KR20180012857A - 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드 - Google Patents
아데노바이러스 폴리뉴클레오티드 및 폴리펩티드 Download PDFInfo
- Publication number
- KR20180012857A KR20180012857A KR1020187000991A KR20187000991A KR20180012857A KR 20180012857 A KR20180012857 A KR 20180012857A KR 1020187000991 A KR1020187000991 A KR 1020187000991A KR 20187000991 A KR20187000991 A KR 20187000991A KR 20180012857 A KR20180012857 A KR 20180012857A
- Authority
- KR
- South Korea
- Prior art keywords
- acid sequence
- seq
- amino acid
- adenovirus
- polypeptide
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 187
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 185
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 185
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 185
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 182
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 178
- 241000701161 unidentified adenovirus Species 0.000 title claims description 209
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 166
- 239000013598 vector Substances 0.000 claims description 239
- 108090000623 proteins and genes Proteins 0.000 claims description 187
- 241000725643 Respiratory syncytial virus Species 0.000 claims description 162
- 210000004027 cell Anatomy 0.000 claims description 140
- 102000004169 proteins and genes Human genes 0.000 claims description 112
- 108091007433 antigens Proteins 0.000 claims description 78
- 102000036639 antigens Human genes 0.000 claims description 78
- 241000700605 Viruses Species 0.000 claims description 77
- 239000000427 antigen Substances 0.000 claims description 77
- 239000000203 mixture Substances 0.000 claims description 73
- 239000012634 fragment Substances 0.000 claims description 58
- 238000012217 deletion Methods 0.000 claims description 54
- 230000037430 deletion Effects 0.000 claims description 54
- 230000014509 gene expression Effects 0.000 claims description 49
- 239000002671 adjuvant Substances 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 39
- 150000007523 nucleic acids Chemical group 0.000 claims description 36
- 206010057190 Respiratory tract infections Diseases 0.000 claims description 33
- 229960005486 vaccine Drugs 0.000 claims description 30
- 230000028993 immune response Effects 0.000 claims description 28
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 22
- 208000015181 infectious disease Diseases 0.000 claims description 22
- 238000004519 manufacturing process Methods 0.000 claims description 21
- NTIZESTWPVYFNL-UHFFFAOYSA-N Methyl isobutyl ketone Chemical compound CC(C)CC(C)=O NTIZESTWPVYFNL-UHFFFAOYSA-N 0.000 claims description 18
- 241001135569 Human adenovirus 5 Species 0.000 claims description 17
- 101150039699 M2-1 gene Proteins 0.000 claims description 16
- 201000010099 disease Diseases 0.000 claims description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 14
- 238000011282 treatment Methods 0.000 claims description 14
- 108020001507 fusion proteins Proteins 0.000 claims description 13
- 102000037865 fusion proteins Human genes 0.000 claims description 13
- 230000001939 inductive effect Effects 0.000 claims description 13
- 108091034117 Oligonucleotide Proteins 0.000 claims description 12
- 239000002773 nucleotide Substances 0.000 claims description 12
- 230000035772 mutation Effects 0.000 claims description 11
- 101710087110 ORF6 protein Proteins 0.000 claims description 10
- 206010061603 Respiratory syncytial virus infection Diseases 0.000 claims description 10
- 101710095001 Uncharacterized protein in nifU 5'region Proteins 0.000 claims description 10
- 239000003814 drug Substances 0.000 claims description 10
- 229940035032 monophosphoryl lipid a Drugs 0.000 claims description 10
- 239000002502 liposome Substances 0.000 claims description 8
- 230000003308 immunostimulating effect Effects 0.000 claims description 7
- 229930182490 saponin Natural products 0.000 claims description 7
- 150000007949 saponins Chemical class 0.000 claims description 7
- 239000000758 substrate Substances 0.000 claims description 7
- 101710159752 Poly(3-hydroxyalkanoate) polymerase subunit PhaE Proteins 0.000 claims description 6
- 101710130262 Probable Vpr-like protein Proteins 0.000 claims description 6
- 239000004365 Protease Substances 0.000 claims description 6
- 101710110895 Uncharacterized 7.3 kDa protein in cox-rep intergenic region Proteins 0.000 claims description 6
- 101000768957 Acholeplasma phage L2 Uncharacterized 37.2 kDa protein Proteins 0.000 claims description 5
- 101000823746 Acidianus ambivalens Uncharacterized 17.7 kDa protein in bps2 3'region Proteins 0.000 claims description 5
- 101000916369 Acidianus ambivalens Uncharacterized protein in sor 5'region Proteins 0.000 claims description 5
- 101000769342 Acinetobacter guillouiae Uncharacterized protein in rpoN-murA intergenic region Proteins 0.000 claims description 5
- 101000823696 Actinobacillus pleuropneumoniae Uncharacterized glycosyltransferase in aroQ 3'region Proteins 0.000 claims description 5
- 101000786513 Agrobacterium tumefaciens (strain 15955) Uncharacterized protein outside the virF region Proteins 0.000 claims description 5
- 101000618005 Alkalihalobacillus pseudofirmus (strain ATCC BAA-2126 / JCM 17055 / OF4) Uncharacterized protein BpOF4_00885 Proteins 0.000 claims description 5
- 102100020724 Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Human genes 0.000 claims description 5
- 101000967489 Azorhizobium caulinodans (strain ATCC 43989 / DSM 5975 / JCM 20966 / LMG 6465 / NBRC 14845 / NCIMB 13405 / ORS 571) Uncharacterized protein AZC_3924 Proteins 0.000 claims description 5
- 101000823761 Bacillus licheniformis Uncharacterized 9.4 kDa protein in flaL 3'region Proteins 0.000 claims description 5
- 101000819719 Bacillus methanolicus Uncharacterized N-acetyltransferase in lysA 3'region Proteins 0.000 claims description 5
- 101000789586 Bacillus subtilis (strain 168) UPF0702 transmembrane protein YkjA Proteins 0.000 claims description 5
- 101000792624 Bacillus subtilis (strain 168) Uncharacterized protein YbxH Proteins 0.000 claims description 5
- 101000790792 Bacillus subtilis (strain 168) Uncharacterized protein YckC Proteins 0.000 claims description 5
- 101000819705 Bacillus subtilis (strain 168) Uncharacterized protein YlxR Proteins 0.000 claims description 5
- 101000948218 Bacillus subtilis (strain 168) Uncharacterized protein YtxJ Proteins 0.000 claims description 5
- 101000718627 Bacillus thuringiensis subsp. kurstaki Putative RNA polymerase sigma-G factor Proteins 0.000 claims description 5
- 101000641200 Bombyx mori densovirus Putative non-structural protein Proteins 0.000 claims description 5
- 101000947633 Claviceps purpurea Uncharacterized 13.8 kDa protein Proteins 0.000 claims description 5
- 101000948901 Enterobacteria phage T4 Uncharacterized 16.0 kDa protein in segB-ipI intergenic region Proteins 0.000 claims description 5
- 101000805958 Equine herpesvirus 4 (strain 1942) Virion protein US10 homolog Proteins 0.000 claims description 5
- 101000790442 Escherichia coli Insertion element IS2 uncharacterized 11.1 kDa protein Proteins 0.000 claims description 5
- 101000788354 Escherichia phage P2 Uncharacterized 8.2 kDa protein in gpA 5'region Proteins 0.000 claims description 5
- 101000770304 Frankia alni UPF0460 protein in nifX-nifW intergenic region Proteins 0.000 claims description 5
- 101000797344 Geobacillus stearothermophilus Putative tRNA (cytidine(34)-2'-O)-methyltransferase Proteins 0.000 claims description 5
- 101000748410 Geobacillus stearothermophilus Uncharacterized protein in fumA 3'region Proteins 0.000 claims description 5
- 101000772675 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) UPF0438 protein HI_0847 Proteins 0.000 claims description 5
- 101000631019 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) Uncharacterized protein HI_0350 Proteins 0.000 claims description 5
- 101000768938 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 8.9 kDa protein in int-C1 intergenic region Proteins 0.000 claims description 5
- 101000785414 Homo sapiens Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Proteins 0.000 claims description 5
- 101000833492 Homo sapiens Jouberin Proteins 0.000 claims description 5
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 claims description 5
- 102100024407 Jouberin Human genes 0.000 claims description 5
- 101000782488 Junonia coenia densovirus (isolate pBRJ/1990) Putative non-structural protein NS2 Proteins 0.000 claims description 5
- 101000811523 Klebsiella pneumoniae Uncharacterized 55.8 kDa protein in cps region Proteins 0.000 claims description 5
- 101000818409 Lactococcus lactis subsp. lactis Uncharacterized HTH-type transcriptional regulator in lacX 3'region Proteins 0.000 claims description 5
- 101000878851 Leptolyngbya boryana Putative Fe(2+) transport protein A Proteins 0.000 claims description 5
- 101000758828 Methanosarcina barkeri (strain Fusaro / DSM 804) Uncharacterized protein Mbar_A1602 Proteins 0.000 claims description 5
- 101001122401 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF3 Proteins 0.000 claims description 5
- 101001055788 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) Pentapeptide repeat protein MfpA Proteins 0.000 claims description 5
- 101000740670 Orgyia pseudotsugata multicapsid polyhedrosis virus Protein C42 Proteins 0.000 claims description 5
- 101000769182 Photorhabdus luminescens Uncharacterized protein in pnp 3'region Proteins 0.000 claims description 5
- 101000961392 Pseudescherichia vulneris Uncharacterized 29.9 kDa protein in crtE 3'region Proteins 0.000 claims description 5
- 101000731030 Pseudomonas oleovorans Poly(3-hydroxyalkanoate) polymerase 2 Proteins 0.000 claims description 5
- 101001065485 Pseudomonas putida Probable fatty acid methyltransferase Proteins 0.000 claims description 5
- 101000711023 Rhizobium leguminosarum bv. trifolii Uncharacterized protein in tfuA 3'region Proteins 0.000 claims description 5
- 101000948156 Rhodococcus erythropolis Uncharacterized 47.3 kDa protein in thcA 5'region Proteins 0.000 claims description 5
- 101000917565 Rhodococcus fascians Uncharacterized 33.6 kDa protein in fasciation locus Proteins 0.000 claims description 5
- 101000790284 Saimiriine herpesvirus 2 (strain 488) Uncharacterized 9.5 kDa protein in DHFR 3'region Proteins 0.000 claims description 5
- 101000936719 Streptococcus gordonii Accessory Sec system protein Asp3 Proteins 0.000 claims description 5
- 101000788499 Streptomyces coelicolor Uncharacterized oxidoreductase in mprA 5'region Proteins 0.000 claims description 5
- 101001102841 Streptomyces griseus Purine nucleoside phosphorylase ORF3 Proteins 0.000 claims description 5
- 101000708557 Streptomyces lincolnensis Uncharacterized 17.2 kDa protein in melC2-rnhH intergenic region Proteins 0.000 claims description 5
- 101000649826 Thermotoga neapolitana Putative anti-sigma factor antagonist TM1081 homolog Proteins 0.000 claims description 5
- 101000827562 Vibrio alginolyticus Uncharacterized protein in proC 3'region Proteins 0.000 claims description 5
- 101000778915 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) Uncharacterized membrane protein VP2115 Proteins 0.000 claims description 5
- 230000002265 prevention Effects 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 101000621943 Acholeplasma phage L2 Probable integrase/recombinase Proteins 0.000 claims description 4
- 101000618348 Allochromatium vinosum (strain ATCC 17899 / DSM 180 / NBRC 103801 / NCIMB 10441 / D) Uncharacterized protein Alvin_0065 Proteins 0.000 claims description 4
- 101000781117 Autographa californica nuclear polyhedrosis virus Uncharacterized 12.4 kDa protein in CTL-LEF2 intergenic region Proteins 0.000 claims description 4
- 101000708323 Azospirillum brasilense Uncharacterized 28.8 kDa protein in nifR3-like 5'region Proteins 0.000 claims description 4
- 101000770311 Azotobacter chroococcum mcd 1 Uncharacterized 19.8 kDa protein in nifW 5'region Proteins 0.000 claims description 4
- 101000748761 Bacillus subtilis (strain 168) Uncharacterized MFS-type transporter YcxA Proteins 0.000 claims description 4
- 101000765620 Bacillus subtilis (strain 168) Uncharacterized protein YlxP Proteins 0.000 claims description 4
- 101000916134 Bacillus subtilis (strain 168) Uncharacterized protein YqxJ Proteins 0.000 claims description 4
- 101000754349 Bordetella pertussis (strain Tohama I / ATCC BAA-589 / NCTC 13251) UPF0065 protein BP0148 Proteins 0.000 claims description 4
- 101000827633 Caldicellulosiruptor sp. (strain Rt8B.4) Uncharacterized 23.9 kDa protein in xynA 3'region Proteins 0.000 claims description 4
- 101000947628 Claviceps purpurea Uncharacterized 11.8 kDa protein Proteins 0.000 claims description 4
- 101000686796 Clostridium perfringens Replication protein Proteins 0.000 claims description 4
- 101000788129 Escherichia coli Uncharacterized protein in sul1 3'region Proteins 0.000 claims description 4
- 101000788370 Escherichia phage P2 Uncharacterized 12.9 kDa protein in GpA 3'region Proteins 0.000 claims description 4
- 101000787096 Geobacillus stearothermophilus Uncharacterized protein in gldA 3'region Proteins 0.000 claims description 4
- 101000976889 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 19.2 kDa protein in cox-rep intergenic region Proteins 0.000 claims description 4
- 101000827627 Klebsiella pneumoniae Putative low molecular weight protein-tyrosine-phosphatase Proteins 0.000 claims description 4
- 101001130841 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF5 Proteins 0.000 claims description 4
- 101000974028 Rhizobium leguminosarum bv. viciae (strain 3841) Putative cystathionine beta-lyase Proteins 0.000 claims description 4
- 101000756519 Rhodobacter capsulatus (strain ATCC BAA-309 / NBRC 16581 / SB1003) Uncharacterized protein RCAP_rcc00048 Proteins 0.000 claims description 4
- 101000948219 Rhodococcus erythropolis Uncharacterized 11.5 kDa protein in thcD 3'region Proteins 0.000 claims description 4
- 101000936711 Streptococcus gordonii Accessory secretory protein Asp4 Proteins 0.000 claims description 4
- 101000929863 Streptomyces cinnamonensis Monensin polyketide synthase putative ketoacyl reductase Proteins 0.000 claims description 4
- 101000788468 Streptomyces coelicolor Uncharacterized protein in mprR 3'region Proteins 0.000 claims description 4
- 101000845085 Streptomyces violaceoruber Granaticin polyketide synthase putative ketoacyl reductase 1 Proteins 0.000 claims description 4
- 101000711771 Thiocystis violacea Uncharacterized 76.5 kDa protein in phbC 3'region Proteins 0.000 claims description 4
- 101000711318 Vibrio alginolyticus Uncharacterized 11.6 kDa protein in scrR 3'region Proteins 0.000 claims description 4
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 claims description 4
- 150000003839 salts Chemical class 0.000 claims description 4
- 241000193096 Human adenovirus B3 Species 0.000 claims description 3
- 101000908757 Human adenovirus C serotype 2 Early 4 ORF4 protein Proteins 0.000 claims description 3
- 102000007999 Nuclear Proteins Human genes 0.000 claims description 3
- 108010089610 Nuclear Proteins Proteins 0.000 claims description 3
- 102100040307 Protein FAM3B Human genes 0.000 claims description 3
- 101710198378 Uncharacterized 10.8 kDa protein in cox-rep intergenic region Proteins 0.000 claims description 3
- 101710134973 Uncharacterized 9.7 kDa protein in cox-rep intergenic region Proteins 0.000 claims description 3
- 230000000890 antigenic effect Effects 0.000 claims description 3
- 230000006806 disease prevention Effects 0.000 claims description 3
- 210000004962 mammalian cell Anatomy 0.000 claims description 3
- 229910052751 metal Inorganic materials 0.000 claims description 3
- 239000002184 metal Substances 0.000 claims description 3
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 claims description 3
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 3
- 239000001397 quillaja saponaria molina bark Substances 0.000 claims description 3
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 claims description 2
- 108010024878 Adenovirus E1A Proteins Proteins 0.000 claims description 2
- 108010087905 Adenovirus E1B Proteins Proteins 0.000 claims description 2
- 108010057856 Adenovirus E2 Proteins Proteins 0.000 claims description 2
- 108010027410 Adenovirus E3 Proteins Proteins 0.000 claims description 2
- 102100031725 Cortactin-binding protein 2 Human genes 0.000 claims description 2
- 108091029430 CpG site Proteins 0.000 claims description 2
- 108010065805 Interleukin-12 Proteins 0.000 claims description 2
- 108090000171 Interleukin-18 Proteins 0.000 claims description 2
- 108010039918 Polylysine Proteins 0.000 claims description 2
- 101710197985 Probable protein Rev Proteins 0.000 claims description 2
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 claims description 2
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 claims description 2
- 229920001400 block copolymer Polymers 0.000 claims description 2
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 claims description 2
- 150000002632 lipids Chemical class 0.000 claims description 2
- 239000011859 microparticle Substances 0.000 claims description 2
- 239000004005 microsphere Substances 0.000 claims description 2
- 229920000724 poly(L-arginine) polymer Polymers 0.000 claims description 2
- 108010011110 polyarginine Proteins 0.000 claims description 2
- 229920000656 polylysine Polymers 0.000 claims description 2
- QGMRQYFBGABWDR-UHFFFAOYSA-N sodium;5-ethyl-5-pentan-2-yl-1,3-diazinane-2,4,6-trione Chemical compound [Na+].CCCC(C)C1(CC)C(=O)NC(=O)NC1=O QGMRQYFBGABWDR-UHFFFAOYSA-N 0.000 claims description 2
- 229940031439 squalene Drugs 0.000 claims description 2
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 claims description 2
- 239000000277 virosome Substances 0.000 claims description 2
- 108010056962 Adenovirus E4 Proteins Proteins 0.000 claims 1
- 102000004127 Cytokines Human genes 0.000 claims 1
- 108090000695 Cytokines Proteins 0.000 claims 1
- 108700019146 Transgenes Proteins 0.000 description 86
- 235000018102 proteins Nutrition 0.000 description 79
- 239000000835 fiber Substances 0.000 description 61
- 108020004414 DNA Proteins 0.000 description 40
- 238000006467 substitution reaction Methods 0.000 description 40
- 230000003612 virological effect Effects 0.000 description 37
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 36
- 210000000234 capsid Anatomy 0.000 description 36
- 239000013612 plasmid Substances 0.000 description 33
- 230000002163 immunogen Effects 0.000 description 32
- 241000711895 Bovine orthopneumovirus Species 0.000 description 30
- 235000001014 amino acid Nutrition 0.000 description 29
- 210000002966 serum Anatomy 0.000 description 27
- 229940024606 amino acid Drugs 0.000 description 26
- 241000880493 Leptailurus serval Species 0.000 description 24
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 24
- 108010090894 prolylleucine Proteins 0.000 description 24
- 239000002245 particle Substances 0.000 description 23
- 210000004072 lung Anatomy 0.000 description 21
- 239000000047 product Substances 0.000 description 21
- 101710145505 Fiber protein Proteins 0.000 description 20
- 241000699670 Mus sp. Species 0.000 description 20
- 150000001413 amino acids Chemical class 0.000 description 20
- 230000003053 immunization Effects 0.000 description 20
- 238000012384 transportation and delivery Methods 0.000 description 20
- 241000990167 unclassified Simian adenoviruses Species 0.000 description 20
- 108010068327 4-hydroxyphenylpyruvate dioxygenase Proteins 0.000 description 19
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 19
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 19
- 238000002560 therapeutic procedure Methods 0.000 description 19
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 18
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 18
- 102000039446 nucleic acids Human genes 0.000 description 18
- 108020004707 nucleic acids Proteins 0.000 description 18
- 241000894007 species Species 0.000 description 18
- 238000002255 vaccination Methods 0.000 description 18
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 17
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 17
- 241001465754 Metazoa Species 0.000 description 17
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 17
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 17
- 238000002649 immunization Methods 0.000 description 17
- 108020003175 receptors Proteins 0.000 description 17
- 102000005962 receptors Human genes 0.000 description 17
- 239000013603 viral vector Substances 0.000 description 17
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 16
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 16
- 108010092854 aspartyllysine Proteins 0.000 description 16
- 244000309466 calf Species 0.000 description 16
- 238000010276 construction Methods 0.000 description 16
- 108010050848 glycylleucine Proteins 0.000 description 16
- 230000003472 neutralizing effect Effects 0.000 description 16
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 15
- 108090000565 Capsid Proteins Proteins 0.000 description 15
- 102100023321 Ceruloplasmin Human genes 0.000 description 15
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 15
- -1 aromatic amino acid Chemical class 0.000 description 15
- 108010077245 asparaginyl-proline Proteins 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 241000711920 Human orthopneumovirus Species 0.000 description 14
- 108010089804 glycyl-threonine Proteins 0.000 description 14
- 244000052769 pathogen Species 0.000 description 14
- 108010077112 prolyl-proline Proteins 0.000 description 14
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 13
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 13
- 108010093581 aspartyl-proline Proteins 0.000 description 13
- 108010015792 glycyllysine Proteins 0.000 description 13
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 13
- 230000010076 replication Effects 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- 108010020532 tyrosyl-proline Proteins 0.000 description 13
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 12
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 12
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 12
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 12
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 12
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 12
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 12
- 238000007792 addition Methods 0.000 description 12
- 108010044940 alanylglutamine Proteins 0.000 description 12
- 230000006801 homologous recombination Effects 0.000 description 12
- 238000002744 homologous recombination Methods 0.000 description 12
- 230000005847 immunogenicity Effects 0.000 description 12
- 238000004806 packaging method and process Methods 0.000 description 12
- 230000001717 pathogenic effect Effects 0.000 description 12
- 108010029020 prolylglycine Proteins 0.000 description 12
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 11
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 11
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 11
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 11
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 11
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 11
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 11
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 11
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 11
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 11
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 11
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 11
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 11
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 11
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 11
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 11
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 11
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 11
- 125000000539 amino acid group Chemical group 0.000 description 11
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 11
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 11
- 108010077515 glycylproline Proteins 0.000 description 11
- 229940027941 immunoglobulin g Drugs 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 108010051242 phenylalanylserine Proteins 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 101150075174 E1B gene Proteins 0.000 description 10
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 10
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 10
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 10
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 10
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 10
- 108010079364 N-glycylalanine Proteins 0.000 description 10
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 10
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 10
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 10
- 230000001086 cytosolic effect Effects 0.000 description 10
- 108010078144 glutaminyl-glycine Proteins 0.000 description 10
- 239000006166 lysate Substances 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 9
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 9
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 9
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 9
- 241001217856 Chimpanzee adenovirus Species 0.000 description 9
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 9
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 9
- 206010035664 Pneumonia Diseases 0.000 description 9
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 9
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 9
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 9
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 9
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 9
- 108010087924 alanylproline Proteins 0.000 description 9
- 238000011260 co-administration Methods 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 230000007170 pathology Effects 0.000 description 9
- 230000037452 priming Effects 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 8
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 8
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 8
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 8
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 8
- 241000701022 Cytomegalovirus Species 0.000 description 8
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 8
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 8
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 8
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 8
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 8
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 8
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 8
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 8
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 8
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 8
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 8
- 101710141454 Nucleoprotein Proteins 0.000 description 8
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 8
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 8
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 8
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 8
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 8
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 8
- 210000001744 T-lymphocyte Anatomy 0.000 description 8
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 8
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 8
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 8
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 8
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 8
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 8
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 8
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 8
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 230000036039 immunity Effects 0.000 description 8
- 230000006698 induction Effects 0.000 description 8
- 238000007918 intramuscular administration Methods 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 7
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 7
- 238000002965 ELISA Methods 0.000 description 7
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 7
- 102100037850 Interferon gamma Human genes 0.000 description 7
- 108010074328 Interferon-gamma Proteins 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- 208000035415 Reinfection Diseases 0.000 description 7
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 7
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 7
- 230000005867 T cell response Effects 0.000 description 7
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 7
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 7
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 7
- 108010010147 glycylglutamine Proteins 0.000 description 7
- 108010081551 glycylphenylalanine Proteins 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- 230000029812 viral genome replication Effects 0.000 description 7
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 6
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 6
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 6
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 6
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 6
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 6
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 6
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 241000598171 Human adenovirus sp. Species 0.000 description 6
- 208000029523 Interstitial Lung disease Diseases 0.000 description 6
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 6
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 6
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 6
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 6
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 6
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- SRILZRSXIKRGBF-HRCADAONSA-N Phe-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N SRILZRSXIKRGBF-HRCADAONSA-N 0.000 description 6
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 6
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 6
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 6
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 6
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 108010012058 leucyltyrosine Proteins 0.000 description 6
- 235000017709 saponins Nutrition 0.000 description 6
- 238000011285 therapeutic regimen Methods 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 230000005030 transcription termination Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 5
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 5
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 5
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 5
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 5
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 5
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 5
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 5
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 5
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 5
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 5
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 5
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 5
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 5
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 5
- 241000725303 Human immunodeficiency virus Species 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 5
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 5
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 5
- CRIODIGWCUPXKU-AVGNSLFASA-N Lys-Pro-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O CRIODIGWCUPXKU-AVGNSLFASA-N 0.000 description 5
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- 240000000220 Panda oleosa Species 0.000 description 5
- 235000016496 Panda oleosa Nutrition 0.000 description 5
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 5
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 5
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 5
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 5
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 5
- 241000144282 Sigmodon Species 0.000 description 5
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 5
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 5
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 5
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 5
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 5
- YMZYSCDRTXEOKD-IHPCNDPISA-N Tyr-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N YMZYSCDRTXEOKD-IHPCNDPISA-N 0.000 description 5
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 5
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 238000010790 dilution Methods 0.000 description 5
- 239000012895 dilution Substances 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 230000008595 infiltration Effects 0.000 description 5
- 238000001764 infiltration Methods 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 238000006386 neutralization reaction Methods 0.000 description 5
- 108010047079 phenylalanyl-leucyl-arginyl-phenylalanine Proteins 0.000 description 5
- 101150088856 pix gene Proteins 0.000 description 5
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 5
- 230000001681 protective effect Effects 0.000 description 5
- 108010071207 serylmethionine Proteins 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 4
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 4
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 4
- ZSOICJZJSRWNHX-ACZMJKKPSA-N Ala-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@H](C)[NH3+] ZSOICJZJSRWNHX-ACZMJKKPSA-N 0.000 description 4
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 4
- PXAFZDXYEIIUTF-LKTVYLICSA-N Ala-Trp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXAFZDXYEIIUTF-LKTVYLICSA-N 0.000 description 4
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 4
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 4
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 4
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 4
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 4
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 4
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 4
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 4
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 4
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 4
- QTKYFZCMSQLYHI-UBHSHLNASA-N Asn-Trp-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O QTKYFZCMSQLYHI-UBHSHLNASA-N 0.000 description 4
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 4
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 4
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 4
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 4
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 4
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 4
- 101710205625 Capsid protein p24 Proteins 0.000 description 4
- 241000282693 Cercopithecidae Species 0.000 description 4
- 101150029662 E1 gene Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 4
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 4
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 4
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 4
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 4
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 4
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 4
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 4
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 4
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 4
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 4
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 4
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 4
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 4
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 4
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 4
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 4
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 4
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 4
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 4
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 4
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 4
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 4
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 4
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 4
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 4
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 4
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 4
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 4
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 4
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 4
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 4
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 4
- SQXUUGUCGJSWCK-CIUDSAMLSA-N Lys-Asp-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N SQXUUGUCGJSWCK-CIUDSAMLSA-N 0.000 description 4
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 4
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 4
- 101710085938 Matrix protein Proteins 0.000 description 4
- 101710127721 Membrane protein Proteins 0.000 description 4
- ZEDVFJPQNNBMST-CYDGBPFRSA-N Met-Arg-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZEDVFJPQNNBMST-CYDGBPFRSA-N 0.000 description 4
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 4
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 4
- 241000282579 Pan Species 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 4
- ABEFOXGAIIJDCL-SFJXLCSZSA-N Phe-Thr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ABEFOXGAIIJDCL-SFJXLCSZSA-N 0.000 description 4
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 4
- 101710177166 Phosphoprotein Proteins 0.000 description 4
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 4
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 4
- JFBJPBZSTMXGKL-JYJNAYRXSA-N Pro-Met-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JFBJPBZSTMXGKL-JYJNAYRXSA-N 0.000 description 4
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 4
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 4
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 4
- 229940124679 RSV vaccine Drugs 0.000 description 4
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 4
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 4
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 4
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 4
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 4
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 4
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 4
- 101710149279 Small delta antigen Proteins 0.000 description 4
- 101710172711 Structural protein Proteins 0.000 description 4
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 4
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 4
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 4
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 4
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 4
- IGGFFPOIFHZYKC-PBCZWWQYSA-N Thr-His-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O IGGFFPOIFHZYKC-PBCZWWQYSA-N 0.000 description 4
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 4
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 4
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 4
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 4
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 4
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 4
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 4
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 4
- UTQBQJNSNXJNIH-IHPCNDPISA-N Trp-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N UTQBQJNSNXJNIH-IHPCNDPISA-N 0.000 description 4
- 102100022563 Tubulin polymerization-promoting protein Human genes 0.000 description 4
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 4
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 4
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 4
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 4
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 4
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 4
- 108020005202 Viral DNA Proteins 0.000 description 4
- 108700005077 Viral Genes Proteins 0.000 description 4
- 230000001154 acute effect Effects 0.000 description 4
- 230000005875 antibody response Effects 0.000 description 4
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 238000002716 delivery method Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 4
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 4
- 210000000224 granular leucocyte Anatomy 0.000 description 4
- 230000001900 immune effect Effects 0.000 description 4
- 210000000987 immune system Anatomy 0.000 description 4
- 210000004969 inflammatory cell Anatomy 0.000 description 4
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 230000008774 maternal effect Effects 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 238000009126 molecular therapy Methods 0.000 description 4
- 238000003753 real-time PCR Methods 0.000 description 4
- 230000000241 respiratory effect Effects 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 210000004989 spleen cell Anatomy 0.000 description 4
- 229940036185 synagis Drugs 0.000 description 4
- 101150024821 tetO gene Proteins 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 3
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 3
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 3
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 3
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 3
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 3
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 3
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 3
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 3
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 3
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 3
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 3
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 3
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 206010006448 Bronchiolitis Diseases 0.000 description 3
- 101150013191 E gene Proteins 0.000 description 3
- 101150066038 E4 gene Proteins 0.000 description 3
- 102000030782 GTP binding Human genes 0.000 description 3
- 108091000058 GTP-Binding Proteins 0.000 description 3
- 101710177291 Gag polyprotein Proteins 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 3
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 3
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 3
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 3
- 241000282575 Gorilla Species 0.000 description 3
- QAMFAYSMNZBNCA-UWVGGRQHSA-N His-Gly-Met Chemical compound CSCC[C@H](NC(=O)CNC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O QAMFAYSMNZBNCA-UWVGGRQHSA-N 0.000 description 3
- 241001272567 Hominoidea Species 0.000 description 3
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 3
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 3
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 3
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- 206010024971 Lower respiratory tract infections Diseases 0.000 description 3
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 3
- 241000282560 Macaca mulatta Species 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 3
- 108010047562 NGR peptide Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 241000282576 Pan paniscus Species 0.000 description 3
- 241000282577 Pan troglodytes Species 0.000 description 3
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 3
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 3
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 3
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 3
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 3
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 3
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 3
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 3
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 3
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 3
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 3
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 3
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 3
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 3
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 3
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 3
- UZQJVUCHXGYFLQ-AYDHOLPZSA-N [(2s,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-4-[(2r,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-3,5-dihydroxy-6-(hydroxymethyl)-4-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-3,5-dihydroxy-6-(hy Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@]([C@@]3(CC[C@H]2[C@@]1(C=O)C)C)(C)CC(O)[C@]1(CCC(CC14)(C)C)C(=O)O[C@H]1[C@@H]([C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZQJVUCHXGYFLQ-AYDHOLPZSA-N 0.000 description 3
- 108010081404 acein-2 Proteins 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 235000012000 cholesterol Nutrition 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000001493 electron microscopy Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000008014 freezing Effects 0.000 description 3
- 238000007710 freezing Methods 0.000 description 3
- 108700004026 gag Genes Proteins 0.000 description 3
- 238000001476 gene delivery Methods 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010255 intramuscular injection Methods 0.000 description 3
- 239000007927 intramuscular injection Substances 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 108020003519 protein disulfide isomerase Proteins 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 239000013605 shuttle vector Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000010257 thawing Methods 0.000 description 3
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 2
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 2
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 2
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 241001137901 Centropomus undecimalis Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108010041986 DNA Vaccines Proteins 0.000 description 2
- 229940021995 DNA vaccine Drugs 0.000 description 2
- 238000008157 ELISA kit Methods 0.000 description 2
- 108091006027 G proteins Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 2
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 2
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 2
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101710094396 Hexon protein Proteins 0.000 description 2
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 2
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 2
- 101000669447 Homo sapiens Toll-like receptor 4 Proteins 0.000 description 2
- 101150032643 IVa2 gene Proteins 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 2
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 2
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 2
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 2
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 2
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 2
- 101710139464 Phosphoglycerate kinase 1 Proteins 0.000 description 2
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 2
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 2
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 2
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 2
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 2
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 2
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- 102100039360 Toll-like receptor 4 Human genes 0.000 description 2
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 2
- KZTLJLFVOIMRAQ-IHPCNDPISA-N Trp-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZTLJLFVOIMRAQ-IHPCNDPISA-N 0.000 description 2
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 2
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 2
- 206010046306 Upper respiratory tract infection Diseases 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 2
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000012411 cloning technique Methods 0.000 description 2
- 238000002648 combination therapy Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 2
- 239000003989 dielectric material Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 2
- 210000003979 eosinophil Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 101150098622 gag gene Proteins 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000035784 germination Effects 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- 230000028996 humoral immune response Effects 0.000 description 2
- 230000004727 humoral immunity Effects 0.000 description 2
- 230000002519 immonomodulatory effect Effects 0.000 description 2
- 230000002757 inflammatory effect Effects 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 108010028930 invariant chain Proteins 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 239000007764 o/w emulsion Substances 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 230000002685 pulmonary effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013207 serial dilution Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- ZEIYPKQQLSUPOT-QORCZRPOSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 ZEIYPKQQLSUPOT-QORCZRPOSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- XKZQKPRCPNGNFR-UHFFFAOYSA-N 2-(3-hydroxyphenyl)phenol Chemical compound OC1=CC=CC(C=2C(=CC=CC=2)O)=C1 XKZQKPRCPNGNFR-UHFFFAOYSA-N 0.000 description 1
- PPINMSZPTPRQQB-NHCYSSNCSA-N 2-[[(2s)-1-[(2s)-2-[[(2s)-2-amino-3-methylbutanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]acetic acid Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PPINMSZPTPRQQB-NHCYSSNCSA-N 0.000 description 1
- XZKIHKMTEMTJQX-UHFFFAOYSA-L 4-nitrophenyl phosphate(2-) Chemical compound [O-][N+](=O)C1=CC=C(OP([O-])([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-L 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- 101150116940 AGPS gene Proteins 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- CVHJIWVKTFNGHT-ACZMJKKPSA-N Ala-Gln-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N CVHJIWVKTFNGHT-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 101100165660 Alternaria brassicicola bsc6 gene Proteins 0.000 description 1
- 206010001889 Alveolitis Diseases 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 229930091051 Arenine Natural products 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 1
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 1
- LLZXKVAAEWBUPB-KKUMJFAQSA-N Arg-Gln-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLZXKVAAEWBUPB-KKUMJFAQSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- XMGVWQWEWWULNS-BPUTZDHNSA-N Arg-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XMGVWQWEWWULNS-BPUTZDHNSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- PBFXCUOEGVJTMV-QXEWZRGKSA-N Asn-Met-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O PBFXCUOEGVJTMV-QXEWZRGKSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 1
- WLKVEEODTPQPLI-ACZMJKKPSA-N Asp-Gln-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WLKVEEODTPQPLI-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- WDMNFNXKGSLIOB-GUBZILKMSA-N Asp-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N WDMNFNXKGSLIOB-GUBZILKMSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 101100499295 Bacillus subtilis (strain 168) disA gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 206010010264 Condition aggravated Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 1
- GFMJUESGWILPEN-MELADBBJSA-N Cys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CS)N)C(=O)O GFMJUESGWILPEN-MELADBBJSA-N 0.000 description 1
- JUNZLDGUJZIUCO-IHRRRGAJSA-N Cys-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O JUNZLDGUJZIUCO-IHRRRGAJSA-N 0.000 description 1
- SRZZZTMJARUVPI-JBDRJPRFSA-N Cys-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N SRZZZTMJARUVPI-JBDRJPRFSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 206010014950 Eosinophilia Diseases 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 208000007212 Foot-and-Mouth Disease Diseases 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- OAOOXBSVCJEIFY-QAETUUGQSA-N Gln-Leu-Leu-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O OAOOXBSVCJEIFY-QAETUUGQSA-N 0.000 description 1
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 102000008055 Heparan Sulfate Proteoglycans Human genes 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- LCNNHVQNFNJLGK-AVGNSLFASA-N His-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N LCNNHVQNFNJLGK-AVGNSLFASA-N 0.000 description 1
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 1
- CSTNMMIHMYJGFR-IHRRRGAJSA-N His-His-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 CSTNMMIHMYJGFR-IHRRRGAJSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- SLFSYFJKSIVSON-SRVKXCTJSA-N His-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SLFSYFJKSIVSON-SRVKXCTJSA-N 0.000 description 1
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 1
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 1
- 241000282596 Hylobatidae Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 1
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 101710084021 Large envelope protein Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- ZCWWVXAXWUAEPZ-SRVKXCTJSA-N Lys-Met-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZCWWVXAXWUAEPZ-SRVKXCTJSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150103632 M2-2 gene Proteins 0.000 description 1
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 1
- MUYQDMBLDFEVRJ-LSJOCFKGSA-N Met-Ala-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 MUYQDMBLDFEVRJ-LSJOCFKGSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 1
- GPVLSVCBKUCEBI-KKUMJFAQSA-N Met-Gln-Phe Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GPVLSVCBKUCEBI-KKUMJFAQSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- NHDMNXBBSGVYGP-PYJNHQTQSA-N Met-His-Ile Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)CC1=CN=CN1 NHDMNXBBSGVYGP-PYJNHQTQSA-N 0.000 description 1
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 1
- QLESZRANMSYLCZ-CYDGBPFRSA-N Met-Pro-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QLESZRANMSYLCZ-CYDGBPFRSA-N 0.000 description 1
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- JHVNNUIQXOGAHI-KJEVXHAQSA-N Met-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N)O JHVNNUIQXOGAHI-KJEVXHAQSA-N 0.000 description 1
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 1
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 1
- 241001092142 Molina Species 0.000 description 1
- 241000700627 Monkeypox virus Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101000663001 Mus musculus TNFAIP3-interacting protein 1 Proteins 0.000 description 1
- 102100026057 Myosin regulatory light chain 2, atrial isoform Human genes 0.000 description 1
- 101710098224 Myosin regulatory light chain 2, atrial isoform Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241001644525 Nastus productus Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 101150007210 ORF6 gene Proteins 0.000 description 1
- 102000004067 Osteocalcin Human genes 0.000 description 1
- 108090000573 Osteocalcin Proteins 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- ZBYHVSHBZYHQBW-SRVKXCTJSA-N Phe-Cys-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZBYHVSHBZYHQBW-SRVKXCTJSA-N 0.000 description 1
- HPECNYCQLSVCHH-BZSNNMDCSA-N Phe-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N HPECNYCQLSVCHH-BZSNNMDCSA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- 101100226894 Phomopsis amygdali PaGT gene Proteins 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 241000288935 Platyrrhini Species 0.000 description 1
- 206010035742 Pneumonitis Diseases 0.000 description 1
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- WECYCNFPGZLOOU-FXQIFTODSA-N Pro-Asn-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O WECYCNFPGZLOOU-FXQIFTODSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- CKXMGSJPDQXBPG-JYJNAYRXSA-N Pro-Cys-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O CKXMGSJPDQXBPG-JYJNAYRXSA-N 0.000 description 1
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 1
- QCMYJBKTMIWZAP-AVGNSLFASA-N Pro-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 QCMYJBKTMIWZAP-AVGNSLFASA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 101000918244 Pseudoalteromonas phage PM2 Peptidoglycan hydrolase P7 Proteins 0.000 description 1
- 101000584831 Pseudoalteromonas phage PM2 Protein P6 Proteins 0.000 description 1
- 241001454523 Quillaja saponaria Species 0.000 description 1
- 235000009001 Quillaja saponaria Nutrition 0.000 description 1
- 230000010799 Receptor Interactions Effects 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- IWUCXVSUMQZMFG-AFCXAGJDSA-N Ribavirin Chemical compound N1=C(C(=O)N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 IWUCXVSUMQZMFG-AFCXAGJDSA-N 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- WTPKKLMBNBCCNL-ACZMJKKPSA-N Ser-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N WTPKKLMBNBCCNL-ACZMJKKPSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 1
- NBUKGEFVZJMSIS-XIRDDKMYSA-N Ser-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CO)N NBUKGEFVZJMSIS-XIRDDKMYSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- JJUNLJTUIKFPRF-BPUTZDHNSA-N Ser-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N JJUNLJTUIKFPRF-BPUTZDHNSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000287219 Serinus canaria Species 0.000 description 1
- 108090000054 Syndecan-2 Proteins 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 1
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 1
- PNKDNKGMEHJTJQ-BPUTZDHNSA-N Trp-Arg-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PNKDNKGMEHJTJQ-BPUTZDHNSA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- HWCBFXAWVTXXHZ-NYVOZVTQSA-N Trp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N HWCBFXAWVTXXHZ-NYVOZVTQSA-N 0.000 description 1
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 1
- DYIXEGROAOVQPK-VFAJRCTISA-N Trp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DYIXEGROAOVQPK-VFAJRCTISA-N 0.000 description 1
- UPUNWAXSLPBMRK-XTWBLICNSA-N Trp-Thr-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UPUNWAXSLPBMRK-XTWBLICNSA-N 0.000 description 1
- STJXERBCEWQLKS-IHPCNDPISA-N Trp-Tyr-Cys Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 STJXERBCEWQLKS-IHPCNDPISA-N 0.000 description 1
- YTHWAWACWGWBLE-MNSWYVGCSA-N Trp-Tyr-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 YTHWAWACWGWBLE-MNSWYVGCSA-N 0.000 description 1
- LNGFWVPNKLWATF-ZVZYQTTQSA-N Trp-Val-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LNGFWVPNKLWATF-ZVZYQTTQSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 1
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- OSMTVLSRTQDWHJ-JBACZVJFSA-N Tyr-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 OSMTVLSRTQDWHJ-JBACZVJFSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 1
- OFHKXNKJXURPSY-ULQDDVLXSA-N Tyr-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O OFHKXNKJXURPSY-ULQDDVLXSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 1
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- 101150004676 VGF gene Proteins 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- UBTBGUDNDFZLGP-SRVKXCTJSA-N Val-Arg-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UBTBGUDNDFZLGP-SRVKXCTJSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- FHICGHSMIPIAPL-HDYAAECPSA-N [2-[3-[6-[3-[(5R,6aS,6bR,12aR)-10-[6-[2-[2-[4,5-dihydroxy-3-(3,4,5-trihydroxyoxan-2-yl)oxyoxan-2-yl]ethoxy]ethyl]-3,4,5-trihydroxyoxan-2-yl]oxy-5-hydroxy-2,2,6a,6b,9,9,12a-heptamethyl-1,3,4,5,6,6a,7,8,8a,10,11,12,13,14b-tetradecahydropicene-4a-carbonyl]peroxypropyl]-5-[[5-[8-[3,5-dihydroxy-4-(3,4,5-trihydroxyoxan-2-yl)oxyoxan-2-yl]octoxy]-3,4-dihydroxy-6-methyloxan-2-yl]methoxy]-3,4-dihydroxyoxan-2-yl]propoxymethyl]-5-hydroxy-3-[(6S)-6-hydroxy-2,6-dimethylocta-2,7-dienoyl]oxy-6-methyloxan-4-yl] (2E,6S)-6-hydroxy-2-(hydroxymethyl)-6-methylocta-2,7-dienoate Chemical compound C=C[C@@](C)(O)CCC=C(C)C(=O)OC1C(OC(=O)C(\CO)=C\CC[C@](C)(O)C=C)C(O)C(C)OC1COCCCC1C(O)C(O)C(OCC2C(C(O)C(OCCCCCCCCC3C(C(OC4C(C(O)C(O)CO4)O)C(O)CO3)O)C(C)O2)O)C(CCCOOC(=O)C23C(CC(C)(C)CC2)C=2[C@@]([C@]4(C)CCC5C(C)(C)C(OC6C(C(O)C(O)C(CCOCCC7C(C(O)C(O)CO7)OC7C(C(O)C(O)CO7)O)O6)O)CC[C@]5(C)C4CC=2)(C)C[C@H]3O)O1 FHICGHSMIPIAPL-HDYAAECPSA-N 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010088716 attachment protein G Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 229920000249 biocompatible polymer Polymers 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000003123 bronchiole Anatomy 0.000 description 1
- 206010006475 bronchopulmonary dysplasia Diseases 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229940023860 canarypox virus HIV vaccine Drugs 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007969 cellular immunity Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 210000005220 cytoplasmic tail Anatomy 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004041 dendritic cell maturation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 229960003957 dexamethasone Drugs 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000005421 electrostatic potential Methods 0.000 description 1
- 206010014665 endocarditis Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 201000001155 extrinsic allergic alveolitis Diseases 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 239000013305 flexible fiber Substances 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 230000002949 hemolytic effect Effects 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 230000003118 histopathologic effect Effects 0.000 description 1
- 102000045429 human PGK1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 244000052637 human pathogen Species 0.000 description 1
- 230000008348 humoral response Effects 0.000 description 1
- 208000022098 hypersensitivity pneumonitis Diseases 0.000 description 1
- 239000012642 immune effector Substances 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000010324 immunological assay Methods 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 229960001438 immunostimulant agent Drugs 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 230000003447 ipsilateral effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 238000002941 microtiter virus yield reduction assay Methods 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002682 neurofibrillary tangle Anatomy 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 210000001331 nose Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003002 pH adjusting agent Substances 0.000 description 1
- 229960000402 palivizumab Drugs 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108010091742 peptide F Proteins 0.000 description 1
- RJSZPKZQGIKVAU-UXBJKDEOSA-N peptide f Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C(C)C)C(C)C)C1=CC=CC=C1 RJSZPKZQGIKVAU-UXBJKDEOSA-N 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 208000005814 piedra Diseases 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 108700004029 pol Genes Proteins 0.000 description 1
- 229950008882 polysorbate Drugs 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 235000013930 proline Nutrition 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 108010004093 retinal S antigen peptide M Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229960000329 ribavirin Drugs 0.000 description 1
- HZCAHMRRMINHDJ-DBRKOABJSA-N ribavirin Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1N=CN=C1 HZCAHMRRMINHDJ-DBRKOABJSA-N 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 235000004400 serine Nutrition 0.000 description 1
- 230000000405 serological effect Effects 0.000 description 1
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000007811 spectroscopic assay Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000004808 supercritical fluid chromatography Methods 0.000 description 1
- 201000009862 superficial mycosis Diseases 0.000 description 1
- 230000003319 supportive effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940021747 therapeutic vaccine Drugs 0.000 description 1
- 235000008521 threonine Nutrition 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 108010001055 thymocartin Proteins 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940125575 vaccine candidate Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010072644 valyl-alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000007501 viral attachment Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/155—Paramyxoviridae, e.g. parainfluenza virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/21—Retroviridae, e.g. equine infectious anemia virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/075—Adenoviridae
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/745—Blood coagulation or fibrinolysis factors
- C07K14/75—Fibrinogen
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5256—Virus expressing foreign proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10321—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10322—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10371—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16211—Human Immunodeficiency Virus, HIV concerning HIV gagpol
- C12N2740/16234—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/18011—Paramyxoviridae
- C12N2760/18511—Pneumovirus, e.g. human respiratory syncytial virus
- C12N2760/18522—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/18011—Paramyxoviridae
- C12N2760/18511—Pneumovirus, e.g. human respiratory syncytial virus
- C12N2760/18534—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Virology (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Hematology (AREA)
- Communicable Diseases (AREA)
- Pulmonology (AREA)
- Toxicology (AREA)
- Oncology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
단리된 폴리뉴클레오티드가 특히 제공되며, 상기 폴리뉴클레오티드는 하기로 구성된 군으로부터 선택되는 폴리펩티드를 인코딩한다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체, 및
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드.
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체, 및
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드.
Description
본 발명은 신규한 침팬지 아데노바이러스 ChAd155로부터 유래된 단리된 폴리뉴클레오티드 및 폴리펩티드 서열, 및 상기 폴리뉴클레오티드 및 폴리펩티드 서열을 포함하는 재조합 폴리뉴클레오티드, 벡터, 아데노바이러스 및 조성물에 관한 것이다.
아데노바이러스는 다양한 표적 조직에서 매우 효과적인 유전자 전달 및 큰 트랜스진(transgene) 용량을 달성하는 이의 능력으로 인해 유전자 전달 용도로 널리 사용되어 왔다. 통상적으로, 아데노바이러스의 E1 유전자는 결실되고, 선택 프로모터, 관심 유전자의 cDNA 서열 및 poly A 신호로 구성된 트랜스진 카세트로 대체되어, 복제 결함 재조합 바이러스를 발생시킨다.
재조합 아데노바이러스는 유전자 요법 및 백신으로 유용하다. 침팬지 아데노바이러스를 기초로 한 바이러스 벡터는 유전학적 백신의 개발을 위한 인간 유래 Ad 벡터의 사용에 대한 대안이다. 침팬지로부터 단리된 아데노바이러스는 인간 기원의 세포에서의 이들의 효율적인 증식에 의해 입증된 바와 같이 인간으로부터 단리된 아데노바이러스와 밀접한 관련이 있다. 그러나, 인간 및 침팬지 아데노바이러스는 밀접하게 관련이 있어, 2개의 바이러스 종 사이의 혈청학적 교차 반응성이 가능하다.
분자를 표적에 효과적으로 전달하고, 집단 내 선택된 아데노바이러스 혈청형에 대한 기존 면역의 효과를 최소화하는 벡터에 대한 요구가 있다. 인간에서 관찰되는 기존 면역의 한 양태는 체액성 면역이며, 이는 아데노바이러스 단백질에 특이적인 항체의 생성 및 지속을 발생시킬 수 있다. 아데노바이러스에 의해 유도된 체액성 반응은 주로 섬유, 펜톤 및 헥손의 3개의 주요 구조 캡시드 단백질에 대해 유도된다.
본 발명의 벡터, 조성물 및 방법은 선행 기술에 비해 높은 생산성, 개선된 면역원성 및 증가된 트랜스진 발현을 포함하나 이에 제한되지는 않는 하나 이상의 개선된 특징을 가질 수 있다. 본 발명의 벡터는 병원체에 대해 인간 또는 비-인간 동물을 면역화시키는데 유용한 하나 이상의 면역원의 발현에 이용될 수 있다.
호흡기 세포 융합 바이러스(RSV)는 모든 연령층의 사람에서 호흡기 감염을 일으키는 전염성이 강한 인간 병원체이다. 태어난 첫 해에, 유아의 50-70%는 RSV에 감염되며 본질적으로 모든 소아는 2세 생일까지 RSV 감염을 경험하였다. 심한 RSV-관련 하기도 감염(LRTI)의 위험은 6개월 미만의 유아에서 가장 높으며 입원의 주요 원인이다. RSV에 의한 감염은 완전한 보호 면역을 부여하지 않는다. 증상관련 RSV 재감염은 이후 일생 동안 흔하게 나타나며, 성인기 동안 내내 지속된다. 이러한 재감염은 일반적으로 이들이 흔한 급성 상기도 감염으로 나타나기 때문에 대개 진단이 되지 않는다. 그러나, 더 취약한 사람(예컨대, 면역결핍 성인 또는 노인)에서, 재감염은 또한 심각한 질병으로 이어질 수 있다.
현재까지, RSV에 대해 이용 가능한 백신은 없으며 RSV 질병의 치료는 대개 증상 및 지지 치료이다. 항바이러스 약물 리바비린은 현재 RSV 치료를 위해 승인된 유일한 항바이러스제이지만, 그 효능, 투여의 어려움(에어로졸) 및 높은 비용에 대한 불확실성으로 인해 중증의 입원 환자로 제한된다[American Academy of Pediatrics Subcommittee on Diagnosis and Management of Bronchiolitis, 2006]. RSV-특이적 모노클로날 항체(palivizumab, Synagis™, Medimmune)는 RSV 질병의 위험이 높은 소아에서 RSV로 인한 입원을 요하는 심각한 LRTI의 예방을 위해 지시되지만 높은 비용 및 반복적인 투여 요구로 인해 일반적인 건강한 유아 집단에서는 지시되거나 권장되지 않는다.
1960년 후반에, 임상 시험에서 시험된 포르말린-불활성화된 전체 바이러스 RSV 백신(FI-RSV)은 2세 미만의 소아에서 RSV에 의한 후속적인 자연 감염시 더 심한 임상 증상을 일으켰다[Kim, 1969; Chin, 1969]). 이러한 경험으로 소아 RSV 백신 후보의 안전 문제가 고조되었다. 그 이후로, 약독화된 생 바이러스 백신 및 정제 또는 재조합 바이러스 단백질에 기반한 백신을 포함하여, 여러 시험용 백신이 연구되어 왔고 계속 연구되고 있다. 그러나 아직 RSV 질병 예방을 위한 허가된 백신은 없다.
발명의 개요
단리된 폴리뉴클레오티드가 제공되며, 상기 폴리뉴클레오티드는 하기로 구성된 군으로부터 선택되는 폴리펩티드를 인코딩한다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체, 및
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드.
또한, 하기로 구성된 군으로부터 선택되는 폴리뉴클레오티드를 포함하는 재조합 폴리뉴클레오티드가 제공된다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드, 및
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드.
또한, 하기로 구성된 군으로부터 선택되는 폴리뉴클레오티드를 포함하는 재조합 벡터가 제공된다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드, 및
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드.
또한, 하기로 구성된 군으로부터 선택되는 적어도 하나의 폴리뉴클레오티드 또는 폴리펩티드를 포함하는 재조합 아데노바이러스가 제공된다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드,
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(d) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(e) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체, 및
(f) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드.
또한, 하기 중 적어도 하나 및 약학적으로 허용되는 부형제를 포함하는 조성물이 제공된다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드,
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(d) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(e) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체,
(f) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드,
(g) 상기 (a), (b) 또는 (c)에 기재된 바와 같은 폴리뉴클레오티드를 포함하는 벡터, 및
(h) 상기 (a), (b) 또는 (c)에 기재된 바와 같은 폴리뉴클레오티드를 포함하는 재조합 아데노바이러스.
또한, 하기 중 적어도 하나를 포함하는 세포가 제공된다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드,
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(d) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(e) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체,
(f) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드,
(g) 상기 (a), (b) 또는 (c)에 기재된 바와 같은 폴리뉴클레오티드를 포함하는 벡터, 및
(h) 상기 (a), (b) 또는 (c)에 기재된 바와 같은 폴리뉴클레오티드를 포함하는 재조합 아데노바이러스.
또한, 하기로 구성된 군으로부터 선택되는 단리된 아데노바이러스 폴리펩티드가 제공된다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체, 및
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드.
또한, SEQ ID NO: 6에 따른 서열을 포함하거나 이로 구성되는 단리된 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포가 제공된다.
도 1a-c - 표시된 유인원 아데노바이러스로부터의 섬유 단백질 서열의 정렬.
ChAd3 (SEQ ID NO: 27)
PanAd3 (SEQ ID NO: 28)
ChAd17 (SEQ ID NO: 29)
ChAd19 (SEQ ID NO:30)
ChAd24 (SEQ ID NO:31)
ChAd155 (SEQ ID NO:1)
ChAd11 (SEQ ID NO:32)
ChAd20 (SEQ ID NO:33)
ChAd31 (SEQ ID NO:34)
PanAd1 (SEQ ID NO:35)
PanAd2 (SEQ ID NO:36)
도 2 - 특정 ChAd155 BAC 및 플라스미드 벡터의 생성을 위한 흐름도
도 3 - 종 C BAC 셔틀(Shuttle) #1365 개략도
도 4 - pArsChAd155 Ad5E4orf6-2 (#1490) 개략도
도 5 - pChAd155/RSV 개략도
도 6 - BAC ChAd155/RSV 개략도
도 7 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 생산성(실험 1)
도 8 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 생산성(실험 2)
도 9 - RSV 트랜스진을 발현하는 PanAd3 및 ChAd155 벡터의 생산성
도 10 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 발현 수준
도 11 - HIV Gag 트랜스진을 발현하는 PanAd3 및 ChAd155 벡터의 발현 수준 - 웨스턴 블롯
도 12 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 면역원성 - IFN-감마 ELISpot
도 13 - HIV Gag 트랜스진을 발현하는 PanAd3 및 ChAd155 벡터의 면역원성 - IFN-감마 ELISpot
도 14 - ChAd155-RSV 벡터에 의해 RSV 항원을 발현하는데 이용된 합성 DNA 단편의 개략도
도 15 - BALB/c 마우스에서 ChAd155-RSV 및 PanAd3-RSV에 의해 유도된 항-F 항체 역가
도 16 - 비강 조직(A) 및 폐 균질액(B)에서 RSV 역가, 바이러스 챌린지 후 RSV 중화 항체(C) 및 병리학 점수(D)
도 17 - bRSV-특이적 IgG(A) 및 RSV 중화 항체(B) 유도의 동역학
도 18 - bRSV 챌린지 후 6일까지 검출된 비인두 면봉의 평균 바이러스 역가의 동역학
도 19 - 하기도에서 bRSV 복제에 대한 예방접종의 효과
도 20 - bRSV 챌린지 6일 후 육안 폐렴 경결에 대한 예방접종의 효과
도 21 - bRSV 챌린지 6일 후 폐 염증 반응에 대한 예방접종의 효과
ChAd3 (SEQ ID NO: 27)
PanAd3 (SEQ ID NO: 28)
ChAd17 (SEQ ID NO: 29)
ChAd19 (SEQ ID NO:30)
ChAd24 (SEQ ID NO:31)
ChAd155 (SEQ ID NO:1)
ChAd11 (SEQ ID NO:32)
ChAd20 (SEQ ID NO:33)
ChAd31 (SEQ ID NO:34)
PanAd1 (SEQ ID NO:35)
PanAd2 (SEQ ID NO:36)
도 2 - 특정 ChAd155 BAC 및 플라스미드 벡터의 생성을 위한 흐름도
도 3 - 종 C BAC 셔틀(Shuttle) #1365 개략도
도 4 - pArsChAd155 Ad5E4orf6-2 (#1490) 개략도
도 5 - pChAd155/RSV 개략도
도 6 - BAC ChAd155/RSV 개략도
도 7 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 생산성(실험 1)
도 8 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 생산성(실험 2)
도 9 - RSV 트랜스진을 발현하는 PanAd3 및 ChAd155 벡터의 생산성
도 10 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 발현 수준
도 11 - HIV Gag 트랜스진을 발현하는 PanAd3 및 ChAd155 벡터의 발현 수준 - 웨스턴 블롯
도 12 - HIV Gag 트랜스진을 발현하는 ChAd3 및 ChAd155 벡터의 면역원성 - IFN-감마 ELISpot
도 13 - HIV Gag 트랜스진을 발현하는 PanAd3 및 ChAd155 벡터의 면역원성 - IFN-감마 ELISpot
도 14 - ChAd155-RSV 벡터에 의해 RSV 항원을 발현하는데 이용된 합성 DNA 단편의 개략도
도 15 - BALB/c 마우스에서 ChAd155-RSV 및 PanAd3-RSV에 의해 유도된 항-F 항체 역가
도 16 - 비강 조직(A) 및 폐 균질액(B)에서 RSV 역가, 바이러스 챌린지 후 RSV 중화 항체(C) 및 병리학 점수(D)
도 17 - bRSV-특이적 IgG(A) 및 RSV 중화 항체(B) 유도의 동역학
도 18 - bRSV 챌린지 후 6일까지 검출된 비인두 면봉의 평균 바이러스 역가의 동역학
도 19 - 하기도에서 bRSV 복제에 대한 예방접종의 효과
도 20 - bRSV 챌린지 6일 후 육안 폐렴 경결에 대한 예방접종의 효과
도 21 - bRSV 챌린지 6일 후 폐 염증 반응에 대한 예방접종의 효과
서열의 설명
SEQ ID NO: 1 - ChAd155 섬유의 폴리펩티드 서열
SEQ ID NO: 2 - ChAd155 섬유를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 3 - ChAd155 펜톤의 폴리펩티드 서열
SEQ ID NO: 4 - ChAd155 펜톤을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 5 - ChAd155 헥손의 폴리펩티드 서열
SEQ ID NO: 6 - ChAd155 헥손을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 7 - ChAd155#1434를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 8 - ChAd155#1390을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 9 - ChAd155#1375를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 10 - 야생형 ChAd155를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 11 - ChAd155/RSV를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 12 - CASI 프로모터를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 13 - Ad5orf6 프라이머 1 폴리뉴클레오티드 서열
SEQ ID NO: 14 - Ad5orf6 프라이머 2 폴리뉴클레오티드 서열
SEQ ID NO: 15 - BAC/CHAd155 ΔE1_TetO hCMV RpsL-Kana 프라이머 1 폴리뉴클레오티드 서열
SEQ ID NO: 16 - BAC/CHAd155 ΔE1_TetO hCMV RpsL-Kana (#1375) 프라이머 2 폴리뉴클레오티드 서열
SEQ ID NO: 17 - 1021-FW E4 Del Step1 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 18 - 1022-RW E4 Del Step1 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 19 - 1025-FW E4 Del Step2 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 20 - 1026-RW E4 Del Step2 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 21 - 91-SubMonte FW 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 22 - 890-BghPolyA RW 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 23 - CMVfor 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 24 - CMVrev 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 25 - CMVFAM-TAMRA qPCR 프로브 폴리뉴클레오티드 서열
SEQ ID NO: 26 - 우드척(Woodchuck) 간염 바이러스 전사후 조절 요소(WPRE) 폴리뉴클레오티드 서열
SEQ ID NO: 27 - ChAd3의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 28 - PanAd3의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 29 - ChAd17의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 30 - ChAd19의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 31 - ChAd24의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 32 - ChAd11의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 33 - ChAd20의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 34 - ChAd31의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 35 - PanAd1의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 36 - PanAd2의 섬유 단백질에 대한 아미노산 서열
SEQ ID NO: 37 - RSV FΔTM-N-M2-1 아미노산 서열
SEQ ID NO: 38 - HIV Gag 폴리뉴클레오티드 서열
발명의 상세한 설명
아데노바이러스
아데노바이러스는 3개의 주요 단백질인 헥손(II), 펜톤 베이스(III) 및 노브형 섬유(knobbed fiber)(IV)와 함께 다수의 다른 작은 단백질들인 VI, VIII, IX, IIIa 및 IVa2를 포함하는 정이십면체 캡시드를 갖는 특징적인 형태를 갖는다. 바이러스 유전체는 선형의 이중 가닥 DNA이다. 바이러스 DNA는 고도의 베이스 단백질 VII 및 작은 펩티드 pX(이전에는, 뮤로 언급됨)와 밀접하게 회합되어 있다. 또 다른 단백질인 V가 상기 DNA-단백질 복합체와 함께 패키징되고, 단백질 VI를 통해 캡시드에 대한 구조적 연결을 제공한다. 상기 바이러스는 또한 성숙한 감염성 바이러스를 생성하기 위해 일부 구조 단백질의 처리에 필요한 바이러스-인코딩된 프로테아제를 함유한다.
아데노바이러스 유전체는 잘 특성규명되어 있다. 유사하게 위치되는 특정 오픈 리딩 프레임과 관련하여 아데노바이러스 유전체의 전체적인 구성, 예를 들어, 각각의 바이러스의 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자의 위치에서의 전반적인 보존이 존재한다. 아데노바이러스 유전체의 각각의 말단은 바이러스 복제에 필요한 역 말단 반복(ITR)으로 공지된 서열을 포함한다. 상기 바이러스는 또한 감염성 비리온을 생성하는데 필요한 일부 구조 단백질을 처리하는데 필요한 바이러스-인코딩된 프로테아제를 포함한다. 아데노바이러스 유전체의 구조는 바이러스 유전자가 숙주 세포 형질도입 후에 발현되는 순서에 기초하여 기재된다. 더욱 특히, 바이러스 유전자는 전사가 DNA 복제의 개시 전 또는 후에 발생하는지에 따라 초기(E) 또는 후기(L) 유전자로 언급된다. 형질도입의 초기 단계에서, 아데노바이러스의 E1A, E1B, E2A, E2B, E3 및 E4 유전자가 발현되어 숙주 세포가 바이러스를 복제하도록 준비시킨다. 감염의 후기 단계 동안, 바이러스 입자의 구조 성분을 인코딩하는 후기 유전자 L1-L5의 발현이 활성화된다.
아데노바이러스는 종 특이적이며, 다양한 혈청형, 즉, 항체에 의해 교차-중화되지 않는 바이러스의 유형이 다양한 포유동물 종으로부터 단리되었다. 예를 들어, 서열 상동성 및 적혈구 세포를 응집시키는 능력을 기초로 하여 6개의 하위그룹(A-F; B는 B1 및 B2로 세분됨)으로 나뉘는 50개 초과의 혈청형이 인간으로부터 단리되었다(Tatsis and Ertl Molecular Therapy (2004) 10:616-629). 다수의 아데노바이러스가 비인간 유인원, 예를 들어, 침팬지, 보노보, 히말라야 원숭이(rhesus macaque) 및 고릴라로부터 단리되었고, 이들은 헥손 또는 섬유 서열에 기초한 계통발생학적 관계를 기초로 하여 동일한 인간 그룹으로 분류된다(Colloca et al. (2012) ScienceTranslational Medicine 4:1-9; Roy et al. (2004) Virology 324: 361-372; Roy et al. (2010) Journal of Gene Medicine 13:17-25).
섬유 단백질을 포함하는 아데노바이러스 캡시드 단백질 및 이들 단백질을 인코딩하는 폴리뉴클레오티드
상기 개설된 바와 같이, 아데노바이러스 캡시드는 3개의 주요 단백질인 헥손, 펜톤 및 섬유를 포함한다. 헥손은 캡시드의 구조 성분의 대부분을 차지하며, 이는 240개의 삼량체 헥손 캡소미어 및 12개의 펜톤 베이스로 구성된다. 헥손은 3개의 보존된 이중 배럴을 가지며, 상단은 3개의 타워(tower)를 갖고, 각각의 타워는 캡시드 대부분을 형성하는 각각의 서브유닛으로부터의 루프를 함유한다. 헥손의 베이스는 아데노바이러스 혈청형 사이에 고도로 보존되어 있는 반면, 표면 루프는 가변적이다(Tatsis and Ertl Molecular Therapy (2004) 10:616-629).
펜톤은 섬유가 부착하는 오량체 베이스를 형성하는 또 다른 아데노바이러스 캡시드 단백질이다. 삼량체 섬유 단백질은 캡시드의 12개의 꼭지점 각각에서 펜톤 베이스로부터 돌출되어 있으며, 노브형 막대-유사 구조이다. 대부분의 다른 정이십면체 바이러스의 것과 비교하여 아데노바이러스 캡시드의 표면에서의 현저한 차이는 길고 얇은 섬유 단백질의 존재이다. 섬유 단백질의 주요 역할은 세포 수용체와의 상호작용을 통해 세포 표면에 바이러스 캡시드를 테더링(tethering)시키는 것이다.
많은 아데노바이러스 혈청형의 섬유 단백질은 N-말단 꼬리, 반복 서열로 이루어진 중심 축, 및 C-말단 구형 노브 도메인(또는 "헤드")의 공통 구조를 공유한다. 중심축 도메인은 다양한 수의 베타-반복으로 구성된다. 베타-반복은 연결되어 매우 견고하고 안정적인 3개의 얽힌 나선형 가닥의 연장된 구조를 형성한다. 상기 축은 N-말단 꼬리와 구형 노브 구조를 연결하며, 이는 표적 세포 수용체와의 상호작용을 담당한다. 아데노바이러스 노브 도메인의 구형 특성은 수용체를 측면 및 정점으로 결합시키기 위한 큰 표면을 제공한다. 이러한 구조의 효과는 수용체-결합 부위를 바이러스 캡시드로부터 멀리 떨어져서 돌출시킴으로써 바이러스가 비교적 편평한 캡시드 표면에 의해 제공되는 입체적 구속으로부터 자유롭게 하는 것이다.
많은 아데노바이러스 혈청형의 섬유는 동일한 전반적인 구조를 갖지만, 이들은 이들의 기능뿐만 아니라 구조에 영향을 미치는 다양한 아미노산 서열을 갖는다. 예를 들어, 섬유 노브의 표면 상의 다수의 노출된 영역은 용이하게 적응 가능한 수용체 결합 부위를 제공한다. 섬유 노브의 구형 형태는 수용체가 노브의 측면 또는 섬유 노브의 상단에 결합되도록 한다. 이들 결합 부위는 통상적으로 인간 아데노바이러스 사이에서 불량하게 보존되는 베타-가닥을 연결하는 표면-노출 루프 상에 놓여 있다. 이들 루프 상의 노출된 측쇄는 3차 및 4차 구조를 유지하면서 노브에 다양한 표면 특징을 제공한다. 예를 들어, 노브 표면에서의 정전기 전위 및 전하 분포는 Ad 8, Ad 19 및 Ad 37에 대한 약 9의 pI로부터 하위그룹 B 아데노바이러스에 대한 약 5까지의 섬유 노브 서열에서의 광범위한 등전점으로 인해 다양할 수 있다. 구조적으로 복잡한 바이러스 리간드로서, 섬유 단백질은 바이러스 캡시드로부터 다수의 배향 및 거리(축)의 다양한 결합 표면(노브)의 제시를 가능하게 한다.
일부 혈청형 사이의 가장 명백한 변화 중 하나는 섬유 길이이다. 섬유 축의 길이가 노브 및 바이러스와 이의 표적 수용체의 상호작용에 강하게 영향을 미치는 것이 연구에서 제시되었다. 또한, 혈청형 사이의 섬유 단백질은 또한 이들의 휘는 능력이 다양할 수 있다. 축의 베타-반복은 매우 안정적이고 규칙적인 구조를 형성하나, 전자현미경(EM) 연구는 섬유 내에 별개의 힌지를 나타내었다. 여러 아데노바이러스 혈청형 섬유로부터의 단백질 서열의 분석은 EM에 의해 관찰되는 바와 같이 축 내의 힌지 중 하나와 강하게 연관된 N-말단 꼬리로부터의 세번째 베타-반복에서의 축의 반복 서열에서의 파괴를 정확하게 지적한다. 섬유 내의 힌지는 노브가 바이러스 캡시드와 관련된 다양한 배향을 채택하는 것을 가능하게 하며, 이는 노브 상의 수용체 결합 부위의 정확한 제시를 요구하는 수용체 연동에 대한 입체적 방해를 회피할 수 있다. 따라서, 예를 들어, 하위그룹 D Ad의 단단한 섬유는 이들이 스스로 휠 수 없으므로 바이러스 부착을 위해 가요성 수용체 또는 사전배치된 수용체를 필요로 한다. (Nicklin et al Molecular Therapy 2005 12:384-393)
다양한 Ad 혈청형에 대한 특정 세포 수용체의 확인 및 이들이 조직 향성에 기여하는 방법의 지식은 섬유 슈도타이핑(pseudotyping) 기술의 사용을 통해 달성되었다. 일부 하위그룹의 Ad가 일차 수용체로 CAR을 이용하나, 많은 Ad가 대안적 일차 수용체를 이용하여 시험관 내 및 생체 내에서 광범위하게 다양한 향성을 발생시키는 것이 명백해지고 있다. 이들 혈청형의 섬유는 이들의 일차 및 삼차 구조에서 섬유 축 강성, 섬유 축 길이, 및 CAR 결합 부위 및/또는 추정 HSPG 결합 모티프의 결핍과 같은 명백한 차이와 함께 섬유 노브 내에서의 순 전하의 차이를 나타낸다. 따라서, 대안적 섬유 축 및 노브로 Ad 5 입자를 슈도타이핑하는 것은 중요한 세포 결합 도메인을 제거할 기회를 제공하며, 또한 Ad 5로 달성된 것에 비해 규정된 세포 유형으로의 더욱 효과적인(및 잠재적으로 더 높은 세포-선택적인) 트랜스진 전달을 가능하게 할 수 있다. 섬유-슈도타이핑된 Ad 입자의 중화는 또한 벡터의 성공적인 투여를 촉진하는 상황인, 사용되는 섬유가 인간 또는 실험 모델에서 더 낮은 혈청유병률(seroprevalence)을 갖는 Ad로부터 유래되는 경우에 감소될 수 있다(Nicklin et al Molecular Therapy (2005) 12:384-393). 또한, 헥손 또는 펜톤 단독은 아니지만 전장 섬유뿐만 아니라 단리된 섬유 노브 영역은 수지상 세포 성숙을 유도할 수 있고, 효능 있는 CD8+ T 세포 반응의 유도와 관련이 있다(Molinier-Frenkel et al. J. Biol. Chem. (2003) 278:37175-37182). 종합하면, 아데노바이러스 섬유는 아데노바이러스 벡터의 적어도 수용체-결합 및 면역원성에서 중요한 역할을 한다.
그룹 C 유인원 아데노바이러스의 섬유 단백질 사이의 차이를 예시하는 것이 도 1에 제공된 정렬이다. 이들 아데노바이러스의 섬유 서열이 ChAd155와 같이 긴 섬유를 갖는 것, 또는 ChAd3와 같이 짧은 섬유를 갖는 것으로 광범위하게 그룹화될 수 있다는 것이 두드러진 특징이다. 이러한 길이 차이는 긴 섬유에 비해 짧은 섬유에서 대략 위치 321에서의 36개의 아미노산 결실로 인한 것이다. 또한, 짧은 섬유 하위그룹과 긴 섬유 하위그룹 사이에서는 상이하나 각각의 하위그룹 내에서는 일치하는 다수의 아미노산 치환이 존재한다. 이들 차이의 정확한 기능은 아직 밝혀지지 않았으나, 섬유의 기능 및 면역원성을 고려할 때, 이들은 유의한 것으로 보인다. 바이러스 향성의 결정인자 중 하나가 섬유 축의 길이인 것이 밝혀졌다. 더 짧은 축을 갖는 Ad5 벡터가 CAR 수용체에 대한 결합의 더 낮은 효율 및 더 낮은 감염성을 갖는 것이 입증되었다(Ambriovic-Ristov A. et al.: Virology. (2003) 312(2):425-33): 이러한 손상은 세포 수용체에 대한 덜 효율적인 부착을 발생시키는 더 짧은 섬유의 증가된 강성의 결과인 것으로 추측되었다(Wu, E et al.: J Virol. (2003) 77(13): 7225-7235). 이들 연구는 더 짧은 축을 갖는 섬유를 갖는 이전에 기재된 ChAd3 및 PanAd3과 비교하여 더 길고 더욱 가요성인 섬유를 갖는 ChAd155의 개선된 특성을 설명할 수 있다.
본 발명의 일 양태에서, 침팬지 아데노바이러스 ChAd155의 단리된 섬유, 펜톤 및 헥손 캡시드 폴리펩티드 및 침팬지 아데노바이러스 ChAd155의 섬유, 펜톤 및 헥산 캡시드 폴리펩티드를 인코딩하는 단리된 폴리뉴클레오티드가 제공된다.
3개 모두의 캡시드 단백질은 낮은 혈청유병률에 기여할 것으로 예상되며, 따라서 미리 존재하는 중화 항체에 대한 아데노바이러스의 친화성을 억제하기 위해, 예를 들어, 감소된 혈청유병률을 갖는 재조합 아데노바이러스를 제조하기 위해 서로 독립적으로 또는 조합하여 사용될 수 있다. 상기 재조합 아데노바이러스는 ChAd155로부터의 적어도 하나의 섬유 단백질과 함께 상이한 혈청형으로부터의 캡시드 단백질을 갖는 키메라 아데노바이러스일 수 있다.
ChAd155 섬유 폴리펩티드 서열은 SEQ ID NO: 1에 제공된다.
ChAd155 펜톤 폴리펩티드 서열은 SEQ ID NO: 3에 제공된다.
ChAd155 헥손 폴리펩티드 서열은 SEQ ID NO: 5에 제공된다.
ChAd155 섬유의 폴리펩티드 서열 또는 이의 기능성 유도체를 포함하는 폴리펩티드, 재조합 아데노바이러스, 조성물 또는 세포
적합하게는, 본 발명의 단리된 폴리펩티드, 재조합 아데노바이러스, 조성물 또는 세포는 SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 포함한다.
적합하게는, 본 발명의 폴리펩티드, 재조합 아데노바이러스, 조성물 또는 세포는 SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체인 폴리펩티드를 포함하며, 상기 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는다. 적합하게는, SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90%, 예를 들어, 적어도 91.0%, 예를 들어, 적어도 93.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 1에 비해 130개 이하, 더욱 적합하게는 120개 이하, 더욱 적합하게는 110개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
적합하게는, 본 발명에 따른 폴리펩티드, 재조합 아데노바이러스, 조성물 또는 세포는 하기를 추가로 포함한다:
(a) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 3의 아미노산 서열과 적어도 50.0% 동일한 아미노산 서열을 갖는, 기능성 유도체,
및/또는
(a) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 5의 아미노산 서열과 적어도 50% 동일한 아미노산 서열을 갖는, 기능성 유도체.
적합하게는, SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 3의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 91.0%, 예를 들어, 적어도 93.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 99.7%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 3에 비해 300개 이하, 더욱 적합하게는 250개 이하, 더욱 적합하게는 200개 이하, 더욱 적합하게는 150개 이하, 더욱 적합하게는 125개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
적합하게는, SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 5의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 91.0%, 예를 들어, 적어도 93.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 99.7%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 5에 비해 500개 이하, 더욱 적합하게는 400개 이하, 더욱 적합하게는 450개 이하, 더욱 적합하게는 300개 이하, 더욱 적합하게는 250개 이하, 더욱 적합하게는 200개 이하, 더욱 적합하게는 150개 이하, 더욱 적합하게는 125개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
ChAd155 펜톤의 폴리펩티드 서열을 포함하는 폴리펩티드, 재조합 아데노바이러스, 조성물 또는 세포
적합하게는, 본 발명의 폴리펩티드, 재조합 아데노바이러스, 조성물 또는 세포는 SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 포함한다.
적합하게는, 본 발명의 폴리펩티드, 재조합 아데노바이러스, 조성물 또는 세포는 하기를 추가로 포함한다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체
및/또는
(a) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 5의 아미노산 서열과 적어도 60% 동일한 아미노산 서열을 갖는, 기능성 유도체.
적합하게는, SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 87.0%, 예를 들어, 적어도 89.0%, 예를 들어, 적어도 91.0%, 예를 들어, 적어도 93.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 1에 비해 130개 이하, 더욱 적합하게는 120개 이하, 더욱 적합하게는 110개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
적합하게는, SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO:5의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 5에 비해 500개 이하, 더욱 적합하게는 400개 이하, 더욱 적합하게는 450개 이하, 더욱 적합하게는 300개 이하, 더욱 적합하게는 250개 이하, 더욱 적합하게는 200개 이하, 더욱 적합하게는 150개 이하, 더욱 적합하게는 125개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
ChAd155 섬유 또는 이의 기능성 유도체를 인코딩하는 폴리뉴클레오티드를 포함하는 단리된 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포
적합하게는, 본 발명의 단리된 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포는 SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함한다. 적합하게는, 폴리뉴클레오티드는 SEQ ID NO: 2에 따른 서열을 갖는다.
대안적으로, 본 발명의 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포는 SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드를 포함하며, 상기 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는다. 적합하게는, SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90%, 예를 들어, 적어도 91.0%, 예를 들어, 적어도 93.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99%, 예를 들어, 적어도 99.4%, 예를 들어, 적어도 99.6%, 예를 들어, 적어도 99.8% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 1에 비해 130개 이하, 더욱 적합하게는 120개 이하, 더욱 적합하게는 110개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
적합하게는, 본 발명의 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포는 하기를 인코딩하는 폴리뉴클레오티드를 추가로 포함한다:
(a) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 3의 아미노산 서열과 적어도 50.0% 동일한 아미노산 서열을 갖는, 기능성 유도체,
및/또는
(a) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 5의 아미노산 서열과 적어도 50% 동일한 아미노산 서열을 갖는, 기능성 유도체.
적합하게는, SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 3의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 91.0%, 예를 들어, 적어도 93.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99%, 예를 들어, 적어도 99.4%, 예를 들어, 적어도 99.6%, 예를 들어, 적어도 99.8% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 3에 비해 300개 이하, 더욱 적합하게는 250개 이하, 더욱 적합하게는 200개 이하, 더욱 적합하게는 150개 이하, 더욱 적합하게는 125개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
적합하게는, SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO:5의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 99.7%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 5에 비해 500개 이하, 더욱 적합하게는 400개 이하, 더욱 적합하게는 450개 이하, 더욱 적합하게는 300개 이하, 더욱 적합하게는 250개 이하, 더욱 적합하게는 200개 이하, 더욱 적합하게는 150개 이하, 더욱 적합하게는 125개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
ChAd155 펜톤을 인코딩하는 폴리뉴클레오티드를 포함하는 단리된 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포
적합하게는, 본 발명의 단리된 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포는 SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함한다. 적합하게는, 폴리뉴클레오티드는 SEQ ID NO: 4에 따른 서열을 갖는다.
적합하게는, 본 발명의 폴리뉴클레오티드, 벡터, 재조합 아데노바이러스, 조성물 또는 세포는 하기를 인코딩하는 폴리뉴클레오티드를 추가로 포함한다:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 50% 동일한 아미노산 서열을 갖는, 기능성 유도체
및/또는
(a) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 5의 아미노산 서열과 적어도 50% 동일한 아미노산 서열을 갖는, 기능성 유도체.
적합하게는, SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 87.0%, 예를 들어, 적어도 89.0%, 예를 들어, 적어도 91.0%, 예를 들어, 적어도 93.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 99.7%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 1에 비해 130개 이하, 더욱 적합하게는 120개 이하, 더욱 적합하게는 110개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
적합하게는, SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체는 이의 전장에 걸쳐 SEQ ID NO:5의 아미노산 서열과 적어도 60.0%, 예를 들어, 적어도 70.0%, 예를 들어, 적어도 80.0%, 예를 들어, 적어도 85.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 95.0%, 예를 들어, 적어도 97.0%, 예를 들어, 적어도 98.0%, 예를 들어, 적어도 99.0%, 예를 들어, 적어도 99.2%, 예를 들어, 적어도 99.4%, 예를 들어, 99.5%, 예를 들어, 적어도 99.6%, 예를 들어, 99.7%, 예를 들어, 적어도 99.8%, 예를 들어, 99.9% 동일한 아미노산 서열을 갖는다. 대안적으로, 기능성 유도체는 SEQ ID NO: 5에 비해 500개 이하, 더욱 적합하게는 400개 이하, 더욱 적합하게는 450개 이하, 더욱 적합하게는 300개 이하, 더욱 적합하게는 250개 이하, 더욱 적합하게는 200개 이하, 더욱 적합하게는 150개 이하, 더욱 적합하게는 125개 이하, 더욱 적합하게는 100개 이하, 더욱 적합하게는 90개 이하, 더욱 적합하게는 80개 이하, 더욱 적합하게는 70개 이하, 더욱 적합하게는 60개 이하, 더욱 적합하게는 50개 이하, 더욱 적합하게는 40개 이하, 더욱 적합하게는 30개 이하, 더욱 적합하게는 20개 이하, 더욱 적합하게는 10개 이하, 더욱 적합하게는 5개 이하, 더욱 적합하게는 4개 이하, 더욱 적합하게는 3개 이하, 더욱 적합하게는 2개 이하, 더욱 적합하게는 1개 이하의 첨가(들), 결실(들) 또는 치환(들)을 갖는다.
ChAd155 백본
본 발명은 침팬지 아데노바이러스 ChAd155의 단리된 폴리뉴클레오티드 서열, 예를 들어, 야생형의 변형되지 않은 ChAd155(SEQ ID NO: 10)의 단리된 폴리뉴클레오티드 서열 및 ChAd155의 변형된 백본 작제물을 제공한다. 이들 변형된 백본 작제물은 ChAd155#1434(SEQ ID NO: 7), ChAd155#1390(SEQ ID NO: 8) 및 ChAd155#1375(SEQ ID NO: 9)를 포함한다. ChAd155 백본은, 예를 들어, 트랜스진의 전달을 위한 재조합 복제-적격 또는 복제-부적격 아데노바이러스의 작제에서 사용될 수 있다.
ChAd155 야생형 서열(SEQ ID NO: 10) 서열의 주석이 하기에 제공된다.
일 구현예에서, SEQ ID NO: 7, 8, 9, 10의 서열의 단편 및 이의 상보적 가닥, cDNA 및 이에 상보적인 RNA가 제공된다. 적합하게는, 단편은 적어도 15개의 뉴클레오티드 길이, 더욱 적합하게는 30개의 뉴클레오티드 길이, 더욱 적합하게는 60개의 뉴클레오티드 길이, 더욱 적합하게는 120개의 뉴클레오티드 길이, 더욱 적합하게는 240개, 더욱 적합하게는 480개의 뉴클레오티드 길이이며, 기능성 단편, 즉, 생물학적 관심 단편을 포함한다. 예를 들어, 기능성 단편은 원하는 아데노바이러스 생성물을 발현시킬 수 있거나, 재조합 바이러스 벡터의 생성에 유용할 수 있다. 상기 단편은 상기 나열된 유전자 서열을 포함한다.
본원에 기재된 아데노바이러스 핵산에 의해 인코딩되는 ChAd155 아데노바이러스의 유전자 생성물, 예를 들어, 단백질, 효소 및 이들의 단편이 제공된다. 상기 단백질은 상기 확인된 오픈 리딩 프레임에 의해 인코딩되는 단백질 및 서열 목록에 제공된 폴리뉴클레오티드에 의해 인코딩되는 단백질을 포함한다.
추가의 ChAd155 폴리뉴클레오티드 및 폴리펩티드
일부 구현예에서, 본 발명의 폴리뉴클레오티드는 본 발명의 섬유 폴리펩티드; 펜톤 폴리펩티드; 헥손 폴리펩티드 및 펜톤 폴리펩티드; 헥손 폴리펩티드 및 섬유 폴리펩티드; 펜톤 폴리펩티드 및 섬유 폴리펩티드; 또는 헥손 폴리펩티드, 펜톤 폴리펩티드 및 섬유 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하며; 추가의 아데노바이러스 폴리뉴클레오티드, 적합하게는 ChAd155 폴리뉴클레오티드를 추가로 포함할 수 있다. 따라서, 적합하게는, 본 발명에 따른 폴리뉴클레오티드는 하기 중 하나 이상을 포함하며, SEQ ID NO:10에 비한 서열 좌표가 상기 주석에 제공된다:
(a) 아데노바이러스 5'-역 말단 반복(ITR);
(b) 아데노바이러스 E1A 영역, 또는 E1A_280R 및 E1A_243R 영역으로부터 선택되는 이의 단편;
(c) 아데노바이러스 E1B 또는 IX 영역, 또는 E1B_19K, E1B_55K 및 IX 영역으로 구성된 군으로부터 선택되는 이의 단편;
(d) 아데노바이러스 E2B 영역; 또는 E2B_pTP, E2B_중합효소 및 E2B_IVa2 영역으로 구성된 군으로부터 선택되는 이의 단편;
(e) 아데노바이러스 L1 영역, 또는 이의 단편으로서, 상기 단편이 L1_13.6K, L1_52K 및 L1_pIIIa 단백질로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L1 영역, 또는 이의 단편;
(f) 아데노바이러스 L2 영역 또는 본 발명의 펜톤 단백질을 인코딩하는 폴리뉴클레오티드를 포함하는 L2 영역, 또는 이들의 단편으로서, 상기 단편이 L2_펜톤 단백질, L2_pVII 단백질, L2_V 단백질 및 L2_pX 단백질로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L2 영역 또는 본 발명의 펜톤 단백질을 인코딩하는 폴리뉴클레오티드를 포함하는 L2 영역, 또는 이들의 단편;
(g) 아데노바이러스 L3 영역 또는 본 발명의 헥손 단백질을 인코딩하는 폴리뉴클레오티드를 포함하는 L3 영역, 또는 이들의 단편으로서, 상기 단편이 L3_pVI 단백질, L3_헥손 단백질 및 L3_프로테아제 단백질로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L3 영역 또는 본 발명의 헥손 단백질을 인코딩하는 폴리뉴클레오티드를 포함하는 L3 영역, 또는 이들의 단편;
(h) 아데노바이러스 E2A 영역;
(i) 아데노바이러스 L4 영역, 또는 이의 단편으로서, 상기 단편이 L4_100k 단백질, L4_33K 단백질, L4_22K 단백질 및 단백질 L4_VIII로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L4 영역, 또는 이의 단편;
(j) E3 ORF1, E3 ORF2, E3 ORF3, E3 ORF4, E3 ORF5, E3 ORF6, E3 ORF7, E3 ORF8, 및 E3 ORF9로 구성된 군으로부터 선택되는 아데노바이러스 E3 영역 또는 이의 단편;
(k) 아데노바이러스 L5 영역 또는 본 발명의 L5_섬유 섬유 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 L5 영역;
(l) 아데노바이러스(예를 들어, Ad5) E4 영역, 또는 E4 ORF7, E4 ORF6, E4 ORF4, E4 ORF3, E4 ORF2 및 E4 ORF1으로 구성된 군으로부터 선택되는 이의 단편; 특히 상기 E4 영역의 ORF6;
(m) 아데노바이러스 3'-ITR; 및/또는
(n) 아데노바이러스 VAI 또는 VAII RNA 영역, 바람직하게는 ChAd155가 아닌 아데노바이러스로부터의 아데노바이러스 VAI 또는 VAII RNA 영역, 더욱 바람직하게는 Ad5로부터의 아데노바이러스 VAI 또는 VAII RNA 영역.
정의
적합하게는, 본 발명의 폴리뉴클레오티드 또는 폴리펩티드는 단리된다. "단리된" 폴리뉴클레오티드는 이의 본래의 환경으로부터 분리된 것이다. 예를 들어, 자연 발생 폴리뉴클레오티드는 자연계의 공존하는 물질 중 일부 또는 전부로부터 분리되는 경우에 단리된다. 폴리뉴클레오티드는, 예를 들어, 이의 자연 환경의 일부가 아닌 벡터로 클로닝되거나, cDNA 내에 포함되는 경우에 단리된 것으로 간주된다.
적합하게는, 본 발명의 폴리뉴클레오티드는 재조합 폴리뉴클레오티드이다. 재조합은 폴리뉴클레오티드가 자연에서 발견되는 폴리뉴클레오티드와 다른 폴리뉴클레오티드를 발생시키는 클로닝, 제한 또는 라이게이션 단계, 또는 다른 절차 중 적어도 하나의 생성물인 것을 의미한다. 재조합 아데노바이러스는 재조합 폴리뉴클레오티드를 포함하는 아데노바이러스이다. 재조합 벡터는 재조합 폴리뉴클레오티드를 포함하는 벡터이다. '재조합 바이러스'는 본래의 재조합 바이러스의 프로제니(progeny)를 포함한다. '재조합 벡터'는 본래의 재조합 벡터의 복제물을 포함한다. '재조합 폴리뉴클레오티드'는 본래의 재조합 폴리뉴클레오티드의 복제물을 포함한다.
적합하게는, 본 발명의 폴리펩티드 서열은 자연 서열과 관련하여 적어도 하나의 변경을 함유한다. 적합하게는, 본 발명의 폴리뉴클레오티드 서열은 자연 서열과 관련하여 적어도 하나의 변경을 함유한다. 예를 들어, 유전 공학 기술에 의해 상이한 종(종종, 상이한 속, 아과 또는 과)으로부터 유래된 플라스미드 또는 벡터로 도입된 폴리뉴클레오티드는 이종성 폴리뉴클레오티드이다. 이의 자연 코딩 서열로부터 분리되고, 자연적으로 연결된 채로 발견되지 않는 코딩 서열에 작동 가능하게 연결된 프로모터는 이종성 프로모터이다. 바이러스 또는 바이러스 벡터의 유전체로 클로닝된 특정 재조합 부위(바이러스의 유전체는 이를 자연적으로 함유하지 않음)는 이종성 재조합 부위이다. 이종성 핵산 서열은 또한 아데노바이러스 유전체에서 자연적으로 발견되나, 아데노바이러스 벡터 내의 비-자연 위치에 위치되는 서열을 포함한다.
통상적으로, "이종성"은 비교되는 존재물의 나머지 것과 유전자형적으로 다른 존재물로부터 유래된 것을 의미한다. 이종성 핵산 서열은 아데노바이러스 벡터의 자연 발생 핵산 서열로부터 단리되거나, 이로부터 유래되거나, 이를 기초로 하지 않는 임의의 핵산 서열을 나타낸다. "자연 발생"은 자연에서 발견되고, 합성적으로 제조되거나 변형되지 않은 서열을 의미한다. 서열은 공급원으로부터 분리되나 변형(예를 들어, 결실, 치환(돌연변이), 삽입, 또는 다른 변형)되지 않아, 적합하게는 공급원 유전자의 정상 기능을 붕괴시키지 않는 경우에 공급원으로부터 "유래"된다.
폴리펩티드의 "기능성 유도체"는 적합하게는 폴리펩티드의 변형된 형태, 예를 들어, 폴리펩티드의 하나 이상의 아미노산이 결실되고/되거나, 삽입되고/되거나, 변형되고/되거나, 치환될 수 있는 폴리펩티드의 변형된 형태를 나타낸다. 변형되지 않은 아데노바이러스 캡시드 단백질의 유도체는, 예를 들어, 하기와 같은 경우 기능성인 것으로 간주된다:
(a) 캡시드 내에 유도체 캡시드 단백질을 포함하는 아데노바이러스가 변형되지 않은 캡시드 단백질을 포함하는 아데노바이러스에 비해 실질적으로 동일하거나 더 낮은 혈청유병률을 보유하고/하거나;
(b) 캡시드 내에 유도체 캡시드 단백질을 포함하는 아데노바이러스가 변형되지 않은 캡시드 단백질을 포함하는 아데노바이러스에 비해 실질적으로 동일하거나 더 높은 숙주 세포 감염성을 보유하고/하거나;
(c) 캡시드 내에 유도체 캡시드 단백질을 포함하는 아데노바이러스가 변형되지 않은 캡시드 단백질을 포함하는 아데노바이러스에 비해 실질적으로 동일하거나 더 높은 면역원성을 보유하고/하거나;
(d) 캡시드 내에 유도체 캡시드 단백질을 포함하는 아데노바이러스가 변형되지 않은 캡시드 단백질을 포함하는 아데노바이러스에 비해 실질적으로 동일하거나 더 높은 수준의 트랜스진 생산성을 보유하는 경우.
상기 특성 (a)-(d)는 적합하게는 하기 실시예 섹션에 기재된 방법을 이용하여 측정될 수 있다.
적합하게는, 폴리펩티드, 벡터 또는 재조합 아데노바이러스는 인간 집단에서 낮은 혈청유병률을 갖는다. "낮은 혈청유병률"은 인간 아데노바이러스 5(Ad5)에 비해 감소된 기존 중화 항체 수준을 갖는 것을 의미할 수 있다. 유사하거나 대안적으로, "낮은 혈청유병률"은 약 20% 미만의 혈청유병률, 약 15% 미만의 혈청유병률, 약 10% 미만의 혈청유병률, 약 5% 미만의 혈청유병률, 약 4% 미만의 혈청유병률, 약 3% 미만의 혈청유병률, 약 2% 미만의 혈청유병률, 약 1% 미만의 혈청유병률 또는 검출 가능하지 않은 혈청유병률을 의미할 수 있다. 혈청유병률은 문헌[Aste-Amezaga et al., Hum. Gene Ther. (2004) 15(3):293-304]에 기재된 방법을 이용하여 임상적으로 관련된 중화 역가(200 초과의 50% 중화 역가로 정의됨)를 갖는 개체의 백분율로 측정될 수 있다.
용어 폴리펩티드, 펩티드 및 단백질은 본원에서 상호 교환적으로 사용된다.
용어 "유인원"은 통상적으로 비인간 영장류, 예를 들어, 구세계 원숭이, 신세계 원숭이, 원숭이 및 긴팔원숭이를 포함하는 것을 의미한다. 특히, 유인원은 비인간 원숭이, 예를 들어, 침팬지(판 트로글로디테(Pan troglodyte)), 보노보(판 파니스쿠스(Pan paniscus)) 및 고릴라(고릴라 속)를 나타낼 수 있다. 비-원숭이 유인원은 히말라야 원숭이(마카카 물라타(Macaca mulatta))를 포함할 수 있다.
서열 비교
2개의 밀접하게 관련된 폴리뉴클레오티드 또는 폴리펩티드 서열을 비교하기 위해, 제1 서열과 제2 서열 사이의 "동일성 %"는 표준 설정을 이용한 정렬 프로그램, 예를 들어, BLAST®(blast.ncbi.nlm.nih.gov에서 이용 가능함, 2015년 3월 9일에 최종 액세스)을 이용하여 계산될 수 있다. 동일성 %는 동일한 잔기의 수를 참조 서열 내의 잔기의 수로 나누고, 100을 곱한 것이다. 상기 및 청구항에서 언급된 동일성 % 숫자는 이러한 방법에 의해 계산된 백분율이다. 동일성 %의 대안적 정의는 동일한 잔기의 수를 정렬된 잔기의 수로 나누고, 100을 곱한 것이다. 대안적 방법은 정렬 내의 갭, 예를 들어, 다른 서열에 비한 한 서열에서의 결실이 스코어링 파라미터에서 갭 스코어 또는 갭 비용으로 설명되는 갭 방법(gapped method)을 이용하는 것을 포함한다. 더 많은 정보를 위해, 2015년 3월 9일에 마지막으로 액세스된 ftp.ncbi.nlm.nih.gov/pub/factsheets/HowTo_BLASTGuide.pdf에서 이용 가능한 BLAST® 팩트 시트(fact sheet)를 참조한다.
폴리뉴클레오티드 또는 이에 의해 인코딩된 폴리펩티드의 기능성을 보존하는 서열은 더욱 밀접하게 동일할 수 있다. 폴리펩티드 또는 폴리뉴클레오티드 서열은 이들이 이들의 전장에 걸쳐 100% 서열 동일성을 공유하는 경우에 다른 폴리펩티드 또는 폴리뉴클레오티드 서열과 동일하거나 일치하는 것으로 언급된다.
서열 사이의 "차이"는 제1 서열에 비해 제2 서열의 한 위치에서의 단일 아미노산 잔기의 삽입, 결실 또는 치환을 나타낸다. 2개의 폴리펩티드 서열은 1개, 2개 또는 그 초과의 상기 아미노산 차이를 함유할 수 있다. 제1 서열과 달리 동일한(100% 서열 동일성) 제2 서열에서의 삽입, 결실 또는 치환은 서열 동일성 퍼센트를 감소시킨다. 예를 들어, 동일한 서열이 9개의 아미노산 잔기 길이인 경우, 제2 서열에서의 하나의 치환은 88.9%의 서열 동일성을 발생시킨다. 동일한 서열이 17개의 아미노산 잔기 길이인 경우, 제2 서열에서의 2개의 치환은 88.2%의 서열 동일성을 발생시킨다. 동일한 서열이 7개의 아미노산 잔기 길이인 경우, 제2 서열에서의 3개의 치환은 57.1%의 서열 동일성을 발생시킨다. 제1 및 제2 폴리펩티드 서열이 9개의 아미노산 잔기 길이이고, 6개의 동일한 잔기를 공유하는 경우, 제1 및 제2 폴리펩티드 서열은 66% 초과의 동일성을 공유한다(제1 및 제2 폴리펩티드 서열은 66.7%의 동일성을 공유한다). 제1 및 제2 폴리펩티드 서열이 17개의 아미노산 잔기 길이이고, 16개의 동일한 잔기를 공유하는 경우, 제1 및 제2 폴리펩티드 서열은 94% 초과의 동일성을 공유한다(제1 및 제2 폴리펩티드 서열은 94.1%의 동일성을 공유한다). 제1 및 제2 폴리펩티드 서열이 7개의 아미노산 잔기 길이이고, 3개의 동일한 잔기를 공유하는 경우, 제1 및 제2 폴리펩티드 서열은 42% 초과의 동일성을 공유한다(제1 및 제2 폴리펩티드 서열은 42.9%의 동일성을 공유한다).
대안적으로, 제1의 참조 폴리펩티드 서열을 제2의 비교 폴리펩티드 서열과 비교하기 위해, 제2 서열을 생성시키기 위해 제1 서열에서 이루어진 첨가, 치환 및/또는 결실의 수가 확인될 수 있다. 첨가는 제1 폴리펩티드의 서열로의 하나의 아미노산 잔기의 첨가(제1 폴리펩티드의 어느 한 말단에서의 첨가를 포함)이다. 치환은 제1 폴리펩티드의 서열 내의 하나의 아미노산 잔기의 하나의 상이한 아미노산 잔기에 의한 치환이다. 결실은 제1 폴리펩티드의 서열로부터의 하나의 아미노산 잔기의 결실(제1 폴리펩티드의 어느 한 말단에서의 결실을 포함)이다.
제1의 참조 폴리뉴클레오티드 서열을 제2의 비교 폴리뉴클레오티드 서열과 비교하기 위해, 제2 서열을 생성시키기 위해 제1 서열에서 이루어진 첨가, 치환 및/또는 결실의 수가 확인될 수 있다. 첨가는 제1 폴리뉴클레오티드의 서열로의 하나의 뉴클레오티드 잔기의 첨가(제1 폴리뉴클레오티드의 어느 한 말단에서의 첨가를 포함)이다. 치환은 제1 폴리뉴클레오티드의 서열 내의 하나의 뉴클레오티드 잔기의 하나의 상이한 뉴클레오티드 잔기에 의한 치환이다. 결실은 제1 폴리뉴클레오티드의 서열로부터의 하나의 뉴클레오티드 잔기의 결실(제1 폴리뉴클레오티드의 어느 한 말단에서의 결실을 포함)이다.
적합하게는, 본 발명의 서열 내에서의 치환은 보존성 치환일 수 있다. 보존성 치환은 한 아미노산의 치환되는 아미노산과 유사한 화학적 특성을 갖는 또 다른 아미노산에 의한 치환을 포함한다(예를 들어, 문헌[Stryer et al, Biochemistry, 5th Edition 2002, pages 44-49] 참조). 바람직하게는, 보존성 치환은 (i) 염기성 아미노산의 또 다른 상이한 염기성 아미노산에 의한 치환; (ii) 산성 아미노산의 또 다른 상이한 산성 아미노산에 의한 치환; (iii) 방향족 아미노산의 또 다른 상이한 방향족 아미노산에 의한 치환; (iv) 비-극성 지방족 아미노산의 또 다른 상이한 비-극성 지방족 아미노산에 의한 치환; 및 (v) 극성의 하전되지 않은 아미노산의 또 다른 상이한 극성의 하전되지 않은 아미노산에 의한 치환으로 구성된 군으로부터 선택된 치환이다. 염기성 아미노산은 바람직하게는 아르기닌, 히스티딘, 및 리신으로 구성된 군으로부터 선택된다. 산성 아미노산은 바람직하게는 아스파테이트 또는 글루타메이트이다. 방향족 아미노산은 바람직하게는 페닐알라닌, 티로신 및 트립토판으로 구성된 군으로부터 선택된다. 비-극성의 지방족 아미노산은 바람직하게는 글리신, 알라닌, 발린, 류신, 메티오닌 및 이소류신으로 구성된 군으로부터 선택된다. 극성의 하전되지 않은 아미노산은 바람직하게는 세린, 트레오닌, 시스테인, 프롤린, 아스파라긴 및 글루타민으로 구성된 군으로부터 선택된다. 보존성 아미노산 치환과 대조적으로, 비-보존성 아미노산 치환은 한 아미노산의 상기 개설된 보존성 치환 (i) 내지 (v)에 속하지 않는 임의의 아미노산에 의한 교환이다.
벡터 및 재조합 아데노바이러스
본 발명의 ChAd155 서열은 치료제로서, 그리고 다양한 벡터 시스템, 재조합 아데노바이러스 및 숙주 세포의 작제에서 유용하다. 적합하게는, 용어 "벡터"는 야생형 서열에 비해 실질적으로 변경(예를 들어, 결실되고/되거나 비활성화된 유전자 또는 기능성 영역)되고/되었거나 이종성 서열, 즉, 상이한 공급원으로부터 획득된 핵산("삽입물"로도 언급됨)이 혼입되고, 세포(예를 들어, 숙주 세포)로 도입되는 경우 삽입된 폴리뉴클레오티드 서열을 복제하고/하거나 발현시킬 수 있는 핵산을 나타낸다. 예를 들어, 삽입물은 본원에 기재된 ChAd155 서열 중 일부 또는 전부일 수 있다. 또한 또는 대안적으로, ChAd155 벡터는 바이러스 유전자, 예를 들어, E1 또는 본원에 기재된 다른 바이러스 유전자 또는 기능성 영역의 하나 이상의 결실 또는 비활성화를 포함하는 ChAd155 아데노바이러스일 수 있다. 이종성 서열을 포함하거나 포함하지 않을 수 있는 상기 ChAd155는 종종 "백본"으로 언급되며, 그대로 사용되거나, 벡터에 대한 추가 변형을 위한 시작점으로 사용될 수 있다.
벡터는 네이키드 DNA, 플라스미드, 바이러스, 코스미드, 파지 벡터, 예를 들어, 람다 벡터, 인공 염색체, 예를 들어, BAC(박테리아 인공 염색체), 또는 에피솜을 포함하는 임의의 적합한 핵산 분자일 수 있다. 대안적으로, 벡터는 세포 비함유 시험관 내 전사 또는 발현을 위한 전사 및/또는 발현 유닛, 예를 들어, T7-상용성 시스템일 수 있다. 벡터는 단독으로 또는 다른 아데노바이러스 서열 또는 단편과 함께, 또는 비-아데노바이러스 서열로부터의 요소와 함께 사용될 수 있다. ChAd155 서열은 또한 안티센스 전달 벡터, 유전자 요법 벡터, 또는 백신 벡터에서 유용할 수 있다. 따라서, 유전자 전달 벡터, 및 ChAd155 서열을 함유하는 숙주 세포가 추가로 제공된다.
용어 "복제-적격" 아데노바이러스는 세포 내에 포함된 임의의 재조합 헬퍼 단백질의 부재하에서 숙주 세포에서 복제할 수 있는 아데노바이러스를 나타낸다. 적합하게는, "복제-적격" 아데노바이러스는 다음과 같은 온전하거나 기능성 필수 초기 유전자를 포함한다: E1A, E1B, E2A, E2B, E3 및 E4. 특정 동물로부터 단리된 야생형 아데노바이러스는 상기 동물에서 복제 적격일 것이다.
용어 "복제-부적격" 또는 "복제-결함" 아데노바이러스는 적어도 기능적 결실(또는 "기능 손실" 돌연변이), 즉, 완전히 제거되지 않고 유전자의 기능을 손상시키는 결실 또는 돌연변이, 예를 들어, 인공 정지 코돈의 도입, 활성 부위 또는 상호작용 도메인의 결실 또는 돌연변이, 유전자의 조절 서열의 돌연변이 또는 결실 등, 또는 바이러스 복제에 필수적인 유전자 생성물을 인코딩하는 유전자, 예를 들어, E1A, E1B, E2A, E2B, E3 및 E4(예를 들어, E3 ORF1, E3 ORF2, E3 ORF3, E3 ORF4, E3 ORF5, E3 ORF6, E3 ORF7, E3 ORF8, E3 ORF9, E4 ORF7, E4 ORF6, E4 ORF4, E4 ORF3, E4 ORF2 및/또는 E4 ORF1)로부터 선택되는 아데노바이러스 유전자 중 하나 이상의 완전한 제거를 포함하도록 공학 처리됨으로 인해 복제 불가능한 아데노바이러스를 나타낸다. 특히, 적합하게는 E1 및 선택적으로 E3 및/또는 E4가 결실된다. 결실되는 경우, 상기 언급된 결실된 유전자 영역은 적합하게는 또 다른 서열과 관련하여 동일성 %를 결정하는 경우에 정렬에서 고려되지 않을 것이다.
본 발명은 치료 또는 백신 목적으로 단백질, 적합하게는 이종성 단백질을 세포로 전달하는 벡터, 예를 들어, 재조합 아데노바이러스를 제공한다. 벡터는 네이키드 DNA, 파지, 트랜스포존(transposon), 코스미드, 에피솜, 플라스미드, 또는 바이러스를 포함하는 임의의 유전적 요소를 포함할 수 있다. 상기 벡터는 본원에 개시된 바와 같은 ChAd155의 DNA 및 미니유전자(minigene)를 함유한다. "미니유전자"(또는 "발현 카세트")는 선택된 이종성 유전자(트랜스진) 및 숙주 세포에서 유전자 생성물의 번역, 전사 및/또는 발현을 유도하는데 필요한 다른 조절 요소의 조합물을 의미한다.
통상적으로, ChAd155-유래 아데노바이러스 벡터는 미니유전자가 선택된 아데노바이러스 유전자에 고유한 영역에서 다른 아데노바이러스 서열을 함유하는 핵산 분자 내에 위치되도록 설계된다. 미니유전자는 원하는 경우 기존 유전자 영역에 삽입되어 상기 유전자의 기능을 붕괴시킬 수 있다. 대안적으로, 미니유전자는 부분적 또는 완전히 결실된 아데노바이러스 유전자의 부위에 삽입될 수 있다. 예를 들어, 미니유전자는 E1A, E1B, E2A, E2B, E3 및 E4로 구성된 군으로부터 선택되는 유전체 영역의 적어도 하나의 유전자를 비-기능성이 되도록 돌연변이, 삽입 또는 결실의 부위에 위치될 수 있다. 용어 "비-기능성이 되도록 한다"는 유전자 영역의 충분한 양이 제거되거나 달리 붕괴되어, 유전자 영역이 더 이상 유전자 발현의 기능성 생성물을 생성할 수 없는 것을 의미한다. 원하는 경우, 전체 유전자 영역이 제거될 수 있다(그리고 적합하게는 미니유전자로 대체될 수 있다).
예를 들어, 재조합 바이러스의 생성에 유용한 생산 벡터의 경우, 벡터는 미니유전자 및 아데노바이러스 유전체의 5' 말단 또는 아데노바이러스 유전체의 3' 말단, 또는 아데노바이러스 유전체의 5' 및 3' 말단 둘 모두를 함유할 수 있다. 아데노바이러스 유전체의 5' 말단은 패키징 및 복제에 필요한 5' 시스-요소, 즉, 5' ITR 서열(복제 기점으로 기능함) 및 자연 5' 패키징 인핸서 도메인(선형 Ad 유전체 및 E1 프로모터에 대한 인핸서 요소를 패키징하는데 필요한 서열을 함유함)을 함유한다. 아데노바이러스 유전체의 3' 말단은 패키징 및 캡시드화에 필요한 3' 시스-요소(ITR을 포함함)를 포함한다. 적합하게는, 재조합 아데노바이러스는 5' 및 3' 아데노바이러스 시스-요소 둘 모두를 함유하며, 미니유전자(적합하게는 트랜스진을 함유함)는 5' 및 3' 아데노바이러스 서열 사이에 위치된다. ChAd155-기반 아데노바이러스 벡터는 또한 추가 아데노바이러스 서열을 함유할 수 있다.
적합하게는, ChAd155-기반 벡터는 본 발명의 아데노바이러스 ChAd155 유전체로부터 유래된 하나 이상의 아데노바이러스 요소를 함유한다. 일 구현예에서, 벡터는 ChAd155로부터의 아데노바이러스 ITR 및 동일 아데노바이러스 혈청형으로부터의 추가 아데노바이러스 서열을 함유한다. 또 다른 구현예에서, 벡터는 ITR을 제공하는 것과 상이한 아데노바이러스 혈청형으로부터 유래되는 아데노바이러스 서열을 함유한다.
본원에 정의된 바와 같이, 슈도타이핑된 아데노바이러스는 아데노바이러스의 캡시드 단백질이 ITR을 제공하는 아데노바이러스와 상이한 아데노바이러스로부터 유래되는 아데노바이러스를 나타낸다.
추가로, 키메라 또는 하이브리드 아데노바이러스는 당업자에게 공지된 기술(예를 들어, US 7,291,498호)을 이용하여 본원에 기재된 아데노바이러스를 이용하여 작제될 수 있다.
본 발명의 벡터에 존재하는 ITR 및 임의의 다른 아데노바이러스 서열은 많은 공급원으로부터 획득될 수 있다. 다양한 아데노바이러스 균주가 미국 미생물보존센터(American Type Culture Collection, Manassas, Virginia)로부터 이용 가능하거나, 다양한 상업 및 기관 공급처로부터 요청에 의해 이용 가능하다. 추가로, 많은 상기 균주의 서열은, 예를 들어, PubMed 및 GenBank를 포함하는 다양한 데이터베이스로부터 이용 가능하다. 다른 침팬지 또는 인간 아데노바이러스로부터 제조된 상동성 아데노바이러스 벡터는 공개된 문헌(예를 들어, US 5,240,846호)에 기재되어 있다. 유형 Ad5(GenBank 등록 번호 M73370)를 포함하는 다수의 아데노바이러스 유형의 DNA 서열이 GenBank로부터 이용 가능하다. 아데노바이러스 서열은 현재 확인된 인간 유형 중 임의의 유형을 추가로 포함하여 임의의 공지된 아데노바이러스 혈청형, 예를 들어, 혈청형 2, 3, 4, 7, 12 및 40으로부터 획득될 수 있다. 유사하게, 비인간 동물(예를 들어, 유인원)을 감염시키는 것으로 공지된 아데노바이러스가 또한 본 발명의 벡터 작제물에서 사용될 수 있다(예를 들어, US 6,083,716호). 본원에 기재된 벡터의 작제에서 사용되는 바이러스 서열, 헬퍼 바이러스(필요한 경우), 및 재조합 바이러스 입자, 및 다른 벡터 성분 및 서열은 하기 기재되는 바와 같이 획득될 수 있다.
서열, 벡터 및 아데노바이러스 생성
본 발명의 서열은 재조합 생성, 화학 합성, 또는 다른 합성 수단을 포함하는 임의의 적합한 수단에 의해 생성될 수 있다. 적합한 생성 기술은 당업자에게 널리 공지되어 있다. 대안적으로, 펩티드는 또한 널리 공지된 고체상 펩티드 합성 방법에 의해 합성될 수 있다.
아데노바이러스 플라스미드(또는 다른 벡터)가 아데노바이러스 벡터를 생성시키기 위해 사용될 수 있다. 일 구현예에서, 아데노바이러스 벡터는 복제-부적격인 아데노바이러스 입자이다. 일 구현예에서, 아데노바이러스 입자는 E1A 및/또는 E1B 유전자에서의 결실에 의해 복제-부적격이 된다. 대안적으로, 아데노바이러스는 선택적으로 E1A 및/또는 E1B 유전자를 보존하면서 또 다른 수단에 의해 복제-부적격이 된다. 유사하게는, 일부 구현예에서, 벡터에 대한 면역 반응의 감소는 E2B 및/또는 DNA 중합효소 유전자에서의 결실에 의해 달성될 수 있다. 아데노바이러스 벡터는 또한 아데노바이러스 유전체에 대한 다른 돌연변이, 예를 들어, 온도-민감성 돌연변이 또는 다른 유전자에서의 결실을 함유할 수 있다. 다른 구현예에서, 아데노바이러스 벡터에서 온전한 E1A 및/또는 E1B 영역을 보유하는 것이 바람직하다. 상기 온전한 E1 영역은 아데노바이러스 유전체 내의 이의 자연 위치에 위치될 수 있거나, 자연 아데노바이러스 유전체 내의 결실 부위(예를 들어, E3 영역 내)에 배치될 수 있다.
포유동물(예를 들어, 인간) 세포로의 유전자의 전달을 위한 아데노바이러스 벡터의 작제에서, 광범위한 변형된 아데노바이러스 핵산 서열이 벡터에서 사용될 수 있다. 예를 들어, 아데노바이러스 지연 초기 유전자 E3의 일부 또는 전부가 재조합 바이러스의 일부를 형성하는 아데노바이러스 서열로부터 제거될 수 있다. E3의 기능은 재조합 바이러스 입자의 기능 및 생성과 관련이 없는 것으로 생각된다. 아데노바이러스 벡터는 또한 E4 유전자의 적어도 ORF6 영역, 더욱 바람직하게는 이러한 유전자의 기능에서의 중복성으로 인해 전체 E4 영역의 결실을 갖도록 작제될 수 있다. 본 발명의 또 다른 벡터는 지연 초기 유전자 E2A에서 결실을 함유한다. 결실은 또한 아데노바이러스 유전체의 후기 유전자 L1 내지 L5 중 임의의 것에서 이루어질 수 있다. 유사하게는, 중간체 유전자 IX 및 IVa2에서의 결실이 일부 목적에 유용할 수 있다. 다른 결실이 다른 구조 또는 비-구조 아데노바이러스 유전자에서 이루어질 수 있다. 상기 논의된 결실은 개별적으로 이용될 수 있으며, 즉, 본원에 기재된 바와 같은 사용을 위한 아데노바이러스 서열은 단지 하나의 영역에서 결실을 함유할 수 있다. 대안적으로, 전체 유전자 또는 이들의 생물학적 활성을 파괴하기에 효과적인 상기 유전자의 일부의 결실은 임의의 조합으로 사용될 수 있다. 예를 들어, 일 예시적 벡터에서, 아데노바이러스 서열은 E1 유전자 및 E4 유전자의 결실, 또는 E1, E2A 및 E3 유전자의 결실, 또는 E1 및 E3 유전자의 결실, 또는 E3의 결실과 함께 또는 이의 결실 없이 E1, E2A 및 E4 유전자의 결실 등을 가질 수 있다. E 유전자 중 어느 하나 이상은 적합하게는 아데노바이러스의 상이한 균주로부터 유래된 E 유전자(또는 하나 이상의 E 유전자 오픈 리딩 프레임)로 대체될 수 있다. 특히 적합하게는, ChAd155 E1 및 E3 유전자는 결실되고, ChAd155 E4 유전자는 E4Ad5orf6으로 대체된다. 상기 논의된 바와 같이, 상기 결실 및/또는 치환은 원하는 결과를 달성하기 위해 다른 돌연변이, 예를 들어, 온도-민감성 돌연변이와 함께 사용될 수 있다.
하나 이상의 필수 아데노바이러스 서열(예를 들어, E1A, E1B, E2A, E2B, E4 ORF6, L1, L2, L3, L4 및 L5)이 결여된 아데노바이러스 벡터는 아데노바이러스 입자의 바이러스 감염성 및 증식에 필요한 손실된 아데노바이러스 유전자 생성물의 존재하에서 배양될 수 있다. 이들 헬퍼 기능은 하나 이상의 헬퍼 작제물(예를 들어, 플라스미드 또는 바이러스) 또는 패키징 숙주 세포의 존재하에서 아데노바이러스 벡터를 배양함으로써 제공될 수 있다.
복제-부적격 벡터의 상보성
상기 기재된 유전자 중 임의의 유전자에서 결실된 재조합 아데노바이러스를 생성시키기 위해, 바이러스의 복제 및 감염성에 필수적인 경우 결실된 유전자 영역의 기능은 헬퍼 바이러스 또는 세포주, 즉, 상보성 또는 패키징 세포주에 의해 재조합 바이러스에 제공되어야 한다.
헬퍼 바이러스
미니유전자를 운반하는데 사용되는 바이러스 벡터의 아데노바이러스 유전자 내용물에 따라, 미니유전자를 함유하는 감염성 재조합 바이러스 입자를 생성시키는데 필요한 충분한 아데노바이러스 유전자 서열을 제공하기 위해 헬퍼 아데노바이러스 또는 비-복제 바이러스 단편이 사용될 수 있다. 유용한 헬퍼 바이러스는 아데노바이러스 벡터 작제물에 존재하지 않고/않거나 벡터가 형질감염되는 패키징 세포주에 의해 발현되지 않는 선택된 아데노바이러스 유전자 서열을 함유한다. 일 구현예에서, 헬퍼 바이러스는 복제-결여성이며, 적합하게는 본원에 기재된 하나 이상의 서열에 더하여 아데노바이러스 유전자를 함유한다. 상기 헬퍼 바이러스는 적합하게는 E1 발현(선택적으로, 추가로 E3 발현) 세포주와 함께 사용된다.
헬퍼 바이러스는 선택적으로 리포터 유전자를 함유할 수 있다. 다수의 상기 리포터 유전자가 당 분야에 공지되어 있을뿐만 아니라 본원에 기재되어 있다. 아데노바이러스 벡터 상의 트랜스진과 상이한 헬퍼 바이러스 상의 리포터 유전자의 존재는 아데노바이러스 벡터 및 헬퍼 바이러스 둘 모두가 독립적으로 모니터되는 것을 가능하게 한다. 이러한 리포터는 정제시 생성된 재조합 바이러스와 헬퍼 바이러스 사이의 분리를 가능하게 하기 위해 사용된다.
상보성 세포주
많은 상황에서, 바이러스의 복제 및 감염성에 필수적인 하나 이상의 손실된 유전자, 예를 들어, 인간 E1을 발현하는 세포주가 침팬지 아데노바이러스 벡터를 교차보충(transcomplement)하는데 사용될 수 있다. 이는 본 발명의 침팬지 아데노바이러스 서열과 현재 이용 가능한 패키징 세포에서 발견되는 인간 아데노바이러스 서열 사이의 다양성으로 인해 현재 인간 E1-함유 세포의 사용이 복제 및 생산 과정 동안 복제-적격 아데노바이러스의 발생을 방지함에 따라 특히 유리하다.
대안적으로, 원하는 경우, 선택된 모 세포주에서의 발현을 위한 프로모터의 전사 조절하에서 최소한 ChAd155로부터 E1 유전자를 발현하는 패키징 세포 또는 세포주를 발생시키기 위해 본원에 제공된 서열을 이용할 수 있다. 이러한 목적을 위해 유도성 또는 항시성 프로모터가 사용될 수 있다. 상기 프로모터의 예는 본 문서의 다른 곳에 상세히 기재되어 있다. 임의의 원하는 ChAd155 유전자를 발현하는 신규한 세포주의 생성을 위해 모 세포가 선택된다. 비제한적으로, 상기 모 세포주는 다른 것 중에서도 HeLa[ATCC 등록 번호 CCL 2], A549[ATCC 등록 번호 CCL 185], HEK 293, KB[CCL 17], Detroit[예를 들어, Detroit 510, CCL 72] 및 WI-38[CCL 75] 세포일 수 있다. 이들 세포주는 미국 미생물보존센터(American Type Culture Collection, 10801 University Boulevard, Manassas, Virginia 20110-2209)로부터 모두 이용 가능하다.
상기 E1-발현 세포주는 재조합 아데노바이러스 E1 결실 벡터의 생성에서 유용하다. 추가로, 또는 대안적으로, 하나 이상의 아데노바이러스 유전자 생성물, 예를 들어, E1A, E1B, E2A, E3 및/또는 E4를 발현하는 세포주가 재조합 바이러스 벡터의 생성에서 사용되는 것과 본질적으로 동일한 절차를 이용하여 작제될 수 있다. 상기 세포주는 상기 생성물을 인코딩하는 필수 유전자가 결실된 아데노바이러스 벡터를 교차보충하거나, 헬퍼-의존성 바이러스(예를 들어, 아데노-관련 바이러스)의 패키징에 필요한 헬퍼 기능을 제공하기 위해 사용될 수 있다. 숙주 세포의 제조는 선택된 DNA 서열의 어셈블리와 같은 기술을 포함한다.
또 다른 대안에서, 필수 아데노바이러스 유전자 생성물은 아데노바이러스 벡터 및/또는 헬퍼 바이러스에 의해 교차하여(in trans) 제공된다. 상기 예에서, 적합한 숙주 세포는 임의의 생물학적 유기체, 예를 들어, 원핵생물(예를 들어, 박테리아) 세포, 및 진핵생물 세포, 예를 들어, 곤충 세포, 효모 세포 및 포유동물 세포로부터 선택될 수 있다.
숙주 세포는 인간, 원숭이, 마우스, 래트, 토끼, 및 햄스터를 포함하는 포유동물로부터 유래된 세포, 예를 들어, A549, WEHI, 3T3, 10'I'I/2, HEK 293 세포 또는 Per.C6(둘 모두는 기능성 아데노바이러스 E1을 발현함)[Fallaux, 1998], Saos, C2C12, L 세포, HT1080, HepG2 및 일차 섬유모세포, 간세포 및 근육모세포를 포함하나 이에 제한되지는 않는 임의의 포유동물 종으로부터 선택될 수 있다.
특히 적합한 상보성 세포주는 Procell92 세포주이다. Procell92 세포주는 인간 포스포글리세레이트 키나제-1(PGK) 프로모터의 조절하에서 Tet 억제인자로 형질감염된 아데노바이러스 E1 유전자, 및 G418-내성 유전자를 발현하는 HEK 293 세포를 기초로 한다(Vitelli et al. PLOS One (2013) 8(e55435):1-9). Procell92.S는 현탁 조건에서의 성장에 적합하며, 독성 단백질을 발현하는 아데노바이러스 벡터를 생성하는데 유용하다(www.okairos.com/e/inners.php?m=00084, 2015년 4월 13일에 마지막으로 액세스됨).
바이러스 입자의 어셈블리 및 세포주의 형질감염
일반적으로, 형질감염에 의해 미니유전자를 포함하는 벡터를 전달하는 경우, 벡터는 약 1 x 104개의 세포 내지 약 1 x 1013개의 세포, 바람직하게는 약 105개의 세포에 약 5 μg 내지 약 100 μg의 DNA, 바람직하게는 약 10 내지 약 50 μg의 DNA의 양으로 전달된다. 그러나, 벡터 DNA 대 숙주 세포의 상대량은 선택된 벡터, 전달 방법 및 선택된 숙주 세포와 같은 요인을 고려하여 조정될 수 있다.
벡터의 숙주 세포로의 도입은 형질감염 및 감염을 포함하는 당 분야에 공지된 임의의 수단에 의해 달성될 수 있다. 아데노바이러스 유전자 중 하나 이상은 숙주 세포의 유전체로 안정적으로 통합되거나, 에피솜으로서 안정적으로 발현되거나, 일시적으로 발현될 수 있다. 유전자 생성물은 모두 에피솜 상태로 또는 안정적으로 통합된 상태로 일시적으로 발현될 수 있거나, 유전자 생성물 중 일부는 안정적으로 발현될 수 있는 반면 다른 일부는 일시적으로 발현된다.
숙주 세포로의 벡터의 도입은 또한 당업자에게 공지된 기술을 이용하여 달성될 수 있다. 적합하게는, 표준 형질감염 기술, 예를 들어, CaPC 형질감염 또는 전기천공이 사용된다.
다양한 중간체 플라스미드로의 아데노바이러스의 선택된 DNA 서열(및 트랜스진 및 다른 벡터 요소)의 어셈블리, 및 재조합 바이러스 입자를 생성시키기 위한 플라스미드 및 벡터의 사용은 모두 통상적인 기술을 이용하여 달성된다. 상기 기술은 cDNA의 통상적인 클로닝 기술, 아데노바이러스 유전체의 중첩 올리고뉴클레오티드 서열의 이용, 중합효소 연쇄 반응, 및 원하는 뉴클레오티드 서열을 제공하는 임의의 적합한 방법을 포함한다. 표준 형질감염 및 공동-형질감염 기술, 예를 들어, CaPC 침전 기술이 사용된다. 사용되는 다른 통상적인 방법은 바이러스 유전체의 상동성 재조합, 아가 오버레이(agar overlay)에서의 바이러스 플라크 형성(plaquing), 신호 생성을 측정하는 방법 등을 포함한다.
예를 들어, 원하는 미니유전자-함유 바이러스 벡터의 작제 및 어셈블리 후, 벡터는 헬퍼 바이러스의 존재하에 패키징 세포주로 시험관 내에서 형질감염된다. 상동성 재조합이 헬퍼 서열과 벡터 서열 사이에서 발생하며, 이는 벡터 내의 아데노바이러스-트랜스진 서열이 복제되고 비리온 캡시드로 패키징되는 것을 가능하게 하여, 재조합 바이러스 벡터 입자를 생성시킨다. 생성된 재조합 아데노바이러스는 선택된 트랜스진을 선택된 세포로 전달하는데 유용하다. 패키징 세포주에서 성장된 재조합 바이러스를 이용한 생체 내 실험에서, 본 발명의 E1-결실된 재조합 아데노바이러스 벡터는 트랜스진을 비-유인원 포유동물, 바람직하게는 인간 세포로 전달하는데 있어서의 유용성을 입증한다.
트랜스진
트랜스진은 이러한 트랜스진에 측접한 벡터 서열과 이종성인 핵산 서열이며, 관심 단백질을 인코딩한다. 핵산 코딩 서열은 숙주 세포에서 트랜스진 전사, 번역, 및/또는 발현을 가능하게 하는 방식으로 조절 성분에 작동 가능하게 연결된다.
트랜스진 서열의 조성은 생성되는 벡터가 사용될 용도에 좌우될 것이다. 예를 들어, 트랜스진은 치료용 트랜스진 또는 면역원성 트랜스진일 수 있다. 대안적으로, 트랜스진 서열은 발현시 검출 가능한 신호를 생성하는 리포터 서열을 포함할 수 있다. 상기 리포터 서열은, 비제한적인 예로, β-락타마제, β-갈락토시다제(LacZ), 알칼리성 포스파타제, 티미딘 키나제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스페라제(CAT), 루시페라제, 막 결합된 단백질, 예를 들어, CD2, CD4, CD8, 인플루엔자 헤마글루티딘 단백질, 및 특이적인 고 친화성 항체가 존재하거나 통상적인 수단에 의해 생성될 수 있는 당 분야에 널리 공지된 것들, 및 다른 것들 중에서 헤마글루티닌 또는 Myc로부터의 항원 태그 도메인에 적절하게 융합된 막 결합된 단백질을 포함하는 융합 단백질을 인코딩하는 DNA 서열을 포함한다. 이들 코딩 서열은 이의 발현을 유도하는 조절 요소와 회합되는 경우 효소, 방사선, 비색, 형광 또는 다른 분광 검정, 형광 활성화 세포 분류 검정 및 면역학적 검정, 예를 들어, 효소 결합 면역흡착 측정(ELISA), 방사면역측정법(RIA) 및 면역조직화학을 포함하는 통상적인 수단에 의해 검출 가능한 신호를 제공한다.
일 구현예에서, 트랜스진은 생물학 및 의학에 유용한 생성물을 인코딩하는 비-마커 서열, 예를 들어, 치료용 트랜스진 또는 면역원성 트랜스진, 예를 들어, 단백질, RNA, 효소, 또는 촉매성 RNA이다. 바람직한 RNA 분자는 tRNA, dsRNA, 리보솜 RNA, 촉매성 RNA, 및 안티센스 RNA를 포함한다. 유용한 RNA 서열의 한 예는 치료되는 동물에서 표적화된 핵산 서열의 발현을 소멸시키는 서열이다.
트랜스진은 암 치료제 또는 백신으로서, 예를 들어, 유전적 결함의 치료를 위해, 면역 반응의 유도를 위해, 및/또는 예방 백신 목적을 위해 사용될 수 있다. 본원에서 사용되는 바와 같은 면역 반응의 유도는 단백질에 대한 T 세포 및/또는 체액성 면역 반응을 유도하는 단백질의 능력을 나타낸다.
따라서, 일 구현예에서, 본 발명은 병원체로부터 유래된 면역원성 트랜스진을 포함하는 발현 카세트를 포함하는 본 발명에 따른 재조합 벡터를 제공한다. 특정 구현예에서, 병원체는 호흡기 바이러스이다. 따라서, 본 발명은 인간 호흡기 세포 융합 바이러스(RSV)로부터 유래된 면역원성 트랜스진을 포함하는 발현 카세트를 포함하는 재조합 ChAd155-유래 아데노바이러스 벡터를 제공한다. 일 구현예에서, 본 발명의 재조합 ChAd155-유래 아데노바이러스 벡터는 RSV F 항원 및 RSV M 및 N 항원을 포함한다. 더욱 특히, 핵산은 RSV FΔTM 항원(막횡단 및 세포질 영역이 결실된 융합(F) 단백질), 및 RSV M2-1(전사 항-종결) 및 N(뉴클레오캡시드) 항원을 인코딩한다. 특정 구현예에서, 재조합 벡터는 SEQ ID NO: 37에 따른 서열을 인코딩하는 핵산 서열(예를 들어, 발현 카세트 내에서)을 포함한다. 일 구현예에서, 재조합 벡터는 SEQ IS NO: 11에 따른 서열을 갖는 폴리뉴클레오티드로 본질적으로 구성된다.
조절 요소
트랜스진에 더하여, 벡터는 또한 플라스미드 벡터로 형질감염되거나, 본 발명에 의해 생성된 바이러스로 감염된 세포에서 트랜스진의 전사, 번역 및/또는 발현을 가능하게 하는 방식으로 트랜스진에 작동 가능하게 연결되는 통상적인 조절 요소를 포함한다. 본원에서 사용되는 "작동 가능하게 연결된" 서열은 관심 유전자와 인접한 발현 조절 서열 및 관심 유전자를 조절하기 위해 교차하여(in trans) 작용하거나 멀리서 작용하는 발현 조절 서열 둘 모두를 포함한다.
발현 조절 서열은 적절한 전사 개시, 종료, 프로모터 및 인핸서 서열; 효과적인 RNA 처리 신호, 예를 들어, 토끼 베타-글로빈 polyA를 포함하는 스플라이싱 및 아데닐중합체형성(poly A) 신호; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 향상시키는 서열(예를 들어, 코작(Kozak) 컨센서스 서열); 단백질 안정성을 향상시키는 서열; 및 원하는 경우 인코딩된 생성물의 분비를 향상시키는 서열을 포함한다. 다른 서열 중에서도, 키메라 인트론이 사용될 수 있다.
일부 구현예에서, 우드척 간염 바이러스 전사후 조절 요소(WPRE)(Zuffrey et al. (1999) J Virol; 73(4):2886-9)가 트랜스진에 작동 가능하게 연결될 수 있다. 예시적 WPRE는 SEQ ID NO: 26에 제공된다.
"프로모터"는 RNA 중합효소의 결합을 가능하게 하고, 유전자의 전사를 유도하는 뉴클레오티드 서열이다. 통상적으로, 프로모터는 유전자의 전사 시작 부위에 근접한 유전자의 5' 비-코딩 영역에 위치된다. 전사 개시에서 기능하는 프로모터 내의 서열 요소는 종종 컨센서스 뉴클레오티드 서열을 특징으로 한다. 프로모터의 예는 박테리아, 효모, 식물, 바이러스, 및 포유동물(인간을 포함함)로부터의 프로모터를 포함하나, 이에 제한되지는 않는다. 내부, 천연, 항시성, 유도성 및/또는 조직-특이성인 프로모터를 포함하는 매우 많은 수의 발현 조절 서열이 당 분야에 공지되어 있으며, 사용될 수 있다.
항시성 프로모터의 예는 TBG 프로모터, 레트로바이러스 라우스 육종 바이러스 LTR 프로모터(선택적으로, 인핸서를 가짐), 사이토메갈로바이러스(CMV) 프로모터(선택적으로, CMV 인핸서를 가짐, 예를 들어, 문헌[Boshart et al, Cell, 41:521-530 (1985)] 참조), CASI 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK) 프로모터, 및 EF1a 프로모터(Invitrogen)를 포함하나, 이에 제한되지는 않는다.
일부 구현예에서, 프로모터는 CASI 프로모터(예를 들어, WO2012/115980호 참조)이다. CASI 프로모터는 CMV 인핸서의 일부, 닭 베타-액틴 프로모터의 일부, 및 UBC 인핸서의 일부를 함유하는 합성 프로모터이다. 일부 구현예에서, CASI 프로모터는 SEQ ID NO: 12와 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 그 초과의 서열 동일성을 갖는 핵산 서열을 포함할 수 있다. 일부 구현예에서, 프로모터는 SEQ ID NO: 12의 핵산 서열을 포함하거나, 이로 구성된다.
유도성 프로모터는 유전자 발현의 조절을 가능하게 하며, 외인적으로 공급된 화합물, 환경 요인, 예를 들어, 온도, 또는 특정 생리학적 상태의 존재, 예를 들어, 급성기, 세포의 특정 분화 상태에 의해, 또는 복제하는 세포에서만 조절될 수 있다. 유도성 프로모터 및 유도성 시스템은 Invitrogen, Clontech 및 Ariad를 포함하나, 이에 제한되지는 않는 다양한 상업적 공급처로부터 이용 가능하다. 많은 다른 시스템이 기재되어 있으며, 당업자에 의해 용이하게 선택될 수 있다. 예를 들어, 유도성 프로모터는 아연-유도성 양 메탈로티오닌(MT) 프로모터 및 덱사메타손(Dex)-유도성 마우스 유암 바이러스(MMTV) 프로모터를 포함한다. 다른 유도성 시스템은 T7 중합효소 프로모터 시스템(WO 98/10088호); 엑디손 곤충 프로모터(No et al, Proc. Natl. Acad. Sci. USA, 93:3346-3351 (1996)), 테트라사이클린-억제성 시스템(Gossen et al, Proc. Natl. Acad. Sci. USA, 89:5547-5551 (1992)), 테트라사이클린-유도성 시스템(Gossen et al, Science, 378:1766-1769 (1995), 또한 Harvey et al, Curr. Opin. Chem. Biol, 2:512-518 (1998) 참조)을 포함한다. 다른 시스템은 FK506 이합체, 카스트라디올(castradiol), 디페놀 무리슬레론(diphenol murislerone)을 이용하는 VP16 또는 p65, RU486-유도성 시스템(Wang et al, Nat. Biotech., 15:239-243 (1997) 및 Wang et al, Gene Ther., 4:432-441 (1997)) 및 라파마이신-유도성 시스템(Magari et al, J. Clin. Invest., 100:2865-2872 (1997))을 포함한다. 일부 유도성 프로모터의 효과는 시간이 지남에 따라 증가한다. 이러한 경우에, 다수의 억제인자, 예를 들어, IRES에 의해 TetR에 연결된 TetR을 일렬로 삽입함으로써 상기 시스템의 효과를 향상시킬 수 있다.
또 다른 구현예에서, 트랜스진에 대한 자연 프로모터가 사용될 것이다. 자연 프로모터는 트랜스진의 발현이 자연 발현을 모방해야 하는 것이 요망되는 경우에 바람직할 수 있다. 자연 프로모터는 트랜스진의 발현이 시간적 또는 발달적으로, 또는 조직-특이적 방식으로, 또는 특정 전사 자극에 반응하여 조절되어야 하는 경우에 사용될 수 있다. 추가의 구현예에서, 다른 자연 발현 조절 요소, 예를 들어, 인핸서 요소, 아데닐중합체형성 부위 또는 코작 컨센서스 서열이 또한 자연 발현을 모방하기 위해 이용될 수 있다.
트랜스진은 조직-특이적 프로모터에 작동 가능하게 연결될 수 있다. 예를 들어, 골격근에서의 발현이 요망되는 경우, 근육에서 활성인 프로모터가 사용되어야 한다. 이들은 골격 β-액틴, 미오신 경쇄 2A, 디스트로핀, 근육 크레아틴 키나제를 인코딩하는 유전자로부터의 프로모터뿐만 아니라 자연 발생 프로모터보다 높은 활성을 갖는 합성 근육 프로모터를 포함한다(Li et al, Nat. Biotech., 17:241-245 (1999) 참조). 조직 특이적인 프로모터의 예는 다른 것들 중에서 간(알부민, Miyatake et al, J. Virol, 71:5124-32 (1997); B형 간염 바이러스 코어 프로모터, Sandig et al, Gene Ther., 3:1002-9 (1996); 알파-태아단백질(AFP), Arbuthnot et al., Hum. Gene Ther., 7: 1503-14 (1996)), 뼈 오스테오칼신(Stein et al, Mol. Biol. Rep., 24:185-96 (1997)); 뼈 시알로단백질(Chen et al., J. Bone Miner. Res., 11:654-64 (1996)), 림프구(CD2, Hansal et al, J. Immunol, 161:1063-8 (1998); 면역글로불린 중쇄; T 세포 수용체 사슬), 신경세포, 예를 들어, 뉴런-특이적 에놀라제(NSE) 프로모터(Andersen et al, Cell. Mol. Neurobiol, 13:503-15 (1993)), 신경미세섬유 경쇄 유전자(Piccioli et al, Proc. Natl. Acad. Sci. USA, 88:5611-5 (1991)), 및 뉴런-특이적 vgf 유전자(Piccioli et al, Neuron, 15:373-84 (1995))에 대해 공지되어 있다.
선택적으로, 치료적으로 유용한 생성물 또는 면역원성 생성물을 인코딩하는 트랜스진을 운반하는 벡터는 다른 것들 중에서 제네티신, 하이그로마이신 또는 퓨리마이신 내성을 인코딩하는 서열을 포함할 수 있는 선택 가능한 마커 또는 리포터 유전자를 또한 포함할 수 있다. 앰피실린 내성과 같은 상기 선택 가능한 리포터 또는 마커 유전자(바람직하게는, 바이러스 입자로 패키징되는 바이러스 유전체 외부에 위치됨)는 박테리아 세포에서 플라스미드의 존재를 알리기 위해 사용될 수 있다. 벡터의 다른 성분은 복제 기점을 포함할 수 있다.
이들 벡터는 당업자에게 공지된 기술과 함께 본원에 제공된 기술 및 서열을 이용하여 생성된다. 상기 기술은 본문에 기재된 것과 같은 cDNA의 통상적인 클로닝 기술, 아데노바이러스 유전체의 중첩 올리고뉴클레오티드 서열의 이용, 중합효소 연쇄 반응, 및 원하는 뉴클레오티드 서열을 제공하는 임의의 적합한 방법을 포함한다.
치료 및 예방
재조합 ChAd155-기반 벡터는 시험관 내, 생체 외, 및 생체 내에서 인간 또는 비-유인원 포유동물로의 유전자 전달에 유용하다.
본원에 기재된 재조합 아데노바이러스 벡터는 시험관 내에서 이종성 트랜스진에 의해 인코딩된 생성물의 생성을 위한 발현 벡터로 사용될 수 있다. 예를 들어, 트랜스진을 함유하는 재조합 복제-부적격 아데노바이러스는 상기 기재된 바와 같은 상보성 세포주로 형질감염될 수 있다.
ChAd155-유래 재조합 아데노바이러스 벡터는 유기체가 하나 이상의 아데노바이러스 혈청형에 대한 중화 항체를 갖는 경우에도 생체 내 또는 생체 외에서 선택된 숙주 세포로 선택된 트랜스진을 전달할 수 있는 효과적인 유전자 전달 비히클을 제공한다. 일 구현예에서, 벡터 및 세포는 생체 외에서 혼합되고; 감염된 세포는 통상적인 방법을 이용하여 배양되고; 형질도입된 세포는 환자로 재주입된다. 이들 기술은 치료 목적 및 보호 면역 유도를 포함하는 면역화를 위한 유전자 전달에 특히 매우 적합하다.
면역원성 트랜스진
재조합 ChAd155 벡터는 또한 면역원성 조성물로 투여될 수 있다. 본원에 기재된 바와 같은 면역원성 조성물은 포유동물, 적합하게는 인간으로의 전달 후 벡터에 의해 전달된 트랜스진 생성물에 대해 면역 반응, 예를 들어, 체액성(예를 들어, 항체) 및/또는 세포-매개(예를 들어, 세포독성 T 세포) 반응을 유도할 수 있는 하나 이상의 재조합 ChAd155 벡터를 포함하는 조성물이다. 재조합 아데노바이러스는 원하는 면역원을 인코딩하는 유전자를 포함(적합하게는, 이의 유전자 결실 중 임의의 결실 내에 포함)할 수 있으며, 따라서 백신에서 사용될 수 있다. 재조합 아데노바이러스는 면역 반응의 유도에 중요하고, 병원체의 확산을 제한할 수 있는 항원(들)이 확인되었고, cDNA가 이용 가능한 임의의 병원체에 대한 예방 또는 치료 백신으로 사용될 수 있다.
따라서, 일 구현예에서, 본 발명은 병원체에 의한 질병 원인의 치료에서 본 발명에 따른 재조합 아데노바이러스의 용도를 제공한다. 일 구현예에서, 그러한 치료는 예방적 치료이다. 일 구현예에서, 본 발명은 병원체에 대한 면역 반응의 생성에서 재조합 아데노바이러스의 용도를 제공한다. 특정 구현예에서, 병원체는 호흡기 바이러스이다. 따라서, 본 발명은 RSV 감염의 치료 또는 예방에서 인간 호흡기 세포 융합 바이러스(RSV)로부터 유래된 면역원성 트랜스진을 포함하는 발현 카세트를 포함하는 재조합 ChAd155-유래 아데노바이러스 벡터의 용도를 제공한다. 일 구현예에서, 본 발명의 재조합 ChAd155-유래 아데노바이러스 벡터는 RSV F 항원 및 RSV M 및 N 항원을 포함한다. 더욱 특히, 핵산은 RSV FΔTM 항원(막횡단 및 세포질 영역이 결실된 융합(F) 단백질), 및 RSV M2-1(전사 항-종결) 및 N(뉴클레오캡시드) 항원을 인코딩한다. 특히, 트랜스진은 SEQ ID NO: 37에 개시된 RSV 항원을 인코딩한다.
추가의 구현예에서. 본 발명은 병원체에 대한 면역 반응의 생성을 위한 약제의 제조에서의 본 발명에 따른 재조합 아데노바이러스의 용도를 제공한다. 따라서, 본 발명은 RSV 감염의 치료 또는 예방을 위한 약제의 제조에서의 인간 호흡기 세포 융합 바이러스(RSV)로부터 유래된 면역원성 트랜스진을 포함하는 발현 카세트를 포함하는 재조합 ChAd155-유래 아데노바이러스 벡터의 용도를 제공한다. 더욱 특히, 트랜스진은 RSV FΔTM 항원(막횡단 및 세포질 영역이 결실된 융합(F) 단백질), 및 RSV M2-1(전사 항-종결) 및 N(뉴클레오캡시드) 항원을 인코딩한다. 특히, 트랜스진은 SEQ ID NO: 37에 개시된 RSV 항원을 인코딩하고, 예를 들어, 일 구현예에서, 트랜스진은 SEQ ID NO: 11의 폴리뉴클레오티드를 포함한다.
일 구현예에서, 본 발명은 병원체로부터 유래된 면역원성 트랜스진을 포함하는 발현 카세트를 포함하는 유효량의 본 발명에 따른 재조합 아데노바이러스, 예를 들어, ChAd155-유래 아데노바이러스의 투여를 포함하는, 병원체에 의한 질병 원인의 치료 또는 예방 방법을 제공한다. 특정 구현예에서, 병원체는 인간 호흡기 세포 융합 바이러스(RSV)이다. 일 구현예에서, 본 발명은 본 발명에 따른 재조합 아데노바이러스의 투여를 포함하는 인간 호흡기 세포 융합 바이러스(RSV)에 대해 유도되는 면역 반응을 생성하거나 향상시키는 방법을 제공한다. 특히, 면역 반응을 생성하거나 향상시키는 방법은 SEQ ID NO: 37에 개시된 RSV 항원을 인코딩하는 트랜스진을 포함하는 유효량의 ChAd155-유래 아데노바이러스의 투여를 포함하고, 예를 들어, 일 구현예에서, 트랜스진은 SEQ ID NO: 11의 폴리뉴클레오티드를 포함한다.
일 구현예에서, 본 발명은 병원체, 예를 들어, 인간 호흡기 세포 융합 바이러스(RSV)로부터 유래된 면역원성 트랜스진을 포함하는 발현 카세트를 포함하는 본 발명에 따른 재조합 아데노바이러스, 예를 들어, ChAd155-유래 아데노바이러스, 및 약학적으로 허용되는 부형제를 포함하는 면역원성 조성물을 제공한다.
상기 백신 또는 다른 면역원성 조성물은 적합한 전달 비히클로 제형화될 수 있다. 일반적으로, 면역원성 조성물에 대한 용량은 하기 '전달 방법 및 투여량'에 정의된 범위 내이다. 선택된 유전자의 면역성의 수준은, 존재시, 부스터에 대한 필요성을 결정하기 위해 모니터될 수 있다. 혈청에서의 항체 역가의 평가 후, 선택적 부스터 면역화가 요망될 수 있다.
일 구현예에서, 본 발명의 재조합 ChAd155-유래 아데노바이러스 벡터를 포함하는 면역원성 조성물은 RSV F 항원 및 RSV M 및 N 항원을 인코딩하는 트랜스진을 함유하는 발현 카세트를 포함한다. 더욱 특히, 트랜스진은 RSV FΔTM 항원(막횡단 및 세포질 영역이 결실된 융합(F) 단백질), 및 RSV M2-1(전사 항-종결) 및 N(뉴클레오캡시드) 항원을 인코딩한다. 특히, 트랜스진은 SEQ ID NO: 37에 개시된 RSV 항원을 인코딩하고, 예를 들어, 일 구현예에서, 트랜스진은 SEQ ID NO: 11의 폴리뉴클레오티드를 포함한다. 선택적으로, 본 발명의 백신 또는 면역원성 조성물은, 예를 들어, 애쥬번트, 안정화제, pH 조절제, 보존제 등을 포함하는 다른 성분을 함유하도록 제형화될 수 있다. 적합한 애쥬번트의 예는 하기 '애쥬번트'에 제공된다. 상기 애쥬번트는 항원만 인코딩하는 DNA 백신으로 프라이밍시 생성된 면역 반응에 비해 항원-특이적 면역 반응을 향상시키기 위해 항원을 인코딩하는 프라이밍 DNA 백신과 함께 투여될 수 있다. 대안적으로, 상기 애쥬번트는 본 발명의 ChAd155 벡터를 포함하는 투여 요법에서 투여되는 폴리펩티드 항원과 함께 투여될 수 있다(하기 '투여 요법'에 기재됨).
재조합 아데노바이러스는 면역원성 양, 즉, 원하는 표적 세포를 형질감염시키기 위해 투여 경로에서 효과적이고, 면역 반응을 유도하기 위해 선택된 유전자의 충분한 수준의 발현을 제공하는 재조합 아데노바이러스의 양으로 투여된다. 보호 면역이 제공되는 경우, 재조합 아데노바이러스는 감염 및/또는 재발성 질병을 예방하는데 유용한 백신 조성물인 것으로 간주된다.
다른 병원체에 대해 인간 또는 비-인간 동물을 면역화시키는데 유용한 본 발명의 벡터에 의해 발현된 면역원은, 예를 들어, 인간 및 비-인간 척추동물을 감염시키는 박테리아, 진균, 기생 미생물 또는 다세포 기생충을 포함하거나, 암세포 또는 종양 세포로부터 유래된다. 예를 들어, 면역원은 다양한 바이러스 과로부터 선택될 수 있다. 면역 반응이 요망되는 바이러스 과의 예는 호흡기 바이러스, 예를 들어, 호흡기 세포 융합 바이러스(RSV) 및 다른 파라믹소바이러스, 예를 들어, 인간 메타뉴모바이러스, hMPV 및 파라인플루엔자 바이러스(PIV)를 포함한다.
RSV에 의한 감염은 완전한 보호 면역을 부여하지 않는다. 유아에서의 감염 이후에 증상관련 RSV 재감염이 따라오고, 이는 성인기 동안 내내 지속된다. 이러한 재감염은 일반적으로 이들이 흔한 급성 상기도 감염으로 나타나기 때문에 대개 진단이 되지 않는다. 그러나, 더 취약한 사람(예컨대, 면역결핍 성인 또는 노인)에서, 재감염은 또한 심각한 질병으로 이어질 수 있다. 면역계의 둘 모두의 아암(체액성 및 세포성 면역)은 심각한 질병으로부터의 보호에 관여한다[Guvenel, 2014].
체액성 면역 반응은 바이러스를 중화시키고 바이러스 복제를 억제할 수 있어서, 하기도 RSV 감염 및 심각한 질병으로부터의 보호에서 중요한 역할을 할 수 있다[Piedra, 2003]. 면역글로블린 G(IgG) RSV-중화 모노클로날 항체(Synagis)가 예방적으로 제공되는 형태의 수동 면역은 기관지폐 이형성증 또는 내재성 심폐 질환이 있는 미숙아 및 신생아에서 RSV 질병을 어느 정도 예방하는 것으로 나타났다[Cardenas, 2005].
T 세포가 또한 RSV 질병의 제어에 관여한다. 치명적인 RSV 감염은 중증 복합 면역결핍, 골수 및 폐 이식 수용자의 경우에서처럼, 낮은 CD8 T 세포 수를 갖는 환자에서 설명되어 왔다[Hertz, 1989]. 신생아의 RSV 감염의 치명적인 경우의 조직병리학은 폐 침윤물에 CD8 T 세포의 상대적 부족이 있음을 보여준다[Welliver, 2007]. 또한, 인터페론-감마(IFN-γ)를 생산하는 CD8 T 세포의 존재는 RSV의 동물 모델에서 감소된 Th2 반응 및 감소된 호산구증가증과 관련이 있었다[Castilow, 2008; Stevens, 2009].
본원에 기재된 재조합 벡터는 세포용해성 T 세포 및 벡터에 의해 발현된 삽입된 이종성 항원 단백질에 특이적인 항체를 유도하는데 매우 효과적일 것으로 예상된다.
인간 또는 비-인간 동물을 면역화시키기 위한 면역원으로 유용한 RSV의 적합한 항원은 융합 단백질(F), 부착 단백질(G), 기질 단백질(M2) 및 핵단백질(N)로부터 선택될 수 있다. 용어 "F 단백질" 또는 "융합 단백질" 또는 "F 단백질 폴리펩티드" 또는 "융합 단백질 폴리펩티드"는 RSV 융합 단백질 폴리펩티드의 아미노산 서열의 일부 또는 전부를 갖는 폴리펩티드 또는 단백질을 나타낸다. 유사하게, 용어 "G 단백질" 또는 "G 단백질 폴리펩티드"는 RSV 부착 단백질 폴리펩티드의 아미노산 서열의 일부 또는 전부를 갖는 폴리펩티드 또는 단백질을 나타낸다. 용어 "M 단백질" 또는 "기질 단백질" 또는 "M 단백질 폴리펩티드"는 RSV 기질 단백질의 아미노산 서열의 일부 또는 전부를 갖는 폴리펩티드 또는 단백질을 나타내며, M2-1(본원에서 M2.1로 기재될 수 있음) 및 M2-2 유전자 생성물 중 어느 하나 또는 둘 모두를 포함할 수 있다. 마찬가지로, 용어 "N 단백질" 또는 "뉴클레오캡시드 단백질" 또는 "N 단백질 폴리펩티드"는 RSV 핵단백질의 아미노산 서열의 일부 또는 전부를 갖는 폴리펩티드 또는 단백질을 나타낸다.
G 당단백질의 항원성에서의 차이를 주로 기초로 하여 A 및 B 그룹의 2개 그룹의 인간 RSV 균주가 기재되었다. RSV의 다수의 균주가 현재까지 단리되었고, 이 중 임의의 것이 본원에 개시된 면역원성 조합물의 항원의 상황에서 적합하다. GenBank 및/또는 EMBL 등록 번호에 의해 표시된 예시적 균주는 US 공개 출원 번호 2010/0203071호(WO2008114149호)에서 발견될 수 있으며, 이는 본 발명에서 사용하기에 적합한 RSV F 및 G 단백질의 핵산 및 폴리펩티드 서열을 개시할 목적으로 참조로서 본원에 포함된다. 일 구현예에서, RSV F 단백질은 RSV F 단백질의 엑토도메인(FΔTM)일 수 있다.
예시적 M 및 N 단백질 핵산 및 단백질 서열은, 예를 들어, US 공개 출원 번호 2014/0141042호(WO2012/089833호)에서 발견될 수 있으며, 이는 본 발명에서 사용하기에 적합한 RSV M 및 N 단백질의 핵산 및 폴리펩티드 서열을 개시하기 위한 목적으로 본원에 포함된다.
적합하게는, 본 발명에서 사용하기 위해, 트랜스진 핵산은 RSV F 항원 및 RSV M 및 N 항원을 인코딩한다. 더욱 특히, 핵산은 RSV FΔTM 항원(막횡단 및 세포질 영역이 결실된 융합(F) 단백질), 및 RSV M2-1(전사 항-종결) 및 N(뉴클레오캡시드) 항원을 인코딩한다.
막횡단 및 세포질 영역이 결실된 융합(F) 단백질(F0ΔTM)
RSV F 단백질은 주요 표면 항원이며, 표적 세포에 대한 바이러스 융합을 매개한다. F 단백질은 RSV 서브그룹과 균주 사이에서 고도로 보존된 항원이다. F 단백질은 예방적 RSV-중화 모노클로날 항체 Synagis를 포함하는 중화 항체에 대한 표적이다. 막횡단 영역 및 세포질 꼬리의 결실은 FΔTM 단백질의 분비를 허용한다. F 단백질의 이 가용성 형태를 인지하는, Synagis를 포함하는 중화 항체는 시험관 내 RSV 감염성을 억제한다[Magro, 2010].
뉴클레오캡시드(N) 단백질
N 단백질은 RSV 균주 사이에 고도로 보존되고 많은 T 세포 에피토프의 공급원으로 알려진 내부(노출되지 않은) 항원이다[Townsend, 1984]. N 단백질은 RSV 유전체의 복제 및 전사에 필수적이다. N 단백질의 주요 기능은 RNA 전사, 복제 및 패키징의 목적으로 바이러스 유전체를 캡슐화하고 이를 리보뉴클레아제로부터 보호하는 것이다.
전사 항-종결(M2-1) 단백질
M2-1 단백질은 전장 메신저 RNA(mRNA)의 효율적 합성뿐만 아니라 비분할된 음성-가닥 RNA 바이러스의 특징인 폴리시스트론 번역초과(polycistronic readthrough) mRNA의 합성에 중요한 전사 항-종결 인자이다. M2-1은 RSV 균주 사이에 고도로 보존되고 많은 T 세포 에피토프의 공급원으로 알려진 내부(노출되지 않은) 항원이다[Townsend, 1984].
일 구현예에서, 본 발명은 RSV FΔTM 항원, 및 RSV M2-1 및 N 항원을 인코딩하는 트랜스진을 포함하는 재조합 ChAd155 백터를 제공하고, 여기서 자가 절단 부위가 RSV FΔTM 항원과 RSV M2-1 사이에 포함되고 가요성 링커가 RSV M2-1과 N 항원 사이에 포함된다. 일 구현예에서, 적합한 트랜스진 핵산은 SEQ ID NO:37에 의해 표시되는 폴리펩티드를 인코딩한다.
일 구현예에서, 면역원은 레트로바이러스, 예를 들어, 렌티바이러스, 예를 들어, 인간 면역결핍 바이러스(HIV)로부터 유래될 수 있다. 상기 구현예에서, 면역원은 HIV-1 또는 HIV-2로부터 유래될 수 있다.
HIV 유전체는 다수의 상이한 단백질을 인코딩하며, 이들 각각은 본 발명의 벡터에 의해 발현되는 경우 전체적으로 또는 단편으로서 면역원성일 수 있다. 외피 단백질은, 예를 들어, gp120, gp41 및 Env 전구체 gp160을 포함한다. HIV의 비-외피 단백질은, 예를 들어, 내부 구조 단백질, 예를 들어, gag 및 pol 유전자의 생성물 및 다른 비-구조 단백질, 예를 들어, Rev, Nef, Vif 및 Tat을 포함한다. 일 구현예에서, 본 발명의 벡터는 HIV Gag를 포함하는 하나 이상의 폴리펩티드를 인코딩한다.
Gag 유전자는 전구체 다기능단백질로 번역되며, 이는 프로테아제에 의해 절단되어 기질 단백질(p17), 캡시드(p24), 뉴클레오캡시드(p9), p6 및 2개의 공간 펩티드, p2 및 p1을 포함하는 생성물을 생성시키며, 이들 모두는 Gag 단편의 예이다.
Gag 유전자는 p55로도 언급되는 55-킬로달톤(kD) Gag 전구체 단백질을 발생시키며, 이는 스플라이싱되지 않은 바이러스 mRNA로부터 발현된다. 번역 동안, p55의 N 말단은 미리스토일화되어, 세포막의 세포질 측면과 이의 회합을 촉발시킨다. 막-회합된 Gag 다기능단백질은 감염된 세포의 표면으로부터 바이러스 입자의 발아를 촉발시키는 다른 바이러스 및 세포 단백질과 함께 바이러스 유전체 RNA의 2개 카피를 모집한다. 발아 후, p55는 바이러스 성숙 과정 동안 바이러스 인코딩된 프로테아제(pol 유전자의 생성물)에 의해 MA(기질 [p17]), CA(캡시드 [p24]), NC(뉴클레오캡시드 [p9]), 및 p6으로 명명된 4개의 더 작은 단백질로 절단되며, 이들 모두는 Gag 단편의 예이다. 일 구현예에서, 본 발명의 벡터는 SEQ ID NO: 38의 Gag 폴리펩티드를 포함한다.
애쥬번트
본원에서 사용되는 "애쥬번트"는 면역원에 대한 면역 반응을 향상시키는 조성물을 나타낸다. 이러한 애쥬번트의 예는 무기 애쥬번트(예를 들어, 무기 금속 염, 예를 들어, 알루미늄 포스페이트 또는 알루미늄 하이드록시드), 유기 애쥬번트(예를 들어, 사포닌, 예를 들어, QS21, 또는 스쿠알렌), 오일-기반 애쥬번트(예를 들어, 프로인트 완전 애쥬번트 및 프로인트 불완전 애쥬번트), 사이토카인(예를 들어, IL-1β, IL-2, IL-7, IL-12, IL-18, GM-CFS, 및 INF-γ) 미립자 애쥬번트(예를 들어, 면역-자극성 복합체(ISCOMS), 리포솜, 또는 생물분해성 미세구), 바이로솜, 박테리아 애쥬번트(예를 들어, 모노포스포릴 지질 A, 예를 들어, 3-데-O-아실화 모노포스포릴 지질 A(3D-MPL), 또는 뮤라밀 펩티드), 합성 애쥬번트(예를 들어, 비-이온성 블록 공중합체, 뮤라밀 펩티드 유사체, 또는 합성 지질 A), 합성 폴리뉴클레오티드 애쥬번트(예를 들어, 폴리아르기닌 또는 폴리리신) 및 메틸화되지 않은 CpG 디뉴클레오티드("CpG")를 함유하는 면역자극성 올리고뉴클레오티드를 포함하나, 이에 제한되지는 않는다.
한 적합한 애쥬번트는 모노포스포릴 지질 A(MPL), 특히 3-데-O-아실화 모노포스포릴 지질 A(3D-MPL)이다. 화학적으로, 이는 종종 3-데-O-아실화 포노포스포릴 지질 A와 4, 5 또는 6개의 아실화된 사슬의 혼합물로 제공된다. 이는 GB 2122204B호에 교시된 방법에 의해 정제되고 제조될 수 있으며, 상기 참조는 또한 디포스포릴 지질 A, 및 이의 3-O-데아실화된 변이체의 제조를 개시한다. 다른 정제된 지질다당류 및 합성 지질다당류가 기재되었다(U.S. 특허 번호 6,005,099호 및 EP 0 729 473 B1호; Hilgers et al., 1986, Int.Arch.Allergy.Immunol., 79(4):392-6; Hilgers et al., 1987, Immunology, 60(1):141-6; 및 EP 0 549 074 B1l).
사포닌이 또한 적합한 애쥬번트이다(Lacaille-Dubois, M and Wagner H, A review of the biological and pharmacological activities of saponins. Phytomedicine vol 2 pp 363-386 (1996) 참조). 예를 들어, 사포닌 Quil A(남아메리카 나무 퀼라자 사포나리아 몰리나(Quillaja Saponaria Molina)의 껍질로부터 유래됨), 및 이의 분획이 U.S. 특허 번호 5,057,540호 및 문헌[Kensil, Crit. Rev. Ther. Drug Carrier Syst., 1996, 12:1-55]; 및 EP 0 362 279 B1호에 기재되어 있다. Quil A의 정제된 분획, 예를 들어, QS21 및 QS17이 또한 면역자극제로 공지되어 있으며; 이의 생성 방법은 U.S. 특허 번호 5,057,540호 및 EP 0 362 279 B1호에 개시되어 있다. QS7(Quil-A의 비-용혈 분획)이 또한 상기 참조에 기재되어 있다. QS21의 사용은 문헌[Kensil et al. (1991, J. Immunology, 146: 431-437)]에 추가로 기재되어 있다. QS21 및 폴리소르베이트 또는 사이클로덱스트린의 조합물이 또한 공지되어 있다(WO 99/10008호). QuilA의 분획, 예를 들어, QS21 및 QS7을 포함하는 미립자 애쥬번트 시스템이 WO 96/33739호 및 WO 96/11711호에 기재되어 있다.
또 다른 애쥬번트는 메틸화되지 않은 CpG 디뉴클레오티드("CpG")를 함유하는 면역자극성 올리고뉴클레오티드이다(Krieg, Nature 374:546 (1995)). CpG는 DNA에 존재하는 시토신-구아노신 디뉴클레오티드 모티프에 대한 약어이다. CpG는 전신 및 점막 경로 둘 모두로 투여되는 경우에 애쥬번트로 공지되어 있다(WO 96/02555호, EP 468520호, Davis et al, J.Immunol, 1998, 160:870-876; McCluskie and Davis, J.Immunol., 1998, 161:4463-6). 백신으로 제형화되는 경우 CpG는 자유 항원과 함께 자유 용액으로 투여될 수 있거나(WO 96/02555호), 항원에 공유적으로 컨쥬게이션될 수 있거나(WO 98/16247호), 담체, 예를 들어, 알루미늄 하이드록시드와 함께 제형화될 수 있다(Brazolot-Millan et al., Proc. Natl. Acad. Sci., USA, 1998, 95:15553-8).
상기 기재된 것과 같은 애쥬번트는 담체, 예를 들어, 리포솜, 수중유 에멀젼, 및/또는 금속 염(알루미늄 하이드록시드와 같은 알루미늄 염을 포함함)과 함께 제형화될 수 있다. 예를 들어, 3D-MPL은 알루미늄 하이드록시드(EP 0 689 454호) 또는 수중유 에멀젼(WO 95/17210호)과 함께 제형화될 수 있고; QS21은 콜레스테롤 함유 리포솜(WO 96/33739호), 수중유 에멀젼(WO 95/17210호) 또는 백반(WO 98/15287호)과 함께 제형화될 수 있고; CpG는 백반(Brazolot-Millan, 상기) 또는 다른 양이온성 담체와 함께 제형화될 수 있다.
애쥬번트의 조합물, 특히 모노포스포릴 지질 A 및 사포닌 유도체의 조합물(예를 들어, WO 94/00153호; WO 95/17210호; WO 96/33739호; WO 98/56414호; WO 99/12565호; WO 99/11241호 참조), 더욱 특히 WO 94/00153호에 개시된 바와 같은 QS21 및 3D-MPL의 조합물, 또는 WO 96/33739호에 개시된 바와 같은 QS21이 콜레스테롤-함유 리포솜(DQ)에서 켄칭되는 조성물이 본 발명에서 사용될 수 있다. 대안적으로, CpG 및 사포닌, 예를 들어, QS21의 조합물이 본 발명에서 사용하기에 적합한 애쥬번트이다. 수중유 에멀젼 중 QS21, 3D-MPL & 토코페롤을 포함하는 효능 있는 애쥬번트 제형이 WO 95/17210호에 기재되어 있으며, 본 발명에서 사용하기 위한 또 다른 제형이다. 사포닌 애쥬번트는 리포솜 내에서 제형화될 수 있고, 면역자극성 올리고뉴클레오티드와 조합될 수 있다. 따라서, 적합한 애쥬번트 시스템은, 예를 들어, 모노포스포릴 지질 A, 바람직하게는 3D-MPL과 함께 알루미늄 염의 조합물을 포함한다(예를 들어, WO00/23105호에 기재됨). 추가의 예시적 애쥬번트는 QS21 및/또는 MPL 및/또는 CpG를 포함한다. QS21은 WO 96/33739호에 개시된 바와 같이 콜레스테롤-함유 리포솜 내에서 켄칭될 수 있다.
다른 적합한 애쥬번트는 알킬 글루코사미니드 포스페이트(AGP), 예를 들어, WO9850399호 또는 U.S. 특허 번호 6,303,347호에 개시된 것(AGP의 제조를 위한 공정이 또한 개시됨), 또는 U.S. 특허 번호 6,764,840호에 개시된 바와 같은 AGP의 약학적으로 허용되는 염을 포함한다. 일부 AGP는 TLR4 효능제이고, 일부는 TLR4 길항제이다. 둘 모두가 애쥬번트로서 유용한 것으로 생각된다.
예방접종에서 사용되는 발현 시스템에 의해 포함되는 항원에 대한 불변 사슬의 융합이 아데노바이러스와 함께 투여되는 경우 상기 항원에 대한 면역 반응을 증가시키는 것으로 밝혀졌다(US 2011/0293704호로 공개되고, 불변 사슬 서열을 개시하기 위한 참조로서 포함되는 WO 2007/062656호). 따라서, 본 발명의 일 구현예에서, 면역원성 트랜스진은 재조합 ChAd155 바이러스 벡터에서 불변 사슬과 공동-발현될 수 있다.
또 다른 구현예에서, 본 발명은 면역조절 효과 반응을 유도하거나, 대상체에 ChAd155 캡시드를 전달함으로써 또 다른 활성제에 대한 세포독성 T 세포 반응을 향상시키거나 애쥬번트화시키기 위한 ChAd155의 캡시드(선택적으로, 온전한 또는 재조합 바이러스 입자 또는 빈 캡시드가 사용됨)의 용도를 제공한다. ChAd155 캡시드는 단독으로 또는 이에 대한 면역 반응을 향상시키기 위한 활성제와 함께 조합 요법으로 전달될 수 있다. 유리하게는, 원하는 효과가 숙주를 아데노바이러스로 감염시키지 않고 달성될 수 있다.
투여 요법
일반적으로, ChAd155 재조합 아데노바이러스 벡터는 치료용 또는 면역원성 분자(예를 들어, 단백질)의 전달에 사용될 것이다. 본 발명의 재조합 아데노바이러스 벡터가 재조합 아데노바이러스 벡터의 반복 전달을 포함하는 요법에서 사용하기에 특히 매우 적합하다는 것이 둘 모두의 적용에서 용이하게 이해될 것이다. 상기 요법은 통상적으로 바이러스 캡시드가 교대로 반복되는 일련의 바이러스 벡터의 전달을 포함한다. 바이러스 캡시드는 각각의 후속 투여에 대해, 또는 특정 혈청형 캡시드의 미리 선택된 투여 횟수(예를 들어, 1회, 2회, 3회, 4회 또는 그 초과) 후에 변경될 수 있다. 따라서, 요법은 제1 캡시드를 갖는 재조합 아데노바이러스의 전달, 제2 캡시드를 갖는 재조합 아데노바이러스의 전달, 및 제3 캡시드를 갖는 재조합 아데노바이러스의 전달을 포함할 수 있다. 본 발명의 아데노바이러스 캡시드를 단독으로, 서로 조합하여, 또는 다른 아데노바이러스(바람직하게는, 면역학적으로 비-교차반응성인 아데노바이러스)와 조합하여 사용하는 다양한 다른 요법이 당업자에게 명백할 것이다. 선택적으로, 상기 요법은 다른 비-인간 영장류 아데노바이러스, 인간 아데노바이러스, 또는 본원에 기재된 것과 같은 인공 서열의 캡시드를 갖는 재조합 아데노바이러스의 투여를 포함할 수 있다.
본 발명의 아데노바이러스 벡터는 트랜스진의 다수의 아데노바이러스-매개 전달이 요망되는 치료 요법, 예를 들어, 동일한 트랜스진의 재전달을 포함하는 요법 또는 다른 트랜스진의 전달을 포함하는 조합 요법에 특히 매우 적합하다. 상기 요법은 ChAd155 아데노바이러스 벡터의 투여 후, 동일 혈청형 아데노바이러스로부터의 벡터를 이용한 재투여를 포함할 수 있다. 특히 바람직한 요법은 ChAd155 아데노바이러스 벡터의 투여를 포함하며, 여기서 제1 투여에서 전달되는 벡터의 아데노바이러스 캡시드 서열의 공급원은 1회 이상의 후속 투여에서 사용되는 바이러스 벡터의 아데노바이러스 캡시드 서열의 공급원과 상이하다. 예를 들어, 치료 요법은 ChAd155 벡터의 투여 및 동일하거나 상이한 혈청형의 하나 이상의 아데노바이러스 벡터를 이용한 반복 투여를 포함한다.
또 다른 예에서, 치료 요법은 아데노바이러스 벡터의 투여 후, 첫번째 전달된 아데노바이러스 벡터 내의 캡시드의 공급원과 상이한 캡시드를 갖는 ChAd155 벡터를 이용한 반복 투여, 및 선택적으로 이전 투여 단계에서 벡터의 아데노바이러스 캡시드의 공급원과 동일하거나 바람직하게는 상이한 또 다른 벡터를 이용한 추가 투여를 포함한다. 이들 요법은 동일하거나 상이한 치료 또는 면역원성 분자를 전달할 수 있다. 이들 요법은 ChAd155 서열을 이용하여 작제된 아데노바이러스 벡터의 전달로 제한되지 않는다. 오히려, 이들 요법은 ChAd155 벡터와 조합된 다른 비-인간 영장류 아데노바이러스 서열, 또는 인간 아데노바이러스 서열을 포함하는 다른 아데노바이러스 서열을 포함하나 이에 제한되지는 않는 다른 아데노바이러스 서열을 용이하게 이용할 수 있다.
추가 예에서, 치료 요법은 (i) 하나 이상의 ChAd155 아데노바이러스 벡터 및 (ii) 추가 성분, 예를 들어, 비-아데노바이러스 벡터, 비-바이러스 벡터, 및/또는 애쥬번트와 선택적으로 동시에 투여되는 다양한 다른 치료적으로 유용한 화합물 또는 분자, 예를 들어, 항원성 단백질의 동시(예를 들어, 공동-투여) 또는 순차적(예를 들어, 프라임-부스트) 전달을 포함할 수 있다. 이들 요법은 동일하거나 상이한 치료 또는 면역원성 분자를 전달할 수 있다. 공동-투여의 예는 동측성 공동-투여 및 대측성 공동-투여(하기 '전달 방법 및 투여량'에 추가로 기재됨)를 포함한다.
하나 이상의 ChAd155 아데노바이러스 벡터와 동시 전달 또는 특히 순차적 전달(예를 들어, 프라임-부스트)에서 사용하기에 적합한 비-아데노바이러스 벡터는 하나 이상의 폭스바이러스 벡터를 포함한다. 적합하게는, 폭스바이러스 벡터는 아과 코르도폭스바이러스아과, 더욱 적합하게는 오르토폭스(orthopox), 파라폭스(parapox), 야타폭스(yatapox), 아비폭스(avipox)(적합하게는, 카나리폭스(canarypox)(ALVAC) 또는 조류폭스(FPV)) 및 몰루시폭스(molluscipox)로 구성된 군으로부터 선택되는 상기 아과 내의 속에 속한다. 더욱 더 적합하게는, 폭스바이러스 벡터는 오르토폭스에 속하며, 백시니아 바이러스, NYVAC(백시니아의 코펜하겐(Copenhagen) 균주로부터 유래됨), 변형된 백시니아 앙카라(MVA), 우두바이러스 및 원숭이폭스 바이러스로 구성된 군으로부터 선택된다. 가장 적합하게는, 폭스바이러스 벡터는 MVA이다.
"동시" 투여는 적합하게는 동일 진행 면역 반응을 나타낸다. 바람직하게는, 둘 모두의 성분은 동시에(예를 들어, DNA 및 단백질 둘 모두의 동시 투여) 투여되나, 한 성분은 수 분 내에(예를 들어, 동일한 의학적 약속 또는 의사 방문시), 수 시간 내에 투여될 수 있다. 상기 투여가 또한 공동-투여로 언급된다. 일부 구현예에서, 공동-투여는 아데노바이러스 벡터, 애쥬번트 및 단백질 성분의 투여를 나타낼 수 있다. 다른 구현예에서, 공동-투여는 아데노바이러스 벡터 및 또 다른 바이러스 벡터, 예를 들어, 제2의 아데노바이러스 벡터 또는 폭스바이러스, 예를 들어, MVA의 투여를 나타낸다. 다른 구현예에서, 공동-투여는 아데노바이러스 벡터 및 선택적으로 애쥬번트화되는 단백질 성분의 투여를 나타낸다.
또 다른 구현예에서, 치료 요법은 임신한 모체로의 면역원성 조성물의 투여 및 출생 후, 예를 들어, 출생 1, 2, 3, 4, 5, 6, 7 또는 8개월 후에 추가 면역원성 조성물을 유아에 후속 투여하는 것을 포함한다. 모체 면역화의 결과로서 생성된 항체는 임신 태아의 수동 면역을 제공하기 위해 태반을 통과할 수 있다. 일 구현예에서, 모체 면역화는 재조합 단백질 항원의 투여에 의한 것이고 유아 면역화는 본 발명에 따른 재조합 아데노바이러스 벡터의 투여에 의한 것이다. 또 다른 구현예에서, 모체 면역화는 본 발명에 따른 재조합 아데노바이러스 벡터의 투여에 의한 것이고 유아 면역화는 재조합 단백질 항원의 투여에 의한 것이다. 또 다른 구현예에서, 모체 및 유아 면역화 둘 모두는 본 발명에 따른 재조합 아데노바이러스 벡터의 투여에 의한 것이다.
따라서, 본 발명은 유아, 특히 임신 중에 RSV에 대해 면역화된 모체에서 출생한 유아에서 RSV에 대한 면역 반응의 생성에서의 본 발명에 따른 재조합 ChAd155-유래 아데노바이러스 벡터의 용도를 제공한다. 따라서, 본 발명은 유아에서 면역 반응의 생성을 위한 약제의 제조에서의 인간 호흡기 세포 융합 바이러스(RSV)로부터 유래된 면역원성 트랜스진을 포함하는 재조합 ChAd155-유래 아데노바이러스 벡터의 용도를 제공한다. 바람직하게는, 특히 유아는 임신 중에 RSV에 대해 면역화된 모체에서 태어났다. 더욱 특히, 트랜스진은 RSV FΔTM 항원(막횡단 및 세포질 영역이 결실된 융합(F) 단백질), 및 RSV M2-1(전사 항-종결) 및 N(뉴클레오캡시드) 항원을 인코딩한다. 특히, 트랜스진은 SEQ ID NO: 37에 개시된 RSV 항원을 인코딩하고, 예를 들어, 일 구현예에서, 트랜스진은 SEQ ID NO: 11의 폴리뉴클레오티드를 포함한다.
프라임-부스트 요법이 이용될 수 있다. 프라임-부스트는 (i) 면역계의 최초 프라이밍 후, (ii) 일차 면역 반응이 확립된 후 수 주 또는 수 개월 후의 면역계의 이차 또는 부스팅의 2개의 별개의 면역 반응을 나타낸다.
상기 요법은 면역계를 프라이밍하기 위한 재조합 ChAd155 벡터의 투여와 전통적인 항원, 예를 들어, 단백질(선택적으로, 애쥬번트와 공동-투여됨), 또는 상기 항원을 인코딩하는 서열을 갖는 재조합 바이러스를 이용한 제2의 부스터 투여를 포함할 수 있다(예를 들어, WO 00/11140호). 대안적으로, 면역화 요법은 항원을 인코딩하는 벡터(바이러스 또는 DNA-기반)에 대한 면역 반응을 부스팅하기 위해 재조합 ChAd155 벡터의 투여를 포함할 수 있다. 또 다른 대안에서, 면역화 요법은 단백질의 투여 후, 항원을 인코딩하는 재조합 ChAd155 벡터를 이용한 부스터를 포함한다. 한 예에서, 프라임-부스트 요법은 항원이 유래되는 바이러스, 박테리아 또는 다른 유기체에 대한 보호 면역 반응을 제공할 수 있다. 또 다른 구현예에서, 프라임-부스트 요법은 치료가 제공되는 질환의 존재의 검출을 위한 통상적인 검정을 이용하여 측정될 수 있는 치료 효과를 제공한다.
바람직하게는, 부스팅 조성물은 대상체에 프라이밍 조성물을 투여한 후 약 2 내지 약 27주 후에 투여된다. 부스팅 조성물의 투여는 프라이밍 백신에 의해 투여되는 것과 동일한 항원 또는 상이한 항원을 전달할 수 있거나 이를 함유하는 유효량의 부스팅 조성물을 이용하여 달성된다. 부스팅 조성물은 동일한 바이러스 공급원 또는 또 다른 공급원으로부터 유래되는 재조합 바이러스 벡터로 구성될 수 있다. 대안적으로, 부스팅 조성물은 프라이밍 백신에서 인코딩된 것과 동일한 항원을 함유하나, 단백질 형태인 조성물일 수 있으며, 이러한 조성물은 숙주에서 면역 반응을 유도한다. 부스팅 조성물의 주요 필요조건은 조성물의 항원이 프라이밍 조성물에 의해 인코딩되는 것과 동일한 항원이거나 교차-반응성 항원이라는 것이다.
전달 방법 및 투여량
벡터는 약학적으로 또는 생리학적으로 허용되는 담체, 예를 들어, 등장성 염수; 당업자에게 명백할 등장성 염 용액 또는 다른 제형에 현탁되거나 용해됨으로써 투여를 위해 제조될 수 있다. 적절한 담체는 당업자에게 명백할 것이며, 투여 경로에 대부분 좌우될 것이다. 본원에 기재된 조성물은 생물분해성 생체적합성 중합체를 이용하는 서방형 제형으로 포유동물에 투여될 수 있거나, 마이셀, 젤 및 리포솜을 이용하여 현장 전달될 수 있다.
일부 구현예에서, 본 발명의 재조합 아데노바이러스는 근내 주사, 질내 주사, 정맥내 주사, 복강내 주사, 피하 주사, 경피 투여, 피내 투여, 코 투여 또는 경구 투여에 의해 대상체에 투여된다.
치료 요법이 각각 상이한 조성물에 제형화된 하나 이상의 ChAd155 아데노바이러스 벡터 및 추가 성분의 공동-투여를 포함하는 경우, 이들은 바람직하게는 동일 부위 또는 그 부근에서 공동-국소적으로 투여된다. 예를 들어, 성분은 동일 측면 또는 말단("공동-측면" 투여) 또는 반대 측면 또는 말단("대측성" 투여)으로 투여(예를 들어, 근내, 경피, 피내, 피하로부터 선택된 투여 경로를 통함)될 수 있다.
바이러스 벡터의 투여량은 주로 치료되는 질환, 환자의 연령, 체중 및 건강과 같은 요인에 좌우될 것이며, 따라서 환자마다 다를 수 있다. 예를 들어, 바이러스 벡터의 치료적으로 효과적인 성인 인간 또는 수의학적 투여량은 일반적으로 1x105 내지 1x1015개의 바이러스 입자, 예를 들어, 1x108 내지 1x1012개(예를 들어, 1x108개, 2.5x108개, 5x108개, 1x109개, 1.5x109개, 2.5x109개, 5x109개, 1x1010개, 1.5x1010개, 2.5x1010개, 5x1010개, 1x1011개, 1.5x1011개, 2.5x1011개, 5x1011개, 1x1012개의 입자)를 함유한다. 대안적으로, 바이러스 벡터는 통상적으로 1x105 내지 1x1010 플라크 형성 단위(PFU), 예를 들어, 1x105 PFU, 2.5x105 PFU, 5x105 PFU, 1x106 PFU, 2.5x106 PFU, 5x106 PFU, 1x107 PFU, 2.5x107 PFU, 5x107 PFU, 1x108 PFU, 2.5x108 PFU, 5x108 PFU, 1x109 PFU, 2.5x109 PFU, 5x109 PFU, 또는 1x1010 PFU의 용량으로 투여될 수 있다. 투여량은 동물의 크기 및 투여 경로에 따라 달라질 것이다. 예를 들어, 근내 주사를 위한 적합한 인간 또는 수의학적 투여량(약 80 kg 동물에 대해)은 단일 부위에 대해 1 mL 당 약 1 x 109 내지 약 5 x 1012개의 입자 범위 내이다. 선택적으로, 다수의 투여 부위가 이용될 수 있다. 또 다른 예에서, 적합한 인간 또는 수의학적 투여량은 경구 제형에 대해 약 1 x 1011 내지 약 1 x 1015개의 입자 범위 내일 수 있다.
바이러스 벡터는, 예를 들어, HCMV 프로모터를 포함하는 발현 카세트와 함께 벡터 유전체를 함유하는 플라스미드 DNA의 연속 희석액을 표준 곡선으로서 이용하여 CMV 프로모터 영역에 대해 설계된 프라이머 및 프로브를 이용한 정량적 PCR 분석(Q-PCR)에 의해 정량될 수 있다. 시험 샘플 내의 카피수는 평행선 분석 방법에 의해 결정된다. 벡터 입자 정량을 위한 대안적 방법은 분석 HPLC 또는 A260 nm에 기반한 분광광도 방법일 수 있다.
핵산의 면역학적 유효량은 적합하게는 1 ng 내지 100 mg일 수 있다. 예를 들어, 적합한 양은 1 μg 내지 100 mg일 수 있다. 특정 핵산(예를 들어, 벡터)의 적절한 양은 당업자에 의해 용이하게 결정될 수 있다. 핵산 성분의 예시적 유효량은 1 ng 내지 100 μg, 예를 들어, 1 ng 내지 1μg(예를 들어, 100 ng-1μg), 또는 1 μg 내지 100 μg, 예를 들어, 10 ng, 50 ng, 100 ng, 150 ng, 200 ng, 250 ng, 500 ng, 750 ng, 또는 1 μg일 수 있다. 핵산의 유효량은 또한 1μg 내지 500 μg, 예를 들어, 1 μg 내지 200 μg, 예를 들어, 10 내지 100 μg, 예를 들어, 1 μg, 2 μg, 5 μg, 10 μg, 20 μg, 50 μg, 75 μg, 100 μg, 150 μg, 또는 200 μg을 포함할 수 있다. 대안적으로, 핵산의 예시적 유효량은 100 μg 내지 1 mg, 예를 들어, 100 μg 내지 500 μg, 예를 들어, 100 μg, 150 μg, 200 μg, 250 μg, 300 μg, 400 μg, 500 μg, 600 μg, 700 μg, 800 μg, 900 μg 또는 1 mg일 수 있다.
일반적으로, 인간 용량은 0.1 ml 내지 2 ml의 부피 내일 것이다. 따라서, 본원에 기재된 조성물은, 예를 들어, 개별적 또는 조합된 면역원성 성분 당 0.1, 0.15, 0.2, 0.5, 1.0, 1.5 또는 2.0 ml 인간 용량의 부피로 제형화될 수 있다.
당업자는 투여 경로 및 재조합 벡터가 사용되는 치료 또는 백신 적용에 따라 상기 용량을 조정할 수 있다. 트랜스진의 발현 수준, 또는 애쥬번트에 대해, 순환 항체의 수준은 투여량의 투여 빈도를 결정하기 위해 모니터될 수 있다.
하나 이상의 프라이밍 및/또는 부스팅 단계가 이용되는 경우, 이러한 단계는 매시간, 매일, 매주 또는 매달, 또는 매년 투여되는 단일 용량을 포함할 수 있다. 예로서, 포유동물은 담체 중 약 10 μg 내지 약 50 μg의 플라스미드를 함유하는 1회 또는 2회 용량을 투여받을 수 있다. 전달 양 또는 부위는 바람직하게는 포유동물의 정체 및 상태를 기초로 하여 선택된다.
선택된 트랜스진에 의해 인코딩되는 단백질의 치료 수준 또는 이에 대한 면역 반응의 수준은, 존재시, 부스터에 대한 필요성을 결정하기 위해 모니터될 수 있다. 혈청에서의 CD8+ T 세포 반응, 또는 선택적으로, 항체 역가의 평가 후, 선택적 부스터 면역화가 요망될 수 있다. 선택적으로, 재조합 ChAd155 벡터는 단일 투여 또는 다양한 조합 요법, 예를 들어, 다른 활성 성분을 포함하는 요법 또는 치료 과정과 조합하여 또는 프라임-부스트 요법으로 전달될 수 있다.
본 발명은 이제 하기의 비제한적인 실시예에 의해 추가로 기재될 것이다.
실시예
실시예 1: ChAd155의 단리
야생형 침팬지 아데노바이러스 타입 155(ChAd155)를 아데노바이러스 단리 및 특성규명 기술을 기재하는 목적으로 참조로서 본원에 포함되는 문헌[Colloca et al. (2012)] 및 WO 2010086189호에 기재된 바와 같은 표준 절차를 이용하여 뉴 이베리아 리서치 센터 시설(New Iberia Research Center; The University of Louisiana at Lafayette)에서 사육된 건강한 어린 침팬지로부터 단리시켰다.
실시예 2: ChAd155 벡터 작제
이후, ChAd155 바이러스 유전체를 플라스미드 또는 BAC 벡터에 클로닝한 후, ChAd155 바이러스 유전체의 다양한 영역에서 하기 변형을 갖도록 변형시켰다(도 2):
a) 바이러스 유전체의 E1 영역(bp 449 내지 bp 3529)의 결실;
b) 바이러스 유전체의 E4 영역(bp 34731 내지 bp 37449)의 결실;
c) 인간 Ad5로부터 유래된 E4orf6의 삽입.
2.1: E1 영역의 결실: BAC/ChAd155 ΔE1_TetO hCMV RpsL-Kana#1375의 작제
ChAd155 바이러스 유전체를 ChAd155 바이러스 DNA 및 서브그룹 C BAC 셔틀(#1365)과 공동-형질전환된 E. 콜리(E. coli) 균주 BJ5183 전기천공 적격 세포(Stratagene 카탈로그 번호 2000154)에서의 상동성 재조합에 의해 BAC 벡터로 클로닝하였다. 도 3의 개략도에 제시된 바와 같이, 서브그룹 C 셔틀은 pBeloBAC11(GenBank U51113, NEB)로부터 유래된 BAC 벡터로, 이는 종 C에 속하는 ChAd의 클로닝에 전용이며, 따라서 종 C ChAd 바이러스의 우측 및 좌측 말단(우측 및 좌측 ITR을 포함함)으로부터 유래된 DNA 단편 및 pIX 유전자를 함유한다.
종 C BAC 셔틀은 또한 좌측 말단과 pIX 유전자 사이에 삽입된 RpsL-Kana 카세트를 함유한다. 또한, ISceI 제한 부위가 측접된 Amp-LacZ-SacB 선택 카세트가 바이러스 유전체의 pIX 유전자와 우측 말단 사이에 존재한다. 특히, BAC 셔틀은 다음과 같은 특징부를 포함하였다: 좌측 ITR: bp 27 내지 139, hCMV(tetO) RpsL-Kana 카세트: bp 493 내지 3396, pIX 유전자: bp 3508 내지 3972, ISceI 제한 부위: bp 3990 내지 7481, Amp-LacZ-SacB 선택 카세트: bp 4000 내지 7471, 우측 ITR: bp 7805 내지 7917.
BJ5183 세포를 ISceI 제한 효소로 절단된 후, 젤로부터 정제된 ChAd155 정제된 바이러스 DNA 및 서브그룹 C BAC 셔틀 벡터와의 전기천공에 의해 공동-형질전환시켰다. pIX 유전자 및 우측 ITR 서열(종 C BAC 셔틀 선형화 DNA의 말단에 존재함)과 ChAd155 바이러스 DNA에 존재하는 상동성 서열 사이에서 발생하는 상동성 재조합은 BAC 셔틀 벡터 내에서의 ChAd155 바이러스 유전체 DNA의 삽입을 발생시켰다. 동시에, 바이러스 E1 영역을 결실시키고, RpsL-Kana 카세트로 치환시켜, BAC/ChAd155 ΔE1/TetO hCMV RpsL-Kana#1375를 생성시켰다.
2.2: E. 콜리 BJ5183에서의 상동성 재조합에 의한 플라스미드 작제
2.2.1: E4 영역의 결실 - pChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RpsL-Kana(#1434)의 작제
벡터의 증식을 개선시키기 위해, E. 콜리에서 여러 단계의 클로닝 및 상동성 재조합을 포함하는 전략을 이용하여 자연 E4 영역을 Ad5 E4orf6 코딩 서열로 대체함으로써 뉴클레오티드 34731-37449(ChAd155 야생형 서열)에 걸쳐 있는 E4 영역의 결실을 벡터 백본에 도입시켰다. E4 코딩 영역을 완전히 결실시킨 반면, E4 자연 프로모터 및 아데닐중합체형성 신호를 보존시켰다. 이를 위해, 하기 상술되는 바와 같이 E. 콜리 BJ5183에서의 상동성 재조합에 의해 ChAd155 자연 E4 영역을 대체함으로써 Ad5orf6의 삽입을 가능하게 하도록 셔틀 벡터를 작제하였다.
pARS 종C Ad5E4orf6-1의 작제
올리고뉴클레오티드 5'-ATACGGACTAGTGGAGAAGTACTCGCCTACATG-3'(SEQ ID NO: 13) 및 5'-ATACGGAAGATCTAAGACTTCAGGAAATATGACTAC-3'(SEQ ID NO: 14)와 함께 주형으로서 Ad5 DNA를 이용한 PCR에 의해 Ad5orf6을 함유하는 DNA 단편을 획득하였다. PCR 단편을 BglII 및 SpeI으로 절단하고, BglII 및 SpeI으로 절단된 종 C RLD-EGFP 셔틀에 클로닝하여, 플라스미드 pARS 종 C Ad5orf6-1을 생성시켰다. 셔틀에 관한 세부사항은 문헌[Colloca et al, Sci. Transl. Med. (2012) 4:115ra]에서 발견될 수 있다.
pARS 종C Ad5E4orf6-2의 작제
E4 영역을 결실시키기 위해, ChAd155 wt 서열(SEQ ID NO: 10)의 bp 34586 내지 bp 34730에 걸쳐 있는 177 bp DNA 단편을 올리고뉴클레오티드 5'-ATTCAGTGTACAGGCGCGCCAAAGCATGACGCTGTTGATTTGATTC-3'(SEQ ID NO: 15) 및 5'-ACTAGGACTAGTTATAAGCTAGAATGGGGCTTTGC-3'(SEQ ID NO: 16)과 함께 주형으로서 플라스미드 BAC/ChAd155 ΔE1_TetO hCMV RpsL-Kana(#1375)를 이용한 PCR에 의해 증폭시켰다. PCR 단편을 BsrGI 및 SpeI으로 절단하고, BsrGI 및 SpeI으로 절단된 pARS 서브그룹C Ad5orf6-1으로 클로닝하여, 플라스미드 pARS 종C Ad5orf6-2(#1490)를 생성시켰다. 이러한 셔틀 플라스미드의 개략도가 도 4에 제공된다. 특히, 셔틀 플라스미드는 다음과 같은 특징부를 포함하였다: 좌측 ITR: bp 1 내지 113, 종 C 첫번째 460bp: bp 1 내지 460, ChAd155 wt(SEQ ID NO:10의 bp 34587 내지 bp 34724): bp 516 내지 650, Ad5 orf6: bp 680 내지 1561, 종 C 마지막 393 bp: bp 1567 내지 1969, 우측 ITR: bp 1857 내지 1969.
pChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RpsL-Kana(#1434)의 작제
이후, 생성된 플라스미드 pARS 서브그룹C Ad5orf6-2를 ChAd155 백본 내의 E4 영역을 Ad5orf6로 대체하기 위해 사용하였다. 이를 위해, 플라스미드 BAC/ChAd155 ΔE1_TetO hCMV RpsL-Kana(#1375)를 PacI/PmeI으로 절단하고, 절단된 플라스미드 pARS 서브그룹C Ad5orf6-2 BsrGI/AscI과 함께 BJ5183 세포로 공동-형질전환시켜, pChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RpsL-Kana(#1434) 프리-아데노(pre-adeno) 플라스미드를 획득하였다.
2.2.2: RSV 발현 카세트의 삽입 - pChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RSV의 작제
백신 항원은 NCBI(National Centre for Biotechnology Information) 데이터베이스에서 검색한 여러 상이한 서브그룹 A RSV 단리물의 정렬에서 유래된 컴퓨팅 컨센서스 서열이다. 각각의 항원에 대해 단백질 컨센서스 서열은 모두 비-동일한 서열의 정렬 및 다수결 원칙의 적용에 의해 Log-Expectation(MUSCLE) 버전 3.6에 의한 다중 서열 비교(Multiple Sequence Comparison)를 이용하여 도출되었다. 블래스트(blasted)되었을 때, 유래된 F 단백질의 컨센서스 서열은 주석달린 자연 변이체: embCAA26143.1과 단 하나의 아미노산만큼 차이가 있는 것으로 밝혀졌다. 컨센서스 N 단백질 또한 주석달린 변이체 ID:1494470과 단 하나의 아미노산 차이를 갖는 반면, M2-1 단백질은 변이체 P04545와 동일하였다. 마지막으로, 각각의 항원성 서열은 진핵 세포에서의 발현을 위해 코돈-최적화되고, 화학적으로 합성되고 어셈블링되었다. 도 14 및 SEQ ID NO: 37에 제시된 작제물은 가용성 F 단백질 FΔTM 및 다른 2개의 RSV 항원 사이에, 리보솜 스킵으로 알려진 번역 효과에 의해 다기능단백질 처리를 매개하는 아프토바이러스 구제역 바이러스 2A 영역(18개 아미노산)을 함유한다[Donnelly, 2001]. 포유동물 세포로의 형질감염 후, 절단이 일어나고, 가용성 F 단백질이 세포 배양 상층액에서 검출된다. 융합 단백질 N-M2-1이 대신 발현되고 세포내 분획에서 검출된다.
RSV 카세트를 HCMV 프로모터와 BGH polyA 서열 사이에 존재하는 상동성을 이용하여 E. 콜리에서의 상동성 재조합을 통해 선형화된 프리-아데노 수용체 벡터에 클로닝하였다. 플라스미드 pvjTetOhCMV-bghpolyA_RSV를 SfiI 및 SpeI으로 절단하여 tetO, RSV 및 BGHpolyA 서열과 함께 HCMV 프로모터를 함유하는 4,65 Kb 단편을 절제하였다. 생성된 RSV 4,65 Kb 단편을 상동성 재조합에 의해 HCMV 및 BGHpA의 조절하에서 RpsL-Kana 선택 카세트를 갖는 pChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RpsL-Kana(#1434) 수용체 벡터로 클로닝하였다. 수용체 프리-아데노 플라스미드를 제한 엔도뉴클레아제 SnaBI으로 선형화시켰다. 생성된 작제물은 pChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RSV 벡터(도 5)였다.
2.3: 리콤비니어링(recombineering)에 의한 BAC 벡터 작제
2.3.1: E4 영역의 결실 - BAC/ChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RpsL-Kana#1390의 작제
ChAd155 wt 서열의 뉴클레오티드 34731-37449에 걸쳐 있는 E4 영역의 결실을 E. 콜리 SW102 적격 세포에서의 2개의 상이한 리콤비니어링 단계를 포함하는 전략을 이용하여 자연 E4 영역을 Ad5 E4orf6 코딩 서열로 대체함으로써 벡터 백본에 도입시켰다.
첫번째 단계는 재조합체의 양성/음성 선택의 목적을 위해 ChAd155의 E4 영역 내에 자살 유전자 SacB, 앰피실린-R 유전자 및 lacZ(Amp-LacZ-SacB 선택 카세트)를 포함하는 선택 카세트의 삽입을 발생시켰다.
첫번째 단계 - ChAd155 자연 E4 영역의 Amp-LacZ-SacB 선택 카세트에 의한 치환
Amp-LacZ-SacB 선택 카세트를 상동성 재조합을 가능하게 하기 위해 E4 측접 서열을 함유하는 하기 제공되는 올리고뉴클레오티드를 이용한 PCR에 의해 증폭시켰다: 1021-FW E4 Del Step1 (5'-TTAATAGACACAGTAGCTTAATAGACCCAGTAGTGCAAAGCCCCATTCTAGCTTATAA CCCCTATTTGTTTATTTTTCT-3')(SEQ ID NO: 17) 및 1022-RW E4 Del Step1 (5'-ATATATACTCTCTCGGCACTTGGCCTTTTACACTGCGAAGTGTTGGTGCTGGTGCTGCGTTGAGAGATCTTTATTTGTTAACTGTTAATTGTC-3') (SEQ ID NO: 18).
pAdeno 플라스미드 BAC/ChAd155 (DE1) tetO hCMV - RpsLKana#1375를 함유하는 E. 콜리 SW102 적격 세포를 형질전환시키기 위해 PCR 생성물을 사용하였다. SW102 세포의 형질전환은 람다(λ) Red-매개 상동성 재조합을 통해 ChAd155의 E4 영역 내에 선택 카세트의 삽입을 가능하게 하여, 이에 따라 BAC/ChAd155 (DE1) TetOhCMV - RpsL Kana #1379(ChAd155 자연 E4 영역을 치환함으로써 Amp-LacZ-SacB 카세트를 포함함)를 획득하였다.
두번째 단계 - Amp-lacZ-SacB 선택 카세트의 Ad5E4orf6 영역에 의한 치환
이후, 생성된 플라스미드 BAC/ChAd155 (DE1) TetOhCMV - RpsL Kana #1379(ChAd155 E4 영역 대신 Amp-LacZ-SacB 카세트를 가짐)를 조작하여 ChAd155 백본 내에서 Amp-lacZ-SacB 선택 카세트를 Ad5orf6로 대체하였다. 이를 위해, 올리고뉴클레오티드 1025-FW E4 Del Step2 (5'-TTAATAGACACAGTAGCTTAATA-3')(SEQ ID NO: 19) 및 1026-RW E4 Del Step2 (5'-GGAAGGGAGTGTCTAGTGTT-3')(SEQ ID NO: 20)를 이용한 PCR에 의해 Ad5orf6 영역을 함유하는 DNA 단편을 획득하였다. 생성된 DNA 단편을 pAdeno 플라스미드 BAC/ChAd155 (DE1) TetOhCMV - RpsL Kana)#1379를 함유하는 E. 콜리 SW102 적격 세포에 도입시켜, 자연 ChAd155 E4 영역을 치환시키는 Ad5orf6를 함유하는 최종 플라스미드 BAC/ChAd155(ΔE1, E4 Ad5E4orf6) TetOhCMV - RpsL Kana#1390을 생성시켰다.
2.3.2: RSV 발현 카세트의 삽입: BAC/ChAd155 ΔE1, E4_Ad5E4orf6/TetOhCMV RSV#1393의 작제
RpsL-Kana 선택 카세트를 치환시킴으로써 RSV 트랜스진을 BAC/ChAd155 ΔE1, E4_Ad5E4orf6/TetOhCMV RSV#1390 벡터에 클로닝하였다. 작제 전략은 E. 콜리 SW102 적격 세포에서의 2개의 상이한 리콤비니어링 단계를 기초로 하였다.
첫번째 단계 - RpsL-Kana 카세트의 Amp-LacZ-SacB 선택 카세트에 의한 치환
올리고뉴클레오티드 91-SubMonte FW (5'-CAATGGGCGTGGATAGCGGTTTGAC-3')(SEQ ID NO: 21) 및 890-BghPolyA RW (5'-CAGCATGCCTGCTATTGTC-3')(SEQ ID NO: 22)를 이용한 PCR에 의해 플라스미드 BAC/ChAd155 (DE1) TetO hCMV Amp-LacZ-SacB#1342로부터 Amp-LacZ-SacB 선택 카세트를 획득하였다. 생성물을 pAdeno 플라스미드 BAC/ChAd155(DE1, E4 Ad5E4orf6) TetOhCMV - RpsL Kana#1390을 함유하는 E. 콜리 SW102 적격 세포로 형질전환시켜, BAC/ChAd155(DE1, E4 Ad5E4orf6) TetOhCMV - Amp-LacZ-SacB#1386을 생성시켰다.
두번째 단계 - Amp-lacZ-SacB 선택 카세트의 RSV 트랜스진에 의한 치환
Amp-lacZ-SacB 선택 카세트를 상동성 재조합에 의해 치환시킴으로써 RSV 트랜스진을 플라스미드 BAC/ChAd155(DE1, E4 Ad5E4orf6) TetOhCMV - Amp-LacZ-SacB#1386에 삽입하였다. 이를 위해, 플라스미드 pvjTetOhCMV-bghpolyA_RSV#1080(RSV 발현 카세트를 함유함)을 SpeI 및 SfiI로 절단하여, HCMV 프로모터, RSV 및 BGHpolyA를 포함하는 4.4 Kb 단편을 절제하였다. 생성된 RSV 4.4 Kb 단편을 pAdeno 플라스미드 BAC/ChAd155(DE1, E4 Adr5E4orf6) TetOhCMV - Amp-LacZ-SacB#1386를 함유하는 E. 콜리 SW102 적격 세포로 형질전환시켜, 최종 플라스미드 BAC/ChAd155 ΔE1, E4_Ad5E4orf6/TetO hCMV RSV#1393을 생성시켰다. ChAd155/RSV(SEQ ID NO: 11)를 갖는 BAC의 구조가 도 6에 예시되어 있다. 특히, ChAd155/RSV는 다음과 같은 특징부를 포함하였다: 종 C 좌측 ITR: bp 1 내지 113, hCMV(tetO) bp 467 내지 1311, RSV 유전자: bp 1348 내지 4785, bghpolyA: bp 4815 내지 5032, Ad5E4orf6: bp 36270 내지 37151, 종 C 우측 ITR: bp 37447 내지 37559.
실시예 3: 벡터 생성
ChAd155의 생산성을 Procell 92 세포주에서 ChAd3 및 PanAd3와의 비교로 평가하였다.
3.1: HIV Gag 트랜스진을 포함하는 벡터의 생성
HIV Gag 단백질을 발현하는 벡터를 상기(ChAd155/GAG) 또는 이전에(ChAd3/GAG Colloca et al, Sci. Transl. Med. (2012) 4:115ra) 기재된 바와 같이 제조하였다. ChAd3/GAG 및 ChAd155/GAG를 회수하고, 계대배양 3(P3)까지 Procell 92에서 증폭시켰고; P3 용해질을 사용하여 각각의 벡터와 함께 단층으로 배양된 Procell 92의 2개의 T75 플라스크를 감염시켰다. 100 vp/세포의 감염다중도(MOI)를 둘 모두의 감염 실험에 이용하였다. 완전한 CPE가 명백해지는 경우(감염 후 72시간) 감염된 세포를 수거하고, 풀링(pooling)시켰고; 바이러스를 3주기의 동결/해동(-70℃/37℃)에 의해 감염된 세포로부터 방출시킨 후, 용해질을 원심분리에 의해 정화시켰다. 정화된 용해질을 CMV 프로모터 영역에 상보적인 프라이머 및 프로브를 이용한 정량적 PCR 분석에 의해 정량하였다. 올리고뉴클레오티드 서열은 다음과 같다: CMVfor 5'-CATCTACGTATTAGTCATCGCTATTACCA-3'(SEQ ID NO: 23), CMVrev 5'-GACTTGGAAATCCCCGTGAGT-3'(SEQ ID NO: 24), CMVFAM-TAMRA 프로브 5'-ACATCAATGGGCGTGGATAGCGGTT-3'(SEQ ID NO: 25)(QPCR을 ABI Prism 7900 Sequence 검출기에서 수행하였다 - Applied Biosystem). 정화된 용해질에서 측정된 결과적 체적 역가(volumetric titer)(vp/ml) 및 세포 당 바이러스 입자에서 발현된 특정 생산성(vp/세포)이 하기 표 1에 제공되고, 도 7에 예시된다.
표 1. P3 용해질로부터의 벡터 생산성.
HIV Gag 트랜스진을 발현하는 ChAd155 벡터의 더 높은 생산성을 확인하기 위해, 접종물로서 정제된 바이러스를 이용하여 두번째 실험을 수행하였다. 이를 위해, Procell 92 세포를 T25 플라스크에 시딩하고, 세포의 컨플루언스(confluence)가 약 80%가 되었을 때 MOI=100 vp/세포의 감염을 이용하여 ChAd3/GAG 및 ChAd155/GAG로 감염시켰다. 완전한 CPE가 명백한 경우 감염된 세포를 수거하였고; 동결/해동에 의해 감염된 세포로부터 바이러스를 방출시키고, 원심분리에 의해 정화시켰다. 정화된 용해질을 다음과 같은 프라이머 및 프로브를 이용한 정량적 PCR 분석으로 정량하였다: CMVfor 5'-CATCTACGTATTAGTCATCGCTATTACCA-3'(SEQ ID NO: 23), CMV rev GACTTGGAAATCCCCGTGAGT(SEQ ID NO: 24), CMV 프로모터 영역에 상보적인 CMV FAM-TAMRA 프로브 5'-ACATCAATGGGCGTGGATAGCGGTT-3'(SEQ ID NO: 25)(샘플을 ABI Prism 7900 Sequence 검출기에서 분석하였다 - Applied Biosystems). 정화된 용해질에서 측정된 결과적 체적 역가(volumetric titer)(vp/ml) 및 세포 당 바이러스 입자에서 발현된 특정 생산성(vp/세포)이 하기 표 2에 제공되고, 도 8에 예시된다.
표 2. 정제된 바이러스로부터의 벡터 생산성.
3.2: RSV 트랜스진을 포함하는 벡터의 생성
현탁액에서 배양된 Procell 92.S에서의 RSV 백신 벡터의 생산성을 평가하기 위해 다양한 세트의 실험을 수행하였다. 실험은 5x105 세포/ml의 세포 밀도에서 Procell 92.S를 감염시킴으로써 PanAd3/RSV(WO2012/089833호에 기재됨) 및 Chad155/RSV를 병행하여 비교하였다. 감염된 세포를 감염 3일 후에 수거하였고; 3주기의 동결/해동에 의해 감염된 세포로부터 바이러스를 방출시키고, 용해질을 원심분리에 의해 정화시켰다. 이후, 정화된 용해질을 상기 보고된 바와 같이 정량적 PCR 분석으로 정량하였다. 체적 생산성 및 세포 특이적 생산성이 하기 표 3에 제공되고, 도 9에 예시된다.
표 3
실시예 4: 트랜스진 발현 수준
4.1: HIV Gag 트랜스진의 발현 수준
HeLa 세포를 HIV Gag 트랜스진을 포함하는 ChAd3 및 ChAd155 벡터로 감염시킴으로써 발현 수준을 병행 실험에서 비교하였다. HeLa 세포를 24 웰 플레이트에 시딩하고, MOI=250 vp/세포를 이용하여 ChAd3/GAG 및 ChAd155/GAG 정제된 바이러스로 이중으로 감염시켰다. HeLa 감염된 세포의 상층액을 감염 48시간 후에 수거하고, 상업적 ELISA 키트(HIV-1 p24 ELISA Kit, PerkinElmer Life Science)를 이용하여 분비된 HIV GAG 단백질의 생성을 정량하였다. HIV-1 p24 항원 표준 곡선을 이용하여 제조업체의 설명서에 따라 정량을 수행하였다. pg/GAG 단백질 ml로 표현되는 결과가 도 10에 예시된다.
4.1: RSV F 트랜스진의 발현 수준
HeLa 세포를 RSV F 트랜스진을 포함하는 상기 기재된 PanAd3 및 ChAd155 벡터로 감염시킴으로써 발현 수준을 병행 실험에서 비교하였다. 이를 위해, HeLa 세포를 6 웰 플레이트에 시딩하고, MOI=500 vp/세포를 이용하여 PanAd3/RSV 및 ChAd155/RSV 정제된 바이러스로 이중으로 감염시켰다. 상층액을 감염 48시간 후에 수거하고, 분비된 RSV F 단백질의 생성을 ELISA로 정량하였다. 상층액의 5개의 상이한 희석액을 상업적 마우스 항-RSV F 모노클로날 항체로 코팅된 마이크로플레이트 웰로 옮겼다. 이차 항-RSV F 토끼 항혈청 및 이후 비오틴-컨쥬게이션된 항-토끼 IgG를 이용한 후, 스트렙타비딘-AP 컨쥬게이트(BD Pharmingen cat. 554065)를 첨가하여 포획된 항원을 나타냈다. RSV F 단백질(Sino Biological cat. 11049-V08B) 표준 곡선을 이용하여 정량을 수행하였다. ug/RSV F 단백질의 ml로 표현되는 획득된 결과가 하기 표 4에 제공된다.
표 4
PanAd3 RSV 벡터에 비해 ChAd155 RSV 벡터에 의해 제공된 더 높은 수준의 트랜스진 발현을 확인하기 위해 웨스턴 블롯 분석을 또한 수행하였다. 6 웰 플레이트에 플레이팅된 HeLa 세포를 MOI=250 및 500 vp/세포를 이용하여 PanAd3/RSV 및 ChAd155/RSV 정제된 바이러스로 감염시켰다. HeLa 감염된 세포의 상층액을 수거하고, 분비된 RSV F 단백질의 생성을 비-환원 SDS 젤 및 이후 웨스턴 블롯 분석에 의해 분석하였다. 동등한 양의 상층액을 비-환원 SDS 젤에 로딩하고; 전기영동 분리 후, 단백질을 니트로셀룰로스 막으로 옮겨, 항-RSV F 마우스 모노클로날 항체(클론 RSV-F-3 카탈로그 번호: ABIN308230, antibodies-online.com에서 이용 가능함(2015년 4월 13일에 마지막으로 액세스됨))로 프로빙하였다. 일차 항체와의 인큐베이션 후, 막을 세척한 후, 항-마우스 HRP 컨쥬게이트 이차 항체와 인큐베이션하였다. 최종적으로, 검정을 표준 기술(ECL 검출 시약 Pierce 카탈로그 번호 W3252282)를 이용한 전기화학발광에 의해 발달시켰다. 웨스턴 블롯 결과가 도 11에 제시된다. 화살표로 표시된 약 170 kD의 밴드가 F 단백질에 대해 발생된 모노클로날 항체 mAb 13에 의해 나타났고, 이는 삼량체 F 단백질의 예상 중량에 해당한다. ChAd155 RSV 벡터가 MOI=250 및 500vp/세포 둘 모두에서 더 어두운 밴드를 발생시킨 것이 관찰될 수 있다.
실시예 5: 마우스 면역화 실험에 의한 면역학적 효능의 평가
5.1: HIV Gag 트랜스진을 포함하는 벡터의 면역원성
ChAd155/GAG 벡터의 면역원성을 BALB/c 마우스(그룹 당 5마리)에서 ChAd3/GAG 벡터와 병행하여 평가하였다. 106개의 바이러스 입자를 근내 주사하여 실험을 수행하였다. T-세포 반응을 BALB/c 마우스에서 맵핑된 GAG CD8+ T 세포 에피토프를 이용한 생체 외 IFN-감마 효소-결합 면역스팟(ELISpot)에 의한 면역화 3주 후에 측정하였다. 100만 개의 비장세포 당 IFN-감마 스팟 형성 세포(SFC)로 표현되는 결과가 도 12에 제시된다. 각각의 도트는 단일 마우스에서의 반응을 나타내고, 선은 각각의 용량 그룹에 대한 평균에 해당한다. 바이러스 입자의 수에서의 주사된 용량 및 CD8 면역우세 펩티드에 대한 양성 마우스의 빈도가 x 축 상에 제시된다.
5.2: RSV 트랜스진을 포함하는 벡터의 면역원성
백신 후보 ChAd155-RSV의 면역원성을 평가하기 위한 전임상 연구를 근교배 BALB/c 마우스에서 수행하였다(5.2.1). 백신 효능을 또한 RSV에 의한 비내(IN) 챌린지 후 하부(폐) 또는 상부(비강 조직) 기도에서의 바이러스 부하 측정을 통해 코튼 래트에서 평가하였다(5.2.2). 마지막으로, 백신을 자연 RSV 감염을 모방하는 모델인 어린 혈청음성 송아지에서 시험하였다(5.2.3).
5.2.1 - 근교배 마우스
ChAd155-RSV를 BALB/c 마우스 균주에서 시험하여 이의 면역학적 잠재력을 평가하였다. 근교배 마우스에서의 용량 에스컬레이션은 종(비-인간 영장류 및 인간)을 가로질러 일관되게 확인된 결과로 마우스에서 침팬지 아데노바이러스 벡터의 면역학적 잠재력을 순위매길 수 있는 표준 검정이다[Colloca, 2012].
PanAd3/RSV 및 ChAd155/RSV 벡터의 면역학적 효능을 BALB/c 마우스에서 평가하였다. 둘 모두의 벡터를 3X106, 107, 및 108 vp의 용량으로 근내 주사하였다. 예방접종 3주 후, 면역화된 마우스의 비장세포를 단리시키고, BALB/c 마우스에서 맵핑된 면역우세 펩티드 F 및 M 에피토프를 항원으로 이용하여 IFN-감마-ELISpot에 의해 분석하였다. 면역-반응의 수준은 투여량 감소에 따라 감소되었으나(예상된 바와 같음), 면역 반응은 PanAd3/RSV 백신으로 면역화된 마우스의 동등한 그룹에 비해 ChAd155/RSV 벡터로 면역화된 마우스의 그룹에서 명백히 더 높았다(도 13). 도 13에서, 기호는 3개의 면역우세 에피토프(F51-66 F85-93 및 M2-1282-290)에 대한 반응의 합계로서 계산되고, 백그라운드에 대해 보정된 IFN-감마 스팟 형성 세포(SFC)/100만 개의 비장세포로 표현되는 개별적 마우스 데이터를 제시한다. 수평선은 각각의 용량 그룹에 대한 IFN-감마 SFC의 평균 수/100만 개의 비장세포를 나타낸다. T 세포 용량 반응은 ChAd155-RSV 면역화된 마우스에서 관찰되었고 모든 마우스는 낮은 3x106 vp 투여량에도 반응하였다. PanAd3-RSV는 가장 높은 투여량에서 유사한 반응을 유도하였으나, ChAd155-RSV는 2개의 보다 낮은 투여량에서 더 높은 반응을 유도하였다(도 13).
두 번째 연구에서, 한 그룹의 BALB/c 마우스는 5x108 vp의 단일 용량, IM으로 ChAd155-RSV를 투여받았고 다른 그룹은 PanAd3-RSV를 투여받았다. 후속하여 예방접종 4주 후부터 시작하여 10주까지 2주 간격으로 마우스(n=5/그룹)를 채혈하여 항 F 항체의 유도 및 유지를 모니터하였다. 면역화된 마우스로부터의 풀링된 혈청을 코팅된 RSV-F 단백질 상에서 효소 결합 면역흡착 측정(ELISA)으로 시험하였다. 도 15는 예방접종으로부터 다양한 시점에 면역화된 마우스로부터의 풀링된 혈청에서 ELISA에 의해 측정된 RSV F 면역글로불린 G(IgG) 역가를 보여준다. 풀링된 혈청 연속 희석액을 RSV-F 단백질 코팅된 ELISA 웰에 플레이팅하였고, 알칼리 포스파타제(AP) 및 p-니트로페닐 포스페이트(pNPP) 기질에 컨쥬게이션된 염소 항-마우스 IgG를 이용하여 특이적 IgG의 결합을 나타내었다. 반응은 시간 경과에 따라 진행되었고 정해진 시점에 405 나노미터(nm)로 판독되었다. 데이터는 1:100 희석에서 면역전 혈청의 평균보다 3 표준 편차(SD) 이상 높은 광학 밀도 (OD)405 판독을 나타내는 혈청 희석율로 계산된 종말점 역가로서 표시된다. RSV F 단백질에 대한 항체 반응은 ChAd155-RSV에 의해 유도되었고 5x108 vp의 단일 IM 투여 후 10주의 기간에 걸쳐 유지되었으며, 항체 역가는 PanAd3-RSV에 의해 유도된 것보다 안정기에 1.5배 더 높았다(도 15).
5.2.2 -코튼 래트
방법
5개 그룹의 암컷 6-8주령 코튼 래트(8마리 래트/그룹)를 5x108 또는 5x107 vp의 ChAd155-RSV 또는 PanAd3-RSV로 근내(IM) 경로에 의해 면역화시켰다(표 5를 참조하라). 대조군은 예방접종하지 않은 채로 두었다. 예방접종 7주 후, 동물을 105 pfu 표준 용량의 RSV A(Long 균주)로 비내(IN) 접종에 의해 챌린지하였다. 챌린지 5일 후, 동물을 희생시키고, 바이러스 적정을 위해 비강 조직을 수거하고, 바이러스 적정(좌엽) 및 조직병리학(우엽, 그룹 A, D, E만)을 위해 일괄적으로 폐를 수집하여 양분하였다. RSV 챌린지 5일 후에 수집된 비강 조직 또는 폐 균질액의 RSV 역가를 허용 세포(HEp-2 세포) 상에서 표준 플라크 검정에 의해 결정하였다. FFPE 폐 섹션을 헤마톡실린/에오신으로 염색하였다. 폐 염증의 4가지 파라미터를 평가하였다: 세기관지주위염(PB), 혈관주위염(PV), 사이질 폐렴(IP), 및 폐포염(A). 슬라이드에 맹검으로 0-4의 중증도 점수를 매긴 다음, 값을 0-100% 조직병리학 점수로 전환시켰다. 동물들을 또한 0일 및 챌린지시에, 허용 세포(Vero 세포) 상에서 표준 플라크 검정에 의한 RSV 중화 항원 적정을 위해 채혈하였다. 중화 항체 역가는 바이러스 대조군에 비해 바이러스의 60%가 중화된 혈청 희석율의 역수로서 결정되었다.
표 5 코튼 래트의 투여 계획
면역원성 및 효능 결과
도 16 패널 A 및 B는 플라크 검정에 의한, 각각 비강 조직 및 폐 균질액으로부터의 RSV 바이러스 역가를 보여준다. RSV 챌린지 5일 후에 수집된 비강 또는 폐 균질액의 RSV 역가는 허용 세포 상에서 표준 플라크 검정에 의해 결정되었다. 데이터는 조직의 그램 당 RSV 플라크 형성 단위(pfu/g)로 표시된다. 둘 모두의 투여량의 근내 ChAd155-RSV는, 가장 낮은 투여량의 한 마리 동물을 제외하고, 폐에서의 바이러스 복제를 완전히 폐지하였다. 상기도의 감염은 또한 예방접종되지 않은 대조군 동물에 비해 용량-의존적인 방식으로 현저하게 감소되었다(비강 조직으로부터 회수된 1 내지 2 로그 더 낮은 RSV 역가 사이).
코튼 래트에서 1:100 이상의 혈청 중화 항체 역가가 폐에서 바이러스 복제로부터 보호를 부여한다는 것이 종래에 밝혀졌다[Prince, 1985]. 이 연구에서, 5x108 vp로 IM 투여된 두 벡터 모두는 보호 임계값 범위의 RSV 중화 항체를 유도하였지만, 역가는 더 낮은 백신 투여량에 의해 감소되었다(도 16 패널 C). 그럼에도 불구하고, 예방접종은 혈청 항체 수준이 1:100 이하일 때조차도 폐에서 바이러스 복제를 예방하였는데, 이는 다른 면역 이펙터 메커니즘에 대한 역할을 시사한다. RSV 중화 항체 역가는 대조군에 비해 60%만큼 플라크를 감소시키는 혈청 희석율로서 표시된다.
안전성 결과
ChAd155-RSV에 의한 예방접종이 백신-향상된 병리학을 유도하였는지를 평가하기 위해 폐 조직병리학을 감염 5일 후에 수행하였다. 폐 염증의 4가지 파라미터를 폐 조직의 다른 영역에서 염증 세포의 존재에 따라 평가하였다: 세기관지주위염(PB, 세기관지 주위에 염증 세포 침윤), 혈관주위염(PV, 소혈관 주위에 염증 세포 침윤), 사이질 폐렴(IP, 염증 세포 침윤 및 폐포 벽의 비후), 및 폐포염 (A, 폐포 공간 내 세포). 포르말린-고정된, 파라핀-임베디드 폐 섹션을 헤마톡실린/에오신으로 염색하였다. 슬라이드에 맹검으로 0-4의 중증도 점수를 매긴 다음, 값을 0-100% 조직병리학 점수로 전환시켰다. 점선(5%로 설정)은 유의한 병리학에 대한 임계값을 나타낸다. PanAd3-RSV(회색으로 표시)에 대한 조직병리학 데이터는 이전 연구에서 얻었다. 4가지 파라미터 중에서, 폐포 벽에 염증 침윤의 존재(사이질 폐렴 [IP]), 보다 중요하게는 폐포 공간에 염증 침윤의 존재(폐포염 [A])는 향상된 질병 및 폐 병리학의 예측으로 간주된다[Prince, 2001]. 폐 조직병리학 분석의 결과(도 16 패널 D)는 IM ChAd155-RSV가 유의한 IP 및 A 병리학 점수를 유도하지 않았음을 보여주었다. 관찰된 낮은 수준의 IP 및 A는 RSV 급성 감염 및 이차 RSV 재감염 동안 관찰된 것과 일치하며[Boukhvalova, 2013], 이전 연구에서 PanAd3-RSV에 의해 관찰된 값과 유사하였다.
도 16에서, 점선 수평선은 패널 A, B 및 C의 각 검정에 대한 검출 한계(LOD)를 나타낸다. 패널 D에서 점선 수평선(5%로 설정)은 유의한 병리학에 대한 임계값을 나타낸다.
5.2.3 - 혈청음성 송아지
소 RSV(bRSV)는 어린 송아지에서 인간 유아에서 관찰되는 것과 매우 유사한 호흡기 질환을 일으킨다. 또한, 소 RSV는 인간 RSV와 유전적으로 그리고 항원적으로 관련되어 있다. 신생 송아지 bRSV 모델은 인간 RSV 백신의 안전성 평가를 위한 적절한 동물 모델을 모델링한다.
방법
세 그룹의 5마리의 초유-제한된 송아지를 표 6에 지시된 대로, 5x1010 vp ChAd155-RSV 또는 비교기 PanAd3-RSV에 의해, 4주 간격으로 2회 접종하여 예방접종하였다.
표 6 신생 송아지의 투여 계획
그룹 C를 관련이 없는 항원을 함유하는 PanAd3 아데노벡터로 모의 접종하였다. 동물을 두 번째 예방접종 4주 후 104 pfu의 bRSV Snook 균주의 IN(10 mL) 및 기관내(IT)(10 mL) 투여에 의해 챌린지하였다. 감염 6일 후, 바이러스 복제가 폐 및 코에서 최대 폐 병리를 일으키는 최고점에 도달했을 때, 동물을 희생시켰다. 이 모델에서, 챌린지 접종물 투여의 IN/IT 경로로 인해, 존재하는 경우, 극히 적은 임상 징후가 챌린지된 대조군 동물에서 관찰되었다. 따라서, bRSV 챌린지에 대한 예방접종의 효과는 bRSV의 비인두 배출, 폐 균질액에서 bRSV의 수준 분석, 육안 폐렴 병변의 발달 및 기관지-폐포 세척(BAL)에서의 백혈구 분석에 의해 연구되었다. 예방접종 및/또는 챌린지 후에 유도된 항체 반응(항체 및 중화 역가)도 조사되었다.
면역원성 결과
bRSV-특이적 혈청 IgG의 유도에 대한 예방접종의 효과
예방접종의 과정 전반에 걸쳐 평균 bRSV-특이적 혈청 IgG 항체 및 인간 RSV(hRSV) 중화 역가의 동역학이 도 17에서 연구 그룹에 대해 도시된다. 그래프는 각 연구 그룹의 기하 평균 값을 보여준다. bRSV-특이적 IgG의 수준은 항원으로서 bRSV(Snook 균주)-감염된 우태아 신장(FCK) 세포 용해질을 사용하여 결정되었다[Taylor, 1995]. 모의 감염된 FCK 세포의 용해질을 대조 항원으로서 이용하였다.
RSV 면역원을 투여받은 각 그룹의 5마리 동물 중 2마리는 예방접종의 시작 시점에 낮은 수준의 모체 bRSV-특이적 항체를 나타내었다. 그럼에도 불구하고, 모든 동물은 백신에 반응하여 부스트 후에 높은 수준(log10 = 3-3.5)의 bRSV-특이적 항체에 도달하였다(도 17A). 대조군의 모든 송아지는 예방접종의 시작 시점에 검출 가능한 bRSV-특이적 항체를 지녔고, 이는 연구 동안 감소하였으며, 챌린지 당일에는 검출될 수 없었다. 결론적으로, PanAd3-RSV 및 ChAd155-RSV는 항체 반응을 유도하는데 유사한 효능을 나타내었다.
hRSV 중화 반응은 예방접종 전에는 검출될 수 없었다. 단일 용량 후, PanAd3-RSV로 예방접종된 모든 동물 및 ChAd155-RSV로 예방접종된 5마리 동물 중 2마리는 측정 가능한 RSV 중화 항체를 지녔다(도 17B). 둘 모두의 백신에 대해 두 번째 용량 후 현저한 부스트가 관찰되었다. hRSV 중화 반응의 추가 향상은 챌린지 1주 후에 관찰되지 않았다.
효능 결과
bRSV의 비인두 배출에 대한 예방접종의 효과
bRSV 챌린지 후, 비인두 면봉을 매일 수득하고 샘플 내의 bRSV 역가를 측정 하였다. 도 18에 도시된 바와 같이, 대조군의 역가는 3일부터 6일까지 증가하였다. bRSV 복제는 아데노벡터 RSV 작제물 중 어느 하나를 투여받은 송아지에서 현저하게 감소한 것으로 나타났다.
하기도에서 bRSV의 복제에 대한 예방접종의 효과.
bRSV 챌린지 6일 후, 모든 대조군 송아지의 폐 세척 세포(LWC) 및 폐엽 균질 액(RA, RC 및 LC)에서, 그리고 대조군 송아지 6마리 중 5마리의 기관 스크레이프(TSc) 샘플로부터 높은 역가의 bRSV가 검출되었다(도 19). 대조적으로, bRSV는 ChAd155-RSV를 투여받은 송아지의 1의 LWC 및 2의 TSc 샘플로부터 낮은 역가로 검출되었지만, PanAd3-RSV를 투여받은 송아지로부터의 모든 샘플에서 검출될 수 없었다.
폐 병리학에 대한 예방접종의 효과
bRSV 챌린지 6일 후, 광범위한 육안 폐렴 경결이 6마리의 대조군 송아지 중 6마리에서 관찰되었다(도 20). 대조적으로, 아데노벡터 RSV 작제물 중 어느 하나를 투여받은 송아지에서는 육안 폐렴 경결이 거의 없거나 전혀 없었다. 도 21은 bRSV 챌린지 6일 후, BAL에서 림프구(L), 대식세포(Mo), 다형핵 백혈구(PMN) 및 호산구(Eo)의 평균 비율 ± SD를 정량한다. 대조군 송아지의 BAL에서 세포의 약 70%는 PMN이었다. 보다 낮은 비율의 PMN이 ChAd155-RSV 또는 PanAd3-RSV를 투여받은 송아지의 BAL에서 발견되었는데, 이는 감소된 폐 염증을 나타낸다. 중요하게는, ChAd155-RSV 또는 PanAd3-RSV를 투여받은 송아지의 폐에서 호산구는 극히 적거나 검출될 수 없었는데, 이는 백신-유도된 질병 악화의 부재를 시사한다.
결론
종합하면, 상기 보고된 결과는 ChAd155가 ChAd3 및 PanAd3 벡터와 비교하여 개선된 아데노바이러스 벡터임을 입증하였다. ChAd155는 더 생산적이고, 따라서 제조 공정을 용이하게 하고, 시험관 내 및 또한 생체 내에서 더 높은 수준의 트랜스진을 발현시킬 수 있어, 동물 모델에서 발현된 항원에 대한 더 강한 T-세포 반응 및 최소한 효능 있는 항체 반응을 제공하는 것으로 나타났다. 보호 면역은 백신-유도된 향상된 폐 병리학 징후 없이 달성된다.
참고문헌
서열의 설명
SEQ ID NO: 1 - ChAd155 섬유의 폴리펩티드 서열
SEQ ID NO: 2 - ChAd155 섬유를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 3 - ChAd155 펜톤의 폴리펩티드 서열
SEQ ID NO: 4 - ChAd155 펜톤을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 5 - ChAd155 헥손의 폴리펩티드 서열
SEQ ID NO: 6 - ChAd155 헥손을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 7 - ChAd155#1434 백본 작제물을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 8 - ChAd155#1390 백본 작제물을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 9 - ChAd155#1375 백본 작제물을 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 10 - 야생형 ChAd155를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 11 - ChAd155/RSV를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 12 - CASI 프로모터를 인코딩하는 폴리뉴클레오티드 서열
SEQ ID NO: 13 - Ad5orf6 프라이머 1 폴리뉴클레오티드 서열
SEQ ID NO: 14 - Ad5orf6 프라이머 2 폴리뉴클레오티드 서열
SEQ ID NO: 15 - BAC/CHAd155 ΔE1_TetO hCMV RpsL-Kana 프라이머 1 폴리뉴클레오티드 서열
SEQ ID NO: 16 - BAC/CHAd155 ΔE1_TetO hCMV RpsL-Kana (#1375) 프라이머 2 폴리뉴클레오티드 서열
SEQ ID NO: 17 - 1021-FW E4 Del Step1 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 18 - 1022-RW E4 Del Step1 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 19 - 1025-FW E4 Del Step2 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 20 - 1026-RW E4 Del Step2 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 21 - 91-SubMonte FW 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 22 - 90-BghPolyA RW 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 23 - CMVfor 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 24 - CMVrev 프라이머 폴리뉴클레오티드 서열
SEQ ID NO: 25 - CMVFAM-TAMRA qPCR 프로브 폴리뉴클레오티드 서열
SEQ ID NO: 26 - 우드척 간염 바이러스 전사후 조절 요소(WPRE) 폴리뉴클레오티드 서열
SEQ ID NO: 27 - ChAd3 섬유 아미노산 서열
SEQ ID NO: 28- PanAd3 섬유 아미노산 서열
SEQ ID NO: 29 - ChAd17 섬유 아미노산 서열
SEQ ID NO: 30 - ChAd19 섬유 아미노산 서열
SEQ ID NO: 31 - ChAd24 섬유 아미노산 서열
SEQ ID NO: 32 - ChAd11 섬유 아미노산 서열
SEQ ID NO: 33 - ChAd20 섬유 아미노산 서열
SEQ ID NO: 34 - ChAd31 섬유 아미노산 서열
SEQ ID NO: 35 - PanAd1 섬유 아미노산 서열
SEQ ID NO: 36 - PanAd2 섬유 아미노산 서열
SEQ ID NO: 37 - RSV FΔTM-N-M2-1 아미노산 서열
SEQ ID NO: 38 - HIV Gag 폴리뉴클레오티드 서열
SEQUENCE LISTING
<110> GLAXOSMITHKLINE BIOLOGICALS SA
<120> ADENOVIRUS POLYNUCLEOTIDES AND POLYPEPTIDES
<130> VB66115 PCT
<140>
<141>
<150> UK 1514772.1
<151> 2015-08-19
<150> UK 1510357.5
<151> 2015-06-12
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 578
<212> PRT
<213> Simian adenovirus
<400> 1
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Ile Thr Thr Ala Ser Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Gly Ile Asp
180 185 190
Met Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Gly Leu Asn Phe
195 200 205
Gly Ala Pro Leu His Val Val Asp Ser Leu Asn Ala Leu Thr Val Val
210 215 220
Thr Gly Gln Gly Leu Thr Ile Asn Gly Thr Ala Leu Gln Thr Arg Val
225 230 235 240
Ser Gly Ala Leu Asn Tyr Asp Thr Ser Gly Asn Leu Glu Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Val Asp Ala Asn Gly Gln Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Phe Val Asn Ser Ala His Asn Leu Asp Val Asn Tyr Asn
290 295 300
Arg Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val
305 310 315 320
Asn Ile Lys Thr Ala Lys Gly Leu Ile Tyr Asp Asp Thr Ala Ile Ala
325 330 335
Ile Asn Ala Gly Asp Gly Leu Gln Phe Asp Ser Gly Ser Asp Thr Asn
340 345 350
Pro Leu Lys Thr Lys Leu Gly Leu Gly Leu Asp Tyr Asp Ser Ser Arg
355 360 365
Ala Ile Ile Ala Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly
370 375 380
Ala Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr
385 390 395 400
Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile Tyr Ser Glu Lys Asp Ala
405 410 415
Lys Phe Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser
420 425 430
Val Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr
435 440 445
Val Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu
450 455 460
Leu Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly
465 470 475 480
Asp Leu Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro
485 490 495
Asn Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn
500 505 510
Ile Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr
515 520 525
Leu Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val
530 535 540
Ser Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr
545 550 555 560
Ile Asn Glu Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala
565 570 575
Gln Glu
<210> 2
<211> 1734
<212> DNA
<213> Simian adenovirus
<400> 2
atgaagcgca ccaaaacgtc tgacgagagc ttcaaccccg tgtaccccta tgacacggaa 60
agcggccctc cctccgtccc tttcctcacc cctcccttcg tgtctcccga tggattccaa 120
gaaagtcccc ccggggtcct gtctctgaac ctggccgagc ccctggtcac ttcccacggc 180
atgctcgccc tgaaaatggg aagtggcctc tccctggacg acgctggcaa cctcacctct 240
caagatatca ccaccgctag ccctcccctc aaaaaaacca agaccaacct cagcctagaa 300
acctcatccc ccctaactgt gagcacctca ggcgccctca ccgtagcagc cgccgctccc 360
ctggcggtgg ccggcacctc cctcaccatg caatcagagg cccccctgac agtacaggat 420
gcaaaactca ccctggccac caaaggcccc ctgaccgtgt ctgaaggcaa actggccttg 480
caaacatcgg ccccgctgac ggccgctgac agcagcaccc tcacagtcag tgccacacca 540
ccccttagca caagcaatgg cagcttgggt attgacatgc aagcccccat ttacaccacc 600
aatggaaaac taggacttaa ctttggcgct cccctgcatg tggtagacag cctaaatgca 660
ctgactgtag ttactggcca aggtcttacg ataaacggaa cagccctaca aactagagtc 720
tcaggtgccc tcaactatga cacatcagga aacctagaat tgagagctgc agggggtatg 780
cgagttgatg caaatggtca acttatcctt gatgtagctt acccatttga tgcacaaaac 840
aatctcagcc ttaggcttgg acagggaccc ctgtttgtta actctgccca caacttggat 900
gttaactaca acagaggcct ctacctgttc acatctggaa ataccaaaaa gctagaagtt 960
aatatcaaaa cagccaaggg tctcatttat gatgacactg ctatagcaat caatgcgggt 1020
gatgggctac agtttgactc aggctcagat acaaatccat taaaaactaa acttggatta 1080
ggactggatt atgactccag cagagccata attgctaaac tgggaactgg cctaagcttt 1140
gacaacacag gtgccatcac agtaggcaac aaaaatgatg acaagcttac cttgtggacc 1200
acaccagacc catcccctaa ctgtagaatc tattcagaga aagatgctaa attcacactt 1260
gttttgacta aatgcggcag tcaggtgttg gccagcgttt ctgttttatc tgtaaaaggt 1320
agccttgcgc ccatcagtgg cacagtaact agtgctcaga ttgtcctcag atttgatgaa 1380
aatggagttc tactaagcaa ttcttccctt gaccctcaat actggaacta cagaaaaggt 1440
gaccttacag agggcactgc atataccaac gcagtgggat ttatgcccaa cctcacagca 1500
tacccaaaaa cacagagcca aactgctaaa agcaacattg taagtcaggt ttacttgaat 1560
ggggacaaat ccaaacccat gaccctcacc attaccctca atggaactaa tgaaacagga 1620
gatgccacag taagcactta ctccatgtca ttctcatgga actggaatgg aagtaattac 1680
attaatgaaa cgttccaaac caactccttc accttctcct acatcgccca agaa 1734
<210> 3
<211> 593
<212> PRT
<213> Simian adenovirus
<400> 3
Met Arg Arg Ala Ala Met Tyr Gln Glu Gly Pro Pro Pro Ser Tyr Glu
1 5 10 15
Ser Val Val Gly Ala Ala Ala Ala Ala Pro Ser Ser Pro Phe Ala Ser
20 25 30
Gln Leu Leu Glu Pro Pro Tyr Val Pro Pro Arg Tyr Leu Arg Pro Thr
35 40 45
Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Phe Asp
50 55 60
Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Val Ala Ser
65 70 75 80
Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Gln
85 90 95
Asn Asn Asp Tyr Ser Pro Ser Glu Ala Ser Thr Gln Thr Ile Asn Leu
100 105 110
Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr
115 120 125
Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Ala
130 135 140
Arg Val Met Val Ser Arg Ser His Thr Lys Glu Asp Arg Val Glu Leu
145 150 155 160
Lys Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Tyr Ser Glu
165 170 175
Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Leu
180 185 190
Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys
195 200 205
Phe Asp Thr Arg Asn Phe Arg Leu Gly Leu Asp Pro Val Thr Gly Leu
210 215 220
Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Ile
225 230 235 240
Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn
245 250 255
Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile
260 265 270
Thr Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val
275 280 285
Glu Ala Tyr Gln Asp Ser Leu Lys Glu Asn Glu Ala Gly Gln Glu Asp
290 295 300
Thr Ala Pro Ala Ala Ser Ala Ala Ala Glu Gln Gly Glu Asp Ala Ala
305 310 315 320
Asp Thr Ala Ala Ala Asp Gly Ala Glu Ala Asp Pro Ala Met Val Val
325 330 335
Glu Ala Pro Glu Gln Glu Glu Asp Met Asn Asp Ser Ala Val Arg Gly
340 345 350
Asp Thr Phe Val Thr Arg Gly Glu Glu Lys Gln Ala Glu Ala Glu Ala
355 360 365
Ala Ala Glu Glu Lys Gln Leu Ala Ala Ala Ala Ala Ala Ala Ala Leu
370 375 380
Ala Ala Ala Glu Ala Glu Ser Glu Gly Thr Lys Pro Ala Lys Glu Pro
385 390 395 400
Val Ile Lys Pro Leu Thr Glu Asp Ser Lys Lys Arg Ser Tyr Asn Leu
405 410 415
Leu Lys Asp Ser Thr Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr
420 425 430
Asn Tyr Gly Asp Pro Ser Thr Gly Val Arg Ser Trp Thr Leu Leu Cys
435 440 445
Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro
450 455 460
Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
465 470 475 480
Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro Val His Ser Lys Ser
485 490 495
Phe Tyr Asn Asp Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr
500 505 510
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala
515 520 525
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
530 535 540
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn Ser Ile Gly Gly Val
545 550 555 560
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
565 570 575
Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg Thr
580 585 590
Phe
<210> 4
<211> 1779
<212> DNA
<213> Simian adenovirus
<400> 4
atgcggcgcg cggcgatgta ccaggaggga cctcctccct cttacgagag cgtggtgggc 60
gcggcggcgg cggcgccctc ttctcccttt gcgtcgcagc tgctggagcc gccgtacgtg 120
cctccgcgct acctgcggcc tacggggggg agaaacagca tccgttactc ggagctggcg 180
cccctgttcg acaccacccg ggtgtacctg gtggacaaca agtcggcgga cgtggcctcc 240
ctgaactacc agaacgacca cagcaatttt ttgaccacgg tcatccagaa caatgactac 300
agcccgagcg aggccagcac ccagaccatc aatctggatg accggtcgca ctggggcggc 360
gacctgaaaa ccatcctgca caccaacatg cccaacgtga acgagttcat gttcaccaat 420
aagttcaagg cgcgggtgat ggtgtcgcgc tcgcacacca aggaagaccg ggtggagctg 480
aagtacgagt gggtggagtt cgagctgcca gagggcaact actccgagac catgaccatt 540
gacctgatga acaacgcgat cgtggagcac tatctgaaag tgggcaggca gaacggggtc 600
ctggagagcg acatcggggt caagttcgac accaggaact tccgcctggg gctggacccc 660
gtgaccgggc tggttatgcc cggggtgtac accaacgagg ccttccatcc cgacatcatc 720
ctgctgcccg gctgcggggt ggacttcact tacagccgcc tgagcaacct cctgggcatc 780
cgcaagcggc agcccttcca ggagggcttc aggatcacct acgaggacct ggaggggggc 840
aacatccccg cgctcctcga tgtggaggcc taccaggata gcttgaagga aaatgaggcg 900
ggacaggagg ataccgcccc cgccgcctcc gccgccgccg agcagggcga ggatgctgct 960
gacaccgcgg ccgcggacgg ggcagaggcc gaccccgcta tggtggtgga ggctcccgag 1020
caggaggagg acatgaatga cagtgcggtg cgcggagaca ccttcgtcac ccggggggag 1080
gaaaagcaag cggaggccga ggccgcggcc gaggaaaagc aactggcggc agcagcggcg 1140
gcggcggcgt tggccgcggc ggaggctgag tctgagggga ccaagcccgc caaggagccc 1200
gtgattaagc ccctgaccga agatagcaag aagcgcagtt acaacctgct caaggacagc 1260
accaacaccg cgtaccgcag ctggtacctg gcctacaact acggcgaccc gtcgacgggg 1320
gtgcgctcct ggaccctgct gtgcacgccg gacgtgacct gcggctcgga gcaggtgtac 1380
tggtcgctgc ccgacatgat gcaagacccc gtgaccttcc gctccacgcg gcaggtcagc 1440
aacttcccgg tggtgggcgc cgagctgctg cccgtgcact ccaagagctt ctacaacgac 1500
caggccgtct actcccagct catccgccag ttcacctctc tgacccacgt gttcaatcgc 1560
tttcctgaga accagattct ggcgcgcccg cccgccccca ccatcaccac cgtcagtgaa 1620
aacgttcctg ctctcacaga tcacgggacg ctaccgctgc gcaacagcat cggaggagtc 1680
cagcgagtga ccgttactga cgccagacgc cgcacctgcc cctacgttta caaggccttg 1740
ggcatagtct cgccgcgcgt cctttccagc cgcactttt 1779
<210> 5
<211> 964
<212> PRT
<213> Simian adenovirus
<400> 5
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Ser Tyr Phe Ser Leu Ser Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65 70 75 80
Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Ser Cys Glu Trp Glu Gln Glu Glu Thr Gln Thr Ala Glu
130 135 140
Glu Ala Gln Asp Glu Glu Glu Asp Glu Ala Glu Ala Glu Glu Glu Met
145 150 155 160
Pro Gln Glu Glu Gln Ala Pro Val Lys Lys Thr His Val Tyr Ala Gln
165 170 175
Ala Pro Leu Ser Gly Glu Lys Ile Thr Lys Asp Gly Leu Gln Ile Gly
180 185 190
Thr Asp Ala Thr Ala Thr Glu Gln Lys Pro Ile Tyr Ala Asp Pro Thr
195 200 205
Phe Gln Pro Glu Pro Gln Ile Gly Glu Ser Gln Trp Asn Glu Ala Asp
210 215 220
Ala Ser Val Ala Gly Gly Arg Val Leu Lys Lys Thr Thr Pro Met Lys
225 230 235 240
Pro Cys Tyr Gly Ser Tyr Ala Arg Pro Thr Asn Ala Asn Gly Gly Gln
245 250 255
Gly Val Leu Val Glu Lys Asp Gly Gly Lys Met Glu Ser Gln Val Asp
260 265 270
Met Gln Phe Phe Ser Thr Ser Glu Asn Ala Arg Asn Glu Ala Asn Asn
275 280 285
Ile Gln Pro Lys Leu Val Leu Tyr Ser Glu Asp Val His Met Glu Thr
290 295 300
Pro Asp Thr His Ile Ser Tyr Lys Pro Ala Lys Ser Asp Asp Asn Ser
305 310 315 320
Lys Val Met Leu Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile
325 330 335
Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly
340 345 350
Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val
355 360 365
Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp
370 375 380
Ser Met Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val
385 390 395 400
Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Thr Glu
405 410 415
Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Val Thr
420 425 430
Asp Thr Tyr Gln Ala Ile Lys Thr Asn Gly Asn Gly Asn Gly Gly Gly
435 440 445
Asn Thr Thr Trp Thr Lys Asp Glu Thr Phe Ala Asp Arg Asn Glu Ile
450 455 460
Gly Val Gly Asn Asn Phe Ala Met Glu Ile Asn Leu Ser Ala Asn Leu
465 470 475 480
Trp Arg Asn Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Lys
485 490 495
Leu Lys Tyr Asn Pro Ser Asn Val Glu Ile Ser Asp Asn Pro Asn Thr
500 505 510
Tyr Asp Tyr Met Asn Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys
515 520 525
Tyr Ile Asn Leu Gly Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val
530 535 540
Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met
545 550 555 560
Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln
565 570 575
Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr
580 585 590
Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser
595 600 605
Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Lys Phe Glu Ser
610 615 620
Ile Cys Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser
625 630 635 640
Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn
645 650 655
Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala
660 665 670
Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg
675 680 685
Gly Trp Ala Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly
690 695 700
Ser Gly Phe Asp Pro Tyr Tyr Thr Tyr Ser Gly Ser Ile Pro Tyr Leu
705 710 715 720
Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Val Thr
725 730 735
Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro
740 745 750
Asn Glu Phe Glu Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn Val
755 760 765
Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Ile Gln Met Leu Ala
770 775 780
Asn Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys
785 790 795 800
Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln
805 810 815
Val Val Asp Glu Thr Lys Tyr Lys Asp Tyr Gln Gln Val Gly Ile Ile
820 825 830
His Gln His Asn Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met
835 840 845
Arg Glu Gly Gln Ala Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly
850 855 860
Lys Thr Ala Val Asp Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg
865 870 875 880
Thr Leu Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala
885 890 895
Leu Thr Asp Leu Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala
900 905 910
Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu
915 920 925
Tyr Val Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro His
930 935 940
Arg Gly Val Ile Glu Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly
945 950 955 960
Asn Ala Thr Thr
<210> 6
<211> 2880
<212> DNA
<213> Simian adenovirus
<400> 6
atggcgaccc catcgatgat gccgcagtgg tcgtacatgc acatctcggg ccaggacgcc 60
tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg ccaccgagag ctacttcagc 120
ctgagtaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgg 180
tctcagcgcc tgacgctgcg gttcattccc gtggaccgcg aggacaccgc gtactcgtac 240
aaggcgcggt tcaccctggc cgtgggcgac aaccgcgtgc tggacatggc ctccacctac 300
tttgacatcc gcggggtgct ggaccggggt cccactttca agccctactc tggcaccgcc 360
tacaactccc tggcccccaa gggcgctccc aactcctgcg agtgggagca agaggaaact 420
caggcagttg aagaagcagc agaagaggaa gaagaagatg ctgacggtca agctgaggaa 480
gagcaagcag ctaccaaaaa gactcatgta tatgctcagg ctcccctttc tggcgaaaaa 540
attagtaaag atggtctgca aataggaacg gacgctacag ctacagaaca aaaacctatt 600
tatgcagacc ctacattcca gcccgaaccc caaatcgggg agtcccagtg gaatgaggca 660
gatgctacag tcgccggcgg tagagtgcta aagaaatcta ctcccatgaa accatgctat 720
ggttcctatg caagacccac aaatgctaat ggaggtcagg gtgtactaac ggcaaatgcc 780
cagggacagc tagaatctca ggttgaaatg caattctttt caacttctga aaacgcccgt 840
aacgaggcta acaacattca gcccaaattg gtgctgtata gtgaggatgt gcacatggag 900
accccggata cgcacctttc ttacaagccc gcaaaaagcg atgacaattc aaaaatcatg 960
ctgggtcagc agtccatgcc caacagacct aattacatcg gcttcagaga caactttatc 1020
ggcctcatgt attacaatag cactggcaac atgggagtgc ttgcaggtca ggcctctcag 1080
ttgaatgcag tggtggactt gcaagacaga aacacagaac tgtcctacca gctcttgctt 1140
gattccatgg gtgacagaac cagatacttt tccatgtgga atcaggcagt ggacagttat 1200
gacccagatg ttagaattat tgaaaatcat ggaactgaag acgagctccc caactattgt 1260
ttccctctgg gtggcatagg ggtaactgac acttaccagg ctgttaaaac caacaatggc 1320
aataacgggg gccaggtgac ttggacaaaa gatgaaactt ttgcagatcg caatgaaata 1380
ggggtgggaa acaatttcgc tatggagatc aacctcagtg ccaacctgtg gagaaacttc 1440
ctgtactcca acgtggcgct gtacctacca gacaagctta agtacaaccc ctccaatgtg 1500
gacatctctg acaaccccaa cacctacgat tacatgaaca agcgagtggt ggccccgggg 1560
ctggtggact gctacatcaa cctgggcgcg cgctggtcgc tggactacat ggacaacgtc 1620
aaccccttca accaccaccg caatgcgggc ctgcgctacc gctccatgct cctgggcaac 1680
gggcgctacg tgcccttcca catccaggtg ccccagaagt tctttgccat caagaacctc 1740
ctcctcctgc cgggctccta cacctacgag tggaacttca ggaaggatgt caacatggtc 1800
ctccagagct ctctgggtaa cgatctcagg gtggacgggg ccagcatcaa gttcgagagc 1860
atctgcctct acgccacctt cttccccatg gcccacaaca cggcctccac gctcgaggcc 1920
atgctcagga acgacaccaa cgaccagtcc ttcaatgact acctctccgc cgccaacatg 1980
ctctacccca tacccgccaa cgccaccaac gtccccatct ccatcccctc gcgcaactgg 2040
gcggccttcc gcggctgggc cttcacccgc ctcaagacca aggagacccc ctccctgggc 2100
tcgggattcg acccctacta cacctactcg ggctccattc cctacctgga cggcaccttc 2160
tacctcaacc acactttcaa gaaggtctcg gtcaccttcg actcctcggt cagctggccg 2220
ggcaacgacc gtctgctcac ccccaacgag ttcgagatca agcgctcggt cgacggggag 2280
ggctacaacg tggcccagtg caacatgacc aaggactggt tcctggtcca gatgctggcc 2340
aactacaaca tcggctacca gggcttctac atcccagaga gctacaagga caggatgtac 2400
tccttcttca ggaacttcca gcccatgagc cggcaggtgg tggaccagac caagtacaag 2460
gactaccagg aggtgggcat catccaccag cacaacaact cgggcttcgt gggctacctc 2520
gcccccacca tgcgcgaggg acaggcctac cccgccaact tcccctatcc gctcataggc 2580
aagaccgcgg tcgacagcat cacccagaaa aagttcctct gcgaccgcac cctctggcgc 2640
atccccttct ccagcaactt catgtccatg ggtgcgctct cggacctggg ccagaacttg 2700
ctctacgcca actccgccca cgccctcgac atgaccttcg aggtcgaccc catggacgag 2760
cccacccttc tctatgttct gttcgaagtc tttgacgtgg tccgggtcca ccagccgcac 2820
cgcggcgtca tcgagaccgt gtacctgcgt acgcccttct cggccggcaa cgccaccacc 2880
<210> 7
<211> 37912
<212> DNA
<213> Simian adenovirus
<400> 7
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccgggccc cccctcgagg tcgacggtat cgataagctt cacgctgccg 1380
caagcactca gggcgcaagg gctgctaaag gaagcggaac acgtagaaag ccagtccgca 1440
gaaacggtgc tgaccccgga tgaatgtcag ctactgggct atctggacaa gggaaaacgc 1500
aagcgcaaag agaaagcagg tagcttgcag tgggcttaca tggcgatagc tagactgggc 1560
ggttttatgg acagcaagcg aaccggaatt gccagctggg gcgccctctg gtaaggttgg 1620
gaagccctgc aaagtaaact ggatggcttt cttgccgcca aggatctgat ggcgcagggg 1680
atcaagatct aaccaggagc tatttaatgg caacagttaa ccagctggta cgcaaaccac 1740
gtgctcgcaa agttgcgaaa agcaacgtgc ctgcgctgga agcatgcccg caaaaacgtg 1800
gcgtatgtac tcgtgtatat actaccactc ctaaaaaacc gaactccgcg ctgcgtaaag 1860
tatgccgtgt tcgtctgact aacggtttcg aagtgacttc ctacatcggt ggtgaaggtc 1920
acaacctgca ggagcactcc gtgatcctga tccgtggcgg tcgtgttaaa gacctcccgg 1980
gtgttcgtta ccacaccgta cgtggtgcgc ttgactgctc cggcgttaaa gaccgtaagc 2040
aggctcgttc caagtatggc gtgaagcgtc ctaaggctta atggtagatc tgatcaagag 2100
acaggatgac ggtcgtttcg catgcttgaa caagatggat tgcacgcagg ttctccggcc 2160
gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 2220
gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 2280
tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg 2340
ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 2400
ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 2460
tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 2520
gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 2580
gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 2640
ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 2700
ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 2760
gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 2820
ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 2880
atcgccttct atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga 2940
ccgaccaagc gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg 3000
aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg 3060
atctcatgct ggagttcttc gcccaccccg ggctcgatcc cctcgggggg aatcagaatt 3120
cagtcgacag cggccgcgat ctgctgtgcc ttctagttgc cagccatctg ttgtttgccc 3180
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 3240
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 3300
gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 3360
ctctatggcc gatcagcgat cgctgaggtg ggtgagtggg cgtggcctgg ggtggtcatg 3420
aaaatatata agttgggggt cttagggtct ctttatttgt gttgcagaga ccgccggagc 3480
catgagcggg agcagcagca gcagcagtag cagcagcgcc ttggatggca gcatcgtgag 3540
cccttatttg acgacgcgga tgccccactg ggccggggtg cgtcagaatg tgatgggctc 3600
cagcatcgac ggccgacccg tcctgcccgc aaattccgcc acgctgacct atgcgaccgt 3660
cgcggggacg ccgttggacg ccaccgccgc cgccgccgcc accgcagccg cctcggccgt 3720
gcgcagcctg gccacggact ttgcattcct gggaccactg gcgacagggg ctacttctcg 3780
ggccgctgct gccgccgttc gcgatgacaa gctgaccgcc ctgctggcgc agttggatgc 3840
gcttactcgg gaactgggtg acctttctca gcaggtcatg gccctgcgcc agcaggtctc 3900
ctccctgcaa gctggcggga atgcttctcc cacaaatgcc gtttaagata aataaaacca 3960
gactctgttt ggattaaaga aaagtagcaa gtgcattgct ctctttattt cataattttc 4020
cgcgcgcgat aggccctaga ccagcgttct cggtcgttga gggtgcggtg tatcttctcc 4080
aggacgtggt agaggtggct ctggacgttg agatacatgg gcatgagccc gtcccggggg 4140
tggaggtagc accactgcag agcttcatgc tccggggtgg tgttgtagat gatccagtcg 4200
tagcaggagc gctgggcatg gtgcctaaaa atgtccttca gcagcaggcc gatggccagg 4260
gggaggccct tggtgtaagt gtttacaaaa cggttaagtt gggaagggtg cattcgggga 4320
gagatgatgt gcatcttgga ctgtattttt agattggcga tgtttccgcc cagatccctt 4380
ctgggattca tgttgtgcag gaccaccagt acagtgtatc cggtgcactt ggggaatttg 4440
tcatgcagct tagagggaaa agcgtggaag aacttggaga cgcctttgtg gcctcccaga 4500
ttttccatgc attcgtccat gatgatggca atgggcccgc gggaggcagc ttgggcaaag 4560
atatttctgg ggtcgctgac gtcgtagttg tgttccaggg tgaggtcgtc ataggccatt 4620
tttacaaagc gcgggcggag ggtgcccgac tgggggatga tggtcccctc tggccctggg 4680
gcgtagttgc cctcgcagat ctgcatttcc caggccttaa tctcggaggg gggaatcata 4740
tccacctgcg gggcgatgaa gaaaacggtt tccggagccg gggagattaa ctgggatgag 4800
agcaggtttc taagcagctg tgattttcca caaccggtgg gcccataaat aacacctata 4860
accggttgca gctggtagtt tagagagctg cagctgccgt cgtcccggag gaggggggcc 4920
acctcgttga gcatgtccct gacgcgcatg ttctccccga ccagatccgc cagaaggcgc 4980
tcgccgccca gggacagcag ctcttgcaag gaagcaaagt ttttcagcgg cttgaggccg 5040
tccgccgtgg gcatgttttt cagggtctgg ctcagcagct ccaggcggtc ccagagctcg 5100
gtgacgtgct ctacggcatc tctatccagc atatctcctc gtttcgcggg ttggggcgac 5160
tttcgctgta gggcaccaag cggtggtcgt ccagcggggc cagagtcatg tccttccatg 5220
ggcgcagggt cctcgtcagg gtggtctggg tcacggtgaa ggggtgcgct ccgggctgag 5280
cgcttgccaa ggtgcgcttg aggctggttc tgctggtgct gaagcgctgc cggtcttcgc 5340
cctgcgcgtc ggccaggtag catttgacca tggtgtcata gtccagcccc tccgcggcgt 5400
gtcccttggc gcgcagcttg cccttggagg tggcgccgca cgaggggcag agcaggctct 5460
tgagcgcgta gagcttgggg gcgaggaaga ccgattcggg ggagtaggcg tccgcgccgc 5520
agaccccgca cacggtctcg cactccacca gccaggtgag ctcggggcgc gccgggtcaa 5580
aaaccaggtt tcccccatgc tttttgatgc gtttcttacc tcgggtctcc atgaggtggt 5640
gtccccgctc ggtgacgaag aggctgtccg tgtctccgta gaccgacttg aggggtcttt 5700
tctccagggg ggtccctcgg tcttcctcgt agaggaactc ggaccactct gagacgaagg 5760
cccgcgtcca ggccaggacg aaggaggcta tgtgggaggg gtagcggtcg ttgtccacta 5820
gggggtccac cttctccaag gtgtgaagac acatgtcgcc ttcctcggcg tccaggaagg 5880
tgattggctt gtaggtgtag gccacgtgac cgggggttcc tgacgggggg gtataaaagg 5940
gggtgggggc gcgctcgtcg tcactctctt ccgcatcgct gtctgcgagg gccagctgct 6000
ggggtgagta ttccctctcg aaggcgggca tgacctccgc gctgaggttg tcagtttcca 6060
aaaacgagga ggatttgatg ttcacctgtc ccgaggtgat acctttgagg gtacccgcgt 6120
ccatctggtc agaaaacacg atctttttat tgtccagctt ggtggcgaac gacccgtaga 6180
gggcgttgga gagcagcttg gcgatggagc gcagggtctg gttcttgtcc ctgtcggcgc 6240
gctccttggc cgcgatgttg agctgcacgt actcgcgcgc gacgcagcgc cactcgggga 6300
agacggtggt gcgctcgtcg ggcaccaggc gcacgcgcca gccgcggttg tgcagggtga 6360
ccaggtccac gctggtggcg acctcgccgc gcaggcgctc gttggtccag cagagacggc 6420
cgcccttgcg cgagcagaag gggggcaggg ggtcgagctg ggtctcgtcc ggggggtccg 6480
cgtccacggt gaaaaccccg gggcgcaggc gcgcgtcgaa gtagtctatc ttgcaacctt 6540
gcatgtccag cgcctgctgc cagtcgcggg cggcgagcgc gcgctcgtag gggttgagcg 6600
gcgggcccca gggcatgggg tgggtgagtg cggaggcgta catgccgcag atgtcataga 6660
cgtagagggg ctcccgcagg accccgatgt aggtggggta gcagcggccg ccgcggatgc 6720
tggcgcgcac gtagtcatac agctcgtgcg agggggcgag gaggtcgggg cccaggttgg 6780
tgcgggcggg gcgctccgcg cggaagacga tctgcctgaa gatggcatgc gagttggaag 6840
agatggtggg gcgctggaag acgttgaagc tggcgtcctg caggccgacg gcgtcgcgca 6900
cgaaggaggc gtaggagtcg cgcagcttgt gtaccagctc ggcggtgacc tgcacgtcga 6960
gcgcgcagta gtcgagggtc tcgcggatga tgtcatattt agcctgcccc ttctttttcc 7020
acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcgggaaac 7080
cgtccggttc cgaacggtaa gagcctagca tgtagaactg gttgacggcc tggtaggcgc 7140
agcagccctt ctccacgggg agggcgtagg cctgcgcggc cttgcggagc gaggtgtggg 7200
tcagggcgaa ggtgtccctg accatgactt tgaggtactg gtgcttgaag tcggagtcgt 7260
cgcagccgcc ccgctcccag agcgagaagt cggtgcgctt cttggagcgg gggttgggca 7320
gagcgaaggt gacatcgttg aagaggattt tgcccgcgcg gggcatgaag ttgcgggtga 7380
tgcggaaggg ccccggcact tcagagcggt tgttgatgac ctgggcggcg agcacgatct 7440
cgtcgaagcc gttgatgttg tggcccacga tgtagagttc caggaagcgg ggccggccct 7500
ttacggtggg cagcttcttt agctcttcgt aggtgagctc ctcgggcgag gcgaggccgt 7560
gctcggccag ggcccagtcc gcgaggtgcg ggttgtctct gaggaaggac ttccagaggt 7620
cgcgggccag gagggtctgc aggcggtctc tgaaggtcct gaactggcgg cccacggcca 7680
ttttttcggg ggtgatgcag tagaaggtga gggggtcttg ctgccagcgg tcccagtcga 7740
gctgcagggc gaggtcgcgc gcggcggtga ccaggcgctc gtcgcccccg aatttcatga 7800
ccagcatgaa gggcacgagc tgctttccga aggcccccat ccaagtgtag gtctctacat 7860
cgtaggtgac aaagaggcgc tccgtgcgag gatgcgagcc gatcgggaag aactggatct 7920
cccgccacca gttggaggag tggctgttga tgtggtggaa gtagaagtcc cgtcgccggg 7980
ccgaacactc gtgctggctt ttgtaaaagc gagcgcagta ctggcagcgc tgcacgggct 8040
gtacctcatg cacgagatgc acctttcgcc cgcgcacgag gaagccgagg ggaaatctga 8100
gccccccgcc tggctcgcgg catggctggt tctcttctac tttggatgcg tgtccgtctc 8160
cgtctggctc ctcgaggggt gttacggtgg agcggaccac cacgccgcgc gagccgcagg 8220
tccagatatc ggcgcgcggc ggtcggagtt tgatgacgac atcgcgcagc tgggagctgt 8280
ccatggtctg gagctcccgc ggcggcggca ggtcagccgg gagttcttgc aggttcacct 8340
cgcagagtcg ggccagggcg cggggcaggt ctaggtggta cctgatctct aggggcgtgt 8400
tggtggcggc gtcgatggct tgcaggagcc cgcagccccg gggggcgacg acggtgcccc 8460
gcggggtggt ggtggtggtg gcggtgcagc tcagaagcgg tgccgcgggc gggcccccgg 8520
aggtaggggg ggctccggtc ccgcgggcag gggcggcagc ggcacgtcgg cgtggagcgc 8580
gggcaggagt tggtgctgtg cccggaggtt gctggcgaag gcgacgacgc ggcggttgat 8640
ctcctggatc tggcgcctct gcgtgaagac gacgggcccg gtgagcttga acctgaaaga 8700
gagttcgaca gaatcaatct cggtgtcatt gaccgcggcc tggcgcagga tctcctgcac 8760
gtctcccgag ttgtcttggt aggcgatctc ggccatgaac tgctcgatct cttcctcctg 8820
gaggtctccg cgtccggcgc gttccacggt ggccgccagg tcgttggaga tgcgccccat 8880
gagctgcgag aaggcgttga gtccgccctc gttccagact cggctgtaga ccacgccccc 8940
ctggtcatcg cgggcgcgca tgaccacctg cgcgaggttg agctccacgt gccgcgcgaa 9000
gacggcgtag ttgcgcagac gctggaagag gtagttgagg gtggtggcgg tgtgctcggc 9060
cacgaagaag ttcatgaccc agcggcgcaa cgtggattcg ttgatgtccc ccaaggcctc 9120
cagccgttcc atggcctcgt agaagtccac ggcgaagttg aaaaactggg agttgcgcgc 9180
cgacacggtc aactcctcct ccagaagacg gatgagctcg gcgacggtgt cgcgcacctc 9240
gcgctcgaag gctatgggga tctcttcctc cgctagcatc accacctcct cctcttcctc 9300
ctcttctggc acttccatga tggcttcctc ctcttcgggg ggtggcggcg gcggcggtgg 9360
gggagggggc gctctgcgcc ggcggcggcg caccgggagg cggtccacga agcgcgcgat 9420
catctccccg cggcggcggc gcatggtctc ggtgacggcg cggccgttct cccgggggcg 9480
cagttggaag acgccgccgg acatctggtg ctggggcggg tggccgtgag gcagcgagac 9540
ggcgctgacg atgcatctca acaattgctg cgtaggtacg ccgccgaggg acctgaggga 9600
gtccatatcc accggatccg aaaacctttc gaggaaggcg tctaaccagt cgcagtcgca 9660
aggtaggctg agcaccgtgg cgggcggcgg ggggtggggg gagtgtctgg cggaggtgct 9720
gctgatgatg taattgaagt aggcggactt gacacggcgg atggtcgaca ggagcaccat 9780
gtccttgggt ccggcctgct ggatgcggag gcggtcggct atgccccagg cttcgttctg 9840
gcatcggcgc aggtccttgt agtagtcttg catgagcctt tccaccggca cctcttctcc 9900
ttcctcttct gcttcttcca tgtctgcttc ggccctgggg cggcgccgcg cccccctgcc 9960
ccccatgcgc gtgaccccga accccctgag cggttggagc agggccaggt cggcgacgac 10020
gcgctcggcc aggatggcct gctgcacctg cgtgagggtg gtttggaagt catccaagtc 10080
cacgaagcgg tggtaggcgc ccgtgttgat ggtgtaggtg cagttggcca tgacggacca 10140
gttgacggtc tggtggcccg gttgcgacat ctcggtgtac ctgagtcgcg agtaggcgcg 10200
ggagtcgaag acgtagtcgt tgcaagtccg caccaggtac tggtagccca ccaggaagtg 10260
cggcggcggc tggcggtaga ggggccagcg cagggtggcg ggggctccgg gggccaggtc 10320
ttccagcatg aggcggtggt aggcgtagat gtacctggac atccaggtga tacccgcggc 10380
ggtggtggag gcgcgcggga agtcgcgcac ccggttccag atgttgcgca ggggcagaaa 10440
gtgctccatg gtaggcgtgc tctgtccagt cagacgcgcg cagtcgttga tactctagac 10500
cagggaaaac gaaagccggt cagcgggcac tcttccgtgg tctggtgaat agatcgcaag 10560
ggtatcatgg cggagggcct cggttcgagc cccgggtccg ggccggacgg tccgccatga 10620
tccacgcggt taccgcccgc gtgtcgaacc caggtgtgcg acgtcagaca acggtggagt 10680
gttccttttg gcgtttttct ggccgggcgc cggcgccgcg taagagacta agccgcgaaa 10740
gcgaaagcag taagtggctc gctccccgta gccggaggga tccttgctaa gggttgcgtt 10800
gcggcgaacc ccggttcgaa tcccgtactc gggccggccg gacccgcggc taaggtgttg 10860
gattggcctc cccctcgtat aaagaccccg cttgcggatt gactccggac acggggacga 10920
gcccctttta tttttgcttt ccccagatgc atccggtgct gcggcagatg cgccccccgc 10980
cccagcagca gcaacaacac cagcaagagc ggcagcaaca gcagcgggag tcatgcaggg 11040
ccccctcacc caccctcggc gggccggcca cctcggcgtc cgcggccgtg tctggcgcct 11100
gcggcggcgg cggggggccg gctgacgacc ccgaggagcc cccgcggcgc agggccagac 11160
actacctgga cctggaggag ggcgagggcc tggcgcggct gggggcgccg tctcccgagc 11220
gccacccgcg ggtgcagctg aagcgcgact cgcgcgaggc gtacgtgcct cggcagaacc 11280
tgttcaggga ccgcgcgggc gaggagcccg aggagatgcg ggacaggagg ttcagcgcag 11340
ggcgggagct gcggcagggg ctgaaccgcg agcggctgct gcgcgaggag gactttgagc 11400
ccgacgcgcg gacggggatc agccccgcgc gcgcgcacgt ggcggccgcc gacctggtga 11460
cggcgtacga gcagacggtg aaccaggaga tcaacttcca aaagagtttc aacaaccacg 11520
tgcgcacgct ggtggcgcgc gaggaggtga ccatcgggct gatgcacctg tgggactttg 11580
taagcgcgct ggtgcagaac cccaacagca agcctctgac ggcgcagctg ttcctgatag 11640
tgcagcacag cagggacaac gaggcgttta gggacgcgct gctgaacatc accgagcccg 11700
agggtcggtg gctgctggac ctgattaaca tcctgcagag catagtggtg caggagcgca 11760
gcctgagcct ggccgacaag gtggcggcca tcaactactc gatgctgagc ctgggcaagt 11820
tttacgcgcg caagatctac cagacgccgt acgtgcccat agacaaggag gtgaagatcg 11880
acggttttta catgcgcatg gcgctgaagg tgctcaccct gagcgacgac ctgggcgtgt 11940
accgcaacga gcgcatccac aaggccgtga gcgtgagccg gcggcgcgag ctgagcgacc 12000
gcgagctgat gcacagcctg cagcgggcgc tggcgggcgc cggcagcggc gacagggagg 12060
cggagtccta cttcgatgcg ggggcggacc tgcgctgggc gcccagccgg cgggccctgg 12120
aggccgcggg ggtccgcgag gactatgacg aggacggcga ggaggatgag gagtacgagc 12180
tagaggaggg cgagtacctg gactaaaccg cgggtggtgt ttccggtaga tgcaagaccc 12240
gaacgtggtg gacccggcgc tgcgggcggc tctgcagagc cagccgtccg gccttaactc 12300
ctcagacgac tggcgacagg tcatggaccg catcatgtcg ctgacggcgc gtaacccgga 12360
cgcgttccgg cagcagccgc aggccaacag gctctccgcc atcctggagg cggtggtgcc 12420
tgcgcgctcg aaccccacgc acgagaaggt gctggccata gtgaacgcgc tggccgagaa 12480
cagggccatc cgcccggacg aggccgggct ggtgtacgac gcgctgctgc agcgcgtggc 12540
ccgctacaac agcggcaacg tgcagaccaa cctggaccgg ctggtggggg acgtgcgcga 12600
ggcggtggcg cagcgcgagc gcgcggatcg gcagggcaac ctgggctcca tggtggcgct 12660
gaatgccttc ctgagcacgc agccggccaa cgtgccgcgg gggcaggaag actacaccaa 12720
ctttgtgagc gcgctgcggc tgatggtgac cgagaccccc cagagcgagg tgtaccagtc 12780
gggcccggac tacttcttcc agaccagcag acagggcctg cagacggtga acctgagcca 12840
ggctttcaag aacctgcggg ggctgtgggg cgtgaaggcg cccaccggcg accgggcgac 12900
ggtgtccagc ctgctgacgc ccaactcgcg cctgctgctg ctgctgatcg cgccgttcac 12960
ggacagcggc agcgtgtccc gggacaccta cctggggcac ctgctgaccc tgtaccgcga 13020
ggccatcggg caggcgcagg tggacgagca caccttccag gagatcacca gcgtgagccg 13080
cgcgctgggg caggaggaca cgagcagcct ggaggcgact ctgaactacc tgctgaccaa 13140
ccggcggcag aagattccct cgctgcacag cctgacctcc gaggaggagc gcatcttgcg 13200
ctacgtgcag cagagcgtga gcctgaacct gatgcgcgac ggggtgacgc ccagcgtggc 13260
gctggacatg accgcgcgca acatggaacc gggcatgtac gccgcgcacc ggccttacat 13320
caaccgcctg atggactacc tgcatcgcgc ggcggccgtg aaccccgagt actttaccaa 13380
cgccatcctg aacccgcact ggctcccgcc gcccgggttc tacagcgggg gcttcgaggt 13440
cccggagacc aacgatggct tcctgtggga cgacatggac gacagcgtgt tctccccgcg 13500
gccgcaggcg ctggcggaag cgtccctgct gcgtcccaag aaggaggagg aggaggaggc 13560
gagtcgccgc cgcggcagca gcggcgtggc ttctctgtcc gagctggggg cggcagccgc 13620
cgcgcgcccc gggtccctgg gcggcagccc ctttccgagc ctggtggggt ctctgcacag 13680
cgagcgcacc acccgccctc ggctgctggg cgaggacgag tacctgaata actccctgct 13740
gcagccggtg cgggagaaaa acctgcctcc cgccttcccc aacaacggga tagagagcct 13800
ggtggacaag atgagcagat ggaagaccta tgcgcaggag cacagggacg cgcctgcgct 13860
ccggccgccc acgcggcgcc agcgccacga ccggcagcgg gggctggtgt gggatgacga 13920
ggactccgcg gacgatagca gcgtgctgga cctgggaggg agcggcaacc cgttcgcgca 13980
cctgcgcccc cgcctgggga ggatgtttta aaaaaaaaaa aaaaaagcaa gaagcatgat 14040
gcaaaaatta aataaaactc accaaggcca tggcgaccga gcgttggttt cttgtgttcc 14100
cttcagtatg cggcgcgcgg cgatgtacca ggagggacct cctccctctt acgagagcgt 14160
ggtgggcgcg gcggcggcgg cgccctcttc tccctttgcg tcgcagctgc tggagccgcc 14220
gtacgtgcct ccgcgctacc tgcggcctac gggggggaga aacagcatcc gttactcgga 14280
gctggcgccc ctgttcgaca ccacccgggt gtacctggtg gacaacaagt cggcggacgt 14340
ggcctccctg aactaccaga acgaccacag caattttttg accacggtca tccagaacaa 14400
tgactacagc ccgagcgagg ccagcaccca gaccatcaat ctggatgacc ggtcgcactg 14460
gggcggcgac ctgaaaacca tcctgcacac caacatgccc aacgtgaacg agttcatgtt 14520
caccaataag ttcaaggcgc gggtgatggt gtcgcgctcg cacaccaagg aagaccgggt 14580
ggagctgaag tacgagtggg tggagttcga gctgccagag ggcaactact ccgagaccat 14640
gaccattgac ctgatgaaca acgcgatcgt ggagcactat ctgaaagtgg gcaggcagaa 14700
cggggtcctg gagagcgaca tcggggtcaa gttcgacacc aggaacttcc gcctggggct 14760
ggaccccgtg accgggctgg ttatgcccgg ggtgtacacc aacgaggcct tccatcccga 14820
catcatcctg ctgcccggct gcggggtgga cttcacttac agccgcctga gcaacctcct 14880
gggcatccgc aagcggcagc ccttccagga gggcttcagg atcacctacg aggacctgga 14940
ggggggcaac atccccgcgc tcctcgatgt ggaggcctac caggatagct tgaaggaaaa 15000
tgaggcggga caggaggata ccgcccccgc cgcctccgcc gccgccgagc agggcgagga 15060
tgctgctgac accgcggccg cggacggggc agaggccgac cccgctatgg tggtggaggc 15120
tcccgagcag gaggaggaca tgaatgacag tgcggtgcgc ggagacacct tcgtcacccg 15180
gggggaggaa aagcaagcgg aggccgaggc cgcggccgag gaaaagcaac tggcggcagc 15240
agcggcggcg gcggcgttgg ccgcggcgga ggctgagtct gaggggacca agcccgccaa 15300
ggagcccgtg attaagcccc tgaccgaaga tagcaagaag cgcagttaca acctgctcaa 15360
ggacagcacc aacaccgcgt accgcagctg gtacctggcc tacaactacg gcgacccgtc 15420
gacgggggtg cgctcctgga ccctgctgtg cacgccggac gtgacctgcg gctcggagca 15480
ggtgtactgg tcgctgcccg acatgatgca agaccccgtg accttccgct ccacgcggca 15540
ggtcagcaac ttcccggtgg tgggcgccga gctgctgccc gtgcactcca agagcttcta 15600
caacgaccag gccgtctact cccagctcat ccgccagttc acctctctga cccacgtgtt 15660
caatcgcttt cctgagaacc agattctggc gcgcccgccc gcccccacca tcaccaccgt 15720
cagtgaaaac gttcctgctc tcacagatca cgggacgcta ccgctgcgca acagcatcgg 15780
aggagtccag cgagtgaccg ttactgacgc cagacgccgc acctgcccct acgtttacaa 15840
ggccttgggc atagtctcgc cgcgcgtcct ttccagccgc actttttgag caacaccacc 15900
atcatgtcca tcctgatctc acccagcaat aactccggct ggggactgct gcgcgcgccc 15960
agcaagatgt tcggaggggc gaggaagcgt tccgagcagc accccgtgcg cgtgcgcggg 16020
cacttccgcg ccccctgggg agcgcacaaa cgcggccgcg cggggcgcac caccgtggac 16080
gacgccatcg actcggtggt ggagcaggcg cgcaactaca ggcccgcggt ctctaccgtg 16140
gacgcggcca tccagaccgt ggtgcggggc gcgcggcggt acgccaagct gaagagccgc 16200
cggaagcgcg tggcccgccg ccaccgccgc cgacccgggg ccgccgccaa acgcgccgcc 16260
gcggccctgc ttcgccgggc caagcgcacg ggccgccgcg ccgccatgag ggccgcgcgc 16320
cgcttggccg ccggcatcac cgccgccacc atggcccccc gtacccgaag acgcgcggcc 16380
gccgccgccg ccgccgccat cagtgacatg gccagcaggc gccggggcaa cgtgtactgg 16440
gtgcgcgact cggtgaccgg cacgcgcgtg cccgtgcgct tccgcccccc gcggacttga 16500
gatgatgtga aaaaacaaca ctgagtctcc tgctgttgtg tgtatcccag cggcggcggc 16560
gcgcgcagcg tcatgtccaa gcgcaaaatc aaagaagaga tgctccaggt cgtcgcgccg 16620
gagatctatg ggcccccgaa gaaggaagag caggattcga agccccgcaa gataaagcgg 16680
gtcaaaaaga aaaagaaaga tgatgacgat gccgatgggg aggtggagtt cctgcgcgcc 16740
acggcgccca ggcgcccggt gcagtggaag ggccggcgcg taaagcgcgt cctgcgcccc 16800
ggcaccgcgg tggtcttcac gcccggcgag cgctccaccc ggactttcaa gcgcgtctat 16860
gacgaggtgt acggcgacga agacctgctg gagcaggcca acgagcgctt cggagagttt 16920
gcttacggga agcgtcagcg ggcgctgggg aaggaggacc tgctggcgct gccgctggac 16980
cagggcaacc ccacccccag tctgaagccc gtgaccctgc agcaggtgct gccgagcagc 17040
gcaccctccg aggcgaagcg gggtctgaag cgcgagggcg gcgacctggc gcccaccgtg 17100
cagctcatgg tgcccaagcg gcagaggctg gaggatgtgc tggagaaaat gaaagtagac 17160
cccggtctgc agccggacat cagggtccgc cccatcaagc aggtggcgcc gggcctcggc 17220
gtgcagaccg tggacgtggt catccccacc ggcaactccc ccgccgccgc caccactacc 17280
gctgcctcca cggacatgga gacacagacc gatcccgccg cagccgcagc cgcagccgcc 17340
gccgcgacct cctcggcgga ggtgcagacg gacccctggc tgccgccggc gatgtcagct 17400
ccccgcgcgc gtcgcgggcg caggaagtac ggcgccgcca acgcgctcct gcccgagtac 17460
gccttgcatc cttccatcgc gcccaccccc ggctaccgag gctataccta ccgcccgcga 17520
agagccaagg gttccacccg ccgtccccgc cgacgcgccg ccgccaccac ccgccgccgc 17580
cgccgcagac gccagcccgc actggctcca gtctccgtga ggaaagtggc gcgcgacgga 17640
cacaccctgg tgctgcccag ggcgcgctac caccccagca tcgtttaaaa gcctgttgtg 17700
gttcttgcag atatggccct cacttgccgc ctccgtttcc cggtgccggg ataccgagga 17760
ggaagatcgc gccgcaggag gggtctggcc ggccgcggcc tgagcggagg cagccgccgc 17820
gcgcaccggc ggcgacgcgc caccagccga cgcatgcgcg gcggggtgct gcccctgtta 17880
atccccctga tcgccgcggc gatcggcgcc gtgcccggga tcgcctccgt ggccttgcaa 17940
gcgtcccaga ggcattgaca gacttgcaaa cttgcaaata tggaaaaaaa aaccccaata 18000
aaaaagtcta gactctcacg ctcgcttggt cctgtgacta ttttgtagaa tggaagacat 18060
caactttgcg tcgctggccc cgcgtcacgg ctcgcgcccg ttcctgggac actggaacga 18120
tatcggcacc agcaacatga gcggtggcgc cttcagttgg ggctctctgt ggagcggcat 18180
taaaagtatc gggtctgccg ttaaaaatta cggctcccgg gcctggaaca gcagcacggg 18240
ccagatgttg agagacaagt tgaaagagca gaacttccag cagaaggtgg tggagggcct 18300
ggcctccggc atcaacgggg tggtggacct ggccaaccag gccgtgcaga ataagatcaa 18360
cagcagactg gacccccggc cgccggtgga ggaggtgccg ccggcgctgg agacggtgtc 18420
ccccgatggg cgtggcgaga agcgcccgcg gcccgatagg gaagagacca ctctggtcac 18480
gcagaccgat gagccgcccc cgtatgagga ggccctgaag caaggtctgc ccaccacgcg 18540
gcccatcgcg cccatggcca ccggggtggt gggccgccac acccccgcca cgctggactt 18600
gcctccgccc gccgatgtgc cgcagcagca gaaggcggca cagccgggcc cgcccgcgac 18660
cgcctcccgt tcctccgccg gtcctctgcg ccgcgcggcc agcggccccc gcgggggggt 18720
cgcgaggcac ggcaactggc agagcacgct gaacagcatc gtgggtctgg gggtgcggtc 18780
cgtgaagcgc cgccgatgct actgaatagc ttagctaacg tgttgtatgt gtgtatgcgc 18840
cctatgtcgc cgccagagga gctgctgagt cgccgccgtt cgcgcgccca ccaccaccgc 18900
cactccgccc ctcaagatgg cgaccccatc gatgatgccg cagtggtcgt acatgcacat 18960
ctcgggccag gacgcctcgg agtacctgag ccccgggctg gtgcagttcg cccgcgccac 19020
cgagagctac ttcagcctga gtaacaagtt taggaacccc acggtggcgc ccacgcacga 19080
tgtgaccacc gaccggtctc agcgcctgac gctgcggttc attcccgtgg accgcgagga 19140
caccgcgtac tcgtacaagg cgcggttcac cctggccgtg ggcgacaacc gcgtgctgga 19200
catggcctcc acctactttg acatccgcgg ggtgctggac cggggtccca ctttcaagcc 19260
ctactctggc accgcctaca actccctggc ccccaagggc gctcccaact cctgcgagtg 19320
ggagcaagag gaaactcagg cagttgaaga agcagcagaa gaggaagaag aagatgctga 19380
cggtcaagct gaggaagagc aagcagctac caaaaagact catgtatatg ctcaggctcc 19440
cctttctggc gaaaaaatta gtaaagatgg tctgcaaata ggaacggacg ctacagctac 19500
agaacaaaaa cctatttatg cagaccctac attccagccc gaaccccaaa tcggggagtc 19560
ccagtggaat gaggcagatg ctacagtcgc cggcggtaga gtgctaaaga aatctactcc 19620
catgaaacca tgctatggtt cctatgcaag acccacaaat gctaatggag gtcagggtgt 19680
actaacggca aatgcccagg gacagctaga atctcaggtt gaaatgcaat tcttttcaac 19740
ttctgaaaac gcccgtaacg aggctaacaa cattcagccc aaattggtgc tgtatagtga 19800
ggatgtgcac atggagaccc cggatacgca cctttcttac aagcccgcaa aaagcgatga 19860
caattcaaaa atcatgctgg gtcagcagtc catgcccaac agacctaatt acatcggctt 19920
cagagacaac tttatcggcc tcatgtatta caatagcact ggcaacatgg gagtgcttgc 19980
aggtcaggcc tctcagttga atgcagtggt ggacttgcaa gacagaaaca cagaactgtc 20040
ctaccagctc ttgcttgatt ccatgggtga cagaaccaga tacttttcca tgtggaatca 20100
ggcagtggac agttatgacc cagatgttag aattattgaa aatcatggaa ctgaagacga 20160
gctccccaac tattgtttcc ctctgggtgg cataggggta actgacactt accaggctgt 20220
taaaaccaac aatggcaata acgggggcca ggtgacttgg acaaaagatg aaacttttgc 20280
agatcgcaat gaaatagggg tgggaaacaa tttcgctatg gagatcaacc tcagtgccaa 20340
cctgtggaga aacttcctgt actccaacgt ggcgctgtac ctaccagaca agcttaagta 20400
caacccctcc aatgtggaca tctctgacaa ccccaacacc tacgattaca tgaacaagcg 20460
agtggtggcc ccggggctgg tggactgcta catcaacctg ggcgcgcgct ggtcgctgga 20520
ctacatggac aacgtcaacc ccttcaacca ccaccgcaat gcgggcctgc gctaccgctc 20580
catgctcctg ggcaacgggc gctacgtgcc cttccacatc caggtgcccc agaagttctt 20640
tgccatcaag aacctcctcc tcctgccggg ctcctacacc tacgagtgga acttcaggaa 20700
ggatgtcaac atggtcctcc agagctctct gggtaacgat ctcagggtgg acggggccag 20760
catcaagttc gagagcatct gcctctacgc caccttcttc cccatggccc acaacacggc 20820
ctccacgctc gaggccatgc tcaggaacga caccaacgac cagtccttca atgactacct 20880
ctccgccgcc aacatgctct accccatacc cgccaacgcc accaacgtcc ccatctccat 20940
cccctcgcgc aactgggcgg ccttccgcgg ctgggccttc acccgcctca agaccaagga 21000
gaccccctcc ctgggctcgg gattcgaccc ctactacacc tactcgggct ccattcccta 21060
cctggacggc accttctacc tcaaccacac tttcaagaag gtctcggtca ccttcgactc 21120
ctcggtcagc tggccgggca acgaccgtct gctcaccccc aacgagttcg agatcaagcg 21180
ctcggtcgac ggggagggct acaacgtggc ccagtgcaac atgaccaagg actggttcct 21240
ggtccagatg ctggccaact acaacatcgg ctaccagggc ttctacatcc cagagagcta 21300
caaggacagg atgtactcct tcttcaggaa cttccagccc atgagccggc aggtggtgga 21360
ccagaccaag tacaaggact accaggaggt gggcatcatc caccagcaca acaactcggg 21420
cttcgtgggc tacctcgccc ccaccatgcg cgagggacag gcctaccccg ccaacttccc 21480
ctatccgctc ataggcaaga ccgcggtcga cagcatcacc cagaaaaagt tcctctgcga 21540
ccgcaccctc tggcgcatcc ccttctccag caacttcatg tccatgggtg cgctctcgga 21600
cctgggccag aacttgctct acgccaactc cgcccacgcc ctcgacatga ccttcgaggt 21660
cgaccccatg gacgagccca cccttctcta tgttctgttc gaagtctttg acgtggtccg 21720
ggtccaccag ccgcaccgcg gcgtcatcga gaccgtgtac ctgcgtacgc ccttctcggc 21780
cggcaacgcc accacctaaa gaagcaagcc gcagtcatcg ccgcctgcat gccgtcgggt 21840
tccaccgagc aagagctcag ggccatcgtc agagacctgg gatgcgggcc ctattttttg 21900
ggcaccttcg acaagcgctt ccctggcttt gtctccccac acaagctggc ctgcgccatc 21960
gtcaacacgg ccggccgcga gaccgggggc gtgcactggc tggccttcgc ctggaacccg 22020
cgctccaaaa catgcttcct ctttgacccc ttcggctttt cggaccagcg gctcaagcaa 22080
atctacgagt tcgagtacga gggcttgctg cgtcgcagcg ccatcgcctc ctcgcccgac 22140
cgctgcgtca ccctcgaaaa gtccacccag accgtgcagg ggcccgactc ggccgcctgc 22200
ggtctcttct gctgcatgtt tctgcacgcc tttgtgcact ggcctcagag tcccatggac 22260
cgcaacccca ccatgaactt gctgacgggg gtgcccaact ccatgctcca gagcccccag 22320
gtcgagccca ccctgcgccg caaccaggag cagctctaca gcttcctgga gcgccactcg 22380
ccttacttcc gccgccacag cgcacagatc aggagggcca cctccttctg ccacttgcaa 22440
gagatgcaag aagggtaata acgatgtaca cacttttttt ctcaataaat ggcatctttt 22500
tatttataca agctctctgg ggtattcatt tcccaccacc acccgccgtt gtcgccatct 22560
ggctctattt agaaatcgaa agggttctgc cgggagtcgc cgtgcgccac gggcagggac 22620
acgttgcgat actggtagcg ggtgccccac ttgaactcgg gcaccaccag gcgaggcagc 22680
tcggggaagt tttcgctcca caggctgcgg gtcagcacca gcgcgttcat caggtcgggc 22740
gccgagatct tgaagtcgca gttggggccg ccgccctgcg cgcgcgagtt gcggtacacc 22800
gggttgcagc actggaacac caacagcgcc gggtgcttca cgctggccag cacgctgcgg 22860
tcggagatca gctcggcgtc caggtcctcc gcgttgctca gcgcgaacgg ggtcatcttg 22920
ggcacttgcc gccccaggaa gggcgcgtgc cccggtttcg agttgcagtc gcagcgcagc 22980
gggatcagca ggtgcccgtg cccggactcg gcgttggggt acagcgcgcg catgaaggcc 23040
tgcatctggc ggaaggccat ctgggccttg gcgccctccg agaagaacat gccgcaggac 23100
ttgcccgaga actggtttgc ggggcagctg gcgtcgtgca ggcagcagcg cgcgtcggtg 23160
ttggcgatct gcaccacgtt gcgcccccac cggttcttca cgatcttggc cttggacgat 23220
tgctccttca gcgcgcgctg cccgttctcg ctggtcacat ccatctcgat cacatgttcc 23280
ttgttcacca tgctgctgcc gtgcagacac ttcagctcgc cctccgtctc ggtgcagcgg 23340
tgctgccaca gcgcgcagcc cgtgggctcg aaagacttgt aggtcacctc cgcgaaggac 23400
tgcaggtacc cctgcaaaaa gcggcccatc atggtcacga aggtcttgtt gctgctgaag 23460
gtcagctgca gcccgcggtg ctcctcgttc agccaggtct tgcacacggc cgccagcgcc 23520
tccacctggt cgggcagcat cttgaagttc accttcagct cattctccac gtggtacttg 23580
tccatcagcg tgcgcgccgc ctccatgccc ttctcccagg ccgacaccag cggcaggctc 23640
acggggttct tcaccatcac cgtggccgcc gcctccgccg cgctttcgct ttccgccccg 23700
ctgttctctt cctcttcctc ctcttcctcg ccgccgccca ctcgcagccc ccgcaccacg 23760
gggtcgtctt cctgcaggcg ctgcaccttg cgcttgccgt tgcgcccctg cttgatgcgc 23820
acgggcgggt tgctgaagcc caccatcacc agcgcggcct cttcttgctc gtcctcgctg 23880
tccagaatga cctccgggga gggggggttg gtcatcctca gtaccgaggc acgcttcttt 23940
ttcttcctgg gggcgttcgc cagctccgcg gctgcggccg ctgccgaggt cgaaggccga 24000
gggctgggcg tgcgcggcac cagcgcgtcc tgcgagccgt cctcgtcctc ctcggactcg 24060
agacggaggc gggcccgctt cttcgggggc gcgcggggcg gcggaggcgg cggcggcgac 24120
ggagacgggg acgagacatc gtccagggtg ggtggacggc gggccgcgcc gcgtccgcgc 24180
tcgggggtgg tctcgcgctg gtcctcttcc cgactggcca tctcccactg ctccttctcc 24240
tataggcaga aagagatcat ggagtctctc atgcgagtcg agaaggagga ggacagccta 24300
accgccccct ctgagccctc caccaccgcc gccaccaccg ccaatgccgc cgcggacgac 24360
gcgcccaccg agaccaccgc cagtaccacc ctccccagcg acgcaccccc gctcgagaat 24420
gaagtgctga tcgagcagga cccgggtttt gtgagcggag aggaggatga ggtggatgag 24480
aaggagaagg aggaggtcgc cgcctcagtg ccaaaagagg ataaaaagca agaccaggac 24540
gacgcagata aggatgagac agcagtcggg cgggggaacg gaagccatga tgctgatgac 24600
ggctacctag acgtgggaga cgacgtgctg cttaagcacc tgcaccgcca gtgcgtcatc 24660
gtctgcgacg cgctgcagga gcgctgcgaa gtgcccctgg acgtggcgga ggtcagccgc 24720
gcctacgagc ggcacctctt cgcgccgcac gtgcccccca agcgccggga gaacggcacc 24780
tgcgagccca acccgcgtct caacttctac ccggtcttcg cggtacccga ggtgctggcc 24840
acctaccaca tctttttcca aaactgcaag atccccctct cctgccgcgc caaccgcacc 24900
cgcgccgaca aaaccctgac cctgcggcag ggcgcccaca tacctgatat cgcctctctg 24960
gaggaagtgc ccaagatctt cgagggtctc ggtcgcgacg agaaacgggc ggcgaacgct 25020
ctgcacggag acagcgaaaa cgagagtcac tcgggggtgc tggtggagct cgagggcgac 25080
aacgcgcgcc tggccgtact caagcgcagc atagaggtca cccactttgc ctacccggcg 25140
ctcaacctgc cccccaaggt catgagtgtg gtcatgggcg agctcatcat gcgccgcgcc 25200
cagcccctgg ccgcggatgc aaacttgcaa gagtcctccg aggaaggcct gcccgcggtc 25260
agcgacgagc agctggcgcg ctggctggag acccgcgacc ccgcgcagct ggaggagcgg 25320
cgcaagctca tgatggccgc ggtgctggtc accgtggagc tcgagtgtct gcagcgcttc 25380
ttcgcggacc ccgagatgca gcgcaagctc gaggagaccc tgcactacac cttccgccag 25440
ggctacgtgc gccaggcctg caagatctcc aacgtggagc tctgcaacct ggtctcctac 25500
ctgggcatcc tgcacgagaa ccgcctcggg cagaacgtcc tgcactccac cctcaaaggg 25560
gaggcgcgcc gcgactacat ccgcgactgc gcctacctct tcctctgcta cacctggcag 25620
acggccatgg gggtctggca gcagtgcctg gaggagcgca acctcaagga gctggaaaag 25680
ctcctcaagc gcaccctcag ggacctctgg acgggcttca acgagcgctc ggtggccgcc 25740
gcgctggcgg acatcatctt tcccgagcgc ctgctcaaga ccctgcagca gggcctgccc 25800
gacttcacca gccagagcat gctgcagaac ttcaggactt tcatcctgga gcgctcgggc 25860
atcctgccgg ccacttgctg cgcgctgccc agcgacttcg tgcccatcaa gtacagggag 25920
tgcccgccgc cgctctgggg ccactgctac ctcttccagc tggccaacta cctcgcctac 25980
cactcggacc tcatggaaga cgtgagcggc gagggcctgc tcgagtgcca ctgccgctgc 26040
aacctctgca cgccccaccg ctctctagtc tgcaacccgc agctgctcag cgagagtcag 26100
attatcggta ccttcgagct gcagggtccc tcgcctgacg agaagtccgc ggctccaggg 26160
ctgaaactca ctccggggct gtggacttcc gcctacctac gcaaatttgt acctgaggac 26220
taccacgccc acgagatcag gttctacgaa gaccaatccc gcccgcccaa ggcggagctc 26280
accgcctgcg tcatcaccca ggggcacatc ctgggccaat tgcaagccat caacaaagcc 26340
cgccgagagt tcttgctgaa aaagggtcgg ggggtgtacc tggaccccca gtccggcgag 26400
gagctaaacc cgctaccccc gccgccgccc cagcagcggg accttgcttc ccaggatggc 26460
acccagaaag aagcagcagc cgccgccgcc gccgcagcca tacatgcttc tggaggaaga 26520
ggaggaggac tgggacagtc aggcagagga ggtttcggac gaggagcagg aggagatgat 26580
ggaagactgg gaggaggaca gcagcctaga cgaggaagct tcagaggccg aagaggtggc 26640
agacgcaaca ccatcgccct cggtcgcagc cccctcgccg gggcccctga aatcctccga 26700
acccagcacc agcgctataa cctccgctcc tccggcgccg gcgccacccg cccgcagacc 26760
caaccgtaga tgggacacca caggaaccgg ggtcggtaag tccaagtgcc cgccgccgcc 26820
accgcagcag cagcagcagc agcgccaggg ctaccgctcg tggcgcgggc acaagaacgc 26880
catagtcgcc tgcttgcaag actgcggggg caacatctct ttcgcccgcc gcttcctgct 26940
attccaccac ggggtcgcct ttccccgcaa tgtcctgcat tactaccgtc atctctacag 27000
cccctactgc agcggcgacc cagaggcggc agcggcagcc acagcggcga ccaccaccta 27060
ggaagatatc ctccgcgggc aagacagcgg cagcagcggc caggagaccc gcggcagcag 27120
cggcgggagc ggtgggcgca ctgcgcctct cgcccaacga acccctctcg acccgggagc 27180
tcagacacag gatcttcccc actttgtatg ccatcttcca acagagcaga ggccaggagc 27240
aggagctgaa aataaaaaac agatctctgc gctccctcac ccgcagctgt ctgtatcaca 27300
aaagcgaaga tcagcttcgg cgcacgctgg aggacgcgga ggcactcttc agcaaatact 27360
gcgcgctcac tcttaaagac tagctccgcg cccttctcga atttaggcgg gagaaaacta 27420
cgtcatcgcc ggccgccgcc cagcccgccc agccgagatg agcaaagaga ttcccacgcc 27480
atacatgtgg agctaccagc cgcagatggg actcgcggcg ggagcggccc aggactactc 27540
cacccgcatg aactacatga gcgcgggacc ccacatgatc tcacaggtca acgggatccg 27600
cgcccagcga aaccaaatac tgctggaaca ggcggccatc accgccacgc cccgccataa 27660
tctcaacccc cgaaattggc ccgccgccct cgtgtaccag gaaaccccct ccgccaccac 27720
cgtactactt ccgcgtgacg cccaggccga agtccagatg actaactcag gggcgcagct 27780
cgcgggcggc tttcgtcacg gggcgcggcc gctccgacca ggtataagac acctgatgat 27840
cagaggccga ggtatccagc tcaacgacga gtcggtgagc tcttcgctcg gtctccgtcc 27900
ggacggaact ttccagctcg ccggatccgg ccgctcttcg ttcacgcccc gccaggcgta 27960
cctgactctg cagacctcgt cctcggagcc ccgctccggc ggcatcggaa ccctccagtt 28020
cgtggaggag ttcgtgccct cggtctactt caaccccttc tcgggacctc ccggacgcta 28080
ccccgaccag ttcattccga actttgacgc ggtgaaggac tcggcggacg gctacgactg 28140
aatgtcaggt gtcgaggcag agcagcttcg cctgagacac ctcgagcact gccgccgcca 28200
caagtgcttc gcccgcggtt ctggtgagtt ctgctacttt cagctacccg aggagcatac 28260
cgaggggccg gcgcacggcg tccgcctgac cacccagggc gaggttacct gttccctcat 28320
ccgggagttt accctccgtc ccctgctagt ggagcgggag cggggtccct gtgtcctaac 28380
tatcgcctgc aactgcccta accctggatt acatcaagat ctttgctgtc atctctgtgc 28440
tgagtttaat aaacgctgag atcagaatct actggggctc ctgtcgccat cctgtgaacg 28500
ccaccgtctt cacccacccc gaccaggccc aggcgaacct cacctgcggt ctgcatcgga 28560
gggccaagaa gtacctcacc tggtacttca acggcacccc ctttgtggtt tacaacagct 28620
tcgacgggga cggagtctcc ctgaaagacc agctctccgg tctcagctac tccatccaca 28680
agaacaccac cctccaactc ttccctccct acctgccggg aacctacgag tgcgtcaccg 28740
gccgctgcac ccacctcacc cgcctgatcg taaaccagag ctttccggga acagataact 28800
ccctcttccc cagaacagga ggtgagctca ggaaactccc cggggaccag ggcggagacg 28860
taccttcgac ccttgtgggg ttaggatttt ttattaccgg gttgctggct cttttaatca 28920
aagtttcctt gagatttgtt ctttccttct acgtgtatga acacctcaac ctccaataac 28980
tctacccttt cttcggaatc aggtgacttc tctgaaatcg ggcttggtgt gctgcttact 29040
ctgttgattt ttttccttat catactcagc cttctgtgcc tcaggctcgc cgcctgctgc 29100
gcacacatct atatctactg ctggttgctc aagtgcaggg gtcgccaccc aagatgaaca 29160
ggtacatggt cctatcgatc ctaggcctgc tggccctggc ggcctgcagc gccgccaaaa 29220
aagagattac ctttgaggag cccgcttgca atgtaacttt caagcccgag ggtgaccaat 29280
gcaccaccct cgtcaaatgc gttaccaatc atgagaggct gcgcatcgac tacaaaaaca 29340
aaactggcca gtttgcggtc tatagtgtgt ttacgcccgg agacccctct aactactctg 29400
tcaccgtctt ccagggcgga cagtctaaga tattcaatta cactttccct ttttatgagt 29460
tatgcgatgc ggtcatgtac atgtcaaaac agtacaacct gtggcctccc tctccccagg 29520
cgtgtgtgga aaatactggg tcttactgct gtatggcttt cgcaatcact acgctcgctc 29580
taatctgcac ggtgctatac ataaaattca ggcagaggcg aatctttatc gatgaaaaga 29640
aaatgccttg atcgctaaca ccggctttct atctgcagaa tgaatgcaat cacctcccta 29700
ctaatcacca ccaccctcct tgcgattgcc catgggttga cacgaatcga agtgccagtg 29760
gggtccaatg tcaccatggt gggccccgcc ggcaattcca ccctcatgtg ggaaaaattt 29820
gtccgcaatc aatgggttca tttctgctct aaccgaatca gtatcaagcc cagagccatc 29880
tgcgatgggc aaaatctaac tctgatcaat gtgcaaatga tggatgctgg gtactattac 29940
gggcagcggg gagaaatcat taattactgg cgaccccaca aggactacat gctgcatgta 30000
gtcgaggcac ttcccactac cacccccact accacctctc ccaccaccac caccactact 30060
actactacta ctactactac tactactacc actaccgctg cccgccatac ccgcaaaagc 30120
accatgatta gcacaaagcc ccctcgtgct cactcccacg ccggcgggcc catcggtgcg 30180
acctcagaaa ccaccgagct ttgcttctgc caatgcacta acgccagcgc tcatgaactg 30240
ttcgacctgg agaatgagga tgtccagcag agctccgctt gcctgaccca ggaggctgtg 30300
gagcccgttg ccctgaagca gatcggtgat tcaataattg actcttcttc ttttgccact 30360
cccgaatacc ctcccgattc tactttccac atcacgggta ccaaagaccc taacctctct 30420
ttctacctga tgctgctgct ctgtatctct gtggtctctt ccgcgctgat gttactgggg 30480
atgttctgct gcctgatctg ccgcagaaag agaaaagctc gctctcaggg ccaaccactg 30540
atgcccttcc cctacccccc ggattttgca gataacaaga tatgagctcg ctgctgacac 30600
taaccgcttt actagcctgc gctctaaccc ttgtcgcttg cgactcgaga ttccacaatg 30660
tcacagctgt ggcaggagaa aatgttactt tcaactccac ggccgatacc cagtggtcgt 30720
ggagtggctc aggtagctac ttaactatct gcaatagctc cacttccccc ggcatatccc 30780
caaccaagta ccaatgcaat gccagcctgt tcaccctcat caacgcttcc accctggaca 30840
atggactcta tgtaggctat gtaccctttg gtgggcaagg aaagacccac gcttacaacc 30900
tggaagttcg ccagcccaga accactaccc aagcttctcc caccaccacc accaccacca 30960
ccatcaccag cagcagcagc agcagcagcc acagcagcag cagcagatta ttgactttgg 31020
ttttggccag ctcatctgcc gctacccagg ccatctacag ctctgtgccc gaaaccactc 31080
agatccaccg cccagaaacg accaccgcca ccaccctaca cacctccagc gatcagatgc 31140
cgaccaacat cacccccttg gctcttcaaa tgggacttac aagccccact ccaaaaccag 31200
tggatgcggc cgaggtctcc gccctcgtca atgactgggc ggggctggga atgtggtggt 31260
tcgccatagg catgatggcg ctctgcctgc ttctgctctg gctcatctgc tgcctccacc 31320
gcaggcgagc cagacccccc atctatagac ccatcattgt cctgaacccc gataatgatg 31380
ggatccatag attggatggc ctgaaaaacc tacttttttc ttttacagta tgataaattg 31440
agacatgcct cgcattttct tgtacatgtt ccttctccca ccttttctgg ggtgttctac 31500
gctggccgct gtgtctcacc tggaggtaga ctgcctctca cccttcactg tctacctgct 31560
ttacggattg gtcaccctca ctctcatctg cagcctaatc acagtaatca tcgccttcat 31620
ccagtgcatt gattacatct gtgtgcgcct cgcatacttc agacaccacc cgcagtaccg 31680
agacaggaac attgcccaac ttctaagact gctctaatca tgcataagac tgtgatctgc 31740
cttctgatcc tctgcatcct gcccaccctc acctcctgcc agtacaccac aaaatctccg 31800
cgcaaaagac atgcctcctg ccgcttcacc caactgtgga atatacccaa atgctacaac 31860
gaaaagagcg agctctccga agcttggctg tatggggtca tctgtgtctt agttttctgc 31920
agcactgtct ttgccctcat aatctacccc tactttgatt tgggatggaa cgcgatcgat 31980
gccatgaatt accccacctt tcccgcaccc gagataattc cactgcgaca agttgtaccc 32040
gttgtcgtta atcaacgccc cccatcccct acgcccactg aaatcagcta ctttaaccta 32100
acaggcggag atgactgacg ccctagatct agaaatggac ggcatcagta ccgagcagcg 32160
tctcctagag aggcgcaggc aggcggctga gcaagagcgc ctcaatcagg agctccgaga 32220
tctcgttaac ctgcaccagt gcaaaagagg catcttttgt ctggtaaagc aggccaaagt 32280
cacctacgag aagaccggca acagccaccg cctcagttac aaattgccca cccagcgcca 32340
gaagctggtg ctcatggtgg gtgagaatcc catcaccgtc acccagcact cggtagagac 32400
cgaggggtgt ctgcactccc cctgtcgggg tccagaagac ctctgcaccc tggtaaagac 32460
cctgtgcggt ctcagagatt tagtcccctt taactaatca aacactggaa tcaataaaaa 32520
gaatcactta cttaaaatca gacagcaggt ctctgtccag tttattcagc agcacctcct 32580
tcccctcctc ccaactctgg tactccaaac gccttctggc ggcaaacttc ctccacaccc 32640
tgaagggaat gtcagattct tgctcctgtc cctccgcacc cactatcttc atgttgttgc 32700
agatgaagcg caccaaaacg tctgacgaga gcttcaaccc cgtgtacccc tatgacacgg 32760
aaagcggccc tccctccgtc cctttcctca cccctccctt cgtgtctccc gatggattcc 32820
aagaaagtcc ccccggggtc ctgtctctga acctggccga gcccctggtc acttcccacg 32880
gcatgctcgc cctgaaaatg ggaagtggcc tctccctgga cgacgctggc aacctcacct 32940
ctcaagatat caccaccgct agccctcccc tcaaaaaaac caagaccaac ctcagcctag 33000
aaacctcatc ccccctaact gtgagcacct caggcgccct caccgtagca gccgccgctc 33060
ccctggcggt ggccggcacc tccctcacca tgcaatcaga ggcccccctg acagtacagg 33120
atgcaaaact caccctggcc accaaaggcc ccctgaccgt gtctgaaggc aaactggcct 33180
tgcaaacatc ggccccgctg acggccgctg acagcagcac cctcacagtc agtgccacac 33240
caccccttag cacaagcaat ggcagcttgg gtattgacat gcaagccccc atttacacca 33300
ccaatggaaa actaggactt aactttggcg ctcccctgca tgtggtagac agcctaaatg 33360
cactgactgt agttactggc caaggtctta cgataaacgg aacagcccta caaactagag 33420
tctcaggtgc cctcaactat gacacatcag gaaacctaga attgagagct gcagggggta 33480
tgcgagttga tgcaaatggt caacttatcc ttgatgtagc ttacccattt gatgcacaaa 33540
acaatctcag ccttaggctt ggacagggac ccctgtttgt taactctgcc cacaacttgg 33600
atgttaacta caacagaggc ctctacctgt tcacatctgg aaataccaaa aagctagaag 33660
ttaatatcaa aacagccaag ggtctcattt atgatgacac tgctatagca atcaatgcgg 33720
gtgatgggct acagtttgac tcaggctcag atacaaatcc attaaaaact aaacttggat 33780
taggactgga ttatgactcc agcagagcca taattgctaa actgggaact ggcctaagct 33840
ttgacaacac aggtgccatc acagtaggca acaaaaatga tgacaagctt accttgtgga 33900
ccacaccaga cccatcccct aactgtagaa tctattcaga gaaagatgct aaattcacac 33960
ttgttttgac taaatgcggc agtcaggtgt tggccagcgt ttctgtttta tctgtaaaag 34020
gtagccttgc gcccatcagt ggcacagtaa ctagtgctca gattgtcctc agatttgatg 34080
aaaatggagt tctactaagc aattcttccc ttgaccctca atactggaac tacagaaaag 34140
gtgaccttac agagggcact gcatatacca acgcagtggg atttatgccc aacctcacag 34200
catacccaaa aacacagagc caaactgcta aaagcaacat tgtaagtcag gtttacttga 34260
atggggacaa atccaaaccc atgaccctca ccattaccct caatggaact aatgaaacag 34320
gagatgccac agtaagcact tactccatgt cattctcatg gaactggaat ggaagtaatt 34380
acattaatga aacgttccaa accaactcct tcaccttctc ctacatcgcc caagaataaa 34440
aagcatgacg ctgttgattt gattcaatgt gtttctgttt tattttcaag cacaacaaaa 34500
tcattcaagt cattcttcca tcttagctta atagacacag tagcttaata gacccagtag 34560
tgcaaagccc cattctagct tataactagt ggagaagtac tcgcctacat gggggtagag 34620
tcataatcgt gcatcaggat agggcggtgg tgctgcagca gcgcgcgaat aaactgctgc 34680
cgccgccgct ccgtcctgca ggaatacaac atggcagtgg tctcctcagc gatgattcgc 34740
accgcccgca gcataaggcg ccttgtcctc cgggcacagc agcgcaccct gatctcactt 34800
aaatcagcac agtaactgca gcacagcacc acaatattgt tcaaaatccc acagtgcaag 34860
gcgctgtatc caaagctcat ggcggggacc acagaaccca cgtggccatc ataccacaag 34920
cgcaggtaga ttaagtggcg acccctcata aacacgctgg acataaacat tacctctttt 34980
ggcatgttgt aattcaccac ctcccggtac catataaacc tctgattaaa catggcgcca 35040
tccaccacca tcctaaacca gctggccaaa acctgcccgc cggctataca ctgcagggaa 35100
ccgggactgg aacaatgaca gtggagagcc caggactcgt aaccatggat catcatgctc 35160
gtcatgatat caatgttggc acaacacagg cacacgtgca tacacttcct caggattaca 35220
agctcctccc gcgttagaac catatcccag ggaacaaccc attcctgaat cagcgtaaat 35280
cccacactgc agggaagacc tcgcacgtaa ctcacgttgt gcattgtcaa agtgttacat 35340
tcgggcagca gcggatgatc ctccagtatg gtagcgcggg tttctgtctc aaaaggaggt 35400
agacgatccc tactgtacgg agtgcgccga gacaaccgag atcgtgttgg tcgtagtgtc 35460
atgccaaatg gaacgccgga cgtagtcata tttcctgaag tcttagatct ctcaacgcag 35520
caccagcacc aacacttcgc agtgtaaaag gccaagtgcc gagagagtat atataggaat 35580
aaaaagtgac gtaaacgggc aaagtccaaa aaacgcccag aaaaaccgca cgcgaaccta 35640
cgccccgaaa cgaaagccaa aaaacactag acactccctt ccggcgtcaa cttccgcttt 35700
cccacgctac gtcacttgcc ccagtcaaac aaactacata tcccgaactt ccaagtcgcc 35760
acgcccaaaa caccgcctac acctccccgc ccgccggccc gcccccaaac ccgcctcccg 35820
ccccgcgccc cgccccgcgc cgcccatctc attatcatat tggcttcaat ccaaaataag 35880
gtatattatt gatgatggtt taaacggatc caattcttga agacgaaagg gcctcgtgat 35940
acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac 36000
ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat 36060
gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag 36120
tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 36180
tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 36240
acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 36300
cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 36360
ccgtgttgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 36420
ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 36480
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 36540
cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 36600
tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 36660
gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 36720
ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg 36780
ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc 36840
tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta 36900
cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc 36960
ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga 37020
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 37080
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 37140
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 37200
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 37260
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 37320
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 37380
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 37440
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 37500
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 37560
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 37620
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 37680
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 37740
tttttacggt tcctggcctt ttgctggcct tgaagctgtc cctgatggtc gtcatctacc 37800
tgcctggaca gcatggcctg caacgcgggc atcccgatgc cgccggaagc gagaagaatc 37860
ataatgggga aggccatcca gcctcgcgtc gcagatccga attcgtttaa ac 37912
<210> 8
<211> 43428
<212> DNA
<213> Simian adenovirus
<400> 8
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccgggccc cccctcgagg tcgacggtat cgataagctt cacgctgccg 1380
caagcactca gggcgcaagg gctgctaaag gaagcggaac acgtagaaag ccagtccgca 1440
gaaacggtgc tgaccccgga tgaatgtcag ctactgggct atctggacaa gggaaaacgc 1500
aagcgcaaag agaaagcagg tagcttgcag tgggcttaca tggcgatagc tagactgggc 1560
ggttttatgg acagcaagcg aaccggaatt gccagctggg gcgccctctg gtaaggttgg 1620
gaagccctgc aaagtaaact ggatggcttt cttgccgcca aggatctgat ggcgcagggg 1680
atcaagatct aaccaggagc tatttaatgg caacagttaa ccagctggta cgcaaaccac 1740
gtgctcgcaa agttgcgaaa agcaacgtgc ctgcgctgga agcatgcccg caaaaacgtg 1800
gcgtatgtac tcgtgtatat actaccactc ctaaaaaacc gaactccgcg ctgcgtaaag 1860
tatgccgtgt tcgtctgact aacggtttcg aagtgacttc ctacatcggt ggtgaaggtc 1920
acaacctgca ggagcactcc gtgatcctga tccgtggcgg tcgtgttaaa gacctcccgg 1980
gtgttcgtta ccacaccgta cgtggtgcgc ttgactgctc cggcgttaaa gaccgtaagc 2040
aggctcgttc caagtatggc gtgaagcgtc ctaaggctta atggtagatc tgatcaagag 2100
acaggatgac ggtcgtttcg catgcttgaa caagatggat tgcacgcagg ttctccggcc 2160
gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 2220
gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 2280
tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg 2340
ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 2400
ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 2460
tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 2520
gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 2580
gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 2640
ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 2700
ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 2760
gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 2820
ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 2880
atcgccttct atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga 2940
ccgaccaagc gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg 3000
aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg 3060
atctcatgct ggagttcttc gcccaccccg ggctcgatcc cctcgggggg aatcagaatt 3120
cagtcgacag cggccgcgat ctgctgtgcc ttctagttgc cagccatctg ttgtttgccc 3180
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 3240
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 3300
gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 3360
ctctatggcc gatcagcgat cgctgaggtg ggtgagtggg cgtggcctgg ggtggtcatg 3420
aaaatatata agttgggggt cttagggtct ctttatttgt gttgcagaga ccgccggagc 3480
catgagcggg agcagcagca gcagcagtag cagcagcgcc ttggatggca gcatcgtgag 3540
cccttatttg acgacgcgga tgccccactg ggccggggtg cgtcagaatg tgatgggctc 3600
cagcatcgac ggccgacccg tcctgcccgc aaattccgcc acgctgacct atgcgaccgt 3660
cgcggggacg ccgttggacg ccaccgccgc cgccgccgcc accgcagccg cctcggccgt 3720
gcgcagcctg gccacggact ttgcattcct gggaccactg gcgacagggg ctacttctcg 3780
ggccgctgct gccgccgttc gcgatgacaa gctgaccgcc ctgctggcgc agttggatgc 3840
gcttactcgg gaactgggtg acctttctca gcaggtcatg gccctgcgcc agcaggtctc 3900
ctccctgcaa gctggcggga atgcttctcc cacaaatgcc gtttaagata aataaaacca 3960
gactctgttt ggattaaaga aaagtagcaa gtgcattgct ctctttattt cataattttc 4020
cgcgcgcgat aggccctaga ccagcgttct cggtcgttga gggtgcggtg tatcttctcc 4080
aggacgtggt agaggtggct ctggacgttg agatacatgg gcatgagccc gtcccggggg 4140
tggaggtagc accactgcag agcttcatgc tccggggtgg tgttgtagat gatccagtcg 4200
tagcaggagc gctgggcatg gtgcctaaaa atgtccttca gcagcaggcc gatggccagg 4260
gggaggccct tggtgtaagt gtttacaaaa cggttaagtt gggaagggtg cattcgggga 4320
gagatgatgt gcatcttgga ctgtattttt agattggcga tgtttccgcc cagatccctt 4380
ctgggattca tgttgtgcag gaccaccagt acagtgtatc cggtgcactt ggggaatttg 4440
tcatgcagct tagagggaaa agcgtggaag aacttggaga cgcctttgtg gcctcccaga 4500
ttttccatgc attcgtccat gatgatggca atgggcccgc gggaggcagc ttgggcaaag 4560
atatttctgg ggtcgctgac gtcgtagttg tgttccaggg tgaggtcgtc ataggccatt 4620
tttacaaagc gcgggcggag ggtgcccgac tgggggatga tggtcccctc tggccctggg 4680
gcgtagttgc cctcgcagat ctgcatttcc caggccttaa tctcggaggg gggaatcata 4740
tccacctgcg gggcgatgaa gaaaacggtt tccggagccg gggagattaa ctgggatgag 4800
agcaggtttc taagcagctg tgattttcca caaccggtgg gcccataaat aacacctata 4860
accggttgca gctggtagtt tagagagctg cagctgccgt cgtcccggag gaggggggcc 4920
acctcgttga gcatgtccct gacgcgcatg ttctccccga ccagatccgc cagaaggcgc 4980
tcgccgccca gggacagcag ctcttgcaag gaagcaaagt ttttcagcgg cttgaggccg 5040
tccgccgtgg gcatgttttt cagggtctgg ctcagcagct ccaggcggtc ccagagctcg 5100
gtgacgtgct ctacggcatc tctatccagc atatctcctc gtttcgcggg ttggggcgac 5160
tttcgctgta gggcaccaag cggtggtcgt ccagcggggc cagagtcatg tccttccatg 5220
ggcgcagggt cctcgtcagg gtggtctggg tcacggtgaa ggggtgcgct ccgggctgag 5280
cgcttgccaa ggtgcgcttg aggctggttc tgctggtgct gaagcgctgc cggtcttcgc 5340
cctgcgcgtc ggccaggtag catttgacca tggtgtcata gtccagcccc tccgcggcgt 5400
gtcccttggc gcgcagcttg cccttggagg tggcgccgca cgaggggcag agcaggctct 5460
tgagcgcgta gagcttgggg gcgaggaaga ccgattcggg ggagtaggcg tccgcgccgc 5520
agaccccgca cacggtctcg cactccacca gccaggtgag ctcggggcgc gccgggtcaa 5580
aaaccaggtt tcccccatgc tttttgatgc gtttcttacc tcgggtctcc atgaggtggt 5640
gtccccgctc ggtgacgaag aggctgtccg tgtctccgta gaccgacttg aggggtcttt 5700
tctccagggg ggtccctcgg tcttcctcgt agaggaactc ggaccactct gagacgaagg 5760
cccgcgtcca ggccaggacg aaggaggcta tgtgggaggg gtagcggtcg ttgtccacta 5820
gggggtccac cttctccaag gtgtgaagac acatgtcgcc ttcctcggcg tccaggaagg 5880
tgattggctt gtaggtgtag gccacgtgac cgggggttcc tgacgggggg gtataaaagg 5940
gggtgggggc gcgctcgtcg tcactctctt ccgcatcgct gtctgcgagg gccagctgct 6000
ggggtgagta ttccctctcg aaggcgggca tgacctccgc gctgaggttg tcagtttcca 6060
aaaacgagga ggatttgatg ttcacctgtc ccgaggtgat acctttgagg gtacccgcgt 6120
ccatctggtc agaaaacacg atctttttat tgtccagctt ggtggcgaac gacccgtaga 6180
gggcgttgga gagcagcttg gcgatggagc gcagggtctg gttcttgtcc ctgtcggcgc 6240
gctccttggc cgcgatgttg agctgcacgt actcgcgcgc gacgcagcgc cactcgggga 6300
agacggtggt gcgctcgtcg ggcaccaggc gcacgcgcca gccgcggttg tgcagggtga 6360
ccaggtccac gctggtggcg acctcgccgc gcaggcgctc gttggtccag cagagacggc 6420
cgcccttgcg cgagcagaag gggggcaggg ggtcgagctg ggtctcgtcc ggggggtccg 6480
cgtccacggt gaaaaccccg gggcgcaggc gcgcgtcgaa gtagtctatc ttgcaacctt 6540
gcatgtccag cgcctgctgc cagtcgcggg cggcgagcgc gcgctcgtag gggttgagcg 6600
gcgggcccca gggcatgggg tgggtgagtg cggaggcgta catgccgcag atgtcataga 6660
cgtagagggg ctcccgcagg accccgatgt aggtggggta gcagcggccg ccgcggatgc 6720
tggcgcgcac gtagtcatac agctcgtgcg agggggcgag gaggtcgggg cccaggttgg 6780
tgcgggcggg gcgctccgcg cggaagacga tctgcctgaa gatggcatgc gagttggaag 6840
agatggtggg gcgctggaag acgttgaagc tggcgtcctg caggccgacg gcgtcgcgca 6900
cgaaggaggc gtaggagtcg cgcagcttgt gtaccagctc ggcggtgacc tgcacgtcga 6960
gcgcgcagta gtcgagggtc tcgcggatga tgtcatattt agcctgcccc ttctttttcc 7020
acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcgggaaac 7080
cgtccggttc cgaacggtaa gagcctagca tgtagaactg gttgacggcc tggtaggcgc 7140
agcagccctt ctccacgggg agggcgtagg cctgcgcggc cttgcggagc gaggtgtggg 7200
tcagggcgaa ggtgtccctg accatgactt tgaggtactg gtgcttgaag tcggagtcgt 7260
cgcagccgcc ccgctcccag agcgagaagt cggtgcgctt cttggagcgg gggttgggca 7320
gagcgaaggt gacatcgttg aagaggattt tgcccgcgcg gggcatgaag ttgcgggtga 7380
tgcggaaggg ccccggcact tcagagcggt tgttgatgac ctgggcggcg agcacgatct 7440
cgtcgaagcc gttgatgttg tggcccacga tgtagagttc caggaagcgg ggccggccct 7500
ttacggtggg cagcttcttt agctcttcgt aggtgagctc ctcgggcgag gcgaggccgt 7560
gctcggccag ggcccagtcc gcgaggtgcg ggttgtctct gaggaaggac ttccagaggt 7620
cgcgggccag gagggtctgc aggcggtctc tgaaggtcct gaactggcgg cccacggcca 7680
ttttttcggg ggtgatgcag tagaaggtga gggggtcttg ctgccagcgg tcccagtcga 7740
gctgcagggc gaggtcgcgc gcggcggtga ccaggcgctc gtcgcccccg aatttcatga 7800
ccagcatgaa gggcacgagc tgctttccga aggcccccat ccaagtgtag gtctctacat 7860
cgtaggtgac aaagaggcgc tccgtgcgag gatgcgagcc gatcgggaag aactggatct 7920
cccgccacca gttggaggag tggctgttga tgtggtggaa gtagaagtcc cgtcgccggg 7980
ccgaacactc gtgctggctt ttgtaaaagc gagcgcagta ctggcagcgc tgcacgggct 8040
gtacctcatg cacgagatgc acctttcgcc cgcgcacgag gaagccgagg ggaaatctga 8100
gccccccgcc tggctcgcgg catggctggt tctcttctac tttggatgcg tgtccgtctc 8160
cgtctggctc ctcgaggggt gttacggtgg agcggaccac cacgccgcgc gagccgcagg 8220
tccagatatc ggcgcgcggc ggtcggagtt tgatgacgac atcgcgcagc tgggagctgt 8280
ccatggtctg gagctcccgc ggcggcggca ggtcagccgg gagttcttgc aggttcacct 8340
cgcagagtcg ggccagggcg cggggcaggt ctaggtggta cctgatctct aggggcgtgt 8400
tggtggcggc gtcgatggct tgcaggagcc cgcagccccg gggggcgacg acggtgcccc 8460
gcggggtggt ggtggtggtg gcggtgcagc tcagaagcgg tgccgcgggc gggcccccgg 8520
aggtaggggg ggctccggtc ccgcgggcag gggcggcagc ggcacgtcgg cgtggagcgc 8580
gggcaggagt tggtgctgtg cccggaggtt gctggcgaag gcgacgacgc ggcggttgat 8640
ctcctggatc tggcgcctct gcgtgaagac gacgggcccg gtgagcttga acctgaaaga 8700
gagttcgaca gaatcaatct cggtgtcatt gaccgcggcc tggcgcagga tctcctgcac 8760
gtctcccgag ttgtcttggt aggcgatctc ggccatgaac tgctcgatct cttcctcctg 8820
gaggtctccg cgtccggcgc gttccacggt ggccgccagg tcgttggaga tgcgccccat 8880
gagctgcgag aaggcgttga gtccgccctc gttccagact cggctgtaga ccacgccccc 8940
ctggtcatcg cgggcgcgca tgaccacctg cgcgaggttg agctccacgt gccgcgcgaa 9000
gacggcgtag ttgcgcagac gctggaagag gtagttgagg gtggtggcgg tgtgctcggc 9060
cacgaagaag ttcatgaccc agcggcgcaa cgtggattcg ttgatgtccc ccaaggcctc 9120
cagccgttcc atggcctcgt agaagtccac ggcgaagttg aaaaactggg agttgcgcgc 9180
cgacacggtc aactcctcct ccagaagacg gatgagctcg gcgacggtgt cgcgcacctc 9240
gcgctcgaag gctatgggga tctcttcctc cgctagcatc accacctcct cctcttcctc 9300
ctcttctggc acttccatga tggcttcctc ctcttcgggg ggtggcggcg gcggcggtgg 9360
gggagggggc gctctgcgcc ggcggcggcg caccgggagg cggtccacga agcgcgcgat 9420
catctccccg cggcggcggc gcatggtctc ggtgacggcg cggccgttct cccgggggcg 9480
cagttggaag acgccgccgg acatctggtg ctggggcggg tggccgtgag gcagcgagac 9540
ggcgctgacg atgcatctca acaattgctg cgtaggtacg ccgccgaggg acctgaggga 9600
gtccatatcc accggatccg aaaacctttc gaggaaggcg tctaaccagt cgcagtcgca 9660
aggtaggctg agcaccgtgg cgggcggcgg ggggtggggg gagtgtctgg cggaggtgct 9720
gctgatgatg taattgaagt aggcggactt gacacggcgg atggtcgaca ggagcaccat 9780
gtccttgggt ccggcctgct ggatgcggag gcggtcggct atgccccagg cttcgttctg 9840
gcatcggcgc aggtccttgt agtagtcttg catgagcctt tccaccggca cctcttctcc 9900
ttcctcttct gcttcttcca tgtctgcttc ggccctgggg cggcgccgcg cccccctgcc 9960
ccccatgcgc gtgaccccga accccctgag cggttggagc agggccaggt cggcgacgac 10020
gcgctcggcc aggatggcct gctgcacctg cgtgagggtg gtttggaagt catccaagtc 10080
cacgaagcgg tggtaggcgc ccgtgttgat ggtgtaggtg cagttggcca tgacggacca 10140
gttgacggtc tggtggcccg gttgcgacat ctcggtgtac ctgagtcgcg agtaggcgcg 10200
ggagtcgaag acgtagtcgt tgcaagtccg caccaggtac tggtagccca ccaggaagtg 10260
cggcggcggc tggcggtaga ggggccagcg cagggtggcg ggggctccgg gggccaggtc 10320
ttccagcatg aggcggtggt aggcgtagat gtacctggac atccaggtga tacccgcggc 10380
ggtggtggag gcgcgcggga agtcgcgcac ccggttccag atgttgcgca ggggcagaaa 10440
gtgctccatg gtaggcgtgc tctgtccagt cagacgcgcg cagtcgttga tactctagac 10500
cagggaaaac gaaagccggt cagcgggcac tcttccgtgg tctggtgaat agatcgcaag 10560
ggtatcatgg cggagggcct cggttcgagc cccgggtccg ggccggacgg tccgccatga 10620
tccacgcggt taccgcccgc gtgtcgaacc caggtgtgcg acgtcagaca acggtggagt 10680
gttccttttg gcgtttttct ggccgggcgc cggcgccgcg taagagacta agccgcgaaa 10740
gcgaaagcag taagtggctc gctccccgta gccggaggga tccttgctaa gggttgcgtt 10800
gcggcgaacc ccggttcgaa tcccgtactc gggccggccg gacccgcggc taaggtgttg 10860
gattggcctc cccctcgtat aaagaccccg cttgcggatt gactccggac acggggacga 10920
gcccctttta tttttgcttt ccccagatgc atccggtgct gcggcagatg cgccccccgc 10980
cccagcagca gcaacaacac cagcaagagc ggcagcaaca gcagcgggag tcatgcaggg 11040
ccccctcacc caccctcggc gggccggcca cctcggcgtc cgcggccgtg tctggcgcct 11100
gcggcggcgg cggggggccg gctgacgacc ccgaggagcc cccgcggcgc agggccagac 11160
actacctgga cctggaggag ggcgagggcc tggcgcggct gggggcgccg tctcccgagc 11220
gccacccgcg ggtgcagctg aagcgcgact cgcgcgaggc gtacgtgcct cggcagaacc 11280
tgttcaggga ccgcgcgggc gaggagcccg aggagatgcg ggacaggagg ttcagcgcag 11340
ggcgggagct gcggcagggg ctgaaccgcg agcggctgct gcgcgaggag gactttgagc 11400
ccgacgcgcg gacggggatc agccccgcgc gcgcgcacgt ggcggccgcc gacctggtga 11460
cggcgtacga gcagacggtg aaccaggaga tcaacttcca aaagagtttc aacaaccacg 11520
tgcgcacgct ggtggcgcgc gaggaggtga ccatcgggct gatgcacctg tgggactttg 11580
taagcgcgct ggtgcagaac cccaacagca agcctctgac ggcgcagctg ttcctgatag 11640
tgcagcacag cagggacaac gaggcgttta gggacgcgct gctgaacatc accgagcccg 11700
agggtcggtg gctgctggac ctgattaaca tcctgcagag catagtggtg caggagcgca 11760
gcctgagcct ggccgacaag gtggcggcca tcaactactc gatgctgagc ctgggcaagt 11820
tttacgcgcg caagatctac cagacgccgt acgtgcccat agacaaggag gtgaagatcg 11880
acggttttta catgcgcatg gcgctgaagg tgctcaccct gagcgacgac ctgggcgtgt 11940
accgcaacga gcgcatccac aaggccgtga gcgtgagccg gcggcgcgag ctgagcgacc 12000
gcgagctgat gcacagcctg cagcgggcgc tggcgggcgc cggcagcggc gacagggagg 12060
cggagtccta cttcgatgcg ggggcggacc tgcgctgggc gcccagccgg cgggccctgg 12120
aggccgcggg ggtccgcgag gactatgacg aggacggcga ggaggatgag gagtacgagc 12180
tagaggaggg cgagtacctg gactaaaccg cgggtggtgt ttccggtaga tgcaagaccc 12240
gaacgtggtg gacccggcgc tgcgggcggc tctgcagagc cagccgtccg gccttaactc 12300
ctcagacgac tggcgacagg tcatggaccg catcatgtcg ctgacggcgc gtaacccgga 12360
cgcgttccgg cagcagccgc aggccaacag gctctccgcc atcctggagg cggtggtgcc 12420
tgcgcgctcg aaccccacgc acgagaaggt gctggccata gtgaacgcgc tggccgagaa 12480
cagggccatc cgcccggacg aggccgggct ggtgtacgac gcgctgctgc agcgcgtggc 12540
ccgctacaac agcggcaacg tgcagaccaa cctggaccgg ctggtggggg acgtgcgcga 12600
ggcggtggcg cagcgcgagc gcgcggatcg gcagggcaac ctgggctcca tggtggcgct 12660
gaatgccttc ctgagcacgc agccggccaa cgtgccgcgg gggcaggaag actacaccaa 12720
ctttgtgagc gcgctgcggc tgatggtgac cgagaccccc cagagcgagg tgtaccagtc 12780
gggcccggac tacttcttcc agaccagcag acagggcctg cagacggtga acctgagcca 12840
ggctttcaag aacctgcggg ggctgtgggg cgtgaaggcg cccaccggcg accgggcgac 12900
ggtgtccagc ctgctgacgc ccaactcgcg cctgctgctg ctgctgatcg cgccgttcac 12960
ggacagcggc agcgtgtccc gggacaccta cctggggcac ctgctgaccc tgtaccgcga 13020
ggccatcggg caggcgcagg tggacgagca caccttccag gagatcacca gcgtgagccg 13080
cgcgctgggg caggaggaca cgagcagcct ggaggcgact ctgaactacc tgctgaccaa 13140
ccggcggcag aagattccct cgctgcacag cctgacctcc gaggaggagc gcatcttgcg 13200
ctacgtgcag cagagcgtga gcctgaacct gatgcgcgac ggggtgacgc ccagcgtggc 13260
gctggacatg accgcgcgca acatggaacc gggcatgtac gccgcgcacc ggccttacat 13320
caaccgcctg atggactacc tgcatcgcgc ggcggccgtg aaccccgagt actttaccaa 13380
cgccatcctg aacccgcact ggctcccgcc gcccgggttc tacagcgggg gcttcgaggt 13440
cccggagacc aacgatggct tcctgtggga cgacatggac gacagcgtgt tctccccgcg 13500
gccgcaggcg ctggcggaag cgtccctgct gcgtcccaag aaggaggagg aggaggaggc 13560
gagtcgccgc cgcggcagca gcggcgtggc ttctctgtcc gagctggggg cggcagccgc 13620
cgcgcgcccc gggtccctgg gcggcagccc ctttccgagc ctggtggggt ctctgcacag 13680
cgagcgcacc acccgccctc ggctgctggg cgaggacgag tacctgaata actccctgct 13740
gcagccggtg cgggagaaaa acctgcctcc cgccttcccc aacaacggga tagagagcct 13800
ggtggacaag atgagcagat ggaagaccta tgcgcaggag cacagggacg cgcctgcgct 13860
ccggccgccc acgcggcgcc agcgccacga ccggcagcgg gggctggtgt gggatgacga 13920
ggactccgcg gacgatagca gcgtgctgga cctgggaggg agcggcaacc cgttcgcgca 13980
cctgcgcccc cgcctgggga ggatgtttta aaaaaaaaaa aaaaaagcaa gaagcatgat 14040
gcaaaaatta aataaaactc accaaggcca tggcgaccga gcgttggttt cttgtgttcc 14100
cttcagtatg cggcgcgcgg cgatgtacca ggagggacct cctccctctt acgagagcgt 14160
ggtgggcgcg gcggcggcgg cgccctcttc tccctttgcg tcgcagctgc tggagccgcc 14220
gtacgtgcct ccgcgctacc tgcggcctac gggggggaga aacagcatcc gttactcgga 14280
gctggcgccc ctgttcgaca ccacccgggt gtacctggtg gacaacaagt cggcggacgt 14340
ggcctccctg aactaccaga acgaccacag caattttttg accacggtca tccagaacaa 14400
tgactacagc ccgagcgagg ccagcaccca gaccatcaat ctggatgacc ggtcgcactg 14460
gggcggcgac ctgaaaacca tcctgcacac caacatgccc aacgtgaacg agttcatgtt 14520
caccaataag ttcaaggcgc gggtgatggt gtcgcgctcg cacaccaagg aagaccgggt 14580
ggagctgaag tacgagtggg tggagttcga gctgccagag ggcaactact ccgagaccat 14640
gaccattgac ctgatgaaca acgcgatcgt ggagcactat ctgaaagtgg gcaggcagaa 14700
cggggtcctg gagagcgaca tcggggtcaa gttcgacacc aggaacttcc gcctggggct 14760
ggaccccgtg accgggctgg ttatgcccgg ggtgtacacc aacgaggcct tccatcccga 14820
catcatcctg ctgcccggct gcggggtgga cttcacttac agccgcctga gcaacctcct 14880
gggcatccgc aagcggcagc ccttccagga gggcttcagg atcacctacg aggacctgga 14940
ggggggcaac atccccgcgc tcctcgatgt ggaggcctac caggatagct tgaaggaaaa 15000
tgaggcggga caggaggata ccgcccccgc cgcctccgcc gccgccgagc agggcgagga 15060
tgctgctgac accgcggccg cggacggggc agaggccgac cccgctatgg tggtggaggc 15120
tcccgagcag gaggaggaca tgaatgacag tgcggtgcgc ggagacacct tcgtcacccg 15180
gggggaggaa aagcaagcgg aggccgaggc cgcggccgag gaaaagcaac tggcggcagc 15240
agcggcggcg gcggcgttgg ccgcggcgga ggctgagtct gaggggacca agcccgccaa 15300
ggagcccgtg attaagcccc tgaccgaaga tagcaagaag cgcagttaca acctgctcaa 15360
ggacagcacc aacaccgcgt accgcagctg gtacctggcc tacaactacg gcgacccgtc 15420
gacgggggtg cgctcctgga ccctgctgtg cacgccggac gtgacctgcg gctcggagca 15480
ggtgtactgg tcgctgcccg acatgatgca agaccccgtg accttccgct ccacgcggca 15540
ggtcagcaac ttcccggtgg tgggcgccga gctgctgccc gtgcactcca agagcttcta 15600
caacgaccag gccgtctact cccagctcat ccgccagttc acctctctga cccacgtgtt 15660
caatcgcttt cctgagaacc agattctggc gcgcccgccc gcccccacca tcaccaccgt 15720
cagtgaaaac gttcctgctc tcacagatca cgggacgcta ccgctgcgca acagcatcgg 15780
aggagtccag cgagtgaccg ttactgacgc cagacgccgc acctgcccct acgtttacaa 15840
ggccttgggc atagtctcgc cgcgcgtcct ttccagccgc actttttgag caacaccacc 15900
atcatgtcca tcctgatctc acccagcaat aactccggct ggggactgct gcgcgcgccc 15960
agcaagatgt tcggaggggc gaggaagcgt tccgagcagc accccgtgcg cgtgcgcggg 16020
cacttccgcg ccccctgggg agcgcacaaa cgcggccgcg cggggcgcac caccgtggac 16080
gacgccatcg actcggtggt ggagcaggcg cgcaactaca ggcccgcggt ctctaccgtg 16140
gacgcggcca tccagaccgt ggtgcggggc gcgcggcggt acgccaagct gaagagccgc 16200
cggaagcgcg tggcccgccg ccaccgccgc cgacccgggg ccgccgccaa acgcgccgcc 16260
gcggccctgc ttcgccgggc caagcgcacg ggccgccgcg ccgccatgag ggccgcgcgc 16320
cgcttggccg ccggcatcac cgccgccacc atggcccccc gtacccgaag acgcgcggcc 16380
gccgccgccg ccgccgccat cagtgacatg gccagcaggc gccggggcaa cgtgtactgg 16440
gtgcgcgact cggtgaccgg cacgcgcgtg cccgtgcgct tccgcccccc gcggacttga 16500
gatgatgtga aaaaacaaca ctgagtctcc tgctgttgtg tgtatcccag cggcggcggc 16560
gcgcgcagcg tcatgtccaa gcgcaaaatc aaagaagaga tgctccaggt cgtcgcgccg 16620
gagatctatg ggcccccgaa gaaggaagag caggattcga agccccgcaa gataaagcgg 16680
gtcaaaaaga aaaagaaaga tgatgacgat gccgatgggg aggtggagtt cctgcgcgcc 16740
acggcgccca ggcgcccggt gcagtggaag ggccggcgcg taaagcgcgt cctgcgcccc 16800
ggcaccgcgg tggtcttcac gcccggcgag cgctccaccc ggactttcaa gcgcgtctat 16860
gacgaggtgt acggcgacga agacctgctg gagcaggcca acgagcgctt cggagagttt 16920
gcttacggga agcgtcagcg ggcgctgggg aaggaggacc tgctggcgct gccgctggac 16980
cagggcaacc ccacccccag tctgaagccc gtgaccctgc agcaggtgct gccgagcagc 17040
gcaccctccg aggcgaagcg gggtctgaag cgcgagggcg gcgacctggc gcccaccgtg 17100
cagctcatgg tgcccaagcg gcagaggctg gaggatgtgc tggagaaaat gaaagtagac 17160
cccggtctgc agccggacat cagggtccgc cccatcaagc aggtggcgcc gggcctcggc 17220
gtgcagaccg tggacgtggt catccccacc ggcaactccc ccgccgccgc caccactacc 17280
gctgcctcca cggacatgga gacacagacc gatcccgccg cagccgcagc cgcagccgcc 17340
gccgcgacct cctcggcgga ggtgcagacg gacccctggc tgccgccggc gatgtcagct 17400
ccccgcgcgc gtcgcgggcg caggaagtac ggcgccgcca acgcgctcct gcccgagtac 17460
gccttgcatc cttccatcgc gcccaccccc ggctaccgag gctataccta ccgcccgcga 17520
agagccaagg gttccacccg ccgtccccgc cgacgcgccg ccgccaccac ccgccgccgc 17580
cgccgcagac gccagcccgc actggctcca gtctccgtga ggaaagtggc gcgcgacgga 17640
cacaccctgg tgctgcccag ggcgcgctac caccccagca tcgtttaaaa gcctgttgtg 17700
gttcttgcag atatggccct cacttgccgc ctccgtttcc cggtgccggg ataccgagga 17760
ggaagatcgc gccgcaggag gggtctggcc ggccgcggcc tgagcggagg cagccgccgc 17820
gcgcaccggc ggcgacgcgc caccagccga cgcatgcgcg gcggggtgct gcccctgtta 17880
atccccctga tcgccgcggc gatcggcgcc gtgcccggga tcgcctccgt ggccttgcaa 17940
gcgtcccaga ggcattgaca gacttgcaaa cttgcaaata tggaaaaaaa aaccccaata 18000
aaaaagtcta gactctcacg ctcgcttggt cctgtgacta ttttgtagaa tggaagacat 18060
caactttgcg tcgctggccc cgcgtcacgg ctcgcgcccg ttcctgggac actggaacga 18120
tatcggcacc agcaacatga gcggtggcgc cttcagttgg ggctctctgt ggagcggcat 18180
taaaagtatc gggtctgccg ttaaaaatta cggctcccgg gcctggaaca gcagcacggg 18240
ccagatgttg agagacaagt tgaaagagca gaacttccag cagaaggtgg tggagggcct 18300
ggcctccggc atcaacgggg tggtggacct ggccaaccag gccgtgcaga ataagatcaa 18360
cagcagactg gacccccggc cgccggtgga ggaggtgccg ccggcgctgg agacggtgtc 18420
ccccgatggg cgtggcgaga agcgcccgcg gcccgatagg gaagagacca ctctggtcac 18480
gcagaccgat gagccgcccc cgtatgagga ggccctgaag caaggtctgc ccaccacgcg 18540
gcccatcgcg cccatggcca ccggggtggt gggccgccac acccccgcca cgctggactt 18600
gcctccgccc gccgatgtgc cgcagcagca gaaggcggca cagccgggcc cgcccgcgac 18660
cgcctcccgt tcctccgccg gtcctctgcg ccgcgcggcc agcggccccc gcgggggggt 18720
cgcgaggcac ggcaactggc agagcacgct gaacagcatc gtgggtctgg gggtgcggtc 18780
cgtgaagcgc cgccgatgct actgaatagc ttagctaacg tgttgtatgt gtgtatgcgc 18840
cctatgtcgc cgccagagga gctgctgagt cgccgccgtt cgcgcgccca ccaccaccgc 18900
cactccgccc ctcaagatgg cgaccccatc gatgatgccg cagtggtcgt acatgcacat 18960
ctcgggccag gacgcctcgg agtacctgag ccccgggctg gtgcagttcg cccgcgccac 19020
cgagagctac ttcagcctga gtaacaagtt taggaacccc acggtggcgc ccacgcacga 19080
tgtgaccacc gaccggtctc agcgcctgac gctgcggttc attcccgtgg accgcgagga 19140
caccgcgtac tcgtacaagg cgcggttcac cctggccgtg ggcgacaacc gcgtgctgga 19200
catggcctcc acctactttg acatccgcgg ggtgctggac cggggtccca ctttcaagcc 19260
ctactctggc accgcctaca actccctggc ccccaagggc gctcccaact cctgcgagtg 19320
ggagcaagag gaaactcagg cagttgaaga agcagcagaa gaggaagaag aagatgctga 19380
cggtcaagct gaggaagagc aagcagctac caaaaagact catgtatatg ctcaggctcc 19440
cctttctggc gaaaaaatta gtaaagatgg tctgcaaata ggaacggacg ctacagctac 19500
agaacaaaaa cctatttatg cagaccctac attccagccc gaaccccaaa tcggggagtc 19560
ccagtggaat gaggcagatg ctacagtcgc cggcggtaga gtgctaaaga aatctactcc 19620
catgaaacca tgctatggtt cctatgcaag acccacaaat gctaatggag gtcagggtgt 19680
actaacggca aatgcccagg gacagctaga atctcaggtt gaaatgcaat tcttttcaac 19740
ttctgaaaac gcccgtaacg aggctaacaa cattcagccc aaattggtgc tgtatagtga 19800
ggatgtgcac atggagaccc cggatacgca cctttcttac aagcccgcaa aaagcgatga 19860
caattcaaaa atcatgctgg gtcagcagtc catgcccaac agacctaatt acatcggctt 19920
cagagacaac tttatcggcc tcatgtatta caatagcact ggcaacatgg gagtgcttgc 19980
aggtcaggcc tctcagttga atgcagtggt ggacttgcaa gacagaaaca cagaactgtc 20040
ctaccagctc ttgcttgatt ccatgggtga cagaaccaga tacttttcca tgtggaatca 20100
ggcagtggac agttatgacc cagatgttag aattattgaa aatcatggaa ctgaagacga 20160
gctccccaac tattgtttcc ctctgggtgg cataggggta actgacactt accaggctgt 20220
taaaaccaac aatggcaata acgggggcca ggtgacttgg acaaaagatg aaacttttgc 20280
agatcgcaat gaaatagggg tgggaaacaa tttcgctatg gagatcaacc tcagtgccaa 20340
cctgtggaga aacttcctgt actccaacgt ggcgctgtac ctaccagaca agcttaagta 20400
caacccctcc aatgtggaca tctctgacaa ccccaacacc tacgattaca tgaacaagcg 20460
agtggtggcc ccggggctgg tggactgcta catcaacctg ggcgcgcgct ggtcgctgga 20520
ctacatggac aacgtcaacc ccttcaacca ccaccgcaat gcgggcctgc gctaccgctc 20580
catgctcctg ggcaacgggc gctacgtgcc cttccacatc caggtgcccc agaagttctt 20640
tgccatcaag aacctcctcc tcctgccggg ctcctacacc tacgagtgga acttcaggaa 20700
ggatgtcaac atggtcctcc agagctctct gggtaacgat ctcagggtgg acggggccag 20760
catcaagttc gagagcatct gcctctacgc caccttcttc cccatggccc acaacacggc 20820
ctccacgctc gaggccatgc tcaggaacga caccaacgac cagtccttca atgactacct 20880
ctccgccgcc aacatgctct accccatacc cgccaacgcc accaacgtcc ccatctccat 20940
cccctcgcgc aactgggcgg ccttccgcgg ctgggccttc acccgcctca agaccaagga 21000
gaccccctcc ctgggctcgg gattcgaccc ctactacacc tactcgggct ccattcccta 21060
cctggacggc accttctacc tcaaccacac tttcaagaag gtctcggtca ccttcgactc 21120
ctcggtcagc tggccgggca acgaccgtct gctcaccccc aacgagttcg agatcaagcg 21180
ctcggtcgac ggggagggct acaacgtggc ccagtgcaac atgaccaagg actggttcct 21240
ggtccagatg ctggccaact acaacatcgg ctaccagggc ttctacatcc cagagagcta 21300
caaggacagg atgtactcct tcttcaggaa cttccagccc atgagccggc aggtggtgga 21360
ccagaccaag tacaaggact accaggaggt gggcatcatc caccagcaca acaactcggg 21420
cttcgtgggc tacctcgccc ccaccatgcg cgagggacag gcctaccccg ccaacttccc 21480
ctatccgctc ataggcaaga ccgcggtcga cagcatcacc cagaaaaagt tcctctgcga 21540
ccgcaccctc tggcgcatcc ccttctccag caacttcatg tccatgggtg cgctctcgga 21600
cctgggccag aacttgctct acgccaactc cgcccacgcc ctcgacatga ccttcgaggt 21660
cgaccccatg gacgagccca cccttctcta tgttctgttc gaagtctttg acgtggtccg 21720
ggtccaccag ccgcaccgcg gcgtcatcga gaccgtgtac ctgcgtacgc ccttctcggc 21780
cggcaacgcc accacctaaa gaagcaagcc gcagtcatcg ccgcctgcat gccgtcgggt 21840
tccaccgagc aagagctcag ggccatcgtc agagacctgg gatgcgggcc ctattttttg 21900
ggcaccttcg acaagcgctt ccctggcttt gtctccccac acaagctggc ctgcgccatc 21960
gtcaacacgg ccggccgcga gaccgggggc gtgcactggc tggccttcgc ctggaacccg 22020
cgctccaaaa catgcttcct ctttgacccc ttcggctttt cggaccagcg gctcaagcaa 22080
atctacgagt tcgagtacga gggcttgctg cgtcgcagcg ccatcgcctc ctcgcccgac 22140
cgctgcgtca ccctcgaaaa gtccacccag accgtgcagg ggcccgactc ggccgcctgc 22200
ggtctcttct gctgcatgtt tctgcacgcc tttgtgcact ggcctcagag tcccatggac 22260
cgcaacccca ccatgaactt gctgacgggg gtgcccaact ccatgctcca gagcccccag 22320
gtcgagccca ccctgcgccg caaccaggag cagctctaca gcttcctgga gcgccactcg 22380
ccttacttcc gccgccacag cgcacagatc aggagggcca cctccttctg ccacttgcaa 22440
gagatgcaag aagggtaata acgatgtaca cacttttttt ctcaataaat ggcatctttt 22500
tatttataca agctctctgg ggtattcatt tcccaccacc acccgccgtt gtcgccatct 22560
ggctctattt agaaatcgaa agggttctgc cgggagtcgc cgtgcgccac gggcagggac 22620
acgttgcgat actggtagcg ggtgccccac ttgaactcgg gcaccaccag gcgaggcagc 22680
tcggggaagt tttcgctcca caggctgcgg gtcagcacca gcgcgttcat caggtcgggc 22740
gccgagatct tgaagtcgca gttggggccg ccgccctgcg cgcgcgagtt gcggtacacc 22800
gggttgcagc actggaacac caacagcgcc gggtgcttca cgctggccag cacgctgcgg 22860
tcggagatca gctcggcgtc caggtcctcc gcgttgctca gcgcgaacgg ggtcatcttg 22920
ggcacttgcc gccccaggaa gggcgcgtgc cccggtttcg agttgcagtc gcagcgcagc 22980
gggatcagca ggtgcccgtg cccggactcg gcgttggggt acagcgcgcg catgaaggcc 23040
tgcatctggc ggaaggccat ctgggccttg gcgccctccg agaagaacat gccgcaggac 23100
ttgcccgaga actggtttgc ggggcagctg gcgtcgtgca ggcagcagcg cgcgtcggtg 23160
ttggcgatct gcaccacgtt gcgcccccac cggttcttca cgatcttggc cttggacgat 23220
tgctccttca gcgcgcgctg cccgttctcg ctggtcacat ccatctcgat cacatgttcc 23280
ttgttcacca tgctgctgcc gtgcagacac ttcagctcgc cctccgtctc ggtgcagcgg 23340
tgctgccaca gcgcgcagcc cgtgggctcg aaagacttgt aggtcacctc cgcgaaggac 23400
tgcaggtacc cctgcaaaaa gcggcccatc atggtcacga aggtcttgtt gctgctgaag 23460
gtcagctgca gcccgcggtg ctcctcgttc agccaggtct tgcacacggc cgccagcgcc 23520
tccacctggt cgggcagcat cttgaagttc accttcagct cattctccac gtggtacttg 23580
tccatcagcg tgcgcgccgc ctccatgccc ttctcccagg ccgacaccag cggcaggctc 23640
acggggttct tcaccatcac cgtggccgcc gcctccgccg cgctttcgct ttccgccccg 23700
ctgttctctt cctcttcctc ctcttcctcg ccgccgccca ctcgcagccc ccgcaccacg 23760
gggtcgtctt cctgcaggcg ctgcaccttg cgcttgccgt tgcgcccctg cttgatgcgc 23820
acgggcgggt tgctgaagcc caccatcacc agcgcggcct cttcttgctc gtcctcgctg 23880
tccagaatga cctccgggga gggggggttg gtcatcctca gtaccgaggc acgcttcttt 23940
ttcttcctgg gggcgttcgc cagctccgcg gctgcggccg ctgccgaggt cgaaggccga 24000
gggctgggcg tgcgcggcac cagcgcgtcc tgcgagccgt cctcgtcctc ctcggactcg 24060
agacggaggc gggcccgctt cttcgggggc gcgcggggcg gcggaggcgg cggcggcgac 24120
ggagacgggg acgagacatc gtccagggtg ggtggacggc gggccgcgcc gcgtccgcgc 24180
tcgggggtgg tctcgcgctg gtcctcttcc cgactggcca tctcccactg ctccttctcc 24240
tataggcaga aagagatcat ggagtctctc atgcgagtcg agaaggagga ggacagccta 24300
accgccccct ctgagccctc caccaccgcc gccaccaccg ccaatgccgc cgcggacgac 24360
gcgcccaccg agaccaccgc cagtaccacc ctccccagcg acgcaccccc gctcgagaat 24420
gaagtgctga tcgagcagga cccgggtttt gtgagcggag aggaggatga ggtggatgag 24480
aaggagaagg aggaggtcgc cgcctcagtg ccaaaagagg ataaaaagca agaccaggac 24540
gacgcagata aggatgagac agcagtcggg cgggggaacg gaagccatga tgctgatgac 24600
ggctacctag acgtgggaga cgacgtgctg cttaagcacc tgcaccgcca gtgcgtcatc 24660
gtctgcgacg cgctgcagga gcgctgcgaa gtgcccctgg acgtggcgga ggtcagccgc 24720
gcctacgagc ggcacctctt cgcgccgcac gtgcccccca agcgccggga gaacggcacc 24780
tgcgagccca acccgcgtct caacttctac ccggtcttcg cggtacccga ggtgctggcc 24840
acctaccaca tctttttcca aaactgcaag atccccctct cctgccgcgc caaccgcacc 24900
cgcgccgaca aaaccctgac cctgcggcag ggcgcccaca tacctgatat cgcctctctg 24960
gaggaagtgc ccaagatctt cgagggtctc ggtcgcgacg agaaacgggc ggcgaacgct 25020
ctgcacggag acagcgaaaa cgagagtcac tcgggggtgc tggtggagct cgagggcgac 25080
aacgcgcgcc tggccgtact caagcgcagc atagaggtca cccactttgc ctacccggcg 25140
ctcaacctgc cccccaaggt catgagtgtg gtcatgggcg agctcatcat gcgccgcgcc 25200
cagcccctgg ccgcggatgc aaacttgcaa gagtcctccg aggaaggcct gcccgcggtc 25260
agcgacgagc agctggcgcg ctggctggag acccgcgacc ccgcgcagct ggaggagcgg 25320
cgcaagctca tgatggccgc ggtgctggtc accgtggagc tcgagtgtct gcagcgcttc 25380
ttcgcggacc ccgagatgca gcgcaagctc gaggagaccc tgcactacac cttccgccag 25440
ggctacgtgc gccaggcctg caagatctcc aacgtggagc tctgcaacct ggtctcctac 25500
ctgggcatcc tgcacgagaa ccgcctcggg cagaacgtcc tgcactccac cctcaaaggg 25560
gaggcgcgcc gcgactacat ccgcgactgc gcctacctct tcctctgcta cacctggcag 25620
acggccatgg gggtctggca gcagtgcctg gaggagcgca acctcaagga gctggaaaag 25680
ctcctcaagc gcaccctcag ggacctctgg acgggcttca acgagcgctc ggtggccgcc 25740
gcgctggcgg acatcatctt tcccgagcgc ctgctcaaga ccctgcagca gggcctgccc 25800
gacttcacca gccagagcat gctgcagaac ttcaggactt tcatcctgga gcgctcgggc 25860
atcctgccgg ccacttgctg cgcgctgccc agcgacttcg tgcccatcaa gtacagggag 25920
tgcccgccgc cgctctgggg ccactgctac ctcttccagc tggccaacta cctcgcctac 25980
cactcggacc tcatggaaga cgtgagcggc gagggcctgc tcgagtgcca ctgccgctgc 26040
aacctctgca cgccccaccg ctctctagtc tgcaacccgc agctgctcag cgagagtcag 26100
attatcggta ccttcgagct gcagggtccc tcgcctgacg agaagtccgc ggctccaggg 26160
ctgaaactca ctccggggct gtggacttcc gcctacctac gcaaatttgt acctgaggac 26220
taccacgccc acgagatcag gttctacgaa gaccaatccc gcccgcccaa ggcggagctc 26280
accgcctgcg tcatcaccca ggggcacatc ctgggccaat tgcaagccat caacaaagcc 26340
cgccgagagt tcttgctgaa aaagggtcgg ggggtgtacc tggaccccca gtccggcgag 26400
gagctaaacc cgctaccccc gccgccgccc cagcagcggg accttgcttc ccaggatggc 26460
acccagaaag aagcagcagc cgccgccgcc gccgcagcca tacatgcttc tggaggaaga 26520
ggaggaggac tgggacagtc aggcagagga ggtttcggac gaggagcagg aggagatgat 26580
ggaagactgg gaggaggaca gcagcctaga cgaggaagct tcagaggccg aagaggtggc 26640
agacgcaaca ccatcgccct cggtcgcagc cccctcgccg gggcccctga aatcctccga 26700
acccagcacc agcgctataa cctccgctcc tccggcgccg gcgccacccg cccgcagacc 26760
caaccgtaga tgggacacca caggaaccgg ggtcggtaag tccaagtgcc cgccgccgcc 26820
accgcagcag cagcagcagc agcgccaggg ctaccgctcg tggcgcgggc acaagaacgc 26880
catagtcgcc tgcttgcaag actgcggggg caacatctct ttcgcccgcc gcttcctgct 26940
attccaccac ggggtcgcct ttccccgcaa tgtcctgcat tactaccgtc atctctacag 27000
cccctactgc agcggcgacc cagaggcggc agcggcagcc acagcggcga ccaccaccta 27060
ggaagatatc ctccgcgggc aagacagcgg cagcagcggc caggagaccc gcggcagcag 27120
cggcgggagc ggtgggcgca ctgcgcctct cgcccaacga acccctctcg acccgggagc 27180
tcagacacag gatcttcccc actttgtatg ccatcttcca acagagcaga ggccaggagc 27240
aggagctgaa aataaaaaac agatctctgc gctccctcac ccgcagctgt ctgtatcaca 27300
aaagcgaaga tcagcttcgg cgcacgctgg aggacgcgga ggcactcttc agcaaatact 27360
gcgcgctcac tcttaaagac tagctccgcg cccttctcga atttaggcgg gagaaaacta 27420
cgtcatcgcc ggccgccgcc cagcccgccc agccgagatg agcaaagaga ttcccacgcc 27480
atacatgtgg agctaccagc cgcagatggg actcgcggcg ggagcggccc aggactactc 27540
cacccgcatg aactacatga gcgcgggacc ccacatgatc tcacaggtca acgggatccg 27600
cgcccagcga aaccaaatac tgctggaaca ggcggccatc accgccacgc cccgccataa 27660
tctcaacccc cgaaattggc ccgccgccct cgtgtaccag gaaaccccct ccgccaccac 27720
cgtactactt ccgcgtgacg cccaggccga agtccagatg actaactcag gggcgcagct 27780
cgcgggcggc tttcgtcacg gggcgcggcc gctccgacca ggtataagac acctgatgat 27840
cagaggccga ggtatccagc tcaacgacga gtcggtgagc tcttcgctcg gtctccgtcc 27900
ggacggaact ttccagctcg ccggatccgg ccgctcttcg ttcacgcccc gccaggcgta 27960
cctgactctg cagacctcgt cctcggagcc ccgctccggc ggcatcggaa ccctccagtt 28020
cgtggaggag ttcgtgccct cggtctactt caaccccttc tcgggacctc ccggacgcta 28080
ccccgaccag ttcattccga actttgacgc ggtgaaggac tcggcggacg gctacgactg 28140
aatgtcaggt gtcgaggcag agcagcttcg cctgagacac ctcgagcact gccgccgcca 28200
caagtgcttc gcccgcggtt ctggtgagtt ctgctacttt cagctacccg aggagcatac 28260
cgaggggccg gcgcacggcg tccgcctgac cacccagggc gaggttacct gttccctcat 28320
ccgggagttt accctccgtc ccctgctagt ggagcgggag cggggtccct gtgtcctaac 28380
tatcgcctgc aactgcccta accctggatt acatcaagat ctttgctgtc atctctgtgc 28440
tgagtttaat aaacgctgag atcagaatct actggggctc ctgtcgccat cctgtgaacg 28500
ccaccgtctt cacccacccc gaccaggccc aggcgaacct cacctgcggt ctgcatcgga 28560
gggccaagaa gtacctcacc tggtacttca acggcacccc ctttgtggtt tacaacagct 28620
tcgacgggga cggagtctcc ctgaaagacc agctctccgg tctcagctac tccatccaca 28680
agaacaccac cctccaactc ttccctccct acctgccggg aacctacgag tgcgtcaccg 28740
gccgctgcac ccacctcacc cgcctgatcg taaaccagag ctttccggga acagataact 28800
ccctcttccc cagaacagga ggtgagctca ggaaactccc cggggaccag ggcggagacg 28860
taccttcgac ccttgtgggg ttaggatttt ttattaccgg gttgctggct cttttaatca 28920
aagtttcctt gagatttgtt ctttccttct acgtgtatga acacctcaac ctccaataac 28980
tctacccttt cttcggaatc aggtgacttc tctgaaatcg ggcttggtgt gctgcttact 29040
ctgttgattt ttttccttat catactcagc cttctgtgcc tcaggctcgc cgcctgctgc 29100
gcacacatct atatctactg ctggttgctc aagtgcaggg gtcgccaccc aagatgaaca 29160
ggtacatggt cctatcgatc ctaggcctgc tggccctggc ggcctgcagc gccgccaaaa 29220
aagagattac ctttgaggag cccgcttgca atgtaacttt caagcccgag ggtgaccaat 29280
gcaccaccct cgtcaaatgc gttaccaatc atgagaggct gcgcatcgac tacaaaaaca 29340
aaactggcca gtttgcggtc tatagtgtgt ttacgcccgg agacccctct aactactctg 29400
tcaccgtctt ccagggcgga cagtctaaga tattcaatta cactttccct ttttatgagt 29460
tatgcgatgc ggtcatgtac atgtcaaaac agtacaacct gtggcctccc tctccccagg 29520
cgtgtgtgga aaatactggg tcttactgct gtatggcttt cgcaatcact acgctcgctc 29580
taatctgcac ggtgctatac ataaaattca ggcagaggcg aatctttatc gatgaaaaga 29640
aaatgccttg atcgctaaca ccggctttct atctgcagaa tgaatgcaat cacctcccta 29700
ctaatcacca ccaccctcct tgcgattgcc catgggttga cacgaatcga agtgccagtg 29760
gggtccaatg tcaccatggt gggccccgcc ggcaattcca ccctcatgtg ggaaaaattt 29820
gtccgcaatc aatgggttca tttctgctct aaccgaatca gtatcaagcc cagagccatc 29880
tgcgatgggc aaaatctaac tctgatcaat gtgcaaatga tggatgctgg gtactattac 29940
gggcagcggg gagaaatcat taattactgg cgaccccaca aggactacat gctgcatgta 30000
gtcgaggcac ttcccactac cacccccact accacctctc ccaccaccac caccactact 30060
actactacta ctactactac tactactacc actaccgctg cccgccatac ccgcaaaagc 30120
accatgatta gcacaaagcc ccctcgtgct cactcccacg ccggcgggcc catcggtgcg 30180
acctcagaaa ccaccgagct ttgcttctgc caatgcacta acgccagcgc tcatgaactg 30240
ttcgacctgg agaatgagga tgtccagcag agctccgctt gcctgaccca ggaggctgtg 30300
gagcccgttg ccctgaagca gatcggtgat tcaataattg actcttcttc ttttgccact 30360
cccgaatacc ctcccgattc tactttccac atcacgggta ccaaagaccc taacctctct 30420
ttctacctga tgctgctgct ctgtatctct gtggtctctt ccgcgctgat gttactgggg 30480
atgttctgct gcctgatctg ccgcagaaag agaaaagctc gctctcaggg ccaaccactg 30540
atgcccttcc cctacccccc ggattttgca gataacaaga tatgagctcg ctgctgacac 30600
taaccgcttt actagcctgc gctctaaccc ttgtcgcttg cgactcgaga ttccacaatg 30660
tcacagctgt ggcaggagaa aatgttactt tcaactccac ggccgatacc cagtggtcgt 30720
ggagtggctc aggtagctac ttaactatct gcaatagctc cacttccccc ggcatatccc 30780
caaccaagta ccaatgcaat gccagcctgt tcaccctcat caacgcttcc accctggaca 30840
atggactcta tgtaggctat gtaccctttg gtgggcaagg aaagacccac gcttacaacc 30900
tggaagttcg ccagcccaga accactaccc aagcttctcc caccaccacc accaccacca 30960
ccatcaccag cagcagcagc agcagcagcc acagcagcag cagcagatta ttgactttgg 31020
ttttggccag ctcatctgcc gctacccagg ccatctacag ctctgtgccc gaaaccactc 31080
agatccaccg cccagaaacg accaccgcca ccaccctaca cacctccagc gatcagatgc 31140
cgaccaacat cacccccttg gctcttcaaa tgggacttac aagccccact ccaaaaccag 31200
tggatgcggc cgaggtctcc gccctcgtca atgactgggc ggggctggga atgtggtggt 31260
tcgccatagg catgatggcg ctctgcctgc ttctgctctg gctcatctgc tgcctccacc 31320
gcaggcgagc cagacccccc atctatagac ccatcattgt cctgaacccc gataatgatg 31380
ggatccatag attggatggc ctgaaaaacc tacttttttc ttttacagta tgataaattg 31440
agacatgcct cgcattttct tgtacatgtt ccttctccca ccttttctgg ggtgttctac 31500
gctggccgct gtgtctcacc tggaggtaga ctgcctctca cccttcactg tctacctgct 31560
ttacggattg gtcaccctca ctctcatctg cagcctaatc acagtaatca tcgccttcat 31620
ccagtgcatt gattacatct gtgtgcgcct cgcatacttc agacaccacc cgcagtaccg 31680
agacaggaac attgcccaac ttctaagact gctctaatca tgcataagac tgtgatctgc 31740
cttctgatcc tctgcatcct gcccaccctc acctcctgcc agtacaccac aaaatctccg 31800
cgcaaaagac atgcctcctg ccgcttcacc caactgtgga atatacccaa atgctacaac 31860
gaaaagagcg agctctccga agcttggctg tatggggtca tctgtgtctt agttttctgc 31920
agcactgtct ttgccctcat aatctacccc tactttgatt tgggatggaa cgcgatcgat 31980
gccatgaatt accccacctt tcccgcaccc gagataattc cactgcgaca agttgtaccc 32040
gttgtcgtta atcaacgccc cccatcccct acgcccactg aaatcagcta ctttaaccta 32100
acaggcggag atgactgacg ccctagatct agaaatggac ggcatcagta ccgagcagcg 32160
tctcctagag aggcgcaggc aggcggctga gcaagagcgc ctcaatcagg agctccgaga 32220
tctcgttaac ctgcaccagt gcaaaagagg catcttttgt ctggtaaagc aggccaaagt 32280
cacctacgag aagaccggca acagccaccg cctcagttac aaattgccca cccagcgcca 32340
gaagctggtg ctcatggtgg gtgagaatcc catcaccgtc acccagcact cggtagagac 32400
cgaggggtgt ctgcactccc cctgtcgggg tccagaagac ctctgcaccc tggtaaagac 32460
cctgtgcggt ctcagagatt tagtcccctt taactaatca aacactggaa tcaataaaaa 32520
gaatcactta cttaaaatca gacagcaggt ctctgtccag tttattcagc agcacctcct 32580
tcccctcctc ccaactctgg tactccaaac gccttctggc ggcaaacttc ctccacaccc 32640
tgaagggaat gtcagattct tgctcctgtc cctccgcacc cactatcttc atgttgttgc 32700
agatgaagcg caccaaaacg tctgacgaga gcttcaaccc cgtgtacccc tatgacacgg 32760
aaagcggccc tccctccgtc cctttcctca cccctccctt cgtgtctccc gatggattcc 32820
aagaaagtcc ccccggggtc ctgtctctga acctggccga gcccctggtc acttcccacg 32880
gcatgctcgc cctgaaaatg ggaagtggcc tctccctgga cgacgctggc aacctcacct 32940
ctcaagatat caccaccgct agccctcccc tcaaaaaaac caagaccaac ctcagcctag 33000
aaacctcatc ccccctaact gtgagcacct caggcgccct caccgtagca gccgccgctc 33060
ccctggcggt ggccggcacc tccctcacca tgcaatcaga ggcccccctg acagtacagg 33120
atgcaaaact caccctggcc accaaaggcc ccctgaccgt gtctgaaggc aaactggcct 33180
tgcaaacatc ggccccgctg acggccgctg acagcagcac cctcacagtc agtgccacac 33240
caccccttag cacaagcaat ggcagcttgg gtattgacat gcaagccccc atttacacca 33300
ccaatggaaa actaggactt aactttggcg ctcccctgca tgtggtagac agcctaaatg 33360
cactgactgt agttactggc caaggtctta cgataaacgg aacagcccta caaactagag 33420
tctcaggtgc cctcaactat gacacatcag gaaacctaga attgagagct gcagggggta 33480
tgcgagttga tgcaaatggt caacttatcc ttgatgtagc ttacccattt gatgcacaaa 33540
acaatctcag ccttaggctt ggacagggac ccctgtttgt taactctgcc cacaacttgg 33600
atgttaacta caacagaggc ctctacctgt tcacatctgg aaataccaaa aagctagaag 33660
ttaatatcaa aacagccaag ggtctcattt atgatgacac tgctatagca atcaatgcgg 33720
gtgatgggct acagtttgac tcaggctcag atacaaatcc attaaaaact aaacttggat 33780
taggactgga ttatgactcc agcagagcca taattgctaa actgggaact ggcctaagct 33840
ttgacaacac aggtgccatc acagtaggca acaaaaatga tgacaagctt accttgtgga 33900
ccacaccaga cccatcccct aactgtagaa tctattcaga gaaagatgct aaattcacac 33960
ttgttttgac taaatgcggc agtcaggtgt tggccagcgt ttctgtttta tctgtaaaag 34020
gtagccttgc gcccatcagt ggcacagtaa ctagtgctca gattgtcctc agatttgatg 34080
aaaatggagt tctactaagc aattcttccc ttgaccctca atactggaac tacagaaaag 34140
gtgaccttac agagggcact gcatatacca acgcagtggg atttatgccc aacctcacag 34200
catacccaaa aacacagagc caaactgcta aaagcaacat tgtaagtcag gtttacttga 34260
atggggacaa atccaaaccc atgaccctca ccattaccct caatggaact aatgaaacag 34320
gagatgccac agtaagcact tactccatgt cattctcatg gaactggaat ggaagtaatt 34380
acattaatga aacgttccaa accaactcct tcaccttctc ctacatcgcc caagaataaa 34440
aagcatgacg ctgttgattt gattcaatgt gtttctgttt tattttcaag cacaacaaaa 34500
tcattcaagt cattcttcca tcttagctta atagacacag tagcttaata gacccagtag 34560
tgcaaagccc cattctagct tataactagt ggagaagtac tcgcctacat gggggtagag 34620
tcataatcgt gcatcaggat agggcggtgg tgctgcagca gcgcgcgaat aaactgctgc 34680
cgccgccgct ccgtcctgca ggaatacaac atggcagtgg tctcctcagc gatgattcgc 34740
accgcccgca gcataaggcg ccttgtcctc cgggcacagc agcgcaccct gatctcactt 34800
aaatcagcac agtaactgca gcacagcacc acaatattgt tcaaaatccc acagtgcaag 34860
gcgctgtatc caaagctcat ggcggggacc acagaaccca cgtggccatc ataccacaag 34920
cgcaggtaga ttaagtggcg acccctcata aacacgctgg acataaacat tacctctttt 34980
ggcatgttgt aattcaccac ctcccggtac catataaacc tctgattaaa catggcgcca 35040
tccaccacca tcctaaacca gctggccaaa acctgcccgc cggctataca ctgcagggaa 35100
ccgggactgg aacaatgaca gtggagagcc caggactcgt aaccatggat catcatgctc 35160
gtcatgatat caatgttggc acaacacagg cacacgtgca tacacttcct caggattaca 35220
agctcctccc gcgttagaac catatcccag ggaacaaccc attcctgaat cagcgtaaat 35280
cccacactgc agggaagacc tcgcacgtaa ctcacgttgt gcattgtcaa agtgttacat 35340
tcgggcagca gcggatgatc ctccagtatg gtagcgcggg tttctgtctc aaaaggaggt 35400
agacgatccc tactgtacgg agtgcgccga gacaaccgag atcgtgttgg tcgtagtgtc 35460
atgccaaatg gaacgccgga cgtagtcata tttcctgaag tcttagatct ctcaacgcag 35520
caccagcacc aacacttcgc agtgtaaaag gccaagtgcc gagagagtat atataggaat 35580
aaaaagtgac gtaaacgggc aaagtccaaa aaacgcccag aaaaaccgca cgcgaaccta 35640
cgccccgaaa cgaaagccaa aaaacactag acactccctt ccggcgtcaa cttccgcttt 35700
cccacgctac gtcacttgcc ccagtcaaac aaactacata tcccgaactt ccaagtcgcc 35760
acgcccaaaa caccgcctac acctccccgc ccgccggccc gcccccaaac ccgcctcccg 35820
ccccgcgccc cgccccgcgc cgcccatctc attatcatat tggcttcaat ccaaaataag 35880
gtatattatt gatgatggtt taaacggatc ctctagagtc gacctgcagg catgcaagct 35940
tgagtattct atagtgtcac ctaaatagct tggcgtaatc atggtcatag ctgtttcctg 36000
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 36060
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 36120
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgaacccc 36180
ttgcggccgc ccgggccgtc gaccaattct catgtttgac agcttatcat cgaatttctg 36240
ccattcatcc gcttattatc acttattcag gcgtagcaac caggcgttta agggcaccaa 36300
taactgcctt aaaaaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca 36360
ttaagcattc tgccgacatg gaagccatca caaacggcat gatgaacctg aatcgccagc 36420
ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag 36480
aagttgtcca tattggccac gtttaaatca aaactggtga aactcaccca gggattggct 36540
gagacgaaaa acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa 36600
cacgccacat cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc 36660
cagagcgatg aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta 36720
tcccatatca ccagctcacc gtctttcatt gccatacgga attccggatg agcattcatc 36780
aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt gcttattttt ctttacggtc 36840
tttaaaaagg ccgtaatatc cagctgaacg gtctggttat aggtacattg agcaactgac 36900
tgaaatgcct caaaatgttc tttacgatgc cattgggata tatcaacggt ggtatatcca 36960
gtgatttttt tctccatttt agcttcctta gctcctgaaa atctcgataa ctcaaaaaat 37020
acgcccggta gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca 37080
acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg tatcaacagg gacaccagga 37140
tttatttatt ctgcgaagtg atcttccgtc acaggtattt attcgcgata agctcatgga 37200
gcggcgtaac cgtcgcacag gaaggacaga gaaagcgcgg atctgggaag tgacggacag 37260
aacggtcagg acctggattg gggaggcggt tgccgccgct gctgctgacg gtgtgacgtt 37320
ctctgttccg gtcacaccac atacgttccg ccattcctat gcgatgcaca tgctgtatgc 37380
cggtataccg ctgaaagttc tgcaaagcct gatgggacat aagtccatca gttcaacgga 37440
agtctacacg aaggtttttg cgctggatgt ggctgcccgg caccgggtgc agtttgcgat 37500
gccggagtct gatgcggttg cgatgctgaa acaattatcc tgagaataaa tgccttggcc 37560
tttatatgga aatgtggaac tgagtggata tgctgttttt gtctgttaaa cagagaagct 37620
ggctgttatc cactgagaag cgaacgaaac agtcgggaaa atctcccatt atcgtagaga 37680
tccgcattat taatctcagg agcctgtgta gcgtttatag gaagtagtgt tctgtcatga 37740
tgcctgcaag cggtaacgaa aacgatttga atatgccttc aggaacaata gaaatcttcg 37800
tgcggtgtta cgttgaagtg gagcggatta tgtcagcaat ggacagaaca acctaatgaa 37860
cacagaacca tgatgtggtc tgtcctttta cagccagtag tgctcgccgc agtcgagcga 37920
cagggcgaag ccctcgagtg agcgaggaag caccagggaa cagcacttat atattctgct 37980
tacacacgat gcctgaaaaa acttcccttg gggttatcca cttatccacg gggatatttt 38040
tataattatt ttttttatag tttttagatc ttctttttta gagcgccttg taggccttta 38100
tccatgctgg ttctagagaa ggtgttgtga caaattgccc tttcagtgtg acaaatcacc 38160
ctcaaatgac agtcctgtct gtgacaaatt gcccttaacc ctgtgacaaa ttgccctcag 38220
aagaagctgt tttttcacaa agttatccct gcttattgac tcttttttat ttagtgtgac 38280
aatctaaaaa cttgtcacac ttcacatgga tctgtcatgg cggaaacagc ggttatcaat 38340
cacaagaaac gtaaaaatag cccgcgaatc gtccagtcaa acgacctcac tgaggcggca 38400
tatagtctct cccgggatca aaaacgtatg ctgtatctgt tcgttgacca gatcagaaaa 38460
tctgatggca ccctacagga acatgacggt atctgcgaga tccatgttgc taaatatgct 38520
gaaatattcg gattgacctc tgcggaagcc agtaaggata tacggcaggc attgaagagt 38580
ttcgcgggga aggaagtggt tttttatcgc cctgaagagg atgccggcga tgaaaaaggc 38640
tatgaatctt ttccttggtt tatcaaacgt gcgcacagtc catccagagg gctttacagt 38700
gtacatatca acccatatct cattcccttc tttatcgggt tacagaaccg gtttacgcag 38760
tttcggctta gtgaaacaaa agaaatcacc aatccgtatg ccatgcgttt atacgaatcc 38820
ctgtgtcagt atcgtaagcc ggatggctca ggcatcgtct ctctgaaaat cgactggatc 38880
atagagcgtt accagctgcc tcaaagttac cagcgtatgc ctgacttccg ccgccgcttc 38940
ctgcaggtct gtgttaatga gatcaacagc agaactccaa tgcgcctctc atacattgag 39000
aaaaagaaag gccgccagac gactcatatc gtattttcct tccgcgatat cacttccatg 39060
acgacaggat agtctgaggg ttatctgtca cagatttgag ggtggttcgt cacatttgtt 39120
ctgacctact gagggtaatt tgtcacagtt ttgctgtttc cttcagcctg catggatttt 39180
ctcatacttt ttgaactgta atttttaagg aagccaaatt tgagggcagt ttgtcacagt 39240
tgatttcctt ctctttccct tcgtcatgtg acctgatatc gggggttagt tcgtcatcat 39300
tgatgagggt tgattatcac agtttattac tctgaattgg ctatccgcgt gtgtacctct 39360
acctggagtt tttcccacgg tggatatttc ttcttgcgct gagcgtaaga gctatctgac 39420
agaacagttc ttctttgctt cctcgccagt tcgctcgcta tgctcggtta cacggctgcg 39480
gcgagcgcta gtgataataa gtgactgagg tatgtgctct tcttatctcc ttttgtagtg 39540
ttgctcttat tttaaacaac tttgcggttt tttgatgact ttgcgatttt gttgttgctt 39600
tgcagtaaat tgcaagattt aataaaaaaa cgcaaagcaa tgattaaagg atgttcagaa 39660
tgaaactcat ggaaacactt aaccagtgca taaacgctgg tcatgaaatg acgaaggcta 39720
tcgccattgc acagtttaat gatgacagcc cggaagcgag gaaaataacc cggcgctgga 39780
gaataggtga agcagcggat ttagttgggg tttcttctca ggctatcaga gatgccgaga 39840
aagcagggcg actaccgcac ccggatatgg aaattcgagg acgggttgag caacgtgttg 39900
gttatacaat tgaacaaatt aatcatatgc gtgatgtgtt tggtacgcga ttgcgacgtg 39960
ctgaagacgt atttccaccg gtgatcgggg ttgctgccca taaaggtggc gtttacaaaa 40020
cctcagtttc tgttcatctt gctcaggatc tggctctgaa ggggctacgt gttttgctcg 40080
tggaaggtaa cgacccccag ggaacagcct caatgtatca cggatgggta ccagatcttc 40140
atattcatgc agaagacact ctcctgcctt tctatcttgg ggaaaaggac gatgtcactt 40200
atgcaataaa gcccacttgc tggccggggc ttgacattat tccttcctgt ctggctctgc 40260
accgtattga aactgagtta atgggcaaat ttgatgaagg taaactgccc accgatccac 40320
acctgatgct ccgactggcc attgaaactg ttgctcatga ctatgatgtc atagttattg 40380
acagcgcgcc taacctgggt atcggcacga ttaatgtcgt atgtgctgct gatgtgctga 40440
ttgttcccac gcctgctgag ttgtttgact acacctccgc actgcagttt ttcgatatgc 40500
ttcgtgatct gctcaagaac gttgatctta aagggttcga gcctgatgta cgtattttgc 40560
ttaccaaata cagcaatagt aatggctctc agtccccgtg gatggaggag caaattcggg 40620
atgcctgggg aagcatggtt ctaaaaaatg ttgtacgtga aacggatgaa gttggtaaag 40680
gtcagatccg gatgagaact gtttttgaac aggccattga tcaacgctct tcaactggtg 40740
cctggagaaa tgctctttct atttgggaac ctgtctgcaa tgaaattttc gatcgtctga 40800
ttaaaccacg ctgggagatt agataatgaa gcgtgcgcct gttattccaa aacatacgct 40860
caatactcaa ccggttgaag atacttcgtt atcgacacca gctgccccga tggtggattc 40920
gttaattgcg cgcgtaggag taatggctcg cggtaatgcc attactttgc ctgtatgtgg 40980
tcgggatgtg aagtttactc ttgaagtgct ccggggtgat agtgttgaga agacctctcg 41040
ggtatggtca ggtaatgaac gtgaccagga gctgcttact gaggacgcac tggatgatct 41100
catcccttct tttctactga ctggtcaaca gacaccggcg ttcggtcgaa gagtatctgg 41160
tgtcatagaa attgccgatg ggagtcgccg tcgtaaagct gctgcactta ccgaaagtga 41220
ttatcgtgtt ctggttggcg agctggatga tgagcagatg gctgcattat ccagattggg 41280
taacgattat cgcccaacaa gtgcttatga acgtggtcag cgttatgcaa gccgattgca 41340
gaatgaattt gctggaaata tttctgcgct ggctgatgcg gaaaatattt cacgtaagat 41400
tattacccgc tgtatcaaca ccgccaaatt gcctaaatca gttgttgctc ttttttctca 41460
ccccggtgaa ctatctgccc ggtcaggtga tgcacttcaa aaagccttta cagataaaga 41520
ggaattactt aagcagcagg catctaacct tcatgagcag aaaaaagctg gggtgatatt 41580
tgaagctgaa gaagttatca ctcttttaac ttctgtgctt aaaacgtcat ctgcatcaag 41640
aactagttta agctcacgac atcagtttgc tcctggagcg acagtattgt ataagggcga 41700
taaaatggtg cttaacctgg acaggtctcg tgttccaact gagtgtatag agaaaattga 41760
ggccattctt aaggaacttg aaaagccagc accctgatgc gaccacgttt tagtctacgt 41820
ttatctgtct ttacttaatg tcctttgtta caggccagaa agcataactg gcctgaatat 41880
tctctctggg cccactgttc cacttgtatc gtcggtctga taatcagact gggaccacgg 41940
tcccactcgt atcgtcggtc tgattattag tctgggacca cggtcccact cgtatcgtcg 42000
gtctgattat tagtctggga ccacggtccc actcgtatcg tcggtctgat aatcagactg 42060
ggaccacggt cccactcgta tcgtcggtct gattattagt ctgggaccat ggtcccactc 42120
gtatcgtcgg tctgattatt agtctgggac cacggtccca ctcgtatcgt cggtctgatt 42180
attagtctgg aaccacggtc ccactcgtat cgtcggtctg attattagtc tgggaccacg 42240
gtcccactcg tatcgtcggt ctgattatta gtctgggacc acgatcccac tcgtgttgtc 42300
ggtctgatta tcggtctggg accacggtcc cacttgtatt gtcgatcaga ctatcagcgt 42360
gagactacga ttccatcaat gcctgtcaag ggcaagtatt gacatgtcgt cgtaacctgt 42420
agaacggagt aacctcggtg tgcggttgta tgcctgctgt ggattgctgc tgtgtcctgc 42480
ttatccacaa cattttgcgc acggttatgt ggacaaaata cctggttacc caggccgtgc 42540
cggcacgtta accgggctgc atccgatgca agtgtgtcgc tgtcgacgag ctcgcgagct 42600
cggacatgag gttgccccgt attcagtgtc gctgatttgt attgtctgaa gttgttttta 42660
cgttaagttg atgcagatca attaatacga tacctgcgtc ataattgatt atttgacgtg 42720
gtttgatggc ctccacgcac gttgtgatat gtagatgata atcattatca ctttacgggt 42780
cctttccggt gatccgacag gttacggggc ggcgacctcg cgggttttcg ctatttatga 42840
aaattttccg gtttaaggcg tttccgttct tcttcgtcat aacttaatgt ttttatttaa 42900
aataccctct gaaaagaaag gaaacgacag gtgctgaaag cgagcttttt ggcctctgtc 42960
gtttcctttc tctgtttttg tccgtggaat gaacaatgga agtccgagct catcgctaat 43020
aacttcgtat agcatacatt atacgaagtt atattcgatg cggccgcaag gggttcgcgt 43080
cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac 43140
tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 43200
tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 43260
cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 43320
cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact 43380
cactataggg cgaattcgag ctcggtaccc ggggatcctc gtttaaac 43428
<210> 9
<211> 45227
<212> DNA
<213> Simian adenovirus
<400> 9
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccgggccc cccctcgagg tcgacggtat cgataagctt cacgctgccg 1380
caagcactca gggcgcaagg gctgctaaag gaagcggaac acgtagaaag ccagtccgca 1440
gaaacggtgc tgaccccgga tgaatgtcag ctactgggct atctggacaa gggaaaacgc 1500
aagcgcaaag agaaagcagg tagcttgcag tgggcttaca tggcgatagc tagactgggc 1560
ggttttatgg acagcaagcg aaccggaatt gccagctggg gcgccctctg gtaaggttgg 1620
gaagccctgc aaagtaaact ggatggcttt cttgccgcca aggatctgat ggcgcagggg 1680
atcaagatct aaccaggagc tatttaatgg caacagttaa ccagctggta cgcaaaccac 1740
gtgctcgcaa agttgcgaaa agcaacgtgc ctgcgctgga agcatgcccg caaaaacgtg 1800
gcgtatgtac tcgtgtatat actaccactc ctaaaaaacc gaactccgcg ctgcgtaaag 1860
tatgccgtgt tcgtctgact aacggtttcg aagtgacttc ctacatcggt ggtgaaggtc 1920
acaacctgca ggagcactcc gtgatcctga tccgtggcgg tcgtgttaaa gacctcccgg 1980
gtgttcgtta ccacaccgta cgtggtgcgc ttgactgctc cggcgttaaa gaccgtaagc 2040
aggctcgttc caagtatggc gtgaagcgtc ctaaggctta atggtagatc tgatcaagag 2100
acaggatgac ggtcgtttcg catgcttgaa caagatggat tgcacgcagg ttctccggcc 2160
gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 2220
gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 2280
tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg 2340
ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 2400
ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 2460
tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 2520
gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 2580
gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 2640
ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 2700
ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 2760
gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 2820
ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 2880
atcgccttct atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga 2940
ccgaccaagc gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg 3000
aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg 3060
atctcatgct ggagttcttc gcccaccccg ggctcgatcc cctcgggggg aatcagaatt 3120
cagtcgacag cggccgcgat ctgctgtgcc ttctagttgc cagccatctg ttgtttgccc 3180
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 3240
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 3300
gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 3360
ctctatggcc gatcagcgat cgctgaggtg ggtgagtggg cgtggcctgg ggtggtcatg 3420
aaaatatata agttgggggt cttagggtct ctttatttgt gttgcagaga ccgccggagc 3480
catgagcggg agcagcagca gcagcagtag cagcagcgcc ttggatggca gcatcgtgag 3540
cccttatttg acgacgcgga tgccccactg ggccggggtg cgtcagaatg tgatgggctc 3600
cagcatcgac ggccgacccg tcctgcccgc aaattccgcc acgctgacct atgcgaccgt 3660
cgcggggacg ccgttggacg ccaccgccgc cgccgccgcc accgcagccg cctcggccgt 3720
gcgcagcctg gccacggact ttgcattcct gggaccactg gcgacagggg ctacttctcg 3780
ggccgctgct gccgccgttc gcgatgacaa gctgaccgcc ctgctggcgc agttggatgc 3840
gcttactcgg gaactgggtg acctttctca gcaggtcatg gccctgcgcc agcaggtctc 3900
ctccctgcaa gctggcggga atgcttctcc cacaaatgcc gtttaagata aataaaacca 3960
gactctgttt ggattaaaga aaagtagcaa gtgcattgct ctctttattt cataattttc 4020
cgcgcgcgat aggccctaga ccagcgttct cggtcgttga gggtgcggtg tatcttctcc 4080
aggacgtggt agaggtggct ctggacgttg agatacatgg gcatgagccc gtcccggggg 4140
tggaggtagc accactgcag agcttcatgc tccggggtgg tgttgtagat gatccagtcg 4200
tagcaggagc gctgggcatg gtgcctaaaa atgtccttca gcagcaggcc gatggccagg 4260
gggaggccct tggtgtaagt gtttacaaaa cggttaagtt gggaagggtg cattcgggga 4320
gagatgatgt gcatcttgga ctgtattttt agattggcga tgtttccgcc cagatccctt 4380
ctgggattca tgttgtgcag gaccaccagt acagtgtatc cggtgcactt ggggaatttg 4440
tcatgcagct tagagggaaa agcgtggaag aacttggaga cgcctttgtg gcctcccaga 4500
ttttccatgc attcgtccat gatgatggca atgggcccgc gggaggcagc ttgggcaaag 4560
atatttctgg ggtcgctgac gtcgtagttg tgttccaggg tgaggtcgtc ataggccatt 4620
tttacaaagc gcgggcggag ggtgcccgac tgggggatga tggtcccctc tggccctggg 4680
gcgtagttgc cctcgcagat ctgcatttcc caggccttaa tctcggaggg gggaatcata 4740
tccacctgcg gggcgatgaa gaaaacggtt tccggagccg gggagattaa ctgggatgag 4800
agcaggtttc taagcagctg tgattttcca caaccggtgg gcccataaat aacacctata 4860
accggttgca gctggtagtt tagagagctg cagctgccgt cgtcccggag gaggggggcc 4920
acctcgttga gcatgtccct gacgcgcatg ttctccccga ccagatccgc cagaaggcgc 4980
tcgccgccca gggacagcag ctcttgcaag gaagcaaagt ttttcagcgg cttgaggccg 5040
tccgccgtgg gcatgttttt cagggtctgg ctcagcagct ccaggcggtc ccagagctcg 5100
gtgacgtgct ctacggcatc tctatccagc atatctcctc gtttcgcggg ttggggcgac 5160
tttcgctgta gggcaccaag cggtggtcgt ccagcggggc cagagtcatg tccttccatg 5220
ggcgcagggt cctcgtcagg gtggtctggg tcacggtgaa ggggtgcgct ccgggctgag 5280
cgcttgccaa ggtgcgcttg aggctggttc tgctggtgct gaagcgctgc cggtcttcgc 5340
cctgcgcgtc ggccaggtag catttgacca tggtgtcata gtccagcccc tccgcggcgt 5400
gtcccttggc gcgcagcttg cccttggagg tggcgccgca cgaggggcag agcaggctct 5460
tgagcgcgta gagcttgggg gcgaggaaga ccgattcggg ggagtaggcg tccgcgccgc 5520
agaccccgca cacggtctcg cactccacca gccaggtgag ctcggggcgc gccgggtcaa 5580
aaaccaggtt tcccccatgc tttttgatgc gtttcttacc tcgggtctcc atgaggtggt 5640
gtccccgctc ggtgacgaag aggctgtccg tgtctccgta gaccgacttg aggggtcttt 5700
tctccagggg ggtccctcgg tcttcctcgt agaggaactc ggaccactct gagacgaagg 5760
cccgcgtcca ggccaggacg aaggaggcta tgtgggaggg gtagcggtcg ttgtccacta 5820
gggggtccac cttctccaag gtgtgaagac acatgtcgcc ttcctcggcg tccaggaagg 5880
tgattggctt gtaggtgtag gccacgtgac cgggggttcc tgacgggggg gtataaaagg 5940
gggtgggggc gcgctcgtcg tcactctctt ccgcatcgct gtctgcgagg gccagctgct 6000
ggggtgagta ttccctctcg aaggcgggca tgacctccgc gctgaggttg tcagtttcca 6060
aaaacgagga ggatttgatg ttcacctgtc ccgaggtgat acctttgagg gtacccgcgt 6120
ccatctggtc agaaaacacg atctttttat tgtccagctt ggtggcgaac gacccgtaga 6180
gggcgttgga gagcagcttg gcgatggagc gcagggtctg gttcttgtcc ctgtcggcgc 6240
gctccttggc cgcgatgttg agctgcacgt actcgcgcgc gacgcagcgc cactcgggga 6300
agacggtggt gcgctcgtcg ggcaccaggc gcacgcgcca gccgcggttg tgcagggtga 6360
ccaggtccac gctggtggcg acctcgccgc gcaggcgctc gttggtccag cagagacggc 6420
cgcccttgcg cgagcagaag gggggcaggg ggtcgagctg ggtctcgtcc ggggggtccg 6480
cgtccacggt gaaaaccccg gggcgcaggc gcgcgtcgaa gtagtctatc ttgcaacctt 6540
gcatgtccag cgcctgctgc cagtcgcggg cggcgagcgc gcgctcgtag gggttgagcg 6600
gcgggcccca gggcatgggg tgggtgagtg cggaggcgta catgccgcag atgtcataga 6660
cgtagagggg ctcccgcagg accccgatgt aggtggggta gcagcggccg ccgcggatgc 6720
tggcgcgcac gtagtcatac agctcgtgcg agggggcgag gaggtcgggg cccaggttgg 6780
tgcgggcggg gcgctccgcg cggaagacga tctgcctgaa gatggcatgc gagttggaag 6840
agatggtggg gcgctggaag acgttgaagc tggcgtcctg caggccgacg gcgtcgcgca 6900
cgaaggaggc gtaggagtcg cgcagcttgt gtaccagctc ggcggtgacc tgcacgtcga 6960
gcgcgcagta gtcgagggtc tcgcggatga tgtcatattt agcctgcccc ttctttttcc 7020
acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcgggaaac 7080
cgtccggttc cgaacggtaa gagcctagca tgtagaactg gttgacggcc tggtaggcgc 7140
agcagccctt ctccacgggg agggcgtagg cctgcgcggc cttgcggagc gaggtgtggg 7200
tcagggcgaa ggtgtccctg accatgactt tgaggtactg gtgcttgaag tcggagtcgt 7260
cgcagccgcc ccgctcccag agcgagaagt cggtgcgctt cttggagcgg gggttgggca 7320
gagcgaaggt gacatcgttg aagaggattt tgcccgcgcg gggcatgaag ttgcgggtga 7380
tgcggaaggg ccccggcact tcagagcggt tgttgatgac ctgggcggcg agcacgatct 7440
cgtcgaagcc gttgatgttg tggcccacga tgtagagttc caggaagcgg ggccggccct 7500
ttacggtggg cagcttcttt agctcttcgt aggtgagctc ctcgggcgag gcgaggccgt 7560
gctcggccag ggcccagtcc gcgaggtgcg ggttgtctct gaggaaggac ttccagaggt 7620
cgcgggccag gagggtctgc aggcggtctc tgaaggtcct gaactggcgg cccacggcca 7680
ttttttcggg ggtgatgcag tagaaggtga gggggtcttg ctgccagcgg tcccagtcga 7740
gctgcagggc gaggtcgcgc gcggcggtga ccaggcgctc gtcgcccccg aatttcatga 7800
ccagcatgaa gggcacgagc tgctttccga aggcccccat ccaagtgtag gtctctacat 7860
cgtaggtgac aaagaggcgc tccgtgcgag gatgcgagcc gatcgggaag aactggatct 7920
cccgccacca gttggaggag tggctgttga tgtggtggaa gtagaagtcc cgtcgccggg 7980
ccgaacactc gtgctggctt ttgtaaaagc gagcgcagta ctggcagcgc tgcacgggct 8040
gtacctcatg cacgagatgc acctttcgcc cgcgcacgag gaagccgagg ggaaatctga 8100
gccccccgcc tggctcgcgg catggctggt tctcttctac tttggatgcg tgtccgtctc 8160
cgtctggctc ctcgaggggt gttacggtgg agcggaccac cacgccgcgc gagccgcagg 8220
tccagatatc ggcgcgcggc ggtcggagtt tgatgacgac atcgcgcagc tgggagctgt 8280
ccatggtctg gagctcccgc ggcggcggca ggtcagccgg gagttcttgc aggttcacct 8340
cgcagagtcg ggccagggcg cggggcaggt ctaggtggta cctgatctct aggggcgtgt 8400
tggtggcggc gtcgatggct tgcaggagcc cgcagccccg gggggcgacg acggtgcccc 8460
gcggggtggt ggtggtggtg gcggtgcagc tcagaagcgg tgccgcgggc gggcccccgg 8520
aggtaggggg ggctccggtc ccgcgggcag gggcggcagc ggcacgtcgg cgtggagcgc 8580
gggcaggagt tggtgctgtg cccggaggtt gctggcgaag gcgacgacgc ggcggttgat 8640
ctcctggatc tggcgcctct gcgtgaagac gacgggcccg gtgagcttga acctgaaaga 8700
gagttcgaca gaatcaatct cggtgtcatt gaccgcggcc tggcgcagga tctcctgcac 8760
gtctcccgag ttgtcttggt aggcgatctc ggccatgaac tgctcgatct cttcctcctg 8820
gaggtctccg cgtccggcgc gttccacggt ggccgccagg tcgttggaga tgcgccccat 8880
gagctgcgag aaggcgttga gtccgccctc gttccagact cggctgtaga ccacgccccc 8940
ctggtcatcg cgggcgcgca tgaccacctg cgcgaggttg agctccacgt gccgcgcgaa 9000
gacggcgtag ttgcgcagac gctggaagag gtagttgagg gtggtggcgg tgtgctcggc 9060
cacgaagaag ttcatgaccc agcggcgcaa cgtggattcg ttgatgtccc ccaaggcctc 9120
cagccgttcc atggcctcgt agaagtccac ggcgaagttg aaaaactggg agttgcgcgc 9180
cgacacggtc aactcctcct ccagaagacg gatgagctcg gcgacggtgt cgcgcacctc 9240
gcgctcgaag gctatgggga tctcttcctc cgctagcatc accacctcct cctcttcctc 9300
ctcttctggc acttccatga tggcttcctc ctcttcgggg ggtggcggcg gcggcggtgg 9360
gggagggggc gctctgcgcc ggcggcggcg caccgggagg cggtccacga agcgcgcgat 9420
catctccccg cggcggcggc gcatggtctc ggtgacggcg cggccgttct cccgggggcg 9480
cagttggaag acgccgccgg acatctggtg ctggggcggg tggccgtgag gcagcgagac 9540
ggcgctgacg atgcatctca acaattgctg cgtaggtacg ccgccgaggg acctgaggga 9600
gtccatatcc accggatccg aaaacctttc gaggaaggcg tctaaccagt cgcagtcgca 9660
aggtaggctg agcaccgtgg cgggcggcgg ggggtggggg gagtgtctgg cggaggtgct 9720
gctgatgatg taattgaagt aggcggactt gacacggcgg atggtcgaca ggagcaccat 9780
gtccttgggt ccggcctgct ggatgcggag gcggtcggct atgccccagg cttcgttctg 9840
gcatcggcgc aggtccttgt agtagtcttg catgagcctt tccaccggca cctcttctcc 9900
ttcctcttct gcttcttcca tgtctgcttc ggccctgggg cggcgccgcg cccccctgcc 9960
ccccatgcgc gtgaccccga accccctgag cggttggagc agggccaggt cggcgacgac 10020
gcgctcggcc aggatggcct gctgcacctg cgtgagggtg gtttggaagt catccaagtc 10080
cacgaagcgg tggtaggcgc ccgtgttgat ggtgtaggtg cagttggcca tgacggacca 10140
gttgacggtc tggtggcccg gttgcgacat ctcggtgtac ctgagtcgcg agtaggcgcg 10200
ggagtcgaag acgtagtcgt tgcaagtccg caccaggtac tggtagccca ccaggaagtg 10260
cggcggcggc tggcggtaga ggggccagcg cagggtggcg ggggctccgg gggccaggtc 10320
ttccagcatg aggcggtggt aggcgtagat gtacctggac atccaggtga tacccgcggc 10380
ggtggtggag gcgcgcggga agtcgcgcac ccggttccag atgttgcgca ggggcagaaa 10440
gtgctccatg gtaggcgtgc tctgtccagt cagacgcgcg cagtcgttga tactctagac 10500
cagggaaaac gaaagccggt cagcgggcac tcttccgtgg tctggtgaat agatcgcaag 10560
ggtatcatgg cggagggcct cggttcgagc cccgggtccg ggccggacgg tccgccatga 10620
tccacgcggt taccgcccgc gtgtcgaacc caggtgtgcg acgtcagaca acggtggagt 10680
gttccttttg gcgtttttct ggccgggcgc cggcgccgcg taagagacta agccgcgaaa 10740
gcgaaagcag taagtggctc gctccccgta gccggaggga tccttgctaa gggttgcgtt 10800
gcggcgaacc ccggttcgaa tcccgtactc gggccggccg gacccgcggc taaggtgttg 10860
gattggcctc cccctcgtat aaagaccccg cttgcggatt gactccggac acggggacga 10920
gcccctttta tttttgcttt ccccagatgc atccggtgct gcggcagatg cgccccccgc 10980
cccagcagca gcaacaacac cagcaagagc ggcagcaaca gcagcgggag tcatgcaggg 11040
ccccctcacc caccctcggc gggccggcca cctcggcgtc cgcggccgtg tctggcgcct 11100
gcggcggcgg cggggggccg gctgacgacc ccgaggagcc cccgcggcgc agggccagac 11160
actacctgga cctggaggag ggcgagggcc tggcgcggct gggggcgccg tctcccgagc 11220
gccacccgcg ggtgcagctg aagcgcgact cgcgcgaggc gtacgtgcct cggcagaacc 11280
tgttcaggga ccgcgcgggc gaggagcccg aggagatgcg ggacaggagg ttcagcgcag 11340
ggcgggagct gcggcagggg ctgaaccgcg agcggctgct gcgcgaggag gactttgagc 11400
ccgacgcgcg gacggggatc agccccgcgc gcgcgcacgt ggcggccgcc gacctggtga 11460
cggcgtacga gcagacggtg aaccaggaga tcaacttcca aaagagtttc aacaaccacg 11520
tgcgcacgct ggtggcgcgc gaggaggtga ccatcgggct gatgcacctg tgggactttg 11580
taagcgcgct ggtgcagaac cccaacagca agcctctgac ggcgcagctg ttcctgatag 11640
tgcagcacag cagggacaac gaggcgttta gggacgcgct gctgaacatc accgagcccg 11700
agggtcggtg gctgctggac ctgattaaca tcctgcagag catagtggtg caggagcgca 11760
gcctgagcct ggccgacaag gtggcggcca tcaactactc gatgctgagc ctgggcaagt 11820
tttacgcgcg caagatctac cagacgccgt acgtgcccat agacaaggag gtgaagatcg 11880
acggttttta catgcgcatg gcgctgaagg tgctcaccct gagcgacgac ctgggcgtgt 11940
accgcaacga gcgcatccac aaggccgtga gcgtgagccg gcggcgcgag ctgagcgacc 12000
gcgagctgat gcacagcctg cagcgggcgc tggcgggcgc cggcagcggc gacagggagg 12060
cggagtccta cttcgatgcg ggggcggacc tgcgctgggc gcccagccgg cgggccctgg 12120
aggccgcggg ggtccgcgag gactatgacg aggacggcga ggaggatgag gagtacgagc 12180
tagaggaggg cgagtacctg gactaaaccg cgggtggtgt ttccggtaga tgcaagaccc 12240
gaacgtggtg gacccggcgc tgcgggcggc tctgcagagc cagccgtccg gccttaactc 12300
ctcagacgac tggcgacagg tcatggaccg catcatgtcg ctgacggcgc gtaacccgga 12360
cgcgttccgg cagcagccgc aggccaacag gctctccgcc atcctggagg cggtggtgcc 12420
tgcgcgctcg aaccccacgc acgagaaggt gctggccata gtgaacgcgc tggccgagaa 12480
cagggccatc cgcccggacg aggccgggct ggtgtacgac gcgctgctgc agcgcgtggc 12540
ccgctacaac agcggcaacg tgcagaccaa cctggaccgg ctggtggggg acgtgcgcga 12600
ggcggtggcg cagcgcgagc gcgcggatcg gcagggcaac ctgggctcca tggtggcgct 12660
gaatgccttc ctgagcacgc agccggccaa cgtgccgcgg gggcaggaag actacaccaa 12720
ctttgtgagc gcgctgcggc tgatggtgac cgagaccccc cagagcgagg tgtaccagtc 12780
gggcccggac tacttcttcc agaccagcag acagggcctg cagacggtga acctgagcca 12840
ggctttcaag aacctgcggg ggctgtgggg cgtgaaggcg cccaccggcg accgggcgac 12900
ggtgtccagc ctgctgacgc ccaactcgcg cctgctgctg ctgctgatcg cgccgttcac 12960
ggacagcggc agcgtgtccc gggacaccta cctggggcac ctgctgaccc tgtaccgcga 13020
ggccatcggg caggcgcagg tggacgagca caccttccag gagatcacca gcgtgagccg 13080
cgcgctgggg caggaggaca cgagcagcct ggaggcgact ctgaactacc tgctgaccaa 13140
ccggcggcag aagattccct cgctgcacag cctgacctcc gaggaggagc gcatcttgcg 13200
ctacgtgcag cagagcgtga gcctgaacct gatgcgcgac ggggtgacgc ccagcgtggc 13260
gctggacatg accgcgcgca acatggaacc gggcatgtac gccgcgcacc ggccttacat 13320
caaccgcctg atggactacc tgcatcgcgc ggcggccgtg aaccccgagt actttaccaa 13380
cgccatcctg aacccgcact ggctcccgcc gcccgggttc tacagcgggg gcttcgaggt 13440
cccggagacc aacgatggct tcctgtggga cgacatggac gacagcgtgt tctccccgcg 13500
gccgcaggcg ctggcggaag cgtccctgct gcgtcccaag aaggaggagg aggaggaggc 13560
gagtcgccgc cgcggcagca gcggcgtggc ttctctgtcc gagctggggg cggcagccgc 13620
cgcgcgcccc gggtccctgg gcggcagccc ctttccgagc ctggtggggt ctctgcacag 13680
cgagcgcacc acccgccctc ggctgctggg cgaggacgag tacctgaata actccctgct 13740
gcagccggtg cgggagaaaa acctgcctcc cgccttcccc aacaacggga tagagagcct 13800
ggtggacaag atgagcagat ggaagaccta tgcgcaggag cacagggacg cgcctgcgct 13860
ccggccgccc acgcggcgcc agcgccacga ccggcagcgg gggctggtgt gggatgacga 13920
ggactccgcg gacgatagca gcgtgctgga cctgggaggg agcggcaacc cgttcgcgca 13980
cctgcgcccc cgcctgggga ggatgtttta aaaaaaaaaa aaaaaagcaa gaagcatgat 14040
gcaaaaatta aataaaactc accaaggcca tggcgaccga gcgttggttt cttgtgttcc 14100
cttcagtatg cggcgcgcgg cgatgtacca ggagggacct cctccctctt acgagagcgt 14160
ggtgggcgcg gcggcggcgg cgccctcttc tccctttgcg tcgcagctgc tggagccgcc 14220
gtacgtgcct ccgcgctacc tgcggcctac gggggggaga aacagcatcc gttactcgga 14280
gctggcgccc ctgttcgaca ccacccgggt gtacctggtg gacaacaagt cggcggacgt 14340
ggcctccctg aactaccaga acgaccacag caattttttg accacggtca tccagaacaa 14400
tgactacagc ccgagcgagg ccagcaccca gaccatcaat ctggatgacc ggtcgcactg 14460
gggcggcgac ctgaaaacca tcctgcacac caacatgccc aacgtgaacg agttcatgtt 14520
caccaataag ttcaaggcgc gggtgatggt gtcgcgctcg cacaccaagg aagaccgggt 14580
ggagctgaag tacgagtggg tggagttcga gctgccagag ggcaactact ccgagaccat 14640
gaccattgac ctgatgaaca acgcgatcgt ggagcactat ctgaaagtgg gcaggcagaa 14700
cggggtcctg gagagcgaca tcggggtcaa gttcgacacc aggaacttcc gcctggggct 14760
ggaccccgtg accgggctgg ttatgcccgg ggtgtacacc aacgaggcct tccatcccga 14820
catcatcctg ctgcccggct gcggggtgga cttcacttac agccgcctga gcaacctcct 14880
gggcatccgc aagcggcagc ccttccagga gggcttcagg atcacctacg aggacctgga 14940
ggggggcaac atccccgcgc tcctcgatgt ggaggcctac caggatagct tgaaggaaaa 15000
tgaggcggga caggaggata ccgcccccgc cgcctccgcc gccgccgagc agggcgagga 15060
tgctgctgac accgcggccg cggacggggc agaggccgac cccgctatgg tggtggaggc 15120
tcccgagcag gaggaggaca tgaatgacag tgcggtgcgc ggagacacct tcgtcacccg 15180
gggggaggaa aagcaagcgg aggccgaggc cgcggccgag gaaaagcaac tggcggcagc 15240
agcggcggcg gcggcgttgg ccgcggcgga ggctgagtct gaggggacca agcccgccaa 15300
ggagcccgtg attaagcccc tgaccgaaga tagcaagaag cgcagttaca acctgctcaa 15360
ggacagcacc aacaccgcgt accgcagctg gtacctggcc tacaactacg gcgacccgtc 15420
gacgggggtg cgctcctgga ccctgctgtg cacgccggac gtgacctgcg gctcggagca 15480
ggtgtactgg tcgctgcccg acatgatgca agaccccgtg accttccgct ccacgcggca 15540
ggtcagcaac ttcccggtgg tgggcgccga gctgctgccc gtgcactcca agagcttcta 15600
caacgaccag gccgtctact cccagctcat ccgccagttc acctctctga cccacgtgtt 15660
caatcgcttt cctgagaacc agattctggc gcgcccgccc gcccccacca tcaccaccgt 15720
cagtgaaaac gttcctgctc tcacagatca cgggacgcta ccgctgcgca acagcatcgg 15780
aggagtccag cgagtgaccg ttactgacgc cagacgccgc acctgcccct acgtttacaa 15840
ggccttgggc atagtctcgc cgcgcgtcct ttccagccgc actttttgag caacaccacc 15900
atcatgtcca tcctgatctc acccagcaat aactccggct ggggactgct gcgcgcgccc 15960
agcaagatgt tcggaggggc gaggaagcgt tccgagcagc accccgtgcg cgtgcgcggg 16020
cacttccgcg ccccctgggg agcgcacaaa cgcggccgcg cggggcgcac caccgtggac 16080
gacgccatcg actcggtggt ggagcaggcg cgcaactaca ggcccgcggt ctctaccgtg 16140
gacgcggcca tccagaccgt ggtgcggggc gcgcggcggt acgccaagct gaagagccgc 16200
cggaagcgcg tggcccgccg ccaccgccgc cgacccgggg ccgccgccaa acgcgccgcc 16260
gcggccctgc ttcgccgggc caagcgcacg ggccgccgcg ccgccatgag ggccgcgcgc 16320
cgcttggccg ccggcatcac cgccgccacc atggcccccc gtacccgaag acgcgcggcc 16380
gccgccgccg ccgccgccat cagtgacatg gccagcaggc gccggggcaa cgtgtactgg 16440
gtgcgcgact cggtgaccgg cacgcgcgtg cccgtgcgct tccgcccccc gcggacttga 16500
gatgatgtga aaaaacaaca ctgagtctcc tgctgttgtg tgtatcccag cggcggcggc 16560
gcgcgcagcg tcatgtccaa gcgcaaaatc aaagaagaga tgctccaggt cgtcgcgccg 16620
gagatctatg ggcccccgaa gaaggaagag caggattcga agccccgcaa gataaagcgg 16680
gtcaaaaaga aaaagaaaga tgatgacgat gccgatgggg aggtggagtt cctgcgcgcc 16740
acggcgccca ggcgcccggt gcagtggaag ggccggcgcg taaagcgcgt cctgcgcccc 16800
ggcaccgcgg tggtcttcac gcccggcgag cgctccaccc ggactttcaa gcgcgtctat 16860
gacgaggtgt acggcgacga agacctgctg gagcaggcca acgagcgctt cggagagttt 16920
gcttacggga agcgtcagcg ggcgctgggg aaggaggacc tgctggcgct gccgctggac 16980
cagggcaacc ccacccccag tctgaagccc gtgaccctgc agcaggtgct gccgagcagc 17040
gcaccctccg aggcgaagcg gggtctgaag cgcgagggcg gcgacctggc gcccaccgtg 17100
cagctcatgg tgcccaagcg gcagaggctg gaggatgtgc tggagaaaat gaaagtagac 17160
cccggtctgc agccggacat cagggtccgc cccatcaagc aggtggcgcc gggcctcggc 17220
gtgcagaccg tggacgtggt catccccacc ggcaactccc ccgccgccgc caccactacc 17280
gctgcctcca cggacatgga gacacagacc gatcccgccg cagccgcagc cgcagccgcc 17340
gccgcgacct cctcggcgga ggtgcagacg gacccctggc tgccgccggc gatgtcagct 17400
ccccgcgcgc gtcgcgggcg caggaagtac ggcgccgcca acgcgctcct gcccgagtac 17460
gccttgcatc cttccatcgc gcccaccccc ggctaccgag gctataccta ccgcccgcga 17520
agagccaagg gttccacccg ccgtccccgc cgacgcgccg ccgccaccac ccgccgccgc 17580
cgccgcagac gccagcccgc actggctcca gtctccgtga ggaaagtggc gcgcgacgga 17640
cacaccctgg tgctgcccag ggcgcgctac caccccagca tcgtttaaaa gcctgttgtg 17700
gttcttgcag atatggccct cacttgccgc ctccgtttcc cggtgccggg ataccgagga 17760
ggaagatcgc gccgcaggag gggtctggcc ggccgcggcc tgagcggagg cagccgccgc 17820
gcgcaccggc ggcgacgcgc caccagccga cgcatgcgcg gcggggtgct gcccctgtta 17880
atccccctga tcgccgcggc gatcggcgcc gtgcccggga tcgcctccgt ggccttgcaa 17940
gcgtcccaga ggcattgaca gacttgcaaa cttgcaaata tggaaaaaaa aaccccaata 18000
aaaaagtcta gactctcacg ctcgcttggt cctgtgacta ttttgtagaa tggaagacat 18060
caactttgcg tcgctggccc cgcgtcacgg ctcgcgcccg ttcctgggac actggaacga 18120
tatcggcacc agcaacatga gcggtggcgc cttcagttgg ggctctctgt ggagcggcat 18180
taaaagtatc gggtctgccg ttaaaaatta cggctcccgg gcctggaaca gcagcacggg 18240
ccagatgttg agagacaagt tgaaagagca gaacttccag cagaaggtgg tggagggcct 18300
ggcctccggc atcaacgggg tggtggacct ggccaaccag gccgtgcaga ataagatcaa 18360
cagcagactg gacccccggc cgccggtgga ggaggtgccg ccggcgctgg agacggtgtc 18420
ccccgatggg cgtggcgaga agcgcccgcg gcccgatagg gaagagacca ctctggtcac 18480
gcagaccgat gagccgcccc cgtatgagga ggccctgaag caaggtctgc ccaccacgcg 18540
gcccatcgcg cccatggcca ccggggtggt gggccgccac acccccgcca cgctggactt 18600
gcctccgccc gccgatgtgc cgcagcagca gaaggcggca cagccgggcc cgcccgcgac 18660
cgcctcccgt tcctccgccg gtcctctgcg ccgcgcggcc agcggccccc gcgggggggt 18720
cgcgaggcac ggcaactggc agagcacgct gaacagcatc gtgggtctgg gggtgcggtc 18780
cgtgaagcgc cgccgatgct actgaatagc ttagctaacg tgttgtatgt gtgtatgcgc 18840
cctatgtcgc cgccagagga gctgctgagt cgccgccgtt cgcgcgccca ccaccaccgc 18900
cactccgccc ctcaagatgg cgaccccatc gatgatgccg cagtggtcgt acatgcacat 18960
ctcgggccag gacgcctcgg agtacctgag ccccgggctg gtgcagttcg cccgcgccac 19020
cgagagctac ttcagcctga gtaacaagtt taggaacccc acggtggcgc ccacgcacga 19080
tgtgaccacc gaccggtctc agcgcctgac gctgcggttc attcccgtgg accgcgagga 19140
caccgcgtac tcgtacaagg cgcggttcac cctggccgtg ggcgacaacc gcgtgctgga 19200
catggcctcc acctactttg acatccgcgg ggtgctggac cggggtccca ctttcaagcc 19260
ctactctggc accgcctaca actccctggc ccccaagggc gctcccaact cctgcgagtg 19320
ggagcaagag gaaactcagg cagttgaaga agcagcagaa gaggaagaag aagatgctga 19380
cggtcaagct gaggaagagc aagcagctac caaaaagact catgtatatg ctcaggctcc 19440
cctttctggc gaaaaaatta gtaaagatgg tctgcaaata ggaacggacg ctacagctac 19500
agaacaaaaa cctatttatg cagaccctac attccagccc gaaccccaaa tcggggagtc 19560
ccagtggaat gaggcagatg ctacagtcgc cggcggtaga gtgctaaaga aatctactcc 19620
catgaaacca tgctatggtt cctatgcaag acccacaaat gctaatggag gtcagggtgt 19680
actaacggca aatgcccagg gacagctaga atctcaggtt gaaatgcaat tcttttcaac 19740
ttctgaaaac gcccgtaacg aggctaacaa cattcagccc aaattggtgc tgtatagtga 19800
ggatgtgcac atggagaccc cggatacgca cctttcttac aagcccgcaa aaagcgatga 19860
caattcaaaa atcatgctgg gtcagcagtc catgcccaac agacctaatt acatcggctt 19920
cagagacaac tttatcggcc tcatgtatta caatagcact ggcaacatgg gagtgcttgc 19980
aggtcaggcc tctcagttga atgcagtggt ggacttgcaa gacagaaaca cagaactgtc 20040
ctaccagctc ttgcttgatt ccatgggtga cagaaccaga tacttttcca tgtggaatca 20100
ggcagtggac agttatgacc cagatgttag aattattgaa aatcatggaa ctgaagacga 20160
gctccccaac tattgtttcc ctctgggtgg cataggggta actgacactt accaggctgt 20220
taaaaccaac aatggcaata acgggggcca ggtgacttgg acaaaagatg aaacttttgc 20280
agatcgcaat gaaatagggg tgggaaacaa tttcgctatg gagatcaacc tcagtgccaa 20340
cctgtggaga aacttcctgt actccaacgt ggcgctgtac ctaccagaca agcttaagta 20400
caacccctcc aatgtggaca tctctgacaa ccccaacacc tacgattaca tgaacaagcg 20460
agtggtggcc ccggggctgg tggactgcta catcaacctg ggcgcgcgct ggtcgctgga 20520
ctacatggac aacgtcaacc ccttcaacca ccaccgcaat gcgggcctgc gctaccgctc 20580
catgctcctg ggcaacgggc gctacgtgcc cttccacatc caggtgcccc agaagttctt 20640
tgccatcaag aacctcctcc tcctgccggg ctcctacacc tacgagtgga acttcaggaa 20700
ggatgtcaac atggtcctcc agagctctct gggtaacgat ctcagggtgg acggggccag 20760
catcaagttc gagagcatct gcctctacgc caccttcttc cccatggccc acaacacggc 20820
ctccacgctc gaggccatgc tcaggaacga caccaacgac cagtccttca atgactacct 20880
ctccgccgcc aacatgctct accccatacc cgccaacgcc accaacgtcc ccatctccat 20940
cccctcgcgc aactgggcgg ccttccgcgg ctgggccttc acccgcctca agaccaagga 21000
gaccccctcc ctgggctcgg gattcgaccc ctactacacc tactcgggct ccattcccta 21060
cctggacggc accttctacc tcaaccacac tttcaagaag gtctcggtca ccttcgactc 21120
ctcggtcagc tggccgggca acgaccgtct gctcaccccc aacgagttcg agatcaagcg 21180
ctcggtcgac ggggagggct acaacgtggc ccagtgcaac atgaccaagg actggttcct 21240
ggtccagatg ctggccaact acaacatcgg ctaccagggc ttctacatcc cagagagcta 21300
caaggacagg atgtactcct tcttcaggaa cttccagccc atgagccggc aggtggtgga 21360
ccagaccaag tacaaggact accaggaggt gggcatcatc caccagcaca acaactcggg 21420
cttcgtgggc tacctcgccc ccaccatgcg cgagggacag gcctaccccg ccaacttccc 21480
ctatccgctc ataggcaaga ccgcggtcga cagcatcacc cagaaaaagt tcctctgcga 21540
ccgcaccctc tggcgcatcc ccttctccag caacttcatg tccatgggtg cgctctcgga 21600
cctgggccag aacttgctct acgccaactc cgcccacgcc ctcgacatga ccttcgaggt 21660
cgaccccatg gacgagccca cccttctcta tgttctgttc gaagtctttg acgtggtccg 21720
ggtccaccag ccgcaccgcg gcgtcatcga gaccgtgtac ctgcgtacgc ccttctcggc 21780
cggcaacgcc accacctaaa gaagcaagcc gcagtcatcg ccgcctgcat gccgtcgggt 21840
tccaccgagc aagagctcag ggccatcgtc agagacctgg gatgcgggcc ctattttttg 21900
ggcaccttcg acaagcgctt ccctggcttt gtctccccac acaagctggc ctgcgccatc 21960
gtcaacacgg ccggccgcga gaccgggggc gtgcactggc tggccttcgc ctggaacccg 22020
cgctccaaaa catgcttcct ctttgacccc ttcggctttt cggaccagcg gctcaagcaa 22080
atctacgagt tcgagtacga gggcttgctg cgtcgcagcg ccatcgcctc ctcgcccgac 22140
cgctgcgtca ccctcgaaaa gtccacccag accgtgcagg ggcccgactc ggccgcctgc 22200
ggtctcttct gctgcatgtt tctgcacgcc tttgtgcact ggcctcagag tcccatggac 22260
cgcaacccca ccatgaactt gctgacgggg gtgcccaact ccatgctcca gagcccccag 22320
gtcgagccca ccctgcgccg caaccaggag cagctctaca gcttcctgga gcgccactcg 22380
ccttacttcc gccgccacag cgcacagatc aggagggcca cctccttctg ccacttgcaa 22440
gagatgcaag aagggtaata acgatgtaca cacttttttt ctcaataaat ggcatctttt 22500
tatttataca agctctctgg ggtattcatt tcccaccacc acccgccgtt gtcgccatct 22560
ggctctattt agaaatcgaa agggttctgc cgggagtcgc cgtgcgccac gggcagggac 22620
acgttgcgat actggtagcg ggtgccccac ttgaactcgg gcaccaccag gcgaggcagc 22680
tcggggaagt tttcgctcca caggctgcgg gtcagcacca gcgcgttcat caggtcgggc 22740
gccgagatct tgaagtcgca gttggggccg ccgccctgcg cgcgcgagtt gcggtacacc 22800
gggttgcagc actggaacac caacagcgcc gggtgcttca cgctggccag cacgctgcgg 22860
tcggagatca gctcggcgtc caggtcctcc gcgttgctca gcgcgaacgg ggtcatcttg 22920
ggcacttgcc gccccaggaa gggcgcgtgc cccggtttcg agttgcagtc gcagcgcagc 22980
gggatcagca ggtgcccgtg cccggactcg gcgttggggt acagcgcgcg catgaaggcc 23040
tgcatctggc ggaaggccat ctgggccttg gcgccctccg agaagaacat gccgcaggac 23100
ttgcccgaga actggtttgc ggggcagctg gcgtcgtgca ggcagcagcg cgcgtcggtg 23160
ttggcgatct gcaccacgtt gcgcccccac cggttcttca cgatcttggc cttggacgat 23220
tgctccttca gcgcgcgctg cccgttctcg ctggtcacat ccatctcgat cacatgttcc 23280
ttgttcacca tgctgctgcc gtgcagacac ttcagctcgc cctccgtctc ggtgcagcgg 23340
tgctgccaca gcgcgcagcc cgtgggctcg aaagacttgt aggtcacctc cgcgaaggac 23400
tgcaggtacc cctgcaaaaa gcggcccatc atggtcacga aggtcttgtt gctgctgaag 23460
gtcagctgca gcccgcggtg ctcctcgttc agccaggtct tgcacacggc cgccagcgcc 23520
tccacctggt cgggcagcat cttgaagttc accttcagct cattctccac gtggtacttg 23580
tccatcagcg tgcgcgccgc ctccatgccc ttctcccagg ccgacaccag cggcaggctc 23640
acggggttct tcaccatcac cgtggccgcc gcctccgccg cgctttcgct ttccgccccg 23700
ctgttctctt cctcttcctc ctcttcctcg ccgccgccca ctcgcagccc ccgcaccacg 23760
gggtcgtctt cctgcaggcg ctgcaccttg cgcttgccgt tgcgcccctg cttgatgcgc 23820
acgggcgggt tgctgaagcc caccatcacc agcgcggcct cttcttgctc gtcctcgctg 23880
tccagaatga cctccgggga gggggggttg gtcatcctca gtaccgaggc acgcttcttt 23940
ttcttcctgg gggcgttcgc cagctccgcg gctgcggccg ctgccgaggt cgaaggccga 24000
gggctgggcg tgcgcggcac cagcgcgtcc tgcgagccgt cctcgtcctc ctcggactcg 24060
agacggaggc gggcccgctt cttcgggggc gcgcggggcg gcggaggcgg cggcggcgac 24120
ggagacgggg acgagacatc gtccagggtg ggtggacggc gggccgcgcc gcgtccgcgc 24180
tcgggggtgg tctcgcgctg gtcctcttcc cgactggcca tctcccactg ctccttctcc 24240
tataggcaga aagagatcat ggagtctctc atgcgagtcg agaaggagga ggacagccta 24300
accgccccct ctgagccctc caccaccgcc gccaccaccg ccaatgccgc cgcggacgac 24360
gcgcccaccg agaccaccgc cagtaccacc ctccccagcg acgcaccccc gctcgagaat 24420
gaagtgctga tcgagcagga cccgggtttt gtgagcggag aggaggatga ggtggatgag 24480
aaggagaagg aggaggtcgc cgcctcagtg ccaaaagagg ataaaaagca agaccaggac 24540
gacgcagata aggatgagac agcagtcggg cgggggaacg gaagccatga tgctgatgac 24600
ggctacctag acgtgggaga cgacgtgctg cttaagcacc tgcaccgcca gtgcgtcatc 24660
gtctgcgacg cgctgcagga gcgctgcgaa gtgcccctgg acgtggcgga ggtcagccgc 24720
gcctacgagc ggcacctctt cgcgccgcac gtgcccccca agcgccggga gaacggcacc 24780
tgcgagccca acccgcgtct caacttctac ccggtcttcg cggtacccga ggtgctggcc 24840
acctaccaca tctttttcca aaactgcaag atccccctct cctgccgcgc caaccgcacc 24900
cgcgccgaca aaaccctgac cctgcggcag ggcgcccaca tacctgatat cgcctctctg 24960
gaggaagtgc ccaagatctt cgagggtctc ggtcgcgacg agaaacgggc ggcgaacgct 25020
ctgcacggag acagcgaaaa cgagagtcac tcgggggtgc tggtggagct cgagggcgac 25080
aacgcgcgcc tggccgtact caagcgcagc atagaggtca cccactttgc ctacccggcg 25140
ctcaacctgc cccccaaggt catgagtgtg gtcatgggcg agctcatcat gcgccgcgcc 25200
cagcccctgg ccgcggatgc aaacttgcaa gagtcctccg aggaaggcct gcccgcggtc 25260
agcgacgagc agctggcgcg ctggctggag acccgcgacc ccgcgcagct ggaggagcgg 25320
cgcaagctca tgatggccgc ggtgctggtc accgtggagc tcgagtgtct gcagcgcttc 25380
ttcgcggacc ccgagatgca gcgcaagctc gaggagaccc tgcactacac cttccgccag 25440
ggctacgtgc gccaggcctg caagatctcc aacgtggagc tctgcaacct ggtctcctac 25500
ctgggcatcc tgcacgagaa ccgcctcggg cagaacgtcc tgcactccac cctcaaaggg 25560
gaggcgcgcc gcgactacat ccgcgactgc gcctacctct tcctctgcta cacctggcag 25620
acggccatgg gggtctggca gcagtgcctg gaggagcgca acctcaagga gctggaaaag 25680
ctcctcaagc gcaccctcag ggacctctgg acgggcttca acgagcgctc ggtggccgcc 25740
gcgctggcgg acatcatctt tcccgagcgc ctgctcaaga ccctgcagca gggcctgccc 25800
gacttcacca gccagagcat gctgcagaac ttcaggactt tcatcctgga gcgctcgggc 25860
atcctgccgg ccacttgctg cgcgctgccc agcgacttcg tgcccatcaa gtacagggag 25920
tgcccgccgc cgctctgggg ccactgctac ctcttccagc tggccaacta cctcgcctac 25980
cactcggacc tcatggaaga cgtgagcggc gagggcctgc tcgagtgcca ctgccgctgc 26040
aacctctgca cgccccaccg ctctctagtc tgcaacccgc agctgctcag cgagagtcag 26100
attatcggta ccttcgagct gcagggtccc tcgcctgacg agaagtccgc ggctccaggg 26160
ctgaaactca ctccggggct gtggacttcc gcctacctac gcaaatttgt acctgaggac 26220
taccacgccc acgagatcag gttctacgaa gaccaatccc gcccgcccaa ggcggagctc 26280
accgcctgcg tcatcaccca ggggcacatc ctgggccaat tgcaagccat caacaaagcc 26340
cgccgagagt tcttgctgaa aaagggtcgg ggggtgtacc tggaccccca gtccggcgag 26400
gagctaaacc cgctaccccc gccgccgccc cagcagcggg accttgcttc ccaggatggc 26460
acccagaaag aagcagcagc cgccgccgcc gccgcagcca tacatgcttc tggaggaaga 26520
ggaggaggac tgggacagtc aggcagagga ggtttcggac gaggagcagg aggagatgat 26580
ggaagactgg gaggaggaca gcagcctaga cgaggaagct tcagaggccg aagaggtggc 26640
agacgcaaca ccatcgccct cggtcgcagc cccctcgccg gggcccctga aatcctccga 26700
acccagcacc agcgctataa cctccgctcc tccggcgccg gcgccacccg cccgcagacc 26760
caaccgtaga tgggacacca caggaaccgg ggtcggtaag tccaagtgcc cgccgccgcc 26820
accgcagcag cagcagcagc agcgccaggg ctaccgctcg tggcgcgggc acaagaacgc 26880
catagtcgcc tgcttgcaag actgcggggg caacatctct ttcgcccgcc gcttcctgct 26940
attccaccac ggggtcgcct ttccccgcaa tgtcctgcat tactaccgtc atctctacag 27000
cccctactgc agcggcgacc cagaggcggc agcggcagcc acagcggcga ccaccaccta 27060
ggaagatatc ctccgcgggc aagacagcgg cagcagcggc caggagaccc gcggcagcag 27120
cggcgggagc ggtgggcgca ctgcgcctct cgcccaacga acccctctcg acccgggagc 27180
tcagacacag gatcttcccc actttgtatg ccatcttcca acagagcaga ggccaggagc 27240
aggagctgaa aataaaaaac agatctctgc gctccctcac ccgcagctgt ctgtatcaca 27300
aaagcgaaga tcagcttcgg cgcacgctgg aggacgcgga ggcactcttc agcaaatact 27360
gcgcgctcac tcttaaagac tagctccgcg cccttctcga atttaggcgg gagaaaacta 27420
cgtcatcgcc ggccgccgcc cagcccgccc agccgagatg agcaaagaga ttcccacgcc 27480
atacatgtgg agctaccagc cgcagatggg actcgcggcg ggagcggccc aggactactc 27540
cacccgcatg aactacatga gcgcgggacc ccacatgatc tcacaggtca acgggatccg 27600
cgcccagcga aaccaaatac tgctggaaca ggcggccatc accgccacgc cccgccataa 27660
tctcaacccc cgaaattggc ccgccgccct cgtgtaccag gaaaccccct ccgccaccac 27720
cgtactactt ccgcgtgacg cccaggccga agtccagatg actaactcag gggcgcagct 27780
cgcgggcggc tttcgtcacg gggcgcggcc gctccgacca ggtataagac acctgatgat 27840
cagaggccga ggtatccagc tcaacgacga gtcggtgagc tcttcgctcg gtctccgtcc 27900
ggacggaact ttccagctcg ccggatccgg ccgctcttcg ttcacgcccc gccaggcgta 27960
cctgactctg cagacctcgt cctcggagcc ccgctccggc ggcatcggaa ccctccagtt 28020
cgtggaggag ttcgtgccct cggtctactt caaccccttc tcgggacctc ccggacgcta 28080
ccccgaccag ttcattccga actttgacgc ggtgaaggac tcggcggacg gctacgactg 28140
aatgtcaggt gtcgaggcag agcagcttcg cctgagacac ctcgagcact gccgccgcca 28200
caagtgcttc gcccgcggtt ctggtgagtt ctgctacttt cagctacccg aggagcatac 28260
cgaggggccg gcgcacggcg tccgcctgac cacccagggc gaggttacct gttccctcat 28320
ccgggagttt accctccgtc ccctgctagt ggagcgggag cggggtccct gtgtcctaac 28380
tatcgcctgc aactgcccta accctggatt acatcaagat ctttgctgtc atctctgtgc 28440
tgagtttaat aaacgctgag atcagaatct actggggctc ctgtcgccat cctgtgaacg 28500
ccaccgtctt cacccacccc gaccaggccc aggcgaacct cacctgcggt ctgcatcgga 28560
gggccaagaa gtacctcacc tggtacttca acggcacccc ctttgtggtt tacaacagct 28620
tcgacgggga cggagtctcc ctgaaagacc agctctccgg tctcagctac tccatccaca 28680
agaacaccac cctccaactc ttccctccct acctgccggg aacctacgag tgcgtcaccg 28740
gccgctgcac ccacctcacc cgcctgatcg taaaccagag ctttccggga acagataact 28800
ccctcttccc cagaacagga ggtgagctca ggaaactccc cggggaccag ggcggagacg 28860
taccttcgac ccttgtgggg ttaggatttt ttattaccgg gttgctggct cttttaatca 28920
aagtttcctt gagatttgtt ctttccttct acgtgtatga acacctcaac ctccaataac 28980
tctacccttt cttcggaatc aggtgacttc tctgaaatcg ggcttggtgt gctgcttact 29040
ctgttgattt ttttccttat catactcagc cttctgtgcc tcaggctcgc cgcctgctgc 29100
gcacacatct atatctactg ctggttgctc aagtgcaggg gtcgccaccc aagatgaaca 29160
ggtacatggt cctatcgatc ctaggcctgc tggccctggc ggcctgcagc gccgccaaaa 29220
aagagattac ctttgaggag cccgcttgca atgtaacttt caagcccgag ggtgaccaat 29280
gcaccaccct cgtcaaatgc gttaccaatc atgagaggct gcgcatcgac tacaaaaaca 29340
aaactggcca gtttgcggtc tatagtgtgt ttacgcccgg agacccctct aactactctg 29400
tcaccgtctt ccagggcgga cagtctaaga tattcaatta cactttccct ttttatgagt 29460
tatgcgatgc ggtcatgtac atgtcaaaac agtacaacct gtggcctccc tctccccagg 29520
cgtgtgtgga aaatactggg tcttactgct gtatggcttt cgcaatcact acgctcgctc 29580
taatctgcac ggtgctatac ataaaattca ggcagaggcg aatctttatc gatgaaaaga 29640
aaatgccttg atcgctaaca ccggctttct atctgcagaa tgaatgcaat cacctcccta 29700
ctaatcacca ccaccctcct tgcgattgcc catgggttga cacgaatcga agtgccagtg 29760
gggtccaatg tcaccatggt gggccccgcc ggcaattcca ccctcatgtg ggaaaaattt 29820
gtccgcaatc aatgggttca tttctgctct aaccgaatca gtatcaagcc cagagccatc 29880
tgcgatgggc aaaatctaac tctgatcaat gtgcaaatga tggatgctgg gtactattac 29940
gggcagcggg gagaaatcat taattactgg cgaccccaca aggactacat gctgcatgta 30000
gtcgaggcac ttcccactac cacccccact accacctctc ccaccaccac caccactact 30060
actactacta ctactactac tactactacc actaccgctg cccgccatac ccgcaaaagc 30120
accatgatta gcacaaagcc ccctcgtgct cactcccacg ccggcgggcc catcggtgcg 30180
acctcagaaa ccaccgagct ttgcttctgc caatgcacta acgccagcgc tcatgaactg 30240
ttcgacctgg agaatgagga tgtccagcag agctccgctt gcctgaccca ggaggctgtg 30300
gagcccgttg ccctgaagca gatcggtgat tcaataattg actcttcttc ttttgccact 30360
cccgaatacc ctcccgattc tactttccac atcacgggta ccaaagaccc taacctctct 30420
ttctacctga tgctgctgct ctgtatctct gtggtctctt ccgcgctgat gttactgggg 30480
atgttctgct gcctgatctg ccgcagaaag agaaaagctc gctctcaggg ccaaccactg 30540
atgcccttcc cctacccccc ggattttgca gataacaaga tatgagctcg ctgctgacac 30600
taaccgcttt actagcctgc gctctaaccc ttgtcgcttg cgactcgaga ttccacaatg 30660
tcacagctgt ggcaggagaa aatgttactt tcaactccac ggccgatacc cagtggtcgt 30720
ggagtggctc aggtagctac ttaactatct gcaatagctc cacttccccc ggcatatccc 30780
caaccaagta ccaatgcaat gccagcctgt tcaccctcat caacgcttcc accctggaca 30840
atggactcta tgtaggctat gtaccctttg gtgggcaagg aaagacccac gcttacaacc 30900
tggaagttcg ccagcccaga accactaccc aagcttctcc caccaccacc accaccacca 30960
ccatcaccag cagcagcagc agcagcagcc acagcagcag cagcagatta ttgactttgg 31020
ttttggccag ctcatctgcc gctacccagg ccatctacag ctctgtgccc gaaaccactc 31080
agatccaccg cccagaaacg accaccgcca ccaccctaca cacctccagc gatcagatgc 31140
cgaccaacat cacccccttg gctcttcaaa tgggacttac aagccccact ccaaaaccag 31200
tggatgcggc cgaggtctcc gccctcgtca atgactgggc ggggctggga atgtggtggt 31260
tcgccatagg catgatggcg ctctgcctgc ttctgctctg gctcatctgc tgcctccacc 31320
gcaggcgagc cagacccccc atctatagac ccatcattgt cctgaacccc gataatgatg 31380
ggatccatag attggatggc ctgaaaaacc tacttttttc ttttacagta tgataaattg 31440
agacatgcct cgcattttct tgtacatgtt ccttctccca ccttttctgg ggtgttctac 31500
gctggccgct gtgtctcacc tggaggtaga ctgcctctca cccttcactg tctacctgct 31560
ttacggattg gtcaccctca ctctcatctg cagcctaatc acagtaatca tcgccttcat 31620
ccagtgcatt gattacatct gtgtgcgcct cgcatacttc agacaccacc cgcagtaccg 31680
agacaggaac attgcccaac ttctaagact gctctaatca tgcataagac tgtgatctgc 31740
cttctgatcc tctgcatcct gcccaccctc acctcctgcc agtacaccac aaaatctccg 31800
cgcaaaagac atgcctcctg ccgcttcacc caactgtgga atatacccaa atgctacaac 31860
gaaaagagcg agctctccga agcttggctg tatggggtca tctgtgtctt agttttctgc 31920
agcactgtct ttgccctcat aatctacccc tactttgatt tgggatggaa cgcgatcgat 31980
gccatgaatt accccacctt tcccgcaccc gagataattc cactgcgaca agttgtaccc 32040
gttgtcgtta atcaacgccc cccatcccct acgcccactg aaatcagcta ctttaaccta 32100
acaggcggag atgactgacg ccctagatct agaaatggac ggcatcagta ccgagcagcg 32160
tctcctagag aggcgcaggc aggcggctga gcaagagcgc ctcaatcagg agctccgaga 32220
tctcgttaac ctgcaccagt gcaaaagagg catcttttgt ctggtaaagc aggccaaagt 32280
cacctacgag aagaccggca acagccaccg cctcagttac aaattgccca cccagcgcca 32340
gaagctggtg ctcatggtgg gtgagaatcc catcaccgtc acccagcact cggtagagac 32400
cgaggggtgt ctgcactccc cctgtcgggg tccagaagac ctctgcaccc tggtaaagac 32460
cctgtgcggt ctcagagatt tagtcccctt taactaatca aacactggaa tcaataaaaa 32520
gaatcactta cttaaaatca gacagcaggt ctctgtccag tttattcagc agcacctcct 32580
tcccctcctc ccaactctgg tactccaaac gccttctggc ggcaaacttc ctccacaccc 32640
tgaagggaat gtcagattct tgctcctgtc cctccgcacc cactatcttc atgttgttgc 32700
agatgaagcg caccaaaacg tctgacgaga gcttcaaccc cgtgtacccc tatgacacgg 32760
aaagcggccc tccctccgtc cctttcctca cccctccctt cgtgtctccc gatggattcc 32820
aagaaagtcc ccccggggtc ctgtctctga acctggccga gcccctggtc acttcccacg 32880
gcatgctcgc cctgaaaatg ggaagtggcc tctccctgga cgacgctggc aacctcacct 32940
ctcaagatat caccaccgct agccctcccc tcaaaaaaac caagaccaac ctcagcctag 33000
aaacctcatc ccccctaact gtgagcacct caggcgccct caccgtagca gccgccgctc 33060
ccctggcggt ggccggcacc tccctcacca tgcaatcaga ggcccccctg acagtacagg 33120
atgcaaaact caccctggcc accaaaggcc ccctgaccgt gtctgaaggc aaactggcct 33180
tgcaaacatc ggccccgctg acggccgctg acagcagcac cctcacagtc agtgccacac 33240
caccccttag cacaagcaat ggcagcttgg gtattgacat gcaagccccc atttacacca 33300
ccaatggaaa actaggactt aactttggcg ctcccctgca tgtggtagac agcctaaatg 33360
cactgactgt agttactggc caaggtctta cgataaacgg aacagcccta caaactagag 33420
tctcaggtgc cctcaactat gacacatcag gaaacctaga attgagagct gcagggggta 33480
tgcgagttga tgcaaatggt caacttatcc ttgatgtagc ttacccattt gatgcacaaa 33540
acaatctcag ccttaggctt ggacagggac ccctgtttgt taactctgcc cacaacttgg 33600
atgttaacta caacagaggc ctctacctgt tcacatctgg aaataccaaa aagctagaag 33660
ttaatatcaa aacagccaag ggtctcattt atgatgacac tgctatagca atcaatgcgg 33720
gtgatgggct acagtttgac tcaggctcag atacaaatcc attaaaaact aaacttggat 33780
taggactgga ttatgactcc agcagagcca taattgctaa actgggaact ggcctaagct 33840
ttgacaacac aggtgccatc acagtaggca acaaaaatga tgacaagctt accttgtgga 33900
ccacaccaga cccatcccct aactgtagaa tctattcaga gaaagatgct aaattcacac 33960
ttgttttgac taaatgcggc agtcaggtgt tggccagcgt ttctgtttta tctgtaaaag 34020
gtagccttgc gcccatcagt ggcacagtaa ctagtgctca gattgtcctc agatttgatg 34080
aaaatggagt tctactaagc aattcttccc ttgaccctca atactggaac tacagaaaag 34140
gtgaccttac agagggcact gcatatacca acgcagtggg atttatgccc aacctcacag 34200
catacccaaa aacacagagc caaactgcta aaagcaacat tgtaagtcag gtttacttga 34260
atggggacaa atccaaaccc atgaccctca ccattaccct caatggaact aatgaaacag 34320
gagatgccac agtaagcact tactccatgt cattctcatg gaactggaat ggaagtaatt 34380
acattaatga aacgttccaa accaactcct tcaccttctc ctacatcgcc caagaataaa 34440
aagcatgacg ctgttgattt gattcaatgt gtttctgttt tattttcaag cacaacaaaa 34500
tcattcaagt cattcttcca tcttagctta atagacacag tagcttaata gacccagtag 34560
tgcaaagccc cattctagct tatagatcag acagtgataa ttaaccacca ccaccaccat 34620
accttttgat tcaggaaatc atgatcatca caggatccta gtcttcaggc cgccccctcc 34680
ctcccaagac acagaataca cagtcctctc cccccgactg gctttaaata acaccatctg 34740
gttggtcaca gacatgttct taggggttat attccacacg gtctcctgcc gcgccaggcg 34800
ctcgtcggtg atgttgataa actctcccgg cagctcgctc aagttcacgt cgctgtccag 34860
cggctgaacc tccggctgac gcgataactg tgcgaccggc tgctggacga acggaggccg 34920
cgcctacaag ggggtagagt cataatcctc ggtcaggata gggcggtgat gcagcagcag 34980
cgagcgaaac atctgctgcc gccgccgctc cgtccggcag gaaaacaaca cgccggtggt 35040
ctcctccgcg ataatccgca ccgcccgcag catcagcttc ctcgttctcc gcgcgcagca 35100
cctcaccctt atctcgctca aatcggcgca gtaggtacag cacagcacca cgatgttatt 35160
catgatccca cagtgcaggg cgctgtatcc aaagctcatg ccgggaacca ccgcccccac 35220
gtggccatcg taccacaagc gcacgtaaat caagtgtcga cccctcatga acgcgctgga 35280
cacaaacatt acttccttgg gcatgttgta attcaccacc tcccggtacc agataaacct 35340
ctggttgaac agggcacctt ccaccaccat cctgaaccaa gaggccagaa cctgcccacc 35400
ggctatgcac tgcagggaac ccgggttgga acaatgacaa tgcagactcc aaggctcgta 35460
accgtggatc atccggctgc tgaaggcatc gatgttggca caacacagac acacgtgcat 35520
gcactttctc atgattagca gctcttccct cgtcaggatc atatcccaag gaataaccca 35580
ttcttgaatc aacgtaaaac ccacacagca gggaaggcct cgcacataac tcacgttgtg 35640
catggtcagc gtgttgcatt ccggaaacag cggatgatcc tccagtatcg aggcgcgggt 35700
ctccttctca cagggaggta aagggtccct gctgtacgga ctgcgccggg acgaccgaga 35760
tcgtgttgag cgtagtgtca tggaaaaggg aacgccggac gtggtcatac ttcttgaagc 35820
agaaccaggt tcgcgcgtgg caggcctcct tgcgtctgcg gtctcgccgt ctagctcgct 35880
ccgtgtgata gttgtagtac agccactccc gcagagcgtc gaggcgcacc ctggcttccg 35940
gatctatgta gactccgtct tgcaccgcgg ccctgataat atccaccacc gtagaataag 36000
caacacccag ccaagcaata cactcgctct gcgagcggca gacaggagga gcgggcagag 36060
atgggagaac catgataaaa aacttttttt aaagaatatt ttccaattct tcgaaagtaa 36120
gatctatcaa gtggcagcgc tcccctccac tggcgcggtc aaactctacg gccaaagcac 36180
agacaacggc atttctaaga tgttccttaa tggcgtccaa aagacacacc gctctcaagt 36240
tgcagtaaac tatgaatgaa aacccatccg gctgattttc caatatagac gcgccggcag 36300
cgtccaccaa acccagataa ttttcttctc tccagcggtt tacgatctgt ctaagcaaat 36360
cccttatatc aagtccgacc atgccaaaaa tctgctcaag agcgccctcc accttcatgt 36420
acaagcagcg catcatgatt gcaaaaattc aggttcttca gagacctgta taagattcaa 36480
aatgggaaca ttaacaaaaa ttcctctgtc gcgcagatcc cttcgcaggg caagctgaac 36540
ataatcagac aggtccgaac ggaccagtga ggccaaatcc ccaccaggaa ccagatccag 36600
agaccctata ctgattatga cgcgcatact cggggctatg ctgaccagcg tagcgccgat 36660
gtaggcgtgc tgcatgggcg gcgagataaa atgcaaagtg ctggttaaaa aatcaggcaa 36720
agcctcgcgc aaaaaagcta acacatcata atcatgctca tgcaggtagt tgcaggtaag 36780
ctcaggaacc aaaacggaat aacacacgat tttcctctca aacatgactt cgcggatact 36840
gcgtaaaaca aaaaattata aataaaaaat taattaaata acttaaacat tggaagcctg 36900
tctcacaaca ggaaaaacca ctttaatcaa cataagacgg gccacgggca tgccggcata 36960
gccgtaaaaa aattggtccc cgtgattaac aagtaccaca gacagctccc cggtcatgtc 37020
gggggtcatc atgtgagact ctgtatacac gtctggattg tgaacatcag acaaacaaag 37080
aaatcgagcc acgtagcccg gaggtataat cacccgcagg cggaggtaca gcaaaacgac 37140
ccccatagga ggaatcacaa aattagtagg agaaaaaaat acataaacac cagaaaaacc 37200
ctgttgctga ggcaaaatag cgccctcccg atccaaaaca acataaagcg cttccacagg 37260
agcagccata acaaagaccc gagtcttacc agtaaaagaa aaaagatctc tcaacgcagc 37320
accagcacca acacttcgca gtgtaaaagg ccaagtgccg agagagtata tataggaata 37380
aaaagtgacg taaacgggca aagtccaaaa aacgcccaga aaaaccgcac gcgaacctac 37440
gccccgaaac gaaagccaaa aaacactaga cactcccttc cggcgtcaac ttccgctttc 37500
ccacgctacg tcacttgccc cagtcaaaca aactacatat cccgaacttc caagtcgcca 37560
cgcccaaaac accgcctaca cctccccgcc cgccggcccg cccccaaacc cgcctcccgc 37620
cccgcgcccc gccccgcgcc gcccatctca ttatcatatt ggcttcaatc caaaataagg 37680
tatattattg atgatggttt aaacggatcc tctagagtcg acctgcaggc atgcaagctt 37740
gagtattcta tagtgtcacc taaatagctt ggcgtaatca tggtcatagc tgtttcctgt 37800
gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 37860
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 37920
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgaacccct 37980
tgcggccgcc cgggccgtcg accaattctc atgtttgaca gcttatcatc gaatttctgc 38040
cattcatccg cttattatca cttattcagg cgtagcaacc aggcgtttaa gggcaccaat 38100
aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat 38160
taagcattct gccgacatgg aagccatcac aaacggcatg atgaacctga atcgccagcg 38220
gcatcagcac cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga 38280
agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg 38340
agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac 38400
acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc 38460
agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat 38520
cccatatcac cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca 38580
ggcgggcaag aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct 38640
ttaaaaaggc cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact 38700
gaaatgcctc aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag 38760
tgattttttt ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata 38820
cgcccggtag tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa 38880
cgtctcattt tcgccaaaag ttggcccagg gcttcccggt atcaacaggg acaccaggat 38940
ttatttattc tgcgaagtga tcttccgtca caggtattta ttcgcgataa gctcatggag 39000
cggcgtaacc gtcgcacagg aaggacagag aaagcgcgga tctgggaagt gacggacaga 39060
acggtcagga cctggattgg ggaggcggtt gccgccgctg ctgctgacgg tgtgacgttc 39120
tctgttccgg tcacaccaca tacgttccgc cattcctatg cgatgcacat gctgtatgcc 39180
ggtataccgc tgaaagttct gcaaagcctg atgggacata agtccatcag ttcaacggaa 39240
gtctacacga aggtttttgc gctggatgtg gctgcccggc accgggtgca gtttgcgatg 39300
ccggagtctg atgcggttgc gatgctgaaa caattatcct gagaataaat gccttggcct 39360
ttatatggaa atgtggaact gagtggatat gctgtttttg tctgttaaac agagaagctg 39420
gctgttatcc actgagaagc gaacgaaaca gtcgggaaaa tctcccatta tcgtagagat 39480
ccgcattatt aatctcagga gcctgtgtag cgtttatagg aagtagtgtt ctgtcatgat 39540
gcctgcaagc ggtaacgaaa acgatttgaa tatgccttca ggaacaatag aaatcttcgt 39600
gcggtgttac gttgaagtgg agcggattat gtcagcaatg gacagaacaa cctaatgaac 39660
acagaaccat gatgtggtct gtccttttac agccagtagt gctcgccgca gtcgagcgac 39720
agggcgaagc cctcgagtga gcgaggaagc accagggaac agcacttata tattctgctt 39780
acacacgatg cctgaaaaaa cttcccttgg ggttatccac ttatccacgg ggatattttt 39840
ataattattt tttttatagt ttttagatct tcttttttag agcgccttgt aggcctttat 39900
ccatgctggt tctagagaag gtgttgtgac aaattgccct ttcagtgtga caaatcaccc 39960
tcaaatgaca gtcctgtctg tgacaaattg cccttaaccc tgtgacaaat tgccctcaga 40020
agaagctgtt ttttcacaaa gttatccctg cttattgact cttttttatt tagtgtgaca 40080
atctaaaaac ttgtcacact tcacatggat ctgtcatggc ggaaacagcg gttatcaatc 40140
acaagaaacg taaaaatagc ccgcgaatcg tccagtcaaa cgacctcact gaggcggcat 40200
atagtctctc ccgggatcaa aaacgtatgc tgtatctgtt cgttgaccag atcagaaaat 40260
ctgatggcac cctacaggaa catgacggta tctgcgagat ccatgttgct aaatatgctg 40320
aaatattcgg attgacctct gcggaagcca gtaaggatat acggcaggca ttgaagagtt 40380
tcgcggggaa ggaagtggtt ttttatcgcc ctgaagagga tgccggcgat gaaaaaggct 40440
atgaatcttt tccttggttt atcaaacgtg cgcacagtcc atccagaggg ctttacagtg 40500
tacatatcaa cccatatctc attcccttct ttatcgggtt acagaaccgg tttacgcagt 40560
ttcggcttag tgaaacaaaa gaaatcacca atccgtatgc catgcgttta tacgaatccc 40620
tgtgtcagta tcgtaagccg gatggctcag gcatcgtctc tctgaaaatc gactggatca 40680
tagagcgtta ccagctgcct caaagttacc agcgtatgcc tgacttccgc cgccgcttcc 40740
tgcaggtctg tgttaatgag atcaacagca gaactccaat gcgcctctca tacattgaga 40800
aaaagaaagg ccgccagacg actcatatcg tattttcctt ccgcgatatc acttccatga 40860
cgacaggata gtctgagggt tatctgtcac agatttgagg gtggttcgtc acatttgttc 40920
tgacctactg agggtaattt gtcacagttt tgctgtttcc ttcagcctgc atggattttc 40980
tcatactttt tgaactgtaa tttttaagga agccaaattt gagggcagtt tgtcacagtt 41040
gatttccttc tctttccctt cgtcatgtga cctgatatcg ggggttagtt cgtcatcatt 41100
gatgagggtt gattatcaca gtttattact ctgaattggc tatccgcgtg tgtacctcta 41160
cctggagttt ttcccacggt ggatatttct tcttgcgctg agcgtaagag ctatctgaca 41220
gaacagttct tctttgcttc ctcgccagtt cgctcgctat gctcggttac acggctgcgg 41280
cgagcgctag tgataataag tgactgaggt atgtgctctt cttatctcct tttgtagtgt 41340
tgctcttatt ttaaacaact ttgcggtttt ttgatgactt tgcgattttg ttgttgcttt 41400
gcagtaaatt gcaagattta ataaaaaaac gcaaagcaat gattaaagga tgttcagaat 41460
gaaactcatg gaaacactta accagtgcat aaacgctggt catgaaatga cgaaggctat 41520
cgccattgca cagtttaatg atgacagccc ggaagcgagg aaaataaccc ggcgctggag 41580
aataggtgaa gcagcggatt tagttggggt ttcttctcag gctatcagag atgccgagaa 41640
agcagggcga ctaccgcacc cggatatgga aattcgagga cgggttgagc aacgtgttgg 41700
ttatacaatt gaacaaatta atcatatgcg tgatgtgttt ggtacgcgat tgcgacgtgc 41760
tgaagacgta tttccaccgg tgatcggggt tgctgcccat aaaggtggcg tttacaaaac 41820
ctcagtttct gttcatcttg ctcaggatct ggctctgaag gggctacgtg ttttgctcgt 41880
ggaaggtaac gacccccagg gaacagcctc aatgtatcac ggatgggtac cagatcttca 41940
tattcatgca gaagacactc tcctgccttt ctatcttggg gaaaaggacg atgtcactta 42000
tgcaataaag cccacttgct ggccggggct tgacattatt ccttcctgtc tggctctgca 42060
ccgtattgaa actgagttaa tgggcaaatt tgatgaaggt aaactgccca ccgatccaca 42120
cctgatgctc cgactggcca ttgaaactgt tgctcatgac tatgatgtca tagttattga 42180
cagcgcgcct aacctgggta tcggcacgat taatgtcgta tgtgctgctg atgtgctgat 42240
tgttcccacg cctgctgagt tgtttgacta cacctccgca ctgcagtttt tcgatatgct 42300
tcgtgatctg ctcaagaacg ttgatcttaa agggttcgag cctgatgtac gtattttgct 42360
taccaaatac agcaatagta atggctctca gtccccgtgg atggaggagc aaattcggga 42420
tgcctgggga agcatggttc taaaaaatgt tgtacgtgaa acggatgaag ttggtaaagg 42480
tcagatccgg atgagaactg tttttgaaca ggccattgat caacgctctt caactggtgc 42540
ctggagaaat gctctttcta tttgggaacc tgtctgcaat gaaattttcg atcgtctgat 42600
taaaccacgc tgggagatta gataatgaag cgtgcgcctg ttattccaaa acatacgctc 42660
aatactcaac cggttgaaga tacttcgtta tcgacaccag ctgccccgat ggtggattcg 42720
ttaattgcgc gcgtaggagt aatggctcgc ggtaatgcca ttactttgcc tgtatgtggt 42780
cgggatgtga agtttactct tgaagtgctc cggggtgata gtgttgagaa gacctctcgg 42840
gtatggtcag gtaatgaacg tgaccaggag ctgcttactg aggacgcact ggatgatctc 42900
atcccttctt ttctactgac tggtcaacag acaccggcgt tcggtcgaag agtatctggt 42960
gtcatagaaa ttgccgatgg gagtcgccgt cgtaaagctg ctgcacttac cgaaagtgat 43020
tatcgtgttc tggttggcga gctggatgat gagcagatgg ctgcattatc cagattgggt 43080
aacgattatc gcccaacaag tgcttatgaa cgtggtcagc gttatgcaag ccgattgcag 43140
aatgaatttg ctggaaatat ttctgcgctg gctgatgcgg aaaatatttc acgtaagatt 43200
attacccgct gtatcaacac cgccaaattg cctaaatcag ttgttgctct tttttctcac 43260
cccggtgaac tatctgcccg gtcaggtgat gcacttcaaa aagcctttac agataaagag 43320
gaattactta agcagcaggc atctaacctt catgagcaga aaaaagctgg ggtgatattt 43380
gaagctgaag aagttatcac tcttttaact tctgtgctta aaacgtcatc tgcatcaaga 43440
actagtttaa gctcacgaca tcagtttgct cctggagcga cagtattgta taagggcgat 43500
aaaatggtgc ttaacctgga caggtctcgt gttccaactg agtgtataga gaaaattgag 43560
gccattctta aggaacttga aaagccagca ccctgatgcg accacgtttt agtctacgtt 43620
tatctgtctt tacttaatgt cctttgttac aggccagaaa gcataactgg cctgaatatt 43680
ctctctgggc ccactgttcc acttgtatcg tcggtctgat aatcagactg ggaccacggt 43740
cccactcgta tcgtcggtct gattattagt ctgggaccac ggtcccactc gtatcgtcgg 43800
tctgattatt agtctgggac cacggtccca ctcgtatcgt cggtctgata atcagactgg 43860
gaccacggtc ccactcgtat cgtcggtctg attattagtc tgggaccatg gtcccactcg 43920
tatcgtcggt ctgattatta gtctgggacc acggtcccac tcgtatcgtc ggtctgatta 43980
ttagtctgga accacggtcc cactcgtatc gtcggtctga ttattagtct gggaccacgg 44040
tcccactcgt atcgtcggtc tgattattag tctgggacca cgatcccact cgtgttgtcg 44100
gtctgattat cggtctggga ccacggtccc acttgtattg tcgatcagac tatcagcgtg 44160
agactacgat tccatcaatg cctgtcaagg gcaagtattg acatgtcgtc gtaacctgta 44220
gaacggagta acctcggtgt gcggttgtat gcctgctgtg gattgctgct gtgtcctgct 44280
tatccacaac attttgcgca cggttatgtg gacaaaatac ctggttaccc aggccgtgcc 44340
ggcacgttaa ccgggctgca tccgatgcaa gtgtgtcgct gtcgacgagc tcgcgagctc 44400
ggacatgagg ttgccccgta ttcagtgtcg ctgatttgta ttgtctgaag ttgtttttac 44460
gttaagttga tgcagatcaa ttaatacgat acctgcgtca taattgatta tttgacgtgg 44520
tttgatggcc tccacgcacg ttgtgatatg tagatgataa tcattatcac tttacgggtc 44580
ctttccggtg atccgacagg ttacggggcg gcgacctcgc gggttttcgc tatttatgaa 44640
aattttccgg tttaaggcgt ttccgttctt cttcgtcata acttaatgtt tttatttaaa 44700
ataccctctg aaaagaaagg aaacgacagg tgctgaaagc gagctttttg gcctctgtcg 44760
tttcctttct ctgtttttgt ccgtggaatg aacaatggaa gtccgagctc atcgctaata 44820
acttcgtata gcatacatta tacgaagtta tattcgatgc ggccgcaagg ggttcgcgtc 44880
agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 44940
gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 45000
caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 45060
ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 45120
gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattgt aatacgactc 45180
actatagggc gaattcgagc tcggtacccg gggatcctcg tttaaac 45227
<210> 10
<211> 37830
<212> DNA
<213> Simian adenovirus
<400> 10
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcggga ggcgggtccg ggggcgggcc ggcgggcggg gcggtgtggc ggaagtggac 120
tttgtaagtg tggcggatgt gacttgctag tgccgggcgc ggtaaaagtg acgttttccg 180
tgcgcgacaa cgcccacggg aagtgacatt tttcccgcgg tttttaccgg atgttgtagt 240
gaatttgggc gtaaccaagt aagatttggc cattttcgcg ggaaaactga aacggggaag 300
tgaaatctga ttaatttcgc gttagtcata ccgcgtaata tttgtcgagg gccgagggac 360
tttggccgat tacgtggagg actcgcccag gtgttttttg aggtgaattt ccgcgttccg 420
ggtcaaagtc tccgttttat tattatagtc agctgacgcg gagtgtattt ataccctctg 480
atctcgtcaa gtggccactc ttgagtgcca gcgagtagag ttttctcctc tgccgctctc 540
cgctccgctc cgctcggctc tgacaccggg gaaaaaatga gacatttcac ctacgatggc 600
ggtgtgctca ccggccagct ggctgctgaa gtcctggaca ccctgatcga ggaggtattg 660
gccgataatt atcctccctc gactcctttt gagccaccta cacttcacga actctacgat 720
ctggatgtgg tggggcccag cgatccgaac gagcaggcgg tttccagttt ttttccagag 780
tccatgttgt tggccagcca ggagggggtc gaacttgaga cccctcctcc gatcgtggat 840
tcccccgatc cgccgcagct gactaggcag cccgagcgct gtgcgggacc tgagactatg 900
ccccagctgc tacctgaggt gatcgatctc acctgtaatg agtctggttt tccacccagc 960
gaggatgagg acgaagaggg tgagcagttt gtgttagatt ctgtggaaca acccgggcga 1020
ggatgcaggt cttgtcaata tcaccggaaa aacacaggag actcccagat tatgtgttct 1080
ctgtgttata tgaagatgac ctgtatgttt atttacagta agtttatcat ctgtgggcag 1140
gtgggctata gtgtgggtgg tggtctttgg ggggtttttt aatatatgtc aggggttatg 1200
ctgaagactt ttttattgtg atttttaaag gtccagtgtc tgagcccgag caagaacctg 1260
aaccggagcc tgagccttct cgccccagga gaaagcctgt aatcttaact agacccagcg 1320
caccggtagc gagaggcctc agcagcgcgg agaccaccga ctccggtgct tcctcatcac 1380
ccccggagat tcaccccctg gtgcccctgt gtcccgttaa gcccgttgcc gtgagagtca 1440
gtgggcggcg gtctgctgtg gagtgcattg aggacttgct ttttgattca caggaacctt 1500
tggacttgag cttgaaacgc cccaggcatt aaacctggtc acctggactg aatgagttga 1560
cgcctatgtt tgcttttgaa tgacttaatg tgtatagata ataaagagtg agataatgtt 1620
ttaattgcat ggtgtgttta acttgggcgg agtctgctgg gtatataagc ttccctgggc 1680
taaacttggt tacacttgac ctcatggagg cctgggagtg tttggagaac tttgccggag 1740
ttcgtgcctt gctggacgag agctctaaca atacctcttg gtggtggagg tatttgtggg 1800
gctctcccca gggcaagtta gtttgtagaa tcaaggagga ttacaagtgg gaatttgaag 1860
agcttttgaa atcctgtggt gagctattgg attctttgaa tctaggccac caggctctct 1920
tccaggagaa ggtcatcagg actttggatt tttccacacc ggggcgcatt gcagccgcgg 1980
ttgcttttct agcttttttg aaggatagat ggagcgaaga gacccacttg agttcgggct 2040
acgtcctgga ttttctggcc atgcaactgt ggagagcatg gatcagacac aagaacaggc 2100
tgcaactgtt gtcttccgtc cgcccgttgc tgattccggc ggaggagcaa caggccgggt 2160
cagaggaccg ggcccgtcgg gatccggagg agagggcacc gaggccgggc gagaggagcg 2220
cgctgaacct gggaaccggg ctgagcggcc atccacatcg ggagtgaatg tcgggcaggt 2280
ggtggatctt tttccagaac tgcggcggat tttgactatt agggaggatg ggcaatttgt 2340
taagggtctt aagagggaga ggggggcttc tgagcataac gaggaggcca gtaatttagc 2400
ttttagcttg atgaccagac accgtccaga gtgcatcact tttcagcaga ttaaggacaa 2460
ttgtgccaat gagttggatc tgttgggtca gaagtatagc atagagcagc tgaccactta 2520
ctggctgcag ccgggtgatg atctggagga agctattagg gtgtatgcta aggtggccct 2580
gcggcccgat tgcaagtaca agctcaaggg gctggtgaat atcaggaatt gttgctacat 2640
ttctggcaac ggggcggagg tggagataga gaccgaagac agggtggctt tcagatgcag 2700
catgatgaat atgtggccgg gggtgctggg catggacggg gtggtgatta tgaatgtgag 2760
gttcacgggg cccaacttta acggcacggt gtttttgggg aacaccaacc tggtcctgca 2820
cggggtgagc ttctatgggt ttaacaacac ctgtgtggag gcctggaccg atgtgaaggt 2880
ccgcggttgc gccttttatg gatgttggaa ggccatagtg agccgcccta agagcaggag 2940
ttccattaag aaatgcttgt ttgagaggtg caccttgggg atcctggccg agggcaactg 3000
cagggtgcgc cacaatgtgg cctccgagtg cggttgcttc atgctagtca agagcgtggc 3060
ggtaatcaag cataatatgg tgtgcggcaa cagcgaggac aaggcctcac agatgctgac 3120
ctgcacggat ggcaactgcc acttgctgaa gaccatccat gtaaccagcc acagccggaa 3180
ggcctggccc gtgttcgagc acaacttgct gacccgctgc tccttgcatc tgggcaacag 3240
gcggggggtg ttcctgccct atcaatgcaa ctttagtcac accaagatct tgctagagcc 3300
cgagagcatg tccaaggtga acttgaacgg ggtgtttgac atgaccatga agatctggaa 3360
ggtgctgagg tacgacgaga ccaggtcccg gtgcagaccc tgcgagtgcg ggggcaagca 3420
tatgaggaac cagcccgtga tgctggatgt gaccgaggag ctgaggacag accacttggt 3480
tctggcctgc accagggccg agtttggttc tagcgatgaa gacacagatt gaggtgggtg 3540
agtgggcgtg gcctggggtg gtcatgaaaa tatataagtt gggggtctta gggtctcttt 3600
atttgtgttg cagagaccgc cggagccatg agcgggagca gcagcagcag cagtagcagc 3660
agcgccttgg atggcagcat cgtgagccct tatttgacga cgcggatgcc ccactgggcc 3720
ggggtgcgtc agaatgtgat gggctccagc atcgacggcc gacccgtcct gcccgcaaat 3780
tccgccacgc tgacctatgc gaccgtcgcg gggacgccgt tggacgccac cgccgccgcc 3840
gccgccaccg cagccgcctc ggccgtgcgc agcctggcca cggactttgc attcctggga 3900
ccactggcga caggggctac ttctcgggcc gctgctgccg ccgttcgcga tgacaagctg 3960
accgccctgc tggcgcagtt ggatgcgctt actcgggaac tgggtgacct ttctcagcag 4020
gtcatggccc tgcgccagca ggtctcctcc ctgcaagctg gcgggaatgc ttctcccaca 4080
aatgccgttt aagataaata aaaccagact ctgtttggat taaagaaaag tagcaagtgc 4140
attgctctct ttatttcata attttccgcg cgcgataggc cctagaccag cgttctcggt 4200
cgttgagggt gcggtgtatc ttctccagga cgtggtagag gtggctctgg acgttgagat 4260
acatgggcat gagcccgtcc cgggggtgga ggtagcacca ctgcagagct tcatgctccg 4320
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcatggtgc ctaaaaatgt 4380
ccttcagcag caggccgatg gccaggggga ggcccttggt gtaagtgttt acaaaacggt 4440
taagttggga agggtgcatt cggggagaga tgatgtgcat cttggactgt atttttagat 4500
tggcgatgtt tccgcccaga tcccttctgg gattcatgtt gtgcaggacc accagtacag 4560
tgtatccggt gcacttgggg aatttgtcat gcagcttaga gggaaaagcg tggaagaact 4620
tggagacgcc tttgtggcct cccagatttt ccatgcattc gtccatgatg atggcaatgg 4680
gcccgcggga ggcagcttgg gcaaagatat ttctggggtc gctgacgtcg tagttgtgtt 4740
ccagggtgag gtcgtcatag gccattttta caaagcgcgg gcggagggtg cccgactggg 4800
ggatgatggt cccctctggc cctggggcgt agttgccctc gcagatctgc atttcccagg 4860
ccttaatctc ggagggggga atcatatcca cctgcggggc gatgaagaaa acggtttccg 4920
gagccgggga gattaactgg gatgagagca ggtttctaag cagctgtgat tttccacaac 4980
cggtgggccc ataaataaca cctataaccg gttgcagctg gtagtttaga gagctgcagc 5040
tgccgtcgtc ccggaggagg ggggccacct cgttgagcat gtccctgacg cgcatgttct 5100
ccccgaccag atccgccaga aggcgctcgc cgcccaggga cagcagctct tgcaaggaag 5160
caaagttttt cagcggcttg aggccgtccg ccgtgggcat gtttttcagg gtctggctca 5220
gcagctccag gcggtcccag agctcggtga cgtgctctac ggcatctcta tccagcatat 5280
ctcctcgttt cgcgggttgg ggcgactttc gctgtagggc accaagcggt ggtcgtccag 5340
cggggccaga gtcatgtcct tccatgggcg cagggtcctc gtcagggtgg tctgggtcac 5400
ggtgaagggg tgcgctccgg gctgagcgct tgccaaggtg cgcttgaggc tggttctgct 5460
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt 5520
gtcatagtcc agcccctccg cggcgtgtcc cttggcgcgc agcttgccct tggaggtggc 5580
gccgcacgag gggcagagca ggctcttgag cgcgtagagc ttgggggcga ggaagaccga 5640
ttcgggggag taggcgtccg cgccgcagac cccgcacacg gtctcgcact ccaccagcca 5700
ggtgagctcg gggcgcgccg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt 5760
cttacctcgg gtctccatga ggtggtgtcc ccgctcggtg acgaagaggc tgtccgtgtc 5820
tccgtagacc gacttgaggg gtcttttctc caggggggtc cctcggtctt cctcgtagag 5880
gaactcggac cactctgaga cgaaggcccg cgtccaggcc aggacgaagg aggctatgtg 5940
ggaggggtag cggtcgttgt ccactagggg gtccaccttc tccaaggtgt gaagacacat 6000
gtcgccttcc tcggcgtcca ggaaggtgat tggcttgtag gtgtaggcca cgtgaccggg 6060
ggttcctgac gggggggtat aaaagggggt gggggcgcgc tcgtcgtcac tctcttccgc 6120
atcgctgtct gcgagggcca gctgctgggg tgagtattcc ctctcgaagg cgggcatgac 6180
ctccgcgctg aggttgtcag tttccaaaaa cgaggaggat ttgatgttca cctgtcccga 6240
ggtgatacct ttgagggtac ccgcgtccat ctggtcagaa aacacgatct ttttattgtc 6300
cagcttggtg gcgaacgacc cgtagagggc gttggagagc agcttggcga tggagcgcag 6360
ggtctggttc ttgtccctgt cggcgcgctc cttggccgcg atgttgagct gcacgtactc 6420
gcgcgcgacg cagcgccact cggggaagac ggtggtgcgc tcgtcgggca ccaggcgcac 6480
gcgccagccg cggttgtgca gggtgaccag gtccacgctg gtggcgacct cgccgcgcag 6540
gcgctcgttg gtccagcaga gacggccgcc cttgcgcgag cagaaggggg gcagggggtc 6600
gagctgggtc tcgtccgggg ggtccgcgtc cacggtgaaa accccggggc gcaggcgcgc 6660
gtcgaagtag tctatcttgc aaccttgcat gtccagcgcc tgctgccagt cgcgggcggc 6720
gagcgcgcgc tcgtaggggt tgagcggcgg gccccagggc atggggtggg tgagtgcgga 6780
ggcgtacatg ccgcagatgt catagacgta gaggggctcc cgcaggaccc cgatgtaggt 6840
ggggtagcag cggccgccgc ggatgctggc gcgcacgtag tcatacagct cgtgcgaggg 6900
ggcgaggagg tcggggccca ggttggtgcg ggcggggcgc tccgcgcgga agacgatctg 6960
cctgaagatg gcatgcgagt tggaagagat ggtggggcgc tggaagacgt tgaagctggc 7020
gtcctgcagg ccgacggcgt cgcgcacgaa ggaggcgtag gagtcgcgca gcttgtgtac 7080
cagctcggcg gtgacctgca cgtcgagcgc gcagtagtcg agggtctcgc ggatgatgtc 7140
atatttagcc tgccccttct ttttccacag ctcgcggttg aggacaaact cttcgcggtc 7200
tttccagtac tcttggatcg ggaaaccgtc cggttccgaa cggtaagagc ctagcatgta 7260
gaactggttg acggcctggt aggcgcagca gcccttctcc acggggaggg cgtaggcctg 7320
cgcggccttg cggagcgagg tgtgggtcag ggcgaaggtg tccctgacca tgactttgag 7380
gtactggtgc ttgaagtcgg agtcgtcgca gccgccccgc tcccagagcg agaagtcggt 7440
gcgcttcttg gagcgggggt tgggcagagc gaaggtgaca tcgttgaaga ggattttgcc 7500
cgcgcggggc atgaagttgc gggtgatgcg gaagggcccc ggcacttcag agcggttgtt 7560
gatgacctgg gcggcgagca cgatctcgtc gaagccgttg atgttgtggc ccacgatgta 7620
gagttccagg aagcggggcc ggccctttac ggtgggcagc ttctttagct cttcgtaggt 7680
gagctcctcg ggcgaggcga ggccgtgctc ggccagggcc cagtccgcga ggtgcgggtt 7740
gtctctgagg aaggacttcc agaggtcgcg ggccaggagg gtctgcaggc ggtctctgaa 7800
ggtcctgaac tggcggccca cggccatttt ttcgggggtg atgcagtaga aggtgagggg 7860
gtcttgctgc cagcggtccc agtcgagctg cagggcgagg tcgcgcgcgg cggtgaccag 7920
gcgctcgtcg cccccgaatt tcatgaccag catgaagggc acgagctgct ttccgaaggc 7980
ccccatccaa gtgtaggtct ctacatcgta ggtgacaaag aggcgctccg tgcgaggatg 8040
cgagccgatc gggaagaact ggatctcccg ccaccagttg gaggagtggc tgttgatgtg 8100
gtggaagtag aagtcccgtc gccgggccga acactcgtgc tggcttttgt aaaagcgagc 8160
gcagtactgg cagcgctgca cgggctgtac ctcatgcacg agatgcacct ttcgcccgcg 8220
cacgaggaag ccgaggggaa atctgagccc cccgcctggc tcgcggcatg gctggttctc 8280
ttctactttg gatgcgtgtc cgtctccgtc tggctcctcg aggggtgtta cggtggagcg 8340
gaccaccacg ccgcgcgagc cgcaggtcca gatatcggcg cgcggcggtc ggagtttgat 8400
gacgacatcg cgcagctggg agctgtccat ggtctggagc tcccgcggcg gcggcaggtc 8460
agccgggagt tcttgcaggt tcacctcgca gagtcgggcc agggcgcggg gcaggtctag 8520
gtggtacctg atctctaggg gcgtgttggt ggcggcgtcg atggcttgca ggagcccgca 8580
gccccggggg gcgacgacgg tgccccgcgg ggtggtggtg gtggtggcgg tgcagctcag 8640
aagcggtgcc gcgggcgggc ccccggaggt agggggggct ccggtcccgc gggcaggggc 8700
ggcagcggca cgtcggcgtg gagcgcgggc aggagttggt gctgtgcccg gaggttgctg 8760
gcgaaggcga cgacgcggcg gttgatctcc tggatctggc gcctctgcgt gaagacgacg 8820
ggcccggtga gcttgaacct gaaagagagt tcgacagaat caatctcggt gtcattgacc 8880
gcggcctggc gcaggatctc ctgcacgtct cccgagttgt cttggtaggc gatctcggcc 8940
atgaactgct cgatctcttc ctcctggagg tctccgcgtc cggcgcgttc cacggtggcc 9000
gccaggtcgt tggagatgcg ccccatgagc tgcgagaagg cgttgagtcc gccctcgttc 9060
cagactcggc tgtagaccac gcccccctgg tcatcgcggg cgcgcatgac cacctgcgcg 9120
aggttgagct ccacgtgccg cgcgaagacg gcgtagttgc gcagacgctg gaagaggtag 9180
ttgagggtgg tggcggtgtg ctcggccacg aagaagttca tgacccagcg gcgcaacgtg 9240
gattcgttga tgtcccccaa ggcctccagc cgttccatgg cctcgtagaa gtccacggcg 9300
aagttgaaaa actgggagtt gcgcgccgac acggtcaact cctcctccag aagacggatg 9360
agctcggcga cggtgtcgcg cacctcgcgc tcgaaggcta tggggatctc ttcctccgct 9420
agcatcacca cctcctcctc ttcctcctct tctggcactt ccatgatggc ttcctcctct 9480
tcggggggtg gcggcggcgg cggtggggga gggggcgctc tgcgccggcg gcggcgcacc 9540
gggaggcggt ccacgaagcg cgcgatcatc tccccgcggc ggcggcgcat ggtctcggtg 9600
acggcgcggc cgttctcccg ggggcgcagt tggaagacgc cgccggacat ctggtgctgg 9660
ggcgggtggc cgtgaggcag cgagacggcg ctgacgatgc atctcaacaa ttgctgcgta 9720
ggtacgccgc cgagggacct gagggagtcc atatccaccg gatccgaaaa cctttcgagg 9780
aaggcgtcta accagtcgca gtcgcaaggt aggctgagca ccgtggcggg cggcgggggg 9840
tggggggagt gtctggcgga ggtgctgctg atgatgtaat tgaagtaggc ggacttgaca 9900
cggcggatgg tcgacaggag caccatgtcc ttgggtccgg cctgctggat gcggaggcgg 9960
tcggctatgc cccaggcttc gttctggcat cggcgcaggt ccttgtagta gtcttgcatg 10020
agcctttcca ccggcacctc ttctccttcc tcttctgctt cttccatgtc tgcttcggcc 10080
ctggggcggc gccgcgcccc cctgcccccc atgcgcgtga ccccgaaccc cctgagcggt 10140
tggagcaggg ccaggtcggc gacgacgcgc tcggccagga tggcctgctg cacctgcgtg 10200
agggtggttt ggaagtcatc caagtccacg aagcggtggt aggcgcccgt gttgatggtg 10260
taggtgcagt tggccatgac ggaccagttg acggtctggt ggcccggttg cgacatctcg 10320
gtgtacctga gtcgcgagta ggcgcgggag tcgaagacgt agtcgttgca agtccgcacc 10380
aggtactggt agcccaccag gaagtgcggc ggcggctggc ggtagagggg ccagcgcagg 10440
gtggcggggg ctccgggggc caggtcttcc agcatgaggc ggtggtaggc gtagatgtac 10500
ctggacatcc aggtgatacc cgcggcggtg gtggaggcgc gcgggaagtc gcgcacccgg 10560
ttccagatgt tgcgcagggg cagaaagtgc tccatggtag gcgtgctctg tccagtcaga 10620
cgcgcgcagt cgttgatact ctagaccagg gaaaacgaaa gccggtcagc gggcactctt 10680
ccgtggtctg gtgaatagat cgcaagggta tcatggcgga gggcctcggt tcgagccccg 10740
ggtccgggcc ggacggtccg ccatgatcca cgcggttacc gcccgcgtgt cgaacccagg 10800
tgtgcgacgt cagacaacgg tggagtgttc cttttggcgt ttttctggcc gggcgccggc 10860
gccgcgtaag agactaagcc gcgaaagcga aagcagtaag tggctcgctc cccgtagccg 10920
gagggatcct tgctaagggt tgcgttgcgg cgaaccccgg ttcgaatccc gtactcgggc 10980
cggccggacc cgcggctaag gtgttggatt ggcctccccc tcgtataaag accccgcttg 11040
cggattgact ccggacacgg ggacgagccc cttttatttt tgctttcccc agatgcatcc 11100
ggtgctgcgg cagatgcgcc ccccgcccca gcagcagcaa caacaccagc aagagcggca 11160
gcaacagcag cgggagtcat gcagggcccc ctcacccacc ctcggcgggc cggccacctc 11220
ggcgtccgcg gccgtgtctg gcgcctgcgg cggcggcggg gggccggctg acgaccccga 11280
ggagcccccg cggcgcaggg ccagacacta cctggacctg gaggagggcg agggcctggc 11340
gcggctgggg gcgccgtctc ccgagcgcca cccgcgggtg cagctgaagc gcgactcgcg 11400
cgaggcgtac gtgcctcggc agaacctgtt cagggaccgc gcgggcgagg agcccgagga 11460
gatgcgggac aggaggttca gcgcagggcg ggagctgcgg caggggctga accgcgagcg 11520
gctgctgcgc gaggaggact ttgagcccga cgcgcggacg gggatcagcc ccgcgcgcgc 11580
gcacgtggcg gccgccgacc tggtgacggc gtacgagcag acggtgaacc aggagatcaa 11640
cttccaaaag agtttcaaca accacgtgcg cacgctggtg gcgcgcgagg aggtgaccat 11700
cgggctgatg cacctgtggg actttgtaag cgcgctggtg cagaacccca acagcaagcc 11760
tctgacggcg cagctgttcc tgatagtgca gcacagcagg gacaacgagg cgtttaggga 11820
cgcgctgctg aacatcaccg agcccgaggg tcggtggctg ctggacctga ttaacatcct 11880
gcagagcata gtggtgcagg agcgcagcct gagcctggcc gacaaggtgg cggccatcaa 11940
ctactcgatg ctgagcctgg gcaagtttta cgcgcgcaag atctaccaga cgccgtacgt 12000
gcccatagac aaggaggtga agatcgacgg tttttacatg cgcatggcgc tgaaggtgct 12060
caccctgagc gacgacctgg gcgtgtaccg caacgagcgc atccacaagg ccgtgagcgt 12120
gagccggcgg cgcgagctga gcgaccgcga gctgatgcac agcctgcagc gggcgctggc 12180
gggcgccggc agcggcgaca gggaggcgga gtcctacttc gatgcggggg cggacctgcg 12240
ctgggcgccc agccggcggg ccctggaggc cgcgggggtc cgcgaggact atgacgagga 12300
cggcgaggag gatgaggagt acgagctaga ggagggcgag tacctggact aaaccgcggg 12360
tggtgtttcc ggtagatgca agacccgaac gtggtggacc cggcgctgcg ggcggctctg 12420
cagagccagc cgtccggcct taactcctca gacgactggc gacaggtcat ggaccgcatc 12480
atgtcgctga cggcgcgtaa cccggacgcg ttccggcagc agccgcaggc caacaggctc 12540
tccgccatcc tggaggcggt ggtgcctgcg cgctcgaacc ccacgcacga gaaggtgctg 12600
gccatagtga acgcgctggc cgagaacagg gccatccgcc cggacgaggc cgggctggtg 12660
tacgacgcgc tgctgcagcg cgtggcccgc tacaacagcg gcaacgtgca gaccaacctg 12720
gaccggctgg tgggggacgt gcgcgaggcg gtggcgcagc gcgagcgcgc ggatcggcag 12780
ggcaacctgg gctccatggt ggcgctgaat gccttcctga gcacgcagcc ggccaacgtg 12840
ccgcgggggc aggaagacta caccaacttt gtgagcgcgc tgcggctgat ggtgaccgag 12900
accccccaga gcgaggtgta ccagtcgggc ccggactact tcttccagac cagcagacag 12960
ggcctgcaga cggtgaacct gagccaggct ttcaagaacc tgcgggggct gtggggcgtg 13020
aaggcgccca ccggcgaccg ggcgacggtg tccagcctgc tgacgcccaa ctcgcgcctg 13080
ctgctgctgc tgatcgcgcc gttcacggac agcggcagcg tgtcccggga cacctacctg 13140
gggcacctgc tgaccctgta ccgcgaggcc atcgggcagg cgcaggtgga cgagcacacc 13200
ttccaggaga tcaccagcgt gagccgcgcg ctggggcagg aggacacgag cagcctggag 13260
gcgactctga actacctgct gaccaaccgg cggcagaaga ttccctcgct gcacagcctg 13320
acctccgagg aggagcgcat cttgcgctac gtgcagcaga gcgtgagcct gaacctgatg 13380
cgcgacgggg tgacgcccag cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc 13440
atgtacgccg cgcaccggcc ttacatcaac cgcctgatgg actacctgca tcgcgcggcg 13500
gccgtgaacc ccgagtactt taccaacgcc atcctgaacc cgcactggct cccgccgccc 13560
gggttctaca gcgggggctt cgaggtcccg gagaccaacg atggcttcct gtgggacgac 13620
atggacgaca gcgtgttctc cccgcggccg caggcgctgg cggaagcgtc cctgctgcgt 13680
cccaagaagg aggaggagga ggaggcgagt cgccgccgcg gcagcagcgg cgtggcttct 13740
ctgtccgagc tgggggcggc agccgccgcg cgccccgggt ccctgggcgg cagccccttt 13800
ccgagcctgg tggggtctct gcacagcgag cgcaccaccc gccctcggct gctgggcgag 13860
gacgagtacc tgaataactc cctgctgcag ccggtgcggg agaaaaacct gcctcccgcc 13920
ttccccaaca acgggataga gagcctggtg gacaagatga gcagatggaa gacctatgcg 13980
caggagcaca gggacgcgcc tgcgctccgg ccgcccacgc ggcgccagcg ccacgaccgg 14040
cagcgggggc tggtgtggga tgacgaggac tccgcggacg atagcagcgt gctggacctg 14100
ggagggagcg gcaacccgtt cgcgcacctg cgcccccgcc tggggaggat gttttaaaaa 14160
aaaaaaaaaa aagcaagaag catgatgcaa aaattaaata aaactcacca aggccatggc 14220
gaccgagcgt tggtttcttg tgttcccttc agtatgcggc gcgcggcgat gtaccaggag 14280
ggacctcctc cctcttacga gagcgtggtg ggcgcggcgg cggcggcgcc ctcttctccc 14340
tttgcgtcgc agctgctgga gccgccgtac gtgcctccgc gctacctgcg gcctacgggg 14400
gggagaaaca gcatccgtta ctcggagctg gcgcccctgt tcgacaccac ccgggtgtac 14460
ctggtggaca acaagtcggc ggacgtggcc tccctgaact accagaacga ccacagcaat 14520
tttttgacca cggtcatcca gaacaatgac tacagcccga gcgaggccag cacccagacc 14580
atcaatctgg atgaccggtc gcactggggc ggcgacctga aaaccatcct gcacaccaac 14640
atgcccaacg tgaacgagtt catgttcacc aataagttca aggcgcgggt gatggtgtcg 14700
cgctcgcaca ccaaggaaga ccgggtggag ctgaagtacg agtgggtgga gttcgagctg 14760
ccagagggca actactccga gaccatgacc attgacctga tgaacaacgc gatcgtggag 14820
cactatctga aagtgggcag gcagaacggg gtcctggaga gcgacatcgg ggtcaagttc 14880
gacaccagga acttccgcct ggggctggac cccgtgaccg ggctggttat gcccggggtg 14940
tacaccaacg aggccttcca tcccgacatc atcctgctgc ccggctgcgg ggtggacttc 15000
acttacagcc gcctgagcaa cctcctgggc atccgcaagc ggcagccctt ccaggagggc 15060
ttcaggatca cctacgagga cctggagggg ggcaacatcc ccgcgctcct cgatgtggag 15120
gcctaccagg atagcttgaa ggaaaatgag gcgggacagg aggataccgc ccccgccgcc 15180
tccgccgccg ccgagcaggg cgaggatgct gctgacaccg cggccgcgga cggggcagag 15240
gccgaccccg ctatggtggt ggaggctccc gagcaggagg aggacatgaa tgacagtgcg 15300
gtgcgcggag acaccttcgt cacccggggg gaggaaaagc aagcggaggc cgaggccgcg 15360
gccgaggaaa agcaactggc ggcagcagcg gcggcggcgg cgttggccgc ggcggaggct 15420
gagtctgagg ggaccaagcc cgccaaggag cccgtgatta agcccctgac cgaagatagc 15480
aagaagcgca gttacaacct gctcaaggac agcaccaaca ccgcgtaccg cagctggtac 15540
ctggcctaca actacggcga cccgtcgacg ggggtgcgct cctggaccct gctgtgcacg 15600
ccggacgtga cctgcggctc ggagcaggtg tactggtcgc tgcccgacat gatgcaagac 15660
cccgtgacct tccgctccac gcggcaggtc agcaacttcc cggtggtggg cgccgagctg 15720
ctgcccgtgc actccaagag cttctacaac gaccaggccg tctactccca gctcatccgc 15780
cagttcacct ctctgaccca cgtgttcaat cgctttcctg agaaccagat tctggcgcgc 15840
ccgcccgccc ccaccatcac caccgtcagt gaaaacgttc ctgctctcac agatcacggg 15900
acgctaccgc tgcgcaacag catcggagga gtccagcgag tgaccgttac tgacgccaga 15960
cgccgcacct gcccctacgt ttacaaggcc ttgggcatag tctcgccgcg cgtcctttcc 16020
agccgcactt tttgagcaac accaccatca tgtccatcct gatctcaccc agcaataact 16080
ccggctgggg actgctgcgc gcgcccagca agatgttcgg aggggcgagg aagcgttccg 16140
agcagcaccc cgtgcgcgtg cgcgggcact tccgcgcccc ctggggagcg cacaaacgcg 16200
gccgcgcggg gcgcaccacc gtggacgacg ccatcgactc ggtggtggag caggcgcgca 16260
actacaggcc cgcggtctct accgtggacg cggccatcca gaccgtggtg cggggcgcgc 16320
ggcggtacgc caagctgaag agccgccgga agcgcgtggc ccgccgccac cgccgccgac 16380
ccggggccgc cgccaaacgc gccgccgcgg ccctgcttcg ccgggccaag cgcacgggcc 16440
gccgcgccgc catgagggcc gcgcgccgct tggccgccgg catcaccgcc gccaccatgg 16500
ccccccgtac ccgaagacgc gcggccgccg ccgccgccgc cgccatcagt gacatggcca 16560
gcaggcgccg gggcaacgtg tactgggtgc gcgactcggt gaccggcacg cgcgtgcccg 16620
tgcgcttccg ccccccgcgg acttgagatg atgtgaaaaa acaacactga gtctcctgct 16680
gttgtgtgta tcccagcggc ggcggcgcgc gcagcgtcat gtccaagcgc aaaatcaaag 16740
aagagatgct ccaggtcgtc gcgccggaga tctatgggcc cccgaagaag gaagagcagg 16800
attcgaagcc ccgcaagata aagcgggtca aaaagaaaaa gaaagatgat gacgatgccg 16860
atggggaggt ggagttcctg cgcgccacgg cgcccaggcg cccggtgcag tggaagggcc 16920
ggcgcgtaaa gcgcgtcctg cgccccggca ccgcggtggt cttcacgccc ggcgagcgct 16980
ccacccggac tttcaagcgc gtctatgacg aggtgtacgg cgacgaagac ctgctggagc 17040
aggccaacga gcgcttcgga gagtttgctt acgggaagcg tcagcgggcg ctggggaagg 17100
aggacctgct ggcgctgccg ctggaccagg gcaaccccac ccccagtctg aagcccgtga 17160
ccctgcagca ggtgctgccg agcagcgcac cctccgaggc gaagcggggt ctgaagcgcg 17220
agggcggcga cctggcgccc accgtgcagc tcatggtgcc caagcggcag aggctggagg 17280
atgtgctgga gaaaatgaaa gtagaccccg gtctgcagcc ggacatcagg gtccgcccca 17340
tcaagcaggt ggcgccgggc ctcggcgtgc agaccgtgga cgtggtcatc cccaccggca 17400
actcccccgc cgccgccacc actaccgctg cctccacgga catggagaca cagaccgatc 17460
ccgccgcagc cgcagccgca gccgccgccg cgacctcctc ggcggaggtg cagacggacc 17520
cctggctgcc gccggcgatg tcagctcccc gcgcgcgtcg cgggcgcagg aagtacggcg 17580
ccgccaacgc gctcctgccc gagtacgcct tgcatccttc catcgcgccc acccccggct 17640
accgaggcta tacctaccgc ccgcgaagag ccaagggttc cacccgccgt ccccgccgac 17700
gcgccgccgc caccacccgc cgccgccgcc gcagacgcca gcccgcactg gctccagtct 17760
ccgtgaggaa agtggcgcgc gacggacaca ccctggtgct gcccagggcg cgctaccacc 17820
ccagcatcgt ttaaaagcct gttgtggttc ttgcagatat ggccctcact tgccgcctcc 17880
gtttcccggt gccgggatac cgaggaggaa gatcgcgccg caggaggggt ctggccggcc 17940
gcggcctgag cggaggcagc cgccgcgcgc accggcggcg acgcgccacc agccgacgca 18000
tgcgcggcgg ggtgctgccc ctgttaatcc ccctgatcgc cgcggcgatc ggcgccgtgc 18060
ccgggatcgc ctccgtggcc ttgcaagcgt cccagaggca ttgacagact tgcaaacttg 18120
caaatatgga aaaaaaaacc ccaataaaaa agtctagact ctcacgctcg cttggtcctg 18180
tgactatttt gtagaatgga agacatcaac tttgcgtcgc tggccccgcg tcacggctcg 18240
cgcccgttcc tgggacactg gaacgatatc ggcaccagca acatgagcgg tggcgccttc 18300
agttggggct ctctgtggag cggcattaaa agtatcgggt ctgccgttaa aaattacggc 18360
tcccgggcct ggaacagcag cacgggccag atgttgagag acaagttgaa agagcagaac 18420
ttccagcaga aggtggtgga gggcctggcc tccggcatca acggggtggt ggacctggcc 18480
aaccaggccg tgcagaataa gatcaacagc agactggacc cccggccgcc ggtggaggag 18540
gtgccgccgg cgctggagac ggtgtccccc gatgggcgtg gcgagaagcg cccgcggccc 18600
gatagggaag agaccactct ggtcacgcag accgatgagc cgcccccgta tgaggaggcc 18660
ctgaagcaag gtctgcccac cacgcggccc atcgcgccca tggccaccgg ggtggtgggc 18720
cgccacaccc ccgccacgct ggacttgcct ccgcccgccg atgtgccgca gcagcagaag 18780
gcggcacagc cgggcccgcc cgcgaccgcc tcccgttcct ccgccggtcc tctgcgccgc 18840
gcggccagcg gcccccgcgg gggggtcgcg aggcacggca actggcagag cacgctgaac 18900
agcatcgtgg gtctgggggt gcggtccgtg aagcgccgcc gatgctactg aatagcttag 18960
ctaacgtgtt gtatgtgtgt atgcgcccta tgtcgccgcc agaggagctg ctgagtcgcc 19020
gccgttcgcg cgcccaccac caccgccact ccgcccctca agatggcgac cccatcgatg 19080
atgccgcagt ggtcgtacat gcacatctcg ggccaggacg cctcggagta cctgagcccc 19140
gggctggtgc agttcgcccg cgccaccgag agctacttca gcctgagtaa caagtttagg 19200
aaccccacgg tggcgcccac gcacgatgtg accaccgacc ggtctcagcg cctgacgctg 19260
cggttcattc ccgtggaccg cgaggacacc gcgtactcgt acaaggcgcg gttcaccctg 19320
gccgtgggcg acaaccgcgt gctggacatg gcctccacct actttgacat ccgcggggtg 19380
ctggaccggg gtcccacttt caagccctac tctggcaccg cctacaactc cctggccccc 19440
aagggcgctc ccaactcctg cgagtgggag caagaggaaa ctcaggcagt tgaagaagca 19500
gcagaagagg aagaagaaga tgctgacggt caagctgagg aagagcaagc agctaccaaa 19560
aagactcatg tatatgctca ggctcccctt tctggcgaaa aaattagtaa agatggtctg 19620
caaataggaa cggacgctac agctacagaa caaaaaccta tttatgcaga ccctacattc 19680
cagcccgaac cccaaatcgg ggagtcccag tggaatgagg cagatgctac agtcgccggc 19740
ggtagagtgc taaagaaatc tactcccatg aaaccatgct atggttccta tgcaagaccc 19800
acaaatgcta atggaggtca gggtgtacta acggcaaatg cccagggaca gctagaatct 19860
caggttgaaa tgcaattctt ttcaacttct gaaaacgccc gtaacgaggc taacaacatt 19920
cagcccaaat tggtgctgta tagtgaggat gtgcacatgg agaccccgga tacgcacctt 19980
tcttacaagc ccgcaaaaag cgatgacaat tcaaaaatca tgctgggtca gcagtccatg 20040
cccaacagac ctaattacat cggcttcaga gacaacttta tcggcctcat gtattacaat 20100
agcactggca acatgggagt gcttgcaggt caggcctctc agttgaatgc agtggtggac 20160
ttgcaagaca gaaacacaga actgtcctac cagctcttgc ttgattccat gggtgacaga 20220
accagatact tttccatgtg gaatcaggca gtggacagtt atgacccaga tgttagaatt 20280
attgaaaatc atggaactga agacgagctc cccaactatt gtttccctct gggtggcata 20340
ggggtaactg acacttacca ggctgttaaa accaacaatg gcaataacgg gggccaggtg 20400
acttggacaa aagatgaaac ttttgcagat cgcaatgaaa taggggtggg aaacaatttc 20460
gctatggaga tcaacctcag tgccaacctg tggagaaact tcctgtactc caacgtggcg 20520
ctgtacctac cagacaagct taagtacaac ccctccaatg tggacatctc tgacaacccc 20580
aacacctacg attacatgaa caagcgagtg gtggccccgg ggctggtgga ctgctacatc 20640
aacctgggcg cgcgctggtc gctggactac atggacaacg tcaacccctt caaccaccac 20700
cgcaatgcgg gcctgcgcta ccgctccatg ctcctgggca acgggcgcta cgtgcccttc 20760
cacatccagg tgccccagaa gttctttgcc atcaagaacc tcctcctcct gccgggctcc 20820
tacacctacg agtggaactt caggaaggat gtcaacatgg tcctccagag ctctctgggt 20880
aacgatctca gggtggacgg ggccagcatc aagttcgaga gcatctgcct ctacgccacc 20940
ttcttcccca tggcccacaa cacggcctcc acgctcgagg ccatgctcag gaacgacacc 21000
aacgaccagt ccttcaatga ctacctctcc gccgccaaca tgctctaccc catacccgcc 21060
aacgccacca acgtccccat ctccatcccc tcgcgcaact gggcggcctt ccgcggctgg 21120
gccttcaccc gcctcaagac caaggagacc ccctccctgg gctcgggatt cgacccctac 21180
tacacctact cgggctccat tccctacctg gacggcacct tctacctcaa ccacactttc 21240
aagaaggtct cggtcacctt cgactcctcg gtcagctggc cgggcaacga ccgtctgctc 21300
acccccaacg agttcgagat caagcgctcg gtcgacgggg agggctacaa cgtggcccag 21360
tgcaacatga ccaaggactg gttcctggtc cagatgctgg ccaactacaa catcggctac 21420
cagggcttct acatcccaga gagctacaag gacaggatgt actccttctt caggaacttc 21480
cagcccatga gccggcaggt ggtggaccag accaagtaca aggactacca ggaggtgggc 21540
atcatccacc agcacaacaa ctcgggcttc gtgggctacc tcgcccccac catgcgcgag 21600
ggacaggcct accccgccaa cttcccctat ccgctcatag gcaagaccgc ggtcgacagc 21660
atcacccaga aaaagttcct ctgcgaccgc accctctggc gcatcccctt ctccagcaac 21720
ttcatgtcca tgggtgcgct ctcggacctg ggccagaact tgctctacgc caactccgcc 21780
cacgccctcg acatgacctt cgaggtcgac cccatggacg agcccaccct tctctatgtt 21840
ctgttcgaag tctttgacgt ggtccgggtc caccagccgc accgcggcgt catcgagacc 21900
gtgtacctgc gtacgccctt ctcggccggc aacgccacca cctaaagaag caagccgcag 21960
tcatcgccgc ctgcatgccg tcgggttcca ccgagcaaga gctcagggcc atcgtcagag 22020
acctgggatg cgggccctat tttttgggca ccttcgacaa gcgcttccct ggctttgtct 22080
ccccacacaa gctggcctgc gccatcgtca acacggccgg ccgcgagacc gggggcgtgc 22140
actggctggc cttcgcctgg aacccgcgct ccaaaacatg cttcctcttt gaccccttcg 22200
gcttttcgga ccagcggctc aagcaaatct acgagttcga gtacgagggc ttgctgcgtc 22260
gcagcgccat cgcctcctcg cccgaccgct gcgtcaccct cgaaaagtcc acccagaccg 22320
tgcaggggcc cgactcggcc gcctgcggtc tcttctgctg catgtttctg cacgcctttg 22380
tgcactggcc tcagagtccc atggaccgca accccaccat gaacttgctg acgggggtgc 22440
ccaactccat gctccagagc ccccaggtcg agcccaccct gcgccgcaac caggagcagc 22500
tctacagctt cctggagcgc cactcgcctt acttccgccg ccacagcgca cagatcagga 22560
gggccacctc cttctgccac ttgcaagaga tgcaagaagg gtaataacga tgtacacact 22620
ttttttctca ataaatggca tctttttatt tatacaagct ctctggggta ttcatttccc 22680
accaccaccc gccgttgtcg ccatctggct ctatttagaa atcgaaaggg ttctgccggg 22740
agtcgccgtg cgccacgggc agggacacgt tgcgatactg gtagcgggtg ccccacttga 22800
actcgggcac caccaggcga ggcagctcgg ggaagttttc gctccacagg ctgcgggtca 22860
gcaccagcgc gttcatcagg tcgggcgccg agatcttgaa gtcgcagttg gggccgccgc 22920
cctgcgcgcg cgagttgcgg tacaccgggt tgcagcactg gaacaccaac agcgccgggt 22980
gcttcacgct ggccagcacg ctgcggtcgg agatcagctc ggcgtccagg tcctccgcgt 23040
tgctcagcgc gaacggggtc atcttgggca cttgccgccc caggaagggc gcgtgccccg 23100
gtttcgagtt gcagtcgcag cgcagcggga tcagcaggtg cccgtgcccg gactcggcgt 23160
tggggtacag cgcgcgcatg aaggcctgca tctggcggaa ggccatctgg gccttggcgc 23220
cctccgagaa gaacatgccg caggacttgc ccgagaactg gtttgcgggg cagctggcgt 23280
cgtgcaggca gcagcgcgcg tcggtgttgg cgatctgcac cacgttgcgc ccccaccggt 23340
tcttcacgat cttggccttg gacgattgct ccttcagcgc gcgctgcccg ttctcgctgg 23400
tcacatccat ctcgatcaca tgttccttgt tcaccatgct gctgccgtgc agacacttca 23460
gctcgccctc cgtctcggtg cagcggtgct gccacagcgc gcagcccgtg ggctcgaaag 23520
acttgtaggt cacctccgcg aaggactgca ggtacccctg caaaaagcgg cccatcatgg 23580
tcacgaaggt cttgttgctg ctgaaggtca gctgcagccc gcggtgctcc tcgttcagcc 23640
aggtcttgca cacggccgcc agcgcctcca cctggtcggg cagcatcttg aagttcacct 23700
tcagctcatt ctccacgtgg tacttgtcca tcagcgtgcg cgccgcctcc atgcccttct 23760
cccaggccga caccagcggc aggctcacgg ggttcttcac catcaccgtg gccgccgcct 23820
ccgccgcgct ttcgctttcc gccccgctgt tctcttcctc ttcctcctct tcctcgccgc 23880
cgcccactcg cagcccccgc accacggggt cgtcttcctg caggcgctgc accttgcgct 23940
tgccgttgcg cccctgcttg atgcgcacgg gcgggttgct gaagcccacc atcaccagcg 24000
cggcctcttc ttgctcgtcc tcgctgtcca gaatgacctc cggggagggg gggttggtca 24060
tcctcagtac cgaggcacgc ttctttttct tcctgggggc gttcgccagc tccgcggctg 24120
cggccgctgc cgaggtcgaa ggccgagggc tgggcgtgcg cggcaccagc gcgtcctgcg 24180
agccgtcctc gtcctcctcg gactcgagac ggaggcgggc ccgcttcttc gggggcgcgc 24240
ggggcggcgg aggcggcggc ggcgacggag acggggacga gacatcgtcc agggtgggtg 24300
gacggcgggc cgcgccgcgt ccgcgctcgg gggtggtctc gcgctggtcc tcttcccgac 24360
tggccatctc ccactgctcc ttctcctata ggcagaaaga gatcatggag tctctcatgc 24420
gagtcgagaa ggaggaggac agcctaaccg ccccctctga gccctccacc accgccgcca 24480
ccaccgccaa tgccgccgcg gacgacgcgc ccaccgagac caccgccagt accaccctcc 24540
ccagcgacgc acccccgctc gagaatgaag tgctgatcga gcaggacccg ggttttgtga 24600
gcggagagga ggatgaggtg gatgagaagg agaaggagga ggtcgccgcc tcagtgccaa 24660
aagaggataa aaagcaagac caggacgacg cagataagga tgagacagca gtcgggcggg 24720
ggaacggaag ccatgatgct gatgacggct acctagacgt gggagacgac gtgctgctta 24780
agcacctgca ccgccagtgc gtcatcgtct gcgacgcgct gcaggagcgc tgcgaagtgc 24840
ccctggacgt ggcggaggtc agccgcgcct acgagcggca cctcttcgcg ccgcacgtgc 24900
cccccaagcg ccgggagaac ggcacctgcg agcccaaccc gcgtctcaac ttctacccgg 24960
tcttcgcggt acccgaggtg ctggccacct accacatctt tttccaaaac tgcaagatcc 25020
ccctctcctg ccgcgccaac cgcacccgcg ccgacaaaac cctgaccctg cggcagggcg 25080
cccacatacc tgatatcgcc tctctggagg aagtgcccaa gatcttcgag ggtctcggtc 25140
gcgacgagaa acgggcggcg aacgctctgc acggagacag cgaaaacgag agtcactcgg 25200
gggtgctggt ggagctcgag ggcgacaacg cgcgcctggc cgtactcaag cgcagcatag 25260
aggtcaccca ctttgcctac ccggcgctca acctgccccc caaggtcatg agtgtggtca 25320
tgggcgagct catcatgcgc cgcgcccagc ccctggccgc ggatgcaaac ttgcaagagt 25380
cctccgagga aggcctgccc gcggtcagcg acgagcagct ggcgcgctgg ctggagaccc 25440
gcgaccccgc gcagctggag gagcggcgca agctcatgat ggccgcggtg ctggtcaccg 25500
tggagctcga gtgtctgcag cgcttcttcg cggaccccga gatgcagcgc aagctcgagg 25560
agaccctgca ctacaccttc cgccagggct acgtgcgcca ggcctgcaag atctccaacg 25620
tggagctctg caacctggtc tcctacctgg gcatcctgca cgagaaccgc ctcgggcaga 25680
acgtcctgca ctccaccctc aaaggggagg cgcgccgcga ctacatccgc gactgcgcct 25740
acctcttcct ctgctacacc tggcagacgg ccatgggggt ctggcagcag tgcctggagg 25800
agcgcaacct caaggagctg gaaaagctcc tcaagcgcac cctcagggac ctctggacgg 25860
gcttcaacga gcgctcggtg gccgccgcgc tggcggacat catctttccc gagcgcctgc 25920
tcaagaccct gcagcagggc ctgcccgact tcaccagcca gagcatgctg cagaacttca 25980
ggactttcat cctggagcgc tcgggcatcc tgccggccac ttgctgcgcg ctgcccagcg 26040
acttcgtgcc catcaagtac agggagtgcc cgccgccgct ctggggccac tgctacctct 26100
tccagctggc caactacctc gcctaccact cggacctcat ggaagacgtg agcggcgagg 26160
gcctgctcga gtgccactgc cgctgcaacc tctgcacgcc ccaccgctct ctagtctgca 26220
acccgcagct gctcagcgag agtcagatta tcggtacctt cgagctgcag ggtccctcgc 26280
ctgacgagaa gtccgcggct ccagggctga aactcactcc ggggctgtgg acttccgcct 26340
acctacgcaa atttgtacct gaggactacc acgcccacga gatcaggttc tacgaagacc 26400
aatcccgccc gcccaaggcg gagctcaccg cctgcgtcat cacccagggg cacatcctgg 26460
gccaattgca agccatcaac aaagcccgcc gagagttctt gctgaaaaag ggtcgggggg 26520
tgtacctgga cccccagtcc ggcgaggagc taaacccgct acccccgccg ccgccccagc 26580
agcgggacct tgcttcccag gatggcaccc agaaagaagc agcagccgcc gccgccgccg 26640
cagccataca tgcttctgga ggaagaggag gaggactggg acagtcaggc agaggaggtt 26700
tcggacgagg agcaggagga gatgatggaa gactgggagg aggacagcag cctagacgag 26760
gaagcttcag aggccgaaga ggtggcagac gcaacaccat cgccctcggt cgcagccccc 26820
tcgccggggc ccctgaaatc ctccgaaccc agcaccagcg ctataacctc cgctcctccg 26880
gcgccggcgc cacccgcccg cagacccaac cgtagatggg acaccacagg aaccggggtc 26940
ggtaagtcca agtgcccgcc gccgccaccg cagcagcagc agcagcagcg ccagggctac 27000
cgctcgtggc gcgggcacaa gaacgccata gtcgcctgct tgcaagactg cgggggcaac 27060
atctctttcg cccgccgctt cctgctattc caccacgggg tcgcctttcc ccgcaatgtc 27120
ctgcattact accgtcatct ctacagcccc tactgcagcg gcgacccaga ggcggcagcg 27180
gcagccacag cggcgaccac cacctaggaa gatatcctcc gcgggcaaga cagcggcagc 27240
agcggccagg agacccgcgg cagcagcggc gggagcggtg ggcgcactgc gcctctcgcc 27300
caacgaaccc ctctcgaccc gggagctcag acacaggatc ttccccactt tgtatgccat 27360
cttccaacag agcagaggcc aggagcagga gctgaaaata aaaaacagat ctctgcgctc 27420
cctcacccgc agctgtctgt atcacaaaag cgaagatcag cttcggcgca cgctggagga 27480
cgcggaggca ctcttcagca aatactgcgc gctcactctt aaagactagc tccgcgccct 27540
tctcgaattt aggcgggaga aaactacgtc atcgccggcc gccgcccagc ccgcccagcc 27600
gagatgagca aagagattcc cacgccatac atgtggagct accagccgca gatgggactc 27660
gcggcgggag cggcccagga ctactccacc cgcatgaact acatgagcgc gggaccccac 27720
atgatctcac aggtcaacgg gatccgcgcc cagcgaaacc aaatactgct ggaacaggcg 27780
gccatcaccg ccacgccccg ccataatctc aacccccgaa attggcccgc cgccctcgtg 27840
taccaggaaa ccccctccgc caccaccgta ctacttccgc gtgacgccca ggccgaagtc 27900
cagatgacta actcaggggc gcagctcgcg ggcggctttc gtcacggggc gcggccgctc 27960
cgaccaggta taagacacct gatgatcaga ggccgaggta tccagctcaa cgacgagtcg 28020
gtgagctctt cgctcggtct ccgtccggac ggaactttcc agctcgccgg atccggccgc 28080
tcttcgttca cgccccgcca ggcgtacctg actctgcaga cctcgtcctc ggagccccgc 28140
tccggcggca tcggaaccct ccagttcgtg gaggagttcg tgccctcggt ctacttcaac 28200
cccttctcgg gacctcccgg acgctacccc gaccagttca ttccgaactt tgacgcggtg 28260
aaggactcgg cggacggcta cgactgaatg tcaggtgtcg aggcagagca gcttcgcctg 28320
agacacctcg agcactgccg ccgccacaag tgcttcgccc gcggttctgg tgagttctgc 28380
tactttcagc tacccgagga gcataccgag gggccggcgc acggcgtccg cctgaccacc 28440
cagggcgagg ttacctgttc cctcatccgg gagtttaccc tccgtcccct gctagtggag 28500
cgggagcggg gtccctgtgt cctaactatc gcctgcaact gccctaaccc tggattacat 28560
caagatcttt gctgtcatct ctgtgctgag tttaataaac gctgagatca gaatctactg 28620
gggctcctgt cgccatcctg tgaacgccac cgtcttcacc caccccgacc aggcccaggc 28680
gaacctcacc tgcggtctgc atcggagggc caagaagtac ctcacctggt acttcaacgg 28740
cacccccttt gtggtttaca acagcttcga cggggacgga gtctccctga aagaccagct 28800
ctccggtctc agctactcca tccacaagaa caccaccctc caactcttcc ctccctacct 28860
gccgggaacc tacgagtgcg tcaccggccg ctgcacccac ctcacccgcc tgatcgtaaa 28920
ccagagcttt ccgggaacag ataactccct cttccccaga acaggaggtg agctcaggaa 28980
actccccggg gaccagggcg gagacgtacc ttcgaccctt gtggggttag gattttttat 29040
taccgggttg ctggctcttt taatcaaagt ttccttgaga tttgttcttt ccttctacgt 29100
gtatgaacac ctcaacctcc aataactcta ccctttcttc ggaatcaggt gacttctctg 29160
aaatcgggct tggtgtgctg cttactctgt tgattttttt ccttatcata ctcagccttc 29220
tgtgcctcag gctcgccgcc tgctgcgcac acatctatat ctactgctgg ttgctcaagt 29280
gcaggggtcg ccacccaaga tgaacaggta catggtccta tcgatcctag gcctgctggc 29340
cctggcggcc tgcagcgccg ccaaaaaaga gattaccttt gaggagcccg cttgcaatgt 29400
aactttcaag cccgagggtg accaatgcac caccctcgtc aaatgcgtta ccaatcatga 29460
gaggctgcgc atcgactaca aaaacaaaac tggccagttt gcggtctata gtgtgtttac 29520
gcccggagac ccctctaact actctgtcac cgtcttccag ggcggacagt ctaagatatt 29580
caattacact ttcccttttt atgagttatg cgatgcggtc atgtacatgt caaaacagta 29640
caacctgtgg cctccctctc cccaggcgtg tgtggaaaat actgggtctt actgctgtat 29700
ggctttcgca atcactacgc tcgctctaat ctgcacggtg ctatacataa aattcaggca 29760
gaggcgaatc tttatcgatg aaaagaaaat gccttgatcg ctaacaccgg ctttctatct 29820
gcagaatgaa tgcaatcacc tccctactaa tcaccaccac cctccttgcg attgcccatg 29880
ggttgacacg aatcgaagtg ccagtggggt ccaatgtcac catggtgggc cccgccggca 29940
attccaccct catgtgggaa aaatttgtcc gcaatcaatg ggttcatttc tgctctaacc 30000
gaatcagtat caagcccaga gccatctgcg atgggcaaaa tctaactctg atcaatgtgc 30060
aaatgatgga tgctgggtac tattacgggc agcggggaga aatcattaat tactggcgac 30120
cccacaagga ctacatgctg catgtagtcg aggcacttcc cactaccacc cccactacca 30180
cctctcccac caccaccacc actactacta ctactactac tactactact actaccacta 30240
ccgctgcccg ccatacccgc aaaagcacca tgattagcac aaagccccct cgtgctcact 30300
cccacgccgg cgggcccatc ggtgcgacct cagaaaccac cgagctttgc ttctgccaat 30360
gcactaacgc cagcgctcat gaactgttcg acctggagaa tgaggatgtc cagcagagct 30420
ccgcttgcct gacccaggag gctgtggagc ccgttgccct gaagcagatc ggtgattcaa 30480
taattgactc ttcttctttt gccactcccg aataccctcc cgattctact ttccacatca 30540
cgggtaccaa agaccctaac ctctctttct acctgatgct gctgctctgt atctctgtgg 30600
tctcttccgc gctgatgtta ctggggatgt tctgctgcct gatctgccgc agaaagagaa 30660
aagctcgctc tcagggccaa ccactgatgc ccttccccta ccccccggat tttgcagata 30720
acaagatatg agctcgctgc tgacactaac cgctttacta gcctgcgctc taacccttgt 30780
cgcttgcgac tcgagattcc acaatgtcac agctgtggca ggagaaaatg ttactttcaa 30840
ctccacggcc gatacccagt ggtcgtggag tggctcaggt agctacttaa ctatctgcaa 30900
tagctccact tcccccggca tatccccaac caagtaccaa tgcaatgcca gcctgttcac 30960
cctcatcaac gcttccaccc tggacaatgg actctatgta ggctatgtac cctttggtgg 31020
gcaaggaaag acccacgctt acaacctgga agttcgccag cccagaacca ctacccaagc 31080
ttctcccacc accaccacca ccaccaccat caccagcagc agcagcagca gcagccacag 31140
cagcagcagc agattattga ctttggtttt ggccagctca tctgccgcta cccaggccat 31200
ctacagctct gtgcccgaaa ccactcagat ccaccgccca gaaacgacca ccgccaccac 31260
cctacacacc tccagcgatc agatgccgac caacatcacc cccttggctc ttcaaatggg 31320
acttacaagc cccactccaa aaccagtgga tgcggccgag gtctccgccc tcgtcaatga 31380
ctgggcgggg ctgggaatgt ggtggttcgc cataggcatg atggcgctct gcctgcttct 31440
gctctggctc atctgctgcc tccaccgcag gcgagccaga ccccccatct atagacccat 31500
cattgtcctg aaccccgata atgatgggat ccatagattg gatggcctga aaaacctact 31560
tttttctttt acagtatgat aaattgagac atgcctcgca ttttcttgta catgttcctt 31620
ctcccacctt ttctggggtg ttctacgctg gccgctgtgt ctcacctgga ggtagactgc 31680
ctctcaccct tcactgtcta cctgctttac ggattggtca ccctcactct catctgcagc 31740
ctaatcacag taatcatcgc cttcatccag tgcattgatt acatctgtgt gcgcctcgca 31800
tacttcagac accacccgca gtaccgagac aggaacattg cccaacttct aagactgctc 31860
taatcatgca taagactgtg atctgccttc tgatcctctg catcctgccc accctcacct 31920
cctgccagta caccacaaaa tctccgcgca aaagacatgc ctcctgccgc ttcacccaac 31980
tgtggaatat acccaaatgc tacaacgaaa agagcgagct ctccgaagct tggctgtatg 32040
gggtcatctg tgtcttagtt ttctgcagca ctgtctttgc cctcataatc tacccctact 32100
ttgatttggg atggaacgcg atcgatgcca tgaattaccc cacctttccc gcacccgaga 32160
taattccact gcgacaagtt gtacccgttg tcgttaatca acgcccccca tcccctacgc 32220
ccactgaaat cagctacttt aacctaacag gcggagatga ctgacgccct agatctagaa 32280
atggacggca tcagtaccga gcagcgtctc ctagagaggc gcaggcaggc ggctgagcaa 32340
gagcgcctca atcaggagct ccgagatctc gttaacctgc accagtgcaa aagaggcatc 32400
ttttgtctgg taaagcaggc caaagtcacc tacgagaaga ccggcaacag ccaccgcctc 32460
agttacaaat tgcccaccca gcgccagaag ctggtgctca tggtgggtga gaatcccatc 32520
accgtcaccc agcactcggt agagaccgag gggtgtctgc actccccctg tcggggtcca 32580
gaagacctct gcaccctggt aaagaccctg tgcggtctca gagatttagt cccctttaac 32640
taatcaaaca ctggaatcaa taaaaagaat cacttactta aaatcagaca gcaggtctct 32700
gtccagttta ttcagcagca cctccttccc ctcctcccaa ctctggtact ccaaacgcct 32760
tctggcggca aacttcctcc acaccctgaa gggaatgtca gattcttgct cctgtccctc 32820
cgcacccact atcttcatgt tgttgcagat gaagcgcacc aaaacgtctg acgagagctt 32880
caaccccgtg tacccctatg acacggaaag cggccctccc tccgtccctt tcctcacccc 32940
tcccttcgtg tctcccgatg gattccaaga aagtcccccc ggggtcctgt ctctgaacct 33000
ggccgagccc ctggtcactt cccacggcat gctcgccctg aaaatgggaa gtggcctctc 33060
cctggacgac gctggcaacc tcacctctca agatatcacc accgctagcc ctcccctcaa 33120
aaaaaccaag accaacctca gcctagaaac ctcatccccc ctaactgtga gcacctcagg 33180
cgccctcacc gtagcagccg ccgctcccct ggcggtggcc ggcacctccc tcaccatgca 33240
atcagaggcc cccctgacag tacaggatgc aaaactcacc ctggccacca aaggccccct 33300
gaccgtgtct gaaggcaaac tggccttgca aacatcggcc ccgctgacgg ccgctgacag 33360
cagcaccctc acagtcagtg ccacaccacc ccttagcaca agcaatggca gcttgggtat 33420
tgacatgcaa gcccccattt acaccaccaa tggaaaacta ggacttaact ttggcgctcc 33480
cctgcatgtg gtagacagcc taaatgcact gactgtagtt actggccaag gtcttacgat 33540
aaacggaaca gccctacaaa ctagagtctc aggtgccctc aactatgaca catcaggaaa 33600
cctagaattg agagctgcag ggggtatgcg agttgatgca aatggtcaac ttatccttga 33660
tgtagcttac ccatttgatg cacaaaacaa tctcagcctt aggcttggac agggacccct 33720
gtttgttaac tctgcccaca acttggatgt taactacaac agaggcctct acctgttcac 33780
atctggaaat accaaaaagc tagaagttaa tatcaaaaca gccaagggtc tcatttatga 33840
tgacactgct atagcaatca atgcgggtga tgggctacag tttgactcag gctcagatac 33900
aaatccatta aaaactaaac ttggattagg actggattat gactccagca gagccataat 33960
tgctaaactg ggaactggcc taagctttga caacacaggt gccatcacag taggcaacaa 34020
aaatgatgac aagcttacct tgtggaccac accagaccca tcccctaact gtagaatcta 34080
ttcagagaaa gatgctaaat tcacacttgt tttgactaaa tgcggcagtc aggtgttggc 34140
cagcgtttct gttttatctg taaaaggtag ccttgcgccc atcagtggca cagtaactag 34200
tgctcagatt gtcctcagat ttgatgaaaa tggagttcta ctaagcaatt cttcccttga 34260
ccctcaatac tggaactaca gaaaaggtga ccttacagag ggcactgcat ataccaacgc 34320
agtgggattt atgcccaacc tcacagcata cccaaaaaca cagagccaaa ctgctaaaag 34380
caacattgta agtcaggttt acttgaatgg ggacaaatcc aaacccatga ccctcaccat 34440
taccctcaat ggaactaatg aaacaggaga tgccacagta agcacttact ccatgtcatt 34500
ctcatggaac tggaatggaa gtaattacat taatgaaacg ttccaaacca actccttcac 34560
cttctcctac atcgcccaag aataaaaagc atgacgctgt tgatttgatt caatgtgttt 34620
ctgttttatt ttcaagcaca acaaaatcat tcaagtcatt cttccatctt agcttaatag 34680
acacagtagc ttaatagacc cagtagtgca aagccccatt ctagcttata gatcagacag 34740
tgataattaa ccaccaccac caccatacct tttgattcag gaaatcatga tcatcacagg 34800
atcctagtct tcaggccgcc ccctccctcc caagacacag aatacacagt cctctccccc 34860
cgactggctt taaataacac catctggttg gtcacagaca tgttcttagg ggttatattc 34920
cacacggtct cctgccgcgc caggcgctcg tcggtgatgt tgataaactc tcccggcagc 34980
tcgctcaagt tcacgtcgct gtccagcggc tgaacctccg gctgacgcga taactgtgcg 35040
accggctgct ggacgaacgg aggccgcgcc tacaaggggg tagagtcata atcctcggtc 35100
aggatagggc ggtgatgcag cagcagcgag cgaaacatct gctgccgccg ccgctccgtc 35160
cggcaggaaa acaacacgcc ggtggtctcc tccgcgataa tccgcaccgc ccgcagcatc 35220
agcttcctcg ttctccgcgc gcagcacctc acccttatct cgctcaaatc ggcgcagtag 35280
gtacagcaca gcaccacgat gttattcatg atcccacagt gcagggcgct gtatccaaag 35340
ctcatgccgg gaaccaccgc ccccacgtgg ccatcgtacc acaagcgcac gtaaatcaag 35400
tgtcgacccc tcatgaacgc gctggacaca aacattactt ccttgggcat gttgtaattc 35460
accacctccc ggtaccagat aaacctctgg ttgaacaggg caccttccac caccatcctg 35520
aaccaagagg ccagaacctg cccaccggct atgcactgca gggaacccgg gttggaacaa 35580
tgacaatgca gactccaagg ctcgtaaccg tggatcatcc ggctgctgaa ggcatcgatg 35640
ttggcacaac acagacacac gtgcatgcac tttctcatga ttagcagctc ttccctcgtc 35700
aggatcatat cccaaggaat aacccattct tgaatcaacg taaaacccac acagcaggga 35760
aggcctcgca cataactcac gttgtgcatg gtcagcgtgt tgcattccgg aaacagcgga 35820
tgatcctcca gtatcgaggc gcgggtctcc ttctcacagg gaggtaaagg gtccctgctg 35880
tacggactgc gccgggacga ccgagatcgt gttgagcgta gtgtcatgga aaagggaacg 35940
ccggacgtgg tcatacttct tgaagcagaa ccaggttcgc gcgtggcagg cctccttgcg 36000
tctgcggtct cgccgtctag ctcgctccgt gtgatagttg tagtacagcc actcccgcag 36060
agcgtcgagg cgcaccctgg cttccggatc tatgtagact ccgtcttgca ccgcggccct 36120
gataatatcc accaccgtag aataagcaac acccagccaa gcaatacact cgctctgcga 36180
gcggcagaca ggaggagcgg gcagagatgg gagaaccatg ataaaaaact ttttttaaag 36240
aatattttcc aattcttcga aagtaagatc tatcaagtgg cagcgctccc ctccactggc 36300
gcggtcaaac tctacggcca aagcacagac aacggcattt ctaagatgtt ccttaatggc 36360
gtccaaaaga cacaccgctc tcaagttgca gtaaactatg aatgaaaacc catccggctg 36420
attttccaat atagacgcgc cggcagcgtc caccaaaccc agataatttt cttctctcca 36480
gcggtttacg atctgtctaa gcaaatccct tatatcaagt ccgaccatgc caaaaatctg 36540
ctcaagagcg ccctccacct tcatgtacaa gcagcgcatc atgattgcaa aaattcaggt 36600
tcttcagaga cctgtataag attcaaaatg ggaacattaa caaaaattcc tctgtcgcgc 36660
agatcccttc gcagggcaag ctgaacataa tcagacaggt ccgaacggac cagtgaggcc 36720
aaatccccac caggaaccag atccagagac cctatactga ttatgacgcg catactcggg 36780
gctatgctga ccagcgtagc gccgatgtag gcgtgctgca tgggcggcga gataaaatgc 36840
aaagtgctgg ttaaaaaatc aggcaaagcc tcgcgcaaaa aagctaacac atcataatca 36900
tgctcatgca ggtagttgca ggtaagctca ggaaccaaaa cggaataaca cacgattttc 36960
ctctcaaaca tgacttcgcg gatactgcgt aaaacaaaaa attataaata aaaaattaat 37020
taaataactt aaacattgga agcctgtctc acaacaggaa aaaccacttt aatcaacata 37080
agacgggcca cgggcatgcc ggcatagccg taaaaaaatt ggtccccgtg attaacaagt 37140
accacagaca gctccccggt catgtcgggg gtcatcatgt gagactctgt atacacgtct 37200
ggattgtgaa catcagacaa acaaagaaat cgagccacgt agcccggagg tataatcacc 37260
cgcaggcgga ggtacagcaa aacgaccccc ataggaggaa tcacaaaatt agtaggagaa 37320
aaaaatacat aaacaccaga aaaaccctgt tgctgaggca aaatagcgcc ctcccgatcc 37380
aaaacaacat aaagcgcttc cacaggagca gccataacaa agacccgagt cttaccagta 37440
aaagaaaaaa gatctctcaa cgcagcacca gcaccaacac ttcgcagtgt aaaaggccaa 37500
gtgccgagag agtatatata ggaataaaaa gtgacgtaaa cgggcaaagt ccaaaaaacg 37560
cccagaaaaa ccgcacgcga acctacgccc cgaaacgaaa gccaaaaaac actagacact 37620
cccttccggc gtcaacttcc gctttcccac gctacgtcac ttcccccggt caaacaaact 37680
acatatcccg aacttccaag tcgccacgcc caaaacaccg cctacacctc cccgcccgcc 37740
ggcccgcccc cggacccgcc tcccgccccg cgccgcccat ctcattatca tattggcttc 37800
aatccaaaat aaggtatatt attgatgatg 37830
<210> 11
<211> 37559
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 11
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg gaactgctga tcctgaaggc caacgccatc 1380
accaccatcc tgaccgccgt gaccttctgc ttcgccagcg gccagaacat caccgaggaa 1440
ttctaccaga gcacctgtag cgccgtgagc aagggctacc tgagcgccct gagaaccggc 1500
tggtacacca gcgtgatcac catcgagctg agcaacatca aagaaaacaa gtgcaacggc 1560
accgacgcca aagtgaagct gatcaagcag gaactggaca agtacaagaa cgccgtgacc 1620
gagctgcagc tgctgatgca gagcaccccc gccaccaaca accgggccag acgggagctg 1680
ccccggttca tgaactacac cctgaacaac gccaaaaaga ccaacgtgac cctgagcaag 1740
aagcggaagc ggcggttcct gggctttctg ctgggcgtgg gcagcgccat tgccagcggc 1800
gtggccgtgt ctaaggtgct gcacctggaa ggcgaagtga acaagatcaa gagcgccctg 1860
ctgagcacca acaaggccgt ggtgtccctg agcaacggcg tgagcgtgct gaccagcaag 1920
gtgctggatc tgaagaacta catcgacaag cagctgctgc ccatcgtgaa caagcagagc 1980
tgcagcatca gcaacatcga gacagtgatc gagttccagc agaagaacaa ccggctgctg 2040
gaaatcaccc gggagttcag cgtgaacgcc ggcgtgacca cccctgtgtc cacctacatg 2100
ctgaccaaca gcgagctgct gagcctgatc aacgacatgc ccatcaccaa cgaccagaaa 2160
aagctgatga gcaacaacgt gcagatcgtg cggcagcaga gctactccat catgtccatc 2220
atcaaagaag aggtgctggc ctacgtggtg cagctgcccc tgtacggcgt gatcgacacc 2280
ccctgctgga agctgcacac cagccccctg tgcaccacca acaccaaaga gggcagcaac 2340
atctgcctga cccggaccga cagaggctgg tactgcgaca acgccggcag cgtgtcattc 2400
tttccacagg ccgagacatg caaggtgcag agcaaccggg tgttctgcga caccatgaac 2460
agcctgaccc tgccctccga agtgaacctg tgcaacgtgg acatcttcaa ccccaagtac 2520
gactgcaaga tcatgacctc caagaccgac gtgtccagct ccgtgatcac ctccctgggc 2580
gccatcgtgt cctgctacgg caagaccaag tgcaccgcca gcaacaagaa ccggggcatc 2640
atcaagacct tcagcaacgg ctgcgactac gtgtccaaca agggggtgga caccgtgtcc 2700
gtgggcaaca ccctgtacta cgtgaacaaa caggaaggca agagcctgta cgtgaagggc 2760
gagcccatca tcaacttcta cgaccccctg gtgttcccca gcgacgagtt cgacgccagc 2820
atcagccagg tgaacgagaa gatcaaccag agcctggcct tcatccggaa gtccgacgag 2880
ctgctgcaca atgtgaatgc cggcaagtcc accaccaacc ggaagcggag agcccctgtg 2940
aagcagaccc tgaacttcga cctgctgaag ctggccggcg acgtggagag caatcccggc 3000
cctatggccc tgagcaaagt gaaactgaac gatacactga acaaggacca gctgctgtcc 3060
agcagcaagt acaccatcca gcggagcacc ggcgacagca tcgatacccc caactacgac 3120
gtgcagaagc acatcaacaa gctgtgcggc atgctgctga tcacagagga cgccaaccac 3180
aagttcaccg gcctgatcgg catgctgtac gccatgagcc ggctgggccg ggaggacacc 3240
atcaagatcc tgcgggacgc cggctaccac gtgaaggcca atggcgtgga cgtgaccaca 3300
caccggcagg acatcaacgg caaagaaatg aagttcgagg tgctgaccct ggccagcctg 3360
accaccgaga tccagatcaa tatcgagatc gagagccgga agtcctacaa gaaaatgctg 3420
aaagaaatgg gcgaggtggc ccccgagtac agacacgaca gccccgactg cggcatgatc 3480
atcctgtgta tcgccgccct ggtgatcaca aagctggccg ctggcgacag atctggcctg 3540
acagccgtga tcagacgggc caacaatgtg ctgaagaacg agatgaagcg gtacaagggc 3600
ctgctgccca aggacattgc caacagcttc tacgaggtgt tcgagaagta cccccacttc 3660
atcgacgtgt tcgtgcactt cggcattgcc cagagcagca ccagaggcgg ctccagagtg 3720
gagggcatct tcgccggcct gttcatgaac gcctacggcg ctggccaggt gatgctgaga 3780
tggggcgtgc tggccaagag cgtgaagaac atcatgctgg gccacgccag cgtgcaggcc 3840
gagatggaac aggtggtgga ggtgtacgag tacgcccaga agctgggcgg agaggccggc 3900
ttctaccaca tcctgaacaa ccctaaggcc tccctgctgt ccctgaccca gttcccccac 3960
ttctccagcg tggtgctggg aaatgccgcc ggactgggca tcatgggcga gtaccggggc 4020
acccccagaa accaggacct gtacgacgcc gccaaggcct acgccgagca gctgaaagaa 4080
aacggcgtga tcaactacag cgtgctggac ctgaccgctg aggaactgga agccatcaag 4140
caccagctga accccaagga caacgacgtg gagctgggag gcggaggatc tggcggcgga 4200
ggcatgagca gacggaaccc ctgcaagttc gagatccggg gccactgcct gaacggcaag 4260
cggtgccact tcagccacaa ctacttcgag tggccccctc atgctctgct ggtgcggcag 4320
aacttcatgc tgaaccggat cctgaagtcc atggacaaga gcatcgacac cctgagcgag 4380
atcagcggag ccgccgagct ggacagaacc gaggaatatg ccctgggcgt ggtgggagtg 4440
ctggaaagct acatcggctc catcaacaac atcacaaagc agagcgcctg cgtggccatg 4500
agcaagctgc tgacagagct gaacagcgac gacatcaaga agctgaggga caacgaggaa 4560
ctgaacagcc ccaagatccg ggtgtacaac accgtgatca gctacattga gagcaaccgc 4620
aagaacaaca agcagaccat ccatctgctg aagcggctgc ccgccgacgt gctgaaaaag 4680
accatcaaga acaccctgga catccacaag tccatcacca tcaacaatcc caaagaaagc 4740
accgtgtctg acaccaacga tcacgccaag aacaacgaca ccacctgatg agcggccgcg 4800
atctgctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 4860
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 4920
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 4980
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ccgatcagcg 5040
atcgctgagg tgggtgagtg ggcgtggcct ggggtggtca tgaaaatata taagttgggg 5100
gtcttagggt ctctttattt gtgttgcaga gaccgccgga gccatgagcg ggagcagcag 5160
cagcagcagt agcagcagcg ccttggatgg cagcatcgtg agcccttatt tgacgacgcg 5220
gatgccccac tgggccgggg tgcgtcagaa tgtgatgggc tccagcatcg acggccgacc 5280
cgtcctgccc gcaaattccg ccacgctgac ctatgcgacc gtcgcgggga cgccgttgga 5340
cgccaccgcc gccgccgccg ccaccgcagc cgcctcggcc gtgcgcagcc tggccacgga 5400
ctttgcattc ctgggaccac tggcgacagg ggctacttct cgggccgctg ctgccgccgt 5460
tcgcgatgac aagctgaccg ccctgctggc gcagttggat gcgcttactc gggaactggg 5520
tgacctttct cagcaggtca tggccctgcg ccagcaggtc tcctccctgc aagctggcgg 5580
gaatgcttct cccacaaatg ccgtttaaga taaataaaac cagactctgt ttggattaaa 5640
gaaaagtagc aagtgcattg ctctctttat ttcataattt tccgcgcgcg ataggcccta 5700
gaccagcgtt ctcggtcgtt gagggtgcgg tgtatcttct ccaggacgtg gtagaggtgg 5760
ctctggacgt tgagatacat gggcatgagc ccgtcccggg ggtggaggta gcaccactgc 5820
agagcttcat gctccggggt ggtgttgtag atgatccagt cgtagcagga gcgctgggca 5880
tggtgcctaa aaatgtcctt cagcagcagg ccgatggcca gggggaggcc cttggtgtaa 5940
gtgtttacaa aacggttaag ttgggaaggg tgcattcggg gagagatgat gtgcatcttg 6000
gactgtattt ttagattggc gatgtttccg cccagatccc ttctgggatt catgttgtgc 6060
aggaccacca gtacagtgta tccggtgcac ttggggaatt tgtcatgcag cttagaggga 6120
aaagcgtgga agaacttgga gacgcctttg tggcctccca gattttccat gcattcgtcc 6180
atgatgatgg caatgggccc gcgggaggca gcttgggcaa agatatttct ggggtcgctg 6240
acgtcgtagt tgtgttccag ggtgaggtcg tcataggcca tttttacaaa gcgcgggcgg 6300
agggtgcccg actgggggat gatggtcccc tctggccctg gggcgtagtt gccctcgcag 6360
atctgcattt cccaggcctt aatctcggag gggggaatca tatccacctg cggggcgatg 6420
aagaaaacgg tttccggagc cggggagatt aactgggatg agagcaggtt tctaagcagc 6480
tgtgattttc cacaaccggt gggcccataa ataacaccta taaccggttg cagctggtag 6540
tttagagagc tgcagctgcc gtcgtcccgg aggagggggg ccacctcgtt gagcatgtcc 6600
ctgacgcgca tgttctcccc gaccagatcc gccagaaggc gctcgccgcc cagggacagc 6660
agctcttgca aggaagcaaa gtttttcagc ggcttgaggc cgtccgccgt gggcatgttt 6720
ttcagggtct ggctcagcag ctccaggcgg tcccagagct cggtgacgtg ctctacggca 6780
tctctatcca gcatatctcc tcgtttcgcg ggttggggcg actttcgctg tagggcacca 6840
agcggtggtc gtccagcggg gccagagtca tgtccttcca tgggcgcagg gtcctcgtca 6900
gggtggtctg ggtcacggtg aaggggtgcg ctccgggctg agcgcttgcc aaggtgcgct 6960
tgaggctggt tctgctggtg ctgaagcgct gccggtcttc gccctgcgcg tcggccaggt 7020
agcatttgac catggtgtca tagtccagcc cctccgcggc gtgtcccttg gcgcgcagct 7080
tgcccttgga ggtggcgccg cacgaggggc agagcaggct cttgagcgcg tagagcttgg 7140
gggcgaggaa gaccgattcg ggggagtagg cgtccgcgcc gcagaccccg cacacggtct 7200
cgcactccac cagccaggtg agctcggggc gcgccgggtc aaaaaccagg tttcccccat 7260
gctttttgat gcgtttctta cctcgggtct ccatgaggtg gtgtccccgc tcggtgacga 7320
agaggctgtc cgtgtctccg tagaccgact tgaggggtct tttctccagg ggggtccctc 7380
ggtcttcctc gtagaggaac tcggaccact ctgagacgaa ggcccgcgtc caggccagga 7440
cgaaggaggc tatgtgggag gggtagcggt cgttgtccac tagggggtcc accttctcca 7500
aggtgtgaag acacatgtcg ccttcctcgg cgtccaggaa ggtgattggc ttgtaggtgt 7560
aggccacgtg accgggggtt cctgacgggg gggtataaaa gggggtgggg gcgcgctcgt 7620
cgtcactctc ttccgcatcg ctgtctgcga gggccagctg ctggggtgag tattccctct 7680
cgaaggcggg catgacctcc gcgctgaggt tgtcagtttc caaaaacgag gaggatttga 7740
tgttcacctg tcccgaggtg atacctttga gggtacccgc gtccatctgg tcagaaaaca 7800
cgatcttttt attgtccagc ttggtggcga acgacccgta gagggcgttg gagagcagct 7860
tggcgatgga gcgcagggtc tggttcttgt ccctgtcggc gcgctccttg gccgcgatgt 7920
tgagctgcac gtactcgcgc gcgacgcagc gccactcggg gaagacggtg gtgcgctcgt 7980
cgggcaccag gcgcacgcgc cagccgcggt tgtgcagggt gaccaggtcc acgctggtgg 8040
cgacctcgcc gcgcaggcgc tcgttggtcc agcagagacg gccgcccttg cgcgagcaga 8100
aggggggcag ggggtcgagc tgggtctcgt ccggggggtc cgcgtccacg gtgaaaaccc 8160
cggggcgcag gcgcgcgtcg aagtagtcta tcttgcaacc ttgcatgtcc agcgcctgct 8220
gccagtcgcg ggcggcgagc gcgcgctcgt aggggttgag cggcgggccc cagggcatgg 8280
ggtgggtgag tgcggaggcg tacatgccgc agatgtcata gacgtagagg ggctcccgca 8340
ggaccccgat gtaggtgggg tagcagcggc cgccgcggat gctggcgcgc acgtagtcat 8400
acagctcgtg cgagggggcg aggaggtcgg ggcccaggtt ggtgcgggcg gggcgctccg 8460
cgcggaagac gatctgcctg aagatggcat gcgagttgga agagatggtg gggcgctgga 8520
agacgttgaa gctggcgtcc tgcaggccga cggcgtcgcg cacgaaggag gcgtaggagt 8580
cgcgcagctt gtgtaccagc tcggcggtga cctgcacgtc gagcgcgcag tagtcgaggg 8640
tctcgcggat gatgtcatat ttagcctgcc ccttcttttt ccacagctcg cggttgagga 8700
caaactcttc gcggtctttc cagtactctt ggatcgggaa accgtccggt tccgaacggt 8760
aagagcctag catgtagaac tggttgacgg cctggtaggc gcagcagccc ttctccacgg 8820
ggagggcgta ggcctgcgcg gccttgcgga gcgaggtgtg ggtcagggcg aaggtgtccc 8880
tgaccatgac tttgaggtac tggtgcttga agtcggagtc gtcgcagccg ccccgctccc 8940
agagcgagaa gtcggtgcgc ttcttggagc gggggttggg cagagcgaag gtgacatcgt 9000
tgaagaggat tttgcccgcg cggggcatga agttgcgggt gatgcggaag ggccccggca 9060
cttcagagcg gttgttgatg acctgggcgg cgagcacgat ctcgtcgaag ccgttgatgt 9120
tgtggcccac gatgtagagt tccaggaagc ggggccggcc ctttacggtg ggcagcttct 9180
ttagctcttc gtaggtgagc tcctcgggcg aggcgaggcc gtgctcggcc agggcccagt 9240
ccgcgaggtg cgggttgtct ctgaggaagg acttccagag gtcgcgggcc aggagggtct 9300
gcaggcggtc tctgaaggtc ctgaactggc ggcccacggc cattttttcg ggggtgatgc 9360
agtagaaggt gagggggtct tgctgccagc ggtcccagtc gagctgcagg gcgaggtcgc 9420
gcgcggcggt gaccaggcgc tcgtcgcccc cgaatttcat gaccagcatg aagggcacga 9480
gctgctttcc gaaggccccc atccaagtgt aggtctctac atcgtaggtg acaaagaggc 9540
gctccgtgcg aggatgcgag ccgatcggga agaactggat ctcccgccac cagttggagg 9600
agtggctgtt gatgtggtgg aagtagaagt cccgtcgccg ggccgaacac tcgtgctggc 9660
ttttgtaaaa gcgagcgcag tactggcagc gctgcacggg ctgtacctca tgcacgagat 9720
gcacctttcg cccgcgcacg aggaagccga ggggaaatct gagccccccg cctggctcgc 9780
ggcatggctg gttctcttct actttggatg cgtgtccgtc tccgtctggc tcctcgaggg 9840
gtgttacggt ggagcggacc accacgccgc gcgagccgca ggtccagata tcggcgcgcg 9900
gcggtcggag tttgatgacg acatcgcgca gctgggagct gtccatggtc tggagctccc 9960
gcggcggcgg caggtcagcc gggagttctt gcaggttcac ctcgcagagt cgggccaggg 10020
cgcggggcag gtctaggtgg tacctgatct ctaggggcgt gttggtggcg gcgtcgatgg 10080
cttgcaggag cccgcagccc cggggggcga cgacggtgcc ccgcggggtg gtggtggtgg 10140
tggcggtgca gctcagaagc ggtgccgcgg gcgggccccc ggaggtaggg ggggctccgg 10200
tcccgcgggc aggggcggca gcggcacgtc ggcgtggagc gcgggcagga gttggtgctg 10260
tgcccggagg ttgctggcga aggcgacgac gcggcggttg atctcctgga tctggcgcct 10320
ctgcgtgaag acgacgggcc cggtgagctt gaacctgaaa gagagttcga cagaatcaat 10380
ctcggtgtca ttgaccgcgg cctggcgcag gatctcctgc acgtctcccg agttgtcttg 10440
gtaggcgatc tcggccatga actgctcgat ctcttcctcc tggaggtctc cgcgtccggc 10500
gcgttccacg gtggccgcca ggtcgttgga gatgcgcccc atgagctgcg agaaggcgtt 10560
gagtccgccc tcgttccaga ctcggctgta gaccacgccc ccctggtcat cgcgggcgcg 10620
catgaccacc tgcgcgaggt tgagctccac gtgccgcgcg aagacggcgt agttgcgcag 10680
acgctggaag aggtagttga gggtggtggc ggtgtgctcg gccacgaaga agttcatgac 10740
ccagcggcgc aacgtggatt cgttgatgtc ccccaaggcc tccagccgtt ccatggcctc 10800
gtagaagtcc acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg tcaactcctc 10860
ctccagaaga cggatgagct cggcgacggt gtcgcgcacc tcgcgctcga aggctatggg 10920
gatctcttcc tccgctagca tcaccacctc ctcctcttcc tcctcttctg gcacttccat 10980
gatggcttcc tcctcttcgg ggggtggcgg cggcggcggt gggggagggg gcgctctgcg 11040
ccggcggcgg cgcaccggga ggcggtccac gaagcgcgcg atcatctccc cgcggcggcg 11100
gcgcatggtc tcggtgacgg cgcggccgtt ctcccggggg cgcagttgga agacgccgcc 11160
ggacatctgg tgctggggcg ggtggccgtg aggcagcgag acggcgctga cgatgcatct 11220
caacaattgc tgcgtaggta cgccgccgag ggacctgagg gagtccatat ccaccggatc 11280
cgaaaacctt tcgaggaagg cgtctaacca gtcgcagtcg caaggtaggc tgagcaccgt 11340
ggcgggcggc ggggggtggg gggagtgtct ggcggaggtg ctgctgatga tgtaattgaa 11400
gtaggcggac ttgacacggc ggatggtcga caggagcacc atgtccttgg gtccggcctg 11460
ctggatgcgg aggcggtcgg ctatgcccca ggcttcgttc tggcatcggc gcaggtcctt 11520
gtagtagtct tgcatgagcc tttccaccgg cacctcttct ccttcctctt ctgcttcttc 11580
catgtctgct tcggccctgg ggcggcgccg cgcccccctg ccccccatgc gcgtgacccc 11640
gaaccccctg agcggttgga gcagggccag gtcggcgacg acgcgctcgg ccaggatggc 11700
ctgctgcacc tgcgtgaggg tggtttggaa gtcatccaag tccacgaagc ggtggtaggc 11760
gcccgtgttg atggtgtagg tgcagttggc catgacggac cagttgacgg tctggtggcc 11820
cggttgcgac atctcggtgt acctgagtcg cgagtaggcg cgggagtcga agacgtagtc 11880
gttgcaagtc cgcaccaggt actggtagcc caccaggaag tgcggcggcg gctggcggta 11940
gaggggccag cgcagggtgg cgggggctcc gggggccagg tcttccagca tgaggcggtg 12000
gtaggcgtag atgtacctgg acatccaggt gatacccgcg gcggtggtgg aggcgcgcgg 12060
gaagtcgcgc acccggttcc agatgttgcg caggggcaga aagtgctcca tggtaggcgt 12120
gctctgtcca gtcagacgcg cgcagtcgtt gatactctag accagggaaa acgaaagccg 12180
gtcagcgggc actcttccgt ggtctggtga atagatcgca agggtatcat ggcggagggc 12240
ctcggttcga gccccgggtc cgggccggac ggtccgccat gatccacgcg gttaccgccc 12300
gcgtgtcgaa cccaggtgtg cgacgtcaga caacggtgga gtgttccttt tggcgttttt 12360
ctggccgggc gccggcgccg cgtaagagac taagccgcga aagcgaaagc agtaagtggc 12420
tcgctccccg tagccggagg gatccttgct aagggttgcg ttgcggcgaa ccccggttcg 12480
aatcccgtac tcgggccggc cggacccgcg gctaaggtgt tggattggcc tccccctcgt 12540
ataaagaccc cgcttgcgga ttgactccgg acacggggac gagccccttt tatttttgct 12600
ttccccagat gcatccggtg ctgcggcaga tgcgcccccc gccccagcag cagcaacaac 12660
accagcaaga gcggcagcaa cagcagcggg agtcatgcag ggccccctca cccaccctcg 12720
gcgggccggc cacctcggcg tccgcggccg tgtctggcgc ctgcggcggc ggcggggggc 12780
cggctgacga ccccgaggag cccccgcggc gcagggccag acactacctg gacctggagg 12840
agggcgaggg cctggcgcgg ctgggggcgc cgtctcccga gcgccacccg cgggtgcagc 12900
tgaagcgcga ctcgcgcgag gcgtacgtgc ctcggcagaa cctgttcagg gaccgcgcgg 12960
gcgaggagcc cgaggagatg cgggacagga ggttcagcgc agggcgggag ctgcggcagg 13020
ggctgaaccg cgagcggctg ctgcgcgagg aggactttga gcccgacgcg cggacgggga 13080
tcagccccgc gcgcgcgcac gtggcggccg ccgacctggt gacggcgtac gagcagacgg 13140
tgaaccagga gatcaacttc caaaagagtt tcaacaacca cgtgcgcacg ctggtggcgc 13200
gcgaggaggt gaccatcggg ctgatgcacc tgtgggactt tgtaagcgcg ctggtgcaga 13260
accccaacag caagcctctg acggcgcagc tgttcctgat agtgcagcac agcagggaca 13320
acgaggcgtt tagggacgcg ctgctgaaca tcaccgagcc cgagggtcgg tggctgctgg 13380
acctgattaa catcctgcag agcatagtgg tgcaggagcg cagcctgagc ctggccgaca 13440
aggtggcggc catcaactac tcgatgctga gcctgggcaa gttttacgcg cgcaagatct 13500
accagacgcc gtacgtgccc atagacaagg aggtgaagat cgacggtttt tacatgcgca 13560
tggcgctgaa ggtgctcacc ctgagcgacg acctgggcgt gtaccgcaac gagcgcatcc 13620
acaaggccgt gagcgtgagc cggcggcgcg agctgagcga ccgcgagctg atgcacagcc 13680
tgcagcgggc gctggcgggc gccggcagcg gcgacaggga ggcggagtcc tacttcgatg 13740
cgggggcgga cctgcgctgg gcgcccagcc ggcgggccct ggaggccgcg ggggtccgcg 13800
aggactatga cgaggacggc gaggaggatg aggagtacga gctagaggag ggcgagtacc 13860
tggactaaac cgcgggtggt gtttccggta gatgcaagac ccgaacgtgg tggacccggc 13920
gctgcgggcg gctctgcaga gccagccgtc cggccttaac tcctcagacg actggcgaca 13980
ggtcatggac cgcatcatgt cgctgacggc gcgtaacccg gacgcgttcc ggcagcagcc 14040
gcaggccaac aggctctccg ccatcctgga ggcggtggtg cctgcgcgct cgaaccccac 14100
gcacgagaag gtgctggcca tagtgaacgc gctggccgag aacagggcca tccgcccgga 14160
cgaggccggg ctggtgtacg acgcgctgct gcagcgcgtg gcccgctaca acagcggcaa 14220
cgtgcagacc aacctggacc ggctggtggg ggacgtgcgc gaggcggtgg cgcagcgcga 14280
gcgcgcggat cggcagggca acctgggctc catggtggcg ctgaatgcct tcctgagcac 14340
gcagccggcc aacgtgccgc gggggcagga agactacacc aactttgtga gcgcgctgcg 14400
gctgatggtg accgagaccc cccagagcga ggtgtaccag tcgggcccgg actacttctt 14460
ccagaccagc agacagggcc tgcagacggt gaacctgagc caggctttca agaacctgcg 14520
ggggctgtgg ggcgtgaagg cgcccaccgg cgaccgggcg acggtgtcca gcctgctgac 14580
gcccaactcg cgcctgctgc tgctgctgat cgcgccgttc acggacagcg gcagcgtgtc 14640
ccgggacacc tacctggggc acctgctgac cctgtaccgc gaggccatcg ggcaggcgca 14700
ggtggacgag cacaccttcc aggagatcac cagcgtgagc cgcgcgctgg ggcaggagga 14760
cacgagcagc ctggaggcga ctctgaacta cctgctgacc aaccggcggc agaagattcc 14820
ctcgctgcac agcctgacct ccgaggagga gcgcatcttg cgctacgtgc agcagagcgt 14880
gagcctgaac ctgatgcgcg acggggtgac gcccagcgtg gcgctggaca tgaccgcgcg 14940
caacatggaa ccgggcatgt acgccgcgca ccggccttac atcaaccgcc tgatggacta 15000
cctgcatcgc gcggcggccg tgaaccccga gtactttacc aacgccatcc tgaacccgca 15060
ctggctcccg ccgcccgggt tctacagcgg gggcttcgag gtcccggaga ccaacgatgg 15120
cttcctgtgg gacgacatgg acgacagcgt gttctccccg cggccgcagg cgctggcgga 15180
agcgtccctg ctgcgtccca agaaggagga ggaggaggag gcgagtcgcc gccgcggcag 15240
cagcggcgtg gcttctctgt ccgagctggg ggcggcagcc gccgcgcgcc ccgggtccct 15300
gggcggcagc ccctttccga gcctggtggg gtctctgcac agcgagcgca ccacccgccc 15360
tcggctgctg ggcgaggacg agtacctgaa taactccctg ctgcagccgg tgcgggagaa 15420
aaacctgcct cccgccttcc ccaacaacgg gatagagagc ctggtggaca agatgagcag 15480
atggaagacc tatgcgcagg agcacaggga cgcgcctgcg ctccggccgc ccacgcggcg 15540
ccagcgccac gaccggcagc gggggctggt gtgggatgac gaggactccg cggacgatag 15600
cagcgtgctg gacctgggag ggagcggcaa cccgttcgcg cacctgcgcc cccgcctggg 15660
gaggatgttt taaaaaaaaa aaaaaaaagc aagaagcatg atgcaaaaat taaataaaac 15720
tcaccaaggc catggcgacc gagcgttggt ttcttgtgtt cccttcagta tgcggcgcgc 15780
ggcgatgtac caggagggac ctcctccctc ttacgagagc gtggtgggcg cggcggcggc 15840
ggcgccctct tctccctttg cgtcgcagct gctggagccg ccgtacgtgc ctccgcgcta 15900
cctgcggcct acggggggga gaaacagcat ccgttactcg gagctggcgc ccctgttcga 15960
caccacccgg gtgtacctgg tggacaacaa gtcggcggac gtggcctccc tgaactacca 16020
gaacgaccac agcaattttt tgaccacggt catccagaac aatgactaca gcccgagcga 16080
ggccagcacc cagaccatca atctggatga ccggtcgcac tggggcggcg acctgaaaac 16140
catcctgcac accaacatgc ccaacgtgaa cgagttcatg ttcaccaata agttcaaggc 16200
gcgggtgatg gtgtcgcgct cgcacaccaa ggaagaccgg gtggagctga agtacgagtg 16260
ggtggagttc gagctgccag agggcaacta ctccgagacc atgaccattg acctgatgaa 16320
caacgcgatc gtggagcact atctgaaagt gggcaggcag aacggggtcc tggagagcga 16380
catcggggtc aagttcgaca ccaggaactt ccgcctgggg ctggaccccg tgaccgggct 16440
ggttatgccc ggggtgtaca ccaacgaggc cttccatccc gacatcatcc tgctgcccgg 16500
ctgcggggtg gacttcactt acagccgcct gagcaacctc ctgggcatcc gcaagcggca 16560
gcccttccag gagggcttca ggatcaccta cgaggacctg gaggggggca acatccccgc 16620
gctcctcgat gtggaggcct accaggatag cttgaaggaa aatgaggcgg gacaggagga 16680
taccgccccc gccgcctccg ccgccgccga gcagggcgag gatgctgctg acaccgcggc 16740
cgcggacggg gcagaggccg accccgctat ggtggtggag gctcccgagc aggaggagga 16800
catgaatgac agtgcggtgc gcggagacac cttcgtcacc cggggggagg aaaagcaagc 16860
ggaggccgag gccgcggccg aggaaaagca actggcggca gcagcggcgg cggcggcgtt 16920
ggccgcggcg gaggctgagt ctgaggggac caagcccgcc aaggagcccg tgattaagcc 16980
cctgaccgaa gatagcaaga agcgcagtta caacctgctc aaggacagca ccaacaccgc 17040
gtaccgcagc tggtacctgg cctacaacta cggcgacccg tcgacggggg tgcgctcctg 17100
gaccctgctg tgcacgccgg acgtgacctg cggctcggag caggtgtact ggtcgctgcc 17160
cgacatgatg caagaccccg tgaccttccg ctccacgcgg caggtcagca acttcccggt 17220
ggtgggcgcc gagctgctgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta 17280
ctcccagctc atccgccagt tcacctctct gacccacgtg ttcaatcgct ttcctgagaa 17340
ccagattctg gcgcgcccgc ccgcccccac catcaccacc gtcagtgaaa acgttcctgc 17400
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac 17460
cgttactgac gccagacgcc gcacctgccc ctacgtttac aaggccttgg gcatagtctc 17520
gccgcgcgtc ctttccagcc gcactttttg agcaacacca ccatcatgtc catcctgatc 17580
tcacccagca ataactccgg ctggggactg ctgcgcgcgc ccagcaagat gttcggaggg 17640
gcgaggaagc gttccgagca gcaccccgtg cgcgtgcgcg ggcacttccg cgccccctgg 17700
ggagcgcaca aacgcggccg cgcggggcgc accaccgtgg acgacgccat cgactcggtg 17760
gtggagcagg cgcgcaacta caggcccgcg gtctctaccg tggacgcggc catccagacc 17820
gtggtgcggg gcgcgcggcg gtacgccaag ctgaagagcc gccggaagcg cgtggcccgc 17880
cgccaccgcc gccgacccgg ggccgccgcc aaacgcgccg ccgcggccct gcttcgccgg 17940
gccaagcgca cgggccgccg cgccgccatg agggccgcgc gccgcttggc cgccggcatc 18000
accgccgcca ccatggcccc ccgtacccga agacgcgcgg ccgccgccgc cgccgccgcc 18060
atcagtgaca tggccagcag gcgccggggc aacgtgtact gggtgcgcga ctcggtgacc 18120
ggcacgcgcg tgcccgtgcg cttccgcccc ccgcggactt gagatgatgt gaaaaaacaa 18180
cactgagtct cctgctgttg tgtgtatccc agcggcggcg gcgcgcgcag cgtcatgtcc 18240
aagcgcaaaa tcaaagaaga gatgctccag gtcgtcgcgc cggagatcta tgggcccccg 18300
aagaaggaag agcaggattc gaagccccgc aagataaagc gggtcaaaaa gaaaaagaaa 18360
gatgatgacg atgccgatgg ggaggtggag ttcctgcgcg ccacggcgcc caggcgcccg 18420
gtgcagtgga agggccggcg cgtaaagcgc gtcctgcgcc ccggcaccgc ggtggtcttc 18480
acgcccggcg agcgctccac ccggactttc aagcgcgtct atgacgaggt gtacggcgac 18540
gaagacctgc tggagcaggc caacgagcgc ttcggagagt ttgcttacgg gaagcgtcag 18600
cgggcgctgg ggaaggagga cctgctggcg ctgccgctgg accagggcaa ccccaccccc 18660
agtctgaagc ccgtgaccct gcagcaggtg ctgccgagca gcgcaccctc cgaggcgaag 18720
cggggtctga agcgcgaggg cggcgacctg gcgcccaccg tgcagctcat ggtgcccaag 18780
cggcagaggc tggaggatgt gctggagaaa atgaaagtag accccggtct gcagccggac 18840
atcagggtcc gccccatcaa gcaggtggcg ccgggcctcg gcgtgcagac cgtggacgtg 18900
gtcatcccca ccggcaactc ccccgccgcc gccaccacta ccgctgcctc cacggacatg 18960
gagacacaga ccgatcccgc cgcagccgca gccgcagccg ccgccgcgac ctcctcggcg 19020
gaggtgcaga cggacccctg gctgccgccg gcgatgtcag ctccccgcgc gcgtcgcggg 19080
cgcaggaagt acggcgccgc caacgcgctc ctgcccgagt acgccttgca tccttccatc 19140
gcgcccaccc ccggctaccg aggctatacc taccgcccgc gaagagccaa gggttccacc 19200
cgccgtcccc gccgacgcgc cgccgccacc acccgccgcc gccgccgcag acgccagccc 19260
gcactggctc cagtctccgt gaggaaagtg gcgcgcgacg gacacaccct ggtgctgccc 19320
agggcgcgct accaccccag catcgtttaa aagcctgttg tggttcttgc agatatggcc 19380
ctcacttgcc gcctccgttt cccggtgccg ggataccgag gaggaagatc gcgccgcagg 19440
aggggtctgg ccggccgcgg cctgagcgga ggcagccgcc gcgcgcaccg gcggcgacgc 19500
gccaccagcc gacgcatgcg cggcggggtg ctgcccctgt taatccccct gatcgccgcg 19560
gcgatcggcg ccgtgcccgg gatcgcctcc gtggccttgc aagcgtccca gaggcattga 19620
cagacttgca aacttgcaaa tatggaaaaa aaaaccccaa taaaaaagtc tagactctca 19680
cgctcgcttg gtcctgtgac tattttgtag aatggaagac atcaactttg cgtcgctggc 19740
cccgcgtcac ggctcgcgcc cgttcctggg acactggaac gatatcggca ccagcaacat 19800
gagcggtggc gccttcagtt ggggctctct gtggagcggc attaaaagta tcgggtctgc 19860
cgttaaaaat tacggctccc gggcctggaa cagcagcacg ggccagatgt tgagagacaa 19920
gttgaaagag cagaacttcc agcagaaggt ggtggagggc ctggcctccg gcatcaacgg 19980
ggtggtggac ctggccaacc aggccgtgca gaataagatc aacagcagac tggacccccg 20040
gccgccggtg gaggaggtgc cgccggcgct ggagacggtg tcccccgatg ggcgtggcga 20100
gaagcgcccg cggcccgata gggaagagac cactctggtc acgcagaccg atgagccgcc 20160
cccgtatgag gaggccctga agcaaggtct gcccaccacg cggcccatcg cgcccatggc 20220
caccggggtg gtgggccgcc acacccccgc cacgctggac ttgcctccgc ccgccgatgt 20280
gccgcagcag cagaaggcgg cacagccggg cccgcccgcg accgcctccc gttcctccgc 20340
cggtcctctg cgccgcgcgg ccagcggccc ccgcgggggg gtcgcgaggc acggcaactg 20400
gcagagcacg ctgaacagca tcgtgggtct gggggtgcgg tccgtgaagc gccgccgatg 20460
ctactgaata gcttagctaa cgtgttgtat gtgtgtatgc gccctatgtc gccgccagag 20520
gagctgctga gtcgccgccg ttcgcgcgcc caccaccacc gccactccgc ccctcaagat 20580
ggcgacccca tcgatgatgc cgcagtggtc gtacatgcac atctcgggcc aggacgcctc 20640
ggagtacctg agccccgggc tggtgcagtt cgcccgcgcc accgagagct acttcagcct 20700
gagtaacaag tttaggaacc ccacggtggc gcccacgcac gatgtgacca ccgaccggtc 20760
tcagcgcctg acgctgcggt tcattcccgt ggaccgcgag gacaccgcgt actcgtacaa 20820
ggcgcggttc accctggccg tgggcgacaa ccgcgtgctg gacatggcct ccacctactt 20880
tgacatccgc ggggtgctgg accggggtcc cactttcaag ccctactctg gcaccgccta 20940
caactccctg gcccccaagg gcgctcccaa ctcctgcgag tgggagcaag aggaaactca 21000
ggcagttgaa gaagcagcag aagaggaaga agaagatgct gacggtcaag ctgaggaaga 21060
gcaagcagct accaaaaaga ctcatgtata tgctcaggct cccctttctg gcgaaaaaat 21120
tagtaaagat ggtctgcaaa taggaacgga cgctacagct acagaacaaa aacctattta 21180
tgcagaccct acattccagc ccgaacccca aatcggggag tcccagtgga atgaggcaga 21240
tgctacagtc gccggcggta gagtgctaaa gaaatctact cccatgaaac catgctatgg 21300
ttcctatgca agacccacaa atgctaatgg aggtcagggt gtactaacgg caaatgccca 21360
gggacagcta gaatctcagg ttgaaatgca attcttttca acttctgaaa acgcccgtaa 21420
cgaggctaac aacattcagc ccaaattggt gctgtatagt gaggatgtgc acatggagac 21480
cccggatacg cacctttctt acaagcccgc aaaaagcgat gacaattcaa aaatcatgct 21540
gggtcagcag tccatgccca acagacctaa ttacatcggc ttcagagaca actttatcgg 21600
cctcatgtat tacaatagca ctggcaacat gggagtgctt gcaggtcagg cctctcagtt 21660
gaatgcagtg gtggacttgc aagacagaaa cacagaactg tcctaccagc tcttgcttga 21720
ttccatgggt gacagaacca gatacttttc catgtggaat caggcagtgg acagttatga 21780
cccagatgtt agaattattg aaaatcatgg aactgaagac gagctcccca actattgttt 21840
ccctctgggt ggcatagggg taactgacac ttaccaggct gttaaaacca acaatggcaa 21900
taacgggggc caggtgactt ggacaaaaga tgaaactttt gcagatcgca atgaaatagg 21960
ggtgggaaac aatttcgcta tggagatcaa cctcagtgcc aacctgtgga gaaacttcct 22020
gtactccaac gtggcgctgt acctaccaga caagcttaag tacaacccct ccaatgtgga 22080
catctctgac aaccccaaca cctacgatta catgaacaag cgagtggtgg ccccggggct 22140
ggtggactgc tacatcaacc tgggcgcgcg ctggtcgctg gactacatgg acaacgtcaa 22200
ccccttcaac caccaccgca atgcgggcct gcgctaccgc tccatgctcc tgggcaacgg 22260
gcgctacgtg cccttccaca tccaggtgcc ccagaagttc tttgccatca agaacctcct 22320
cctcctgccg ggctcctaca cctacgagtg gaacttcagg aaggatgtca acatggtcct 22380
ccagagctct ctgggtaacg atctcagggt ggacggggcc agcatcaagt tcgagagcat 22440
ctgcctctac gccaccttct tccccatggc ccacaacacg gcctccacgc tcgaggccat 22500
gctcaggaac gacaccaacg accagtcctt caatgactac ctctccgccg ccaacatgct 22560
ctaccccata cccgccaacg ccaccaacgt ccccatctcc atcccctcgc gcaactgggc 22620
ggccttccgc ggctgggcct tcacccgcct caagaccaag gagaccccct ccctgggctc 22680
gggattcgac ccctactaca cctactcggg ctccattccc tacctggacg gcaccttcta 22740
cctcaaccac actttcaaga aggtctcggt caccttcgac tcctcggtca gctggccggg 22800
caacgaccgt ctgctcaccc ccaacgagtt cgagatcaag cgctcggtcg acggggaggg 22860
ctacaacgtg gcccagtgca acatgaccaa ggactggttc ctggtccaga tgctggccaa 22920
ctacaacatc ggctaccagg gcttctacat cccagagagc tacaaggaca ggatgtactc 22980
cttcttcagg aacttccagc ccatgagccg gcaggtggtg gaccagacca agtacaagga 23040
ctaccaggag gtgggcatca tccaccagca caacaactcg ggcttcgtgg gctacctcgc 23100
ccccaccatg cgcgagggac aggcctaccc cgccaacttc ccctatccgc tcataggcaa 23160
gaccgcggtc gacagcatca cccagaaaaa gttcctctgc gaccgcaccc tctggcgcat 23220
ccccttctcc agcaacttca tgtccatggg tgcgctctcg gacctgggcc agaacttgct 23280
ctacgccaac tccgcccacg ccctcgacat gaccttcgag gtcgacccca tggacgagcc 23340
cacccttctc tatgttctgt tcgaagtctt tgacgtggtc cgggtccacc agccgcaccg 23400
cggcgtcatc gagaccgtgt acctgcgtac gcccttctcg gccggcaacg ccaccaccta 23460
aagaagcaag ccgcagtcat cgccgcctgc atgccgtcgg gttccaccga gcaagagctc 23520
agggccatcg tcagagacct gggatgcggg ccctattttt tgggcacctt cgacaagcgc 23580
ttccctggct ttgtctcccc acacaagctg gcctgcgcca tcgtcaacac ggccggccgc 23640
gagaccgggg gcgtgcactg gctggccttc gcctggaacc cgcgctccaa aacatgcttc 23700
ctctttgacc ccttcggctt ttcggaccag cggctcaagc aaatctacga gttcgagtac 23760
gagggcttgc tgcgtcgcag cgccatcgcc tcctcgcccg accgctgcgt caccctcgaa 23820
aagtccaccc agaccgtgca ggggcccgac tcggccgcct gcggtctctt ctgctgcatg 23880
tttctgcacg cctttgtgca ctggcctcag agtcccatgg accgcaaccc caccatgaac 23940
ttgctgacgg gggtgcccaa ctccatgctc cagagccccc aggtcgagcc caccctgcgc 24000
cgcaaccagg agcagctcta cagcttcctg gagcgccact cgccttactt ccgccgccac 24060
agcgcacaga tcaggagggc cacctccttc tgccacttgc aagagatgca agaagggtaa 24120
taacgatgta cacacttttt ttctcaataa atggcatctt tttatttata caagctctct 24180
ggggtattca tttcccacca ccacccgccg ttgtcgccat ctggctctat ttagaaatcg 24240
aaagggttct gccgggagtc gccgtgcgcc acgggcaggg acacgttgcg atactggtag 24300
cgggtgcccc acttgaactc gggcaccacc aggcgaggca gctcggggaa gttttcgctc 24360
cacaggctgc gggtcagcac cagcgcgttc atcaggtcgg gcgccgagat cttgaagtcg 24420
cagttggggc cgccgccctg cgcgcgcgag ttgcggtaca ccgggttgca gcactggaac 24480
accaacagcg ccgggtgctt cacgctggcc agcacgctgc ggtcggagat cagctcggcg 24540
tccaggtcct ccgcgttgct cagcgcgaac ggggtcatct tgggcacttg ccgccccagg 24600
aagggcgcgt gccccggttt cgagttgcag tcgcagcgca gcgggatcag caggtgcccg 24660
tgcccggact cggcgttggg gtacagcgcg cgcatgaagg cctgcatctg gcggaaggcc 24720
atctgggcct tggcgccctc cgagaagaac atgccgcagg acttgcccga gaactggttt 24780
gcggggcagc tggcgtcgtg caggcagcag cgcgcgtcgg tgttggcgat ctgcaccacg 24840
ttgcgccccc accggttctt cacgatcttg gccttggacg attgctcctt cagcgcgcgc 24900
tgcccgttct cgctggtcac atccatctcg atcacatgtt ccttgttcac catgctgctg 24960
ccgtgcagac acttcagctc gccctccgtc tcggtgcagc ggtgctgcca cagcgcgcag 25020
cccgtgggct cgaaagactt gtaggtcacc tccgcgaagg actgcaggta cccctgcaaa 25080
aagcggccca tcatggtcac gaaggtcttg ttgctgctga aggtcagctg cagcccgcgg 25140
tgctcctcgt tcagccaggt cttgcacacg gccgccagcg cctccacctg gtcgggcagc 25200
atcttgaagt tcaccttcag ctcattctcc acgtggtact tgtccatcag cgtgcgcgcc 25260
gcctccatgc ccttctccca ggccgacacc agcggcaggc tcacggggtt cttcaccatc 25320
accgtggccg ccgcctccgc cgcgctttcg ctttccgccc cgctgttctc ttcctcttcc 25380
tcctcttcct cgccgccgcc cactcgcagc ccccgcacca cggggtcgtc ttcctgcagg 25440
cgctgcacct tgcgcttgcc gttgcgcccc tgcttgatgc gcacgggcgg gttgctgaag 25500
cccaccatca ccagcgcggc ctcttcttgc tcgtcctcgc tgtccagaat gacctccggg 25560
gagggggggt tggtcatcct cagtaccgag gcacgcttct ttttcttcct gggggcgttc 25620
gccagctccg cggctgcggc cgctgccgag gtcgaaggcc gagggctggg cgtgcgcggc 25680
accagcgcgt cctgcgagcc gtcctcgtcc tcctcggact cgagacggag gcgggcccgc 25740
ttcttcgggg gcgcgcgggg cggcggaggc ggcggcggcg acggagacgg ggacgagaca 25800
tcgtccaggg tgggtggacg gcgggccgcg ccgcgtccgc gctcgggggt ggtctcgcgc 25860
tggtcctctt cccgactggc catctcccac tgctccttct cctataggca gaaagagatc 25920
atggagtctc tcatgcgagt cgagaaggag gaggacagcc taaccgcccc ctctgagccc 25980
tccaccaccg ccgccaccac cgccaatgcc gccgcggacg acgcgcccac cgagaccacc 26040
gccagtacca ccctccccag cgacgcaccc ccgctcgaga atgaagtgct gatcgagcag 26100
gacccgggtt ttgtgagcgg agaggaggat gaggtggatg agaaggagaa ggaggaggtc 26160
gccgcctcag tgccaaaaga ggataaaaag caagaccagg acgacgcaga taaggatgag 26220
acagcagtcg ggcgggggaa cggaagccat gatgctgatg acggctacct agacgtggga 26280
gacgacgtgc tgcttaagca cctgcaccgc cagtgcgtca tcgtctgcga cgcgctgcag 26340
gagcgctgcg aagtgcccct ggacgtggcg gaggtcagcc gcgcctacga gcggcacctc 26400
ttcgcgccgc acgtgccccc caagcgccgg gagaacggca cctgcgagcc caacccgcgt 26460
ctcaacttct acccggtctt cgcggtaccc gaggtgctgg ccacctacca catctttttc 26520
caaaactgca agatccccct ctcctgccgc gccaaccgca cccgcgccga caaaaccctg 26580
accctgcggc agggcgccca catacctgat atcgcctctc tggaggaagt gcccaagatc 26640
ttcgagggtc tcggtcgcga cgagaaacgg gcggcgaacg ctctgcacgg agacagcgaa 26700
aacgagagtc actcgggggt gctggtggag ctcgagggcg acaacgcgcg cctggccgta 26760
ctcaagcgca gcatagaggt cacccacttt gcctacccgg cgctcaacct gccccccaag 26820
gtcatgagtg tggtcatggg cgagctcatc atgcgccgcg cccagcccct ggccgcggat 26880
gcaaacttgc aagagtcctc cgaggaaggc ctgcccgcgg tcagcgacga gcagctggcg 26940
cgctggctgg agacccgcga ccccgcgcag ctggaggagc ggcgcaagct catgatggcc 27000
gcggtgctgg tcaccgtgga gctcgagtgt ctgcagcgct tcttcgcgga ccccgagatg 27060
cagcgcaagc tcgaggagac cctgcactac accttccgcc agggctacgt gcgccaggcc 27120
tgcaagatct ccaacgtgga gctctgcaac ctggtctcct acctgggcat cctgcacgag 27180
aaccgcctcg ggcagaacgt cctgcactcc accctcaaag gggaggcgcg ccgcgactac 27240
atccgcgact gcgcctacct cttcctctgc tacacctggc agacggccat gggggtctgg 27300
cagcagtgcc tggaggagcg caacctcaag gagctggaaa agctcctcaa gcgcaccctc 27360
agggacctct ggacgggctt caacgagcgc tcggtggccg ccgcgctggc ggacatcatc 27420
tttcccgagc gcctgctcaa gaccctgcag cagggcctgc ccgacttcac cagccagagc 27480
atgctgcaga acttcaggac tttcatcctg gagcgctcgg gcatcctgcc ggccacttgc 27540
tgcgcgctgc ccagcgactt cgtgcccatc aagtacaggg agtgcccgcc gccgctctgg 27600
ggccactgct acctcttcca gctggccaac tacctcgcct accactcgga cctcatggaa 27660
gacgtgagcg gcgagggcct gctcgagtgc cactgccgct gcaacctctg cacgccccac 27720
cgctctctag tctgcaaccc gcagctgctc agcgagagtc agattatcgg taccttcgag 27780
ctgcagggtc cctcgcctga cgagaagtcc gcggctccag ggctgaaact cactccgggg 27840
ctgtggactt ccgcctacct acgcaaattt gtacctgagg actaccacgc ccacgagatc 27900
aggttctacg aagaccaatc ccgcccgccc aaggcggagc tcaccgcctg cgtcatcacc 27960
caggggcaca tcctgggcca attgcaagcc atcaacaaag cccgccgaga gttcttgctg 28020
aaaaagggtc ggggggtgta cctggacccc cagtccggcg aggagctaaa cccgctaccc 28080
ccgccgccgc cccagcagcg ggaccttgct tcccaggatg gcacccagaa agaagcagca 28140
gccgccgccg ccgccgcagc catacatgct tctggaggaa gaggaggagg actgggacag 28200
tcaggcagag gaggtttcgg acgaggagca ggaggagatg atggaagact gggaggagga 28260
cagcagccta gacgaggaag cttcagaggc cgaagaggtg gcagacgcaa caccatcgcc 28320
ctcggtcgca gccccctcgc cggggcccct gaaatcctcc gaacccagca ccagcgctat 28380
aacctccgct cctccggcgc cggcgccacc cgcccgcaga cccaaccgta gatgggacac 28440
cacaggaacc ggggtcggta agtccaagtg cccgccgccg ccaccgcagc agcagcagca 28500
gcagcgccag ggctaccgct cgtggcgcgg gcacaagaac gccatagtcg cctgcttgca 28560
agactgcggg ggcaacatct ctttcgcccg ccgcttcctg ctattccacc acggggtcgc 28620
ctttccccgc aatgtcctgc attactaccg tcatctctac agcccctact gcagcggcga 28680
cccagaggcg gcagcggcag ccacagcggc gaccaccacc taggaagata tcctccgcgg 28740
gcaagacagc ggcagcagcg gccaggagac ccgcggcagc agcggcggga gcggtgggcg 28800
cactgcgcct ctcgcccaac gaacccctct cgacccggga gctcagacac aggatcttcc 28860
ccactttgta tgccatcttc caacagagca gaggccagga gcaggagctg aaaataaaaa 28920
acagatctct gcgctccctc acccgcagct gtctgtatca caaaagcgaa gatcagcttc 28980
ggcgcacgct ggaggacgcg gaggcactct tcagcaaata ctgcgcgctc actcttaaag 29040
actagctccg cgcccttctc gaatttaggc gggagaaaac tacgtcatcg ccggccgccg 29100
cccagcccgc ccagccgaga tgagcaaaga gattcccacg ccatacatgt ggagctacca 29160
gccgcagatg ggactcgcgg cgggagcggc ccaggactac tccacccgca tgaactacat 29220
gagcgcggga ccccacatga tctcacaggt caacgggatc cgcgcccagc gaaaccaaat 29280
actgctggaa caggcggcca tcaccgccac gccccgccat aatctcaacc cccgaaattg 29340
gcccgccgcc ctcgtgtacc aggaaacccc ctccgccacc accgtactac ttccgcgtga 29400
cgcccaggcc gaagtccaga tgactaactc aggggcgcag ctcgcgggcg gctttcgtca 29460
cggggcgcgg ccgctccgac caggtataag acacctgatg atcagaggcc gaggtatcca 29520
gctcaacgac gagtcggtga gctcttcgct cggtctccgt ccggacggaa ctttccagct 29580
cgccggatcc ggccgctctt cgttcacgcc ccgccaggcg tacctgactc tgcagacctc 29640
gtcctcggag ccccgctccg gcggcatcgg aaccctccag ttcgtggagg agttcgtgcc 29700
ctcggtctac ttcaacccct tctcgggacc tcccggacgc taccccgacc agttcattcc 29760
gaactttgac gcggtgaagg actcggcgga cggctacgac tgaatgtcag gtgtcgaggc 29820
agagcagctt cgcctgagac acctcgagca ctgccgccgc cacaagtgct tcgcccgcgg 29880
ttctggtgag ttctgctact ttcagctacc cgaggagcat accgaggggc cggcgcacgg 29940
cgtccgcctg accacccagg gcgaggttac ctgttccctc atccgggagt ttaccctccg 30000
tcccctgcta gtggagcggg agcggggtcc ctgtgtccta actatcgcct gcaactgccc 30060
taaccctgga ttacatcaag atctttgctg tcatctctgt gctgagttta ataaacgctg 30120
agatcagaat ctactggggc tcctgtcgcc atcctgtgaa cgccaccgtc ttcacccacc 30180
ccgaccaggc ccaggcgaac ctcacctgcg gtctgcatcg gagggccaag aagtacctca 30240
cctggtactt caacggcacc ccctttgtgg tttacaacag cttcgacggg gacggagtct 30300
ccctgaaaga ccagctctcc ggtctcagct actccatcca caagaacacc accctccaac 30360
tcttccctcc ctacctgccg ggaacctacg agtgcgtcac cggccgctgc acccacctca 30420
cccgcctgat cgtaaaccag agctttccgg gaacagataa ctccctcttc cccagaacag 30480
gaggtgagct caggaaactc cccggggacc agggcggaga cgtaccttcg acccttgtgg 30540
ggttaggatt ttttattacc gggttgctgg ctcttttaat caaagtttcc ttgagatttg 30600
ttctttcctt ctacgtgtat gaacacctca acctccaata actctaccct ttcttcggaa 30660
tcaggtgact tctctgaaat cgggcttggt gtgctgctta ctctgttgat ttttttcctt 30720
atcatactca gccttctgtg cctcaggctc gccgcctgct gcgcacacat ctatatctac 30780
tgctggttgc tcaagtgcag gggtcgccac ccaagatgaa caggtacatg gtcctatcga 30840
tcctaggcct gctggccctg gcggcctgca gcgccgccaa aaaagagatt acctttgagg 30900
agcccgcttg caatgtaact ttcaagcccg agggtgacca atgcaccacc ctcgtcaaat 30960
gcgttaccaa tcatgagagg ctgcgcatcg actacaaaaa caaaactggc cagtttgcgg 31020
tctatagtgt gtttacgccc ggagacccct ctaactactc tgtcaccgtc ttccagggcg 31080
gacagtctaa gatattcaat tacactttcc ctttttatga gttatgcgat gcggtcatgt 31140
acatgtcaaa acagtacaac ctgtggcctc cctctcccca ggcgtgtgtg gaaaatactg 31200
ggtcttactg ctgtatggct ttcgcaatca ctacgctcgc tctaatctgc acggtgctat 31260
acataaaatt caggcagagg cgaatcttta tcgatgaaaa gaaaatgcct tgatcgctaa 31320
caccggcttt ctatctgcag aatgaatgca atcacctccc tactaatcac caccaccctc 31380
cttgcgattg cccatgggtt gacacgaatc gaagtgccag tggggtccaa tgtcaccatg 31440
gtgggccccg ccggcaattc caccctcatg tgggaaaaat ttgtccgcaa tcaatgggtt 31500
catttctgct ctaaccgaat cagtatcaag cccagagcca tctgcgatgg gcaaaatcta 31560
actctgatca atgtgcaaat gatggatgct gggtactatt acgggcagcg gggagaaatc 31620
attaattact ggcgacccca caaggactac atgctgcatg tagtcgaggc acttcccact 31680
accaccccca ctaccacctc tcccaccacc accaccacta ctactactac tactactact 31740
actactacta ccactaccgc tgcccgccat acccgcaaaa gcaccatgat tagcacaaag 31800
ccccctcgtg ctcactccca cgccggcggg cccatcggtg cgacctcaga aaccaccgag 31860
ctttgcttct gccaatgcac taacgccagc gctcatgaac tgttcgacct ggagaatgag 31920
gatgtccagc agagctccgc ttgcctgacc caggaggctg tggagcccgt tgccctgaag 31980
cagatcggtg attcaataat tgactcttct tcttttgcca ctcccgaata ccctcccgat 32040
tctactttcc acatcacggg taccaaagac cctaacctct ctttctacct gatgctgctg 32100
ctctgtatct ctgtggtctc ttccgcgctg atgttactgg ggatgttctg ctgcctgatc 32160
tgccgcagaa agagaaaagc tcgctctcag ggccaaccac tgatgccctt cccctacccc 32220
ccggattttg cagataacaa gatatgagct cgctgctgac actaaccgct ttactagcct 32280
gcgctctaac ccttgtcgct tgcgactcga gattccacaa tgtcacagct gtggcaggag 32340
aaaatgttac tttcaactcc acggccgata cccagtggtc gtggagtggc tcaggtagct 32400
acttaactat ctgcaatagc tccacttccc ccggcatatc cccaaccaag taccaatgca 32460
atgccagcct gttcaccctc atcaacgctt ccaccctgga caatggactc tatgtaggct 32520
atgtaccctt tggtgggcaa ggaaagaccc acgcttacaa cctggaagtt cgccagccca 32580
gaaccactac ccaagcttct cccaccacca ccaccaccac caccatcacc agcagcagca 32640
gcagcagcag ccacagcagc agcagcagat tattgacttt ggttttggcc agctcatctg 32700
ccgctaccca ggccatctac agctctgtgc ccgaaaccac tcagatccac cgcccagaaa 32760
cgaccaccgc caccacccta cacacctcca gcgatcagat gccgaccaac atcaccccct 32820
tggctcttca aatgggactt acaagcccca ctccaaaacc agtggatgcg gccgaggtct 32880
ccgccctcgt caatgactgg gcggggctgg gaatgtggtg gttcgccata ggcatgatgg 32940
cgctctgcct gcttctgctc tggctcatct gctgcctcca ccgcaggcga gccagacccc 33000
ccatctatag acccatcatt gtcctgaacc ccgataatga tgggatccat agattggatg 33060
gcctgaaaaa cctacttttt tcttttacag tatgataaat tgagacatgc ctcgcatttt 33120
cttgtacatg ttccttctcc caccttttct ggggtgttct acgctggccg ctgtgtctca 33180
cctggaggta gactgcctct cacccttcac tgtctacctg ctttacggat tggtcaccct 33240
cactctcatc tgcagcctaa tcacagtaat catcgccttc atccagtgca ttgattacat 33300
ctgtgtgcgc ctcgcatact tcagacacca cccgcagtac cgagacagga acattgccca 33360
acttctaaga ctgctctaat catgcataag actgtgatct gccttctgat cctctgcatc 33420
ctgcccaccc tcacctcctg ccagtacacc acaaaatctc cgcgcaaaag acatgcctcc 33480
tgccgcttca cccaactgtg gaatataccc aaatgctaca acgaaaagag cgagctctcc 33540
gaagcttggc tgtatggggt catctgtgtc ttagttttct gcagcactgt ctttgccctc 33600
ataatctacc cctactttga tttgggatgg aacgcgatcg atgccatgaa ttaccccacc 33660
tttcccgcac ccgagataat tccactgcga caagttgtac ccgttgtcgt taatcaacgc 33720
cccccatccc ctacgcccac tgaaatcagc tactttaacc taacaggcgg agatgactga 33780
cgccctagat ctagaaatgg acggcatcag taccgagcag cgtctcctag agaggcgcag 33840
gcaggcggct gagcaagagc gcctcaatca ggagctccga gatctcgtta acctgcacca 33900
gtgcaaaaga ggcatctttt gtctggtaaa gcaggccaaa gtcacctacg agaagaccgg 33960
caacagccac cgcctcagtt acaaattgcc cacccagcgc cagaagctgg tgctcatggt 34020
gggtgagaat cccatcaccg tcacccagca ctcggtagag accgaggggt gtctgcactc 34080
cccctgtcgg ggtccagaag acctctgcac cctggtaaag accctgtgcg gtctcagaga 34140
tttagtcccc tttaactaat caaacactgg aatcaataaa aagaatcact tacttaaaat 34200
cagacagcag gtctctgtcc agtttattca gcagcacctc cttcccctcc tcccaactct 34260
ggtactccaa acgccttctg gcggcaaact tcctccacac cctgaaggga atgtcagatt 34320
cttgctcctg tccctccgca cccactatct tcatgttgtt gcagatgaag cgcaccaaaa 34380
cgtctgacga gagcttcaac cccgtgtacc cctatgacac ggaaagcggc cctccctccg 34440
tccctttcct cacccctccc ttcgtgtctc ccgatggatt ccaagaaagt ccccccgggg 34500
tcctgtctct gaacctggcc gagcccctgg tcacttccca cggcatgctc gccctgaaaa 34560
tgggaagtgg cctctccctg gacgacgctg gcaacctcac ctctcaagat atcaccaccg 34620
ctagccctcc cctcaaaaaa accaagacca acctcagcct agaaacctca tcccccctaa 34680
ctgtgagcac ctcaggcgcc ctcaccgtag cagccgccgc tcccctggcg gtggccggca 34740
cctccctcac catgcaatca gaggcccccc tgacagtaca ggatgcaaaa ctcaccctgg 34800
ccaccaaagg ccccctgacc gtgtctgaag gcaaactggc cttgcaaaca tcggccccgc 34860
tgacggccgc tgacagcagc accctcacag tcagtgccac accacccctt agcacaagca 34920
atggcagctt gggtattgac atgcaagccc ccatttacac caccaatgga aaactaggac 34980
ttaactttgg cgctcccctg catgtggtag acagcctaaa tgcactgact gtagttactg 35040
gccaaggtct tacgataaac ggaacagccc tacaaactag agtctcaggt gccctcaact 35100
atgacacatc aggaaaccta gaattgagag ctgcaggggg tatgcgagtt gatgcaaatg 35160
gtcaacttat ccttgatgta gcttacccat ttgatgcaca aaacaatctc agccttaggc 35220
ttggacaggg acccctgttt gttaactctg cccacaactt ggatgttaac tacaacagag 35280
gcctctacct gttcacatct ggaaatacca aaaagctaga agttaatatc aaaacagcca 35340
agggtctcat ttatgatgac actgctatag caatcaatgc gggtgatggg ctacagtttg 35400
actcaggctc agatacaaat ccattaaaaa ctaaacttgg attaggactg gattatgact 35460
ccagcagagc cataattgct aaactgggaa ctggcctaag ctttgacaac acaggtgcca 35520
tcacagtagg caacaaaaat gatgacaagc ttaccttgtg gaccacacca gacccatccc 35580
ctaactgtag aatctattca gagaaagatg ctaaattcac acttgttttg actaaatgcg 35640
gcagtcaggt gttggccagc gtttctgttt tatctgtaaa aggtagcctt gcgcccatca 35700
gtggcacagt aactagtgct cagattgtcc tcagatttga tgaaaatgga gttctactaa 35760
gcaattcttc ccttgaccct caatactgga actacagaaa aggtgacctt acagagggca 35820
ctgcatatac caacgcagtg ggatttatgc ccaacctcac agcataccca aaaacacaga 35880
gccaaactgc taaaagcaac attgtaagtc aggtttactt gaatggggac aaatccaaac 35940
ccatgaccct caccattacc ctcaatggaa ctaatgaaac aggagatgcc acagtaagca 36000
cttactccat gtcattctca tggaactgga atggaagtaa ttacattaat gaaacgttcc 36060
aaaccaactc cttcaccttc tcctacatcg cccaagaata aaaagcatga cgctgttgat 36120
ttgattcaat gtgtttctgt tttattttca agcacaacaa aatcattcaa gtcattcttc 36180
catcttagct taatagacac agtagcttaa tagacccagt agtgcaaagc cccattctag 36240
cttataacta gtggagaagt actcgcctac atgggggtag agtcataatc gtgcatcagg 36300
atagggcggt ggtgctgcag cagcgcgcga ataaactgct gccgccgccg ctccgtcctg 36360
caggaataca acatggcagt ggtctcctca gcgatgattc gcaccgcccg cagcataagg 36420
cgccttgtcc tccgggcaca gcagcgcacc ctgatctcac ttaaatcagc acagtaactg 36480
cagcacagca ccacaatatt gttcaaaatc ccacagtgca aggcgctgta tccaaagctc 36540
atggcgggga ccacagaacc cacgtggcca tcataccaca agcgcaggta gattaagtgg 36600
cgacccctca taaacacgct ggacataaac attacctctt ttggcatgtt gtaattcacc 36660
acctcccggt accatataaa cctctgatta aacatggcgc catccaccac catcctaaac 36720
cagctggcca aaacctgccc gccggctata cactgcaggg aaccgggact ggaacaatga 36780
cagtggagag cccaggactc gtaaccatgg atcatcatgc tcgtcatgat atcaatgttg 36840
gcacaacaca ggcacacgtg catacacttc ctcaggatta caagctcctc ccgcgttaga 36900
accatatccc agggaacaac ccattcctga atcagcgtaa atcccacact gcagggaaga 36960
cctcgcacgt aactcacgtt gtgcattgtc aaagtgttac attcgggcag cagcggatga 37020
tcctccagta tggtagcgcg ggtttctgtc tcaaaaggag gtagacgatc cctactgtac 37080
ggagtgcgcc gagacaaccg agatcgtgtt ggtcgtagtg tcatgccaaa tggaacgccg 37140
gacgtagtca tatttcctga agtcttagat ctctcaacgc agcaccagca ccaacacttc 37200
gcagtgtaaa aggccaagtg ccgagagagt atatatagga ataaaaagtg acgtaaacgg 37260
gcaaagtcca aaaaacgccc agaaaaaccg cacgcgaacc tacgccccga aacgaaagcc 37320
aaaaaacact agacactccc ttccggcgtc aacttccgct ttcccacgct acgtcacttg 37380
ccccagtcaa acaaactaca tatcccgaac ttccaagtcg ccacgcccaa aacaccgcct 37440
acacctcccc gcccgccggc ccgcccccaa acccgcctcc cgccccgcgc cccgccccgc 37500
gccgcccatc tcattatcat attggcttca atccaaaata aggtatatta ttgatgatg 37559
<210> 12
<211> 1109
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 12
ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 60
ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 120
ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 180
tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 240
tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat 300
cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca tctccccccc 360
ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag cgatgggggc 420
gggggggggg gggggcgcgc gccaggcggg gcggggcggg gcgaggggcg gggcggggcg 480
aggcggagag gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt tccttttatg 540
gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg ctccctatca gtgatagaga 600
tctccctatc agtgatagag atcgtcgacg agctcgcggc gggcgggagt cgctgcgcgc 660
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 720
accgcgttac taaaacaggt aagtccggcc tccgcgccgg gttttggcgc ctcccgcggg 780
cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg agcgtcctga 840
tccttccgcc cggacgctca ggacagcggc ccgctgctca taagactcgg ccttagaacc 900
ccagtatcag cagaaggaca ttttaggacg ggacttgggt gactctaggg cactggtttt 960
ctttccagag agcggaacag gcgaggaaaa gtagtccctt ctcggcgatt ctgcggaggg 1020
atctccgtgg ggcggtgaac gccgatgatg cctctactaa ccatgttcat gttttctttt 1080
tttttctaca ggtcctgggt gacgaacag 1109
<210> 13
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 13
atacggacta gtggagaagt actcgcctac atg 33
<210> 14
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 14
atacggaaga tctaagactt caggaaatat gactac 36
<210> 15
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 15
attcagtgta caggcgcgcc aaagcatgac gctgttgatt tgattc 46
<210> 16
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 16
actaggacta gttataagct agaatggggc tttgc 35
<210> 17
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 17
ttaatagaca cagtagctta atagacccag tagtgcaaag ccccattcta gcttataacc 60
cctatttgtt tatttttct 79
<210> 18
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 18
atatatactc tctcggcact tggcctttta cactgcgaag tgttggtgct ggtgctgcgt 60
tgagagatct ttatttgtta actgttaatt gtc 93
<210> 19
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 19
ttaatagaca cagtagctta ata 23
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 20
ggaagggagt gtctagtgtt 20
<210> 21
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 21
caatgggcgt ggatagcggt ttgac 25
<210> 22
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 22
cagcatgcct gctattgtc 19
<210> 23
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 23
catctacgta ttagtcatcg ctattacca 29
<210> 24
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 24
gacttggaaa tccccgtgag t 21
<210> 25
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
probe"
<400> 25
acatcaatgg gcgtggatag cggtt 25
<210> 26
<211> 592
<212> DNA
<213> Woodchuck hepatitis virus
<400> 26
taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 60
tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 120
tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 180
gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 240
tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 300
tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 360
gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 420
cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 480
caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 540
tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc ct 592
<210> 27
<211> 543
<212> PRT
<213> Simian adenovirus
<400> 27
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Ile Thr Thr Ala Ser Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Ile Asn Val Ser Ser Gly Ser Leu Gly Leu Asp
180 185 190
Met Glu Asp Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile
195 200 205
Gly Gly Pro Leu Arg Val Val Asp Ser Leu His Thr Leu Thr Val Val
210 215 220
Thr Gly Asn Gly Leu Thr Val Asp Asn Asn Ala Leu Gln Thr Arg Val
225 230 235 240
Thr Gly Ala Leu Gly Tyr Asp Thr Ser Gly Asn Leu Gln Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Ile Asp Ala Asn Gly Gln Leu Ile Leu Asn Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Tyr Ile Asn Thr Asp His Asn Leu Asp Leu Asn Cys Asn
290 295 300
Arg Gly Leu Thr Thr Thr Thr Thr Asn Asn Thr Lys Lys Leu Glu Thr
305 310 315 320
Lys Ile Ser Ser Gly Leu Asp Tyr Asp Thr Asn Gly Ala Val Ile Ile
325 330 335
Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala Leu Thr Val
340 345 350
Gly Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro
355 360 365
Ser Pro Asn Cys Arg Ile His Ser Asp Lys Asp Cys Lys Phe Thr Leu
370 375 380
Val Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu
385 390 395 400
Ala Val Ser Gly Asn Leu Ala Ser Ile Thr Gly Thr Val Ala Ser Val
405 410 415
Thr Ile Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser
420 425 430
Ser Leu Asp Arg Gln Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn
435 440 445
Ala Ala Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ala Ala
450 455 460
Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Gln
465 470 475 480
Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr Leu Thr Ile Thr
485 490 495
Leu Asn Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr
500 505 510
Ser Met Ser Phe Thr Trp Ala Trp Glu Ser Gly Gln Tyr Ala Thr Glu
515 520 525
Thr Phe Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln
530 535 540
<210> 28
<211> 541
<212> PRT
<213> Simian adenovirus
<400> 28
Met Lys Arg Ala Lys Thr Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Arg Leu Ser Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Asn Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Val Thr Thr Val Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Gln Thr Ser Ala Pro Leu Thr Val Ser Ser Gly Ser Leu
100 105 110
Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu Thr
115 120 125
Met Gln Ser Gln Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Gly Leu
130 135 140
Ala Thr Gln Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Thr Leu Gln
145 150 155 160
Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val Gly
165 170 175
Thr Thr Pro Pro Ile Ser Val Ser Ser Gly Ser Leu Gly Leu Asp Met
180 185 190
Glu Asp Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile Gly
195 200 205
Gly Pro Leu Gln Val Val Asp Ser Leu His Thr Leu Thr Val Val Thr
210 215 220
Gly Asn Gly Ile Thr Val Ala Asn Asn Ala Leu Gln Thr Lys Val Ala
225 230 235 240
Gly Ala Leu Gly Tyr Asp Ser Ser Gly Asn Leu Glu Leu Arg Ala Ala
245 250 255
Gly Gly Met Arg Ile Asn Thr Gly Gly Gln Leu Ile Leu Asp Val Ala
260 265 270
Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln Gly
275 280 285
Pro Leu Tyr Val Asn Thr Asn His Asn Leu Asp Leu Asn Cys Asn Arg
290 295 300
Gly Leu Thr Thr Thr Thr Ser Ser Asn Thr Thr Lys Leu Glu Thr Lys
305 310 315 320
Ile Asp Ser Gly Leu Asp Tyr Asn Ala Asn Gly Ala Ile Ile Ala Lys
325 330 335
Leu Gly Thr Gly Leu Thr Phe Asp Asn Thr Gly Ala Ile Thr Val Gly
340 345 350
Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser
355 360 365
Pro Asn Cys Arg Ile His Ala Asp Lys Asp Lys Phe Thr Leu Val Leu
370 375 380
Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu Ala Val
385 390 395 400
Ser Gly Asn Leu Ser Ser Met Thr Gly Thr Val Ser Ser Val Thr Ile
405 410 415
Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser Ser Leu
420 425 430
Asp Lys Glu Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn Ala Thr
435 440 445
Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ser Ala Tyr Pro
450 455 460
Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Glu Val Tyr
465 470 475 480
Leu His Gly Asp Lys Ser Lys Pro Met Ile Leu Thr Ile Thr Leu Asn
485 490 495
Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr Ser Met
500 505 510
Ser Phe Thr Trp Ser Trp Asp Ser Gly Lys Tyr Ala Thr Glu Thr Phe
515 520 525
Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln
530 535 540
<210> 29
<211> 543
<212> PRT
<213> Simian adenovirus
<400> 29
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Ile Thr Ser Thr Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Ala Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ser Thr Pro Pro Ile Ser Val Ser Ser Gly Ser Leu Gly Leu Asp
180 185 190
Met Glu Asp Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile
195 200 205
Gly Gly Pro Leu Arg Val Val Asp Ser Leu His Thr Leu Thr Val Val
210 215 220
Thr Gly Asn Gly Leu Thr Val Asp Asn Asn Ala Leu Gln Thr Arg Val
225 230 235 240
Thr Gly Ala Leu Gly Tyr Asp Thr Ser Gly Asn Leu Gln Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Ile Asp Ala Asn Gly Gln Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Tyr Val Asn Thr Asp His Asn Leu Asp Leu Asn Cys Asn
290 295 300
Arg Gly Leu Thr Thr Thr Thr Thr Asn Asn Thr Lys Lys Leu Glu Thr
305 310 315 320
Lys Ile Ser Ser Gly Leu Asp Tyr Asp Thr Asn Gly Ala Val Ile Ile
325 330 335
Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala Leu Thr Val
340 345 350
Gly Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro
355 360 365
Ser Pro Asn Cys Arg Ile His Ser Asp Lys Asp Cys Lys Phe Thr Leu
370 375 380
Val Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu
385 390 395 400
Ala Val Ser Gly Asn Leu Ala Ser Ile Thr Gly Thr Val Ala Ser Val
405 410 415
Thr Ile Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser
420 425 430
Ser Leu Asp Lys Gln Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn
435 440 445
Ala Ala Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ala Ala
450 455 460
Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Gln
465 470 475 480
Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr Leu Thr Ile Thr
485 490 495
Leu Asn Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr
500 505 510
Ser Met Ser Phe Thr Trp Ala Trp Glu Ser Gly Gln Tyr Ala Thr Glu
515 520 525
Thr Phe Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln
530 535 540
<210> 30
<211> 543
<212> PRT
<213> Simian adenovirus
<400> 30
Met Lys Arg Thr Lys Thr Ser Asp Lys Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Val Thr Thr Thr Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ala Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Leu Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Ile Ser Val Ser Ser Gly Ser Leu Gly Leu Asp
180 185 190
Met Glu Asp Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile
195 200 205
Gly Gly Pro Leu Arg Val Val Asp Ser Leu His Thr Leu Thr Val Val
210 215 220
Thr Gly Asn Gly Ile Ala Val Asp Asn Asn Ala Leu Gln Thr Arg Val
225 230 235 240
Thr Gly Ala Leu Gly Tyr Asp Thr Ser Gly Asn Leu Gln Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Ile Asp Ala Asn Gly Gln Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Tyr Val Asn Thr Asp His Asn Leu Asp Leu Asn Cys Asn
290 295 300
Arg Gly Leu Thr Thr Thr Thr Thr Asn Asn Thr Lys Lys Leu Glu Thr
305 310 315 320
Lys Ile Gly Ser Gly Leu Asp Tyr Asp Thr Asn Gly Ala Val Ile Ile
325 330 335
Lys Leu Gly Thr Gly Val Ser Phe Asp Ser Thr Gly Ala Leu Ser Val
340 345 350
Gly Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro
355 360 365
Ser Pro Asn Cys Arg Ile His Ser Asp Lys Asp Cys Lys Phe Thr Leu
370 375 380
Val Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu
385 390 395 400
Ala Val Ser Gly Asn Leu Ala Ser Ile Thr Gly Thr Val Ser Ser Val
405 410 415
Thr Ile Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser
420 425 430
Ser Leu Asp Lys Gln Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn
435 440 445
Ala Thr Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ala Ala
450 455 460
Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Gln
465 470 475 480
Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr Leu Thr Ile Thr
485 490 495
Leu Asn Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr
500 505 510
Ser Met Ser Phe Thr Trp Ala Trp Glu Ser Gly Gln Tyr Ala Thr Glu
515 520 525
Thr Phe Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln
530 535 540
<210> 31
<211> 543
<212> PRT
<213> Simian adenovirus
<400> 31
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Val Thr Thr Thr Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ala Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Leu Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Ile Asn Val Ser Ser Gly Ser Leu Gly Leu Asp
180 185 190
Met Glu Asn Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile
195 200 205
Gly Gly Pro Leu Arg Val Val Asp Ser Leu His Thr Leu Thr Val Val
210 215 220
Thr Gly Asn Gly Ile Ala Val Asp Asn Asn Ala Leu Gln Thr Arg Val
225 230 235 240
Thr Gly Ala Leu Gly Tyr Asp Thr Ser Gly Asn Leu Gln Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Ile Asp Ala Asn Gly Gln Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Tyr Val Asn Thr Asp His Asn Leu Asp Leu Asn Cys Asn
290 295 300
Arg Gly Leu Thr Thr Thr Thr Thr Asn Asn Thr Lys Lys Leu Glu Thr
305 310 315 320
Lys Ile Gly Ser Gly Leu Asp Tyr Asp Thr Asn Gly Ala Val Ile Ile
325 330 335
Lys Leu Gly Thr Gly Val Ser Phe Asp Ser Thr Gly Ala Leu Ser Val
340 345 350
Gly Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro
355 360 365
Ser Pro Asn Cys Arg Ile His Ser Asp Lys Asp Cys Lys Phe Thr Leu
370 375 380
Val Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu
385 390 395 400
Ala Val Ser Gly Asn Leu Ala Ser Ile Thr Gly Thr Val Ser Ser Val
405 410 415
Thr Ile Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser
420 425 430
Ser Leu Asp Lys Gln Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn
435 440 445
Ala Thr Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ala Ala
450 455 460
Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Gln
465 470 475 480
Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Ile Leu Thr Ile Thr
485 490 495
Leu Asn Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr
500 505 510
Ser Met Ser Phe Thr Trp Ala Trp Glu Ser Gly Gln Tyr Ala Thr Glu
515 520 525
Thr Phe Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln
530 535 540
<210> 32
<211> 578
<212> PRT
<213> Simian adenovirus
<400> 32
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Val Thr Thr Thr Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ala Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Leu Ala Ala Ala Val Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Ile
165 170 175
Ser Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Gly Ile Asp
180 185 190
Met Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Gly Leu Asn Phe
195 200 205
Gly Ala Pro Leu His Val Val Asp Ser Leu Asn Ala Leu Thr Val Val
210 215 220
Thr Gly Gln Gly Leu Thr Ile Asn Gly Thr Ala Leu Gln Thr Arg Val
225 230 235 240
Ser Gly Ala Leu Asn Tyr Asp Ser Ser Gly Asn Leu Glu Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Val Asp Ala Asn Gly Lys Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Phe Val Asn Ser Ala His Asn Leu Asp Val Asn Tyr Asn
290 295 300
Arg Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val
305 310 315 320
Asn Ile Lys Thr Ala Lys Gly Leu Ile Tyr Asp Asp Thr Ala Ile Ala
325 330 335
Ile Asn Pro Gly Asp Gly Leu Glu Phe Gly Ser Gly Ser Asp Thr Asn
340 345 350
Pro Leu Lys Thr Lys Leu Gly Leu Gly Leu Glu Tyr Asp Ser Ser Arg
355 360 365
Ala Ile Ile Ala Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly
370 375 380
Ala Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr
385 390 395 400
Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile Tyr Ser Glu Lys Asp Ala
405 410 415
Lys Phe Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser
420 425 430
Val Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr
435 440 445
Val Thr Ser Ala Gln Ile Ile Leu Arg Phe Asp Glu Asn Gly Val Leu
450 455 460
Leu Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly
465 470 475 480
Asp Leu Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro
485 490 495
Asn Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn
500 505 510
Ile Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Ile
515 520 525
Leu Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val
530 535 540
Ser Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr
545 550 555 560
Ile Asn Glu Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala
565 570 575
Gln Glu
<210> 33
<211> 578
<212> PRT
<213> Simian adenovirus
<400> 33
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Ile Thr Thr Ala Ser Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Gly Ile Asp
180 185 190
Met Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Gly Leu Asn Phe
195 200 205
Gly Ala Pro Leu His Val Val Asp Ser Leu Asn Ala Leu Thr Val Val
210 215 220
Thr Gly Gln Gly Leu Thr Ile Asn Gly Thr Ala Leu Gln Thr Arg Val
225 230 235 240
Ser Gly Ala Leu Asn Tyr Asp Thr Ser Gly Asn Leu Glu Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Val Asp Ala Asn Gly Gln Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Phe Val Asn Ser Ala His Asn Leu Asp Val Asn Tyr Asn
290 295 300
Arg Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val
305 310 315 320
Asn Ile Lys Thr Ala Lys Gly Leu Ile Tyr Asp Asp Thr Ala Ile Ala
325 330 335
Ile Asn Ala Gly Asp Gly Leu Gln Phe Asp Ser Gly Ser Asp Thr Asn
340 345 350
Pro Leu Lys Thr Lys Leu Gly Leu Gly Leu Asp Tyr Asp Ser Ser Arg
355 360 365
Ala Ile Ile Ala Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly
370 375 380
Ala Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr
385 390 395 400
Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile Tyr Ser Glu Lys Asp Ala
405 410 415
Lys Phe Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser
420 425 430
Val Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr
435 440 445
Val Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu
450 455 460
Leu Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly
465 470 475 480
Asp Leu Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro
485 490 495
Asn Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn
500 505 510
Ile Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr
515 520 525
Leu Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val
530 535 540
Ser Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr
545 550 555 560
Ile Asn Glu Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala
565 570 575
Gln Glu
<210> 34
<211> 578
<212> PRT
<213> Simian adenovirus
<400> 34
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Ile Thr Thr Ala Ser Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Gly Ile Asp
180 185 190
Met Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Gly Leu Asn Phe
195 200 205
Gly Ala Pro Leu His Val Val Asp Ser Leu Asn Ala Leu Thr Val Val
210 215 220
Thr Gly Gln Gly Leu Thr Ile Asn Gly Thr Ala Leu Gln Thr Arg Val
225 230 235 240
Ser Gly Ala Leu Asn Tyr Asp Thr Ser Gly Asn Leu Glu Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Val Asp Ala Asn Gly Gln Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Phe Val Asn Ser Ala His Asn Leu Asp Val Asn Tyr Asn
290 295 300
Arg Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val
305 310 315 320
Asn Ile Lys Thr Ala Lys Gly Leu Ile Tyr Asp Asp Thr Ala Ile Ala
325 330 335
Ile Asn Ala Gly Asp Gly Leu Gln Phe Asp Ser Gly Ser Asp Thr Asn
340 345 350
Pro Leu Lys Thr Lys Leu Gly Leu Gly Leu Asp Tyr Asp Ser Ser Arg
355 360 365
Ala Ile Ile Ala Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly
370 375 380
Ala Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr
385 390 395 400
Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile Tyr Ser Glu Lys Asp Ala
405 410 415
Lys Phe Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser
420 425 430
Val Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr
435 440 445
Val Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu
450 455 460
Leu Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly
465 470 475 480
Asp Leu Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro
485 490 495
Asn Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn
500 505 510
Ile Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr
515 520 525
Leu Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val
530 535 540
Ser Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr
545 550 555 560
Ile Asn Glu Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala
565 570 575
Gln Glu
<210> 35
<211> 577
<212> PRT
<213> Simian adenovirus
<400> 35
Met Lys Arg Ala Lys Thr Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Arg Leu Ser Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Asn Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Val Thr Thr Val Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Gln Thr Ser Ala Pro Leu Thr Val Ser Ser Gly Ser Leu
100 105 110
Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu Thr
115 120 125
Met Gln Ser Gln Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Gly Leu
130 135 140
Ala Thr Gln Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Thr Leu Gln
145 150 155 160
Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val Ser
165 170 175
Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Ser Ile Asp Met
180 185 190
Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Ala Leu Asn Ile Gly
195 200 205
Ala Pro Leu His Val Val Asp Thr Leu Asn Ala Leu Thr Val Val Thr
210 215 220
Gly Gln Gly Leu Thr Ile Asn Gly Arg Ala Leu Gln Thr Arg Val Thr
225 230 235 240
Gly Ala Leu Ser Tyr Asp Thr Glu Gly Asn Ile Gln Leu Gln Ala Gly
245 250 255
Gly Gly Met Arg Ile Asp Asn Asn Gly Gln Leu Ile Leu Asn Val Ala
260 265 270
Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln Gly
275 280 285
Pro Leu Ile Val Asn Ser Ala His Asn Leu Asp Leu Asn Leu Asn Arg
290 295 300
Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val Asn
305 310 315 320
Ile Lys Thr Ala Lys Gly Leu Phe Tyr Asp Gly Thr Ala Ile Ala Ile
325 330 335
Asn Ala Gly Asp Gly Leu Gln Phe Gly Ser Gly Ser Asp Thr Asn Pro
340 345 350
Leu Gln Thr Lys Leu Gly Leu Gly Leu Glu Tyr Asp Ser Asn Lys Ala
355 360 365
Ile Ile Thr Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala
370 375 380
Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr Thr
385 390 395 400
Pro Asp Pro Ser Pro Asn Cys Arg Ile Asn Ser Glu Lys Asp Ala Lys
405 410 415
Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser Val
420 425 430
Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr Val
435 440 445
Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu Leu
450 455 460
Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly Asp
465 470 475 480
Ser Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro Asn
485 490 495
Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn Ile
500 505 510
Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Thr Lys Pro Met Thr Leu
515 520 525
Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val Ser
530 535 540
Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr Ile
545 550 555 560
Asn Asp Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Gln
565 570 575
Glu
<210> 36
<211> 577
<212> PRT
<213> Simian adenovirus
<400> 36
Met Lys Arg Ala Lys Thr Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Arg Leu Ser Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Asn Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Val Thr Thr Val Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Gln Thr Ser Ala Pro Leu Thr Val Ser Ser Gly Ser Leu
100 105 110
Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu Thr
115 120 125
Met Gln Ser Gln Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Gly Leu
130 135 140
Ala Thr Gln Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Thr Leu Gln
145 150 155 160
Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val Ser
165 170 175
Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Ser Ile Asp Met
180 185 190
Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Ala Leu Asn Ile Gly
195 200 205
Ala Pro Leu His Val Val Asp Thr Leu Asn Ala Leu Thr Val Val Thr
210 215 220
Gly Gln Gly Leu Thr Ile Asn Gly Arg Ala Leu Gln Thr Arg Val Thr
225 230 235 240
Gly Ala Leu Ser Tyr Asp Thr Glu Gly Asn Ile Gln Leu Gln Ala Gly
245 250 255
Gly Gly Met Arg Ile Asp Asn Asn Gly Gln Leu Ile Leu Asn Val Ala
260 265 270
Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln Gly
275 280 285
Pro Leu Ile Val Asn Ser Ala His Asn Leu Asp Leu Asn Leu Asn Arg
290 295 300
Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val Asn
305 310 315 320
Ile Lys Thr Ala Lys Gly Leu Phe Tyr Asp Gly Thr Ala Ile Ala Ile
325 330 335
Asn Ala Gly Asp Gly Leu Gln Phe Gly Ser Gly Ser Asp Thr Asn Pro
340 345 350
Leu Gln Thr Lys Leu Gly Leu Gly Leu Glu Tyr Asp Ser Asn Lys Ala
355 360 365
Ile Ile Thr Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala
370 375 380
Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr Thr
385 390 395 400
Pro Asp Pro Ser Pro Asn Cys Arg Ile Asn Ser Glu Lys Asp Ala Lys
405 410 415
Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser Val
420 425 430
Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr Val
435 440 445
Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu Leu
450 455 460
Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly Asp
465 470 475 480
Ser Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro Asn
485 490 495
Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn Ile
500 505 510
Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Thr Lys Pro Met Thr Leu
515 520 525
Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val Ser
530 535 540
Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr Ile
545 550 555 560
Asn Asp Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Gln
565 570 575
Glu
<210> 37
<211> 1145
<212> PRT
<213> Respiratory syncytial virus
<400> 37
Met Glu Leu Leu Ile Leu Lys Ala Asn Ala Ile Thr Thr Ile Leu Thr
1 5 10 15
Ala Val Thr Phe Cys Phe Ala Ser Gly Gln Asn Ile Thr Glu Glu Phe
20 25 30
Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu Ser Ala Leu
35 40 45
Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu Ser Asn Ile
50 55 60
Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys Leu Ile Lys
65 70 75 80
Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu Gln Leu Leu
85 90 95
Met Gln Ser Thr Pro Ala Thr Asn Asn Arg Ala Arg Arg Glu Leu Pro
100 105 110
Arg Phe Met Asn Tyr Thr Leu Asn Asn Ala Lys Lys Thr Asn Val Thr
115 120 125
Leu Ser Lys Lys Arg Lys Arg Arg Phe Leu Gly Phe Leu Leu Gly Val
130 135 140
Gly Ser Ala Ile Ala Ser Gly Val Ala Val Ser Lys Val Leu His Leu
145 150 155 160
Glu Gly Glu Val Asn Lys Ile Lys Ser Ala Leu Leu Ser Thr Asn Lys
165 170 175
Ala Val Val Ser Leu Ser Asn Gly Val Ser Val Leu Thr Ser Lys Val
180 185 190
Leu Asp Leu Lys Asn Tyr Ile Asp Lys Gln Leu Leu Pro Ile Val Asn
195 200 205
Lys Gln Ser Cys Ser Ile Ser Asn Ile Glu Thr Val Ile Glu Phe Gln
210 215 220
Gln Lys Asn Asn Arg Leu Leu Glu Ile Thr Arg Glu Phe Ser Val Asn
225 230 235 240
Ala Gly Val Thr Thr Pro Val Ser Thr Tyr Met Leu Thr Asn Ser Glu
245 250 255
Leu Leu Ser Leu Asn Asp Met Pro Ile Thr Asn Asp Gln Lys Lys Leu
260 265 270
Met Ser Asn Asn Val Gln Ile Val Arg Gln Gln Ser Tyr Ser Ile Met
275 280 285
Ser Ile Ile Lys Glu Glu Val Leu Ala Tyr Val Val Gln Leu Pro Leu
290 295 300
Tyr Gly Val Ile Asp Thr Pro Cys Trp Lys Leu His Thr Ser Pro Leu
305 310 315 320
Cys Thr Thr Asn Thr Lys Glu Gly Ser Asn Ile Cys Leu Thr Arg Thr
325 330 335
Asp Arg Gly Trp Tyr Cys Asp Asn Ala Gly Ser Val Ser Phe Phe Pro
340 345 350
Gln Ala Glu Thr Cys Lys Val Gln Ser Asn Arg Val Phe Cys Asp Thr
355 360 365
Met Asn Ser Leu Thr Leu Pro Ser Glu Val Asn Leu Cys Asn Val Asp
370 375 380
Ile Phe Asn Pro Lys Tyr Asp Cys Lys Ile Met Thr Ser Lys Thr Asp
385 390 395 400
Val Ser Ser Ser Val Ile Thr Ser Leu Gly Ala Ile Val Ser Cys Tyr
405 410 415
Gly Lys Thr Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly Ile Ile Lys
420 425 430
Thr Phe Ser Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly Val Asp Thr
435 440 445
Val Ser Val Gly Asn Thr Leu Tyr Tyr Val Asn Lys Gln Glu Gly Lys
450 455 460
Ser Leu Tyr Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr Asp Pro Leu
465 470 475 480
Val Phe Pro Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln Val Asn Glu
485 490 495
Lys Ile Asn Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp Glu Leu Leu
500 505 510
His Asn Val Asn Ala Gly Lys Ser Thr Thr Asn Arg Lys Arg Arg Ala
515 520 525
Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp
530 535 540
Val Glu Ser Asn Pro Gly Pro Met Ala Leu Ser Lys Val Lys Leu Asn
545 550 555 560
Asp Thr Leu Asn Lys Asp Gln Leu Leu Ser Ser Ser Lys Tyr Thr Ile
565 570 575
Gln Arg Ser Thr Gly Asp Ser Ile Asp Thr Pro Asn Tyr Asp Val Gln
580 585 590
Lys His Ile Asn Lys Leu Cys Gly Met Leu Leu Ile Thr Glu Asp Ala
595 600 605
Asn His Lys Phe Thr Gly Leu Ile Gly Met Leu Tyr Ala Met Ser Arg
610 615 620
Leu Gly Arg Glu Asp Thr Ile Lys Ile Leu Arg Asp Ala Gly Tyr His
625 630 635 640
Val Lys Ala Asn Gly Val Asp Val Thr Thr His Arg Gln Asp Ile Asn
645 650 655
Gly Lys Glu Met Lys Phe Glu Val Leu Thr Leu Ala Ser Leu Thr Thr
660 665 670
Glu Ile Gln Ile Asn Ile Glu Ile Glu Ser Arg Lys Ser Tyr Lys Lys
675 680 685
Met Leu Lys Glu Met Gly Glu Val Ala Pro Glu Tyr Arg His Asp Ser
690 695 700
Pro Asp Cys Gly Met Ile Ile Leu Cys Ile Ala Ala Leu Val Ile Thr
705 710 715 720
Lys Leu Ala Ala Gly Asp Arg Ser Gly Leu Thr Ala Val Ile Arg Arg
725 730 735
Ala Asn Asn Val Leu Lys Asn Glu Met Lys Arg Tyr Lys Gly Leu Leu
740 745 750
Pro Lys Asp Ile Ala Asn Ser Phe Tyr Glu Val Phe Glu Lys Tyr Pro
755 760 765
His Phe Ile Asp Val Phe Val His Phe Gly Ile Ala Gln Ser Ser Thr
770 775 780
Arg Gly Gly Ser Arg Val Glu Gly Ile Phe Ala Gly Leu Phe Met Asn
785 790 795 800
Ala Tyr Gly Ala Gly Gln Val Met Leu Arg Trp Gly Val Leu Ala Lys
805 810 815
Ser Val Lys Asn Ile Met Leu Gly His Ala Ser Val Gln Ala Glu Met
820 825 830
Glu Gln Val Val Glu Val Tyr Glu Tyr Ala Gln Lys Leu Gly Gly Glu
835 840 845
Ala Gly Phe Tyr His Ile Leu Asn Asn Pro Lys Ala Ser Leu Leu Ser
850 855 860
Leu Thr Gln Phe Pro His Phe Ser Ser Val Val Leu Gly Asn Ala Ala
865 870 875 880
Gly Leu Gly Ile Met Gly Glu Tyr Arg Gly Thr Pro Arg Asn Gln Asp
885 890 895
Leu Tyr Asp Ala Ala Lys Ala Tyr Ala Glu Gln Leu Lys Glu Asn Gly
900 905 910
Val Ile Asn Tyr Ser Val Leu Asp Leu Thr Ala Glu Glu Leu Glu Ala
915 920 925
Ile Lys His Gln Leu Asn Pro Lys Asp Asn Asp Val Glu Leu Gly Gly
930 935 940
Gly Gly Ser Gly Gly Gly Gly Met Ser Arg Arg Asn Pro Cys Lys Phe
945 950 955 960
Glu Ile Arg Gly His Cys Leu Asn Gly Lys Arg Cys His Phe Ser His
965 970 975
Asn Tyr Phe Glu Trp Pro Pro His Ala Leu Leu Val Arg Gln Asn Phe
980 985 990
Met Leu Asn Arg Ile Leu Lys Ser Met Asp Lys Ser Ile Asp Thr Leu
995 1000 1005
Ser Glu Ile Ser Gly Ala Ala Glu Leu Asp Arg Thr Glu Glu Tyr
1010 1015 1020
Ala Leu Gly Val Val Gly Val Leu Glu Ser Tyr Ile Gly Ser Ile
1025 1030 1035
Asn Asn Ile Thr Lys Gln Ser Ala Cys Val Ala Met Ser Lys Leu
1040 1045 1050
Leu Thr Glu Leu Asn Ser Asp Asp Ile Lys Lys Leu Arg Asp Asn
1055 1060 1065
Glu Glu Leu Asn Ser Pro Lys Ile Arg Val Tyr Asn Thr Val Ile
1070 1075 1080
Ser Tyr Ile Glu Ser Asn Arg Lys Asn Asn Lys Gln Thr Ile His
1085 1090 1095
Leu Leu Lys Arg Leu Pro Ala Asp Val Leu Lys Lys Thr Ile Lys
1100 1105 1110
Asn Thr Leu Asp Ile His Lys Ser Ile Thr Ile Asn Asn Pro Lys
1115 1120 1125
Glu Ser Thr Val Ser Asp Thr Asn Asp His Ala Lys Asn Asn Asp
1130 1135 1140
Thr Thr
1145
<210> 38
<211> 1502
<212> DNA
<213> Human immunodeficiency virus
<400> 38
atgggtgcta gggcttctgt gctgtctggt ggtgagctgg acaagtggga gaagatcagg 60
ctgaggcctg gtggcaagaa gaagtacaag ctaaagcaca ttgtgtgggc ctccagggag 120
ctggagaggt ttgctgtgaa ccctggcctg ctggagacct ctgaggggtg caggcagatc 180
ctgggccagc tccagccctc cctgcaaaca ggctctgagg agctgaggtc cctgtacaac 240
acagtggcta ccctgtactg tgtgcaccag aagattgatg tgaaggacac caaggaggcc 300
ctggagaaga ttgaggagga gcagaacaag tccaagaaga aggcccagca ggctgctgct 360
ggcacaggca actccagcca ggtgtcccag aactacccca ttgtgcagaa cctccagggc 420
cagatggtgc accaggccat ctccccccgg accctgaatg cctgggtgaa ggtggtggag 480
gagaggcctt ctcccctgag gtgatcccca tgttctctgc cctgtctgag ggtgccaccc 540
cccaggacct gaacaccatg ctgaacacag tggggggcca tcaggctgcc atgcagatgc 600
tgaaggagac catcaatgag gaggctgctg agtgggacag gctgcatcct gtgcacgctg 660
gccccattgc ccccggccag atgagggagc ccaggggctc tgacattgct ggcaccacct 720
ccaccctcca ggagcagatt ggctggatga ccaacaaccc ccccatccct gtgggggaaa 780
tctacaagag gtggatcatc ctgggcctga acaagattgt gaggatgtac tcccccacct 840
ccatcctgga catcaggcag ggccccaagg agcccttcag ggactatgtg gacaggttct 900
acaagaccct gagggctgag caggcctccc aggaggtgaa gaactggatg acagagaccc 960
tgctggtgca gaatgccaac cctgactgca agaccatcct gaaggccctg ggccctgctg 1020
ccaccctgga ggagatgatg acagcctgcc agggggtggg gggccctggt cacaaggcca 1080
gggtgctggc tgaggccatg tcccaggtga ccaactccgc caccatcatg atgcagaggg 1140
gcaacttcag gaaccagagg aagacagtga agtgcttcaa ctgtggcaag gtgggccaca 1200
ttgccaagaa ctgtagggcc cccaggaaga agggctgctg gaagtgtggc aaggagggcc 1260
accagatgaa ggactgcaat gagaggcagg ccaacttcct gggcaaaatc tggccctccc 1320
acaagggcag gcctggcaac ttcctccagt ccaggcctga gcccacagcc cctcccgagg 1380
agtccttcag gtttggggag gagaagacca cccccagcca gaagcaggag cccattgaca 1440
aggagctgta ccccctggcc tccctgaggt ccctgtttgg caacgacccc tcctcccagt 1500
aa 1502
Claims (42)
- 하기로 구성된 군으로부터 선택되는 폴리뉴클레오티드를 포함하는 재조합 벡터:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드, 및
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드. - 하기로 구성된 군으로부터 선택되는 적어도 하나의 폴리뉴클레오티드 또는 폴리펩티드를 포함하는 재조합 아데노바이러스:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드,
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(d) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(e) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체, 및
(f) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드. - 하기 중 적어도 하나 및 약학적으로 허용되는 부형제를 포함하는 조성물:
(a) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(b) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하는 폴리뉴클레오티드로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 폴리뉴클레오티드,
(c) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
(d) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드,
(e) SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는, 기능성 유도체,
(f) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드,
(g) 제 1항에 따른 재조합 벡터, 및
(h) 제 2항에 따른 재조합 아데노바이러스. - 제1항 내지 제3항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드를 인코딩하는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제4항에 있어서, 폴리뉴클레오티드가 SEQ ID NO: 2에 따른 서열을 갖는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 SEQ ID NO: 1에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체를 인코딩하고, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 1의 아미노산 서열과 적어도 80% 동일한, 예를 들어, 적어도 89.0% 동일한, 예를 들어, 적어도 99.0% 동일한, 예를 들어, 적어도 99.6% 동일한 아미노산 서열을 갖는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 하기를 인코딩하는 폴리뉴클레오티드를 포함하는 재조합 벡터, 재조합 아데노바이러스 또는 조성물:
(a) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 3의 아미노산 서열과 적어도 50.0% 동일한 아미노산 서열을 갖는, 기능성 유도체,
또는
(a) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드; 또는
(b) SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체로서, 상기 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 5의 아미노산 서열과 적어도 50% 동일한 아미노산 서열을 갖는, 기능성 유도체. - 제7항에 있어서, SEQ ID NO: 3에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 3의 아미노산 서열과 적어도 70.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 99% 동일한 아미노산 서열을 갖는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제7항에 있어서, SEQ ID NO: 5에 따른 아미노산 서열을 갖는 폴리펩티드의 기능성 유도체가 이의 전장에 걸쳐 SEQ ID NO: 5의 아미노산 서열과 적어도 70.0%, 예를 들어, 적어도 90.0%, 예를 들어, 적어도 99% 동일한 아미노산 서열을 갖는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 하기 중 적어도 하나를 포함하는 재조합 벡터, 재조합 아데노바이러스 또는 조성물:
(a) 아데노바이러스 5'-말단, 바람직하게는 아데노바이러스 5' 역 말단 반복;
(b) 아데노바이러스 E1A 영역, 또는 E1A_280R 및 E1A_243R 영역으로부터 선택되는 이의 단편;
(c) 아데노바이러스 E1B 또는 IX 영역, 또는 E1B_19K, E1B_55K 또는 IX 영역으로 구성된 군으로부터 선택되는 이의 단편;
(d) 아데노바이러스 E2b 영역; 또는 E2B_pTP, E2B_중합효소 및 E2B_IVa2 영역으로 구성된 군으로부터 선택되는 이의 단편;
(e) 아데노바이러스 L1 영역, 또는 이의 단편으로서, 상기 단편이 L1_13.6k 단백질, L1_52k 및 L1_IIIa 단백질로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L1 영역, 또는 이의 단편;
(f) 아데노바이러스 L2 영역, 또는 이의 단편으로서, 상기 단편이 L2_펜톤 단백질, L2_pVII, L2_V, 및 L2_pX 단백질로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L2 영역, 또는 이의 단편;
(g) 아데노바이러스 L3 영역, 또는 이의 단편으로서, 상기 단편이 L3_pVI 단백질, L3_헥손 단백질 및 L3_프로테아제로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L3 영역, 또는 이의 단편;
(h) 아데노바이러스 E2A 영역;
(i) 아데노바이러스 L4 영역, 또는 이의 단편으로서, 상기 단편이 L4_100k 단백질, L4_33k 단백질 및 단백질 L4_VIII로 구성된 군으로부터 선택되는 아데노바이러스 단백질을 인코딩하는, 아데노바이러스 L4 영역, 또는 이의 단편;
(j) 아데노바이러스 E3 영역, 또는 E3 ORF1, E3 ORF2, E3 ORF3, E3 ORF4, E3 ORF5, E3 ORF6, E3 ORF7, E3 ORF8, 및 E3 ORF9로 구성된 군으로부터 선택되는 이의 단편;
(k) 아데노바이러스 L5 영역, 또는 이의 단편으로서, 상기 단편이 L5_섬유 섬유 단백질을 인코딩하는, 아데노바이러스 L5 영역, 또는 이의 단편;
(1) 아데노바이러스 E4 영역, 또는 E4 ORF7, E4 ORF6, E4 ORF4, E4 ORF3, E4 ORF2, 및 E4 ORF1으로 구성된 군으로부터 선택되는 이의 단편;
(m) 아데노바이러스 3'-말단, 바람직하게는 아데노바이러스 3' 역 말단 반복; 및/또는
(n) 아데노바이러스 VAI 또는 VAII RNA 영역, 바람직하게는 ChAd155가 아닌 아데노바이러스로부터의 아데노바이러스 VAI 또는 VAII RNA 영역, 더욱 바람직하게는 Ad5로부터의 아데노바이러스 VAI 또는 VAII RNA 영역. - 제1항 내지 제10항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 아데노바이러스 VAI 또는 VAII RNA 영역을 포함하는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제11항에 있어서, VAI 또는 VAII RNA 영역이 Ad5로부터 유래되는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 이의 전장에 걸쳐 SEQ ID NO: 7, 8 또는 9로 본질적으로 구성되는 참조 서열과 적어도 98.6% 동일한 폴리뉴클레오티드를 포함하거나 이로 구성되는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제13항에 있어서, 폴리뉴클레오티드가 이의 전장에 걸쳐 참조 서열과 동일한 폴리뉴클레오티드를 포함하거나 이로 구성되는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 E1A, E1B, E2A, E2B, E3 및 E4로 구성된 군으로부터 선택되는 유전체 영역의 적어도 하나의 유전자를 비-기능성이 되도록 하는 돌연변이 또는 결실을 포함하는 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제15항에 있어서, 폴리뉴클레오티드에 E1A 및/또는 E1B로 구성된 군으로부터 선택되는 유전체 영역의 적어도 하나의 유전자가 결여된 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제2항 및 제4항 내지 제16항 중 어느 한 항에 있어서, 재조합 아데노바이러스가 복제-적격인 재조합 아데노바이러스.
- 제2항 및 제4항 내지 제16항 중 어느 한 항에 있어서, 재조합 아데노바이러스가 복제-부적격인 재조합 아데노바이러스.
- 제2항 및 제4항 내지 제16항 중 어느 한 항에 있어서, 재조합 아데노바이러스가 이종성 단백질을 인코딩하는 핵산 서열을 포함하고, 상기 핵산 서열이 숙주 세포에서 상기 이종성 단백질의 발현을 유도하는 하나 이상의 서열에 작동 가능하게 연결되는 재조합 아데노바이러스.
- 제19항에 있어서, 이종성 단백질이 항원성 단백질 또는 이의 단편인 재조합 아데노바이러스.
- 제20항에 있어서, 이종성 단백질이 바이러스로부터 유래되는 재조합 아데노바이러스.
- 제19항 내지 제21항 중 어느 한 항에 있어서, 이종성 단백질이 호흡기 세포 융합 바이러스(RSV)의 융합 단백질(F), 부착 단백질(G), 기질 단백질(M2) 및 핵단백질(N)로부터 선택되는 재조합 아데노바이러스.
- 제19항에 있어서, 이종성 단백질을 인코딩하는 핵산 서열이 RSV F 항원 및 RSV M 및 N 항원을 인코딩하는 재조합 아데노바이러스.
- 제23항에 있어서, 이종성 단백질을 인코딩하는 핵산 서열이 RSV FΔTM 항원, RSV M2-1 항원 및 N 항원을 인코딩하는 재조합 아데노바이러스.
- 제23항 또는 제24항에 있어서, 이종성 단백질을 인코딩하는 핵산 서열이 SEQ ID NO: 37에 따른 서열을 인코딩하는 재조합 아데노바이러스.
- 제2항 및 제4항 내지 제25항 중 어느 한 항에 있어서, 아데노바이러스가 포유동물 세포를 감염시킬 수 있는 재조합 아데노바이러스.
- 제3항 내지 제16항 중 어느 한 항에 있어서, 무기 애쥬번트(예를 들어, 무기 금속 염, 예를 들어, 알루미늄 포스페이트 또는 알루미늄 하이드록시드), 유기 애쥬번트(예를 들어, 사포닌, 예를 들어, QS21, 또는 스쿠알렌), 오일-기반 애쥬번트(예를 들어, 프로인트 완전 애쥬번트 및 프로인트 불완전 애쥬번트), 사이토카인(예를 들어, IL-1β, IL-2, IL-7, IL-12, IL-18, GM-CFS, 및 INF-γ) 미립자 애쥬번트(예를 들어, 면역-자극성 복합체(ISCOMS), 리포솜, 또는 생물분해성 미세구), 바이로솜, 박테리아 애쥬번트(예를 들어, 모노포스포릴 지질 A, 예를 들어, 3-데-O-아실화 모노포스포릴 지질 A(3D-MPL), 또는 뮤라밀 펩티드), 합성 애쥬번트(예를 들어, 비-이온성 블록 공중합체, 뮤라밀 펩티드 유사체, 또는 합성 지질 A), 합성 폴리뉴클레오티드 애쥬번트(예를 들어, 폴리아르기닌 또는 폴리리신) 및 메틸화되지 않은 CpG 디뉴클레오티드("CpG")를 함유하는 면역자극성 올리고뉴클레오티드로 구성된 목록으로부터 선택되는 애쥬번트를 포함하는 조성물.
- 제34항에 있어서, 애쥬번트가 3D-MPL 및/또는 QS21인 조성물.
- 제1항 및 제4항 내지 제16항 중 어느 한 항에 있어서, 재조합 벡터가 이종성 단백질을 인코딩하는 핵산 서열을 포함하고, 상기 핵산 서열이 숙주 세포에서 상기 이종성 단백질의 발현을 유도하는 하나 이상의 서열에 작동 가능하게 연결되는 재조합 벡터.
- 제29항에 있어서, 이종성 단백질이 호흡기 세포 융합 바이러스(RSV)의 융합 단백질(F), 부착 단백질(G), 기질 단백질(M2) 및 핵단백질(N)로부터 선택되는 재조합 벡터.
- 제29항에 있어서, 이종성 단백질을 인코딩하는 핵산 서열이 RSV FΔTM 항원, RSV M2-1 항원 및 N 항원을 인코딩하는 재조합 벡터.
- 제31항에 있어서, 이종성 단백질을 인코딩하는 핵산 서열이 SEQ ID NO: 37에 따른 서열을 인코딩하는 재조합 벡터.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 약제로서 사용하기 위한 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제33항에 있어서, 호흡기 세포 융합 바이러스(RSV) 감염의 치료 또는 예방에 사용하기 위한 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 제33항에 있어서, 백신으로 사용하기 위한 재조합 벡터, 재조합 아데노바이러스 또는 조성물.
- 질병의 치료 또는 예방을 위한 제1항 내지 제32항 중 어느 한 항에 따른 재조합 벡터, 재조합 아데노바이러스 또는 조성물의 용도.
- 제36항에 있어서, 질병이 RSV 감염에 의한 것인 재조합 벡터, 재조합 아데노바이러스 또는 조성물의 용도.
- 질병의 치료 또는 예방을 위한 약제의 제조에서의 제1항 내지 제32 중 어느 한 항에 따른 재조합 벡터, 재조합 아데노바이러스 또는 조성물의 용도.
- 제38항에 있어서, 질병이 RSV 감염에 의한 것인 약제의 제조에서의 재조합 벡터, 재조합 아데노바이러스 또는 조성물의 용도.
- 제1항 내지 제32항 중 어느 한 항에 따른 재조합 벡터, 재조합 아데노바이러스 또는 조성물을 대상체에 투여하는 단계를 포함하는 대상체에서 면역 반응을 유도하는 방법.
- 제40항에 있어서, 면역 반응이 호흡기 세포 융합 바이러스(RSV)에 대해 유도되는 방법.
- SEQ ID NO: 11에 따른 서열을 포함하거나 이로 구성되는 단리된 폴리뉴클레오티드.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB1510357.5A GB201510357D0 (en) | 2015-06-12 | 2015-06-12 | Adenovirus polynucleotides and polypeptides |
GB1510357.5 | 2015-06-12 | ||
PCT/EP2015/063248 WO2015189425A1 (en) | 2014-06-13 | 2015-06-12 | Immunogenic combinations |
EPPCT/EP2015/063248 | 2015-06-12 | ||
GB1514772.1 | 2015-08-19 | ||
GBGB1514772.1A GB201514772D0 (en) | 2015-08-19 | 2015-08-19 | Adenovirus polynucleotides and polypeptides |
PCT/EP2016/063297 WO2016198599A1 (en) | 2015-06-12 | 2016-06-10 | Adenovirus polynucleotides and polypeptides |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180012857A true KR20180012857A (ko) | 2018-02-06 |
Family
ID=57503533
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177037436A KR102535670B1 (ko) | 2015-06-12 | 2016-06-10 | 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드 |
KR1020187000991A KR20180012857A (ko) | 2015-06-12 | 2016-06-10 | 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177037436A KR102535670B1 (ko) | 2015-06-12 | 2016-06-10 | 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드 |
Country Status (13)
Country | Link |
---|---|
US (4) | US11254710B2 (ko) |
EP (2) | EP3307314A1 (ko) |
JP (2) | JP6983665B2 (ko) |
KR (2) | KR102535670B1 (ko) |
CN (2) | CN108025058B (ko) |
AU (4) | AU2016275619B2 (ko) |
BE (1) | BE1024420B1 (ko) |
BR (1) | BR112017026523A2 (ko) |
CA (2) | CA2988481A1 (ko) |
EA (1) | EA038402B9 (ko) |
IL (2) | IL256069B2 (ko) |
MX (2) | MX2017016101A (ko) |
WO (2) | WO2016198599A1 (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6983665B2 (ja) | 2015-06-12 | 2021-12-17 | グラクソスミスクライン バイオロジカルズ ソシエテ アノニム | アデノウイルスポリヌクレオチド及びポリペプチド |
GB201513176D0 (en) | 2015-07-27 | 2015-09-09 | Glaxosmithkline Biolog Sa | Novel methods for inducing an immune response |
CN110036020A (zh) * | 2016-12-09 | 2019-07-19 | 葛兰素史密丝克莱恩生物有限公司 | 具有狂犬病病毒抗原的黑猩猩腺病毒构建体 |
GB201620968D0 (en) | 2016-12-09 | 2017-01-25 | Glaxosmithkline Biologicals Sa | Adenovirus polynucleotides and polypeptides |
WO2019016756A1 (en) | 2017-07-21 | 2019-01-24 | Glaxosmithkline Biologicals Sa | ANTIGEN CONSTRUCTS OF CHIKUNGUNYA VIRUSES |
SG11202003058UA (en) | 2017-10-16 | 2020-04-29 | Glaxosmithkline Biologicals Sa | Replication competent adenoviral vectors |
MX2020003746A (es) | 2017-10-16 | 2020-11-06 | Glaxosmithkline Biologicals Sa | Vectores adenovirales con dos casetes de expresion. |
EP3697902A1 (en) | 2017-10-16 | 2020-08-26 | GlaxoSmithKline Biologicals S.A. | Enhanced promoter |
CA3079048A1 (en) | 2017-10-16 | 2019-04-25 | Glaxosmithkline Biologicals Sa | Adenoviral vectors with two expression cassettes encoding rsv antigenic proteins or fragments thereof |
CA3078685A1 (en) * | 2017-10-31 | 2019-05-09 | Janssen Vaccines & Prevention B.V. | Adenovirus and uses thereof |
GB201721068D0 (en) | 2017-12-15 | 2018-01-31 | Glaxosmithkline Biologicals Sa | Hepatitis B immunisation regimen and compositions |
GB201721069D0 (en) | 2017-12-15 | 2018-01-31 | Glaxosmithkline Biologicals Sa | Hepatitis B Immunisation regimen and compositions |
MX2020006225A (es) | 2017-12-20 | 2020-12-07 | Glaxosmithkline Biologicals Sa | Constructos antigenicos del virus de epstein-barr. |
MX2020013553A (es) * | 2018-06-12 | 2021-02-26 | Glaxosmithkline Biologicals Sa | Polinucleotidos y polipeptidos de adenovirus. |
SG11202012710WA (en) * | 2018-06-25 | 2021-01-28 | Akouos Inc | Methods of treating clrn1-associated hearing loss and/or vision loss |
EP3587581A1 (en) | 2018-06-26 | 2020-01-01 | GlaxoSmithKline Biologicals S.A. | Formulations for simian adenoviral vectors having enhanced storage stability |
US11713469B2 (en) * | 2018-07-20 | 2023-08-01 | Janssen Vaccines & Prevention B.V. | Recombinant adenoviral vector expressing Zika antigen with improved productivity |
CN112601545A (zh) | 2018-08-07 | 2021-04-02 | 葛兰素史密丝克莱恩生物有限公司 | 工艺和疫苗 |
US20220184158A1 (en) | 2018-12-21 | 2022-06-16 | Glaxosmithkline Biologicals Sa | Methods of inducing an immune response |
WO2020178359A1 (en) | 2019-03-05 | 2020-09-10 | Glaxosmithkline Biologicals Sa | Hepatitis b immunisation regimen and compositions |
EP4150344A1 (en) | 2020-05-14 | 2023-03-22 | GlaxoSmithKline Biologicals SA | Viral biosensors |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8919102D0 (en) * | 1989-08-22 | 1989-10-04 | Oxford Virology Ltd | A recombinant adenovirus dna sequence,a recombinant adenovirus expressing the dna sequence and a rhabdovirus vaccine including the recombinant adenovirus |
US20040241181A1 (en) | 2001-06-22 | 2004-12-02 | Ertl Hildeghund C. J. | Methods of inducing a cytotoxic immune response and recormbinant simian adenovirus compositions useful therein |
MXPA04004876A (es) * | 2001-11-21 | 2004-07-30 | Univ Pennsylvania | Secuencias de acido nucleico y de aminoacido de adenovirus de simio, vectores que contienen los mismos y metodos de uso. |
US7030094B2 (en) | 2002-02-04 | 2006-04-18 | Corixa Corporation | Immunostimulant compositions comprising an aminoalkyl glucosaminide phosphate and QS-21 |
US7960522B2 (en) | 2003-01-06 | 2011-06-14 | Corixa Corporation | Certain aminoalkyl glucosaminide phosphate compounds and their use |
US7205342B2 (en) * | 2003-10-10 | 2007-04-17 | General Electric Company | Poly(arylene ether) composition and method of molding |
ES2337374T3 (es) * | 2004-01-23 | 2010-04-23 | Istituto Di Richerche Di Biologia Molecolare P. Angeletti S.P.A. | Portadores de vacunas de adenovirus de chimpance. |
ES2647491T3 (es) | 2004-05-21 | 2017-12-21 | Novartis Vaccines And Diagnostics, Inc. | Vectores del alfavirus para las vacunas del virus de la gripe |
WO2006053871A2 (en) * | 2004-11-16 | 2006-05-26 | Crucell Holland B.V. | Multivalent vaccines comprising recombinant viral vectors |
EP1880012B1 (en) * | 2005-05-12 | 2015-07-08 | Glaxo Group Limited | Vaccine composition |
EP2570423B1 (en) * | 2005-06-17 | 2023-05-03 | MSD Italia S.r.l. | Hepatitis C virus nucleic acid vaccine |
CN101675068A (zh) | 2007-03-02 | 2010-03-17 | 葛兰素史密丝克莱恩生物有限公司 | 新的方法和组合物 |
GB0706914D0 (en) * | 2007-04-10 | 2007-05-16 | Isis Innovation | Novel adenovirus vectors |
MX2010005858A (es) * | 2007-11-28 | 2010-06-11 | Univ Pennsylvania | Adenovirus e simianos sadv-39, sadv-25.2, sadv-26, sadv-30, sadv-37 y sadv-38. |
US8231880B2 (en) | 2007-11-28 | 2012-07-31 | The Trustess Of The University Of Pennsylvania | Simian subfamily C adenoviruses SAdV-40, -31, and -34 and uses thereof |
LT2220242T (lt) * | 2007-11-28 | 2017-04-10 | The Trustees Of The University Of Pennsylvania | Simian pošeimio b adenovirusai sadv-28,27,-29,-32,-33 ir -35 ir jų panaudojimas |
US8470310B2 (en) | 2008-03-04 | 2013-06-25 | The Trustees Of The University Of Pennsylvania | Simian adenoviruses SAdV-36, -42.1, -42.2, and -44 and uses thereof |
CA2726914A1 (en) * | 2008-06-03 | 2009-12-10 | Okairos Ag | A vaccine for the prevention and therapy of hcv infections |
WO2010085984A1 (en) * | 2009-02-02 | 2010-08-05 | Okairos Ag | Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof |
CN102300872A (zh) | 2009-02-02 | 2011-12-28 | 奥凯罗斯股份公司 | 猿腺病毒核酸和氨基酸序列,包含其的载体及其用途 |
US8846031B2 (en) * | 2009-05-29 | 2014-09-30 | The Trustees Of The University Of Pennsylvania | Simian adenovirus 41 and uses thereof |
KR20120052369A (ko) * | 2009-07-31 | 2012-05-23 | 팍스박스, 인코포레이티드 | 아데노바이러스계 벡터 |
EP3466440A1 (en) * | 2010-04-16 | 2019-04-10 | The Government of the United States of America as represented by the Secretary of the Department of Health and Human Services | Chimpanzee adenoviral vector-based filovirus vaccines |
US20110293701A1 (en) | 2010-05-26 | 2011-12-01 | Selecta Biosciences, Inc. | Multivalent synthetic nanocarrier vaccines |
GB201016471D0 (en) * | 2010-09-30 | 2010-11-17 | Isis Innovation | Viral vector immunogenic compositions |
US20120328605A1 (en) | 2010-10-27 | 2012-12-27 | Daniel Larocque | Compositions and uses |
WO2012089231A1 (en) | 2010-12-30 | 2012-07-05 | Okairòs Ag | Paramyxovirus vaccines |
GB201108879D0 (en) * | 2011-05-25 | 2011-07-06 | Isis Innovation | Vector |
CA2841047A1 (en) * | 2011-07-06 | 2013-01-10 | Novartis Ag | Immunogenic compositions and uses thereof |
FR2978457A1 (fr) * | 2011-07-27 | 2013-02-01 | Univ Paris Diderot Paris 7 | Composes contenant un vecteur viral a specificite hepatique et presentant une activite anti-inflammatoire |
US9233153B2 (en) * | 2011-10-05 | 2016-01-12 | Genvec, Inc. | Affenadenovirus (gorilla) or adenoviral vectors and methods of use |
CN103239734B (zh) | 2012-02-10 | 2016-02-24 | 北京艾棣维欣生物技术有限公司 | 用于预防和/或治疗呼吸道合胞病毒感染的疫苗 |
AU2013237424B2 (en) | 2012-03-22 | 2017-07-06 | Janssen Vaccines & Prevention B.V. | Vaccine against RSV |
AU2013298915B2 (en) | 2012-08-01 | 2018-03-01 | Bavarian Nordic A/S | Recombinant modified vaccinia virus Ankara (MVA) Respiratory Syncytial Virus (RSV) vaccine |
BR112015011389A2 (pt) * | 2012-11-20 | 2017-08-22 | Glaxosmithkline Biologicals Sa | Complexo f do vírus sincicial respiratório, métodos para produzir um complexo f do vírus sincicial respiratório e para indução de uma resposta imunológica a um f de rsv em um indivíduo, e, composição imunogênica |
DE102012221236A1 (de) | 2012-11-21 | 2014-05-22 | Zf Friedrichshafen Ag | Getriebe |
GB201303406D0 (en) * | 2013-02-26 | 2013-04-10 | Health Prot Agency | Crimean-Congo Haemorrhagic Fever Virus Antigenic Composition |
BR112015025709A2 (pt) | 2013-04-18 | 2017-07-18 | Immune Design Corp | monoterapia com gla para uso em tratamento de câncer |
CN103923943B (zh) * | 2013-08-19 | 2019-01-22 | 中国科学院上海巴斯德研究所 | 一种基于腺病毒AdC7的表达载体及其构建方法 |
CN103937835A (zh) * | 2013-08-19 | 2014-07-23 | 中国科学院上海巴斯德研究所 | 一种基于腺病毒AdC68的表达载体及其构建方法 |
GB201318084D0 (en) * | 2013-10-11 | 2013-11-27 | Isis Innovation | Malaria vaccination |
JP6664338B2 (ja) | 2014-06-13 | 2020-03-13 | グラクソスミスクライン バイオロジカルズ ソシエテ アノニム | 免疫原性組合せ物 |
JP6983665B2 (ja) | 2015-06-12 | 2021-12-17 | グラクソスミスクライン バイオロジカルズ ソシエテ アノニム | アデノウイルスポリヌクレオチド及びポリペプチド |
-
2016
- 2016-06-10 JP JP2017564424A patent/JP6983665B2/ja active Active
- 2016-06-10 CN CN201680047775.1A patent/CN108025058B/zh active Active
- 2016-06-10 KR KR1020177037436A patent/KR102535670B1/ko active IP Right Grant
- 2016-06-10 US US15/735,839 patent/US11254710B2/en active Active
- 2016-06-10 CA CA2988481A patent/CA2988481A1/en active Pending
- 2016-06-10 US US15/735,872 patent/US11254711B2/en active Active
- 2016-06-10 KR KR1020187000991A patent/KR20180012857A/ko not_active Application Discontinuation
- 2016-06-10 WO PCT/EP2016/063297 patent/WO2016198599A1/en active Application Filing
- 2016-06-10 EP EP16730773.5A patent/EP3307314A1/en not_active Withdrawn
- 2016-06-10 EA EA201792651A patent/EA038402B9/ru unknown
- 2016-06-10 MX MX2017016101A patent/MX2017016101A/es unknown
- 2016-06-10 AU AU2016275619A patent/AU2016275619B2/en active Active
- 2016-06-10 AU AU2016275601A patent/AU2016275601A1/en not_active Abandoned
- 2016-06-10 JP JP2017564467A patent/JP6873054B2/ja active Active
- 2016-06-10 CN CN201680047373.1A patent/CN107921118B/zh active Active
- 2016-06-10 EP EP16730315.5A patent/EP3307313A1/en active Pending
- 2016-06-10 CA CA2988654A patent/CA2988654A1/en active Pending
- 2016-06-10 BR BR112017026523A patent/BR112017026523A2/pt not_active IP Right Cessation
- 2016-06-10 MX MX2017016105A patent/MX2017016105A/es unknown
- 2016-06-10 BE BE2016/5434A patent/BE1024420B1/fr active IP Right Grant
- 2016-06-10 WO PCT/EP2016/063329 patent/WO2016198621A1/en active Application Filing
-
2017
- 2017-12-03 IL IL256069A patent/IL256069B2/en unknown
- 2017-12-05 IL IL256121A patent/IL256121B2/en unknown
-
2019
- 2019-03-26 AU AU2019202081A patent/AU2019202081B2/en active Active
- 2019-11-27 AU AU2019271972A patent/AU2019271972B2/en active Active
-
2021
- 2021-12-30 US US17/565,796 patent/US20220204566A1/en active Pending
-
2022
- 2022-01-25 US US17/583,511 patent/US20220220157A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019271972B2 (en) | Adenovirus polynucleotides and polypeptides | |
BE1023916B1 (fr) | Nouvel adenovirus | |
KR101761425B1 (ko) | 시미안 아데노바이러스 핵산- 및 아미노산-서열, 이를 포함하는 벡터 및 이의 용도 | |
RU2762854C2 (ru) | Последовательности нуклеиновых кислот и аминокислотные последовательности аденовирусов человекообразных обезьян, исключая человека, содержащие их векторы, и их применения | |
KR102205908B1 (ko) | 아데노바이러스 벡터 | |
RU2731342C9 (ru) | Фармацевтическое средство и способ его использования для индукции специфического иммунитета против вируса тяжелого острого респираторного синдрома SARS-CoV-2 (варианты) | |
KR102608590B1 (ko) | 종양 살상 바이러스 및 이의 사용방법 | |
KR101668163B1 (ko) | Cmv용 백신으로서의 조건부 복제 시토메갈로바이러스 | |
KR102471633B1 (ko) | 바이러스 동역학에 미치는 영향 최소화를 위한 치료용 아데노바이러스의 외인성 유전자 발현 | |
JP2024073576A (ja) | 改変アデノウイルス | |
KR101996427B1 (ko) | 외인성 항원을 포함하는 인간 시토메갈로바이러스 | |
KR20190092471A (ko) | 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드 | |
CN107937440A (zh) | 猴腺病毒(大猩猩)或腺病毒载体及其使用方法 | |
KR20200066349A (ko) | 복제 가능 아데노바이러스 벡터 | |
JP2023145678A (ja) | エプスタインバールウイルス抗原構築物 | |
CN116940589A (zh) | 重组sars-cov-2疫苗 | |
KR20200083540A (ko) | 시토메갈로바이러스의 안정한 제형 | |
KR20230031929A (ko) | 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도 | |
CN116323955A (zh) | 通过crispr/cas介导的体内末端解析拯救重组腺病毒 | |
RU2800361C2 (ru) | Стабильные составы цитомегаловируса | |
NL2023464B1 (en) | Oncolytic Non-human adenoviruses and uses thereof | |
DK2391638T3 (en) | Abeadenovirus nucleic acid and amino acid sequences, vectors containing them, and uses thereof. | |
KR20230146436A (ko) | 집단의 재접종을 위한 중증 급성 호흡기 증후군 바이러스 sars-cov-2에 대한 특이 면역의 유도를 위한 제제(변형체)의 용도 | |
KR20230092820A (ko) | Sars-cov-2에 대한 특이적 면역을 유도하기 위한 약제학적 제제 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |