KR20220070075A - 아데노-관련 바이러스 변이체 캡시드 및 그 용도 - Google Patents
아데노-관련 바이러스 변이체 캡시드 및 그 용도 Download PDFInfo
- Publication number
- KR20220070075A KR20220070075A KR1020227017132A KR20227017132A KR20220070075A KR 20220070075 A KR20220070075 A KR 20220070075A KR 1020227017132 A KR1020227017132 A KR 1020227017132A KR 20227017132 A KR20227017132 A KR 20227017132A KR 20220070075 A KR20220070075 A KR 20220070075A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- aav
- amino acid
- acid sequence
- variant
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 107
- 241000702421 Dependoparvovirus Species 0.000 title claims abstract description 42
- 210000000234 capsid Anatomy 0.000 title claims description 289
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 420
- 108090000565 Capsid Proteins Proteins 0.000 claims abstract description 266
- 102100023321 Ceruloplasmin Human genes 0.000 claims abstract description 266
- 210000002845 virion Anatomy 0.000 claims abstract description 142
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 63
- 210000000663 muscle cell Anatomy 0.000 claims abstract description 60
- 230000001965 increasing effect Effects 0.000 claims abstract description 29
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 15
- 150000001413 amino acids Chemical class 0.000 claims description 271
- 238000006467 substitution reaction Methods 0.000 claims description 194
- 108090000623 proteins and genes Proteins 0.000 claims description 190
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 174
- 238000003780 insertion Methods 0.000 claims description 126
- 230000037431 insertion Effects 0.000 claims description 126
- 241000700605 Viruses Species 0.000 claims description 58
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 54
- 102000039446 nucleic acids Human genes 0.000 claims description 52
- 108020004707 nucleic acids Proteins 0.000 claims description 52
- 210000004413 cardiac myocyte Anatomy 0.000 claims description 51
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 50
- 102000004169 proteins and genes Human genes 0.000 claims description 50
- 125000003729 nucleotide group Chemical group 0.000 claims description 49
- 239000002773 nucleotide Substances 0.000 claims description 46
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 45
- 208000015181 infectious disease Diseases 0.000 claims description 42
- 210000003205 muscle Anatomy 0.000 claims description 37
- 230000002458 infectious effect Effects 0.000 claims description 29
- 239000004055 small Interfering RNA Substances 0.000 claims description 27
- 230000000747 cardiac effect Effects 0.000 claims description 26
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 21
- 241000958487 Adeno-associated virus 3B Species 0.000 claims description 20
- 108020004459 Small interfering RNA Proteins 0.000 claims description 18
- 210000002363 skeletal muscle cell Anatomy 0.000 claims description 18
- 238000010253 intravenous injection Methods 0.000 claims description 14
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 12
- -1 spacer amino acids Chemical class 0.000 claims description 11
- 108020005544 Antisense RNA Proteins 0.000 claims description 10
- 239000003184 complementary RNA Substances 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 10
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 9
- 239000000872 buffer Substances 0.000 claims description 8
- 239000003085 diluting agent Substances 0.000 claims description 8
- 239000003937 drug carrier Substances 0.000 claims description 8
- 238000010255 intramuscular injection Methods 0.000 claims description 8
- 239000007927 intramuscular injection Substances 0.000 claims description 8
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 7
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 claims description 7
- 230000003472 neutralizing effect Effects 0.000 claims description 7
- 239000002253 acid Substances 0.000 claims description 6
- 102100024108 Dystrophin Human genes 0.000 claims description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 5
- 108010069091 Dystrophin Proteins 0.000 claims description 4
- 208000024720 Fabry Disease Diseases 0.000 claims description 4
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 claims description 4
- 206010053185 Glycogen storage disease type II Diseases 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 239000012634 fragment Substances 0.000 claims description 4
- 201000004502 glycogen storage disease II Diseases 0.000 claims description 4
- 239000002679 microRNA Substances 0.000 claims description 4
- 238000006386 neutralization reaction Methods 0.000 claims description 4
- 208000024412 Friedreich ataxia Diseases 0.000 claims description 3
- 102000005840 alpha-Galactosidase Human genes 0.000 claims description 3
- 108010030291 alpha-Galactosidase Proteins 0.000 claims description 3
- 108010028144 alpha-Glucosidases Proteins 0.000 claims description 3
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 2
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 2
- 102000007390 Glycogen Phosphorylase Human genes 0.000 claims description 2
- 108010046163 Glycogen Phosphorylase Proteins 0.000 claims description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 2
- 102000003869 Frataxin Human genes 0.000 claims 2
- 108090000217 Frataxin Proteins 0.000 claims 2
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims 1
- 241000425548 Adeno-associated virus 3A Species 0.000 claims 1
- 102000002464 Galactosidases Human genes 0.000 claims 1
- 108010093031 Galactosidases Proteins 0.000 claims 1
- 108091070501 miRNA Proteins 0.000 claims 1
- 208000029578 Muscle disease Diseases 0.000 abstract description 21
- 230000004048 modification Effects 0.000 abstract description 15
- 238000012986 modification Methods 0.000 abstract description 15
- 238000011160 research Methods 0.000 abstract description 4
- 208000021642 Muscular disease Diseases 0.000 abstract description 2
- 235000001014 amino acid Nutrition 0.000 description 377
- 229940024606 amino acid Drugs 0.000 description 261
- 210000004027 cell Anatomy 0.000 description 173
- 239000000047 product Substances 0.000 description 71
- 239000005090 green fluorescent protein Substances 0.000 description 54
- 241000282414 Homo sapiens Species 0.000 description 51
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 50
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 50
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 46
- 201000010099 disease Diseases 0.000 description 45
- 235000018102 proteins Nutrition 0.000 description 43
- 230000003612 virological effect Effects 0.000 description 40
- 102000040430 polynucleotide Human genes 0.000 description 36
- 108091033319 polynucleotide Proteins 0.000 description 36
- 239000002157 polynucleotide Substances 0.000 description 36
- 238000010361 transduction Methods 0.000 description 36
- 230000026683 transduction Effects 0.000 description 36
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 35
- 230000014509 gene expression Effects 0.000 description 35
- 210000002027 skeletal muscle Anatomy 0.000 description 31
- 210000001519 tissue Anatomy 0.000 description 30
- 238000001727 in vivo Methods 0.000 description 29
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 28
- 108700019146 Transgenes Proteins 0.000 description 27
- 229920001184 polypeptide Polymers 0.000 description 26
- 102000004196 processed proteins & peptides Human genes 0.000 description 26
- 230000006870 function Effects 0.000 description 25
- 239000013598 vector Substances 0.000 description 25
- 108020004414 DNA Proteins 0.000 description 24
- 238000001990 intravenous administration Methods 0.000 description 23
- 229960000310 isoleucine Drugs 0.000 description 23
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 23
- 108091033409 CRISPR Proteins 0.000 description 22
- 238000000338 in vitro Methods 0.000 description 22
- 239000002245 particle Substances 0.000 description 22
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 21
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 19
- 241000288906 Primates Species 0.000 description 18
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 17
- 210000004165 myocardium Anatomy 0.000 description 17
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 16
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 16
- 108700026244 Open Reading Frames Proteins 0.000 description 16
- 210000001087 myotubule Anatomy 0.000 description 16
- 230000010076 replication Effects 0.000 description 16
- 230000002950 deficient Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 230000035772 mutation Effects 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 239000003795 chemical substances by application Substances 0.000 description 13
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 12
- 230000002452 interceptive effect Effects 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 12
- 238000004113 cell culture Methods 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- 108700028369 Alleles Proteins 0.000 description 10
- 238000010354 CRISPR gene editing Methods 0.000 description 10
- 101150044789 Cap gene Proteins 0.000 description 10
- 230000006872 improvement Effects 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 230000002438 mitochondrial effect Effects 0.000 description 10
- 238000004806 packaging method and process Methods 0.000 description 10
- 208000024891 symptom Diseases 0.000 description 10
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 9
- 101710163270 Nuclease Proteins 0.000 description 9
- 108020004566 Transfer RNA Proteins 0.000 description 9
- 230000007812 deficiency Effects 0.000 description 9
- 210000001671 embryonic stem cell Anatomy 0.000 description 9
- 210000002216 heart Anatomy 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 239000013608 rAAV vector Substances 0.000 description 9
- 210000000130 stem cell Anatomy 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- 239000004474 valine Substances 0.000 description 9
- 230000002861 ventricular Effects 0.000 description 9
- 108010042407 Endonucleases Proteins 0.000 description 8
- 108020005004 Guide RNA Proteins 0.000 description 8
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 8
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 8
- 108060001084 Luciferase Proteins 0.000 description 8
- 239000005089 Luciferase Substances 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 238000001476 gene delivery Methods 0.000 description 8
- 238000001415 gene therapy Methods 0.000 description 8
- 210000005003 heart tissue Anatomy 0.000 description 8
- 238000010569 immunofluorescence imaging Methods 0.000 description 8
- 102220041803 rs587780753 Human genes 0.000 description 8
- 208000011580 syndromic disease Diseases 0.000 description 8
- 206010010356 Congenital anomaly Diseases 0.000 description 7
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 7
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 239000000556 agonist Substances 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 238000012512 characterization method Methods 0.000 description 7
- 238000000684 flow cytometry Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 210000003098 myoblast Anatomy 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 230000002207 retinal effect Effects 0.000 description 7
- 241000701161 unidentified adenovirus Species 0.000 description 7
- 108010085238 Actins Proteins 0.000 description 6
- 102000007469 Actins Human genes 0.000 description 6
- 241000701022 Cytomegalovirus Species 0.000 description 6
- 230000007018 DNA scission Effects 0.000 description 6
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 6
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 238000010166 immunofluorescence Methods 0.000 description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000004220 muscle function Effects 0.000 description 6
- 238000011002 quantification Methods 0.000 description 6
- 102000005962 receptors Human genes 0.000 description 6
- 108020003175 receptors Proteins 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 239000013607 AAV vector Substances 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- 108010083379 Sarcoglycans Proteins 0.000 description 5
- 102000006308 Sarcoglycans Human genes 0.000 description 5
- 101710172711 Structural protein Proteins 0.000 description 5
- 102000004987 Troponin T Human genes 0.000 description 5
- 108090001108 Troponin T Proteins 0.000 description 5
- 235000004279 alanine Nutrition 0.000 description 5
- 230000001772 anti-angiogenic effect Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 239000000090 biomarker Substances 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 210000001778 pluripotent stem cell Anatomy 0.000 description 5
- 229910052700 potassium Inorganic materials 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 230000009885 systemic effect Effects 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 4
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- 102100029492 Glycogen phosphorylase, muscle form Human genes 0.000 description 4
- 206010019280 Heart failures Diseases 0.000 description 4
- 101000700475 Homo sapiens Glycogen phosphorylase, muscle form Proteins 0.000 description 4
- 101000693993 Homo sapiens Sodium channel protein type 4 subunit alpha Proteins 0.000 description 4
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 4
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 102100038319 Myosin-6 Human genes 0.000 description 4
- 101710204027 Myosin-6 Proteins 0.000 description 4
- 102100038934 Myosin-7 Human genes 0.000 description 4
- 101710204029 Myosin-7 Proteins 0.000 description 4
- 108010052185 Myotonin-Protein Kinase Proteins 0.000 description 4
- 102100022437 Myotonin-protein kinase Human genes 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- 102100037385 Phosphoglycerate mutase 2 Human genes 0.000 description 4
- 101710093483 Phosphoglycerate mutase 2 Proteins 0.000 description 4
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 4
- 102000019027 Ryanodine Receptor Calcium Release Channel Human genes 0.000 description 4
- 108010012219 Ryanodine Receptor Calcium Release Channel Proteins 0.000 description 4
- 102100027195 Sodium channel protein type 4 subunit alpha Human genes 0.000 description 4
- 238000010459 TALEN Methods 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 239000004473 Threonine Substances 0.000 description 4
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 4
- 102000013534 Troponin C Human genes 0.000 description 4
- 108010053096 Vascular Endothelial Growth Factor Receptor-1 Proteins 0.000 description 4
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 4
- 102100033178 Vascular endothelial growth factor receptor 1 Human genes 0.000 description 4
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 235000009582 asparagine Nutrition 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 4
- 239000012636 effector Substances 0.000 description 4
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 4
- 210000002950 fibroblast Anatomy 0.000 description 4
- 230000005021 gait Effects 0.000 description 4
- 230000009368 gene silencing by RNA Effects 0.000 description 4
- 235000013922 glutamic acid Nutrition 0.000 description 4
- 239000004220 glutamic acid Substances 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 230000001023 pro-angiogenic effect Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000010186 staining Methods 0.000 description 4
- 239000013603 viral vector Substances 0.000 description 4
- 230000001018 virulence Effects 0.000 description 4
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 3
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 3
- 102100026189 Beta-galactosidase Human genes 0.000 description 3
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 3
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 108091079001 CRISPR RNA Proteins 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 108091006146 Channels Proteins 0.000 description 3
- 102100031519 Collagen alpha-1(VI) chain Human genes 0.000 description 3
- 102100031518 Collagen alpha-2(VI) chain Human genes 0.000 description 3
- 102100024338 Collagen alpha-3(VI) chain Human genes 0.000 description 3
- 102000001039 Dystrophin Human genes 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 102100031509 Fibrillin-1 Human genes 0.000 description 3
- 108010030229 Fibrillin-1 Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 102100029481 Glycogen phosphorylase, liver form Human genes 0.000 description 3
- 229920002683 Glycosaminoglycan Polymers 0.000 description 3
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 3
- 101000941581 Homo sapiens Collagen alpha-1(VI) chain Proteins 0.000 description 3
- 101000941585 Homo sapiens Collagen alpha-2(VI) chain Proteins 0.000 description 3
- 101000909506 Homo sapiens Collagen alpha-3(VI) chain Proteins 0.000 description 3
- 101000700616 Homo sapiens Glycogen phosphorylase, liver form Proteins 0.000 description 3
- 102000004627 Iduronidase Human genes 0.000 description 3
- 108010003381 Iduronidase Proteins 0.000 description 3
- 108090001061 Insulin Proteins 0.000 description 3
- 102000004877 Insulin Human genes 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- 241000282567 Macaca fascicularis Species 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- 208000008955 Mucolipidoses Diseases 0.000 description 3
- 102000008934 Muscle Proteins Human genes 0.000 description 3
- 108010074084 Muscle Proteins Proteins 0.000 description 3
- 102100030971 Myosin light chain 3 Human genes 0.000 description 3
- 101710193416 Myosin light chain 3 Proteins 0.000 description 3
- 101710101143 Myosin light polypeptide 6 Proteins 0.000 description 3
- 208000002537 Neuronal Ceroid-Lipofuscinoses Diseases 0.000 description 3
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 102100023105 Sialin Human genes 0.000 description 3
- 101710105284 Sialin Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 102100038413 UDP-N-acetylglucosamine-dolichyl-phosphate N-acetylglucosaminephosphotransferase Human genes 0.000 description 3
- 108010024501 UDPacetylglucosamine-dolichyl-phosphate acetylglucosamine-1-phosphate transferase Proteins 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 239000003114 blood coagulation factor Substances 0.000 description 3
- 210000001054 cardiac fibroblast Anatomy 0.000 description 3
- 230000035605 chemotaxis Effects 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 238000003197 gene knockdown Methods 0.000 description 3
- 230000030279 gene silencing Effects 0.000 description 3
- 230000004077 genetic alteration Effects 0.000 description 3
- 231100000118 genetic alteration Toxicity 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 210000002064 heart cell Anatomy 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 208000014674 injury Diseases 0.000 description 3
- 229940125396 insulin Drugs 0.000 description 3
- 210000005240 left ventricle Anatomy 0.000 description 3
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 201000006938 muscular dystrophy Diseases 0.000 description 3
- 210000000107 myocyte Anatomy 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 239000011591 potassium Substances 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000000861 pro-apoptotic effect Effects 0.000 description 3
- 108020004418 ribosomal RNA Proteins 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 230000029812 viral genome replication Effects 0.000 description 3
- HCHFRAXBELVCGG-JYFOCSDGSA-N (2z,3z)-2,3-bis[(4-methoxyphenyl)methylidene]butanedinitrile Chemical compound C1=CC(OC)=CC=C1\C=C(/C#N)\C(\C#N)=C\C1=CC=C(OC)C=C1 HCHFRAXBELVCGG-JYFOCSDGSA-N 0.000 description 2
- 102100040084 A-kinase anchor protein 9 Human genes 0.000 description 2
- 101710109922 A-kinase anchor protein 9 Proteins 0.000 description 2
- 102100032123 AMP deaminase 1 Human genes 0.000 description 2
- 102000056181 ATP-binding cassette subfamily A member 1 Human genes 0.000 description 2
- 102000000449 ATP-binding cassette subfamily C member 9 Human genes 0.000 description 2
- 108050008988 ATP-binding cassette subfamily C member 9 Proteins 0.000 description 2
- 102100032922 ATP-dependent 6-phosphofructokinase, muscle type Human genes 0.000 description 2
- 102100030913 Acetylcholine receptor subunit alpha Human genes 0.000 description 2
- 102100022725 Acetylcholine receptor subunit beta Human genes 0.000 description 2
- 102100022729 Acetylcholine receptor subunit delta Human genes 0.000 description 2
- 102100024005 Acid ceramidase Human genes 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 2
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 2
- 102100022015 Alpha-1-syntrophin Human genes 0.000 description 2
- 102100031317 Alpha-N-acetylgalactosaminidase Human genes 0.000 description 2
- 102100034561 Alpha-N-acetylglucosaminidase Human genes 0.000 description 2
- 101710106740 Alpha-N-acetylglucosaminidase Proteins 0.000 description 2
- 102100040894 Amylo-alpha-1,6-glucosidase Human genes 0.000 description 2
- 102100032187 Androgen receptor Human genes 0.000 description 2
- 101710168746 Ankyrin repeat and LEM domain-containing protein 1 Proteins 0.000 description 2
- 102100036818 Ankyrin-2 Human genes 0.000 description 2
- 101710191052 Ankyrin-2 Proteins 0.000 description 2
- 200000000007 Arterial disease Diseases 0.000 description 2
- 102100022146 Arylsulfatase A Human genes 0.000 description 2
- 102100031491 Arylsulfatase B Human genes 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 2
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- 108010023546 Aspartylglucosylaminase Proteins 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 102100036597 Basement membrane-specific heparan sulfate proteoglycan core protein Human genes 0.000 description 2
- 102100034732 Beta-1,3-glucuronyltransferase LARGE1 Human genes 0.000 description 2
- 101710093792 Beta-1,3-glucuronyltransferase LARGE1 Proteins 0.000 description 2
- 102100031500 Beta-1,4-glucuronyltransferase 1 Human genes 0.000 description 2
- 102100026031 Beta-glucuronidase Human genes 0.000 description 2
- 102100032487 Beta-mannosidase Human genes 0.000 description 2
- 102100033849 CCHC-type zinc finger nucleic acid binding protein Human genes 0.000 description 2
- 101710116319 CCHC-type zinc finger nucleic acid binding protein Proteins 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 102100025580 Calmodulin-1 Human genes 0.000 description 2
- 101710164735 Calmodulin-1 Proteins 0.000 description 2
- 102100025579 Calmodulin-2 Human genes 0.000 description 2
- 101710164734 Calmodulin-2 Proteins 0.000 description 2
- 102100038613 Calreticulin-3 Human genes 0.000 description 2
- 101710160266 Calreticulin-3 Proteins 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 208000031229 Cardiomyopathies Diseases 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 102100027943 Carnitine O-palmitoyltransferase 1, liver isoform Human genes 0.000 description 2
- 101710120614 Carnitine O-palmitoyltransferase 1, liver isoform Proteins 0.000 description 2
- 102100028918 Catenin alpha-3 Human genes 0.000 description 2
- 102000003904 Caveolin 3 Human genes 0.000 description 2
- 108090000268 Caveolin 3 Proteins 0.000 description 2
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 2
- 102100023457 Chloride channel protein 1 Human genes 0.000 description 2
- 108010058699 Choline O-acetyltransferase Proteins 0.000 description 2
- 102100023460 Choline O-acetyltransferase Human genes 0.000 description 2
- 102100031082 Choline/ethanolamine kinase Human genes 0.000 description 2
- 102000009660 Cholinergic Receptors Human genes 0.000 description 2
- 108010009685 Cholinergic Receptors Proteins 0.000 description 2
- 102100022641 Coagulation factor IX Human genes 0.000 description 2
- 102100033601 Collagen alpha-1(I) chain Human genes 0.000 description 2
- 102100031611 Collagen alpha-1(III) chain Human genes 0.000 description 2
- 102100031457 Collagen alpha-1(V) chain Human genes 0.000 description 2
- 102100036213 Collagen alpha-2(I) chain Human genes 0.000 description 2
- 102100031502 Collagen alpha-2(V) chain Human genes 0.000 description 2
- 208000002330 Congenital Heart Defects Diseases 0.000 description 2
- 108010002947 Connectin Proteins 0.000 description 2
- 102000001045 Connexin 43 Human genes 0.000 description 2
- 108010069241 Connexin 43 Proteins 0.000 description 2
- 102100034976 Cystathionine beta-synthase Human genes 0.000 description 2
- 108010073644 Cystathionine beta-synthase Proteins 0.000 description 2
- 102100031620 Cysteine and glycine-rich protein 3 Human genes 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 102100034690 Delta(14)-sterol reductase LBR Human genes 0.000 description 2
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 description 2
- 102000005707 Desmoglein 2 Human genes 0.000 description 2
- 108010045583 Desmoglein 2 Proteins 0.000 description 2
- 102100038199 Desmoplakin Human genes 0.000 description 2
- 108091000074 Desmoplakin Proteins 0.000 description 2
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 2
- 108010044191 Dynamin II Proteins 0.000 description 2
- 102100021238 Dynamin-2 Human genes 0.000 description 2
- 102100024074 Dystrobrevin alpha Human genes 0.000 description 2
- 102100025682 Dystroglycan 1 Human genes 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 102000003951 Erythropoietin Human genes 0.000 description 2
- 108090000394 Erythropoietin Proteins 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 201000003542 Factor VIII deficiency Diseases 0.000 description 2
- 102100031510 Fibrillin-2 Human genes 0.000 description 2
- 108010030242 Fibrillin-2 Proteins 0.000 description 2
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 2
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 2
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- 102100028072 Fibroblast growth factor 4 Human genes 0.000 description 2
- 108090000381 Fibroblast growth factor 4 Proteins 0.000 description 2
- 102100028875 Formylglycine-generating enzyme Human genes 0.000 description 2
- 102100021237 G protein-activated inward rectifier potassium channel 4 Human genes 0.000 description 2
- 102100023364 Ganglioside GM2 activator Human genes 0.000 description 2
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 2
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- 102100036264 Glucose-6-phosphatase catalytic subunit 1 Human genes 0.000 description 2
- 102100039684 Glucose-6-phosphate exchanger SLC37A4 Human genes 0.000 description 2
- 102000004547 Glucosylceramidase Human genes 0.000 description 2
- 108010017544 Glucosylceramidase Proteins 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 102100039264 Glycogen [starch] synthase, liver Human genes 0.000 description 2
- 102100039262 Glycogen [starch] synthase, muscle Human genes 0.000 description 2
- 208000032000 Glycogen storage disease due to muscle glycogen phosphorylase deficiency Diseases 0.000 description 2
- 206010018462 Glycogen storage disease type V Diseases 0.000 description 2
- 101710141660 Glycogen synthase 1 Proteins 0.000 description 2
- 101710141659 Glycogen synthase 2 Proteins 0.000 description 2
- 102100039939 Growth/differentiation factor 8 Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 208000009292 Hemophilia A Diseases 0.000 description 2
- 102100039991 Heparan-alpha-glucosaminide N-acetyltransferase Human genes 0.000 description 2
- 108030000639 Heparan-alpha-glucosaminide N-acetyltransferases Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 102000016871 Hexosaminidase A Human genes 0.000 description 2
- 108010053317 Hexosaminidase A Proteins 0.000 description 2
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 2
- 108010090007 Homeobox Protein Nkx-2.5 Proteins 0.000 description 2
- 102000012808 Homeobox Protein Nkx-2.5 Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000775844 Homo sapiens AMP deaminase 1 Proteins 0.000 description 2
- 101000730838 Homo sapiens ATP-dependent 6-phosphofructokinase, muscle type Proteins 0.000 description 2
- 101000726895 Homo sapiens Acetylcholine receptor subunit alpha Proteins 0.000 description 2
- 101000678746 Homo sapiens Acetylcholine receptor subunit beta Proteins 0.000 description 2
- 101000678765 Homo sapiens Acetylcholine receptor subunit delta Proteins 0.000 description 2
- 101000893559 Homo sapiens Amylo-alpha-1,6-glucosidase Proteins 0.000 description 2
- 101001016707 Homo sapiens Beta-mannosidase Proteins 0.000 description 2
- 101000906651 Homo sapiens Chloride channel protein 1 Proteins 0.000 description 2
- 101000945357 Homo sapiens Collagen alpha-1(I) chain Proteins 0.000 description 2
- 101000993285 Homo sapiens Collagen alpha-1(III) chain Proteins 0.000 description 2
- 101000941708 Homo sapiens Collagen alpha-1(V) chain Proteins 0.000 description 2
- 101000875067 Homo sapiens Collagen alpha-2(I) chain Proteins 0.000 description 2
- 101000941594 Homo sapiens Collagen alpha-2(V) chain Proteins 0.000 description 2
- 101000614712 Homo sapiens G protein-activated inward rectifier potassium channel 4 Proteins 0.000 description 2
- 101000685969 Homo sapiens Ganglioside GM2 activator Proteins 0.000 description 2
- 101000930910 Homo sapiens Glucose-6-phosphatase catalytic subunit 1 Proteins 0.000 description 2
- 101000886173 Homo sapiens Glucose-6-phosphate exchanger SLC37A4 Proteins 0.000 description 2
- 101000944277 Homo sapiens Inward rectifier potassium channel 2 Proteins 0.000 description 2
- 101001027628 Homo sapiens Kinesin-like protein KIF21A Proteins 0.000 description 2
- 101001023021 Homo sapiens LIM domain-binding protein 3 Proteins 0.000 description 2
- 101000575454 Homo sapiens Major facilitator superfamily domain-containing protein 8 Proteins 0.000 description 2
- 101000584208 Homo sapiens Myosin light chain kinase 2, skeletal/cardiac muscle Proteins 0.000 description 2
- 101000829992 Homo sapiens N-acetylglucosamine-6-sulfatase Proteins 0.000 description 2
- 101000997654 Homo sapiens N-acetylmannosamine kinase Proteins 0.000 description 2
- 101000679245 Homo sapiens Neuronal acetylcholine receptor subunit alpha-10 Proteins 0.000 description 2
- 101000782865 Homo sapiens Neuronal acetylcholine receptor subunit alpha-2 Proteins 0.000 description 2
- 101000745163 Homo sapiens Neuronal acetylcholine receptor subunit alpha-3 Proteins 0.000 description 2
- 101000745167 Homo sapiens Neuronal acetylcholine receptor subunit alpha-4 Proteins 0.000 description 2
- 101000745175 Homo sapiens Neuronal acetylcholine receptor subunit alpha-5 Proteins 0.000 description 2
- 101000822072 Homo sapiens Neuronal acetylcholine receptor subunit alpha-6 Proteins 0.000 description 2
- 101000822103 Homo sapiens Neuronal acetylcholine receptor subunit alpha-7 Proteins 0.000 description 2
- 101000822093 Homo sapiens Neuronal acetylcholine receptor subunit alpha-9 Proteins 0.000 description 2
- 101000726901 Homo sapiens Neuronal acetylcholine receptor subunit beta-2 Proteins 0.000 description 2
- 101000726905 Homo sapiens Neuronal acetylcholine receptor subunit beta-3 Proteins 0.000 description 2
- 101000678747 Homo sapiens Neuronal acetylcholine receptor subunit beta-4 Proteins 0.000 description 2
- 101000601661 Homo sapiens Paired box protein Pax-7 Proteins 0.000 description 2
- 101000801684 Homo sapiens Phospholipid-transporting ATPase ABCA1 Proteins 0.000 description 2
- 101000731078 Homo sapiens Phosphorylase b kinase gamma catalytic chain, liver/testis isoform Proteins 0.000 description 2
- 101000945272 Homo sapiens Phosphorylase b kinase regulatory subunit alpha, liver isoform Proteins 0.000 description 2
- 101000945267 Homo sapiens Phosphorylase b kinase regulatory subunit alpha, skeletal muscle isoform Proteins 0.000 description 2
- 101001137939 Homo sapiens Phosphorylase b kinase regulatory subunit beta Proteins 0.000 description 2
- 101000595923 Homo sapiens Placenta growth factor Proteins 0.000 description 2
- 101000609211 Homo sapiens Polyadenylate-binding protein 2 Proteins 0.000 description 2
- 101001032038 Homo sapiens Potassium/sodium hyperpolarization-activated cyclic nucleotide-gated channel 4 Proteins 0.000 description 2
- 101001003584 Homo sapiens Prelamin-A/C Proteins 0.000 description 2
- 101000845685 Homo sapiens Protein Dok-7 Proteins 0.000 description 2
- 101001094684 Homo sapiens Protein O-mannosyl-transferase 2 Proteins 0.000 description 2
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 2
- 101001041393 Homo sapiens Serine protease HTRA1 Proteins 0.000 description 2
- 101000785063 Homo sapiens Serine-protein kinase ATM Proteins 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- 101001123859 Homo sapiens Sialidase-1 Proteins 0.000 description 2
- 101000694017 Homo sapiens Sodium channel protein type 5 subunit alpha Proteins 0.000 description 2
- 101000694021 Homo sapiens Sodium channel subunit beta-4 Proteins 0.000 description 2
- 101001034303 Homo sapiens Solute carrier family 2, facilitated glucose transporter member 10 Proteins 0.000 description 2
- 101000597193 Homo sapiens Telethonin Proteins 0.000 description 2
- 101000697888 Homo sapiens UDP-GalNAc:beta-1,3-N-acetylgalactosaminyltransferase 2 Proteins 0.000 description 2
- 101000867811 Homo sapiens Voltage-dependent L-type calcium channel subunit alpha-1C Proteins 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 102100028799 Inner nuclear membrane protein Man1 Human genes 0.000 description 2
- 101710087161 Inner nuclear membrane protein Man1 Proteins 0.000 description 2
- 102100033114 Inward rectifier potassium channel 2 Human genes 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- 102100037688 Kinesin-like protein KIF21A Human genes 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- 102100034671 L-lactate dehydrogenase A chain Human genes 0.000 description 2
- 102100024580 L-lactate dehydrogenase B chain Human genes 0.000 description 2
- 102100035112 LIM domain-binding protein 3 Human genes 0.000 description 2
- 108010088350 Lactate Dehydrogenase 5 Proteins 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 208000034800 Leukoencephalopathies Diseases 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 2
- 102100022119 Lipoprotein lipase Human genes 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 208000003221 Lysosomal acid lipase deficiency Diseases 0.000 description 2
- 102100023231 Lysosomal alpha-mannosidase Human genes 0.000 description 2
- 101710135169 Lysosomal alpha-mannosidase Proteins 0.000 description 2
- 108010009491 Lysosomal-Associated Membrane Protein 2 Proteins 0.000 description 2
- 102100038225 Lysosome-associated membrane glycoprotein 2 Human genes 0.000 description 2
- RVRHBLSINNOLPI-UHFFFAOYSA-N Lythridin Natural products COc1ccc(cc1OC)C2CC(CC3CCCCN23)OC(=O)CC(O)c4ccc(O)cc4 RVRHBLSINNOLPI-UHFFFAOYSA-N 0.000 description 2
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 description 2
- 102100025613 Major facilitator superfamily domain-containing protein 8 Human genes 0.000 description 2
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 102000005954 Methylenetetrahydrofolate Reductase (NADPH2) Human genes 0.000 description 2
- 108010030837 Methylenetetrahydrofolate Reductase (NADPH2) Proteins 0.000 description 2
- 102100031545 Microsomal triglyceride transfer protein large subunit Human genes 0.000 description 2
- 108010006519 Molecular Chaperones Proteins 0.000 description 2
- 206010072927 Mucolipidosis type I Diseases 0.000 description 2
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 2
- 102100021970 Myc box-dependent-interacting protein 1 Human genes 0.000 description 2
- 101710146921 Myc box-dependent-interacting protein 1 Proteins 0.000 description 2
- 102100038380 Myogenic factor 5 Human genes 0.000 description 2
- 102100032970 Myogenin Human genes 0.000 description 2
- 108010056785 Myogenin Proteins 0.000 description 2
- 102000005604 Myosin Heavy Chains Human genes 0.000 description 2
- 108010084498 Myosin Heavy Chains Proteins 0.000 description 2
- 102100030788 Myosin light chain kinase 2, skeletal/cardiac muscle Human genes 0.000 description 2
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 2
- 102100036639 Myosin-11 Human genes 0.000 description 2
- 101710115164 Myosin-11 Proteins 0.000 description 2
- 108010056852 Myostatin Proteins 0.000 description 2
- 102100021003 N(4)-(beta-N-acetylglucosaminyl)-L-asparaginase Human genes 0.000 description 2
- 108010027520 N-Acetylgalactosamine-4-Sulfatase Proteins 0.000 description 2
- 102100023282 N-acetylglucosamine-6-sulfatase Human genes 0.000 description 2
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 2
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 2
- 102100033341 N-acetylmannosamine kinase Human genes 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108010006140 N-sulfoglucosamine sulfohydrolase Proteins 0.000 description 2
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 2
- 102000002023 NADH:ubiquinone oxidoreductases Human genes 0.000 description 2
- 108050009313 NADH:ubiquinone oxidoreductases Proteins 0.000 description 2
- 102100034434 Nebulin Human genes 0.000 description 2
- 102100022598 Neuronal acetylcholine receptor subunit alpha-10 Human genes 0.000 description 2
- 102100035585 Neuronal acetylcholine receptor subunit alpha-2 Human genes 0.000 description 2
- 102100039908 Neuronal acetylcholine receptor subunit alpha-3 Human genes 0.000 description 2
- 102100039909 Neuronal acetylcholine receptor subunit alpha-4 Human genes 0.000 description 2
- 102100039907 Neuronal acetylcholine receptor subunit alpha-5 Human genes 0.000 description 2
- 102100021518 Neuronal acetylcholine receptor subunit alpha-6 Human genes 0.000 description 2
- 102100021511 Neuronal acetylcholine receptor subunit alpha-7 Human genes 0.000 description 2
- 102100021520 Neuronal acetylcholine receptor subunit alpha-9 Human genes 0.000 description 2
- 102100030912 Neuronal acetylcholine receptor subunit beta-2 Human genes 0.000 description 2
- 102100030911 Neuronal acetylcholine receptor subunit beta-3 Human genes 0.000 description 2
- 102100022728 Neuronal acetylcholine receptor subunit beta-4 Human genes 0.000 description 2
- 102100031801 Nexilin Human genes 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102100037503 Paired box protein Pax-7 Human genes 0.000 description 2
- 102100031686 Paired mesoderm homeobox protein 2A Human genes 0.000 description 2
- 101710187404 Paired mesoderm homeobox protein 2A Proteins 0.000 description 2
- 102000005327 Palmitoyl protein thioesterase Human genes 0.000 description 2
- 108020002591 Palmitoyl protein thioesterase Proteins 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 2
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 2
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 2
- 101710139464 Phosphoglycerate kinase 1 Proteins 0.000 description 2
- 102100032391 Phosphorylase b kinase gamma catalytic chain, liver/testis isoform Human genes 0.000 description 2
- 102100033548 Phosphorylase b kinase regulatory subunit alpha, liver isoform Human genes 0.000 description 2
- 102100033547 Phosphorylase b kinase regulatory subunit alpha, skeletal muscle isoform Human genes 0.000 description 2
- 102100020854 Phosphorylase b kinase regulatory subunit beta Human genes 0.000 description 2
- 102100035194 Placenta growth factor Human genes 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 102100039427 Polyadenylate-binding protein 2 Human genes 0.000 description 2
- 102100022807 Potassium voltage-gated channel subfamily H member 2 Human genes 0.000 description 2
- 102100038718 Potassium/sodium hyperpolarization-activated cyclic nucleotide-gated channel 4 Human genes 0.000 description 2
- 102100026531 Prelamin-A/C Human genes 0.000 description 2
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 2
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 102100031135 Protein Dok-7 Human genes 0.000 description 2
- 102100028655 Protein O-mannose kinase Human genes 0.000 description 2
- 101710086532 Protein O-mannose kinase Proteins 0.000 description 2
- 102100028120 Protein O-mannosyl-transferase 1 Human genes 0.000 description 2
- 101710093787 Protein O-mannosyl-transferase 1 Proteins 0.000 description 2
- 102100035490 Protein O-mannosyl-transferase 2 Human genes 0.000 description 2
- 102100023097 Protein S100-A1 Human genes 0.000 description 2
- 101710156967 Protein S100-A1 Proteins 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 102100031774 Ribitol 5-phosphate transferase FKRP Human genes 0.000 description 2
- 101710087595 Ribitol 5-phosphate transferase FKRP Proteins 0.000 description 2
- 102100031754 Ribitol-5-phosphate transferase FKTN Human genes 0.000 description 2
- 101710087566 Ribitol-5-phosphate transferase FKTN Proteins 0.000 description 2
- 102100035179 Ribitol-5-phosphate xylosyltransferase 1 Human genes 0.000 description 2
- 101710161553 Ribitol-5-phosphate xylosyltransferase 1 Proteins 0.000 description 2
- 101710166136 Selenocysteine insertion sequence-binding protein 2 Proteins 0.000 description 2
- 102100026077 Selenocysteine insertion sequence-binding protein 2 Human genes 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- 102100021119 Serine protease HTRA1 Human genes 0.000 description 2
- 102100020824 Serine-protein kinase ATM Human genes 0.000 description 2
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 2
- 102100028760 Sialidase-1 Human genes 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 102100027198 Sodium channel protein type 5 subunit alpha Human genes 0.000 description 2
- 102100027181 Sodium channel subunit beta-4 Human genes 0.000 description 2
- 102100037190 Sodium-dependent neutral amino acid transporter B(0)AT1 Human genes 0.000 description 2
- 101710168080 Sodium-dependent neutral amino acid transporter B(0)AT1 Proteins 0.000 description 2
- 108010038615 Solute Carrier Family 22 Member 5 Proteins 0.000 description 2
- 102100039670 Solute carrier family 2, facilitated glucose transporter member 10 Human genes 0.000 description 2
- 102100036924 Solute carrier family 22 member 5 Human genes 0.000 description 2
- 102000000019 Sterol Esterase Human genes 0.000 description 2
- 108010055297 Sterol Esterase Proteins 0.000 description 2
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 2
- 102100035155 Telethonin Human genes 0.000 description 2
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 2
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- 102100026260 Titin Human genes 0.000 description 2
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 2
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 2
- 102100033530 Transmembrane protein 43 Human genes 0.000 description 2
- 101710106890 Transmembrane protein 43 Proteins 0.000 description 2
- 108010039203 Tripeptidyl-Peptidase 1 Proteins 0.000 description 2
- 102100034197 Tripeptidyl-peptidase 1 Human genes 0.000 description 2
- 102100033632 Tropomyosin alpha-1 chain Human genes 0.000 description 2
- 101710128188 Tropomyosin alpha-1 chain Proteins 0.000 description 2
- 102100033080 Tropomyosin alpha-3 chain Human genes 0.000 description 2
- 101710091952 Tropomyosin alpha-3 chain Proteins 0.000 description 2
- 101710186379 Tropomyosin-1 Proteins 0.000 description 2
- 102000013394 Troponin I Human genes 0.000 description 2
- 108010065729 Troponin I Proteins 0.000 description 2
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 2
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 2
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 2
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 2
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 2
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 2
- 102100027958 UDP-GalNAc:beta-1,3-N-acetylgalactosaminyltransferase 2 Human genes 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 2
- 108010073919 Vascular Endothelial Growth Factor D Proteins 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 2
- 102100038234 Vascular endothelial growth factor D Human genes 0.000 description 2
- 102000003970 Vinculin Human genes 0.000 description 2
- 108090000384 Vinculin Proteins 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 102000013814 Wnt Human genes 0.000 description 2
- 108050003627 Wnt Proteins 0.000 description 2
- 101000678336 Xenopus laevis Actin, alpha skeletal muscle 2 Proteins 0.000 description 2
- 101000678338 Xenopus tropicalis Actin, alpha cardiac muscle 2 Proteins 0.000 description 2
- 102100038983 Xylosyltransferase 1 Human genes 0.000 description 2
- 108050007995 Xylosyltransferase 1 Proteins 0.000 description 2
- 102100032728 Xylosyltransferase 2 Human genes 0.000 description 2
- 101710199598 Xylosyltransferase 2 Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000008484 agonism Effects 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010015684 alpha-N-Acetylgalactosaminidase Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 108010080146 androgen receptors Proteins 0.000 description 2
- 230000033115 angiogenesis Effects 0.000 description 2
- 230000002763 arrhythmic effect Effects 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000034196 cell chemotaxis Effects 0.000 description 2
- 230000002490 cerebral effect Effects 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 208000028831 congenital heart disease Diseases 0.000 description 2
- 230000008828 contractile function Effects 0.000 description 2
- 210000004351 coronary vessel Anatomy 0.000 description 2
- 108010023942 cysteine and glycine-rich protein 3 Proteins 0.000 description 2
- 210000004262 dental pulp cavity Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 229940105423 erythropoietin Drugs 0.000 description 2
- 229940126864 fibroblast growth factor Drugs 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 230000007946 glucose deprivation Effects 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 201000004534 glycogen storage disease V Diseases 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 208000009429 hemophilia B Diseases 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000002519 immonomodulatory effect Effects 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000001361 intraarterial administration Methods 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 108010087599 lactate dehydrogenase 1 Proteins 0.000 description 2
- 108010022838 lamin B receptor Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000003716 mesoderm Anatomy 0.000 description 2
- 108010038232 microsomal triglyceride transfer protein Proteins 0.000 description 2
- 230000037230 mobility Effects 0.000 description 2
- 230000007659 motor function Effects 0.000 description 2
- 238000001964 muscle biopsy Methods 0.000 description 2
- 108010065781 myosin light chain 2 Proteins 0.000 description 2
- 108010059725 myosin-binding protein C Proteins 0.000 description 2
- 108010054130 nebulin Proteins 0.000 description 2
- 208000018360 neuromuscular disease Diseases 0.000 description 2
- 230000000324 neuroprotective effect Effects 0.000 description 2
- 230000036284 oxygen consumption Effects 0.000 description 2
- 210000003540 papillary muscle Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010049224 perlecan Proteins 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 108010059929 phospholamban Proteins 0.000 description 2
- 102000005681 phospholamban Human genes 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 210000003314 quadriceps muscle Anatomy 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 210000005241 right ventricle Anatomy 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 210000002460 smooth muscle Anatomy 0.000 description 2
- 230000002739 subcortical effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- XQTLDIFVVHJORV-UHFFFAOYSA-N tecnazene Chemical compound [O-][N+](=O)C1=C(Cl)C(Cl)=CC(Cl)=C1Cl XQTLDIFVVHJORV-UHFFFAOYSA-N 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000002463 transducing effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000008736 traumatic injury Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 210000003501 vero cell Anatomy 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 230000010464 virion assembly Effects 0.000 description 2
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 1
- WDVIDPRACNGFPP-QWRGUYRKSA-N (2s)-2-[[(2s)-6-amino-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCC(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WDVIDPRACNGFPP-QWRGUYRKSA-N 0.000 description 1
- 102100028734 1,4-alpha-glucan-branching enzyme Human genes 0.000 description 1
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 1
- MSWZFWKMSRAUBD-GASJEMHNSA-N 2-amino-2-deoxy-D-galactopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O MSWZFWKMSRAUBD-GASJEMHNSA-N 0.000 description 1
- KZMAWJRXKGLWGS-UHFFFAOYSA-N 2-chloro-n-[4-(4-methoxyphenyl)-1,3-thiazol-2-yl]-n-(3-methoxypropyl)acetamide Chemical compound S1C(N(C(=O)CCl)CCCOC)=NC(C=2C=CC(OC)=CC=2)=C1 KZMAWJRXKGLWGS-UHFFFAOYSA-N 0.000 description 1
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 1
- 102100039791 43 kDa receptor-associated protein of the synapse Human genes 0.000 description 1
- 102100024626 5'-AMP-activated protein kinase subunit gamma-2 Human genes 0.000 description 1
- FWXNJWAXBVMBGL-UHFFFAOYSA-N 9-n,9-n,10-n,10-n-tetrakis(4-methylphenyl)anthracene-9,10-diamine Chemical compound C1=CC(C)=CC=C1N(C=1C2=CC=CC=C2C(N(C=2C=CC(C)=CC=2)C=2C=CC(C)=CC=2)=C2C=CC=CC2=1)C1=CC=C(C)C=C1 FWXNJWAXBVMBGL-UHFFFAOYSA-N 0.000 description 1
- 108010011122 A Kinase Anchor Proteins Proteins 0.000 description 1
- 102000014022 A Kinase Anchor Proteins Human genes 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 102100040963 Acetylcholine receptor subunit epsilon Human genes 0.000 description 1
- 102100040966 Acetylcholine receptor subunit gamma Human genes 0.000 description 1
- 102100033639 Acetylcholinesterase Human genes 0.000 description 1
- 108010022752 Acetylcholinesterase Proteins 0.000 description 1
- 102100029271 Acetylcholinesterase collagenic tail peptide Human genes 0.000 description 1
- 108020005296 Acid Ceramidase Proteins 0.000 description 1
- 208000019932 Aciduria Diseases 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000649046 Adeno-associated virus 11 Species 0.000 description 1
- 241000649047 Adeno-associated virus 12 Species 0.000 description 1
- 241000300529 Adeno-associated virus 13 Species 0.000 description 1
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 1
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 1
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 1
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 208000002016 Adenosine monophosphate deaminase deficiency Diseases 0.000 description 1
- 108700037035 Adenosine monophosphate deaminase deficiency Proteins 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 229920000310 Alpha glucan Polymers 0.000 description 1
- 208000029602 Alpha-N-acetylgalactosaminidase deficiency Diseases 0.000 description 1
- 208000007195 Andersen Syndrome Diseases 0.000 description 1
- 201000006060 Andersen-Tawil syndrome Diseases 0.000 description 1
- 206010002329 Aneurysm Diseases 0.000 description 1
- 206010002383 Angina Pectoris Diseases 0.000 description 1
- 102000009840 Angiopoietins Human genes 0.000 description 1
- 108010009906 Angiopoietins Proteins 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 208000027896 Aortic valve disease Diseases 0.000 description 1
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 1
- 101100490659 Arabidopsis thaliana AGP17 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 1
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 201000006058 Arrhythmogenic right ventricular cardiomyopathy Diseases 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- BHELIUBJHYAEDK-OAIUPTLZSA-N Aspoxicillin Chemical compound C1([C@H](C(=O)N[C@@H]2C(N3[C@H](C(C)(C)S[C@@H]32)C(O)=O)=O)NC(=O)[C@H](N)CC(=O)NC)=CC=C(O)C=C1 BHELIUBJHYAEDK-OAIUPTLZSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 206010003658 Atrial Fibrillation Diseases 0.000 description 1
- 101150056981 BID gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101150079123 Bad gene Proteins 0.000 description 1
- 201000005943 Barth syndrome Diseases 0.000 description 1
- 201000006935 Becker muscular dystrophy Diseases 0.000 description 1
- 101710088655 Beta-1,4-glucuronyltransferase 1 Proteins 0.000 description 1
- 102100030686 Beta-sarcoglycan Human genes 0.000 description 1
- 102400000667 Brain natriuretic peptide 32 Human genes 0.000 description 1
- 101800000407 Brain natriuretic peptide 32 Proteins 0.000 description 1
- 101800002247 Brain natriuretic peptide 45 Proteins 0.000 description 1
- 206010059027 Brugada syndrome Diseases 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 102100022361 CAAX prenyl protease 1 homolog Human genes 0.000 description 1
- 102000014814 CACNA1C Human genes 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 208000002061 Cardiac Conduction System Disease Diseases 0.000 description 1
- 108010051609 Cardiac Myosins Proteins 0.000 description 1
- 102000013602 Cardiac Myosins Human genes 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 206010058892 Carnitine deficiency Diseases 0.000 description 1
- 206010050215 Carnitine palmitoyltransferase deficiency Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 101710106619 Catenin alpha-3 Proteins 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 101710147336 Choline/ethanolamine kinase Proteins 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 108010043741 Collagen Type VI Proteins 0.000 description 1
- 102000002734 Collagen Type VI Human genes 0.000 description 1
- 102100031162 Collagen alpha-1(XVIII) chain Human genes 0.000 description 1
- 108010053085 Complement Factor H Proteins 0.000 description 1
- 102100035432 Complement factor H Human genes 0.000 description 1
- 208000004117 Congenital Myasthenic Syndromes Diseases 0.000 description 1
- 208000016758 Congenital fibrosis of extraocular muscles Diseases 0.000 description 1
- 206010056370 Congestive cardiomyopathy Diseases 0.000 description 1
- 208000034656 Contusions Diseases 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 1
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 1
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 1
- 108010025905 Cystine-Knot Miniproteins Proteins 0.000 description 1
- 206010011777 Cystinosis Diseases 0.000 description 1
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 101100372758 Danio rerio vegfaa gene Proteins 0.000 description 1
- 102100021790 Delta-sarcoglycan Human genes 0.000 description 1
- 102100036912 Desmin Human genes 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- 101001117086 Dictyostelium discoideum cAMP/cGMP-dependent 3',5'-cAMP/cGMP phosphodiesterase A Proteins 0.000 description 1
- 201000010046 Dilated cardiomyopathy Diseases 0.000 description 1
- 108700043208 Dimauro disease Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102100035966 DnaJ homolog subfamily A member 2 Human genes 0.000 description 1
- 101000827763 Drosophila melanogaster Fibroblast growth factor receptor homolog 1 Proteins 0.000 description 1
- 102100032248 Dysferlin Human genes 0.000 description 1
- 101710192866 Dystrobrevin alpha Proteins 0.000 description 1
- 108010071885 Dystroglycans Proteins 0.000 description 1
- 102100029503 E3 ubiquitin-protein ligase TRIM32 Human genes 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 208000002197 Ehlers-Danlos syndrome Diseases 0.000 description 1
- 102100034239 Emerin Human genes 0.000 description 1
- HCHFRAXBELVCGG-UHFFFAOYSA-N Emerin Natural products C1=CC(OC)=CC=C1C=C(C#N)C(C#N)=CC1=CC=C(OC)C=C1 HCHFRAXBELVCGG-UHFFFAOYSA-N 0.000 description 1
- 108010079505 Endostatins Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000283070 Equus zebra Species 0.000 description 1
- 206010015548 Euthanasia Diseases 0.000 description 1
- 108010077781 F-actin-binding proteins Proteins 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 206010016077 Factor IX deficiency Diseases 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 208000001948 Farber Lipogranulomatosis Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 208000001640 Fibromyalgia Diseases 0.000 description 1
- 101150048336 Flt1 gene Proteins 0.000 description 1
- 101710192607 Formylglycine-generating enzyme Proteins 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000034286 G proteins Human genes 0.000 description 1
- 102220597401 G0/G1 switch protein 2_V46A_mutation Human genes 0.000 description 1
- 108010046649 GDNP peptide Proteins 0.000 description 1
- 208000017462 Galactosialidosis Diseases 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 102100021792 Gamma-sarcoglycan Human genes 0.000 description 1
- 208000009796 Gangliosidoses Diseases 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- 206010053249 Glycogen Storage Disease Type IV Diseases 0.000 description 1
- 208000006562 Glycogen Storage Disease Type VII Diseases 0.000 description 1
- 208000011123 Glycogen storage disease due to glycogen branching enzyme deficiency Diseases 0.000 description 1
- 208000032002 Glycogen storage disease due to liver glycogen phosphorylase deficiency Diseases 0.000 description 1
- 208000031926 Glycogen storage disease due to muscle phosphofructokinase deficiency Diseases 0.000 description 1
- 206010053240 Glycogen storage disease type VI Diseases 0.000 description 1
- 102100034154 Guanine nucleotide-binding protein G(i) subunit alpha-2 Human genes 0.000 description 1
- 208000012777 Hartnup Disease Diseases 0.000 description 1
- 102100032606 Heat shock factor protein 1 Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 102000003693 Hedgehog Proteins Human genes 0.000 description 1
- 108090000031 Hedgehog Proteins Proteins 0.000 description 1
- 229920002971 Heparan sulfate Polymers 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102220512848 Heterogeneous nuclear ribonucleoprotein A1-like 2_N215D_mutation Human genes 0.000 description 1
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 1
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- 108010048671 Homeodomain Proteins Proteins 0.000 description 1
- 102000009331 Homeodomain Proteins Human genes 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101001058479 Homo sapiens 1,4-alpha-glucan-branching enzyme Proteins 0.000 description 1
- 101000744504 Homo sapiens 43 kDa receptor-associated protein of the synapse Proteins 0.000 description 1
- 101000760987 Homo sapiens 5'-AMP-activated protein kinase subunit gamma-2 Proteins 0.000 description 1
- 101000965233 Homo sapiens Acetylcholine receptor subunit epsilon Proteins 0.000 description 1
- 101000965219 Homo sapiens Acetylcholine receptor subunit gamma Proteins 0.000 description 1
- 101000770471 Homo sapiens Acetylcholinesterase collagenic tail peptide Proteins 0.000 description 1
- 101000975753 Homo sapiens Acid ceramidase Proteins 0.000 description 1
- 101000617784 Homo sapiens Alpha-1-syntrophin Proteins 0.000 description 1
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 1
- 101000729794 Homo sapiens Beta-1,4-glucuronyltransferase 1 Proteins 0.000 description 1
- 101000765010 Homo sapiens Beta-galactosidase Proteins 0.000 description 1
- 101000703495 Homo sapiens Beta-sarcoglycan Proteins 0.000 description 1
- 101000824531 Homo sapiens CAAX prenyl protease 1 homolog Proteins 0.000 description 1
- 101000916179 Homo sapiens Catenin alpha-3 Proteins 0.000 description 1
- 101000777313 Homo sapiens Choline/ethanolamine kinase Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000616408 Homo sapiens Delta-sarcoglycan Proteins 0.000 description 1
- 101000870166 Homo sapiens DnaJ homolog subfamily C member 14 Proteins 0.000 description 1
- 101001016184 Homo sapiens Dysferlin Proteins 0.000 description 1
- 101001053689 Homo sapiens Dystrobrevin alpha Proteins 0.000 description 1
- 101000855983 Homo sapiens Dystroglycan 1 Proteins 0.000 description 1
- 101000634982 Homo sapiens E3 ubiquitin-protein ligase TRIM32 Proteins 0.000 description 1
- 101000648611 Homo sapiens Formylglycine-generating enzyme Proteins 0.000 description 1
- 101001070508 Homo sapiens Guanine nucleotide-binding protein G(i) subunit alpha-2 Proteins 0.000 description 1
- 101000867525 Homo sapiens Heat shock factor protein 1 Proteins 0.000 description 1
- 101000972491 Homo sapiens Laminin subunit alpha-2 Proteins 0.000 description 1
- 101001116314 Homo sapiens Methionine synthase reductase Proteins 0.000 description 1
- 101001023043 Homo sapiens Myoblast determination protein 1 Proteins 0.000 description 1
- 101001072470 Homo sapiens N-acetylglucosamine-1-phosphotransferase subunits alpha/beta Proteins 0.000 description 1
- 101000974726 Homo sapiens Potassium voltage-gated channel subfamily E member 1 Proteins 0.000 description 1
- 101000974720 Homo sapiens Potassium voltage-gated channel subfamily E member 2 Proteins 0.000 description 1
- 101001047090 Homo sapiens Potassium voltage-gated channel subfamily H member 2 Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 101000893741 Homo sapiens Tissue alpha-L-fucosidase Proteins 0.000 description 1
- 101000932790 Homo sapiens Voltage-dependent L-type calcium channel subunit alpha-1S Proteins 0.000 description 1
- 206010020365 Homocystinuria Diseases 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- 241000484121 Human parvovirus Species 0.000 description 1
- 101100273566 Humulus lupulus CCL10 gene Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000015178 Hurler syndrome Diseases 0.000 description 1
- 208000015204 Hurler-Scheie syndrome Diseases 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- 208000007599 Hyperkalemic periodic paralysis Diseases 0.000 description 1
- 208000001021 Hyperlipoproteinemia Type I Diseases 0.000 description 1
- 208000031309 Hypertrophic Familial Cardiomyopathy Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical class C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102100032832 Integrin alpha-7 Human genes 0.000 description 1
- 102100039903 Integrin alpha-9 Human genes 0.000 description 1
- 208000035478 Interatrial communication Diseases 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010011185 KCNQ1 Potassium Channel Proteins 0.000 description 1
- 206010048804 Kearns-Sayre syndrome Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 208000034693 Laceration Diseases 0.000 description 1
- 108700036935 Lactate dehydrogenase deficiency type A Proteins 0.000 description 1
- 108010021101 Lamin Type B Proteins 0.000 description 1
- 102100022745 Laminin subunit alpha-2 Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- 201000009342 Limb-girdle muscular dystrophy Diseases 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 201000009035 MERRF syndrome Diseases 0.000 description 1
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 1
- 101150013833 MYOD1 gene Proteins 0.000 description 1
- 101150094019 MYOG gene Proteins 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 208000030162 Maple syrup disease Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- 101710163328 Methionine synthase Proteins 0.000 description 1
- 102100031551 Methionine synthase Human genes 0.000 description 1
- 102100024614 Methionine synthase reductase Human genes 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000002151 Microfilament Proteins Human genes 0.000 description 1
- 108010040897 Microfilament Proteins Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 206010058799 Mitochondrial encephalomyopathy Diseases 0.000 description 1
- 206010072928 Mucolipidosis type II Diseases 0.000 description 1
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 1
- 206010056893 Mucopolysaccharidosis VII Diseases 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100351033 Mus musculus Pax7 gene Proteins 0.000 description 1
- 101600105505 Mus musculus Vascular endothelial growth factor C (isoform 1) Proteins 0.000 description 1
- 102100035077 Myoblast determination protein 1 Human genes 0.000 description 1
- 108010020197 Myogenic Regulatory Factor 5 Proteins 0.000 description 1
- 101710099061 Myogenic factor 5 Proteins 0.000 description 1
- 108010067385 Myosin Light Chains Proteins 0.000 description 1
- 102000016349 Myosin Light Chains Human genes 0.000 description 1
- 101710193418 Myosin light chain 1 Proteins 0.000 description 1
- 102100030740 Myosin light chain 1/3, skeletal muscle isoform Human genes 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 102100036710 N-acetylglucosamine-1-phosphotransferase subunits alpha/beta Human genes 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 1
- 208000012529 Naxos disease Diseases 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101100049938 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) exr-1 gene Proteins 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- 206010029748 Noonan syndrome Diseases 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000004286 Osteochondrodysplasias Diseases 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 206010034010 Parkinsonism Diseases 0.000 description 1
- 208000013234 Pearson syndrome Diseases 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 1
- 108700010203 Phosphoglycerate Kinase 1 Deficiency Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 102100022755 Potassium voltage-gated channel subfamily E member 1 Human genes 0.000 description 1
- 102100022752 Potassium voltage-gated channel subfamily E member 2 Human genes 0.000 description 1
- 101710163354 Potassium voltage-gated channel subfamily H member 2 Proteins 0.000 description 1
- 102100037444 Potassium voltage-gated channel subfamily KQT member 1 Human genes 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 101710113072 Probable methionine synthase Proteins 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-N Propionic acid Chemical compound CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 208000021811 Sandhoff disease Diseases 0.000 description 1
- 102000017852 Saposin Human genes 0.000 description 1
- 108050007079 Saposin Proteins 0.000 description 1
- 208000018675 Schwartz-Jampel syndrome Diseases 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- 101710192761 Serine-type anaerobic sulfatase-maturating enzyme Proteins 0.000 description 1
- 206010040639 Sick sinus syndrome Diseases 0.000 description 1
- 201000001828 Sly syndrome Diseases 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 108010040240 Sodium-Calcium Exchanger Proteins 0.000 description 1
- 102000001794 Sodium-Calcium Exchanger Human genes 0.000 description 1
- 102100035088 Sodium/calcium exchanger 1 Human genes 0.000 description 1
- 102000011971 Sphingomyelin Phosphodiesterase Human genes 0.000 description 1
- 108010061312 Sphingomyelin Phosphodiesterase Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 201000010814 Synostosis Diseases 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 102100040526 Tissue alpha-L-fucosidase Human genes 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 101001023030 Toxoplasma gondii Myosin-D Proteins 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 102000016715 Transforming Growth Factor beta Receptors Human genes 0.000 description 1
- 108010092867 Transforming Growth Factor beta Receptors Proteins 0.000 description 1
- 102000056172 Transforming growth factor beta-3 Human genes 0.000 description 1
- 108090000097 Transforming growth factor beta-3 Proteins 0.000 description 1
- 102000009192 Transforming growth factor-beta receptor, type II Human genes 0.000 description 1
- 108050000083 Transforming growth factor-beta receptor, type II Proteins 0.000 description 1
- 102000005937 Tropomyosin Human genes 0.000 description 1
- 108010030743 Tropomyosin Proteins 0.000 description 1
- 102000004903 Troponin Human genes 0.000 description 1
- 108090001027 Troponin Proteins 0.000 description 1
- 102100036859 Troponin I, cardiac muscle Human genes 0.000 description 1
- 101710128251 Troponin I, cardiac muscle Proteins 0.000 description 1
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 1
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- NZCPCJCJZHKFGZ-AAEUAGOBSA-N Trp-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NZCPCJCJZHKFGZ-AAEUAGOBSA-N 0.000 description 1
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 1
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 1
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 1
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 1
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 1
- 101710102803 Tumor suppressor ARF Proteins 0.000 description 1
- 102400000731 Tumstatin Human genes 0.000 description 1
- 108700001567 Type I Schindler Disease Proteins 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 1
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- 108010073925 Vascular Endothelial Growth Factor B Proteins 0.000 description 1
- 102100038217 Vascular endothelial growth factor B Human genes 0.000 description 1
- 101150030763 Vegfa gene Proteins 0.000 description 1
- 101150091393 Vegfb gene Proteins 0.000 description 1
- 101150036482 Vegfc gene Proteins 0.000 description 1
- 101150111878 Vegfd gene Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 206010047631 Vitamin E deficiency Diseases 0.000 description 1
- 102100032574 Voltage-dependent L-type calcium channel subunit alpha-1C Human genes 0.000 description 1
- 102220559235 Voltage-dependent L-type calcium channel subunit alpha-1C_P34A_mutation Human genes 0.000 description 1
- 102220559240 Voltage-dependent L-type calcium channel subunit alpha-1C_P34S_mutation Human genes 0.000 description 1
- 102100025485 Voltage-dependent L-type calcium channel subunit alpha-1S Human genes 0.000 description 1
- 206010048214 Xanthoma Diseases 0.000 description 1
- 206010048215 Xanthomatosis Diseases 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 101710151579 Zinc metalloproteinase Proteins 0.000 description 1
- QFGQGUUVPIAIJW-UHFFFAOYSA-N [2-(3,4-dihydroxyphenyl)-2-hydroxyethyl]-trimethylazanium;iodide Chemical compound [I-].C[N+](C)(C)CC(O)C1=CC=C(O)C(O)=C1 QFGQGUUVPIAIJW-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 208000004622 abetalipoproteinemia Diseases 0.000 description 1
- 229940022698 acetylcholinesterase Drugs 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 208000017478 adult neuronal ceroid lipofuscinosis Diseases 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 206010001689 alkaptonuria Diseases 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 229940087168 alpha tocopherol Drugs 0.000 description 1
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 201000008333 alpha-mannosidosis Diseases 0.000 description 1
- 210000000411 amacrine cell Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 208000007474 aortic aneurysm Diseases 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 206010003119 arrhythmia Diseases 0.000 description 1
- 230000006793 arrhythmia Effects 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000013914 atrial heart septal defect Diseases 0.000 description 1
- 206010003664 atrial septal defect Diseases 0.000 description 1
- 229940120638 avastin Drugs 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 101150024147 bax gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- 102000007478 beta-N-Acetylhexosaminidases Human genes 0.000 description 1
- 108010085377 beta-N-Acetylhexosaminidases Proteins 0.000 description 1
- 201000006486 beta-mannosidosis Diseases 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229940019700 blood coagulation factors Drugs 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- SXDBWCPKPHAZSM-UHFFFAOYSA-M bromate Inorganic materials [O-]Br(=O)=O SXDBWCPKPHAZSM-UHFFFAOYSA-M 0.000 description 1
- SXDBWCPKPHAZSM-UHFFFAOYSA-N bromic acid Chemical compound OBr(=O)=O SXDBWCPKPHAZSM-UHFFFAOYSA-N 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 102220359796 c.55A>G Human genes 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000001196 cardiac muscle myoblast Anatomy 0.000 description 1
- 210000000803 cardiac myoblast Anatomy 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 201000011635 congenital fibrosis of the extraocular muscles Diseases 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 108010056197 emerin Proteins 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 201000007830 familial atrial fibrillation Diseases 0.000 description 1
- 201000006692 familial hypertrophic cardiomyopathy Diseases 0.000 description 1
- 208000031352 familial ventricular tachycardia Diseases 0.000 description 1
- 102000013370 fibrillin Human genes 0.000 description 1
- 108060002895 fibrillin Proteins 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 201000008049 fucosidosis Diseases 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 208000007345 glycogen storage disease Diseases 0.000 description 1
- 201000004510 glycogen storage disease VI Diseases 0.000 description 1
- 201000009339 glycogen storage disease VII Diseases 0.000 description 1
- 208000023875 glycogen storage disease due to lactate dehydrogenase M-subunit deficiency Diseases 0.000 description 1
- 201000008977 glycoproteinosis Diseases 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 210000002837 heart atrium Anatomy 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 210000002287 horizontal cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 201000005706 hypokalemic periodic paralysis Diseases 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000012606 in vitro cell culture Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 208000017482 infantile neuronal ceroid lipofuscinosis Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 108010024084 integrin alpha7 Proteins 0.000 description 1
- 108010024069 integrin alpha9 Proteins 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 208000006443 lactic acidosis Diseases 0.000 description 1
- 108010042502 laminin A Proteins 0.000 description 1
- 108010008097 laminin alpha 2 Proteins 0.000 description 1
- 208000025014 late infantile neuronal ceroid lipofuscinosis Diseases 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 210000005246 left atrium Anatomy 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 208000036546 leukodystrophy Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000010859 live-cell imaging Methods 0.000 description 1
- 208000004731 long QT syndrome Diseases 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 208000024393 maple syrup urine disease Diseases 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- ZIYVHBGGAOATLY-UHFFFAOYSA-N methylmalonic acid Chemical compound OC(=O)C(C)C(O)=O ZIYVHBGGAOATLY-UHFFFAOYSA-N 0.000 description 1
- 210000000274 microglia Anatomy 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 208000012268 mitochondrial disease Diseases 0.000 description 1
- 230000004898 mitochondrial function Effects 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 201000007769 mucolipidosis Diseases 0.000 description 1
- 208000020460 mucolipidosis II alpha/beta Diseases 0.000 description 1
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 1
- 201000002273 mucopolysaccharidosis II Diseases 0.000 description 1
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 1
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 description 1
- 208000011045 mucopolysaccharidosis type 3 Diseases 0.000 description 1
- 208000025919 mucopolysaccharidosis type 7 Diseases 0.000 description 1
- 210000002464 muscle smooth vascular Anatomy 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 208000031225 myocardial ischemia Diseases 0.000 description 1
- 230000001452 natriuretic effect Effects 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- HPNRHPKXQZSDFX-OAQDCNSJSA-N nesiritide Chemical compound C([C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)CNC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CO)C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 HPNRHPKXQZSDFX-OAQDCNSJSA-N 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 230000002232 neuromuscular Effects 0.000 description 1
- 201000007642 neuronal ceroid lipofuscinosis 1 Diseases 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 208000021090 palsy Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229960001412 pentobarbital Drugs 0.000 description 1
- WEXRUCMBJFQVBZ-UHFFFAOYSA-N pentobarbital Chemical compound CCCC(C)C1(CC)C(=O)NC(=O)NC1=O WEXRUCMBJFQVBZ-UHFFFAOYSA-N 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 208000029308 periodic paralysis Diseases 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- DCWXELXMIBXGTH-QMMMGPOBSA-N phosphonotyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-QMMMGPOBSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 101150093695 pitx3 gene Proteins 0.000 description 1
- 208000014321 polymorphic ventricular tachycardia Diseases 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001814 protein method Methods 0.000 description 1
- 238000009163 protein therapy Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 101150101384 rat1 gene Proteins 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000005245 right atrium Anatomy 0.000 description 1
- 108010046141 rilonacept Proteins 0.000 description 1
- 208000016625 rippling muscle disease Diseases 0.000 description 1
- 102220322371 rs1554854584 Human genes 0.000 description 1
- 102220295199 rs1554958062 Human genes 0.000 description 1
- 102200029613 rs35593767 Human genes 0.000 description 1
- 102220040909 rs587778531 Human genes 0.000 description 1
- 102220071204 rs751350498 Human genes 0.000 description 1
- 210000003752 saphenous vein Anatomy 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 208000002131 short QT syndrome Diseases 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 208000011985 sialidosis Diseases 0.000 description 1
- 210000000419 skeletal muscle satellite cell Anatomy 0.000 description 1
- 210000004683 skeletal myoblast Anatomy 0.000 description 1
- 210000001057 smooth muscle myoblast Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 108010067207 sodium-calcium exchanger 1 Proteins 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 108010084272 syntrophin alpha1 Proteins 0.000 description 1
- 208000016505 systemic primary carnitine deficiency disease Diseases 0.000 description 1
- 150000003505 terpenes Chemical class 0.000 description 1
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229960000984 tocofersolan Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010012374 type IV collagen alpha3 chain Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 208000019553 vascular disease Diseases 0.000 description 1
- 210000000596 ventricular septum Anatomy 0.000 description 1
- 206010047302 ventricular tachycardia Diseases 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000002076 α-tocopherol Substances 0.000 description 1
- 235000004835 α-tocopherol Nutrition 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/1703—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- A61K38/1709—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- A61K38/1719—Muscle proteins, e.g. myosin or actin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/44—Oxidoreductases (1)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/47—Hydrolases (3) acting on glycosyl compounds (3.2), e.g. cellulases, lactases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/03—Herpetoviridae, e.g. pseudorabies virus
- C07K14/05—Epstein-Barr virus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/864—Parvoviral vectors, e.g. parvovirus, densovirus
- C12N15/8645—Adeno-associated virus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y116/00—Oxidoreductases oxidizing metal ions (1.16)
- C12Y116/03—Oxidoreductases oxidizing metal ions (1.16) with oxygen as acceptor (1.16.3)
- C12Y116/03001—Ferroxidase (1.16.3.1), i.e. ceruloplasmin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01001—Phosphorylase (2.4.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/0102—Alpha-glucosidase (3.2.1.20)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01022—Alpha-galactosidase (3.2.1.22)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0019—Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14121—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14133—Use of viral protein as therapeutic agent other than vaccine, e.g. apoptosis inducing or anti-inflammatory
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14145—Special targeting system for viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14171—Demonstrated in vivo effect
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Neurology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Physical Education & Sports Medicine (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Marine Sciences & Fisheries (AREA)
- Tropical Medicine & Parasitology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본원에서 모 AAV 캡시드 단백질에 대해 아미노산 서열에서 하나 이상의 변형을 갖는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이 제공되며, 이때 상기 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질은 AAV 비리온에 존재할 때 변형되지 않은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 하나 이상의 유형의 근육 세포의 증가된 감염성을 부여한다. 또한, 재조합 AAV 비리온 및 본원에 개시된 변이체 AAV 캡시드 단백질을 포함하는 이의 약학적 조성물, rAAV 캡시드 단백질 및 비리온의 제조 방법, 및 연구 및 임상 실습에서, 예를 들어 근육 질환 및 질병의 치료를 위한 하나 이상의 근육 세포로 핵산 서열의 전달에서 이들 rAAV 캡시드 단백질 및 비리온을 사용하는 방법이 제공된다.
Description
본 출원은 2017년 9월 20일에 출원된 미국 가 특허출원 제62/560,901호의 혜택을 주장하며, 이들의 전체 개시 내용은 본원에 참고로 포함된다.
본원에 개시된 발명은 일반적으로 변이체 캡시드 단백질을 포함하는 아데노-관련 바이러스(AAV) 비리온의 분야 및 유도 진화 기술을 이용한 이 같은 변이체 캡시드의 생성에 관한 것이다.
근육은 다양한 중증 유전적 질환과 관련된다. 근육은 많은 근육 이상증 질병에 대한 유전자 요법에서 표적 조직이며, 또한 전신성 질병을 치료하기 위해 분비 인자를 생성하기 위한 바이오팩토리(biofactory)로서 잘 활용될 수 있다. 인간의 근육 조직에 치료 유전자를 전달하는 것은 근육-관련 질병을 치료하는 데 있어서 가장 긴급한 만족스럽지 못한 요구라는 것이 거의 틀림없다.
근육-유도 유전자 전달을 달성하기 위한 하나의 접근법은 유전자-기반 아데노-관련 바이러스(AAV)-매개 요법이며, 여기서 재조합 아데노 관련 바이러스(rAAV)는 하나 이상의 근육 세포에 유전자를 전달하는데, 예를 들어, 미싱 유전자(missing gene)를 대체하고, 우성 결함 유전자를 정정하거나, 또는 연속적인 단백질 치료를 위한 템플릿을 제공하는데 사용된다. AAV-기반 임상 유전자 요법이 점점 더 성공적이었지만, 예를 들어, 높은 효율로 근육의 원하는 세포를 표적화하는 것을 포함하는 바이러스 벡터 특성과 관련하여 결점이 여전히 많습니다. 따라서, 질병의 치료를 위해 근육의 세포에 더 효과적인 유전자-기반 전달을 제공할 수 있는 우수한 형질도입 능력을 갖는 새로운 AAV 변이체에 대한 필요성이 당업계에 존재한다. 당업계에 공지된 바와 같은 야생형 AAV 및 AAV 변이체와 비교하여,--일부 경우에 광범위하게, 다른 경우에서, 특정 근육 세포 유형에 대해 우선적으로-- 개선된 근육 형질도입 프로파일을 나타내는 이러한 AAV 변이체에 대한 필요성이 당업계에 존재한다.
자연적으로 발생하는 AAV는 3개의 오픈 리딩 프레임(open reading frame)인 rep, cap 및 aap를 함유하는 단일 가닥 DNA 바이러스이다. 첫 번째 유전자인 rep는 게놈 복제에 필요한 4개의 단백질(Rep78, Rep68, Rep52 및 Rep40)을 암호화하고, 두 번째, cap는 바이러스 캡시드를 형성하기 위해 조립되는 3개의 구조 단백질(VP1-3)을 발현하고, 세 번째는 캡시드 조립에 필수적인 조립 활성화 단백질(AAP)을 발현한다. AAV는 활성 복제를 위한 아데노바이러스(adenovirus) 또는 헤르페스바이러스(herpesvirus)와 같은 헬퍼 바이러스(helper virus)의 존재에 의존한다. 헬퍼 바이러스의 부재 하에 AAV는 게놈이 에피솜(episome)적으로 유지되거나 AAVS1 유전자좌(locus) 내의 숙주 염색체에 통합되는 잠복 상태를 확립한다.
시험관 내(in vitro) 및 생체 내(in vivo) 유도 진화 기술은 현재의 AAV 기반 유전자 전달 벡터보다 개선된 AAV 변이체을 선택하는데 사용될 수 있다. 이 같은 유도 진화 기술은 당해 기술 분야에 공지되어 있으며, 예를 들어, PCT 공보 WO 2014/194132 및 Kotterman & Schaffer(Nature Review Genetics, AOP, published online 20 May 2014; doi: 10.1038/nrg3742)에 기재되어 있으며, 이의 전체 내용은 본 명세서에 참고로 포함된다. 유도 진화는 반복적인 유전적 다양화 및 선택 과정을 통해 자연적 진화를 모방하는 캡시드 공학 접근법으로, AAV 기반 비리온과 같은 생체 분자의 기능을 점진적으로 개선시키는 유익한 돌연변이의 축적을 가능하게 한다. 이 접근법에서 야생형 AAV cap 유전자는 바이러스 입자의 라이브러리를 생성하기 위해 일괄 처리되는 대형 유전자 라이브러리를 만들기 위해 다양화되고, 유전자 전달 장벽을 극복할 수 있는 우수한 표현형을 가진 독특한 변이체를 분리하기 위해 선택 압력이 가해진다.
AAV 변이체는, 예를 들어 미국 특허 제9,193,956호; 제9,186,419호; 제8,632,764호; 제8,663,624호; 제8,927,514호; 제8,628,966호; 제8,263,396호; 제8,734,809호; 제8,889,641호; 제8,632,764호; 제8,691,948호; 제8,299,295호; 제8,802,440호; 제8,445,267호; 제8,906,307호; 제8,574,583호; 제8,067,015호; 제7,588,772호; 제7,867,484호; 제8,163,543호; 제8,283,151호; 제8,999,678호; 제7,892,809호; 제7,906,111호; 제7,259,151호; 제7,629,322호; 제7,220,577호; 제8,802,080호; 제7,198,951호; 제8,318,480호; 제8,962,332호; 제7,790,449호; 제7,282,199호; 제8,906,675호; 제8,524,446호; 제7,712,893호; 제6,491,907호; 제8,637,255호; 제7,186,522호; 제7,105,345호; 제6,759,237호; 제6,984,517호; 제6,962,815호; 제7,749,492호; 제7,259,151호; 및 제6,156,303호; 미국 공개공보 제2013/0295614호; 제2015/0065562호; 제2014/0364338호; 제2013/0323226호; 제2014/0359799호; 제2013/0059732호; 제2014/0037585호; 제2014/0056854호; 제2013/0296409호; 제2014/0335054호; 제2013/0195801호; 제2012/0070899호; 제2011/0275529호; 제2011/0171262호; 제2009/0215879호; 제2010/0297177호; 제2010/0203083호; 제2009/0317417호; 제2009/0202490호; 제2012/0220492호; 제2006/0292117호; 및 제2004/0002159호; 유럽 공개공보 제2692731 A1호; 제2383346 B1호; 제2359865 B1호; 제2359866 B1호; 제2359867 B1호; 및 제2357010 B1호; 제1791858 B1호; 제1668143 B1호; 제1660678 B1호; 제1664314 B1호; 제1496944 B1호; 제1456383 B1호; 제2341068 B1호; 제2338900 B1호; 제1456419 B1호; 제1310571 B1호; 제1456383 B1호; 제1633772 B1호; 및 제1135468 B1호; 및 국제 (PCT) 공개공보 제WO2014/124282호; 제WO2013/170078호; 제WO2014/160092호; 제WO2014/103957호; 제WO2014/052789호; 제WO2013/174760호; 제WO2013/123503호; 제WO2011/038187호; 및 제WO2008/124015호; 제WO 2003/054197호에 개시되어 있지만; 이러한 참고 문헌들 중 어느 것도 본원에 개시된 AAV 변이체의 실시형태 및/또는 특징 및/또는 조성물 및/또는 물질 구조가 개시되어 있지 않다.
본 명세서 및 인용된 특허 문헌에 인용된 모든 문헌 및 참고 문헌은 본원에 참고로 포함된다.
발명의 요약
본원에서는 모(Parental) AAV 캡시드 단백질에 대해 아미노산 서열에서 하나 이상의 변형을 갖는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이 제공되며, 이때 상기 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질은 AAV 비리온에 존재할 때 변형되지 않은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 하나 이상의 유형의 근육 세포의 증가된 감염성을 부여한다. 또한, 재조합 AAV 비리온 및 본원에 개시된 변이체 AAV 캡시드 단백질을 포함하는 이의 약학적 조성물, 변이체 rAAV 캡시드 단백질 및 비리온의 제조 방법, 및 연구 및 임상 실습에서, 예를 들어 질환 및 질병의 치료를 위한 하나 이상의 근육 세포로의 핵산 서열의 전달에서, 이들 rAAV 캡시드 단백질 및 비리온을 사용하는 방법이 제공된다.
본원의 일부 양태에서, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이 제공되며, 이러한 변이체 AAV 캡시드 단백질은 모 AAV 캡시드에 비해 아미노산 서열에서 하나 이상의 변형을 가지며, 이때 상기 모 AAV 캡시드는 AAV 비리온에 존재하는 경우에 아미노산 서열 변형을 포함하지 않는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 하나 이상의 유형의 근육 세포(예를 들어, 골격근 세포 및/또는 심근 세포)의 증가된 감염성을 부여한다. 본원의 관련 양태에서, 변이체 AAV 캡시드 단백질은, AAV 비리온에 존재하는 경우 항-AAV 항체에 의한 중화에 대해 향상된 내성을 부여한다.
본원의 일부 양태에서, 재조합 AAV(rAAV) 비리온이 제공되며, 이러한 rAAV 비리온은 본원에 기재된 바와 같은 변이체 캡시드 단백질을 포함하며, 여기서 rAAV 비리온은 상응하는 변형되지 않은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성에 비해 하나 이상의 유형의 근육 세포(예를 들어, 골격근 세포 및/또는 심근 세포)의 증가된 감염성을 부여한다. 일부 실시형태에서, rAAV 비리온은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 비해 모든 근육 세포의 증가된 감염성을 나타낸다. 다른 실시형태에서, rAAV 비리온은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 비해 특정 근육 세포 유형만의 증가된 감염성을 나타낸다. 달리 말하면, rAAV 비리온은 특정 근육 세포 유형에 대해만 우선적인 증가된 감염성을 나타내지만, 예를 들어 rAAV는 골격근 섬유아세포, 골격근 위성 세포, 심장 섬유아세포, 심장 전구 세포, 평활근 세포 및/또는 횡경막 근육 세포로부터 선택되는 하나 이상의 세포 유형의 우선적으로 증가된 감염성을 입증하지만, 모든 세포 유형의 증가된 감염성을 입증하지 못한다.
일부 실시형태에서, rAAV 비리온은 이종성 핵산을 포함한다. 일부 이러한 실시형태에서, 이종성 핵산은 폴리펩타이드를 인코딩하는 RNA를 인코딩한다. 이 같은 다른 실시형태에서, 이종성 핵산 서열은 폴리펩타이드를 인코딩하지 않는 RNA, 예를 들어, 이종성 핵산 서열은 RNA 간섭 제, 핵산 분해 효소에 대한 가이드 RNA 등을 인코딩한다.
또한, 본 발명의 감염성 rAAV 비리온 및 약학적으로 허용 가능한 담체를 포함하는 약학적 조성물이 본원에 제공된다.
또한, 표적 세포를 rAAV 비리온과 접촉시킴으로써 이종성 핵산을 표적 세포 (예를 들어 심근 세포)에 전달하는 방법에 본원에 기재된 바와 같은 변이체 캡시드 단백질을 포함하는 rAAV 비리온의 용도가 제공된다. 일부 실시형태에서, 표적 세포는 심혈관 질환 치료를 필요로 하는 개인의 심장에서와 같이 생체 내에서 존재한다. 다른 실시형태에서, 표적 세포는 시험관 내에 존재한다.
또한, 본원에 기재된 바와 같은 변이체 캡시드 단백질을 포함하는 유효량의 rAAV 비리온 또는 유효량의 rAAV 비리온을 포함하는 약학적 조성물을 이 같은 치료를 필요로 하는 대상에 투여함으로써 질병(예를 들어 심근 또는 골격근 질환)을 치료 및 또는 예방하는 방법이 제공된다.
또한, 본원에 기재된 바와 같은 변이체 AAV 캡시드 단백질을 인코딩하는 서열을 포함하는 단리된 핵산, 및 단리된 핵산을 포함하는 숙주 세포가 본원에 제공된다. 또 다른 실시형태에서, 단리된 핵산 및/또는 단리된 숙주 세포는 rAAV를 포함한다.
일부 양태에서, 변이체 AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해, 캡시드 단백질의 GH-루프에는 약 5개의 아미노산 내지 약 20개의 아미노산("이종성 펩타이드" 또는 "펩타이드 삽입물")의 삽입물을 포함하며, 여기서 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다. 일부 실시형태에서, 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41), 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택되는 서열을 포함하거나 필수적으로 이루어진다. 일부 바람직한 실시형태에서, 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29) 및 LATNKIGVTS(서열 식별 번호 37)로 이루어진 군으로부터 선택되는 서열을 포함하거나 필수적으로 이루어진다.
일부 양태에서, AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우에 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다.
일부 실시 양태에서, AAV2에 비해 P363L 치환을 포함하고, 임의로 AAV2에 비해 E347K 및/또는 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.
관련 양태에서, 변이체 AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해 펩타이드 삽입 및 하나 이상의 아미노산 치환을 포함하며, 여기서 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우에 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다. 몇몇 실시 양태에서, AAV2에 비해 펩타이드 삽입체 및 V708I 치환을 포함하는 변이체 AAV 캡시드 단백질을 제공되며, 여기서 상기 펩타이드 삽입체는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군, 바람직하게는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA (서열 식별 번호 29) 및 LATNKIGVTS(서열 식별 번호 37)로 이루어진 군으로부터 임의로 선택된다. 몇몇 실시 양태에서, AAV2에 비해 펩타이드 삽입체 및 P363L 치환를 포함하는 변이체 AAV 캡시드 단백질이 제공되며, 여기서 상기 펩타이드 삽입체는 GNLTKGN(서열 식별 번호 16), LAGNLTKGNA(서열 식별 번호 30), QADTTKN(서열 식별 번호 23) 및 LAQADTTKNA(서열 식별 번호 39)로 이루어진 군으로부터 임의로 선택된다.
일부 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKIQRTDA(서열 식별 번호 27) 및 V708I 치환을 포함하며, 임의로 AAV2에 비해 A593E 및/또는 S109T 및/또는 T330A 및/또는 R588M 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKIQRTDA(서열 식별 번호 27) 및 A35P 치환을 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종 펩타이드 LANKIQRTDA(서열 식별 번호 27) 및 아미노산 치환 N312K, N449D, N551S, I698V 및 L735Q를 포함하며, 임의로 AAV2에 비해 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.
일부 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKTTNKDA(서열 식별 번호 28) 및 V708I 치환을 포함하며, 임의로 AAV2에 비해 S109T 및/또는 W694C 및/또는 W606C 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종 펩타이드 LANKTTNKDA(서열 식별 번호 28) 및 I698V 치환을 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKTTNKDA(서열 식별 번호 28) 및 아미노산 치환 N312K, N449D, N551S, I698V 및 L735Q를 포함하며, 임의로 AAV2에 비해 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.
일부 실시 양태에서, AAV2에 비해 이종 펩타이드 LATNKIGVTA(서열 식별 번호 29) 및 V708I 치환을 포함하며, 임의로 AAV2에 비해 N449K 및/또는 G222S 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종성 펩타이드 LATNKIGVTA(서열 식별 번호 29) 및 아미노산 치환 N312K, N449D, N551S, I698V 및 L735Q를 포함하며, 임의로 AAV2에 비해 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.
일부 실시 양태에서, 본원에 기재된 바와 같은 이종성 펩타이드 및 AAV2에 비해 P363L 치환을 포함하는 변이체 AAV 캡시드 단백질이 개시된다.
또한, 본원에 개시된 바와 같은 변이체 AAV 캡시드를 포함하는 rAAV의 제조 및/또는 전달 방법이 본원에 개시된다. 또한, 본원에 개시된 바와 같은 변이체 AAV 캡시드를 포함하는 rAAV를 포함하는, 본원에 기재된 방법에 사용하기 위한 키트가 본원에서 제공된다.
다른 실시형태에서, 이전 단락에서 변이체 캡시드 단백질을 포함하는 AAV 비리온은 이전 또는 이후에 개시된 임의의 실시형태를 포함할 수 있다. 사실상, 명확한 설명을 위해 별도의 실시형태들의 문맥에 설명되어 있는 본 발명의 특정 특징부는 단일 실시형태로 함께 제공될 수도 있다. 반대로, 간략화를 위해, 단일 실시형태의 문맥에 설명되어 있는 본 발명의 다양한 특징부가 또한 개별적으로 제공되거나, 임의의 적합한 하위 조합으로 제공될 수 있다. 본 발명에 속하는 실시형태의 모든 조합은 본 발명에 구체적으로 포함되며, 거의 모든 조합이 개별적 및 명시적으로 개시되는 바와 같이 본원에 개시된다. 또한, 다양한 실시형태의 모든 하위 조합 및 이의 성분은 본 발명에 구체적으로 포함되며, 거의 모든 하위 조합이 본원에서 개별적 및 명시적으로 개시되는 바와 같이 본원에 개시된다.
본 발명의 요약은 특허청구범위를 한정하고자 하는 것이 아니며, 임의의 방식으로 본 발명의 범위를 제한하려는 것도 아니다.
본원에 개시된 본 발명의 다른 특징 및 이점은 하기 도면, 상세한 설명 및 특허청구범위로부터 명백하게 될 것이다.
본 발명은 첨부된 도면과 함께 해석되는 경우에 하기 상세한 설명으로부터 가장 잘 이해되 것이다. 특허 또는 출원 파일에는 색으로 표시된 하나 이상의 도면이 포함되어 있다. 컬러 도면(들)이 있는 이러한 특허 또는 특허 출원 공개공보의 사본은 요청에 따라 필요한 수수료의 지불과 함께 특허청이 제공할 것이다. 통상적인 실시에 따르면, 도면의 다양한 특징부는 척도에 맞게 도시되지 않는다는 것이 강조된다. 반대로, 다양한 특징부의 치수는 명확성을 위해 임의로 확장되거나 축소된다. 도면에는 하기 도가 포함된다.
도 1은 유도 진화 방법론의 실시형태를 나타낸다. 단계(a)는 DNA 돌연변이 기술과 cap 유전자의 조합을 포함하는 바이러스 캡시드 라이브러리의 생성을 나타낸다. 단계(b)는 각 바이러스 입자가 캡시드를 인코딩하는 cap 유전자를 둘러싸고 있는 돌연변이 캡시드로 구성되고 정제되도록 바이러스를 패키징하는 것을 나타낸다. 그 후, 캡시드 라이브러리는 시험관 내 또는 생체 내에서 선택적 압력을 받게 된다. 유도 진화 기술의 이러한 양태에서, 관심이 있는 조직 또는 세포 물질은 그 표적을 성공적으로 감염시켰던 AAV 변이체의 단리를 위해 수확되고, 바이러스가 성공적으로 회수된다. 단계(c)는 반복 선택을 통한 성공적인 클론의 단계 1 농축(enrichment)을 나타낸다. 단계(d)는 바이러스 적합성을 반복적으로 증가시키기 위해 재다양화 및 추가의 선택 단계를 거치는 선택된 cap 유전자의 단계 2 농축을 나타낸다. 단계(e)는 재조합 AAV 벡터로서 제조되고 다양한 세포 유형 및 조직 표적의 형질 도입 수준에 대해 특징지어지는 벡터 선별 단계 1 및 2 동안 히트(hit)로 확인된 변이체를 나타낸다. AAV 유도 진화 과정의 본질에 의해, 본원에 개시된 변이체는 선별 과정 도중에 근육 세포를 형질 도입하고 게놈(변이체 cap 유전자를 인코딩하는 게놈)을 전달하는 능력이 이미 입증되어 있다.
도 2는 대표적인 선택으로부터 심장 및 골격 근육 조직으로부터 바이러스 게놈의 PCR 증폭을 나타낸다. 적색 박스 내의 밴드는 바이러스 게놈의 성공적인 증폭을 나타낸다.
도면 3A-3C는 서열 분석 내에서의 모티프의 빈도를 나타낸다. 도 3A는 심장 조직에 대한 정맥 내 전달의 선택적인 압력에 대한 라운드 4 시퀀싱 분석을 제공한다. 도 3B는 심장 조직에 대한 중화 항체의 존재 하에서의 정맥내 전달의 선택적인 압력에 대한 라운드 2 시퀀싱 분석을 제공한다. 도 3C는 골격 근육 조직에 대한 정맥내 전달의 선택적인 압력에 대한 라운드 3 시퀀싱 분석을 제공한다. 도 3A는 57.40% LANKTTNKDA 모티프, 16.96% LANKTTNKDA 모티프, 7.32% A593E 모티프, 7.32% 다른 모티프, 4.88% V708I 모티프 및 4.88% LASNTVKAIA 모티프를 나타낸다. 도 3B는 21.14% 다른 모티프, 20.33% LAQADTTKNA 모티프, 15.45% LANKTTNKDA 모티프, 15.45% LAASNKAA 모티프, 15.45% AAV6/AAV5 키메라 모티프 및 12.20% LANTVKLSTA 모티프를 나타낸다. 도 3C는 43.21% A593E 모티프, 41.98% P363L 모티프 및 14.81% 다른 모티프를 나타낸다.
도 4A 내지 4C, 도 4A는 아미노산 587 및 V708I 치환에 따른 랜덤 헵타머(heptamer)를 함유하는 AAV2의 대표적인 3차원 모델이다. 도 4B는 V229I, A490T 및 A581T 치환(서열 식별 번호 62로 제시된 아미노산 서열에 상응하는)을 함유하는 AAV6/AAV5 키메라(chimera)의 대표적인 3차원 모델이다. 도 4C는 P363L 치환을 함유하는 AAV2의 대표적인 3차원 모델이다.
도 5A-E는 야생형(자연 발생) 혈청형 AAV1, AAV2, AAV3A, AAV3B 및 AAV4-10의 및 사이의 아미노산 위치를 보여주는 야생형 AAV 서열 식별 번호 1-11의 배열을 제공한다.
도면 6A-6E는 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 및 신규한 LATTKIGVTA + V708I 변이체 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심근 세포의 형질 도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 조절하에 GFP 이식 유전자(transgene)를 발현한다. 도 6A: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 LATTKIGVTA + V708I.CAG.GFP 또는 야생형 대조군 AAV1.CAG.GFP, AAV2.CAG.GFP, 및 AAV9.CAG.GFP로 20,100,500 및 2500 MOIs에서 감염시켰다. 모든 MOIs에서 감염 후 6일째에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AV1, AV2, 또는 AAV9 캡시드보다 더 우수한 심근 세포를 형질 도입한다는 것을 입증한다. 도 6B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 심근 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AV1, AV2, 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의적인 용량-의존적 개선을 제공한다는 것을 나타낸다. *P < 0.005. 도 6C-6D: 웨스턴 블롯에 의해 각 배양물에서 GFP의 양을 정량화하는 것은, 신규한 AAV 변이체는 야생형 AV1, AV2, 또는 AAV9 캡시드에 대한 이식 유전자의 발현에 있어서 유의적인 개선을 제공한다는 것을 나타낸다. NT = 형질 도입되지 않음. 도 6E: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 LATTKIGVTA + V708I.CAG.GFP 또는 야생형 대조군 AAV1.CAG.GFP, AAV2.CAG.GFP 및 AAV9.CAG.GFP로 감염시켰다. 500 MOI에서 감염 후 1, 2, 3 및 5일째에 세포 배양물의 면역 형광 이미징은 야생형 AV1, AV2, 또는 AAV9 캡시드보다 신규한 AAV 변이체 캡시드가 심근 세포를 더 잘 형질 도입시키고 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 7A-E는 CAG 프로모터의 조절하에 GFP 이식 유전자를 발현하는, 서열 식별 번호 62의 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심근 세포의 형질 도입에 대한 데이터를 제공한다. 도 7A: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드 또는 야생형 대조군 AAV1.CAG.GFP, AAV8.CAG.GFP 및 AAV9.CAG.GFP로 100, 500, and 2500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 6일째에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV1, AAV8 또는 AAV9 캡시드보다 더 우수한 심근 세포를 형질 도입시킴을 입증한다. 도 7B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 심근 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV1, AAV8 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의적인 용량-의존적 개선을 제공한다는 것을 나타낸다. *P < 0. 도 7 C-7D: 웨스턴 블롯에 의해 각 배양물에서 GFP 의 양을 정량화하는 것은 신규한 AAV 변이체가 야생형 AAV1, AAV8 또는 AAV9 캡시드에 대한 이식 유전자의 발현에 유의적인 개선을 제공한다는 것을 나타낸다. 비히클(vehicle) = 형질 도입되지 않음. 도 7E: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드 또는 야생형 대조군 AAV8.CAG.GFP로 감염시켰다. 2500 MOI에서 감염 후 3, 4, 5 및 6일째에 세포 배양물의 면역 형광 이미징은 야생형 AAV8 캡시드보다 신규한 AAV 변이체 캡시드가 심근 세포를 더 잘 형질 도입시키며 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 8A-C는 신규한 AAV 변이체 LANKQRTDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 골격 근육 섬유의 형질 도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 8A: 인간 초기 근육 모세포로부터 골격 근육 섬유로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV8.CAG.GFP 및 AAV9CAG로 100, 500 및 2500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 7일 후에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV8 또는 AAV9 캡시드보다 더 우수한 골격 근육 섬유를 형질 도입시킨다는 것을 입증한다. 도 8B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 골격근 섬유의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV8 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의한 용량-의존성 개선을 제공한다는 것을 나타낸다. *P < 0.05. 도 8C: 인간 초기 근육 모세포로부터 골격 근육 섬유로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV8.CAG.GFP 및 AAV9.CAG.GFP로 감염시켰다. 2500 MOI에서 감염 후 2-7일째에 세포 배양물의 면역 형광 이미징은 야생형 AAV8 또는 AAV9 캡시드보다 신규한 AAV 변이체 캡시드가 골격 근육 섬유를 더 잘 형질 도입시키며 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 9A-B는 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 근육 전구 세포의 형질도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 9A: 인간 만능 줄기 세포주로부터 근육 전구 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV9.CAG.GFP로 500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 6일 후에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV9보다 더 나은 근육 전구 세포를 형질 도입한다는 것을 입증한다. 도면 9B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 근육 전구 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV9를 통해 형질 도입된 세포의 수에 있어 유의한 개선을 제공한다는 것을 나타낸다. *P < 0.05.
도 10A-B는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심장 근육 세포 및 인간 골격 근육 섬유의 형질 도입의 개선 규모에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 10A: 야생형 AAV8 및 AAV9와 비교하여 신규한 AAV 캡시드 변이체에 의해 인간 심장 근육 세포의 형질 도입에서 폴드 증가(fold increase), 근육 질병에 대한 임상 적용에 가장 널리 사용된 혈청형. 도 10B: 야생형 AAV8 및 AAV9 와 비교하여 신규한 AAV 캡시드 변이체에 의해 인간 골격 근육 섬유의 형질 도입에서 폴드 증가.
도 11A-B는 CAG 프로모터의 조절하에 루시페라제(luciferase) 이식 유전자를 발현하는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드를 포함하는 재조합 AAV 바이러스에 의해 생체 내에서 생쥐 조직의 형질 도입에 대한 데이터를 제공한다. 생쥐에게 꼬리 정맥을 통해 동물당 2 X 1011 바이러스 게놈의 단일 정맥 내 주사를 주었다. 도 11A: 14일(좌측) 및 28일(우측) 투여 후 루시페라제의 생전(in life) 이미징은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 세포를 형질 도입시킬 수 있음을 입증한다. 도 11B: 심장, 횡경막 및 사두근에서 56일 투여 후의 루시페라제 활성은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 심장 및 골격 근육을 형질 도입할 수 있다는 것을 입증한다.
도 12A-B는 CAG 프로모터의 조절하에 GFP 이식 유전자를 발현하는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드를 포함하는 재조합 AAV 바이러스에 의해 생체 내에서 비-인간 영장류 골격 근육의 형질 도입에 대한 데이터를 제공한다. 비-인간 영장류를 각각 1011개의 바이러스 게놈의 3회 근육 내 주사로 좌측 외측광근(vastus lateralis) 내로 투여하고, 4주 투여 후 근육 조직을 분석하였다. 도 12A: 2x, 4x 및 20x 배율에서 근위(proximal) 생검 부위의 횡단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있다는 것을 입증한다. 도면 12B: 2x, 4x 및 20x 배율에서 원위(distal) 생검 부위의 종단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있음을 입증한다.
도 1은 유도 진화 방법론의 실시형태를 나타낸다. 단계(a)는 DNA 돌연변이 기술과 cap 유전자의 조합을 포함하는 바이러스 캡시드 라이브러리의 생성을 나타낸다. 단계(b)는 각 바이러스 입자가 캡시드를 인코딩하는 cap 유전자를 둘러싸고 있는 돌연변이 캡시드로 구성되고 정제되도록 바이러스를 패키징하는 것을 나타낸다. 그 후, 캡시드 라이브러리는 시험관 내 또는 생체 내에서 선택적 압력을 받게 된다. 유도 진화 기술의 이러한 양태에서, 관심이 있는 조직 또는 세포 물질은 그 표적을 성공적으로 감염시켰던 AAV 변이체의 단리를 위해 수확되고, 바이러스가 성공적으로 회수된다. 단계(c)는 반복 선택을 통한 성공적인 클론의 단계 1 농축(enrichment)을 나타낸다. 단계(d)는 바이러스 적합성을 반복적으로 증가시키기 위해 재다양화 및 추가의 선택 단계를 거치는 선택된 cap 유전자의 단계 2 농축을 나타낸다. 단계(e)는 재조합 AAV 벡터로서 제조되고 다양한 세포 유형 및 조직 표적의 형질 도입 수준에 대해 특징지어지는 벡터 선별 단계 1 및 2 동안 히트(hit)로 확인된 변이체를 나타낸다. AAV 유도 진화 과정의 본질에 의해, 본원에 개시된 변이체는 선별 과정 도중에 근육 세포를 형질 도입하고 게놈(변이체 cap 유전자를 인코딩하는 게놈)을 전달하는 능력이 이미 입증되어 있다.
도 2는 대표적인 선택으로부터 심장 및 골격 근육 조직으로부터 바이러스 게놈의 PCR 증폭을 나타낸다. 적색 박스 내의 밴드는 바이러스 게놈의 성공적인 증폭을 나타낸다.
도면 3A-3C는 서열 분석 내에서의 모티프의 빈도를 나타낸다. 도 3A는 심장 조직에 대한 정맥 내 전달의 선택적인 압력에 대한 라운드 4 시퀀싱 분석을 제공한다. 도 3B는 심장 조직에 대한 중화 항체의 존재 하에서의 정맥내 전달의 선택적인 압력에 대한 라운드 2 시퀀싱 분석을 제공한다. 도 3C는 골격 근육 조직에 대한 정맥내 전달의 선택적인 압력에 대한 라운드 3 시퀀싱 분석을 제공한다. 도 3A는 57.40% LANKTTNKDA 모티프, 16.96% LANKTTNKDA 모티프, 7.32% A593E 모티프, 7.32% 다른 모티프, 4.88% V708I 모티프 및 4.88% LASNTVKAIA 모티프를 나타낸다. 도 3B는 21.14% 다른 모티프, 20.33% LAQADTTKNA 모티프, 15.45% LANKTTNKDA 모티프, 15.45% LAASNKAA 모티프, 15.45% AAV6/AAV5 키메라 모티프 및 12.20% LANTVKLSTA 모티프를 나타낸다. 도 3C는 43.21% A593E 모티프, 41.98% P363L 모티프 및 14.81% 다른 모티프를 나타낸다.
도 4A 내지 4C, 도 4A는 아미노산 587 및 V708I 치환에 따른 랜덤 헵타머(heptamer)를 함유하는 AAV2의 대표적인 3차원 모델이다. 도 4B는 V229I, A490T 및 A581T 치환(서열 식별 번호 62로 제시된 아미노산 서열에 상응하는)을 함유하는 AAV6/AAV5 키메라(chimera)의 대표적인 3차원 모델이다. 도 4C는 P363L 치환을 함유하는 AAV2의 대표적인 3차원 모델이다.
도 5A-E는 야생형(자연 발생) 혈청형 AAV1, AAV2, AAV3A, AAV3B 및 AAV4-10의 및 사이의 아미노산 위치를 보여주는 야생형 AAV 서열 식별 번호 1-11의 배열을 제공한다.
도면 6A-6E는 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 및 신규한 LATTKIGVTA + V708I 변이체 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심근 세포의 형질 도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 조절하에 GFP 이식 유전자(transgene)를 발현한다. 도 6A: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 LATTKIGVTA + V708I.CAG.GFP 또는 야생형 대조군 AAV1.CAG.GFP, AAV2.CAG.GFP, 및 AAV9.CAG.GFP로 20,100,500 및 2500 MOIs에서 감염시켰다. 모든 MOIs에서 감염 후 6일째에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AV1, AV2, 또는 AAV9 캡시드보다 더 우수한 심근 세포를 형질 도입한다는 것을 입증한다. 도 6B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 심근 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AV1, AV2, 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의적인 용량-의존적 개선을 제공한다는 것을 나타낸다. *P < 0.005. 도 6C-6D: 웨스턴 블롯에 의해 각 배양물에서 GFP의 양을 정량화하는 것은, 신규한 AAV 변이체는 야생형 AV1, AV2, 또는 AAV9 캡시드에 대한 이식 유전자의 발현에 있어서 유의적인 개선을 제공한다는 것을 나타낸다. NT = 형질 도입되지 않음. 도 6E: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 LATTKIGVTA + V708I.CAG.GFP 또는 야생형 대조군 AAV1.CAG.GFP, AAV2.CAG.GFP 및 AAV9.CAG.GFP로 감염시켰다. 500 MOI에서 감염 후 1, 2, 3 및 5일째에 세포 배양물의 면역 형광 이미징은 야생형 AV1, AV2, 또는 AAV9 캡시드보다 신규한 AAV 변이체 캡시드가 심근 세포를 더 잘 형질 도입시키고 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 7A-E는 CAG 프로모터의 조절하에 GFP 이식 유전자를 발현하는, 서열 식별 번호 62의 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심근 세포의 형질 도입에 대한 데이터를 제공한다. 도 7A: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드 또는 야생형 대조군 AAV1.CAG.GFP, AAV8.CAG.GFP 및 AAV9.CAG.GFP로 100, 500, and 2500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 6일째에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV1, AAV8 또는 AAV9 캡시드보다 더 우수한 심근 세포를 형질 도입시킴을 입증한다. 도 7B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 심근 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV1, AAV8 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의적인 용량-의존적 개선을 제공한다는 것을 나타낸다. *P < 0. 도 7 C-7D: 웨스턴 블롯에 의해 각 배양물에서 GFP 의 양을 정량화하는 것은 신규한 AAV 변이체가 야생형 AAV1, AAV8 또는 AAV9 캡시드에 대한 이식 유전자의 발현에 유의적인 개선을 제공한다는 것을 나타낸다. 비히클(vehicle) = 형질 도입되지 않음. 도 7E: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드 또는 야생형 대조군 AAV8.CAG.GFP로 감염시켰다. 2500 MOI에서 감염 후 3, 4, 5 및 6일째에 세포 배양물의 면역 형광 이미징은 야생형 AAV8 캡시드보다 신규한 AAV 변이체 캡시드가 심근 세포를 더 잘 형질 도입시키며 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 8A-C는 신규한 AAV 변이체 LANKQRTDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 골격 근육 섬유의 형질 도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 8A: 인간 초기 근육 모세포로부터 골격 근육 섬유로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV8.CAG.GFP 및 AAV9CAG로 100, 500 및 2500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 7일 후에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV8 또는 AAV9 캡시드보다 더 우수한 골격 근육 섬유를 형질 도입시킨다는 것을 입증한다. 도 8B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 골격근 섬유의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV8 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의한 용량-의존성 개선을 제공한다는 것을 나타낸다. *P < 0.05. 도 8C: 인간 초기 근육 모세포로부터 골격 근육 섬유로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV8.CAG.GFP 및 AAV9.CAG.GFP로 감염시켰다. 2500 MOI에서 감염 후 2-7일째에 세포 배양물의 면역 형광 이미징은 야생형 AAV8 또는 AAV9 캡시드보다 신규한 AAV 변이체 캡시드가 골격 근육 섬유를 더 잘 형질 도입시키며 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 9A-B는 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 근육 전구 세포의 형질도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 9A: 인간 만능 줄기 세포주로부터 근육 전구 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV9.CAG.GFP로 500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 6일 후에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV9보다 더 나은 근육 전구 세포를 형질 도입한다는 것을 입증한다. 도면 9B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 근육 전구 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV9를 통해 형질 도입된 세포의 수에 있어 유의한 개선을 제공한다는 것을 나타낸다. *P < 0.05.
도 10A-B는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심장 근육 세포 및 인간 골격 근육 섬유의 형질 도입의 개선 규모에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 10A: 야생형 AAV8 및 AAV9와 비교하여 신규한 AAV 캡시드 변이체에 의해 인간 심장 근육 세포의 형질 도입에서 폴드 증가(fold increase), 근육 질병에 대한 임상 적용에 가장 널리 사용된 혈청형. 도 10B: 야생형 AAV8 및 AAV9 와 비교하여 신규한 AAV 캡시드 변이체에 의해 인간 골격 근육 섬유의 형질 도입에서 폴드 증가.
도 11A-B는 CAG 프로모터의 조절하에 루시페라제(luciferase) 이식 유전자를 발현하는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드를 포함하는 재조합 AAV 바이러스에 의해 생체 내에서 생쥐 조직의 형질 도입에 대한 데이터를 제공한다. 생쥐에게 꼬리 정맥을 통해 동물당 2 X 1011 바이러스 게놈의 단일 정맥 내 주사를 주었다. 도 11A: 14일(좌측) 및 28일(우측) 투여 후 루시페라제의 생전(in life) 이미징은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 세포를 형질 도입시킬 수 있음을 입증한다. 도 11B: 심장, 횡경막 및 사두근에서 56일 투여 후의 루시페라제 활성은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 심장 및 골격 근육을 형질 도입할 수 있다는 것을 입증한다.
도 12A-B는 CAG 프로모터의 조절하에 GFP 이식 유전자를 발현하는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드를 포함하는 재조합 AAV 바이러스에 의해 생체 내에서 비-인간 영장류 골격 근육의 형질 도입에 대한 데이터를 제공한다. 비-인간 영장류를 각각 1011개의 바이러스 게놈의 3회 근육 내 주사로 좌측 외측광근(vastus lateralis) 내로 투여하고, 4주 투여 후 근육 조직을 분석하였다. 도 12A: 2x, 4x 및 20x 배율에서 근위(proximal) 생검 부위의 횡단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있다는 것을 입증한다. 도면 12B: 2x, 4x 및 20x 배율에서 원위(distal) 생검 부위의 종단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있음을 입증한다.
본 발명의 방법 및 조성물을 기재하기 전에, 본 발명은 기재된 특정 방법 또는 조성물에 제한되지 않으며, 따라서 다양할 수 있음을 이해되어야 한다. 또한, 본원에 사용된 용어는 단지 특정 실시형태만을 설명하기 위한 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서만 제한될 것이므로 제한적인 것으로 의도되지 않는다는 것이 이해되어야 한다.
본원에 개시된 본 발명은 도면 및 설명에 예시되어 있다. 그러나 특정 실시형태가 도면에 도시되어 있지만, 본 발명을 도시 및/또는 개시된 특정 실시형태에 제한하기 위함은 아니다. 오히려, 본원에 개시된 본 발명은 본 발명의 사상 및 범위 내에 속하는 모든 변경, 대안적인 구성 및 등가물을 포함하도록 의도된다. 이와 같이, 도면은 예시적인 것이며 제한적인 것이 아닌 것을 의도된다.
값의 범위가 제공되는 경우, 그 범위의 상한 및 하한 사이의, 문맥상 명확히 달리 지시하지 않는 한 하한의 단위의 십분의 일까지의, 각 중간 값(intervening value)이 구체적으로 개시되는 것으로 이해된다. 명시된 범위 내에서 임의의 명시된 값 또는 중간 값 사이의 보다 작은 범위, 및 그러한 명시된 범위 내의 임의의 다른 명시된 값 또는 중간 값이 본 발명에 포함된다. 이들 작은 범위의 상한 및 하한은 독립적으로는 범위에 포함 또는 배제될 수 있고, 상한 및 하한 중 어느 하나 또는 둘 모두가 작은 범위에 포함되는 범위 각각이 또한 본 발명에 포함되며, 명시된 범위에서 임의의 구체적으로 배제된 제한을 받는다. 명시된 범위가 상한 및 하한 중 하나 또는 둘 모두를 포함하는 경우, 이들 포함된 상한 및 하한 중 하나 또는 둘 모두를 제외한 범위도 본 발명에 포함된다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 개시된 것과 유사하거나 동등한 임의의 방법 및 재료가 본 발명의 실시 또는 시험에 사용될 수 있지만, 일부 잠재적이고 바람직한 방법 및 재료가 이하에 설명된다. 본원에 언급된 모든 간행물은 간행물이 인용되는 방법 및/또는 재료를 개시하고 설명하기 위해 본원에 참고로 포함된다. 본 개시내용은 모순이 있는 범위까지 포함된 간행물의 임의의 개시내용을 대체하는 것으로 이해된다.
본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 본원에 기술되고 예시된 개별 실시형태 각각은 본 발명의 범위 또는 사상에서 벗어나지 않는 한 임의의 다른 몇몇 실시형태로부터 용이하게 분리되거나 이들 실시형태와 조합될 수 있는 개별 성분 및 특징을 갖는다. 인용된 모든 방법은 열거된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본원 및 첨부된 특허청구범위에서 사용된 바와 같이, 단수 형태 "하나", "일" 및 "그"는 문맥상 명확하게 달리 지시하지 않는 한 복수 대상을 포함한다. 따라서, 예를 들어, "재조합 AAV 비리온"에 대한 인용은 복수의 이 같은 비리온을 포함하고, "근육 세포"에 대한 인용은 하나 이상의 근육 세포 및 당업자 등에게 공지된 이의 등가물에 대한 인용을 포함한다. 특허청구범위는 임의의 선택적인 성분을 배제하도록 작성될 수 있는 것으로 추가로 주지된다. 이와 같이, 이러한 진술은 특허청구범위의 성분의 인용 또는 "부정적인" 제한의 사용과 관련하여 "단독으로", "오직" 등과 같은 배타적인 용어의 사용을 위한 선행 기준으로서 역할을 하기 위한 것이다.
본원에서 논의된 간행물은 본 출원의 출원일 이전에 그들의 공개를 위해서만 제공된다. 본원에서는 어떠한 것도 본 발명이 선행 발명으로 인해 이 같은 간행물보다 시기를 선행할 자격을 갖지 않는다는 인정으로 해석되어서는 안 된다. 또한, 제공된 간행물의 날짜는 실제 공개일과 다를 수 있으며, 이는 독립으로 확인해야 할 수도 있다.
정의
아데노-관련 바이러스는 비-외피성, 20면체 캡시드 내에 4.7kb 길이의 단일 가닥 DNA 게놈으로 구성된 비병원성 파보바이러스(parvovirus)이다. 게놈은 복제 및 패키징(packaging) 신호의 바이러스 기원으로 기능 하는 역전된 말단 반복(ITR)에 의해 측면에 놓인 3개의 오픈 리딩 프레임(ORF)을 포함한다. rep ORF는 바이러스 복제, 전사 조절, 부위 특이적 통합 및 비리온 조립에서 역할을 하는 4개의 비구조적 단백질을 인코딩한다. cap ORF는 3개의 구조 단백질(VP 1-3)을 인코딩하고, 이들 단백질은 조립되어 60-머(mer)의 바이러스 캡시드를 형성한다. 마지막으로, cap 유전자 내에서 대체 리딩 프레임으로서 존재하는 ORF는 AAV 캡시드 단백질을 핵소체(nucleolus)에 국한시키고 캡시드 조립 과정에서 기능을 하는 바이러스 단백질인 조립-활성화 단백질(AAP)을 생성한다.
몇몇 자연적으로 발생하는("야생형") 혈청형 및 100종 이상의 공지된 AAV 변이체가 존재하며, 이들 각각은 특히 캡시드 단백질의 초가변 영역 내에서 아미노산 서열이 다르며, 따라서 그들의 유전자 전달 특성이 다르다. 어떠한 AAV도 인간 질병과 관련이 없었으며, 그 결과 재조합 AAV가 임상 적용에 매력적인 것이 되었다.
본원에서 개시의 목적상, "AAV"라는 용어는 바이러스 자체 및 그의 유도체를 포함하지만 이에 제한되지 않는 아데노-관련 바이러스의 약어이다. 달리 명시된 경우를 제외하고, 상기 용어는 모든 아형 또는 혈청형 및 복제 가능 형태 및 재조합 형태 모두를 지칭한다. 용어 "AAV"는 AAV 타입 1(AAV-1 또는 AAV1), AAV 타입 2(AAV-2 또는 AAV2), AAV 타입 3A(AAV-3A 또는 AAV3A), AAV 타입 3B(AAV-3B 또는 AAV3B), AAV 타입 4(AAV-4 또는 AAV4), AAV 타입 5(AAV-5 또는 AAV5), AAV 타입 6(AAV-6 또는 AAV6), AAV 타입 7(AAV-7 또는 AAV7), AAV 타입 8(AAV-8 또는 AAV8), AAV 타입 9(AAV-9 또는 AAV9), AAV 타입 10(AAV-10 또는 AAV10 또는 AAVrh10), 조류 AAV, 소 AAV, 개 AAV, 염소 AAV, 말 AAV, 영장류 AAV, 비영장류 AAV 및 양 AAV를 포함하지만 이에 제한되지 않는다. "영장류 AAV"는 영장류를 감염시키는 AAV를 지칭하며, "비영장류 AAV"는 비영장류 포유동물을 감염시키는 AAV를 지치하며, "소 AAV"는 소 포유동물 등을 감염시키는 AAV를 지칭한다.
AAV의 다양한 혈청형의 게놈 서열뿐만 아니라 천연 말단 반복(native terminal repeats)(TRs), Rep 단백질 및 캡시드 서브유닛의 서열은 당업계에 공지되어 있다. 이 같은 서열은 문헌 또는 유전자은행(GenBank)과 같은 공공 데이터베이스에서 찾아 볼 수 있다. 예를 들어, 유전자은행(GenBank) 수탁번호: NC_002077.1(AAV1), AF063497.1(AAV1), NC_001401.2(AAV2), AF043303.1(AAV2), J01901.1(AAV2), U48704.1(AAV3A), NC_001729.1(AAV3A), AF028705.1(AAV3B), NC_001829.1(AAV4), U89790.1(AAV4), NC_006152.1(AA5), AF085716.1(AAV-5), AF028704.1(AAV6), NC_006260.1(AAV7), AF513851.1(AAV7), AF513852.1(AAV8), NC_006261.1(AAV-8), AY530579.1(AAV9), AAT46337(AAV10) 및 AAO88208(AAVrh10)을 참고하며, 이의 전문은 AAV 핵산 및 아미노산 서열을 교시하기 위해 본원에 참고로 포함된다. 예를 들어, Srivistava et al. (1983) J. Virology 45:555; Chiorini et al. (1998) J. Virology 71:6823; Chiorini et al. (1999) J. Virology 73:1309; Bantel-Schaal et al. (1999) J. Virology 73:939; Xiao et al. (1999) J. Virology 73:3994; Muramatsu et al. (1996) Virology 221:208; Shade et. al. (1986) J. Virol. 58:921; Gao et al. (2002) Proc. Nat. Acad. Sci. USA 99:11854; Moris et al. (2004) Virology 33:375-383; 국제 특허 공보 제WO 00/28061호, 제WO 99/61601호, 제WO 98/11244호; 및 미국 특허 제6,156,303호를 또한 참고한다.
AAV 혈청형과 관련된 자연적으로 존재하는 캡 (캡시드) 단백질의 서열은 당업계에 공지되어 있으며, AAV1(서열 식별 번호 1), AAV2(서열 식별 번호 2), AAV3A(서열 식별 번호 3), AAV3B(서열 식별 번호 4), AAV4(서열 식별 번호 5), AAV5(서열 식별 번호 6), AAV6(서열 식별 번호 7), AAV7(서열 식별 번호 8), AAV8(서열 식별 번호 9), AAV9(서열 식별 번호 10), AAV10(서열 식별 번호 11) 및 AAVrh10(서열 식별 번호 12)으로서 본원에 개시된 것들을 포함한다. 용어 "변이체 AAV 캡시드 단백질" 또는 "AAV 변이체"는 자연적으로 존재하거나 "야생형"의 AAV 캡시드 단백질 서열, 예를 들어, 본원에서 서열 식별 번호 1 내지 서열 식별 번호 12에 개시된 바와 같은 서열에 대해 적어도 하나의 변형 또는 치환(결실, 삽입, 점 돌연변이 등을 포함함)을 포함하는 아미노산 서열을 포함하는 AAV 캡시드 단백질을 지칭한다. 변이체 AAV 캡시드 단백질은 야생형 캡시드 단백질의 아미노산 서열에 대해 약 80% 이상의 동일성, 예를 들어 야생형 캡시드 단백질의 아미노산 서열에 대해 85% 이상의 동일성, 90% 이상의 동일성 또는 95% 이상의 동일성, 예를 들어 야생형 캡시드 단백질에 대해 98% 또는 99%의 동일성을 가질 수 있다. 변이체 AAV 캡시드 단백질은 야생형 캡시드 단백질이 아닐 수 있다.
본원에서 개시의 목적상, "AAV 비리온" 또는 "AAV 바이러스 입자"는 적어도 하나의 AAV 캡시드 단백질 및 캡시드화된 AAV 폴리뉴클레오타이드로 구성된 바이러스 입자를 지칭한다.
본원에서 개시의 목적상, 용어 "rAAV"는 재조합 아데노-관련 바이러스를 지칭하는 약어이다. 폴리뉴클레오타이드에 적용되는 "재조합체"는 클로닝, 제한 또는 연결 단계 및 기타 과정의 다양한 조합 산물을 의미하며, 이때 상기 산물은 폴리뉴클레오타이드가 자연계에서 발견되는 폴리뉴클레오타이드와 구별되는 구조체을 생성한다. 재조합 바이러스는 재조합 폴리뉴클레오타이드를 포함하는 바이러스 입자이다. 상기 용어는 각각 원래의 폴리뉴클레오타이드 구조체의 복제물 및 원래의 바이러스 구조체의 자손을 포함한다.
용어 "rAAV 벡터"는 정의상 rAAV 폴리뉴클레오타이드를 포함하는 rAAV 비리온 (즉, rAAV 바이러스 입자)(예를 들어, 전염성 rAAV 비리온)을 포함하고; 또한 rAAV (예를 들어, rAAV를 인코딩하는 단일 가닥 폴리뉴클레오타이드(ss-rAAV); rAAV를 인코딩하는 이중 가닥 폴리뉴클레오타이드(ds-rAAV), 예를 들어 rAAV를 인코딩하는 플라스미드; 및 기타)를 인코딩하는 폴리뉴클레오타이드를 포함한다.
AAV 비리온이 이종성 폴리뉴클레오타이드(즉, 야생형 AAV 게놈 이외의 폴리뉴클레오타이드, 예를 들어, 표적 세포로 전달되는 이식 유전자, 표적 세포로 전달되는 RNAi 작용제 또는 CRISPR 작용제 등)를 포함하는 경우, 이는 전형적으로 "재조합 AAV(rAAV) 비리온" 또는 "rAAV 바이러스 입자"로서 지칭된다. 일반적으로, 이종성 폴리뉴클레오타이드는 적어도 하나, 일반적으로 2개의 AAV 전위(inverted) 말단 반복서열(ITR) 옆에 위치한다.
용어 "패키징"은 AAV 입자의 조립 및 캡시드화를 초래하는 일련의 세포 내 사건을 지칭한다. AAV "rep" 및 "cap" 유전자는 아데노-관련 바이러스의 복제 및 캡시드화 단백질을 인코딩하는 폴리뉴클레오타이드 서열을 지칭한다. AAV rep 및 cap은 본원에서 AAV "패지징 유전자"로서 지칭된다.
AAV에 대한 용어 "헬퍼 바이러스"는 AAV(예를 들어, 야생형 AAV)가 포유동물 세포에 의해 복제되고 패키징될 수 있도록 하는 바이러스를 지칭한다. 아데노바이러스, 헤르페스바이러스, 및 우두 바이러스(vaccinia)와 같은 수두 바이러스를 비롯하여 AAV에 대한 이 같은 다양한 헬퍼 바이러스가 당업계에 공지되어 있다. 하위그룹 C의 아데노바이러스 5형이 가장 보편적으로 사용되지만, 아데노바이러스는 다수의 상이한 하위그룹을 포함한다. 인간, 비인간 포유류 및 조류 기원의 수많은 아데노바이러스가 공지되어 있으며 ATCC와 같은 기탁기관에서 구입 가능하다. 헤르페스 부류의 바이러스에는, 예를 들어 헤르페스 심플렉스 바이러스(HSV) 및 엡스타인-바 바이러스(Epstein-Barr virus; EBV)뿐만 아니라, 사이토메갈로바이러스(cytomegalovirus; CMV) 및 슈도레이비스 바이러스(pseudorabies virus; PRV)를 포함하며, 이들은 또한 ATCC와 같은 기탁기관에서 구입 가능하다.
용어 "헬퍼 바이러스 기능(들)"은 (본원에서 개시된 복제 및 패키징에 대한 기타 요건과 함께) AAV 복제 및 패키징을 허용하는 헬퍼 바이러스 게놈에서 인코딩된 기능(들)을 지칭한다. 본원에 기재된 바와 같이, "헬퍼 바이러스 기능"은 헬퍼 바이러스를 제공하거나, 예를 들어 필수 기능(들)을 인코딩하는 폴리뉴클레오타이드 서열을 생산자 세포에 트랜스 방식으로 제공하는 것을 포함하는 많은 방법으로 제공될 수 있다. 예를 들어, 하나 이상의 아데노바이러스 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 플라스미드 또는 다른 발현 벡터는 rAAV 벡터와 함께 생산자 세포 내로 형질 감염된다.
용어 "감염성" 바이러스 또는 바이러스 입자는 만능적으로 조립된 바이러스 캡시드를 포함하는 것이며, 바이러스 종이 주성(tropism)이 있는 세포 내로 폴리뉴클레오타이드 성분을 전달할 수 있다. 상기 용어는 반드시 바이러스의 복제 능력을 의미하는 것은 아니다. 감염성 바이러스 입자를 계수하기 위한 분석은 본 개시내용 및 당업계의 다른 부분에서 개시되어 있다. 바이러스 감염성은 전체 바이러스 입자에 대한 감염성 바이러스 입자의 비율로 나타낼 수 있다. 전체 바이러스 입자에 대한 감염성 바이러스 입자의 비율을 측정하는 방법은 당업계에 공지되어 있다. 예를 들어, Grainger et al. (2005) Mol. Ther. 11:S337(TCID50 전염성 역가 분석이 기술되어 있음); 및 Zolotukhin et al. (1999) Gene Ther. 6:973을 참고한다. 또한, 실시예를 참고한다.
본원에 사용된 용어 "주성(Tropism)"은 특정 숙주 종의 세포 또는 숙주 종 내의 특정 세포 유형의 바이러스(예를 들어, AAV)에 의한 우선적 표적화를 의미한다. 예를 들어, 심장, 폐, 간 및 근육의 세포를 감염시킬 수 있는 바이러스는 폐 및 근육 세포만을 감염시킬 수 있는 바이러스에 비해 더 넓은(즉, 증가된) 주성을 갖는다. 주성은 또한, 숙주의 특정 유형 세포 표면 분자에 대한 바이러스의 의존성을 포함할 수 있다. 예를 들어, 일부 바이러스는 표면 글리코스아미노글리칸이 있는 세포만을 감염시킬 수 있는 반면, 다른 바이러스는 시알산이 있는 세포만을 감염시킬 수 있다 (이 같은 의존성은 바이러스 감염에 대한 잠재적인 숙주 세포로서 특정 종류의 분자가 결핍된 다양한 세포주를 사용하여 시험할 수 있음). 경우에 따라, 바이러스의 주성은 바이러스의 상대적 선호도를 설명한다. 예를 들어, 첫 번째 바이러스는 모든 세포 유형을 감염시킬 수 있지만 표면 글리코스아미노글리칸으로 이들 세포를 감염시키는데 훨씬 더 성공적이다. 두 번째 바이러스도 동일한 특성을 선호한다면 비록 절대 형질 도입 효율이 유사하지 않을지라도 두 번째 바이러스는 첫 번째 바이러스와 유사(또는 동일)한 주성을 가진 것으로 간주될 수 있다(예를 들어, 두 번째 바이러스도 표면 글리코스아미노글리칸으로 이들 세포를 감염시키는데 더 성공적임). 예를 들어, 두 번째 바이러스는 테스트한 모든 소정의 세포 유형을 감염시킬 때 첫 번째 바이러스보다 더 효율적일 수 있지만, 상대 선호도가 유사(동일)하면 두 번째 바이러스는 여전히 첫 번째 바이러스와 유사(또는 동일)한 주성을 갖는 것으로 간주될 수 있다. 일부 실시형태에서, 대상 변이체 AAV 캡시드 단백질을 포함하는 비리온의 주성은 자연적으로 발생하는 비리온에 비해 변경되지 않는다. 일부 실시형태에서, 대상 변이체 AAV 캡시드 단백질을 포함하는 비리온의 주성은 자연적으로 발생하는 비리온에 비해 확대된다(즉, 넓어진다). 일부 실시형태에서, 대상 변이체 AAV 캡시드 단백질을 포함하는 비리온의 주성은 자연적으로 발생하는 비리온에 비해 감소된다.
용어 "복제 가능(replication-competent)" 바이러스(예를 들어, 복제 가능 AAV)는 감염성이고 감염 세포에서(즉, 헬퍼 바이러스 또는 헬퍼 바이러스 기능의 존재 하에) 복제될 수 있는 표현형적으로 야생형 바이러스를 지칭한다. AAV의 경우, 복제 가능성은 일반적으로 기능적 AAV 패키징 유전자의 존재를 필요로 한다. 일반적으로, 본원에 기재된 바와 같은 rAAV 벡터는 하나 이상의 AAV 패키징 유전자가 없기 때문에 포유동물 세포(특히 인간 세포)에서 복제 불가능하다. 전형적으로, 이 같은 rAAV 벡터에는 AAV 패키징 유전자와 유입되는 rAAV 벡터 사이의 재조합에 의해 복제 가능 AAV가 생성될 가능성을 최소화하기 위해 임의의 AAV 패키징 유전자 서열이 결여되어 있다. 다수의 실시형태에서, 본원에 기재된 바와 같은 rAAV 벡터 제제는 복제 가능 AAV(rcAAV; RCA로도 지칭됨)를 거의 함유하지 않는 제제(예를 들어, 102개의 rAAV 입자당 약 1개 미만의 rcAAV, 104개의 rAAV 입자당 약 1개 미만의 rcAAV, 10개의 rAAV 입자당 약 1개 미만의 rcAAV, 1012개의 rAAV 입자당 약 1개 미만의 rcAAV 또는 rcAAV 없음)이다.
용어 "폴리뉴클레오타이드"는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 또는 이의 유사체를 비롯하여 임의의 길이를 갖는 중합체 형태의 뉴클레오타이드를 지칭한다. 폴리뉴클레오타이드는 메틸화 뉴클레오타이드 및 뉴클레오타이드 유사체와 같은 변형된 뉴클레오타이드를 포함할 수 있으며, 비뉴클레오타이드 성분에 의해 중단되어 있을 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 중합체의 조립 이전 또는 이후에 부여될 수 있다. 본원에 사용된 용어 폴리뉴클레오타이드는 이중 가닥 및 단일 가닥 분자를 지칭하며, 이들은 상호 교환 가능하다. 달리 특정되거나 요구되지 않는 한, 폴리뉴클레오타이드를 포함하는 본원의 임의의 실시형태는 이중 가닥 형태 및 이중 가닥 형태를 구성하는 것으로 공지되거나 예측되는 2개의 상보적인 단일 가닥 형태의 각각을 둘 모두 포함한다.
폴리뉴클레오타이드 또는 폴리펩타이드는 다른 폴리뉴클레오타이드 또는 폴리펩타이드와 일정 비율의 "서열 동일성"을 가지며, 이는 배열 시에 2개의 서열을 비교할 때의 염기 또는 아미노산의 비율이 동일하다는 것을 의미한다. 서열 유사성은 다수의 상이한 방식으로 결정될 수 있다. 서열 동일성을 결정하기 위해, BLAST를 포함한 방법 및 컴퓨터 프로그램을 사용하여 서열을 배열할 수 있으며, 이는 월드와이드웹 ncbi.nlm.nih.gov/BLAST/에서 구입 가능하다. 또 다른 배열 알고리즘은 옥스포드 몰레큘러 그룹 인코포레이티드(Oxford Molecular Group, Inc)의 자회사인 미국 위스콘신 주 매디슨 소재의 유전학 컴퓨팅 그룹(Genetics Computing Group; GCG) 패키지에서 이용 가능한 FASTA이다. 배열를 위한 기타 기법은 문헌[Methods in Enzymology, vol. 266: Computer Methods for Macromolecular Sequence Analysis (1996), ed. Doolittle, Academic Press, Inc., a division of Harcourt Brace & Co., San Diego, California, USA]에 기재되어 있다. 특히 흥미로운 것은 서열에서 갭을 허용하는 배열 프로그램이다. 스미스-워터먼(Smith-Waterman)은 서열 배열에서 갭을 허용하는 알고리즘의 한 유형이다. 문헌[Meth. Mol. Biol. 70:173-187 (1997)]을 참고한다. 또한, 니들맨(Needleman) 및 분쉬(Wunsch) 배열 방법을 사용하는 GAP 프로그램을 이용하여 서열을 배열할 수 있다. 문헌[J. Mol. Biol. 48:443-453 (1970)]을 참고한다.
용어 "유전자"는 세포에서 어떤 종류의 기능을 수행하는 폴리뉴클레오타이드를 지칭한다. 예를 들어, 유전자는 유전자 산물을 인코딩할 수 있는 오픈 리딩 프레임을 함유할 수 있다. 유전자 산물의 한 예는 유전자로부터 전사되고 번역되는 단백질이다. 유전자 산물의 다른 예로는 RNA, 예를 들어 기능성 RNA 산물, 예를 들어 앱타머(aptamer), 간섭 RNA, 리보솜 RNA(rRNA), 전달 RNA(tRNA), 비-코팅 RNA(ncRNA), 뉴클레아제용 가이드 RNA 등이 있으며, 전사는 되지만 번역되지는 않는다.
용어 "유전자 발현 산물" 또는 "유전자 산물"은 상기에서 정의된 바와 같은 특정 유전자의 발현으로부터 얻어진 분자이다. 유전자 발현 산물은, 예를 들어 폴리펩타이드, 앱타머(aptamer), 간섭 RNA, 메신저 RNA(mRNA), rRNA, tRNA, 비-코딩 RNA(ncRNA) 등을 포함한다.
용어 "siRNA 작용제"("소형 간섭" 또는 "짧은 간섭 RNA"(또는 siRNA))는 관심 있는 유전자("표적 유전자")로 표적화하는 뉴클레오타이드의 RNA 이중체(duplex)이다. "RNA 이중체"는 이중 가닥 RNA(dsRNA)의 영역을 형성하는 RNA 분자의 2개의 영역 사이의 상보적인 쌍형성으로 형성된 구조를 지칭한다. siRNA는 siRNA의 이중체 부분의 뉴클레오타이드 서열이 표적 유전자의 뉴클레오타이드 서열에 상보적이라는 점에서 유전자에 "표적화"된다. 일부 실시형태에서, siRNA의 이중체는 30개 미만의 뉴클레오타이드 서열이다. 일부 실시형태에서, 이중체는 29개, 28개, 27개, 26개, 25개, 24개, 23개, 22개, 21개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개 또는 10개의 뉴클레오타이드 서열일 수 있다. 일부 실시형태에서, 이중체는 19개 내지 25개의 뉴클레오타이드 서열이다. 일부 실시형태에서, siRNA는 매개 유전자 표적화는 동물 세포의 내생성 RNA 간섭(RNAi) 경로를 활성화하기 위해 DNA 구조체를 이용하는 유전자 사일런싱 기법(gene-silencing technique)인 DNA-유도 RNA 간섭을 사용하여 수행된다. 이 같은 DNA 구조체는 자기-상보적인 이중 가닥 RNA, 전형적으로는 짧은 헤어핀 RNA(short-hairpin RNA)(shRNA)를 발현하기 위해 설계된 것이며, 이는 일단 가공되면 표적 유전자 또는 유전자들의 사일런싱을 초래한다. 내생성 mRNA 또는 바이러스 RNA를 포함하는 임의의 RNA는 목적하는 mRNA 표적에 상보적인 이중 가닥 RNA를 발현하는 구조체를 설계함으로써 사일런싱될 수 있다. 이와 같이, siRNA 작용제의 RNA 이중체 부분은 shRNA로서 지칭되는 짧은 헤어핀 구조의 일부일 수 있다. 이중체 부분 이외에도, 헤어핀 구조는 이중체를 형성하는 2개의 서열 사이에 위치한 루프 부분을 함유할 수 있다. 루프는 길이가 다를 수 있다. 일부 실시형태에서, 루프는 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개 또는 13개의 뉴클레오타이드 서열이다. 상기 헤어핀 구조는 또한 3' 또는 5' 돌출 부분을 함유할 수 있다. 일부 실시형태에서, 돌출부는 0개, 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드 서열을 갖는 3' 또는 5' 돌출부이다. 일반적으로, 표적 유전자의 발현 산물(예를 들어, mRNA, 폴리펩타이드 등)의 수준은 5' 비번역(UT) 영역, ORF 또는 3' UT 영역을 포함하는 표적 유전자 전사체의 적어도 19개 내지 25개의 뉴클레오타이드 서열의 긴 분절(예를 들어, 20개 내지 21개의 뉴클레오타이드 서열)에 대해 상보적인 특정 이중 가닥 뉴클레오타이드 서열을 함유하는 siRNA 작용제(예를 들어, siRNA, shRNA 등)에 의해 감소된다. 일부 실시형태에서, 짧은 간섭 RNA는 약 19개 내지 25개의 뉴클레오타이드 서열이다. 예를 들어, siRNA 기술의 설명에 대해서는 PCT 출원 제WO O0/44895호, 제WO 99/32619호, 제WO 01/75164호, 제WO 01/92513호, 제WO 01/29058호, 제WO 01/89304호, 제WO 02/16620호 및 제WO 02/29858호; 및 미국 특허 공개공보 제2004/0023390호를 참고한다. siRNA 및/또는 shRNA는 핵산 서열에 의해 인코딩될 수 있고, 핵산 서열은 또한 프로모터를 포함할 수 있다. 핵산 서열은 또한 폴리아데닐화 신호를 포함할 수 있다. 일부 실시형태에서, 폴리아데닐화 신호는 최소 합성 폴리아데닐화 신호이다.
용어 "안티센스 RNA"는 유전자 발현 산물에 대해 상보적인 RNA를 포함한다. 예를 들어, 특정 mRNA에 표적화되는 안티센스 RNA는 mRNA에 대해 상보적인 RNA 기반 작용제(또는 변형된 RNA 일 수 있음)이며, 여기서 mRNA에 대한 안티센스 RNA의 혼성화는(예를 들어, RNA의 안정성의 변경, RNA의 번역의 변경 등을 통해) mRNA의 발현을 변경시킨다. 또한 "안티센스 RNA"에는 안티센스 RNA를 인코딩하는 핵산이 포함된다.
"CRISPR/Cas9 작용제"와 관련하여 용어 "CRISPR"은 침입 핵산의 사이런싱을 유도하기 위해 CRISPR RNA(crRNA)를 사용하여 박테리아와 고세균(archaea)에 바이러스 및 플라스미드에 대한 적응성 면역력을 제공하도록 진화한 군집형의 일정하게 분포하는 짧은 회문 구조 반복 서열(clustered regularly interspaced short palindromic repeats)/CRISPR 관련 (Cas) 시스템을 포함한다. Cas9 단백질(또는 이의 기능적 등가물 및/또는 변이체, 즉 Cas9-유사 단백질)은 당연히 crRNA 및 tracrRNA(가이드 RNA로도 지칭됨)로 지칭되는 2개의 자연적으로 발생하거나 합성인 RNA 분자와 단백질의 결합에 의존하는 DNA 엔도뉴클레아제 활성을 포함한다. 일부 경우, 2개의 분자가 공유 결합되어 단일 분자를 형성한다(단일 가이드 RNA("sgRNA")로도 지칭됨). 따라서, Cas9 또는 Cas9-유사 단백질은 DNA-표적화 RNA(이의 용어는 2분자 가이드 RNA 구성 및 단일 분자 가이드 RNA 구성 둘 모두를 포함함)와 결합하며, 이는 Cas9 또는 Cas9-유사 단백질을 활성화시키고, 상기 단백질을 표적 핵산 서열로 유도한다.
Cas9 또는 Cas9-유사 단백질이 이의 천연 효소 기능을 유지하면, 이는 표적 DNA를 절단하여 이중 가닥 파열을 생성하고, 이는 게놈 변경(즉, 편집: 결실, 삽입(공여체 폴리뉴클레오타이드가 존재하는 경우))을 야기할 수 있으며, 그 결과 유전자 발현을 변경할 수 있다. Cas9의 일부 변이체(이의 변이체는 Cas9-유사라는 용어에 의해 포함됨)는 DNA 절단 활성이 감소하도록 변경되었다(일부 경우에 이들은 표적 DNA의 두 가닥 대신 단일 가닥을 절단하는 반면, 다른 경우에는 DNA 절단 활성이 없을 때까지 심각하게 감소하였다). DNA 절단 활성이 감소된 Cas9-유사 단백질(심지어 DNA 절단 활성이 없음)은 여전히 RNA 중합효소 활성을 차단하기 위해 표적 DNA로 유도될 수 있다. 대안적으로, Cas9 또는 Cas9-유사 단백질은 VP64 전사 활성화 도메인을 Cas9 단백질에 융합시키고 테트라루프(tetraloop) 및 스텝-루프(stem-loop)에서 융합 단백질을 MS2 RNA 앱타머를 포함하는 MS2-P65-HSF1 헬퍼 단백질 및 단일 가이드 RNA와 함께 동시 전달하여 전사를 활성화시키는 세포에서 협주적 활성화 매개인자(synergistic activation mediator; Cas9-SAM) 복합체를 형성함으로써 변형될 수 있다. 따라서 효소적 불활성 Cas9-유사 단백질은 표적 DNA의 전사를 차단하거나 활성화하기 위해 DNA-표적화 RNA에 의해 표적 DNA의 특정 위치에 표적화될 수 있다. 본원에 사용된 용어 "CRISPR/Cas9 작용제"는 상기에서 기재된 바와 같거나 당업계에 공지된 모든 형태의 CRISPR/Cas9를 포함한다.
CRISPR 작용제에 대한 자세한 정보는, 예를 들어 (a) 문헌[Jinek et. al., Science. 2012 Aug 17; 337 (6096):816-21:"A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity"]; (b) 문헌[Qi et al., Cell. 2013 Feb 28; 152(5):1173-83:"Repurposing CRISPR as an RNA- guided platform for sequence- specific control of gene expression"], 및 (c) 미국 특허 출원 번호 제13/842,859호 및 PCT 출원 번호 제PCT/US13/32589호에서 찾아볼 수 있으며, 이들 전문은 전체가 본원에 참고로 포함된다. 따라서, 본원에서 사용된 용어 "CRISPR 작용제"는 Cas9-기반 시스템(예를 들어, Cas9 또는 Cas9-유사 단백질; DNA-표적화 RNA, 예를 들어 crRNA-유사 RNA, tracrRNA-유사 RNA, 단일 가이드 RNA 등의 임의의 요소; 공여체 폴리뉴클레오타이드; 및 기타)에서 사용될 수 있는 자연적으로 발생하고/하거나 합성인 서열을 포함하는 임의의 작용제(또는 이 같은 작용제를 인코딩하는 핵산)를 포함한다.
"아연-핑거 뉴클레아제"(ZFN)는 아연 핑거 DNA 결합 도메인을 DNA 절단 도메인에 융합시킴으로써 생성되는 인공 DNA 엔도뉴클레아제를 의미한다. ZFN은 목적하는 DNA 서열을 표적화하도록 가공될 수 있으며, 이는 아연-핑거 뉴클레아제가 독특한 표적 서열을 절단할 수 있도록 한다. 세포에 도입되면 ZFN은 이중 가닥 파열을 유도함으로써 세포(예를 들어, 세포 게놈) 내의 표적 DNA를 편집(edit)하는 데 사용될 수 있다. ZFN 사용에 대한 추가의 정보를 얻기 위해, 예를 들어 문헌[Asuri et al., Mol Ther. 2012 Feb; 20(2): 329-38]; 문헌[Bibikova et al. Science. 2003 May 2; 300(5620): 764]; 문헌[Wood et al. Science. 2011 Jul 15; 333(6040): 307]; 문헌[Ochiai et al. Genes Cells. 2010 Aug; 15(8): 875-85]; 문헌[Takasu et. al., Insect Biochem Mol Biol. 2010 Oct; 40(10): 759-65]; 문헌[Ekker et al, Zebrafish 2008 Summer; 5(2): 121-3]; 문헌[Young et al, Proc Natl Acad Sci U S A. 2011 Apr 26; 108(17): 7052-7]; 문헌[Goldberg et al, Cell. 2010 Mar 5; 140(5): 678-91]; 문헌[Geurts et al, Science. 2009 Jul 24; 325(5939): 433]; 문헌[Flisikowska et al, PLoS One. 2011; 6(6): e21045. doi: 10.1371/journal.pone.0021045. Epub 2011 Jun 13]; 문헌[Hauschild et al, Proc Natl Acad Sci U S A. 2011 Jul 19; 108(29): 12013-7]; 및 문헌[Yu et al, Cell Res. 2011 Nov;21(l 1): 1638-40]을 참고하며; 이의 전문은 ZFN에 관한 이들의 교시를 위해 본원에서 참고로 포함된다. 용어 "ZFN 작용제"는 아연 핑커 뉴클레아제 및/또는 아연 핑거 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함한다.
"전사 활성화제-유사 이펙터 뉴클레아제" 또는 "TALEN" 작용제는 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN)를 지칭한다. TALEN은 TAL(전사 활성화제-유사) 이펙터 DNA 결합 도메인을 DNA 절단 도메인에 융합시킴으로써 생성되는 인공 DNA 엔도뉴클레아제이다. TALEN은 임의의 목적하는 DNA 서열에 실질적으로 결합하도록 신속하게 가공될 수 있으며, 세포에 도입되는 경우 TALEN은 이중 가닥 파열을 유도함으로써 세포(예를 들어, 세포 게놈)의 표적 DNA를 편집하기 위해 사용될 수 있다. TALEN 사용에 대한 추가의 정보를 얻기 위해, 예를 들어 문헌[Hockemeyer et al. Nat Biotechnol. 2011 Jul 7; 29(8): 731-4]; 문헌[Wood et al. Science. 2011 Jul 15; 333(6040): 307]; 문헌[Tesson et al. Nat Biotechnol. 2011 Aug 5; 29(8): 695-6]; 및 문헌[Huang et. al., Nat Biotechnol. 2011 Aug 5; 29(8): 699-700]을 참고하며; 이의 전문은 TALEN과 관련하여 그들의 교시를 위해 본원에서 참고로 포함된다. 용어 "TALEN 작용제"는 TALEN 및/또는 TALEN을 인코딩하는 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함한다.
용어 "제어 요소" 또는 "제어 서열"은 폴리뉴클레오타이드의 복제, 복사, 전사, 접합, 번역 또는 분해를 포함하는 폴리뉴클레오타이드의 기능 조절에 기여하는 분자의 상호 작용에 관련된 뉴클레오타이드 서열을 지칭한다. 상기 조절은 과정의 빈도, 속도 또는 특이성에 영향을 미칠 수 있으며, 특성상 강화되거나 억제될 수 있다. 당해 기술분야에 공지된 제어 요소는, 예를 들어 프로모터 및 인핸서(enhancer)와 같은 전사 조절 서열을 포함한다. 프로모터는 RNA 중합효소에 결합하고 일반적으로 프로모터로부터 하류(3' 방향)에 위치하는 코딩 영역의 전사를 개시하는 특정 조건하에서 가능한 DNA 영역이다. 프로모터는 편재적으로 작동할 수 있으며, 예를 들어 CAG 또는 CMV 프로모터와 같이 많은 세포 유형에서 활성이거나;조직 또는 세포 특이적으로 활성일 수 있다, 예를 들어 프로모터가 심장 근육 세포의 발현에 대해 조직 특이적일 수 있다.
용어 "작동 가능하게 연결된" 또는 "작동성으로 연결된"은 유전 요소가 병치(juxtaposition)된 것을 지칭하며, 이때 상기 요소는 이들이 예상되는 방식으로 작동할 수 있도록 하는 관계에 있다. 예를 들어, 프로모터가 코딩 서열의 전사를 개시하는 것을 돕는 경우, 프로모터는 코딩 영역에 작동 가능하게 연결된다. 이러한 기능적 관계가 유지되는 한, 프로모터와 코딩 영역 사이에는 개재 잔기가 존재할 수 있다.
용어 "발현 벡터"는 관심 있는 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드 영역을 포함하는 벡터를 포함하고, 의도된 표적 세포에서 단백질의 발현을 수행하는데 사용된다. 발현 벡터는 또한 표적에서 단백질의 발현을 촉진하기 위해 인코딩 영역에 작동 가능하게 연결된 제어 요소를 포함할 수 있다. 제어 요소와 이들이 발현을 위해 작동 가능하게 연결된 유전자 또는 유전자들의 조합은 때때로 "발현 카세트(expression cassette)"로서 지칭되며, 이들 중 다수는 당업계에 공지되어 있고 이용 가능하거나, 당업계에서 이용 가능한 성분으로부터 용이하게 구성될 수 있다.
용어 "이종성"은 그것이 비교되는 나머지 독립체(entity)와 유전자형으로 별개인 독립체로부터 유래한다는 것을 의미한다. 예를 들어, 유전 공학 기술에 의해 다른 종에서 유래한 플라스미드 또는 벡터에 도입된 폴리뉴클레오타이드는 이종성 폴리뉴클레오타이드이다. 천연의 코딩 서열로부터 제거되고 그것이 자연적으로 발견되지 않는 코딩 서열에 작동 가능하게 연결된 프로모터는 이종성 프로모터이다. 따라서, 예를 들어 이종성 유전자 산물을 인코딩하는 이종성 핵산 서열을 포함하는 rAAV는 자연적으로 발생적하는 야생형 AAV에 정상적으로 포함되지 않는 폴리뉴클레오타이드를 포함하는 rAAV이고, 인코딩된 이종성 유전자 산물은 정상적으로는 자연적으로 발생하는 야생형 AAV에 의해 정상적으로 인코딩되지 않은 유전자 산물이다.
용어 "유전적 변경" 및 "유전적 변형"(및 문법상 이의 변이체)은 유전 요소 (예를 들어, 폴리뉴클레오타이드)가 유사 분열 또는 감수 분열이 아닌 방식으로 세포 내로 도입되는 과정을 지칭하기 위해 상호 교환 가능하게 본원에서 사용된다. 상기 요소는 세포에 대해 이종성일 수도 있고, 이는 세포에 이미 존재하는 요소의 추가 사본 또는 개선된 버전일 수도 있다. 유전적 변경은, 예를 들어 전기 천공(electroporation), 인산칼슘 침전 또는 폴리뉴클레오타이드-리포솜 복합체와의 접촉과 같은 당업계에 공지된 임의의 과정을 통해 세포를 재조합 플라스미드 또는 기타 폴리뉴클레오타이드로 형질 감염시킴으로써 수행될 수 있다. 또한, 유전적 변경은, 예를 들어 DNA 또는 RNA 바이러스 또는 바이러스 벡터에 의한 형질 도입 또는 감염에 의해 수행될 수 있다. 일반적으로, 유전적 요소는 세포 내의 염색체 또는 미니-염색체에 도입되지만; 세포 및 이의 자손의 표현형 및/또는 유전자형을 변경시키는 임의의 변경도 이러한 용어에 포함된다.
세포 변형과 관련하여 외생성 DNA(예를 들어, 재조합 바이러스를 통해)에 의해 "유전적으로 변형된" 또는 "형질 전환된" 또는 "형질 감염된" 또는 "형질 도입된"이라는 용어는 이 같은 DNA가 세포 내로 도입되는 경우를 지칭한다. 외생성 DNA가 존재하면 영구적 또는 일시적인 유전적 변화가 일어난다. 형질 전환 DNA는 세포의 게놈 내에 통합(공유 결합)될 수 있거나 통합(공유 결합)되지 않을 수 있다. "클론(clone)"은 유사 분열에 의한 단일 세포 또는 공통 조상으로부터 유래하는 세포 집단이다. "세포주"는 여러 세대 동안 시험관 내에서 안정적으로 성장할 수 있는 일차 세포의 클론이다.
본원에서 사용된 바와 같이, 서열이 시험관 내에서 장기간 세포 배양 도중에 및/또는 생체 내에서 장기간 동안 이의 기능을 수행할 수 있다면, 세포는 유전자 서열에 의해 "안정적으로" 변경, 형질 도입, 유전적 변형 또는 형질 전환되는 것으로 간주된다. 일반적으로, 이 같은 세포는 또한 유전적 변형이 도입되어 변경된 세포의 자손으로 유전될 수도 있다는 점에서 "유전적으로" 변경(유전적으로 변형)된다.
용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 임의의 길이의 아미노산의 중합체를 지칭하기 위해 본원에서 상호 교환 가능하게 사용된다. 또한, 상기 용어는, 예를 들어 이황화 결합 형성, 글리코실화, 지질화, 인산화, 또는 표지화 성분과의 접합과 같이 변형되어 있는 아미노산 중합체를 포함한다. 포유동물 대상에게 유전자 산물을 전달하는 것과 관련하여 논의되는 경우, 항-혈관 신생 폴리펩타이드, 신경 보호 폴리펩타이드 등과 같은 폴리펩타이드 및 이에 대한 조성물은 개개의 온전한 폴리펩타이드 또는 이의 임의의 단편 또는 유전적으로 조작된 유도체을 지칭하며, 이때 이들은 온전한 단백질의 목적하는 생화학적 기능을 유지한다. 유사하게, 항-혈관 신생 폴리펩타이드를 인코딩하는 핵산, 신경 보호 폴리펩타이드를 인코딩하는 핵산, 및 포유류 대상에 대한 유전자 산물의 전달에 사용하기 위한 기타 이 같은 핵산(수용체 세포에 전달될 "이식 유전자"로도 지칭될 수 있음)에 대한 인용은 온전한 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드 또는 목적하는 생화학적 기능을 보유하는 임의의 단편 또는 유전적으로 조작된 유도체를 포함한다.
본원에서 사용된 바와 같이, "단리된" 플라스미드, 핵산, 벡터, 바이러스, 비리온, 숙주 세포, 단백질 또는 다른 물질은 물질 또는 유사한 물질이 자연적으로 발생하거나 초기에 제조되는 곳에 또한 존재할 수 있는 적어도 일부의 기타 성분이 결여된 물질의 제제를 지칭한다. 따라서, 예를 들어 단리된 물질은 정제 기술을 사용하여 원료 혼합물로부터 농축시킴으로써 제조될 수 있다. 농축은 용액의 부피당 중량과 같은 절대 기준으로 측정될 수 있거나, 원료 혼합물에 존재하는 제2의 잠재적 간섭 물질과 관련하여 측정될 수 있다. 본 개시내용에서 실시형태의 농축의 증가는 점점 더 단리되게 된다. 단리된 플라스미드, 핵산, 벡터, 바이러스, 숙주 세포 또는 다른 물질은 일부 실시형태에서, 예를 들어 약 80% 내지 약 90% 순도, 적어도 약 90% 순도, 적어도 약 95% 순도, 적어도 약 98% 순도, 또는 적어도 약 99% 이상의 순도로 정제된다.
본원에서 사용된 바와 같이, 용어 "치료", "치료하기" 등은 목적하는 약리학적 및/또는 생리학적 효과를 얻는 것을 지칭한다. 상기 효과는 질병 또는 이의 증상을 완전히 또는 부분적으로 예방한다는 관점에서 예방적일 수 있고/있거나 질병 및/또는 질병에 기인하는 부작용에 대한 부분적 또는 완전한 치료의 관점에서는 치료적일 수 있다. 본원에서 사용된 바와 같은 "치료"는 포유동물, 특히 인간에서의 질병의 임의의 치료를 포함하며, (a) 질병에 걸리기 쉽거나, 질병에 걸릴 위험이 있지만 아직 질병에 걸린 것으로 진단받은 적이 없는 대상에서 질병(및/또는 질병에 의해 유발된 증상)이 발생하지 않도록 예방하는 단계; (b) 질병(및/또는 질병에 의해 유발된 증상)을 억제하는 단계, 즉 이의 발달을 중지시키는 단계; (c) 질병 (및/또는 질병에 의해 유발된 증상)을 완화시키는 단계, 즉 질병(및/또는 질병에 의해 유발된 증상)의 퇴행을 야기하는 단계, 즉 질병 및/또는 질병의 하나 이상의 증상을 완화시키는 단계를 포함한다. 예를 들어, 대상 조성물 및 방법은 근육 질병의 치료에 관한 것일 수 있다. 근육 질병 및 이의 치료를 평가하기 위한 비제한적인 방법은 치료 단백질 생산을 측정하는 것(예를 들어, 근육 생검, 이어서 면역 조직 화학 검사법 또는 혈청 샘플링, 이어서 ELISA 또는 효소 활성 분석), 심부전 증상(예를 들어, 뉴욕 심장 관련 기능적 분류 또는 심부전 설문지를 갖는 미네소타 리빙), 기능적 심장 상태(예를 들어, 6분 보행 테스트 또는 피크 최대 산소 소비), 바이오 마커 분석(예를 들어, N-말단 프로호르몬 뇌 나트륨이뇨 펩타이드), 좌심실 기능/리모델링(예를 들어, 좌심실 박출 분율 또는 좌심실 말단-수축기 부피), 근육 강도(예를 들어, 의료 연구 협회(MEDICAL RESEARCH COUNCIL)가 뒤셴형 디스트로피(Duchenne Dystrophy), 핸드-헬드 동력 측정법(dynamometry), 또는 최대 중량 리프트의 임상 조사를 기준화한다), 근육 기능(예를 들어, 비그노스(Vignos) 스케일, 시한 기능 테스트, 해머스미스(Hammersmith) 운동 능력 점수, 바닥으로부터의 시한 오름, 보행 테스트, 운동 기능 측정 스케일, 노스 스타(North Star) 이동성 평가, 9홀 PEG 테스트 또는 필라델피아 아동 병원 신경근 장애의 유아 테스트), 근육 질병 증상(예를 들어, 신경근 증상 점수 또는 전반적 임상 인상(Clinical Global Impression)), 미토콘드리아 기능(예를 들어, 31P 자기 공명 분광법), 생활의 질, 환자-보고된 결과, 또는 일일 활동의 질의-기반 평가를 즉정하는 것을 포함한다.
용어 "개인", "숙주", "대상" 및 "환자"는 본원에서 상호 교환 가능하게 사용되며, 인간을 포함하지만 이에 제한되지는 않는 포유류; 유인원을 포함한 비인간 영장류; 스포츠 포유동물(예를 들어, 말); 농장 포유동물(예를 들어, 양, 염소 등); 포유류 애완동물(개, 고양이 등); 설치류(예를 들어, 생쥐, 쥐 등)을 지칭한다.
일부 실시형태에서, 개체는 이전에 자연적으로 AAV에 노출되었으며, 그 결과 항-AAV 항체(즉, AAV 중화 항체)를 함유하게 된 인간이다. 일부 실시형태에서, 개체는 이전에 AAV 벡터가 투여되었던(그 결과, 항-AAV 항체를 함유할 수 있는) 인간이고, 다른 병태의 치료 또는 동일한 병태의 추가적인 치료를 위해 벡터의 재투여가 요구되는 인간이다. 예를 들어, 간, 근육 및 망막-이러한 비히클에 대한 중화 항체에 의해 영향을 받는 모든 조직-에 대한 AAV 유전자의 전달을 포함하는 임상 시험에서의 양성 결과에 기초하여, 다수의 이 같은 치료 응용/질병 표적이 존재한다.
본원에 사용된 바와 같은 용어 "유효량"은 유익하거나 목적하는 임상 결과를 달성하기에 충분한 양이다. 유효량은 하나 이상의 투여분으로 투여될 수 있다. 본 개시내용의 목적상, 화합물(예를 들어, 감염성 rAAV 비리온)의 유효량은 특정 질병 상태(예를 들어, 근육 질병) (및/또는 이와 연관된 증상)의 완화, 개선, 안정화, 반전, 예방, 감속 또는 진행을 지연시키기에 충분한 양이다. 따라서, 감염성 rAAV 비리온의 유효량은 개체의 표적 세포(또는 표적 세포들)에 이종성 핵산을 효과적으로 전달할 수 있는 감염성 rAAV 비리온의 양이다. 유효량은, 예를 들어 RT-PCR, 웨스턴 블랏팅(Western blotting), ELISA, 형광 또는 다른 리포터 판독 등과 같은 당업계에 널리 공지된 기술을 사용하여, 예를 들어 이종성 핵산 서열에 의해 인코딩되는 유전자 산물(RNA, 단백질)을 세포 또는 조직에서 검출함으로써 전임상으로 결정될 수 있다. 유효량은, 예를 들어 본원에 기술되고 당업계에 공지된 바와 같이, 당업계에 공지된 방법, 예를 들어 6분 보행 테스트, 좌심실 박출 분율, 핸드-헬드 동력 측정법, 비그노스 스케일 등을 사용하여 예를 들어 질병의 발병 또는 진행의 변화를 검출함으로써 임상적으로 결정될 수 있다.
용어 "근육 세포" 또는 "근육 조직"은 본원에서 골격 근육, 심장 근육, 평활근(예를 들어, 소화관, 방광 및 혈관) 및 횡경막 근육을 제한 없이 포함하는, 임의의 종류의 근육으로부터 유도된 세포 또는 세포 그룹을 지칭한다. 이와 같은 근육 세포들, 예를 들어 근육 모세포, 근육 세포, 근관 세포, 심장 근육 세포, 및 심장 근육 모세포는 분화되거나 미분화될 수 있다. 근육 조직이 순환계에 용이하게 접근할 수 있기 때문에, 생체 내 근육 세포 및 조직에 의해 생성 및 분비되는 단백질은 전신 혜택을 위해 혈류에 논리적으로 들어갈 것이고, 이에 의해 근육으로부터 단백질 분비의 지속된 치료 수준을 제공한다.
용어 "유도 진화"는 반복적인 유전적 다양화 및 선택 과정을 통해 자연적 진화를 모방하여 생체 분자의 기능을 점진적으로 개선시키는 유익한 돌연변이를 축적하는 시험관 내 및/또는 생체 내 캡시드 공학 방법을 지칭한다. 유도 진화는 종종 변이체가 관심 있는 세포 또는 조직 유형의 감염성의 보다 효율적인 수준을 갖는 라이브러리로부터 AAV 변이체의 선택을 위해 "바이오 패닝(biopanning)"으로도 지칭되는 생체 내 방법을 포함한다.
상세한 설명
아데노-관련 바이러스(AAVs)는 비외피성 캡시드 내에 함유된 4.7kb 길이의 단일 가닥 DNA 게놈을 갖는 파보바이러스의 부류이다. 자연적으로 발생하는 AAV의 바이러스 게놈은 2개의 역위 말단 반복서열(ITR)-바이러스 복제 원점(origin of replication) 및 패키징 신호(packaging signal)로 작용을 함-을 가지며, 이는 2개의 오픈 리딩 프레임(ORF), 즉 rep(바이러스 복제, 전사 조절, 부위-특이적 통합 및 비리온 조립에 작용하는 단백질을 인코딩함) 및 cap에 인접해 있다. cap ORF는 3개의 구조 단백질을 코딩하고, 이들 단백질은 조립되어 60-머(mer)의 바이러스 캡시드를 형성한다. 다수의 자연적으로 발생하는 AAV 변이체 및 혈청형이 분리되었으며, 어떠한 것도 인간 질병과 연관되어 있지 않았다.
AAV의 재조합 버전(recombinant version)은 rep 및 cap 대신에 ITRs 사이에 관심있는 마커 또는 치료용 유전자가 삽입되는 유전자 전달 벡터로 사용될 수 있다. 이들 벡터는 시험관 내 및 생체 내 분열 및 비-분할 세포 모두를 형질 전환하는 것으로 나타났으며, 사후 유사 분열 조직에서 수년간 안정한 형질 전환 유전자의 발현을 초래할 수 있다. 예를 들어, 문헌[Knipe DM, Howley PM. Fields’ Virology. Lippincott Williams & Wilkins, Philadelphia, PA, USA, 2007; Gao G-P, Alvira MR, Wang L, Calcedo R, Johnston J, Wilson JM. 인간 유전자 치료를 위한 벡터로서 붉은털 원숭이에서 유래된 새로운 아데노-관련 바이러스. Proc Natl Acad Sci USA 2002; 99: 11854-9; Atchison RW, Casto BC, Hammon WM. 아데노바이러스 관련 결함 바이러스 입자. Science 1965; 149: 754-6; Hoggan MD, Blacklow NR, Rowe WP. 다양한 아데노바이러스 제제에서 발견되는 작은 DNA 바이러스 연구: 물리적, 생물학적 및 면역학적 특성. Proc Natl Acad Sci USA 1966; 55: 1467-74; Blacklow NR, Hoggan MD, Rowe WP. 사람으로부터 아데노바이러스-관련 바이러스의 분리. Proc Natl Acad Sci USA 1967; 58: 1410-5; Bantel-Schaal U, zur Hausen H. 생식기 부위로부터 분리된 결함있는 사람 파보바이러스의 DNA 특성 분석. Virology 1984; 134: 52-63; Mayor HD, Melnick JL. 작은 데옥시리보핵산 함유 바이러스(피코드나 바이러스 그룹). Nature 1966; 210: 331-2; Mori S, Wang L, Takeuchi T, Kanda T. 게잡이 원숭이에서 두 개의 새로운 아데노-관련 바이러스: 캡시드 단백질의 위형 특성. Virology 2004; 330: 375-83; Flotte TR. 유전자 치료 과정 및 전망: 재조합 아데노-관련 바이러스(rAAV) 벡터. Gene Ther 2004; 11 : 805-10]을 참조한다.
재조합 AAV(본원에서 간단히 "AAV"로 언급됨)는 증가하는 임상 시험에서 유망한 결과를 가져왔다. 그러나 항-캡시드 면역 반응, 특정 조직의 낮은 형질 도입, 특정 세포 유형에 표적화 전달에 대한 무능력 및 상대적으로 낮은 운반 능력과 같은 AAV의 유용성을 제한할 수 있는 유전자 전달에 장애가 있다. 많은 경우 AAV를 향상시키는 능력을 가진 합리적인 설계에 효과적으로 힘을 실어 줄 수 있는 충분한 기계론적 지식이 부족하다. 대안으로, 유도 진화는 특정 생물의학적 요구를 충족시키는 새로운 AAV 변이체를 만드는 전략으로 부상했다. 유도 진화 전략은 생체 분자의 기능을 점진적으로 향상시키는 유익한 돌연변이의 축적을 가능하게 하는 유전적 다양화 및 선택 과정을 활용한다. 이 과정에서 야생형 AAV cap 유전자는 바이러스 입자의 라이브러리를 생성하기 위해 패키징되는 대형 유전자 라이브러리를 만들기 위한 여러 접근법에 의해 다양화되고, 그 후 선택적인 압력이 유전자 전달 장벽을 극복할 수 있는 새로운 변이체를 분리하기 위해 적용된다. 중요하게, 유전자 전달 문제의 기초가 되는 기계론적 근거는 기능의 유도 진화에 대해 알려질 필요가 없으므로 향상된 벡터의 개발을 가속화할 수 있다.
전형적으로, 본원에 개시된 변이체는 AAV 라이브러리 및/또는 라이브러리들의 사용을 통해 생성되었다. AAV 캡시드의 구조 단백질을 인코드하는 유전자인 cap 유전자를 바이러스 게놈 공학 분야에서 숙련된 기술자에 알려지고 쉽게 이용 가능한 일련의 유도 진화 기술에 의해 돌연변이시킴으로써 이러한 AAV 라이브러리 또는 라이브러리들이 생성된다. 예를 들어, Bartel et al. Am. Soc. Gene Cell Ther. 15th Annu. Meet. 20, S140(2012); Bowles, D. et al. J. Virol. 77, 423-432(2003); Gray et al. Mol. Ther. 18, 570-578(2010); Grimm, D. et al. J. Virol. 82, 5887-5911; Koerber, J. T. et al. Mol. Ther. 16, 1703-1709(2008); Li W. et al. Mol. Ther. 16, 1252-1260(2008); Koerber, J. T. et al. Methods Mol. Biol. 434, 161-170(2008); Koerber, J. T. et al. Hum. Gene Ther. 18, 367-378(2007); and Koerber, J. T. et al. Mol. Ther. 17, 2088-2095(2009)를 참고한다. 이 같은 기술은, 제한되지 않지만, 다음과 같다: i) 실수 유발 PCR로 미리 정해진 수정 가능한 속도로 무작위 점돌연변이를 AAV cap 오픈 리딩 프레임(ORF)에 도입한다; ii) 다중 AAV 혈청형으로 유전자 라이브러리를 생성하기 위해 AAV cap 유전자의 무작위 키메라를 생성하는 시험관 내 또는 생체 내 바이러스 재조합 또는 "DNA 셔플링(suffling)"; iii) cap ORF 내의 퇴화된 올리고뉴클레오타이드의 연결에 의한 캡시드의 한정된 부위에서의 무작위 펩타이드 삽입; iv) 트랜스포존 돌연변이 유발을 이용한 AAV cap ORF의 무작위 위치로의 펩타이드-인코딩 서열의 한정된 삽입; v) "루프 스왑(loop-swap)" 라이브러리를 생성하기 위해 천연 AAV 혈청형 및 변이체 중 각 아미노산 위치의 보존 수준에 기초하여 생체 정보로 설계된 펩타이드 서열의 라이브러리로 AAV 캡시드의 표면 루프를 대체; vi) 조상 변이체의 라이브러리를 생성하기 위해 AAV 혈청형 사이의 퇴행성 위치에서 무작위 아미노산 치환(Santiago-Ortiz et al., 2015); 및 이러한 기술들의 조합을 포함한다.
DNA 셔플링은 키메라를 생성하고, 이 키메라는 부모의 속성을 독특하고 종종 유익한 방식으로 결합한다; 그러나, 일부는 패키징할 수 없으므로 사실상 라이브러리의 다양성을 감소시킬 수 있다. 캡시드의 특정 영역(들) 내로의 라이브러리의 다양성 정도는 제한되지 않지만 상기 iii-iv)와 같은 펩타이드 삽입 기술을 통해 달성된다. 라이브러리의 다양성은 상기 v)와 같은 기술로 캡시드의 특정 영역(들) 내에 또한 집중되어 있으며, 이러한 집중은 AAV 캡시드의 표면 노출 루프에 있는 다중 초가변 영역으로 지향된다. 많은 기술이 캡시드의 작은 면적만이 변이되는 변이체 캡시드를 생성하지만, 이들 기술은 추가의 돌연변이 유발 전략과 쌍을 이루어 완전한 캡시드를 변형시킬 수 있다.
일단 AAV 라이브러리 또는 라이브러리들이 생성되면, 각 AAV 입자가 캡시드를 인코딩하는 cap 유전자를 둘러싸는 돌연변이 캡시드로 구성되도록 바이러스는 패키징되고 정제된다. 그런 다음, 라이브러리의 변이체는 AAV 분야에서 숙련된 기술자에 의해 공지되어 쉽게 활용할 수 있는 시험관 내 및/또는 생체 내 선택압 기술에 적용된다. 예를 들어, Maheshri, N. et al. Nature Biotech. 24, 198-204(2006); Dalkara, D. et al. Sci. Transl. Med. 5, 189ra76(2013); Lisowski, L. et al. Nature. 506, 382-286(2013); Yang, L. et al. PNAS. 106, 3946-3951(2009); Gao, G. et al. Mol. Ther. 13, 77-87(2006); 및 Bell, P. et al. Hum. Gene. Ther. 22, 985-997(2011)를 참고한다. 예를 들어, 제한 없이, AAV 변이체는 i) 상이한 분획의 용출이 변경된 결합 특성을 갖는 변이체를 생성하는 친화성 컬럼; ii) 1차 세포 - 인체 세포의 행동을 모방하는 조직 표본 또는 불멸 세포주로부터 분리된 - 증가 된 효율 및/또는 조직 특이성을 갖는 AAV 변이체를 생산; iii) 동물 모델 - 임상 유전자 치료 환경을 모방한 - 표적 조직을 성공적으로 감염시킨 AAV 변이체를 생산; iv) 이식된 인간 세포를 감염하는 AAV 변이체를 생산하는 인간 이종 이식 모델; 및/또는 이들의 선택 기술의 조합을 사용하여 선택될 수 있다.
일단 바이러스가 선택되면, 제한 없이, 아데노바이러스 - 매개 복제, PCR 증폭, 차세대 시퀀싱 및 클로닝 등과 같은 공지된 기술에 의해 회수될 수 있다. 그런 다음, 선택 기법을 반복하여 바이러스 복제를 풍부하게 하고 AAV DNA를 분리하여 관심있는 특정 변이체 cap 유전자를 회수한다. 이 같은 선택된 변이체는 추가 변형 또는 돌연변이를 받아 AAV 바이러스 적합성을 반복적으로 증가시키기 위한 추가 선별 단계의 새로운 출발점으로 작용할 수 있다. 그러나 어떤 경우에는, 성공적인 캡시드가 추가 돌연변이 없이 생성되었다.
본원에 개시된 AAV 변이체는 적어도 부분적으로 생체 내 유도 진화 방법론, 예를 들어 정맥 내 투여 후 영장류 심장 및 골격 근육 스크린의 사용을 포함하는 전술한 기술의 사용을 통해 생성되었다. 이와 같이, 본원에 개시된 AAV 변이체 캡시드는 상응하는 모 AAV 캡시드 단백질보다 영장류 근육 세포의 더 효율적인 형질 도입을 부여하는 아미노산 서열의 하나 이상의 변형을 포함한다. 본원에 사용된 "상응하는 모 AAV 캡시드 단백질"은 본 발명의 변이체 AAV 캡시드 단백질과 동일한 야생형 또는 변이체 AAV 혈청형의 AAV 캡시드 단백질을 지칭 하나, 본 발명 변이체 AAV 캡시드 단백질의 하나 이상의 아미노산 서열 변형을 포함하지 않는다. 특정 실시 양태에서, 본원에 기재된 바와 같은 변이체 AAV 캡시드 단백질을 포함하는 AAV는 전신 또는 조직-표적화된 투여 후 신체 전체에 걸쳐 심장 근육 및/또는 다중 골격 근육 그룹에 대하여 전신성 주성을 갖는다.
일부 실시 양태에서, 본 발명의 변이체 AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해 AAV 캡시드 단백질 GH 루프 또는 루프 IV에 공유 결합에 의해 삽입된 약 5개 아미노산 내지 약 20개 아미노산의 이종성 펩타이드를 포함한다. AAV 캡시드 단백질의 "GH 루프" 또는 루프 IV는 당업계에서 AAV 캡시드 단백질의 GH 루프 또는 루프 IV로 언급되는 용매 - 접근 가능한 부분을 의미한다. AAV 캡시드의 GH 루프/루프 IV에 대해서는, 예를 들어, van Vliet et al. (2006) Mol. Ther. 14:809; Padron et al.(2005) J. Virol. 79:5047; 및 Shen et al.(2007) Mol. Ther. 15:1955 참고한다. 따라서, 예를 들어, 삽입 부위는 AAV VP1 캡시드 단백질의 약 아미노산 411-650 내에 있을 수 있다. 예를 들어, 삽입 부위는 AAV1 VP1의 아미노산 571-612 내, AAV2 VP1의 아미노산 570-611 내, AAV3A VP1의 아미노산 571-612 내, AAV3B VP1의 아미노산 571-612 내, AAV4 VP1의 아미노산 569-610 내, AAV5 VP1의 아미노산 560-601 내, AAV6 VP1의 아미노산 571 내지 612 내, AAV7 VP1의 아미노산 572 내지 613 내, AAV8 VP1의 아미노산 573 내지 614 내, AAV9 VP1의 571 내지 612 내 또는 AAV10 VP1의 아미노산 573 내지 614 내 또는 그의 임의의 변이체의 상응하는 아미노산일 수 있다. 당업자는 다양한 AAV 혈청형의 캡시드 단백질의 아미노산 서열의 비교에 기초하여, "AAV2의 아미노산에 상응하는" 삽입 부위가 임의의 주어진 AAV 혈청형의 캡시드 단백질에 존재할 것이라는 것을 알 것이다. 야생형(자연 발생) 혈청형 AAV1, AAV2, AAV3A, AAV3B 및 AAV4-10 사이의 아미노산 위치를 제공하는 야생형 AAV 서열 식별 번호 1-11의 정렬에 대해서는 도 6을 또한 참조한다.
특정 실시 양태에서, 삽입 부위는 임의의 야생형 AAV 혈청형 또는 AAV 변이체의 VP1의 아미노산 570-614 사이에 위치한 2개의 인접한 아미노산 사이의 단일 삽입 부위이며, 예를 들어, 삽입 부위는 임의의 AAV 혈청형 또는 변이체의 VP1의 아미노산 570-610, 아미노산 580-600, 아미노산 570-575, 아미노산 575-580, 아미노산 580-585, 아미노산 585-590, 아미노산 590-600 또는 아미노산 600-614에 위치한 2개의 인접한 아미노산 사이이다. 예를 들어, 삽입 부위는 아미노산 580 및 581, 아미노산 581 및 582, 아미노산 583 및 584, 아미노산 584 및 585, 아미노산 585 및 586, 아미노산 586 및 587, 아미노산 587 및 588, 아미노산 588 및 589, 또는 아미노산 589 및 590 사이일 수 있다. 삽입 부위는 아미노산 575와 576, 아미노산 576과 577, 아미노산 577과 578, 아미노산 578과 579, 또는 아미노산 579와 580 사이일 수 있다. 삽입 부위는 아미노산 590 및 591, 아미노산 591 및 592, 아미노산 592 및 593, 아미노산 593 및 594, 아미노산 594 및 595, 아미노산 595 및 596, 아미노산 596 및 597, 아미노산 597 및 598, 아미노산 598 및 599, 또는 아미노산 599 및 600 사이일 수 있다. 예를 들어, 삽입 부위는 AAV2의 아미노산 587과 588 사이, AAV1의 아미노산 590과 591 사이, AAV3A의 아미노산 588과 589 사이, AAV3B의 아미노산 588과 589 사이, AAV4의 아미노산 584와 585 사이, AAV5의 아미노산 575와 576 사이, AAV6의 아미노산 590과 591 사이, AAV7의 아미노산 589와 590 사이, AAV8의 아미노산 590과 591 사이, AAV9의 아미노산 588과 589 사이, 또는 AAV10의 아미노산 588과 589 사이일 수 있다.
일부 실시 양태에서, 본원에 개시된 펩타이드 삽입은 5개의 아미노산, 6개의 아미노산, 7개의 아미노산, 8개의 아미노산, 9개의 아미노산, 10개의 아미노산, 11개의 아미노산, 12개의 아미노산, 13개의 아미노산, 14개의 아미노산, 15개의 아미노산, 16개의 아미노산, 17개의 아미노산, 18개의 아미노산, 19개의 아미노산 또는 20개의 아미노산 서열을 갖는다. 또 다른 실시 양태에서, 본원에 개시된 펩타이드 삽입은 본원에 개시된 펩타이드 삽입 중 어느 하나의 아미노 말단(N-말단) 및/또는 카르복실 말단(C-말단)에서 1 내지 4개의 스페이서 아미노산을 포함한다. 예시적인 스페이서 아미노산은, 제한 없이, 루신(L), 알라닌(A), 글리신(G), 세린(S), 트레오닌(T) 및 프롤린(P)을 포함한다. 특정 실시 양태에서, 펩타이드 삽입은 N-말단에 2개의 스페이서 아미노산 및 C-말단에 2개의 스페이서 아미노산을 포함한다. 다른 실시 양태에서, 펩타이드 삽입은 N-말단에 2개의 스페이서 아미노산 및 C-말단에 1개의 스페이서 아미노산을 포함한다.
본원에 개시된 펩타이드 삽입은 이전에 기재되지 않았거나 AAV 캡시드에 삽입되지 않았다. 이론에 구속되기를 바라지 않고, 임의의 개시된 펩타이드 삽입의 존재는 바이러스 형질 도입 경로 내에서 세포 외 또는 세포 내 단계를 변화시킬 수 있는 헤파린 황산염에 대한 변이체 캡시드의 친화성을 낮추도록 작용을 할 수 있다. 또한, 본원에 개시된 펩타이드 삽입 모티프는 세포 표면 수용체 결합 도메인의 첨가를 통한 근육 세포(예를 들어, 심장 근육 세포)의 향상된 형질 도입을 부여할 수 있다.
일부 바람직한 실시 양태에서, 삽입 펩타이드는 하기 화학식의 어느 하나의 아미노산 서열을 포함한다.
일부 양태에서, 삽입 펩타이드는 화학식 1a의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:
[화학식 1a]
Y1Y2X1X2X3X4X5X6X7Y3
여기서 각각의 Y1-Y3은, 존재하는 경우, 독립적으로 Ala, Leu, Gly, Ser, Thr, Pro로부터 선택되고
X1은 Ala, Asn, Thr, Gly, Ser, Ala, Gln 및 Asp로부터 선택되고
X2는 Lys, Asn, Thr, Ser, Ala 및 Gln으로부터 선택되고
X3은 Ile, Thr, Lys, Leu, Val, Asn, Asp 및 Arg로부터 선택되고
X4는 Gln, Thr, Ile, Lys, Val, Ser 및 Tyr로부터 선택되고
X5는 Arg, Asn, Gly, Lys, Leu, Thr, Ala, Ser 및 Gln으로부터 선택되고
X6은 Thr, Lys, Val, Gly, Ser, Ala, Arg, and Pro로부터 선택되고
X7은 Asp, Thr, Asn, Ile, Ala 및 Ser로부터 선택된다.
특정 실시 양태에서, 화학식 1a의 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25) 및 ASDSTKA(서열 식별 번호 26)로부터 선택되는 아미노산 서열을 포함한다. 다른 실시 양태에서, 화학식 1a의 삽입 펩타이드는 NKTTNKD(서열 식별 번호 14), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24) 및 NQDYTKT(서열 식별 번호 22)로부터 선택되는 아미노산 서열을 포함하지 않는다.
다른 양태에서, 삽입 펩타이드는 화학식 1b의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:
[화학식 1b]
Y1Y2X1X2X3X4X5X6X7Y3
여기서 각각의 Y1-Y3은, 존재하는 경우, 독립적으로 Ala, Leu, Gly, Ser, Thr, Pro로부터 선택되고
X1은 Thr 및 Asn으로부터 선택되고
X2는 Asn 및 Lys로부터 선택되고
X3은 Lys, Ile 및 Thr로부터 선택되고
X4는 Ile, Gln 및 Thr로부터 선택되고
X5는 Gly, Arg 및 Asn으로부터 선택되고
X6은 Val, Thr 및 Lys로부터 선택되고
X7은 Thr 및 Asp로부터 선택된다.
특정 실시 양태에서, 화학식 1b의 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다. 다른 실시 양태에서, 화학식 1a의 삽입 펩타이드는 NKTTNKD(서열 식별 번호 14)를 포함하지 않는다.
다른 양태에서, 삽입 펩타이드는 화학식 1c의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:
[화학식 1c]
Y1Y2X1X2X3X4X5X6X7Y3
여기서 각각의 Y1-Y3은, 존재하는 경우, 독립적으로 Ala, Leu, Gly, Ser, Thr, Pro로부터 선택되고
X1은 Thr 및 Asn으로부터 선택되고
X2는 Asn 및 Lys로부터 선택되고
X3은 Lys 및 Ile로부터 선택되고
X4는 Ile 및 Gln으로부터 선택되고
X5는 Gly 및 Arg로부터 선택되고
X6은 Val 및 Thr로부터 선택되고
X7은 Thr 및 Asp로부터 선택된다.
특정 실시 양태에서, 화학식 1c의 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다.
다른 양태에서, 삽입 펩타이드는 화학식 1d의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:
[화학식 1d]
Y1Y2X1X2X3X4X5X6X7Y3
여기서 각각의 Y1-Y3은, 존재하는 경우, 독립적으로 Ala, Leu, Gly, Ser, Thr, Pro로부터 선택되고
X1은 Asn 및 Thr로부터 선택되고
X2는 Asn 및 Lys로부터 선택되고
X3은 Lys 및 Thr로부터 선택되고
X4는 Ile 및 Thr로부터 선택되고
X5는 Gly, Lys 및 Thr로부터 선택되고
X6은 Lys, Arg 및 Val로부터 선택되고
X7은 Asp, Thr 및 Asn으로부터 선택된다.
특정 실시 양태에서, 화학식 1d의 삽입 펩타이드는 TNKIGVT(서열 식별 번호 15)를 포함한다.
다른 실시 양태에서, 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다. 관련 실시 양태에서, 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다.
일부 실시 양태에서, 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25) 및 ASDSTKA(서열 식별 번호 26)로부터 선택되는 아미노산 서열을 포함한다.
다른 바람직한 실시 양태에서, 삽입 펩타이드는 NKIQRTD (서열 식별 번호 13), NKTTNKD (서열 식별 번호 14), TNKIGVT (서열 식별 번호 15), GNLTKGN (서열 식별 번호 16), NTVKLST (서열 식별 번호 17), SNTVKAI (서열 식별 번호 18), ASNITKA (서열 식별 번호 19), DNTVTRS (서열 식별 번호 20), NKISAKD (서열 식별 번호 21), NQDYTKT (서열 식별 번호 22), QADTTKN (서열 식별 번호 23), TNRTSPD (서열 식별 번호 24), SNTTQKT (서열 식별 번호 25) 및 ASDSTKA (서열 식별 번호 26)로부터 선택되는 아미노산 서열의 아미노 및/또는 카르복시 말에 1 내지 3개의 스페이서 아미노산(Y1-Y3)을 갖는다. 이러한 특정 실시 양태에서, 삽입 펩타이드는 LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.
일부 실시 양태에서, 본 발명의 변이체 AAV 캡시드 단백질은 GH 루프 또는 루프 IV에서 약 5개 아미노산 내지 약 20개 아미노산의 펩타이드 삽입 이외의 다른 아미노산 서열 변형을 포함하지 않는다. 예를 들어, 일부 실시 양태에서, 본 발명의 변이체 AAV 캡시드 단백질은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25),ASDSTKA(서열 식별 번호 26),LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41), and LAASDSTKAA(서열 식별 번호 42)로 이루어진 군에서 선택되는 아미노산 서열을 포함하는 펩타이드 삽입을 포함하고, 변이체 AAV 캡시드는 다른 아미노산 치환, 삽입, 또는 결실을 포함하지 않는다(즉, 변이체 AAV 캡시드 단백질은 상기 삽입을 포함하고, 그렇지 않으면 상응하는 AAV 캡시드 단백질과 동일하다). 달리 말하면, 상기 삽입을 포함하는 변이체 AAV 캡시드 단백질은 펩타이드가 삽입된 모 AAV 캡시드 단백질과 동일하다. 또 다른 예로서, 본 발명의 변이체 AAV 캡시드 단백질은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로부터 선택되는 아미노산 서열을 포함하는 펩타이드 삽입을 포함하며, 펩타이드 삽입이 AAV2 캡시드의 VP1의 아미노산 587과 588 사이; AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이; AAV7의 VP1의 아미노산 589 및 590 사이; AAV1, AAV6 또는 AAV8의 VP1의 아미노산 590 내지 591 사이; AAV4의 VP1의 아미노산 584 및 585 사이 또는 AAV5의 VP1의 아미노산 575 및 576 사이에 위치하며, 달리 변이체 AAV 캡시드 단백질 서열은 상응하는 모 AAV 캡시드 단백질 서열, 예를 들어, 서열 식별 번호 1-12의 임의의 아미노산 서열과 동일하다.
다른 실시 양태에서, 예를 들어, 본원에 개시된 또는 당업계에 공지된 바와 같이 펩타이드 삽입을 GH 루프에 포함하는 것 이외에 본 발명의 변이체 AAV 캡시드 단백질은 모 AAV 캡시드 단백질과 비교해 약 1 내지 약 100개의 아미노산 치환 또는 결실, 예를 들어, 1 내지 약 5, 약 2 내지 약 4, 약 2 내지 약 5, 약 5 내지 약 10, 약 10 내지 약 15, 약 15 내지 약 20, 약 20 내지 약 25, 약 25-50, 약 50-100 아미노산 치환 또는 결실을 포함한다. 따라서, 일부 실시 양태에서, 본 발명의 변이체 캡시드 단백질은 상응하는 모 AAV 캡시드, 예를 들어 서열 식별 번호 1-12에 개진된 바와 같은 야생형 캡시드 단백질과 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상, 또는 99% 동일성을 갖는 아미노산 서열을 포함한다.
추가의 실시 양태에서, 하나 이상의 아미노산 치환은 펩타이드 삽입 이전에 번호가 매겨진 AAV2 VP1 캡시드 단백질의 아미노산 잔기(들) 35, 109, 195, 213, 222, 229, 312, 319, 330, 333, 347, 363, 427, 447, 449, 453, 490, 527, 551, 581, 585, 588, 593, 606, 649, 651, 694, 698, 708 및/또는 735, 또는 다른 AAV 캡시드 단백질의 상응하는 아미노산 잔기(들)에 있다. 일부 이러한 실시 양태에서, 하나 이상의 아미노산 치환은 펩타이드 삽입 이전에 번호가 매겨진 AAV2 VP1 캡시드 단백질의 A35P, S109T, P195L, D213N, G222S, V229I, N312K, A319T, T330A, A333S, E347K, P363L, A427D, V447F, N449D, N449K, G453R, A490T, K527Q, N551S, A581T, Y585S, R588M, A593E, W606C, K649E, R651H, W694C, I698V, V708I 및 L735Q로 이루어진 군으로부터 선택되거나 다른 AAV 캡시드 단백질의 상응하는 아미노산 잔기(들)에서 선택된다.
바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) 캡시드 단백질의 GH-루프에 있고, NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로부터 선택된 아미노산 서열을 포함하는 펩타이드 삽입, 및 b) AAV2(서열 식별 번호 2)의 아미노산 서열과 비교하여 다음의 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환 중 하나 이상을 포함하고, 치환된 아미노산(들)은 상응하는 위치에 자연적으로 발생되지 않는다: V708I, V708I + A593E, V708I + S109T, V708I + T330A, A35P, V708I + R588M, V708I + W606C, V708I + W694C, I698V, N312K + N449D + N551S + I698V + L735Q, N312K + N449D + N551S + I698V + V708I + L735Q, V708I + N449K 및 V708I + G222S 및 이들의 조합. 일부 실시 양태에서, 하나 이상의 아미노산 치환은 바람직하게는, 펩타이드 삽입 부위는 AAV2 캡시드의 아미노산 587 및 588 사이, AAV2 캡시드의 아미노산 587 및 588 사이, AAV3A, AAV3B, AAV9 또는 AAV10 캡시드의 아미노산 588 및 589 사이, AAV7 캡시드의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8 캡시드의 아미노산 590 및 591 사이, AAV4 캡시드의 아미노산 584 및 585 사이, 또는 AAV5 캡시드의 아미노산 575 및 576 사이에 위치한다.
특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 708에서의 V708I 아미노산 치환을 추가로 포함하고, AAV2 또는 다른 AAV 모 혈청형에서의 상응하는 치환에 대해 A593E 및/또는 S109T 및/또는 T330A 및/또는 R588M 치환을 선택적으로 더 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다. 특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 35에서의 A35P 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 추가로 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이 또는 상응하는 모 AAV 캡시드와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKIQRTDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 43)
특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2 캡시드의 VP1의 587과 588 사이 또는 다른 AAV 혈청형의 캐시드 단백질에서의 상응하는 아미노산 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 또는 다른 AAV 모 혈청형에서의 상응하는 치환과 비교해 N312K 아미노산 치환을 포함하고, AAV2 캡시드 또는 다른 AAV 모 혈청형에서의 상응하는 치환의 아미노산 서열과 비교해 (i) N449D, N551S, I698V 및 L735Q 또는 (ii) N449D, N551S, I698V, L735Q 및 V708I 아미노산 치환을 선택적으로 더 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL K FKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRT D TPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKT S VDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKIQRTDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPE V QYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRN Q (서열 식별 번호 44)
또 다른 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이, AAV7의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 아미노산 590 및 591 사이, AAV4의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 내지 576 사이에 위치하는 펩타이드 삽입을 포함하되, 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13) 및 LANKIQRTDA(서열 식별 번호 27)로부터 선택되는 아미노산을 포함하고, 및 b) AAV3A 또는 AAV3B의 아미노산 709에서의 발린에서 이소류신(isoleusine) 치환, AAV1 또는 AAV6의 709 위치에서의 알라닌에서 이소류신 치환, AAV4의 아미노산 707 또는 AAV9의 아미노산 709에서의 아스파라긴에서 이소류신 치환 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서의 트레오닌에서 이소류신 치환 또는 AAV5의 아미노산 697에서의 글루타민에서 이소류신 치환을 포함하며, 선택적으로 달리 임의의 서열 식별 번호 1 및 3-12와 동일하다. 바람직한 실시형태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하고, 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함한다.
또 다른 바람직한 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에 발린에서의 발린에서 이소류신 아미노산 치환을 포함한다.
또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2의 아미노산과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKIQRTDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 45)
특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드의 아미노산 서열과 비교해 V708I 아미노산 치환을 포함하고, AAV2 또는 다른 AAV 모 혈청형에서의 상응하는 치환에 대해 N449K 및/또는 G222S 치환을 선택적으로 더 포함하며, 치환된 아미노산들은 상응하는 위치에서 자연적으로 발생하지 않는다. 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 혈청형의 캡시드 단백질에서의 상응하는 위치 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA (서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2의 아미노산 서열 또는 다른 AAV 모 혈청형에서의 상응하는 치환(들)과 비교해 N312K, N449D, N551S, I698V 및 L735Q 및 선택적으로 V708I 아미노산 치환을 포함하고, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LATNKIGVTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 46)
또 다른 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이, AAV7의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 아미노산 590 및 591 사이, AAV4의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 내지 576 사이에 위치하는 펩타이드 삽입을 포함하되, 펩타이드 삽입은 TNKIGVT(서열 식별 번호 15), LATNKIGVTA(서열 식별 번호 29) 및 LATNKIGVTS(서열 식별 번호 37)로부터 선택되는 아미노산을 포함하고, 및 b) AAV3A 또는 AAV3B의 아미노산 709에서의 발린에서 이소류신 치환, AAV1 또는 AAV6의 709 위치에서의 알라닌에서 이소류신 치환, AAV4의 아미노산 707 또는 AAV9의 아미노산 709에서의 아스파라긴에서 이소류신 치환 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서의 트레오닌에서 이소류신 치환 또는 AAV5의 아미노산 697에서의 글루타민에서 이소류신 치환을 포함한다. 바람직한 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2의 아미노산 서열과 비교하여 아미노산 708(V708I)에서의 발린에서 이소류신 아미노산 치환을 포함하고, 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 바람직하게 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성이 있다.
또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다.
또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LATNKIGVTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 47)
다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14) 또는 LANKTTNKDA(서열 식별 번호 28)을 포함하는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 708에서의 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 추가로 포함하고, AAV2 또는 다른 AAV 모 혈청형에서의 상응하는 치환과 비교해 S109T 및/또는 W694C 및/또는 W606C 아미노산 치환을 선택적으로 더 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다. 특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 아미노산 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 698에서 또는 다른 AAV 캡시드의 상응하는 잔기에서의 I698V 아미노산 치환을 더 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이 또는 상응하는 모 AAV 캡시드와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKTTNKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별번호 48)
특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2 캡시드 단백질의 아미노산 587과 588 사이 또는 다른 AAV 혈청형의 캡시드 단백질에서의 상응하는 위치 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)을 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교해 N312K 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 추가로 포함하고, AAV2 캡시드의 아미노산과 비교해 N449D, N551S, I698V 및 L735Q 및 선택적으로 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 선택적으로 더 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL K FKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRT D TPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKT S VDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKTTNKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPE V QYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRN Q (서열 식별 번호 49)
다른 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이, AAV7의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 아미노산 590 및 591 사이, AAV4의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 내지 576 사이에 위치하는 펩타이드 삽입을 포함하되, 펩타이드 삽입은 NKTTNKD(서열 식별 번호 14) 및 LANKTTNKDA(서열 식별 번호 28)로부터 선택되는 아미노산을 포함하고, 및 b) AAV3A 또는 AAV3B의 아미노산 709에서의 발린에서 이소류신 치환, AAV1 또는 AAV6의 709 위치에서의 알라닌에서 이소류신 치환, AAV4의 아미노산 707 또는 AAV9의 아미노산 709에서의 아스파라긴에서 이소류신 치환 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서의 트레오닌에서 이소류신 치환 또는 AAV5의 아미노산 697에서의 글루타민에서 이소류신 치환을 포함하며, 선택적으로 달리 임의의 서열 식별 번호 1 및 3-12와 동일하다. 바람직한 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하며, 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함한다.
또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다.
다른 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다.
다른 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKTTNKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 50)
바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) 캡시드 단백질의 GH-루프에 있고, GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25) 및 ASDSTKA(서열 식별 번호 26)로부터 선택된 아미노산 서열을 포함하는 펩타이드 삽입, 및 b) AAV2(서열 식별 번호 2)의 아미노산 서열과 비교하여 다음의 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환 중 하나 이상을 포함하고, 치환된 아미노산(들)은 상응하는 위치에 자연적으로 발생되지 않는다: A35P, S109T, P195L, D213N, G222S, V229I, N312K, A319T, T330A, A333S, E347K, P363L, A427D, V447F, N449D, N449K, G453R, A490T, K527Q, N551S, A581T, Y585S, R588M, A593E, W606C, K649E, R651H, W694C, I698V, V708I, L735Q 및 이들의 조합. 일부 실시 양태에서, 하나 이상의 아미노산 치환은 V708I, S109T, R651H, A319T, P195L, P363L, I698V, D213N, G453R 및 이들의 조합으로 이루어지는 군으로부터 선택된다. 일부 바람직한 실시 양태에서, 하나 이상의 아미노산 치환은 적어도 V708I 및/또는 P363L 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함한다. 바람직하게는, 펩타이드 삽입 부위는 AAV2 캡시드의 아미노산 587 및 588 사이 또는 다른 AAV 혈청형의 캡시드 단백질에서의 상응하는 위치 사이에 위치한다. AAV2 캡시드의 아미노산 587 및 588 사이, AAV3A, AAV3B, AAV9 또는 AAV10 캡시드의 아미노산 588 및 589 사이, AAV7 캡시드의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8 캡시드의 아미노산 590 및 591 사이, AAV4 캡시드의 아미노산 584 및 585 사이, 또는 AAV5 캡시드의 아미노산 575 및 576 사이에 위치한다.
일부 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 다음의 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환 중 하나 이상을 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다: V708I, V708I + S109T, R651H, A319T + P195L, P363L, P363L + V708I. 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2) 또는 다른 AAV 캡시드의 상응하는 잔기의 아미노산 서열에 대해 V708I 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2) 또는 다른 AAV 캡시드의 상응하는 잔기의 아미노산 서열에 대해 P363L 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2) 또는 다른 AAV 캡시드의 상응하는 잔기의 아미노산 서열에 대해 R651H 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAGNLTKGNA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 51)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NTVKLST(서열 식별 번호 17)를 포함하거나 또는 아미노산 서열 LANTVKLSTA(서열 식별 번호 31)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)에 대해 V708I 아미노산 치환 또는 다른 모 AAV 혈청형에서의 상응하는 치환을 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않으며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이에 아미노산 서열 NTVKLST(서열 식별 번호 17)를 포함하거나 또는 아미노산 서열 LANTVKLSTA(서열 식별 번호 31)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANTVKLSTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 52)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 SNTVKAI(서열 식별 번호 18)를 포함하거나 또는 아미노산 서열 LASNTVKAIA(서열 식별 번호 32)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 SNTVKAI(서열 식별 번호 18)를 포함하거나 또는 아미노산 서열 LASNTVKAIA(서열 식별 번호 32)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LASNTVKAIA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 53)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 ASNITKA(서열 식별 번호 19)를 포함하거나 또는 아미노산 서열 LAASNITKAA(서열 식별 번호 33)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 ASNITKA(서열 식별 번호 19)를 포함하거나 또는 아미노산 서열 LAASNITKAA(서열 식별 번호 33)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAASNITKAA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 54)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 DNTVTRS(서열 식별 번호 20)를 포함하거나 또는 아미노산 서열 LADNTVTRSA(서열 식별 번호 34)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 DNTVTRS(서열 식별 번호 20)를 포함하거나 또는 아미노산 서열 LADNTVTRSA(서열 식별 번호 34)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 I698V 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 DNTVTRS(서열 식별 번호 20)를 포함하거나 또는 아미노산 서열 LADNTVTRSA(서열 식별 번호 34)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LADNTVTRSA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 55)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NKISAKD(서열 식별 번호 21)를 포함하거나 또는 아미노산 서열 LANKISAKDA(서열 식별 번호 35)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKISAKD(서열 식별 번호 21)를 포함하거나 또는 아미노산 서열 LANKISAKDA(서열 식별 번호 35)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKISAKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 56)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NQDYTKT(서열 식별 번호 22)를 포함하거나 또는 아미노산 서열 LANQDYTKTA(서열 식별 번호 36)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NQDYTKT (서열 식별 번호 22)를 포함하거나 또는 아미노산 서열 LANQDYTKTA (서열 식별 번호 36)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 I698V 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환을 포함하며, 치환된 아미노산은 상응하는 위치에서 자연적으로 발생하지 않고, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NQDYTKT (서열 식별 번호 22)를 포함하거나 또는 아미노산 서열 LANQDYTKTA (서열 식별 번호 36)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANQDYTKTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 57)
일부 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)을 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2(서열 식별 번호 2)의 아미노산 서열에 대해 다음의 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환 중 하나 이상을 더 포함하고, 치환된 아미노산(들)은 상응하는 위치에 자연적으로 발생되지 않는다: V708I, D213N, P363L 및 G453R. 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 P363L 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 D213N 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 G453R 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAQADTTKNA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 58)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 TNRTSPD(서열 식별 번호 24)를 포함하거나 또는 아미노산 서열 LATNRTSPDA(서열 식별 번호 40)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LATNRTSPDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 59)
일부 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 SNTTQKT(서열 식별 번호 25)를 포함하거나 또는 아미노산 서열 LASNTTQKTA(서열 식별 번호 41)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LASNTTQKTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 60)
일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 ASDSTKA(서열 식별 번호 26)를 포함하거나 또는 아미노산 서열 LAASDSTKAA(서열 식별 번호 42)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않으며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 ASDSTKA(서열 식별 번호 26)를 포함하거나 또는 아미노산 서열 LAASDSTKAA(서열 식별 번호 42)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAASDSTKAA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 61).
여러 양태에서, AAV 캡시드 단백질이 제공되고 이는 상응하는 모 AAV 캡시드 단백질에 대해 하나 이상의 아미노산 치환을 포함하며, 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우에 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포(예를 들어 골격 또는 심장 근육 세포)의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다.
일부 실시 양태에서, AAV 캡시드 단백질 변이체는 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 363 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 위치에 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 캡시드 단백질은 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 363에서 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2), AAV3A 캡시드(서열 식별 번호 3) 또는 AAV3B 캡시드(서열 식별 번호 4)의 아미노산 서열과 비교하여 P363L 아미노산 치환; 또는 AAV1 캡시드(서열 식별 번호 1) 또는 AAV6 캡시드(서열 식별 번호 7)의 아미노산 서열과 비교하여 P364L 아미노산 치환; 또는 AAV7 캡시드(서열 식별 번호 8) 또는 AAV9 캡시드(서열 식별 번호 10)의 아미노산 서열과 비교하여 P365L 아미노산 치환; 또는 AAV8 캡시드(서열 식별 번호 9) 또는 AAV10 캡시드(서열 식별 번호 11)의 아미노산 서열과 비교하여 P366L 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 서열 식별 번호 2의 아미노산 서열과 비교하여 P363L 치환 또는 임의의 서열 식별 번호 1 및 3-12와 비교하여 상응하는 치환을 포함하며 서열 식별 번호 2 또는 임의의 서열 식별 번호 1 및 3-12에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 갖는다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 서열 식별 번호 2에 개진된 아미노산 서열과 비교하여 P363L 아미노산 치환을 포함하는 아미노산 서열을 포함하며 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 서열 식별 번호 2의 아미노산 서열과 비교하여 P363L 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환을 포함하고, 상기 변이체 캡시드 단백질은 서열 식별 번호 2에 개진된 AAV2 캡시드 단백질의 아미노산 서열과 비교하여 또는 다른 AAV 모 혈청형에서의 캡시드 단백질의 아미노산 서열과 비교하여 1 내지 5, 5 내지 10 또는 10 내지 15개의 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 P363L 아미노산 치환을 포함하고 서열 식별 번호 2의 아미노산 서열과 비교하여 E347K 및/또는 V708I 아미노산 치환(들) 또는 다른 AAV 모 혈청형(즉, AAV2 이외)으로부터의 캡시드에서의 상응하는 치환들을 더 포함한다. 다른 바람직한 실시 양태에서, 변이체 캡시드는 서열 식별 번호 2와 비교하여 P363L 아미노산 치환 또는 다른 AAV 모 혈청형으로부터의 캡시드에서의 상응하는 치환을 포함하고, 바람직하게는 AAV2의 VP1의 아미노산 587 및 588 사이, AAV7의 VP1의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 VP1의 아미노산 590 및 591 사이, AAV4의 VP1의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 및 576 사이에 위치하는 펩타이드 삽입을 더 포함하며, 상기 펩타이드 삽입은 바람직하게는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로부터 선택된, 더 바람직하게는 GNLTKGN(서열 식별 번호 16), LAGNLTKGNA(서열 식별 번호 30), QADTTKN(서열 식별 번호 23) 및 LAQADTTKNA(서열 식별 번호 39)로부터 선택된 아미노산 서열을 포함하며, 1 내지 5, 5 내지 10 또는 10 내지 15개의 아미노산 치환 선택적으로 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다.
다른 실시 양태에서, 변이체 AAV 캡시드 단백질는 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 593 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 위치에 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2)와 비교하여 아미노산 593에서 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 가지거나 또는 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 캡시드 단백질은 AAV1, AAV3A, AAV6 또는 AAV9의 아미노산 서열과 비교하여 아미노산 594에서, 또는 AAV5의 아미노산 583에서, 또는 AAV8 또는 AAV10의 아미노산 596에서의 글루탐산(glutamate) 아미노산 치환에 대한 글리신, 또는 AAV3B의 아미노산 594에서의 글루탐산 아미노산 치환에 대한 아르기닌, 또는 AAV4의 아미노산 592에서의 글루탐산 아미노산 치환에 대한 아스파르트산염(aspartate) 또는 AAV7의 595 위치에서의 글루탐산 아미노산 치환에 대한 글루타민을 포함한다. 다른 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E 아미노산 치환을 포함하고 AAV2의 아미노산 서열과 비교하여 하기 아미노산 치환 중 하나 이상을 포함하지 않는다: I19V, V369A, K26R, N215D, G355S, V46A 및 S196P. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E 및 V708I 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E 및 S109T 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E, V708I 및 S109T 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 서열과 비교하여 A593E, V708I 및 N551S 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 서열과 비교하여 A593E, V708I 및 K649E 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 서열과 비교하여 A593E, V708I, S109T 및 K527Q 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다.
다른 실시 양태에서, 변이체 AAV 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 708 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 위치에 아미노산 치환을 포함하며, 치환된 아미노산은 상응하는 위치에서 자연적으로 발생하지 않는다. 바람직하게는, rAAV 비리온은 AAV2와 비교하여 아미노산 250 또는 다른 AAV 모 혈청형의 상응하는 아미노산에서 세린 치환에 대한 프롤린을 포함하지 않는다. 일부 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 708에서 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 바람직한 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 서열과 비교하여 아미노산 708에서 이소류신(V708I) 치환에 대한 발린을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하며, 상기 변이체 캡시드 단백질은 P250S 아미노산 치환을 포함하지 않는다. 일부 실시 양태에서, 변이체 캡시드 단백질은 AAV3A 또는 AAV3B의 아미노산 709에서 이소류신 치환에 대한 발린, AAV1의 위치 709에서 이소류신 치환에 대한 알라닌, AAV4의 아미노산 709 또는 AAV9의 아미노산 709에서 이소류신 치환에 대한 아스파라긴 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서 이소류신 치환에 대한 트레오린 또는 AAV5의 아미노산 697에서 이소루이신 치환에 대한 글루타민을 포함한다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 V708I 아미노산 치환을 포함하며, 상기 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하고 상기 변이체 캡시드 단백질은 P250S 아미노산 치환을 포함하지 않는다. 다른 실시 양태에서, 변이체 캡시드 단백질은 V708I 아미노산 치환을 포함하고, 또한 AAV2의 아미노산 서열과 비교하여 A333S 및/또는 S721L 아미노산 치환을 포함한다. 다른 관련된 실시 양태에서, 변이체 캡시드는 V708I 아미노산 치환을 포함하고, 또한 AAV2의 아미노산 서열과 비교하여 A333S 및/또는 S721L 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다.
다른 실시 양태에서, 변이체 AAV 캡시드 단백질은 서열 식별 번호 1, 2, 3, 4, 5, 6, 7, 8, 10, 11 및 12로 이루어진 군으로부터 선택된 야생형 AAV 캡시드 서열과 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열을 포함하며, i)A35P, D213N, A319T + P195L, P363L, P363L + V708I, G453R, R651H, I698V, V708I, V708I + A593, V708I + S109T, V708I + T330A, V708I + R588M, V708I + W694C, V708I + W606C, V708I + N449K, V708I + G222S, N312K + N449D + N551S + I698V + L735Q, N312K + N449D + N551S + I698V + V708I + L735Q 로 이루어진 군으로부터 선택된 하나 이상의 아미노산 치환, 및/또는 (ii) NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택되는 펩타이드 삽입을 또한 포함한다. 일부 실시 양태에서, 변이체 AAV 캡시드는 특정된 하나 이상의 아미노산 치환 및/또는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 1 내지 12로 이루어지는 군으로부터 선택된 서열과 동일하다.
일부 실시 양태에서, 변이체 AAV 캡시드 단백질은 본원에 기재된 바와 같은 하나 이상의 펩타이드 삽입(들) 및/또는 아미노산 치환을 포함하는 조상(ancestral) 캡시드 단백질이다. 조상 캡시드 단백질은 오늘날 자연에서 발견되는 캡시드 단백질의 진화론적 조상을 의미한다. 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAV11, AAV12, AAV13은 오늘날 자연에서 발견되는 AAV 캡시드 단백질 간의 축중(degeneracy) 위치에서 무작위 아미노산 치환에 의해 인실리코(in silico)에서 생성된다.
다른 실시 양태에서, 변이체 AAV 캡시드 단백질은 AAV5 캡시드(서열 식별 번호 6)의 아미노산 130-725 또는 그것과 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열을 포함하는 키메라이다.
일부 양태에서, 변이체 AAV 캡시드 단백질은 (i) AAV6(서열 식별 번호 7)의 아미노산 1-129 또는 그것과 적어도 90% 이상, 적어도 95% 이상 또는 적어도 98% 이상 동일한 아미노산 및 (ii) AAV5(서열 식별 번호 6)의 아미노산 130-725 또는 그것과 적어도 90% 이상, 적어도 95% 이상 또는 적어도 98% 이상 동일한 아미노산을 포함하고, AAV5(서열 식별 번호 6)의 서열에 대해 V229I, A490T 및 A581T 및 임의로 V447F 또는 Y585S 아미노산 치환을 더 포함하는 키메라이다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDR I VTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAF T TTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAP T TGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(서열 식별 번호 62)
다른 양태에서, 변이체 AAV 캡시드 단백질은 (i) AAV2(서열 식별 번호 2)의 아미노산 1-61 또는 그것과 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열, (ii) AAV6(서열 식별 번호 7)의 아미노산 62-129 또는 그것과 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열, 및 (iii) AAV5(서열 식별 번호 6)의 아미노산 130-725을 포함하고, AAV5(서열 식별 번호 6)의 서열에 대해 V229I, A490T 및 A581T 아미노산 치환을 더 포함하는 키메라이다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDR I VTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAF T TTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAP T TGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(서열 식별 번호 63)
본원에 개시된 AAV 변이체는 정맥 내 투여 후 영장류 심장 및 골격 근육 스크린의 사용을 포함하는 생체 내 유도 진화의 사용을 통해 생성되었다. 일부 실시양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 비리온에 존재할 때 상응하는 모 AAV 캡시드 단백질 또는 야생형 AAV를 포함하는 AAV 비리온에 의한 근육 세포의 형질 도입과 비교하여 근육 세포의 증가된 형질 도입을 부여한다. 예를 들어, 일부 실시 양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 비리온에 존재할 때 상응하는 모체 AAV 캡시드 단백질 또는 야생형 AAV 캡시드 단백질을 포함하는 AAV 비리온보다 영장류 근육 세포의 더욱 효과적인 형질 도입을 부여하고, 예를 들어 근육 세포는 모 AAV 캡시드 단백질 또는 야생형 AAV를 포함하는 AAV 비리온보다 본 변이체 AAV 캡시드 단백질을 포함하는 AAV 비리온을 더 많이 취한다. 일부 이러한 실시 양태에서, AAV 변이체 비리온 또는 변이체 rAAV는 야생형 AAV 비리온 또는 상응하는 모 AAV 캡시드 단백질을 포함하는 rAAV에 의한 근육 세포의 형질 도입과 비교하여, 근육 세포의 형질 도입이 적어도 2배, 적어도 5배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 25배, 적어도 50배, 또는 50배 이상의 증가를 보인다. 바람직한 실시 양태에서, AAV 변이체 비리온 또는 변이체 rAAV는 야생형 AAV8 또는 AAV9에 의한 근육 세포의 형질 도입과 비교하여, 근육 세포의 형질 도입이 적어도 2배, 적어도 5배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 25배, 적어도 50배, 적어도 100배, 적어도 1000배 또는 1000배 이상의 증가를 보인다. 이러한 특정 양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 비리온에 존재할 때, 상응하는 모 AAV 캡시드 단백질 또는 야생형 AAV 캡시드 단백질을 포함하는 AAV 비리온보다 광범위한 영장류 근육 세포의 형질 도입을 부여한다. 즉, 변이체 AAV 비리온은 상응하는 모 AAV 캡시드 단백질을 포함하는 비리온에 의해 형질 도입되지 않는 세포형을 형질 도입시키고 이에 따라 상응하는 모 AAV 비리온보다 근육에서 더 많은 유형의 세포를 형질 도입시킨다. 일부 실시 양태에서, AAV 변이체 비리온은 우선적으로 근육 세포를 형질 도입시키고, 예를 들어 본 rAAV 비리온은 다른 근육 세포 또는 비-근육 세포보다 근육 세포를 2배, 5배, 10배, 15배, 20배, 25배, 50배, 50배 이상 특이적으로 감염시킨다. 일부 실시 양태에서, 형질 도입된 근육 세포는 심장 근육 세포(예를 들어, 심장 근육 세포, 심장 섬유 모세포, 또는 심장 전구 세포)이다. 일부 실시 양태에서, 근육 세포는 골격 근육 세포(예를 들어, 근육 모세포, 근육 대롱 또는 위성 세포)이다. 일부 실시형태에서, 망막 세포는 망막 상피세포 (RPE 세포)이다. 일부 실시형태에서, 망막 세포는 뮐러 (Muller) 교세포이다. 일부 실시형태에서, 망막 세포는 소교 세포이다. 일부 실시형태에서, 망막 세포는 무축삭 세포이다. 일부 실시형태에서, 망막 세포는 양극성 세포이다. 일부 실시형태에서, 망막 세포는 수평 세포이다. 근육 세포의 형질 도입의 증가, 예를 들어, 형질 도입의 증가된 효율, 보다 광범위한 형질 도입, 보다 우선적인 형질 도입 등은 유전자 발현 측정 기술의 임의의 수의 방법에 의해 시험관 내 또는 생체 내에서 용이하게 평가될 수 있다. 예를 들어, AAV는 유비쿼터스 또는 조직 특이적 프로모터의 제어하에 리포터 유전자, 예를 들어 형광 단백질을 포함하는 발현 카세트를 포함하는 게놈으로 패키징 될 수 있으며, 형질 전환의 정도는 예를 들어 형광 현미경에 의한 형광 단백질을 검출함으로써 평가된다. 또 다른 예로서, AAV는 바 코딩된 핵산 서열을 포함하는 게놈으로 패키징 될 수 있고, 형질 전환의 정도는 예를 들어 PCR에 의해 핵산 서열을 검출함으로써 평가될 수 있다. 또 다른 예로서, AAV는 근육 질병의 치료를 위한 치료적 유전자를 포함하는 발현 카세트를 포함하는 게놈으로 패키징 될 수 있고, 형질 도입의 정도는 AAV가 투여된 고통받는 환자의 근육 질병의 치료를 검출함으로써 평가될 수 있다.
본원에 개시된 변이체 rAAV 벡터 또는 비리온 및/또는 방법을 사용하여 치료될 수 있는 질병은 단일유전인자 질병, 복합 질병 및 외상성 상해를 포함하지만, 이에 제한되지 않는다. 단일유전인자 질병의 예로는, 이에 한정되는 것은 아니지만, 뒤셴(Duchenne), 베커(Becker), 선천성(베틀렘 근육질환, 울리히 근이영양증, 후쿠야마 디스트로피, 인테그린-결핍, 메로신-결핍 근육 이상증 및 워커-워버그 증후군), 말단(Gowers-Laing, Miyoshi 및 Nonaka를 포함하나, 이에 한정되지 않는다), 에메리-드레스(Emery-Drefruss), 얼굴어깨위팔, 팔다리 이음, 근육 긴장 및 근육 디스트로피; 선천성 근육 긴장 및 선천성 근육 이상증; 근관 근육질환; 중심핵 근육질환; 데시민 관련 섬유성 근육질환; 아네미아; 안데르슨-타윌(Andersen-Tawil) 증후군; 네말린 근육질환; 브로디병; 리소좀 저장 장애, 예컨대 알파-만노시도시스, 아스파르틸글루코사민뉴리아, 베타-만노시도시스, 시스틴증, 파버(Farber)병, 푸코시도시스(fucosidosis), 게이처(Gaucher)병, 갈락토시알리시스(galactosialidosis), 갈글리오시도스(gangliosidose)(제한 없이, AB 변이체, 활성화제 결핍, 베타-갈락토시다아제 파브리병, 샌드호프병 및 쉰들러병을 포함), 글리코겐 저장 장애(제한 없이, 안데르센 질병, 코리 질병, 다논 질병, 포브르스 질병, 글루코오스-6-인산 결함, 허스 질병, 젖산 탈수소 효소 A 결핍, 폼페병, 타루이병 및 폰 기르케씨병 병을 포함), 유아 프리 시알산 저장 질환(infantile free sialic acid storage disease), 리소좀 산 리파아제의 결핍, 리소좀 산 리파제 결핍, 크라베병, 메타크롬 류코디스트로피(metachrohme Leukodystrophy), 뮤코폴리사카리도스(mucopolysaccharidose)(제한 없이, 히알루로니다아제 결핍, 헌터 증후군, 헐러(Hurler) 증후군, 헐러-스키(Scheie) 증후군, 마르코티옥스-라미(Markoteaux-Lamy) 증후군, 산필리포(Sanfilippo) 증후군, 스케리(Scherie) 증후군 및 스라이(Sly) 증후군을 포함), 뮤콜리피도시스(mucolipidosis)(제한 없이, 시알리도시스(Sialidosis), I-세포 질환, 뮤콜리피딘 1 결핍 및 슈디(Psuedy)-헐러 폴리디스트로피를 포함), 다수의 설파아제 결핍증, 니만난-픽(Niemann-Pick) 질병, 뉴런 세노이드 리포푸사제(제한 없이, 배튼-스피넬메이어-보그트 질병, 선천성 카뎁신 D 결핍증, 독일/세르비안 레이트(Late) 인팬타일(infantile), 잔스키-비엘시오스키(Jansky-Bielschowsky) 질병, 커프스(Kufs) 질환, 레이트 인팬타일, 레이트 인팬타일 변이체, 노턴 간질, 산타뷰오리-할티아(Santavuori-Haltia) 질병 및 터키쉬 레이트 인팬타일을 포함), 피누이상증, 살라 질환, 사포신 B 결핍증, 테이새크병 및 울만 질환; 대사 장애, 예컨대 아데노신 1 인산 탈아미노 효소 결핍증, 알 캅톤 뇨증, 카르니틴 결핍증, 카르니틴 팔미틸 전이 효소 결핍증, 하트넙(Hartnup) 장애, 호모 시스틴 뇨증, 메이플 시럽 뇨 질병, 미오포스포릴라제 결핍증, 포스포후위키나아제 결핍증, 포스포글리세레이트 키나제 결핍증, 포스포글리세레이트 뮤타아제 결핍증, 포스포릴라제 결핍증 및 탄지아 질병; 프리에드리히 아타시아(ataxia); 아타시아 탈렌지엑타시아(talengiectasia); 비타민 E 결핍 아타시아; 주기성 마비, 예컨대 갬스토그프(Gamstorp) 질병 및 하이포칼레믹(hypokalemic) 주기기성 마비; 미토콘드리아 질병, 예컨대 바쓰(Barth) 증후군, 컨스-세이래(Kearns-Sayre) 증후군, 미토콘드리아 근육질환, 미토콘드리아 뇌병증 락트산증 및 발작 유사 에피소드, 울퉁불퉁한(ragged-red) 섬유를 갖는 간대성 근경련 간질 및 피어슨 증후군; 가족성 비대성 심근증; 확장된 심근증; 가족성 선천성 심장 질환 예컨대, 가족성 대동맥 판막 질환 및 선천성 심장 결함을 갖는 좌심실의 비-압축; 가족성 부정맥 예컨대, 앤더슨 심장 율동 주기성 마비, AV 전도 결함을 갖는 심방 중격 결함, 브루가라(Brugada) 증후군, 심장 전도성 결함, 카테콜린성 다형성 심실 빈맥 및 선천성 심장 마비; 가족성 혈관 장애, 예컨대 동맥 비틀림성 증후군, 카다실(CADASIL)(cerebral autosomal dominant arteriopathy with subcortical infacts and leukoencephalopathy), CRDASIL(cerebral recessive dominant arteriopathy with subcortical infacts and leukoencephalopathy), 가족성 대동맥 동맥류, 마팬(Marfan) 증후군, 엘러스-단로스(Ehlers-Danlos) 증후군, 비알(Beals) 선천성 수축성(contractual) 대동맥 동맥류, 로지스-디에츠(Loesys-Dietz) 증후군 및 탄력 섬유성가황색종; 부정맥성 우심실 심근증; 가족성 부정맥성 우심실 이형성증; 나가신 질환(Naxos disease); 좌심실 비-압축; 가족성 심방세동; 가족성 심실 빈맥; 가족성 울프-파킨슨 증후군; 긴 QT 증후군; 짧은 QT 증후군; 시크 시누스(Sick sinus) 증후군; 지단백질 질병, 예컨대 무베타지질단백혈증 및 지단백질 리파제 결핍증; 알파-1 안티트립신 결핍증; 응고 인자 VIII 결핍증(혈우병 A) 또는 응고 인자 IX 결핍(혈우병 B); 탈라세미아; 진행성 골화성 섬유이형증; LMNA 돌연변이(maninopathies); 헌팅톤병(Huntington disease); 선천성 근무력증 증후군; 허치슨-길포드 조로증(Hutchinson-Gilford Progrearia) 증후군; 루난(Noonan) 증후군; 선천성 섬유형 불균형(disproportion) 근육질환; 안외 근육의 선천성 섬유증; 미니코어(minicore) 근육질환; 리플(rippling) 근육 질병; 슈발츠-얌펠(Schwartz-Jampel) 증후군; 관골 골격(tubular aggregate) 근육질환 및 제브라 바디(zebra body) 근육질환. 복합 질병의 예는 심장/심혈관 질환(예를 들어, 울혈성 심부전, 심근경색, 협심증, 관상동맥 질환, 허혈성 심질환, 심근병증); 암; 당뇨병; 및 감염을 포함하나, 이에 한정되지 않는다. 외상성 상해의 예는, 근육의 바이러스 감염, 근육 열상; 및 근육 타박상을 포함하나, 이에 한정되지 않는다. 바람직한 실시 양태에서, 본원에 개시된 변이체 rAAV 벡터 또는 비리온 및/또는 방법은 파브리병(Fabry disease), 프리드리히 운동실조(Friedreich ataxia), 뒤셴형 근이영양증(Duchenne muscular dystrophy), 베커 근이영양증(Becker muscular dystrophy), 폼페병(Pompe disease), 근육 인산분해효소 결핍증(myophosphorylase deficiency), 얼굴어깨위팔 근이영양증(facioscapulohumerical muscural dystrophy), 팔다리 이음 근이영양증(limb girdle muscular dystrophy) 또는 근육 긴장성 이영양증(myotonic dystrophy)을 치료하는데 사용된다.
다른 실시 양태에서, 본원에 개시된 변이체 캡시드는 유전자 산물, 예를 들어, 제한 없이, 간섭 RNA, 긴 비-코딩 RNA, 짧은 비-코딩 RNA, 안티센스 RNA, 앱타머, 폴리펩타이드, 분비된 항체, 단일 사슬 항체, VHH 도메인, 가용성 수용체, 결합체(affibody), 노틴(knottin), DARPin, 센추린, 샤페론, 유전자 기능의 녹-다운(knock-down)을 제공하는 부위 특이적 뉴클레아제 또는 전사의 유전자 특이적 활성화를 제공하는 변형된 부위 특이적 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 포함하는 이종성 핵산을 포함한다.
본원에 개시된 rAAV 변이체 비리온는 유전자 산물을 인코딩하는 뉴클레오타이드 서열을 포함하는 이종성 핵산을 포함한다. 일부 실시 양태에서, 유전자 산물은 안티센스 RNA, microRNA(miRNA), 짧은 헤어핀 RNA(shRNA) 또는 작은 간섭 RNA(siRNA) 또는 그의 전구체 또는 모방체이다. 일부 실시 양태에서, 유전자 산물은 긴 비-코딩 RNA이다. 일부 실시 양태에서, 유전자 산물은 짧은 비-코딩 RNA이다. 일부 실시 양태에서, 유전자 산물은 안티센스 RNA이다. 일부 실시 양태에서, 유전자 산물은 앱타머이다. 일부 실시 양태에서, 유전자 산물은 폴리펩타이드이다. 일부 실시 양태에서, 유전자 산물은 분비된 항체이다. 일부 실시 양태에서, 유전자 산물은 단일 사슬 항체이다. 일부 실시 양태에서, 유전자 산물은 VHH 도메인이다. 일부 실시 양태에서, 유전자 산물은 가용성 수용체이다. 일부 실시 양태에서, 유전자 산물은 결합체이다. 일부 실시 양태에서, 유전자 산물은 노틴이다. 일부 실시 양태에서, 유전자 산물은 DARPin이다. 일부 실시 양태에서, 유전자 산물은 센투린이다. 일부 실시 양태에서, 유전자 산물은 샤페론이다. 일부 실시 양태에서, 유전자 산물은 부위 특이적 뉴클레오타이드로서 유전자 기능의 부위 특이적 녹-다운을 제공한다.
유전자 산물의 용도는 세포에서 인자(factor)의 수준을 높이는 것, 인자의 분비를 통해 이웃 또는 원거리 세포에서 인자의 수준을 높이는 것, 세포에서 인자의 수준을 줄이는 것, 또는 인자의 분비를 통해 이웃 또는 원거리 세포에서 인자의 수준을 줄이는 것을 포함하나, 이에 제한되지 않는다. 유전자 산물은 누락 유전자 산물의 결함 수준을 보충하고, 누락 유전자 산물의 결함 수준을 감소시키며, 새로운 지지 유전자 산물을 도입하고, 지지 유전자 산물의 수준을 보충하고, 방해 유전자 산물의 수준을 감소시키고, 지지 유전자 산물의 수준을 도입하거나 보충한다.
본 AAV 변이체에 의해 전달된 유전자 산물은 근육 질병 및 외상에 직접적으로 또는 간접적으로 연결된 유전자 산물 또는 유전자 산물 활성의 수준을 변경하는데 사용될 수 있다. 또한, 본 AAV 변이체로 형질 도입된 골격, 심장 또는 평활근은 원거리 장기의 도중에(in trans)서 질병의 치료를 위한 치료적 단백질을 생산 및 분비하기 위한 바이오팩토리(biofactory)로서 사용될 수 있다. 유전자 산물이 유전적 질병에 직접 또는 간접적으로 연결된 유전자는 예를 들어, 다음의 유전자 산물 중 임의 것을 인코딩하는 유전자를 포함한다: 디스미니-및 마이크로-디스트로핀(DMD; 예를 들어 유전자은행 수탁번호NP_003997.1; 서열 식별 번호 64); 티틴(TTN); 티틴 캡(TCAP) α-사르코글리칸(SGCA), β-사르코글리칸(SGCB), γ-사르코글리칸(SGCG) 또는 δ-사르코글리칸(SGCD); α-1-안티트립신(A1-AT); 미오신 중쇄 6(MYH6); 미오신 중쇄 7(MYH7); 미오신 중쇄 11(MYH11); 미오신 경쇄 2(ML2); 미오신 경쇄 3(ML3); 미오신 경쇄 키나제 2(MYLK2); 미오신 결합 단백질 C(MYBPC3); 데시민(DES); 다이나민 2(DNM2); 라미닌 α2(LAMA2); 라미닌 A/C(LMNA); 라민 B(LMNB); 라민 B 수용체(LBR); 디스페린(DYSF); 에머린(EMD); 인슐린; 혈액 응고 인자, 비제한적으로 인자 VIII 및 인자 IX를 포함; 에리트로포이에틴(EPO); 지단백질 리파제(LPL); 사르코플라스믹 망상 Ca2++-ATPase(SERCA2A), S100 칼슘 결합 단백질 A1(S100A1); 근관(MTM); DM1 단백질 키나제(DMPK; 예를 들어 유전자은행 수탁번호 NG_009784) 1; 서열 식별 번호 65); 글리코겐 포스포릴라제 L(PYGL); 글리코겐 포스포릴라제, 근육 관련(PYGM; 예를 들어 유전자은행 수탁번호 NP_005600.1; 서열 식별 번호 66); 글리코겐 신타제 1(GYS1); 글리코겐 신타제 2(GYS2); α-갈락토시다제 A(GLA; 예를 들어 유전자은행 수탁번호 NP_000160.1; 서열 식별 번호 67); α-N-아세틸갈락토사미니다제(NAGA); 산 α-글루코시다제(GAA; 예를 들어 유전자은행 수탁번호 NP_000143.2; 서열 식별 번호 68), 스핑고미엘리나제 포스포디에스테라제 1(SMPD1); 리소좀 산 리파제(LIPA); 콜라겐 타입 I α1 사슬(COL1A1); 콜라겐 타입 I α2 사슬(COL1A2); 콜라겐 타입 III α1 사슬(COL3A1); 콜라겐 타입 V α1 사슬(COL5A1); 콜라겐 타입 V α2 사슬(COL5A2); 콜라겐 타입 VI α1 사슬(COL6A1); 콜라겐 타입 VI α2 사슬(COL6A2); 콜라겐 타입 VI α3 사슬(COL6A3); 프로콜라겐-리신 2-옥소글루타레이트 5-디옥시게나제(PLOD1); 리소좀 산 리파제(LIPA); 프라탁신(FXN; 예를 들어 유전자은행 수탁번호 NP_000135.2; 서열 식별 번호 69); 미오스타틴(MSTN); β-N-아세틸 헥소사미니다제 A(HEXA); β-N-아세틸헥소사미니다제 B(HEXB); β-글루코세레브로시다제(GBA); 아데노신 모노포스페이트 디아미나제 1(AMPD1); β-글로빈(HBB); 이두로니다아제(IDUA); 이두로니다아제 2-황산염(IDS); 트로포닌 1(TNNI3); 트로포닌 T2(TNNI2); 트로포닌 C(TNNC1); 트로포미오신 1(TPM1); 트로포미오신 3(TPM3); N-아세틸-α-글루코사미니다제(NAGLU); N-설포글루코사민 설포하이드롤라제(SGSH); 헤파란-α-글루코사미나이드 N-아세틸트랜스퍼라제(HGSNAT); 인테그린 α7(IGTA7); 인테그린 α9(IGTA9); 글루코사민(N-아세틸)-6-술파타제(GNS); 갈락토사민(N-ㅇ아아세틸)-6-술파타제(GALNS); β-갈락토시다아제(GLB1); β-글루쿠로니다제(GUSB); 히알루로글루코사미니다제 1(HYAL1); 산 세라미다제(ASAH1); 갈락토실세르미다아제(GALC); 카뎁신 A(CTSA); 카뎁신 D(CTSA); 카뎁신 K(CTSK); GM2 강글리오사이드 활성화제(GM2A); 아릴술파타제 A(ARSA); 아릴술파타제 B(ARSB); 포르밀글리신-발생 효소(SUMF1); 뉴라미니다아제 1(NEU1); N-아세틸글루코사민-1-포스페이트 트랜스퍼라제 α(GNPTA); N-아세틸글루코사민-1-포스페이트 트랜스퍼라제 β(GNPTB); N-아세틸글루코사민-1-포스페이트 트랜스퍼라제 γ(GNPTB); 뮤코릴핀-1(MCON1); NPC 세포 내 수송체 1(NPC1); NPC 세포 내 수송체 2(NPC2); 세로이드 리포푸스시노시스 5(CLN5);세로이드 리포푸스시노시스 6(CLN6); 세로이드 리포푸스시노시스 8(MFSD8); 팔미토일 단백질 티오에스테라제 1(PPT1); 트리펩티딜 펩티다아제 1(TPP1); 배테민(CLN3); DNAJ 열 충격 단백질 패밀리 40 멤버 C5(DNAJC5); 주요 촉진제 슈퍼패밀리 도메인 함유 8(MFSD8); 만노시다제 α 클래스 2B 멤버 1(MAN2B1); 만노시다제 β(MANBA); 아스파르틸글루코사미니다제(AGA); α-L-푸코시다제(FUCA1); 시스티노신, 리소좀 시스테인 트랜스포터(CTNS); 사이알린; 용질 캐리어 패밀리 2 멤버 10(SLC2A10); 용질 캐리어 패밀리 17 멤버 5(SLC17A5); 용질 캐리어 패밀리 6 멤버 19(SLC6A19); 용질 캐리어 패밀리 22 멤버 5(SLC22A5); 용질 캐리어 패밀리 37 멤버 4(SLC37A4); 리소좀 관련 막 단백질 2(LAMP2); 나트륨 전압-게이트 채널 α 서브유닛 4(SCN4A); 나트륨 전압-게이트 채널 β 서브유닛 4(SCN4B); 나트륨 전압-게이트 채널 α 서브유닛 5(SCN5A); 나트륨 전압-게이트 채널 α 서브유닛 4(SCN4A); 칼슘 전압-게이트 채널 서브유닛 α1c(CACNA1C); 칼슘 전압-게이트 채널 서브유닛 α1s(CACNA1S); 포스포글리세레이트 키나제 1(PGK1); 포스포글리세레이트 뮤타제 2(PGAM2); 아밀로-α-1, 6-글루코시다제, 4-α-글루카노트랜스퍼라제(AGL); 칼륨 전압-게이트 채널 ISK-관련 서브패밀리 멤버 1(KCNE1); 칼륨 전압-게이트 채널 ISK-관련 서브패밀리 멤버 2(KCNE2); 칼륨 전압-게이트 채널 서브패밀리 J 멤버 2(KCNJ2); 칼륨 전압-게이트 채널 서브패밀리 J 멤버 5(KCNJ5); 칼륨 전압-게이트 채널 서브패밀리 H 멤버 2(KCNH2);칼륨 전압-게이트 채널 KQT-유사 서브패밀리 멤버 1(KCNQ1); 과분극-활성화된 사이클릭 뉴클레오타이드-게이트 칼륨 채널 4(HCN4); 클로라이드 전압-게이트 채널 1(CLCN1); 카르니틴 팔미토일트랜스퍼라제 1A(CPT1A); 리아노딘 수용체 1(RYR1); 리아노딘 수용체 2(RYR2); 브릿징 적분기 1(BIN1); LARGE 자일로실-및 글루쿠로닐트랜스퍼라제 1(LARGE1); 도킹 단백질 7(DOK7); 퓨쿠틴(FKTN); 퓨쿠틴 관련 단백질(FKRP); 셀렌단백질 N(SELENON); 단백질 O-만노실트랜스퍼라제 1(POMT1); 단백질 O-만노실트랜스퍼라제 2(POMT2); 단백질 O-연결 만노오스 N-아세틸글루코사미닐트랜스퍼라제 1(POMGNT1); 단백질 O-연결 만노오스 N-아세틸글루코사미닐트랜스퍼라제 2(POMGNT2); 단백질-O-만노오스 키나제(POMK); 이소프레노이드 신타제 도메인 함유(ISPD); 렉틴(PLEXC); 콜린성 수용체 니코틴성 엡시론 서브유닛(CHRNE); 콜린 O-아세틸트랜스퍼라제(CHAT); 콜린 키나제 β(CHKB); 비대칭 아세틸콜린에스터라제의 콜라겐 유사 꼬리 서브유닛(COLQ); 시냅스의 단백질 관련 수용체(RAPSN); 포 앤드 하프(four and a half) LIM 도메인 1 (FHL1); β-1,4-글루쿠로닐트랜스퍼라제 1(B4GAT1); β-1,3-N-아세틸갈락토사미닐트랜스퍼라제 2(B3GALNT2); 디스트로글리칸 1(DAG1); 막횡단 단백질 5(TMEM5); 막횡단 단백질 43(TMEM43); SECIS 결합 단백질 2(SECISBP2); 글루코사민(UDP-N-아세틸)-2-에피머라제/N-아세틸만노사민 키나제(GNE); 아녹타민 5(ANO5); 염색체 가요성 힌지 도메인 함유 1의 구조적 유지(SMCHD1); 락테이트 데하이드로게나제 A(LDHA); 락테이트 데하이드로게나제 B(LDHB); 칼파인 3(CAPN3); 카베올린 3(CAV3); 3부로 된 모티프 함유 2(TRIM32); CCHC-형 아연 핑거 핵산 결합 단백질(CNBP); 네불린(NEB); 액틴, α1, 골격 근육(ACTA1); 액틴, α1, 심장 근육(ACTC1); 액틴 α2(ACTN2); 폴리(A)-결합 단백질 핵 1(PABPN1); LEM 도메인-함유 단백질 3(LEMD3); 아연 메탈로프로테이나제 STE24(ZMPSTE24); 마이크로좀 트리글리세라이드 전달 단백질(MTTP); 콜린성 수용체 니코틴성 α1 서브유닛(CHRNA1); 콜린성 수용체 니코틴성 α2 서브유닛(CHRNA2); 콜린성 수용체 니코틴성 α3 서브유닛(CHRNA3); 콜린성 수용체 니코틴성 α4 서브유닛(CHRNA4); 콜린성 수용체 니코틴성 α5 서브유닛(CHRNA5); 콜린성 수용체 니코틴성 α6 서브유닛(CHRNA6); 콜린성 수용체 니코틴성 α7 서브유닛(CHRNA7); 콜린성 수용체 니코틴성 α8 서브유닛(CHRNA8); 콜린성 수용체 니코틴성 α9 서브유닛(CHRNA9); 콜린성 수용체 니코틴성 α10 서브유닛(CHRNA10); 콜린성 수용체 니코틴성 β1 서브유닛(CHRNB1); 콜린성 수용체 니코틴성 β2 서브유닛(CHRNB2); 콜린성 수용체 니코틴성 β3 서브유닛(CHRNB3); 콜린성 수용체 니코틴성 β4 서브유닛(CHRNB4); 콜린성 수용체 니코틴성 γ 서브유닛(CHRNG1); 콜린성 수용체 니코틴성 δ 서브유닛(CHRND); 콜린성 수용체 니코틴성 ε 서브유닛(CHRNE1); ATP 결합 카세트 서브 패밀리 A 멤버 1(ABCA1); ATP 결합 카세트 서브패밀리 C 6 멤버(ABCC6); ATP 결합 카세트 서브 패밀리 C 멤버 9 (ABCC9); ATP 결합 카세트 서브 패밀리 D 1 멤버(ABCD1); ATP 아제 사르코플라스민/소포체 CA2+ 수송 1(ATP2A1); ATM 세린/트레오닌 키나제(ATM); α 토코페롤 트랜스퍼라제 단백질(TTPA); 키네신 패밀리 멤버 21A(KIF21A); 페어링 유사(paired-like) 호메오박스 2A (PHOX2A); 헤파란 설페이트 프로테오글리칸 2(HSPG2); 스트로마 상호작용 분자 1(STIM1); 노치 1(NOTCH1); 노치 3(NOTCH3); 디스트로브레빈 α(DTNA); 단백질 키나아제 AMP-활성화, 비촉매 γ2(PRKAG2); 시스테인-및 글리신-풍부 단백질 3(CSRP3); 빈쿨린(VCL); 미오제닌 2(MyoZ2); 미오팔라딘(MYPN); 정토필린 2(JPH2); 포스폴람반(PLN); 칼레티쿨린 3(CALR3); 넥시린 F-액틴-결합 단백(NEXN); LIM 도메인 결합 3(LDB3); 아이 어브센트(eyes absent) 4(EYA4); 헌팅틴(HTT); 안드로겐 수용체(AR); 단백질 티로신 포스페이트 비-수용체 타입 11(PTPN11); 접합 플라코글로빈(JUP); 데스모플라킨(DSP); 플라코필린 2(PKP2); 데스모글레인 2(DSG2); 데스모콜린 2(DSC2); 카테닌 α3(CTNNA3); NK2 호메오박스 5(NKX2-5); A-키나아제 앵커 단백질 9(AKAP9); A-키나아제 앵커 단백질 10(AKAP10); 구아닌 뉴클레오타이드-결합 단백질 α-억제 활성 폴리펩타이드 2(GNAI2); 안키린 2(ANK2); 신트로핀 α-1(SNTA1); 칼모듈린 1(CALM1); 칼모듈린 2(CALM2); HTRA 세린 펩티다아제 1(HTRA1); 피브릴린 1(FBN1); 피브릴린 2(FBN2); 자일로실트랜스퍼라제 1(XYT1); 자일로실트랜스퍼라제 2(XYT2); 타파진(TAZ); 호모겐티신산 1,2-디옥시게나제(HGD); 글루코스-6-포스파타제 촉매 서브유닛(G6PC); 1,4-알파-글루칸 효소 1(GBE1); 포스포프룩토키나제, 근육(PFKM); 포스포릴라제 키나제 조절 서브유닛 알파 1(PHKA1); 포스포릴라제 키나제 조절 서브유닛 알파 2(PHKA2); 포스포릴라제 키나제 조절 서브유닛 베타(PHKB); 포스포릴라제 키나제 촉매 서브유닛 감마 2(PHKG2); 포스포글리세레이트 뮤타제 2(PGAM2); 시스타티오닌-베타-신타제(CBS); 메틸렌테트라하이드로폴레이트 리덕타제(MTHFR); 5-메틸테트라하이드로 폴레이트-호모시스테인 메틸트랜스퍼라제(MTR); 5-메틸 테트라하이드로폴레이트-호모시스테인 메틸트랜스퍼라제 리덕타제(MTRR); 메틸말로닌산산성뇨 및 호모시스테인뇨증, clbID 타입(MMADHC); 미토콘드리아 DNA, 제한 없이, 미토콘드리아 인코딩된 NADH: 유비퀴논 옥시도리덕타제 코어 서브유닛 1(MT-ND1); 미토콘드리아 인코딩된 NADH: 유비퀴논 옥시도리덕타제 코어 서브유닛 5(MT-ND5); 미토콘드리아 인코드된 tRNA 글루탐산(MT-TE); 미토콘드리아 인코드된 tRNA 히스타딘(MT-TH); 미토콘드리아 인코드된 tRNA 루신 1(MT-TL1); 미토콘드리아 인코드된 tRNA 리신(MT-TK); 미토콘드리아 인코드된 tRNA 세린 1(MT-TS1); 미토콘드리아 인코드된 tRNA 발린(MT-TV)을 제한 없이 포함한다; 미토겐-활성화 단백질 키나아제 키나제 1(MAP2K1); B-Raf 프로토-종양유전자, 세린/트레오닌 키나제(BRAF); raf-1 프로토-종양유전자, 세린/트레오닌 키나제(RAF1); 성장 인자, 제한 없이, 인슐린 성장 인자 1(IGF-1); 형질 전환 성장 인자 β3(TGFP3); 형질 전환 성장 인자 β 수용체, 타입 I(TGFβR1); 형질 전환 성장 인자 β 수용체, 타입 II(TGFβR2), 섬유 모세포 성장 인자 2(FGF2), 섬유 모세포 성장 인자 4(FGF4), 혈관 내피 성장 인자 A(VEGF-A), 혈관 내피 성장 인자 B(VEGF-B); 혈관 내피 성장 인자 C(VEGF-C), 혈관 내피 성장 인자 D(VEGF-D), 혈관 내피 성장 인자 수용체 1(VEGFR1) 및 혈관 내피 성장 인자 수용체 2(VEGFR2)를 포함한다; 인터류킨; 면역부착; 사이토 카인; 및 항체.
바람직한 실시 양태에서, 본 AAV 변이체에 의해 전달된 유전자 산물은 알파 갈락토시다제 A(GLA), 프라탁신(FXN), 디스트로핀(DMD), 산 알파 글루코시다아제(GAA) 및 근육 글리코겐 포스포릴라제(PYGM)으로부터 선택된다. 일부 바람직한 실시 양태에서, 본 AAV 변이체는 (i) 서열 식별 번호 67로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 GLA 폴리펩타이드, (ii) 서열 식별 번호 69로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 FXN 폴리펩타이드, (iii) 서열 식별 번호 64로 개진된 아미노산 서열의 기능적 단편(예를 들어, 미니 또는 마이크로 디스트로핀, 바람직하게는 24개의 스펙트린-유사 반복 중 적어도 4개의 완전한 액틴-결합 도메인 및 디스트로글리칸-결합 도메인을 포함한다)을 포함하거나 이들로 이루어진 DMD 폴리펩타이드, (iv) 서열 식별 번호 68로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 GAA 폴리펩타이드, (v) 서열 식별 번호 66로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 PYGM 폴리펩타이드, (vi) 또는 (v) 서열 식별 번호 64 및 66-69 중 어느 하나와 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일한 아미노산 서열을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분절(segment)을 포함한다.
다른 바람직한 실시 양태에서, 본 AAV 변이체는 DMPK의 발현을 감소시키는 간섭 RNA, 예를 들어, 안티센스 RNA, miRNA, shRNA 또는 siRNA를 인코딩하는 이식 유전자를 포함한다. 일부 양태에서, 간섭 RNA는 서열 식별 번호 65로 개진된 바와 같은 뉴클레오타이드 서열 또는 서열 식별 번호 65와 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 서열을 갖는 핵산에 의해 인코딩되는 DMPK의 발현을 감소시킨다.
유전자 산물이 세포 사멸(apoptosis)을 유도하거나 촉진시키는 유전자는 본원에서 "프로-세포 사멸(pro-apoptotic) 유전자"로 지칭되며, 이들 유전자(mRNA; 단백질)의 산물은 "프로-세포 사멸 유전자 산물"로 지징된다. 프로 세포 사멸 표적은, 예를 들어, Bax 유전자 산물; Bid 유전자 산물; Bak 유전자 산물; Bad 유전자 산물; Bcl-2; Bcl-X1을 포함한다. 항-세포 사멸 유전자 산물은 X-결합된 세포 사멸 억제제를 포함한다.
유전자 산물이 혈관 신생(angiogenesis)를 유도하거나 촉진시키는 유전자는 본원에서 "프로-혈관 신생(pro-angiogenic) 유전자"로 지칭되며, 이들 유전자(mRNA; 단백질)의 산물은 "프로-혈관 신생 유전자 산물"로 지칭된다. 프로-혈관 신생 표적은, 예를 들어, 혈관 내피 성장 인자(VEGFa, VEGFb, VEGFc, VEGFd); 혈관 내피 성장 인자 수용체 1(VEGFR1); 혈관 내피 성장 인자 수용체 2(VEGFR2); Fms 관련 티로신 키나아제 1(Flt1); 태반 성장 인자(PGF); 혈소판 유래 성장 인자(PDGF); 안지오포이에틴; 소닉 헤지호그를 포함한다. 유전자 산물이 혈관 신생을 억제하는 유전자는 본원에서 "항-혈관 신생 유전자"로 지칭되고, 이들 유전자(mRNA; 단백질)의 산물은 "항-혈관 신생 유전자 산물"로 지칭된다. 항-혈관 신생 유전자 산물은 엔도스타틴; 텀스타틴; 안지오스타틴; 색소 상피-유도 인자(PEDT), 및 융합 단백질 또는 프로-혈관 신생 표적 및/또는 그들의 수용체에 특이적인 항체, 예를 들면 VEGF 특이적 항체 AvastinTM 등을 포함한다.
유전자 산물이 면역 조절자, 예를 들어 보체 인자, 톨-유사 수용체로서 기능하는 유전자를 "면역 조절 유전자(immunomodulatory genes)"라고 부른다. 예시적인 면역 조절 유전자는 사이토카인, 케모카인, 및 이들 및/또는 이들의 수용체, 예를 들면 항 IL-6 융합 단백질 Rilonacept TM, 보체 인자 H-특이적 항체 람파미주맙 등에 대해 특이적인 융합 단백질 또는 항체를 포함한다. 유전자 산물이 근육 보호 인자, 예를 들어 인슐린 성장 인자 1(IGF-1); 형질 전환 성장 인자 β(TGFβ); 섬유 모세포 성장 인자(FGF)로서 기능 하는 유전자.
일부 양태에서, 관심 있는 유전자 산물은, 예를 들어, 엔도뉴클레아제가 근육 질병과 관련된 대립유전자를 녹아웃 하는 경우, 유전자 기능의 부위-특이적 녹다운을 제공하는 부위-특이적 엔도뉴클레아제이다. 예를 들어, 우세 대립유전자가야생형인 경우, 근육 구조 단백질이고 및/또는 정상 근육 기능을 제공하는 유전자의 결함 복제(copy)를 인코딩하는 경우, 부위-특이적 엔도뉴클레아제는 결함 대립유전자에 표적화 될 수 있고 결함 대립유전자를 녹아웃할 수 있다.
결함 대립유전자를 녹아웃 하는 것 이외에, 부위-특이적 뉴클레아제는 또한 결함 대립유전자에 의해 인코딩되는 단백질의 기능적 복제를 인코딩하는 도너(donor) DNA와의 상동 재조합을 자극하는 데 사용될 수 있다. 따라서, 예를 들어, 본 rAAV 비리온은 결함 대립유전자를 녹아웃 하는 부위-특이적 엔도뉴클레아제를 전달하는데 사용될 수 있고, 결함 대립유전자의 기능적 복제를 전달하는데 사용될 수 있어, 결함 대립유전자의 회복을 초래함에 따라, 기능성 근육 단백질(예를 들어, 기능성 라민 A/C, 기능성 피브릴린, 기능성 콜라겐 타입 VI 등)의 생산을 제공한다. 일부 실시 양태에서, 본원에 개시된 rAAV 비리온은 부위-특이적 엔도뉴클레아제를 인코드하는 이종성 뉴클레오타이드 서열; 및 결함 대립유전자의 기능적 복제를 인코드하는 이종성 뉴클레오타이드 서열을 포함하며, 여기서 기능성 복제는 기능성 근육 단백질을 인코드한다. 기능성 근육 단백질은 예를 들어, 라민 A/C, 피브릴린 1, COL6A1, COL6A2, COL6A3 등을 포함한다.
사용하기에 적합한 부위-특이적 엔도뉴클레아제는, 예를 들어, 메가뉴클레아제; 징크 핑거 뉴클레아제(ZFNS); 전사 활성화제-유사 이펙터 뉴클레아제(TALENS); 및 클러스터링된 규칙적으로 상호 이격된 짧은 회기성(palindromic) 반복/CRISPR-연관(Cas)을 포함하며, 여기서 이러한 부위-특이적 엔도뉴클레아제는 비-자연적으로 발생하고 특정 유전자를 표적화하도록 변형된다. 이러한 부위-특이적 뉴클레아제는 게놈 내의 특정 위치를 절단하도록 조작될 수 있고, 비-상동성 말단 결합은 수 개의 뉴클레오타이드를 삽입 또는 삭제하면서 파단을 회복할 수 있다. 이러한 부위-특이적 엔도뉴클레아제("INDELs"로도 지칭됨)는 이어서 단백질을 프레임으로부터 버리고, 효과적으로 유전자를 녹아웃 한다. 예를 들어, 미국 특허 공보 제2011/0301073호를 참조한다.
본원에 개시된 변이체 rAAV 벡터의 일부 실시 양태에서, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 구성적 프로모터에 작동 가능하게 연결된다. 적합한 구성적 프로모터는 예를 들어, 사이토메갈로바이러스 프로모터(CMV)(Stinski et al. (1985) Journal of Virology 55(2): 431-441), CMV 초기 인핸서/치킨 β-액틴(CBA) 프로모터/토끼 β-글로빈 인트론(CAG)(Miyazaki et al. (1989) Gene 79(2): 269-277, CBSB (Jacobson et al. (2006) Molecular Therapy 13(6): 1074-1084),인간 신장 인자 1α 프로모터(EF1α)(Kim et al. (1990) Gene 91(2): 217-223), 인간 포스포글리세레이트 키나제 프로모터(PGK)(Singer-Sam et al. (1984) Gene 32(3): 409-417, 미토콘드리아 중쇄 프로모터(Loderio et al. (2012) PNAS 109(17): 6513-6518), 유비퀴틴 프로모터(Wulff et al. (1990) FEBS Letters 261: 101-105)를 포함한다.
다른 실시 양태에서, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 유도성 프로모터에 작동 가능하게 연결된다. 일부 경우에, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 조직-특이적 또는 세포 유형 - 특이적 조절 요소에 작동 가능하게 연결된다. 예를 들어, 일부 경우에, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 근육-특이적 조절 요소(예를 들어, 심장 특이적 프로모터 또는 골격 근육 특이적 프로모터), 예를 들어, 근육 세포에서 작동 가능하게 연결된 유전자의 선택적 발현을 부여하는 조절 요소에 작동 가능하게 연결된다. 적합한 근육-특이적 조절 요소는 예를 들어, 골격 근육 α-액틴 프로모터(Muscat and Kedes (1987) Mol. Cell. Biol. 7:4089-4099); 심장 근육 α-액틴 프로모터(Minty and Kedes (1986) Mol. Cell. Biol. 6:2125-2136); 평활근 α-액틴 프로모터(Nakano et al. (1991) Gene 99:285-289); 혈관 평활근 α-액틴 프로모터(Keogh et al. (1999) Gene Therapy 6(4):616-628); 근육 크레아틴 키나제 프로모터(Bartlett et al. (1996) Cell Transplantation 5(3):411-419); 미오신 경쇄 1 및 미오신 경쇄 3 프로모터(Seidel and Arnold (1989) J. Biol. Chem. 264(27):16109-16117): 16109-16117): 미오신 경쇄 2v(MLC2v) 프로모터(Su et al. (2004) PNAS 101(46):16280-16285): 미오제닉(myogenic) 인자 5(Myf5) 프로모터(Fujimaki et al. (2004) Journal of Biological Chemistry 289(11):7399-7412); 미오제닉 분화 1(Myod1) 프로모터(Zingg et al. (1994) Nucleic Acids Research 22(12):2234-2241); 미오제닌(Myogenin)(Myog) 프로모터(Salminen et al. (1991) Journal of Cell Biology 115(4):905-917); 쌍을 이룬 박스 유전자 7(Pax7) 프로모터(Murmann et al. (2000) Biol Chem. 381(4):331-335); 쌍을 이룬 유사한 호메오도메인 3(Pitx3) 프로모터(Coulon et al. (2007) Journal of Biological Chemistry 282:33192-33200); MHCK7 프로모터(Salva et al. (2007) Mol. Ther. 15(2):320-329); MCK/SV40 프로모터(Takeshita et al. (2007) International Journal of Molecular Medicine 19:309-315); C5-12 프로모터(Li et al. (1999) Nature Biotechnology 17:241-245); 이중 및 삼중 탠덤 MCK 인핸서/프로모터(Wang et al. (2008) Gene Therapy 15:1489-1499); 미오신 중쇄 7(MYH7) 프로모터(Iwaki et al. (2104) PLoS ONE 9(4):e88610); 미오신 중쇄 6(MYH6) 프로모터(Pacak et al. (2008) Genet. Vaccines Ther. 6:13); 심장 트로포닌 T(TNNT2) 프로모터(Farza et al. (1998) J. Mol. Cell Cardiol. 30(6):1247-53); α-트로포미오신 프로모터(Helfman et al. (1986) Molecular and Cellular Biology 6(11):3582-3595); 심장 트로포닌 C(TNNC1) 프로모터(Scheier et al. (1990) Journal of Biological Chemistry 34(5):21247-21253); 심장 미오신-결합 단백질 C 프로모터(Lin et al. (2013) PLoS ONE 8(7):e69671); 심장 트로포닌 I (TNNI3) 프로모터(Bhavsar et al. (1996) Genomics 35(1):11-23); 데스민 프로모터(Li et al. (1991) Journal of Biological Chemistry 10(5):6562-6570); 나트륨-칼슘 교환기(NCX1) 프로모터(Scheller et al. (1997) Journal of Biological Chemistry 273(13):7643-7649); 심장 나트륨이뇨 인자 프로모터(Durocher et al. (1996) Molecular and Cellular Biology 16(9):4648-4655); 및 SM22α 프로모터(Kemp et al. (1995) Biochemical Journal 310(3):1037-1043)를 포함한다.
본 발명의 목적을 위해, 본원의 개시는 전술한 바와 같은 변이체 AAV 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산을 제공한다. 단리된 핵산은 AAV 벡터, 예를 들어, 재조합 AAV 벡터일 수 있다.
본원의 개시는 또한 근육 질병을 치료하는 방법을 제공하며, 상기 방법은 본원에 개시되고 상기에 기재된 바와 같은 관심있는 이식 유전자를 포함하는 유효량의 rAAV 변이 비리온을 그것을 필요로 하는 개인에게 투여하는 것을 포함한다. 당업자는 본 rAAV 비리온의 유효량을 용이하게 결정할 수 있고, 하나 이상의 기능적 또는 해부학적 파라미터, 예를 들어, 근육 생검, 이어서 면역조직화학, 혈청 샘플링 이어서 ELISA 또는 효소 활성 분석, 보행 테스트, 피크 최대 산소 소비, 바이오마커 분석 좌심실 박출 분율, 좌심실 말단-수축기 부피의 변화, 핸드-헬드 동력 측정법, 최대 중량 리프트, 시간 기능 테스트, 해머스미스 운동 능력 점수, 바닥으로부터의 시한 오름, 또는 9홀 PEG 테스트의 변화를 시험함으로써 질병이 치료된다.
근육 기능 및 이들의 변화를 평가하기 위한 비제한적인 방법은 보행 테스트, 피크 최대 산소 소비, 바이오마커 분석, 좌심실 박출 분율, 좌심실 말단-수축기 부피, 비그노오스 스케일, 시간 기능 테스트, 해머스미스 운동 능력 점수, 바닥으로부터의 시한 오름, 운동 기능 측정 규모, 노스 스타 이동성 평가, 9홀 PEG 테스트 또는 필라델피아 아동 병원 신경근 장애의 유아 테스트를 평가하는 것을 포함한다.
일부 실시 양태에서, 유효량의 본 rAAV 비리온은 근육 기능, 해부학적 근육 완전성 또는 근육 질량의 손실률, 예를 들어, 손실률의 감소 및 이에 따른 질병의 진행의 감소를 2배, 3배, 4배 또는 5배 이상 줄이고, 예를 들어 손실률의 감소 및 이에 따른 질병의 진행 속도의 10배 이상 감소를 초래한다. 일부 실시 양태에서, 본 발명의 rAAV 비리온의 유효량은 근육 기능의 이득, 근육 강도의 이득, 근육 질량의 이득, 및/또는 해부학적 근육 완전성 또는 바이오마커의 개선, 예를 들어, 2배, 3배, 4배 또는 5배 이상 개선 또는 근육 기능, 근육 강도, 근육 질량, 및/또는 해부학적 근육 완전성 또는 바이오마커의 개선에서 10배 이상 개선을 초래한다. 당업자가 용이하게 이해할 수 있는 바와 같이, 요망하는 치료 효과를 달성하기 위해 요구되는 투여량은 전형적으로 당업자가 1 x 108 내지 약 1 x 1016 "벡터 게놈"으로 지칭하는, 전형적으로 1 x 108 내지 약 1 x 1016 재조합 비리온의 범위일 것이며, 바람직하게는 약 1 x 1011 내지 약 1 x 1015 재조합 비리온의 범위일 것이다.
본 발명의 RAAV 비리온은 혈관 내(정맥 내 또는 동맥 내)투여, 복강 내 투여, 사지 관류 및/또는 직접 근육 내 주사에 의해 또는 rAAV 비리온이 골격 근육에 전달되게 하는 임의의 다른 편리한 모드 또는 투여 경로에 의해 골격 근육에 전달될 수 있다. RAAV 비리온은 혈관 내(정맥 내 또는 동맥 내) 투여, 직접적인 심장 주입(좌심방, 우심방, 우심실 및/또는 격막), 관상동맥(좌측 전방 강하 또는 좌측 굴곡 관상동맥을 통해)으로의 앞 방향 또는 역행 주입, 재순환, 복강 내 주사, 심내막(transendocardial)을 통한 주사 또는 rAAV 비리온을 심장 근육에 전달할 수 있는 임의의 다른 편리한 모드 또는 투여 경로에 의해 심장 근육에 전달될 수 있다, 바람직한 실시 양태에서, 본 rAAV 비리온은 전신 정맥 내 투여에 의해 골격 및/또는 심장 근육에 전달된다. 정맥 내 주사를 통해 투여될 때, 야생형 AAV 비리온 또는 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온의 능력과 비교하여, 본 rAAV 비리온은 순환계를 통해 이동할 수 있고, 근육 세포를 보다 효율적으로 형질 도입할 수 있다.
본원에 개시된 변이체 캡시드 단백질은 단리, 예를 들어 정제된다. 일부 실시 양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 벡터 또는 재조합 AAV(rAAV) 비리온에 포함된다. 다른 실시 양태에서, 이러한 AAV 변이체 벡터 및/또는 AAV 변이체 비리온은 영장류 심장 또는 골격 근육에서 근육 질병을 치료하는 생체 내 또는 생체 외 방법에 사용된다.
본원의 개시는 추가로, 제한 없이, 대상 핵산을 포함하는 단리된(유 전적으로 변형된) 숙주 세포와 같은 숙주 세포를 제공한다. 본원에 개시된 본 발명에 따른 숙주 세포는 시험관 내 세포 배양으로부터의 세포와 같은 단리된 세포일 수 있다. 이러한 숙주 세포는 본원에 기재된 바와 같이 본 발명의 rAAV 변이체 비리온을 생산하는데 유용하다. 일 실시 양태에서, 이러한 숙주 세포는 핵산으로 안정적으로 유전적으로 변형된다. 다른 실시 양태에서, 숙주 세포는 핵산으로 일시적으로 유전자 변형된다. 이러한 핵산은 전기 천공법, 칼슘 포스페이트 침전법, 리포솜 매개 형질 전환 등을 포함하는, 그러나 이에 제한되지 않는 입증된 기술을 사용하여 숙주 세포 내로 안정적으로 또는 일시적으로 도입된다. 안정한 형질 전환을 위해, 핵산은 일반적으로 선별 마커, 예를 들어 네오마이신 내성 등과 같은 여러 가지 잘 알려진 선별 마커 중 임의의 것을 더 포함할 것이다. 이러한 숙주 세포는 임의의 다양한 세포, 예를 들어, 쥐 세포 및 영장류 세포(예를 들어, 인간 세포)를 비롯한 포유류 세포 중 임의의 세포에 핵산을 도입함으로써 생성된다. 예시적인 포유동물 세포는, 제한적이지 않지만, 1차 세포 및 세포주를 포함하고, 예시적 세포주는 HEK293 세포, HEK293T 세포, COS 세포, HeLa 세포, Vero 세포, 3T3 생쥐 섬유 모세포, C3H10T1/2 섬유 모세포, CHO 세포 등을 포함하지만 이에 한정되지는 않는다. 예시적인 숙주 세포로는 제한적이지 않지만 HeLa 세포(예를 들어, American Type Culture Collection (ATCC) No. CCL-2), CHO 세포(예를 들어, ATCC Nos. CRL9618, CCL61, CRL9096), 293 세포(예를 들어, ATCC No. CRL-1573), Vero 세포, NIH 3T3 세포(예를 들어, ATCC No. CRL-1658), Huh-7 세포, BHK 세포(예를 들어, ATCC No. CCL10), PC12 세포(ATCC No. CRL1721), COS 세포, COS-7 세포(ATCC No. CRL1651), RAT1 세포, 생쥐 L 세포(ATCC No. CCLI.3), 인간 배아 신장(HEK) 세포(ATCC No. CRL1573), HLHepG2 세포 등을 포함한다. 숙주 세포는 또한 AAV를 생성하는 Sf9 세포와 같은 곤충 세포를 감염시키기 위해 바큘로 바이러스(baculovirus)를 사용하여 제조될 수 있다(예를 들어, 미국 특허 제7,271,002호; 미국 특허 출원 번호 제12/297,958호를 참조한다). 일부 실시 양태에서, 유전자 변형된 숙주 세포는 전술한 바와 같은 변이체 AAV 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산 이외에, 하나 이상의 AAV rep 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산을 포함한다. 다른 실시 양태에서, 숙주 세포는 rAAV 변이체 벡터를 더 포함한다. 이러한 숙주 세포를 사용하여 rAAV 변이체 비리온을 생성할 수 있다. rAAV 비리온을 생성하는 방법은 예를 들어, 미국 특허 공개 번호 제2005/0053922호 및 미국 특허 공개 번호 제2009/0202490호에 기재되어 있다.
본원의 개시는 추가로 a) 본원에 개시 및 상기에서 기재된 바와 같은 rAAV 변이체 비리온; 및 b) 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는 역학적 조성물을 제공한다. 일부 실시 양태에서, 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제는 인간 또는 비인간 환자에서의 사용에 적합하다. 이러한 부형제, 담체, 희석제 및 완충제는 과도한 독성 없이 투여될 수 있는 임의의 약제를 포함한다. 약학적으로 허용 가능한 부형제는 물, 식염수, 글리세롤 및 에탄올과 같은 액체를 포함하지만 이에 한정되지 않는다. 약학적으로 허용 가능한 염, 예를 들어 염산염, 브롬산염, 인산염, 황산염 등과 같은 광물산염; 및 아세트산염, 프로피오산염, 말론산염, 벤조산염 등과 같은 유기산 염이 포함될 수 있다. 부가적으로, 습윤제 또는 유화제, 계면 활성제, pH 완충 물질 등과 같은 보조 물질이 이러한 비히클에 존재할 수 있다. 매우 다양한 약학적으로 허용 가능한 부형제가 당업계에 공지되어 있으며 여기에서 상세히 논의할 필요는 없다. 약학적으로 허용 가능한 부형제는 예를 들어, A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy," 20th edition, Lippincott, Williams, & Wilkins; Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel et al., eds., 7th ed., Lippincott, Williams, & Wilkins; and Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe et al., eds., 3rd ed. Amer. Pharmaceutical Assoc.를 포함하는 다양한 출판물에 충분하게 기술되어 있다. 본 발명의 일부 양태에서, 본 발명은 약 1 x 108 내지 약 1 x 1016 재조합 바이러스 또는 1 x 108 내지 약 1 x 1016 벡터 게놈을 포함하는 약학적 조성물을 제공하고, 각각의 상기 재조합 바이러스는 하나 이상의 유전자 산물을 인코딩하는 게놈을 포함한다.
본 발명의 일부 실시 양태는 하기 항목 1 내지 54 에 예시되어 있다:
1. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV)이며, 그 삽입은 AAV2 또는 AAV2 또는 AAV 변이체 이외의 야생형 AAV 혈청형의 캡시드 부분 내의 상응하는 위치에 있으며, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.
2. 항목 1의 변이체 AAV에 있어서, 상기 캡시드 단백질은 AAV2에 대해 하나 이상의 점돌연변이 또는 다른 야생형 AAV 혈청형 또는 AAV 변이체에 대해 하나 이상의 상응하는 점돌연변이를 포함한다.
3. 항목 2의 변이체 AAV에 있어서, 상기 하나 이상의 점돌연변이는 A35P, S109T, P195L, D213N, G222S, V229I, N312K, A319T, T330A, A333S, E347K, P363L, A427D, V447F, N449D, N449K?, G453R, A490T, K527Q, N551S, A581T, Y585S, R588M, A593E, W606C, K649E, R651H, W694C, I698V, V708I, 및 L735Q로 이루어진 군으로부터 선택되고, 바람직하게는 V708I, V708I + A593E, V708I + S109T, V708I + T330A, A35P, V708I + R588M, V708I + W606C, V708I + W694C, I698V, N312K + N449D + N551S + I698V + L735Q, N312K + N449D + N551S + I698V + V708I + L735Q, V708I + N449K 및 V708I+G222S로 이루어진 군으로부터 선택된다.
4. 항목 1의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 AAV2의 VP1에서 위치 570-671의 또는 다른 야생형 AAV 혈청형 또는 AAV 변이체에서 상응하는 위치의 아미노산 중 임의의 것에 후속하여 삽입된다.
5. 항목 4의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 AAV2의 VP1에서 아미노산 587 또는 다른 AAV 혈청형의 상응하는 위치에 후속하여 삽입된다.
6. (a) 항목 1-5 중 어느 하나에 따른 변이체 AAV 캡시드 단백질, 및 이종성 핵산을 포함하는 감염성 재조합 아데노-관련 바이러스(rAAV) 비리온.
7. 항목 6의 rAAV에 있어서, 상기 이종성 핵산은 RNA 간섭제 또는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함한다.
8. 표적 세포를 항목 7의 RAAV 비리온과 접촉시키는 것을 포함하는, 표적 세포에 이종성 핵산을 전달하는 방법.
9. 항목 8의 방법에 있어서, 상기 표적 세포가 심장 및/또는 골격 근육 세포인 방법.
10. 항목 8의 방법에 있어서, 상기 표적 세포가 시험관 내에 존재하는 방법.
11. 항목 8의 방법에 있어서, 상기 표적 세포가 생체 내에 존재하는 방법.
12. 캡시드 단백질의 GH-루프 내에 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산이며, 상기 삽입은 AAV2 내에 또는 AAV 변이체 이외의 야생형 AAV 혈청형 또는 AAV 변이체의 캡시드 부분 내의 상응하는 위치에 있으며, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.
13. 항목 12의 핵산을 포함하는 단리된 숙주 세포.
14. AAV2의 VP1의 아미노산 570 및 611 사이의 위치에서 2개의 인접한 아미노산에 상응하는 모 AAV 캡시드 단백질에 대해 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 삽입은 아미노산 서열 Y1Y2X1X2X3X4X5X6X7Y3을 포함하며, X1은 T 및 N으로부터 선택되고; X2는 N 및 K 로부터 선택되고; X3은 K, I 및 T로부터 선택되고; X4는 I, Q 및 T로부터 선택되고; X5는 G, R 및 N으로부터 선택되고; X6은 V, T 및 K로부터 선택되고; X7은 T 및 D로부터 선택된다.
15. 항목 14의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로 이루어진 군으로부터 선택된다.
16. 항목 15의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 N-말단 아미노산 LA 및 C-말단 아미노산 A 측면에 위치한다(flanked).
17. 항목 15의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 AAV2의 VP1의 아미노산 587과 588 사이 또는 다른 야생형 AAV 혈청형 또는 AAV 변이체의 상응하는 위치 사이에 있다.
18. (a) 항목 14 내지 17 중 어느 하나에 따른 변이체 AAV 캡시드 단백질, 및 이종성 핵산을 포함하는 감염성 재조합 아데노-관련 바이러스(RAAV) 비리온.
19. 항목 18의 rAAV에 있어서, 상기 이종성 핵산은 RNA 간섭제 또는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함한다.
20. 표적 세포를 항목 18의 RAAV 비리온과 접촉시키는 것을 포함하는, 표적 세포에 이종성 핵산을 전달하는 방법.
21. 항목 20에 있어서, 상기 표적 세포가 심장 및/또는 골격 세포인 방법.
22. 항목 21에 있어서, 상기 표적 세포가 시험관 내 또는 생체 내에서 존재하는 방법.
23. i) 서열 식별 번호 1-10 및 11로 이루어진 군으로부터 선택된 야생형 AAV 와 적어도 90% 동일한 AAV 아미노산 서열; 및 ii) P363L, P363L + V708I, P363L + E347K, V708I + A593E, V708I + A333S, V708I + S721L, V708I + A593E + N551S, V708I + A593E + K649E, V708I + A593E + S109T, V708I + A593E + S109T + K527Q, A593E + S109T로 이루어진 군으로부터 선택된 하나 이상의 아미노산 치환을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 하나 이상의 치환은 AAV2에 대해 또는 다른 AAV 혈청형에 대해 하나 이상의 상응하는 치환이다.
24. 항목 23의 변이체 AAV에 있어서, 상기 캡시드 단백질은 펩타이드 삽입을 포함한다.
25. 항목 24의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41), 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.
26. 항목 23의 변이체 AAV에 있어서, AAV 아미노산 서열은 야생형 AAV와 적어도 95% 동일하다.
27. 항목 23의 변이체 AAV에 있어서, AAV 아미노산 서열은 야생형 AAV와 적어도 99% 동일하다.
28. 항목 23의 변이체 AAV에 있어서, 상기 캡시드 단백질은 키메라 캡시드 단백질이거나 조상 캡시드 단백질이다.
29. (a) 항목 23-28 중 어느 하나에 따른 변이체 AAV 캡시드 단백질, 및 이종성 핵산을 포함하는 감염성 재조합 아데노-관련 바이러스(rAAV) 비리온.
30. 항목 29의 rRAAV에 있어서, 상기 이종성 핵산은 RNA 간섭제 또는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함한다.
31. 표적 세포를 항목 29의 rAAV 비리온과 접촉시키는 것을 포함하는, 표적 세포에 이종성 핵산을 전달하는 방법.
32. 항목 31에 있어서, 상기 표적 세포가 심장 및/또는 골격 근육 세포인 방법.
33. 항목 32에 있어서, 심장 세포가 심장 근육 세포, 심장 근육 모세포, 심장 섬유 모세포, 및 심장 전구 세포로 이루어진 군으로부터 선택되는 방법.
34. 항목 31에 있어서, 상기 표적 세포가 시험관 내에 존재하는 방법.
35. 항목 31에 있어서, 상기 표적 세포가 생체 내에 존재하는 방법.
36. 서열 식별 번호 1-12로 이루어진 군으로부터 선택된 야생형 AAV 또는 AAV 변이체와 적어도 90% 동일한 아미노산 서열을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열; 및 ii) P363L, P363L + V708I, P363L + E347K, V708I + A593E, V708I + A333S, V708I + S721L, V708I + A593E + N551S, V708I + A593E + K649E, V708I + A593E + S109T, V708I + A593E + S109T + K527Q, A593E + S109T로 이루어진 군으로부터 선택된 하나 이상의 아미노산 치환을 포함하는 단리된 핵산.
37. 항목 36의 핵산을 포함하는 단리된 숙주 세포.
38. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하고, 임의로 하나 이상의 점돌연변이를 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13) 및 LANKIQRTDA(서열 식별 번호 26)로 이루어진 군으로부터 선택된다.
39. 항목 38에 따른 변이체 AAV 캡시드 단백질은 V708I 아미노산 치환을 포함한다.
40. 항목 39에 따른 변이체 AAV 캡시드 단백질은 V708I + A593E, V708I + S109T, V708I + T330A, V708I + R588M 또는 V708I + N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.
41. 항목 38에 따른 변이체 AAV 캡시드 단백질은 A35P 아미노산 치환을 포함한다.
42. 항목 38에 따른 변이체 AAV 캡시드 단백질은 N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.
43. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하고, 임의로 하나 이상의 점돌연변이를 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 펩타이드 삽입은 NKTTNKD(서열 식별 번호 14) 및 LANKTTNKDA(서열 식별 번호 27)로 이루어진 군으로부터 선택된다.
44. 항목 43에 따른 변이체 AAV 캡시드 단백질은 V708I 아미노산 치환을 포함한다.
45. 항목 44에 따른 변이체 AAV 캡시드 단백질은 V708I + S109T, V708I + W694C, V708I + W606C, 또는 V708I + N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.
46. 항목 43에 따른 변이체 AAV 캡시드 단백질은 I698V 아미노산 치환을 포함한다.
47. 항목 46에 따른 변이체 AAV 캡시드 단백질은 N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.
48. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하고, 임의로 하나 이상의 점돌연변이를 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 펩타이드 삽입은 TNKIGVT(서열 식별 번호 15), LATNKIGVTA(서열 식별 번호 28) 및 LATNKIGVTS(서열 식별 번호 36)로 이루어진 군으로부터 선택된다.
49. 항목 48에 따른 변이체 AAV 캡시드 단백질은 V708I 아미노산 치환을 포함한다.
50. 항목 49에 따른 변이체 AAV 캡시드 단백질은 V708I + N449K, V708I + G222S, 또는 V708I + N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.
51. 항목 48에 따른 변이체 AAV 캡시드 단백질은 N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.
52. 서열 식별 번호 62의 서열 또는 그것과 적어도 90% 동일한 서열을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 변이체 AAV 캡시드 단백질은 AAV5 캡시드에 대해 하기 아미노산 치환을 포함한다: V229I + A490T + A581T.
53. 항목 52에 따른 변이체 AAV 캡시드 단백질은 AA5 캡시드에 대해 Y585S 또는 V447F 아미노산 치환을 더 포함한다.
54. 서열 식별 번호 63의 서열 또는 그것과 적어도 90% 동일한 서열을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 변이체 AAV 캡시드 단백질은 AAV5 캡시드에 대해 하기 아미노산 치환을 포함한다: V229I + A427D + A490T + A581T.
실시예
하기 실시예는 본 발명을 구성하고 이용하는 방법에 대한 완전한 개시 및 설명을 당업자에게 제공하기 위해 제시되며, 본 발명자가 이러한 발명으로 간주하는 범위를 제한하기 위한 것이 아니며, 하기 실험이 전부이거나 수행된 유일한 실험임을 나타내기 위한 것도 아니다. 사용된 숫자(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하려고 하였지만, 일부 실험적 오류 및 편차는 고려되어야 한다. 달리 언급되지 않는 한, 부(part)는 중량부이고, 분자량은 중량 평균 분자량이고, 온도는 섭씨 온도이고, 압력은 대략적인 대기압이다.
분자 및 세포 생화학의 일반적인 방법은 문헌[Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001); Short Protocols in Molecular Biology, 4th Ed. (Ausubel et al. eds., John Wiley & Sons 1999); Protein Methods (Bollag et al., John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997); and Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)]과 같은 표준 교제에서 찾아볼 수 있으며, 이의 전문은 본원에 참고로 포함된다. 본 개시에서 언급된 유전자 조작을 위한 시약, 클로닝 벡터 및 키트는 BioRad, Stratagene, Invitrogen, Sigma-Aldrich 및 ClonTech와 같은 상업적 공급자로부터 입수 가능하다.
실시예 1
정맥 내 주사 및 조직 수확. 체중이 적어도 3kg 이상인 연령 3 내지 10 세의 단일 수컷 시노몰구스 마카크(cynomolgus macaque)(macaca fascicularis)를 각 선택 라운드에 대해 복재(saphenous) 정맥을 통해 정맥 내 주사를 통해 투여하였다. 동물은 마취시키고 라이브러리의 1-5mL(제 1 라운드에서, 라이브러리는 도 1A에 기재된 모든 돌연변이유발 기술을 사용하여 생성된 변이체로 구성된다; 각각의 후속 라운드에서, 변이체는 이전 라운드로부터 분리되었다), 일부 경우에는 37℃에서 30분 동안 인간 IVIG와 사전-인큐베이션하였다.
안락사는 선택에 따라 14±3 또는 21±3일째에 100mg/kg 펜토바르비탈 나트륨을 정맥 내 주사를 사용하여 숙련된 수의사에 의해 수행되었다. 사두근으로부터 심장 및/또는 골격 근육 조직을 제거하고, DNA를 그 조직으로부터 분리하였다. 일부 경우에, 심장 조직을 여러 영역: 심방, 심실 격벽, 좌측 유두 근육, 우측 유두 근육, 좌심실 및 우심실로 분할하였다.
유도 진화. 유도 진화 과정은 도 1A 내지 도 1E에 나타나 있다. 간단히 말해, DNA 돌연변이 기법과 cap 유전자의 20개 이상(20+)의 독점적인 조합을 포함하는 바이러스성 캡시드 라이브러리가 생성된다(도 1A). 이어서, 이 같은 입자가 이러한 캡시드를 인코딩하는 cap 유전자를 둘러싸고 있는 돌연변이 캡시드로 구성되도록 바이러스를 패키징하고(도 1B) 정제한다. 캡시드 라이브러리는 생체 내에서 선택압을 받게 한다. 관심있는 조직 또는 세포 물질을 그 표적을 성공적으로 감염시켰던 AAV 변이체를 단리하기 위해 수확하고, 바이러스를 성공적으로 회수한다. 성공적인 클론은 반복된 선택을 통해 농축된다(단계 1 - 도 1D). 이어서, 선택된 cap 유전자는 독점적인 재다양화를 거치게 되고, 바이러스 적합성을 반복적으로 증가시키기 위해 추가의 선택 단계를 통해 농축된다(단계 2 - 도 1D). 벡터 선택 단계 1 및 2 동안 확인된 변이체는 영장류 근육 세포를 형질 도입시키는 능력을 입증한다(도 1E).
AAV 캡시드 게놈의 성공적인 회수. 각 선택 라운드에서 회수된 캡시드를 사용하여 후속적인 선택 라운드를 개시하기 위해 주입되는 라이브러리를 패키징하였다. 조직으로부터의 캡시드 유전자의 회수는 관심있는 조직 내로의 라이브러리 벡터의 성공적인 내재화를 나타낸다. 대표적인 선택 라운드에서 심장 및 골격 근육 조직으로부터 바이러스 게놈을 회수하는 것은 도 2에 나타나 있다. 박스 내의 밴드는 바이러스 게놈의 성공적인 회수를 나타낸다.
서열 분석. 심장 조직 또는 골격 근육 조직에 대한 정맥 내 전달의 선택압 을 포함하는 선택 라운드 3-4 및 심장 조직에 대해 중화 항체의 존재 하에서의 정맥 내 전달의 선택압을 포함하는 선택 1-2 라운드 동안, 집단 내의 변이체의 빈도를 결정하기 위해 라이브러리 내의 개별 클론 상에서 서열화를 수행하였다. 서열화 데이터 내에서 모티프의 존재에 대해 변이체를 평가하였다. 변이체는 다중 서열에서 발생하는 통합 변이(unifying variation)(예를 들어, 캡시드 내의 일정한 위치에 있는 특정 점돌연변이 또는 특정 펩타이드 삽입 서열)의 존재에 기초하여 모티프로 분류되었다. 1회 이상의 선택 라운드에서 서열화된 집단의 적어도 5%를 또는 1회 이상의 선택 라운드에서 서열화된 집단의 적어도 10%를 나타내는 모티프는 도 3A(심장 조직에 대해 정맥 내 전달의 선택력에 대한 라운드 4 서열 분석), 도 3B(심장 조직에 대해 중화 항체의 존재 하에서의 정맥 내 전달의 선택압에 대한 라운드 2 서열 분석), 도면 3B(심장 조직에 대해 중화 항체의 존재하에 정맥 내 전달의 선택압에 대한 라운드 2 서열 분석) 및 도 3C(골격 근육 조직에 대해 정맥 내 전달의 선택압에 대한 라운드 3 서열 분석)에 나타나 있다.
심장 및/또는 골격 근육 세포의 증가된 감염성을 부여하는 것으로 확인된 몇몇 대표적인 클론은 하기 표 1 에 열거되어 있다(각각의 클론은 확인된 치환(들) 및/또는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2와 동일하다; 선택 라운드, 서열 및 빈도(괄호 내)의 수는 각 클론에 대해 열거되어 있다):
표 1. 심장 및/또는 골격 근육 세포의 증가된 감염성을 부여하는 AAV VP1 캡시드 단백질에 대한 아미노산 서열 변형. 컬럼 2에 열거된 치환은 야생형 AAV2에 대한 아미노산 서열, 즉 삽입된 펩타이드의 부재하에 기초한다. 컬럼 5의 "심장 + NAb"는 아미노산 서열 변형이 심장 근육 세포의 증가된 감염성에 더하여 항-AAV 항체에 의한 중화에 대해 증가된 내성을 부여해야 한다는 것을 나타낸다.
삽입 | 치환 | 심장 | 심장 + NAb | 골격 근육 |
588~LANKIQRTDA~ (서열 식별 번호 27) |
없음 | 라운드 3: 6 (9.68%) 라운드 4: 11 (26.83%) |
라운드 1: 2 (1.41%) 라운드 2: 1 (0.81%) |
라운드 3: 1 (1.23%) |
588~LANKIQRTDA~ (서열 식별 번호 27) |
+A35P | 라운드 4: 1 (2.44%) | -- | -- |
588~LANKIQRTDA~ (서열 식별 번호 27) |
+S109T+V708I | 라운드 3: 1 (1.61%) 라운드 4: 2 (4.88%) |
-- | -- |
588~LANKIQRTDA~ (서열 식별 번호 27) |
+R588M+V708I | -- | 라운드 1: 1 (0.70%) | -- |
588~LANKIQRTDA~ (서열 식별 번호 27) |
+A593E+V708I | 라운드 3: 1 (1.61%) | -- | -- |
588~LANKIQRTDA~ (서열 식별 번호 27) |
+V708I | 라운드 3: 13 (20.97%) 라운드 4: 10 (23.26%) |
라운드 1: 1 (0.70%) | -- |
588~LANKTTNKDA~ (서열 식별 번호 28) |
없음 | 라운드 4: 2 (4.88%) | 라운드 1: 10 (7.04%) 라운드 2: 8 (6.50%) |
-- |
588~LANKTTNKDA~ (서열 식별 번호 28) |
+S109T+V708I | 라운드 4: 1 (2.44%) | -- | -- |
588~LANKTTNKDA~ (서열 식별 번호 28) |
+W694C+V708I | 라운드 4: 1 (2.44%) | -- | -- |
588~LANKTTNKDA~ (서열 식별 번호 28) |
+I698V | -- | 라운드 1: 1 (0.70%) | -- |
588~LANKTTNKDA~ (서열 식별 번호 28) |
+W606C+V708I | -- | 라운드 2: 1 (0.81%) | -- |
588~LANKTTNKDA~ (서열 식별 번호 28) |
+V708I | 라운드 3: 6 (9.68%) 라운드 4: 3 (7.32%) |
라운드 1: 4 (2.82%) 라운드 2: 10 (8.13%) |
-- |
588~LATNKIGVTA~ (서열 식별 번호 29) |
+V708I | 라운드 4: 1 (2.44%) | -- | -- |
588~LAQADTTKNA~ (서열 식별 번호 39) |
없음 | -- | 라운드 1: 23 (16.02%) 라운드 2: 21 (17.07%) |
-- |
588~LAQADTTKNA~ (서열 식별 번호 39) |
+D213N | -- | 라운드 2: 1 (0.81%) | -- |
588~LAQADTTKNA~ (서열 식별 번호 39) |
+G453R | -- | 라운드 1: 1 (0.70%) | -- |
588~LAQADTTKNA~ (서열 식별 번호 39) |
+V708I | 라운드 4: 1 (2.44%) | 라운드 1: 3 (2.11%) 라운드 2: 3 (2.44%) |
-- |
588~LAQADTTKNA~ (서열 식별 번호 39) |
+P363L | -- | 라운드 1: 1 (0.70%) | -- |
588~LANQDYTKTA~ (서열 식별 번호 36) |
없음 | -- | 라운드 1: 1 (0.70%) | -- |
588~LANQDYTKTA~ (서열 식별 번호 36) |
+I698V | -- | 라운드 2: 2 (1.63%) | -- |
588~LANQDYTKTA~ (서열 식별 번호 36) |
+V708I | -- | 라운드 1: 1 (0.70%) | -- |
588~LATNRTSPDA~ (서열 식별 번호 40) |
+V708I | -- | 라운드 2: 1 (0.81%) | -- |
588~LAASDSTKAA~ (서열 식별 번호 42) | 없음 | -- | -- | 라운드 3: 1 (1.23%) |
588~LAASDSTKAA~ (서열 식별 번호 42) | +V708I | 라운드 3: 2 (3.23%) | -- | -- |
588~LAASNITKAA~ (서열 식별 번호 33) |
없음 | -- | 라운드 1: 2 (1.41%) 라운드 2: 8 (6.50%) |
-- |
588~LAASNITKAA~ (서열 식별 번호 33) |
+V708I | -- | 라운드 1: 6 (4.23%) 라운드 2: 11 (8.94%) |
-- |
588~LAGNLTKGNA~ (서열 식별 번호 30) |
없음 | 라운드 3: 4 (6.44%) | 라운드 1: 6 (4.23%) 라운드 2: 3 (2.44%) |
-- |
588~LAGNLTKGNA~ (서열 식별 번호 30) |
+S109T+V708I | 라운드 3: 2 (3.23%) | -- | -- |
588~LAGNLTKGNA~ (서열 식별 번호 30) |
+A139T+P195L | -- | 라운드 1: 1 (0.70%) | -- |
588~LAGNLTKGNA~ (서열 식별 번호 30) |
+P363L+V708I | -- | 라운드 1: 1 (0.70%) | -- |
588~LAGNLTKGNA~ (서열 식별 번호 30) |
+R651H | -- | 라운드 2: 1 (0.81%) | -- |
588~LAGNLTKGNA~ (서열 식별 번호 30) |
+V708I | 라운드 3: 2 (3.23%) | 라운드 1: 1 (0.70%) 라운드 2: 2 (1.63%) |
-- |
588~LAGNLTKGNA~ (서열 식별 번호 30) |
+P363L | -- | 라운드 1: 1 (0.70%) | -- |
588~LADNTVTRSA~ (서열 식별 번호 34) |
없음 | -- | 라운드 1: 9 (6.34%) 라운드 2: 6 (4.88%) |
-- |
588~LADNTVTRSA~ (서열 식별 번호 34) |
+I698V | -- | 라운드 2: 1 (0.81%) | -- |
588~LADNTVTRSA~ (서열 식별 번호 34) |
+V708I | -- | 라운드 1: 1 (0.70%) 라운드 2: 2 (1.63%) |
-- |
588~LANTVKLSTA~ (서열 식별 번호 31) |
없음 | -- | 라운드 1: 3 (2.11%) 라운드 2: 7 (5.69%) |
-- |
588~LANTVKLSTA~ (서열 식별 번호 31) |
+V708I | -- | 라운드 2: 8 (6.50%) | -- |
588~LASNTVKAIA~ (서열 식별 번호 32) |
없음 | 라운드 3: 2 (3.23%) 라운드 4: 1 (2.44%) |
-- | -- |
588~LASNTVKAIA~ (서열 식별 번호 32) |
+V708I | 라운드 4: 1 (2.44%) | -- | -- |
588~LATNKIGVTS~ (서열 식별 번호 37) |
없음 | 라운드 4: 1 (2.44%) | -- | -- |
588~LASNTTQKTA~ (서열 식별 번호 41) |
없음 | -- | -- | 라운드 3: 2 (2.46%) |
588~LANKISAKDA~ (서열 식별 번호 35) |
없음 | -- | 라운드 2: 3 (2.44%) | -- |
588~LANKISAKDA~ (서열 식별 번호 35) |
+V708I | -- | 라운드 2: 2 (1.63%) | -- |
없음 | P34A | -- | -- | 라운드 4: 2 (10%) |
없음 | P34S | -- | 라운드 1: 1 (0.70%) | -- |
없음 | P64S | -- | -- | 라운드 4: 1 (5.00%) |
없음 | S109T+P235S | -- | -- | 라운드 4: 1 (5.00%) |
없음 | Q120R | -- | -- | 라운드 4: 1 (5.00%) |
없음 | A193V | -- | -- | 라운드 3: 1 (1.23%) |
없음 | T277N | -- | -- | 라운드 4: 1 (5.00%) |
없음 | P351L | -- | -- | 라운드 4: 1 (5.00%) |
없음 | P363L | -- | 라운드 1: 13 (9.15%) | 라운드 3: 34 (41.98%) 라운드 4: 4 (20.00%) |
없음 | P363L+E347K | -- | -- | 라운드 3: 1 (1.23%) |
없음 | P363L+V708I | -- | 라운드 1: 2 (1.41%) | -- |
없음 | S427T+I698V | -- | 라운드 1: 1 (0.70%) | -- |
없음 | Q440K | -- | -- | 라운드 3: 1 (1.23%) |
없음 | Y444F | -- | -- | 라운드 4: 1 (5.00%) |
없음 | N449D | -- | -- | 라운드 4: 1 (5.00%) |
없음 | T568N | -- | -- | 라운드 3: 1 (1.23%) |
없음 | A593E | 라운드 4: 3 (7.32%) | 라운드 1: 1 (0.70%) | 라운드 3: 31 (38.27%) 라운드 4: 2 (10%) |
없음 | S109T+A593E | -- | -- | 라운드 3: 2 (2.47%) |
없음 | S109T+K527Q+A593E+V708I | 라운드 3: 1 (1.61%) | -- | -- |
없음 | S109T+A593E+V708I | 라운드 3: 1 (1.61%) | -- | -- |
없음 | A593E+N551S+V708I | -- | -- | 라운드 3: 1 (1.23%) |
없음 | A593E+K649E+V708I | 라운드 3: 1 (1.61%) | -- | -- |
없음 | A593E+V708I | 라운드 3: 12 (19.35%) | 라운드 1: 5 (3.52%) | 라운드 3: 1 (1.23%) |
없음 | I698V | -- | -- | 라운드 4: 1 (5.00%) |
없음 | V708I | 라운드 3: 6 (9.68%) 라운드 4: 2 (4.88%) |
라운드 1: 10 (7.04%) | 라운드 3: 1 (1.23%) 라운드 4: 1 (5.00%) |
없음 | V708I+A333S | -- | -- | 라운드 3: 1 (1.23%) |
없음 | V708I+S721L | 라운드 3: 1 (1.61%) | -- | -- |
없음 | V708I+L735V | -- | -- | 라운드 3: 1 (1.23%) |
또한, 항-AAV 항체에 의한 중화에 대한 증가된 내성 및 심장 근육 세포의 증가된 감염성을 부여하는 캡시드로 확인되었다.(i) AAV6의 아미노산 1-129 및 (ii) AAV5의 아미노산 130-725를 갖고 AAV5 에 대해 하기 아미노산 치환을 갖는 키메라: V229I + A490T + A581T(서열 식별 번호 62의 서열).
(i) AAV2의 아미노산 1-61 및 (ii) AAV6의 아미노산 62-129, 및 (iii) AAV5 의 아미노산 130-725를 갖고 AAV5에 대해 하기 아미노산 치환을 갖는 키메라: V229I + A490T + A581T(서열 식별 번호 63의 서열).
(i) AAV6의 아미노산 1-129 및 (ii) AAV5의 아미노산 130-725를 갖고 AAV5 에 대해 다음의 아미노산 치환을 갖는 키메라: V229I + A490T + A581T + Y585S
(i) AAV6의 아미노산 1-129 및 (ii) AAV5의 아미노산 130-725를 갖고 AAV5에 대해 다음의 아미노산 치환을 갖는 키메라: V229I + A447F + A490T + A581T
본원에 개시된 AAV 변이체 비리온은 유전 공학적 AAV 바이러스 벡터 분야에서 당업자에게 매우 자명한, 이성적이고 합리적인 설계 파라미터, 특징, 변형, 이점 및 변이를 포함할 수 있다.
실시예 2
심장 근육 세포에 대한 신규한 AAV 변이체 LANKIQRTDA + V708I(서열 식별 번호 43), LANKTTNKDA + V708I(서열 식별 번호 48) 및 LATNKIGVTA + V708I (서열 식별 번호 46)을 포함하는 재조합 AAV 비리온의 세포 주성을 인간 배아 줄기세포(ESC)로부터 생성된 심장 근육 세포를 사용하여 시험관 내에서 평가하였다.
AAV1 캡시드, AAV2 캡시드, AAV9 캡시드, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 또는 신규한 변이체 캡시드LATNKIGVTA + V708I의 어느 하나 및 CAG 프로모터(AAV1.CAG.EGFP, AAV2.CAG.EGFP, AAV9.CAG.EGFP, LANKIQRTDA + V708I.CAG.EGFP, LANKTTNKDA + V708I.CAG.EGFP 및 LATNKIGVTA + V708I.CAG.GFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 심장 근육 세포는 작은 분자를 사용하여 Wnt 시그널링의 조절에 의해 인간 배아 줄기 세포주, ESI-017로부터 생성되었다. 심장 중배엽 유도 14일 후, 배양물을 글루코스 박탈에 의해 심장 근육 세포에 대해 추가로 농축시켰다. 분화 약 24일 후에, 대부분의 세포는 심장 근육 세포 마커, 심장 트로포닌 T(cTnT), 및 심실-특이적 마커, MLC-2V를 발현하였다. 생성된 심장 근육 세포를 갭 접합 단백질 콘넥신 43, 막 전위 변동, 칼슘 취급, 및 수축 기능의 발현에 대해 평가하여 생성된 심장 근육 세포가 벡터 특성화 이전에 성숙한 상태에 도달했다는 것을 확인한다.
AAV1, AAV2, AAV9에 대해, LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 LATNKIGVTA + V708I 변이체는 면역 형광(도 6A), 유동 세포 분석법(도 6B) 및 웨스턴 블랏 분석(도 6C-D)에 의해 결정된 바와 같이 감염 6일 후 인간 심장 근육 세포 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 또한, AAV1, AAV2 및 AAV9에 대해, LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 LATNKIGVTA + V708I는 면역 형광(도 6E)에 의해 결정된 바와 같이, 인간 심장 근육 세포 배양물에서 유전자 발현의 보다 빠른 개시를 위해 제공된다. 근육 및 골격 근육 세포 주성을 나타내는 AAV8 및 AAV9에 대해, 투여된 바이러스 게놈당 감염성 단위의 수는 LANKIQRTDA + V708I 및 LANKTTNKDA + V708I(도 10A)에 대해 수배의 더 높은 규모였다. 이 연구는 유전자를 심장 세포에 전달하는데 AAV 캡시드 변이체를 포함하는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)의 우수한 능력을 예시한다.
실시예 3
인간 배아 줄기 세포(ESC)로부터 생성된 심장 근육 세포를 사용하여 시험관내에서 심장 근육 세포에 대한 신규한 AAV 변이체 AAV6/AAV5 키메라를 포함하는 재조합 AAV 비리온의 세포 주성을 평가하였다.
AAV1 캡시드, AAV8 캡시드, AAV9 캡시드, 또는 신규한 변이체 캡시드 AAV6/AA5 키메라의(서열 식별 번호 62의) 어느 하나 및 CAG 프로모터(AAV1.CAG.EGFP, AAV8.CAG.EGFP, AAV9.CAG.EGFP, AAV6/AAV5 키메라.CAG.EGFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 심장 근육 세포는 작은 분자를 사용하여 Wnt 시그널링의 조절에 의해 인간 배아 줄기 세포주, ESI-017로부터 생성되었다. 심장 중배엽 유도 14일 후, 배양물을 글루코스 박탈에 의해 심장 근육 세포에 대해 추가로 농축시켰다. 분화 약 24일 후에, 대부분의 세포는 심장 근육 세포 마커, 심장 트로포닌 T(cTnT), 및 심실-특이적 마커, MLC-2V를 발현하였다. 생성된 심장 근육 세포를 갭 접합 단백질 콘넥신 43, 막 전위 변동, 칼슘 취급, 및 수축 기능의 발현에 대해 평가하여 생성된 심장 근육 세포가 벡터 특성화 이전에 성숙한 상태에 도달했다는 것을 확인한다.
AAV1, AAV8, AAV9에 대해, AAV6/AAV5 키메라는 면역 형광(도 7A), 유동 세포 분석법(도 7B) 및 웨스턴 블랏 분석(도 7C-D)에 의해 결정된 바와 같이 감염 6일 후 인간 심장 근육 세포 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 또한, AAV8에 대해, AAV6/AAV5 키메라는 면역 형광(도 7E)에 의해 결정된 바와 같이, 인간 심장 근육 세포 배양물에서 유전자 발현의 보다 빠른 개시를 위해 제공된다. AAV8 및 AAV9에 대해, 투여된 바이러스 게놈당 감염성 단위의 수는 AAV6/AAV5 키메라(도 10A)에 대해 수배의 더 높은 규모였다. 이 연구는 유전자를 심장 세포에 전달하는데 AAV 캡시드 변이체를 포함하는 서열 식별 번호 62-의 우수한 능력을 예시한다.
실시예 4
1차 인간 근육 모세포로부터 생성된 골격 근육 섬유를 사용하여 시험관 내에서 골격 근육 섬유에 대한 신규한 AAV 변이체 LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 AAV6/AAV5 키메라를 포함하는 재조합 AAV 비리온의 세포 주성을 평가하였다.
AAV8 캡시드, AAV9 캡시드, 신규한 변이체 캡시드 LANKIQRTDA + V708I, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 또는 신규한 변이체 캡시드 AAV6/AAV5 키메라의 어느 하나 및 CAG 프로모터(AAV8.CAG.EGFP, AAV9.CAG.EGFP, LANKIQRTDA + V708I.CAG.EGFP, LANKTTNKDA + V708I.CAG.EGFP 및 AAV6/AAV5 키메라.CAG.GFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 건강한 51세 남성(Cook Myosites)으로부터 얻은 1차 인간 골격 근육 모세포로부터 골격 근육 섬유를 생성하였다. 근육 모세포를 30일 동안 분화시켜 성숙한 다핵 골격 근육 섬유를 형성하였다. 생성된 골격 근육 섬유들을 미오신 중쇄(MHC) 및 디스트로핀의 발현에 대해 평가하여, 생성된 골격 근육 섬유들의 대부분이 벡터 특성화 이전에 성숙한 상태에 도달했다는 것을 확인한다.
AAV8 및 AAV9에 대해, AAV6/AAV5 키메라는 면역 형광(도 8A) 및 유동 세포 분석법(도 8B)에 의해 결정된 바와 같이 감염 7일 후 인간 골격 근육 섬유 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 또한, AAV8 및 AAV9에 대해, LANKIQRTDA + V708I 및 LANKTTNKDA + V708I는 면역 형광(도 8C)에 의해 결정된 바와 같이, 인간 골격 근육 섬유 배양물에서 유전자 발현의 보다 빠른 개시를 위해 제공된다. AAV8 및 AAV9에 대해, 투여된 바이러스 게놈당 감염성 단위의 수는 LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 AAV6/5 ㅋ키메라(도 10B)에 대해 수배의 더 높은 규모였다. 이 연구는 유전자를 골격 근육 섬유에 전달하는데 변이체를 포함하는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 서열 식별 번호 62의 우수한 능력을 예시한다.
실시예 5
섬유 모세포 유래 인간 유도 만능 줄기 세포(FB-iPSC) 또는 인간 배아 줄기 세포(ESC)로부터 생성된 골격 근육 전구 세포를 사용하여 시험관 내에서 신규한 AAV 변이체 LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 골격 근육 전구 세포에 대한 AAV6/AAV5 키메라를 포함하는 재조합 AAV 비리온의 세포 주성을 평가하였다.
AAV9 캡시드, 신규한 변이체 캡시드 LANKIQRTDA + V708I, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 또는 신규한 변이체 캡시드 AAV6/AAV5 키메라의 어느 하나 및 CAG 프로모터(AAV8.CAG.EGFP, AAV9.CAG.EGFP, LANKIQRTDA + V708I.CAG.EGFP, LANKTTNKDA + V708I.CAG.EGFP 및 AAV6/AAV5 키메라.CAG.GFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 골격 근육 전구 세포는 문헌[Shelton et al. Methods, 2016 with minor modifications]에 기재된 분화 전략에 따라 인간 배아 줄기 세포주, ESI-017(ESI-BIO)로부터 생성하였다. 분화 약 40일 후에, 골격 근육 전구체에 대한 계통 제한(lineage restriction)은 벡터 특성화를 위해 배양물을 사용하기 전에 대부분의 세포에서 PAX7 및 MyoD의 발현에 의해 확인되었다.
AAV9에 대해, LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 AAV6/AAV5 키메라는 면역 형광(도 9A) 및 유동 세포 분석법(도 9B)에 의해 결정된 바와 같이 감염 6일 후 인간 골격 근육 전구체 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 이 연구는 유전자를 골격 근육 전구체에 전달하는데 AAV 캡시드 변이체를 포함하는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 서열 식별 번호 62의 우수한 능력을 예시한다.
실시예 6
유도 진화는 인간 심장 및 골격 근육에 대한 유전자 전달의 다른 방법에 비해 상당한 이점을 갖는 투여 경로, 정맥 내(IV) 투여 후 심장 및 골격 근육 세포로의 우수한 유전자 전달을 갖는 신규한 아데노-관련 바이러스(AAV) 변이체를 발견하기 위해 사용되었다(실시예 1). V708I 치환 및 아미노산 587 및 588(LANKIQRTDA + V708I; 서열 식별 번호 43) 사이에 삽입된 펩타이드 LANKIQRTDA(서열 식별 번호 27)를 포함하는 신규한 AAV 변이체를 포함하는 재조합 AAV 비리온을 근육 내 투여한 후 세포 주성을 생쥐의 생체 내에서 근육 세포를 형질 도입하는 AAV 캡시드 변이체를 함유하는 NKIQRTD(서열 식별 번호 13)을 포함하는 rAAV 비리온의 능력의 대표적인 예로서 평가하였다.
신규한 변이체 캡시드 LANKIQRTDA + V708I 및 CAG 프로모터(LANKIQRTDA + V708I.CAG.luciferase)에 작동 가능하게 연결된 루시페라제 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. B6 알비노(C57BL/6) 생쥐를 2 x 1012 vg로 꼬리정맥 정맥 내 주사를 통해 주사하고, 형질 도입을 루시페라제 이미징에 의한 생전에 그리고 조직 루시페라제 활성에 의한 사후에 평가하였다. 14일(좌측) 및 28일(우측) 투여 후 루시페라제의 생전 이미징은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 세포를 형질 도입시킬 수 있다는 것을 입증한다(도 11A). 심장, 횡경막 및 사두근에 56일 투여 후루시페라제 활성은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 심장 및 골격 근육을 형질 도입할 수 있다는 것을 입증한다(도 11B).
이 연구는 몇몇 임상적으로 허용되는 투여 경로 중 하나를 따르는 변이체를 포함하는 NKIQRTD(서열 식별 번호 13)에 의한 유전자 전달을 예시한다. 유사한 효능이 이 펩타이드 삽입 모티프를 포함하는 다른 변이체로 달성될 수 있다. 마찬가지로, 유사한 효능이 동일한 유도 진화 접근법을 사용하여 확인된 본원에 개시된 다른 변이체로 달성될 수 있다.
실시예 7
유도 진화는 인간 심장 및 골격 근육에 대한 유전자 전달의 다른 방법에 비해 상당한 이점을 갖는 투여 경로, 정맥 내(IV) 투여 후 심장 및 골격 근육 세포로의 우수한 유전자 전달을 갖는 신규한 아데노-관련 바이러스(AAV) 변이체를 발견하기 위해 사용되었다(실시예 1). V708I 치환 및 아미노산 587 및 588(LANKIQRTDA + V708I; 서열 식별 번호 43) 사이에 삽입된 펩타이드 LANKIQRTDA(서열 식별 번호 27)를 포함하는 신규한 AAV 변이체를 포함하는 재조합 AAV 비리온을 근육 내 투여한 후 세포 주성을 비-인간 영장류(NHP)의 생체 내에서 근육 세포를 형질 도입하는 AAV 캡시드 변이체를 함유하는 NKIQRTD(서열 식별 번호 13)을 포함하는 rAAV 비리온의 능력의 대표적인 예로서 평가하였다. 신규한 변이체 캡시드 LANKIQRTDA + V708I 및 CAG 프로모터(LANKIQRTDA + V708I.CAG.GFP)에 작동 가능하게 연결된 녹색 형광 단백질(GFP)을 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 시노몰구스 마카크를 1 x 1O11 vg의 외측광근 내의 부위에 3회 투여량의 벡터로 근육 내를 통해 주사하고, 골격 근육 세포의 형질 도입을 면역형광 이미징에 의해 사후에 평가하였다. 2x, 4x 및 20x 배율에서 근위 생검 부위의 단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격근 세포를 형질 도입할 수 있다는 것을 입증한다(도 12A). 2x, 4x 및 20x 배율에서 말단 생검 부위의 종단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있다는 것을 입증한다(도 12B). 이 연구는 몇몇 임상적으로 허용되는 투여 경로 중 하나를 따르는 변이체를 포함하는 NKIQRTD(서열 식별 번호 13)에 의한 유전자 전달을 예시한다. 유사한 효능이 이 펩타이드 삽입 모티프를 포함하는 다른 변이체로 달성될 수 있다. 마찬가지로, 유사한 효능이 동일한 유도 진화 접근법을 사용하여 확인된 본원에 개시된 다른 변이체로 달성될 수 있다.
전술한 내용은 단지 본 발명의 원리를 예시한다. 당업자는 본 명세서에 명시적으로 기술되거나 도시되지 않았지만, 본 발명의 원리를 구현하고 본 발명의 사상 및 범위 내에 포함되는 다양한 배치를 고안할 수 있다는 것을 이해할 것이다. 또한, 본 명세서에 인용된 모든 실시예 및 조건 언어는 원칙적으로 본 발명의 원리 및 본 발명자에 의해 제공된 개념을 이해하는데 있어서 독자에게 도움을 주도록 의도되며, 이러한 구체적으로 인용된 실시예 및 조건에 제한되지 않는 것으로 해석되어야 한다.
또한, 본 발명의 원리, 양태 및 실시 양태뿐만 아니라 그의 구체적인 실시예를 언급하는 모든 설명은 이의 구조적 및 기능적 등가물을 포함하는 것으로 의도된다. 또한, 이러한 등가물은 현재 공지된 등가물 및 미래에 개발되는 등가물, 즉 구조에 관계없이 동일한 기능을 수행하는 개발된 임의의 요소 모두를 포함하는 것으로 의도된다. 따라서, 본 발명의 범위는 본 명세서에 도시되고 설명된 예시적인 실시예들로 제한되도록 의도되지 않는다. 오히려, 본 발명의 범위 및 사상은 첨부된 청구범위에 의해 구현된다.
SEQUENCE LISTING
<110> 4D Molecular Therapeutics Inc.
<120> Adeno-Associated Virus Variant Capsids and Methods of Use Thereof
<130> 090400-5009 WO
<150> US 62/560,901
<151> 2017-09-20
<160> 69
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> Adeno-associated virus 1
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 2
<211> 735
<212> PRT
<213> adeno-associated virus 2
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> Adeno-associated virus 3A
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly
130 135 140
Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> Adeno-associated virus 3B
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 734
<212> PRT
<213> Adeno-associated virus 4
<400> 5
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser
180 185 190
Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly
195 200 205
Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu
245 250 255
Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn
370 375 380
Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser
405 410 415
Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile
420 425 430
Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu
435 440 445
Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn
450 455 460
Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln
465 470 475 480
Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr
485 490 495
Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly
500 505 510
Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro
515 520 525
Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys
530 535 540
Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser
545 550 555 560
Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly
565 570 575
Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp
580 585 590
Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg
595 600 605
Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu
675 680 685
Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly
690 695 700
Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr
705 710 715 720
Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu
725 730
<210> 6
<211> 724
<212> PRT
<213> Adeno-associated virus 5
<400> 6
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 7
<211> 736
<212> PRT
<213> Adeno-associated virus 6
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 8
<211> 737
<212> PRT
<213> Adeno-associated virus 7
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala
435 440 445
Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln
450 455 460
Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu
545 550 555 560
Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala
580 585 590
Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 9
<211> 738
<212> PRT
<213> Adeno-associated virus 8
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 10
<211> 736
<212> PRT
<213> Adeno-associated virus 9
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 738
<212> PRT
<213> Adeno-associated virus 10
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Glu Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Ala Asn Thr Gly
580 585 590
Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 12
<211> 738
<212> PRT
<213> Adeno-associated virus rh10
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Gly Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Ser Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asp Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala
580 585 590
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 13
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 13
Asn Lys Ile Gln Arg Thr Asp
1 5
<210> 14
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 14
Asn Lys Thr Thr Asn Lys Asp
1 5
<210> 15
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 15
Thr Asn Lys Ile Gly Val Thr
1 5
<210> 16
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 16
Gly Asn Leu Thr Lys Gly Asn
1 5
<210> 17
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 17
Asn Thr Val Lys Leu Ser Thr
1 5
<210> 18
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 18
Ser Asn Thr Val Lys Ala Ile
1 5
<210> 19
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 19
Ala Ser Asn Ile Thr Lys Ala
1 5
<210> 20
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 20
Asp Asn Thr Val Thr Arg Ser
1 5
<210> 21
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 21
Asn Lys Ile Ser Ala Lys Asp
1 5
<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 22
Asn Gln Asp Tyr Thr Lys Thr
1 5
<210> 23
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 23
Gln Ala Asp Thr Thr Lys Asn
1 5
<210> 24
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 24
Thr Asn Arg Thr Ser Pro Asp
1 5
<210> 25
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 25
Ser Asn Thr Thr Gln Lys Thr
1 5
<210> 26
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 26
Ala Ser Asp Ser Thr Lys Ala
1 5
<210> 27
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 27
Leu Ala Asn Lys Ile Gln Arg Thr Asp Ala
1 5 10
<210> 28
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 28
Leu Ala Asn Lys Thr Thr Asn Lys Asp Ala
1 5 10
<210> 29
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 29
Leu Ala Thr Asn Lys Ile Gly Val Thr Ala
1 5 10
<210> 30
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 30
Leu Ala Gly Asn Leu Thr Lys Gly Asn Ala
1 5 10
<210> 31
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 31
Leu Ala Asn Thr Val Lys Leu Ser Thr Ala
1 5 10
<210> 32
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 32
Leu Ala Ser Asn Thr Val Lys Ala Ile Ala
1 5 10
<210> 33
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 33
Leu Ala Ala Ser Asn Ile Thr Lys Ala Ala
1 5 10
<210> 34
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 34
Leu Ala Asp Asn Thr Val Thr Arg Ser Ala
1 5 10
<210> 35
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 35
Leu Ala Asn Lys Ile Ser Ala Lys Asp Ala
1 5 10
<210> 36
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 36
Leu Ala Asn Gln Asp Tyr Thr Lys Thr Ala
1 5 10
<210> 37
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 37
Leu Ala Thr Asn Lys Ile Gly Val Thr Ser
1 5 10
<210> 38
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 38
Leu Ala Thr Asn Lys Ile Gly Val Thr Ala
1 5 10
<210> 39
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 39
Leu Ala Gln Ala Asp Thr Thr Lys Asn Ala
1 5 10
<210> 40
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 40
Leu Ala Thr Asn Arg Thr Ser Pro Asp Ala
1 5 10
<210> 41
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 41
Leu Ala Ser Asn Thr Thr Gln Lys Thr Ala
1 5 10
<210> 42
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> heterologous peptide insertion
<400> 42
Leu Ala Ala Ser Asp Ser Thr Lys Ala Ala
1 5 10
<210> 43
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 43
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile
580 585 590
Gln Arg Thr Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 44
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 44
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile
580 585 590
Gln Arg Thr Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Gln
740 745
<210> 45
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 45
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile
580 585 590
Gln Arg Thr Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 46
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 46
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Thr Asn Lys
580 585 590
Ile Gly Val Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 47
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 47
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Thr Asn Lys
580 585 590
Ile Gly Val Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 48
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Thr
580 585 590
Thr Asn Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 49
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 49
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Thr
580 585 590
Thr Asn Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Gln
740 745
<210> 50
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 50
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Thr
580 585 590
Thr Asn Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 51
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 51
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Gly Asn Leu
580 585 590
Thr Lys Gly Asn Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 52
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 52
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Thr Val
580 585 590
Lys Leu Ser Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 53
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 53
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ser Asn Thr
580 585 590
Val Lys Ala Ile Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 54
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 54
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ala Ser Asn
580 585 590
Ile Thr Lys Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 55
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 55
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asp Asn Thr
580 585 590
Val Thr Arg Ser Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 56
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 56
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile
580 585 590
Ser Ala Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 57
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 57
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Gln Asp
580 585 590
Tyr Thr Lys Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 58
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 58
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Gln Ala Asp
580 585 590
Thr Thr Lys Asn Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 59
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 59
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Thr Asn Arg
580 585 590
Thr Ser Pro Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 60
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 60
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ser Asn Thr
580 585 590
Thr Gln Lys Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 61
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<223> variant AAV capsid
<400> 61
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ala Ser Asp
580 585 590
Ser Thr Lys Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 62
<211> 725
<212> PRT
<213> Artificial Sequence
<220>
<223> Variant AAV capsid chimera
<400> 62
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg
130 135 140
Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp
145 150 155 160
Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser
165 170 175
Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp
180 185 190
Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly
195 200 205
Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr
210 215 220
Trp Met Gly Asp Arg Ile Val Thr Lys Ser Thr Arg Thr Trp Val Leu
225 230 235 240
Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val
245 250 255
Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg
290 295 300
Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr
325 330 335
Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly
340 345 350
Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly
355 360 365
Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser
370 375 380
Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser
405 410 415
Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val
420 425 430
Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val
435 440 445
Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn
450 455 460
Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser
465 470 475 480
Gly Val Asn Arg Ala Ser Val Ser Ala Phe Thr Thr Thr Asn Arg Met
485 490 495
Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met
500 505 510
Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met
515 520 525
Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu
530 535 540
Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn
545 550 555 560
Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser
565 570 575
Ser Thr Thr Ala Pro Thr Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val
580 585 590
Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile
595 600 605
Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala
610 615 620
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys
625 630 635 640
Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val
645 650 655
Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met
660 665 670
Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
675 680 685
Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro
690 695 700
Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr
705 710 715 720
Leu Thr Arg Pro Leu
725
<210> 63
<211> 725
<212> PRT
<213> Artificial Sequence
<220>
<223> Variant AAV capsid chimera
<400> 63
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg
130 135 140
Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp
145 150 155 160
Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser
165 170 175
Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp
180 185 190
Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly
195 200 205
Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr
210 215 220
Trp Met Gly Asp Arg Ile Val Thr Lys Ser Thr Arg Thr Trp Val Leu
225 230 235 240
Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val
245 250 255
Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg
290 295 300
Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr
325 330 335
Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly
340 345 350
Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly
355 360 365
Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser
370 375 380
Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser
405 410 415
Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val
420 425 430
Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val
435 440 445
Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn
450 455 460
Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser
465 470 475 480
Gly Val Asn Arg Ala Ser Val Ser Ala Phe Thr Thr Thr Asn Arg Met
485 490 495
Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met
500 505 510
Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met
515 520 525
Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu
530 535 540
Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn
545 550 555 560
Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser
565 570 575
Ser Thr Thr Ala Pro Thr Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val
580 585 590
Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile
595 600 605
Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala
610 615 620
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys
625 630 635 640
Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val
645 650 655
Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met
660 665 670
Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
675 680 685
Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro
690 695 700
Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr
705 710 715 720
Leu Thr Arg Pro Leu
725
<210> 64
<211> 3685
<212> PRT
<213> Homo sapiens
<400> 64
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Gly Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Gln Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala
3410 3415 3420
Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu
3425 3430 3435
His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser
3440 3445 3450
Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
3455 3460 3465
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser
3470 3475 3480
Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu
3485 3490 3495
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
3500 3505 3510
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys
3515 3520 3525
Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro
3530 3535 3540
Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu
3545 3550 3555
Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu
3560 3565 3570
Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser
3575 3580 3585
Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu
3590 3595 3600
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu
3605 3610 3615
Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly
3620 3625 3630
Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
3635 3640 3645
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu
3650 3655 3660
Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys
3665 3670 3675
Pro Met Arg Glu Asp Thr Met
3680 3685
<210> 65
<211> 19841
<212> DNA
<213> Homo sapiens
<400> 65
tttcctactt gaagcctgac gtagtaaaga tcgggggagg gttagacaga tacagtggtc 60
cccaaccatt ttggcaccag ggactggtct tatggaagac agtttttcca cagactgttg 120
gggggatggt tttgggatga aaccgttctg cctctgatca tcaggtgtta gattctaata 180
aggagcgcac acctagatcc ctcgcatgca tagttcatgg tggggttcgc actcttacga 240
ggattgaatg gtgcgctgct ccggtaggag gctgggctca ggctgtaatg cctgctcgcc 300
caccactcac ctcctgctgc atggcctggt tcctaacagg ccacggacca ctactgttcc 360
atggcccgga ggttgaggac cccgagatac aggacaattc tgtggcaagc aggactgtcc 420
cctcgccaaa gatgggacat cgaggctcct tggagcaccc tgtggccacc ttgcagcagc 480
ctctgtttcc ccatgtttcc atgacctggt gtccatctgt cttccccagt ttgggagctt 540
ctctccgagg aggacctggg cctggtgtgg cacctgctgt gtgagcgggg ccatgtccaa 600
cggccttctt ggggactttg ggtcggggag aagttctgcc tgggttttac tgccttctcc 660
caaccccaca ctgtctcccc tggcagcggt tgatcgacaa gaccaaggtg acatatctga 720
agtggctgcc tgagtcggag agcctgttcc tggcatcaca cgccagtggc cacctgtacc 780
tgtacaacgt cagccacccc tgcgcctcgg ccccgcccca gtacagcctg ctgaagcagg 840
gcgagggctt ctctgtctat gctgccaaga gcaaggcacc ccgcaacccg ctggccaagt 900
gggcggtggg tgaggggccc ctcaacgagt tcgccttctc gcccgatggc cggcacctgg 960
cctgtgtgag ccaggatggc tgcctgcgcg tcttccactt cgactccatg ctcctgcgtg 1020
ggctcatgaa gagctacttt gggggcctgc tgtgtgtgtg ctggagccct gacggccgct 1080
acgtggtgac gggtggcgaa gatgacctgg tcaccgtgtg gtccttcacc gagggccgcg 1140
tggtggctcg aggccatggc cacaagtcct gggtcaacgc tgtggccttt gacccctaca 1200
ccacaagggc agaggaggcg gcgacagcag ccggtgctga tggggagcgg agcggcgaag 1260
aggaggagga ggagcccgag gctgcgggca caggctcggc cgggggcgcc ccgctctctc 1320
cactgcccaa ggctggctcc attacttacc gctttggctc ggcgggccag gacacgcagt 1380
tctgcctgtg ggacctcact gaagacgtgc tctacccgca cccccccctg gcccgcaccc 1440
gcaccctccc tggcacacct ggcaccacgc caccggccgc cagcagctcg aggggtggcg 1500
agcctggccc aggccccctg cctcgctcgc tgtcccgctc caacagtctc ccgcacccag 1560
ctggcggggg caaggcgggc ggcccgggtg tggcggcaga gcctggcaca ccattcagca 1620
ttggccgctt cgccacgctc acactgcagg agcggcggga ccggggggca gagaaggagc 1680
acaagcgcta ccacagcctg ggcaacatca gccggggtgg cagtggcggc agtggcagtg 1740
gtggggagaa gcccagcggc cctgttcccc gcagccgcct ggaccccgcc aaggtgctgg 1800
gcactgcgct gtgcccgcgc atccacgagg tgcccctgct ggagcccctt gtgtgcaaga 1860
agatcgccca ggagcggctc acagtcctcc tgttcctgga ggactgcatc atcactgcct 1920
gccaggaggg cctcatctgc acctgggccc ggccgggcaa ggcggtgagt ggccccacac 1980
cagcctgccg gggacctggc aggacctttc gtgggaagag gcaggcattg gcagagagag 2040
ggctttgttg ctgtcacagc ctctggctcc gtggggtgag gggaagccag ggaaatctta 2100
gtgtctcagt acaagacctc tcagatcctt agagtgaggg ggtctagccc taggcagcag 2160
gcagcagaaa gaggggtggg tgtgagagcc agctaggaat tggggcatcc aaggctggcc 2220
gtctgaaggg cagcagatgg gccccacatg gccaggtctt actgcctgtc actcgaacca 2280
gaatctattt ctgttgaaca tctgtttttt aaatcgtgaa acttttttga gtacttcagg 2340
ccaaaactag gggcgagctc aagcctgtgg gcatggctgc cagcctgggt ctgggactca 2400
ggatctgagc ctcctgctga aggcacaggc tgggaatccc aggcctgggt tccagtccca 2460
ctccctctgt gaccctggac aagtcactgc cccctctgac ctccaactca tcacctctta 2520
gaacagagcc tgtaggatgg gcagtgggtg gatgtgcttg cctcctgggt gggctgtggc 2580
gttgggaagg tcatagtagg cgaatcaggc ctggcatctt gtaagttcgg agctcgtctt 2640
gggtgtctca gcttcttagg gcttggactc agttgcccag ggtcctggag gccgtggctt 2700
ggttcctcag atcctcagtt ttggaatcgt agagtcctga gtccctagaa cttgagagca 2760
cagtctgagt gactcagagg caagagtggt gggatttggg gagtctggtt gagtcctaaa 2820
agagacccct ctgtctccgt agttcacaga cgaggagacc gaggcccaga caggggaagg 2880
aagttggccc aggtcaccca gcaagtcagt ggtagaggta ggactgtccc tgagttcttt 2940
ccccagcacc tcagggtccc tcccaagtta gaagggagct ccagtttccc cctcccctcc 3000
cacccttacc cttaccccat ggtctcactc aggatccgcc aaggactttg attattgcgt 3060
gaaagtgctg actgccagga caggaagcta gctaagatgc aagttcccag cctagagcag 3120
tggcctctgg ggggtctagg gcggacccaa gggcaaggcc agggtggcag cagctttggg 3180
gactctgggc tggctccctc cccttgacac tggctgaagc ccaggtggtc tctaacccct 3240
cccatctctc cctctcatct tccccagggc atctcctccc aaccaggcaa ctccccgagt 3300
ggcacagtgg tgtgaagcca tggatatcgg gcccccccaa ccccatgccc ccagcctcct 3360
agccataacc ctccctgctg acctcacaga tcaacgtatt aacaagacta accatgatgg 3420
atggactgct ccagtccccc cacctgcaca aaatttgggg gccccccaga ctggcccgga 3480
cacgggcgat gtaatagccc ttgtggcctc agccttgtcc cccacccact gccaagtaca 3540
atgacctctt cctctgaaac atcagtgtta ccctcatccc tgtccccagc atgtgactgg 3600
tcactcctgg ggagagactc cccgcccctg ccacaagagc cccaggtctg cagtgtgccc 3660
ctcagttgag tgggcagggc cgggggtggt ccagccctcg cccggccccc accccagctg 3720
cccttgctat tgtctgtgct tttgaagagt gttaaattat ggaagcccct caggttcctc 3780
cctgtcccgc aggacctctt atttatacta aagttccctg ttttctcagc gggtctgtcc 3840
ccttcggagg agatgatgta gaggacctgt gtgtgtactc tgtggttcta ggcagtccgc 3900
tttccccaga ggaggagtgc aggcctgctc ccagcccagc gcctcccacc ccttttcata 3960
gcaggaaaag ccggagccca gggagggaac ggacctgcga gtcacacaac tggtgaccca 4020
caccagcggc tggagcagga ccctcttggg gagaagagca tcctgcccgc agccagggcc 4080
cctcatcaaa gtcctcggtg ttttttaaat tatcagaact gcccaggacc acgtttccca 4140
ggccctgccc agctgggact cctcggtcct tgcctcctag tttctcaggc ctggccctct 4200
caaggcccag gcaccccagg ccggttggag gccccgactt ccactctgga gaaccgtcca 4260
ccctggaaag aagagctcag attcctcttg gctctcggag ccgcagggag tgtgtcttcc 4320
cgcgccaccc tccacccccc gaaatgtttc tgtttctaat cccagcctgg gcaggaatgt 4380
ggctccccgg ccaggggcca aggagctatt ttggggtctc gtttgcccag ggagggcttg 4440
gctccaccac tttcctcccc cagcctttgg gcagcaggtc acccctgttc aggctctgag 4500
ggtgccccct cctggtcctg tcctcaccac cccttcccca cctcctggga aaaaaaaaaa 4560
aaaaaaaaaa aaaagctggt ataaagcaga gagcctgagg gctaaattta actgtccgag 4620
tcggaatcca tctctgagtc acccaagaag ctgccctggc ctcccgtccc cttcccaggc 4680
ctcaacccct ttctcccacc cagccccaac ccccagccct caccccctag cccccagttc 4740
tggagcttgt cgggagcaag ggggtggttg ctactgggtc actcagcctc aattggccct 4800
gtttcagcaa tgggcaggtt cttcttgaaa ttcatcacac ctgtggcttc ctctgtgctc 4860
taccttttta ttggggtgac agtgtgacag ctgagattct ccatgcattc cccctactct 4920
agcactgaag ggttctgaag ggccctggaa ggagggagct tggggggctg gcttgtgagg 4980
ggttaaggct gggaggcggg aggggggctg gaccaagggg tggggagaag gggaggaggc 5040
ctcggccggc cgcagagaga agtggccaga gaggcccagg ggacagccag ggacaggcag 5100
acatgcagcc agggctccag ggcctggaca ggggctgcca ggccctgtga caggaggacc 5160
ccgagccccc ggcccgggga ggggccatgg tgctgcctgt ccaacatgtc agccgaggtg 5220
cggctgaggc ggctccagca gctggtgttg gacccgggct tcctggggct ggagcccctg 5280
ctcgaccttc tcctgggcgt ccaccaggag ctgggcgcct ccgaactggc ccaggacaag 5340
tacgtggccg acttcttgca gtggggtgag tgcctaccct cggggctcct gcagatgggg 5400
tgggggtggg gcaggagaca ggtctgggca cagaggcctg gctgttgggg gggcaggatg 5460
gcaggatggg catggggaga tcctcccatc ctggggctca gagtgtggac ctgggccctg 5520
gggcaacatt tctctgtcct atgccaccac tctggagggg cagagtaagg tcagcagagg 5580
ctagggtggc tgtgactcag agccatggct taggagtcac agcaggctag gctgccaaca 5640
gcctcccatg gcctctctgc accccgcctc agggtcaggg tcagggtcat gctgggagct 5700
ccctctccta ggaccctccc cccaaaagtg ggctctatgg ccctctcccc tggtttcctg 5760
tggcctgggg caagccagga gggccagcat ggggcagctg ccaggggcgc agccgacagg 5820
caggtgttcg gcgccagcct ctccagctgc cccaacaggt gcccaggcac tgggagggcg 5880
gtgactcacg cgggccctgt gggagaacca gctttgcaga caggcgccac cagtgccccc 5940
tcctctgcga tccaggaggg acaactttgg gttcttctgg gtgtgtctcc ttcttttgta 6000
ggttctgcac ccacccccac ccccagcccc aaagtctcgg ttcctatgag ccgtgtgggt 6060
cagccaccat tcccgccacc ccgggtccct gcgtccttta gttctcctgg cccagggcct 6120
ccaaccttcc agctgtccca caaaacccct tcttgcaagg gctttccagg gcctggggcc 6180
agggctggaa ggaggatgct tccgcttctg ccagctgcct tgtctgccca cctcctcccc 6240
aagcccagga ctcgggctca ctggtcactg gtttctttca ttcccagcac cctgcccctc 6300
tggccctcat atgtctggcc ctcagtgact ggtgtttggt ttttggcctg tgtgtaacaa 6360
actgtgtgtg acacttgttt cctgtttctc cgccttcccc tgcttcctct tgtgtccatc 6420
tctttctgac ccaggcctgg ttcctttccc tcctcctccc atttcacaga tgggaaggtg 6480
gaggccaaga agggccaggc cattcagcct ctggaaaaac cttctcccaa cctcccacag 6540
cccctaatga ctctcctggc ctccctttag tagaggatga agttgggttg gcagggtaaa 6600
ctgagaccgg gtggggtagg ggtctggcgc tcccgggagg agcactcctt ttgtggcccg 6660
agctgcatct cgcggcccct cccctgccag gcctggggcg ggggaggggg ccagggttcc 6720
tgctgcctta aaagggctca atgtcttggc tctctcctcc ctcccccgtc ctcagccctg 6780
gctggttcgt ccctgctggc ccactctccc ggaacccccc ggaacccctc tctttcctcc 6840
agaacccact gtctcctctc cttccctccc ctcccatacc catccctctc tccatcctgc 6900
ctccacttct tccacccccg ggagtccagg cctccctgtc cccacagtcc ctgagccaca 6960
agcctccacc ccagctggtc ccccacccag gctgcccagt ttaacattcc tagtcatagg 7020
accttgactt ctgagaggcc tgattgtcat ctgtaaataa ggggtaggac taaagcactc 7080
ctcctggagg actgagagat gggctggacc ggagcacttg agtctgggat atgtgaccat 7140
gctacctttg tctccctgtc ctgttccttc ccccagcccc aaatccaggg ttttccaaag 7200
tgtggttcaa gaaccacctg catctgaatc tagaggtact ggatacaacc ccacgtctgg 7260
gccgttaccc aggacattct acatgagaac gtgggggtgg ggccctggct gcacctgaac 7320
tgtcacctgg agtcagggtg gaaggtggaa gaactgggtc ttatttcctt ctccccttgt 7380
tctttagggt ctgtccttct gcagactccg ttaccccacc ctaaccatcc tgcacaccct 7440
tggagccctc tgggccaatg ccctgtcccg caaagggctt ctcaggcatc tcacctctat 7500
gggagggcat ttttggcccc cagaacctta cacggtgttt atgtggggaa gcccctggga 7560
agcagacagt cctagggtga agctgagagg cagagagaag gggagacaga cagagggtgg 7620
ggctttcccc cttgtctcca gtgccctttc tggtgaccct cggttctttt cccccaccac 7680
ccccccagcg gagcccatcg tggtgaggct taaggaggtc cgactgcaga gggacgactt 7740
cgagattctg aaggtgatcg gacgcggggc gttcagcgag gtaagccgaa ccgggcggga 7800
gcctgacttg actcgtggtg ggcggggcat aggggttggg gcggggcctt agaaattgat 7860
gaatgaccga gccttagaac ctagggctgg gctggaggcg gggcttggga ccaatgggcg 7920
tggtgtggca ggtggggcgg ggccacggct gggtgcagaa gcgggtggag ttgggtctgg 7980
gcgagccctt ttgttttccc gccgtctcca ctctgtctca ctatctcgac ctcaggtagc 8040
ggtagtgaag atgaagcaga cgggccaggt gtatgccatg aagatcatga acaagtggga 8100
catgctgaag aggggcgagg tgaggggctg ggcggacgtg gggggctttg aggatccgcg 8160
ccccgtctcc ggctgcagct cctccgggtg ccctgcaggt gtcgtgcttc cgtgaggaga 8220
gggacgtgtt ggtgaatggg gaccggcggt ggatcacgca gctgcacttc gccttccagg 8280
atgagaacta cctggtgagc tccgggccgg ggtgactagg aagagggaca agagcccgtg 8340
ctgtcactgg acgaggaggt ggggagagga agctctagga ttgggggtgc tgcccggaaa 8400
cgtctgtggg aaagtctgtg tgcggtaaga gggtgtgtca ggtggatgag gggccttccc 8460
tatctgagac ggggatggtg tccttcactg cccgtttctg gggtgatctg ggggactctt 8520
ataaagatgt ctctgttgcg gggggtctct tacctggaat gggataggtc ttcaggaatt 8580
ctaacggggc cactgcctag ggaaggagtg tctgggacct attctctggg tgttgggtgg 8640
cctctgggtt ctctttccca gaacatctca gggggagtga atctgcccag tgacatccca 8700
ggaaagtttt tttgtttgtg tttttttttg aggggcgggg gcgggggccg caggtggtct 8760
ctgatttggc ccggcagatc tctatggtta tctctgggct ggggctgcag gtctctgccc 8820
aaggatgggg tgtctctggg aggggttgtc ccagccatcc gtgatggatc agggcctcag 8880
gggactacca accacccatg acgaacccct tctcagtacc tggtcatgga gtattacgtg 8940
ggcggggacc tgctgacact gctgagcaag tttggggagc ggattccggc cgagatggcg 9000
cgcttctacc tggcggagat tgtcatggcc atagactcgg tgcaccggct tggctacgtg 9060
cacaggtggg tgcagcatgg ccgaggggat agcaagcttg ttccctggcc gggttcttgg 9120
aaggtcagag cccagagagg ccagggcctg gagagggacc ttcttggttg gggcccaccg 9180
gggggtgcct gggagtaggg gtcagaactg tagaagccct acaggggcgg aacccgagga 9240
agtggggtcc caggtggcac tgcccggagg ggcggagcct ggtgggacca cagaagggag 9300
gttcatttat cccacccttc tcttttcctc cgtgcaggga catcaaaccc gacaacatcc 9360
tgctggaccg ctgtggccac atccgcctgg ccgacttcgg ctcttgcctc aagctgcggg 9420
cagatggaac ggtgagccag tgccctggcc acagagcaac tggggctgct gatgagggat 9480
ggaaggcaca gagtgtggga gcgggactgg atttggaggg gaaaagaggt ggtgtgaccc 9540
aggcttaagt gtgcatctgt gtggcggagt attagaccag gcagagggag gggctaagca 9600
tttggggagt ggttggaagg agggcccaga gctggtgggc ccagaggggt gggcccaagc 9660
ctcgctctgc tccttttggt ccaggtgcgg tcgctggtgg ctgtgggcac cccagactac 9720
ctgtcccccg agatcctgca ggctgtgggc ggtgggcctg ggacaggcag ctacgggccc 9780
gagtgtgact ggtgggcgct gggtgtattc gcctatgaaa tgttctatgg gcagacgccc 9840
ttctacgcgg attccacggc ggagacctat ggcaagatcg tccactacaa ggtgagcacg 9900
gccgcaggga gacctggcct ctcccggtag gcgctcccag gctatcgcct cctctccctc 9960
tgagcaggag cacctctctc tgccgctggt ggacgaaggg gtccctgagg aggctcgaga 10020
cttcattcag cggttgctgt gtcccccgga gacacggctg ggccggggtg gagcaggcga 10080
cttccggaca catcccttct tctttggcct cgactgggat ggtctccggg acagcgtgcc 10140
cccctttaca ccggatttcg aaggtgccac cgacacatgc aacttcgact tggtggagga 10200
cgggctcact gccatggtga gcgggggcgg ggtaggtacc tgtggcccct gctcggctgc 10260
gggaacctcc ccatgctccc tccataaagt tggagtaagg acagtgccta ccttctgggg 10320
tcctgaatca ctcattcccc agagcacctg ctctgtgccc atctactact gaggacccag 10380
cagtgaccta gacttacagt ccagtggggg aacacagagc agtcttcaga cagtaaggcc 10440
ccagagtgat cagggctgag acaatggagt gcagggggtg ggggactcct gactcagcaa 10500
ggaaggtcct ggagggcttt ctggagtggg gagctatctg agctgagact tggagggatg 10560
agaagcagga gaggactcct cctcccttag gccgtctctc ttcaccgtgt aacaagctgt 10620
catggcatgc ttgctcggct ctgggtgccc ttttgctgaa caatactggg gatccagcac 10680
ggaccagatg agctctggtc cctgccctca tccagttgca gtctagagaa ttagagaatt 10740
atggagagtg tggcaggtgc cctgaaggga agcaacagga tacaagaaaa aatgatgggg 10800
ccaggcacgg tggctcacgc ctgtaacccc agcaatttgg caggccgaag tgggtggatt 10860
gcttgagccc aggagttcga gaccagcctg ggcaatgtgg tgagaccccc gtctctacaa 10920
aaatgtttta aaaattggtt gggcgtggtg gcgcatgcct gtatactcag ctactagggt 10980
ggccgacgtg ggcttgagcc caggaggtca aggctgcagt gagctgtgat tgtgccactg 11040
cactccagcc tgggcaacgg agagagactc tgtctcaaaa ataagataaa ctgaaattaa 11100
aaaataggct gggctggccg ggcgtggtgg ctcacgcctg taatctcagc actttgggag 11160
gccgaggcgg gtggatcacg aggtcaggag atcgagacca tcttggctaa cacggtgaaa 11220
ccccatctct cctaaaaata caaaaaatta gccaggcgtg gtggcgggcg cctgtagtcc 11280
cagctactca ggaggctgag gcaggagaat ggcgtgaacc cgggaggcag agtttgcagt 11340
gagccgagat cgtgccactg cactccagcc tgggcgacag agcgagactc tgtctcagaa 11400
aaaaaaaaaa aaaaaaaaaa aaataggctg gaccgcggcc gggcgctgtg gctcatgcct 11460
gtaatcccag cactttggga gtccaaggcc ggtgggtcat gagatcagga gttttgagac 11520
taggctggcc aacacggtga aaccccgtct ctactaaaaa tacaagaaaa ttagctgggt 11580
gtggtctcgg gtgcctgtaa ttccagttac tggggaagct gaggcaggag aattgcttga 11640
acctgggagg cagagtttgc agtgagccaa gatcatgcca ctacactcca gtctgggtga 11700
cagagtgaga ctctgtctca aaaaaaaaaa aaaaaaaaag ggttgggcaa ggtggttcac 11760
gcctgtaatc ccagaacttt gggaggctga ggcaggcaga tcactggaag tcaggagttc 11820
aagaccagcc tggccaacat ggtgaaaccc tgtgtctact aaaaatacaa aatttagcca 11880
ggcttggtgg cgtatgcctg taatgccagc tactcaggag gctgaggcag gagaatcgct 11940
tgattgaacc tgggaggcag agtttgcagt gggctggggt tgtgccactg cactctaggc 12000
tgggagacag caagactcca tctaaaaaaa aaaaacagaa ctgggctggg cacagtggct 12060
tatatttgta atcccagcac tttgggaggc tgaggttgga ggactgcttg agcccagagt 12120
ttgggactac aacagctgag gtaggcggat cacttgaggt cagaagatgg agaccagcct 12180
ggccagcgtg gcgaaacccc gtctctacca aaaatataaa aaattagcca ggcgtggtag 12240
agggcgcctg taatctcagc tactcaggac gctgaggcag gagaatcgcc tgaacctggg 12300
aggcggaggt tgcagtgagc tgagattgca ccactgcact ccagcctggg taacagagcg 12360
agactccgta tcaaagaaaa agaaaaaaga aaaaatgctg gaggggccac tttagataag 12420
ccctgagttg gggctggttt ggggggaaca tgtaagccaa gatcaaaaag cagtgagggg 12480
cccgccctga cgactgctgc tcacatctgt gtgtcttgcg caggagacac tgtcggacat 12540
tcgggaaggt gcgccgctag gggtccacct gccttttgtg ggctactcct actcctgcat 12600
ggccctcagg taagcactgc cctggacggc ctccaggggc cacgaggctg cttgagcttc 12660
ctgggtcctg ctccttggca gccaatggag ttgcaggatc agtcttggaa ccttactgtt 12720
ttgggcccaa agactcctaa gaggccagag ttggaggacc ttaaattttc agatctatgt 12780
acttcaaaat gttagattga attttaaaac ctcagagtca cagactgggc ttcccagaat 12840
cttgtaacca ttaactttta cgtctgtagt acacagagcc acaggacttc agaacttgga 12900
aaatatgaag tttagacttt tacaatcagt tgtaaaagaa tgcaaattct ttgaatcagc 12960
catataacaa taaggccatt taaaagtatt aatttaggcg ggccgcggtg gctcacgcct 13020
gtaatcctag cactttggga ggccaaggca ggtggatcat gaggtcagga gatcgagacc 13080
atcctggcta acacggtgaa accccgtctc tactaaaaat acaaaaaaat tagccgggca 13140
tggtggcggg cgcttgcggt cccagctact tgggaggcga ggcaggagaa tggcatgaac 13200
ccgggaggcg gagcttgcag tgagccgaga tcatgccact gcactccagc ctgggcgaca 13260
gagcaagact ccgtctcaaa aaaaaaaaaa aaaaagtatt tatttaggcc gggtgtggtg 13320
gctcacgcct gtaattccag tgctttggga ggatgaggtg ggtggatcac ctgaggtcag 13380
gagttcgaga ccagcctgac caacgtggag aaacctcatc tctactaaaa aacaaaatta 13440
gccaggcgtg gtggcatata cctgtaatcc cagctactca ggaggctgag gcaggagaat 13500
cagaacccag gagggggagg ttgtggtgag ctgagatcgt gccattgcat tccagcctgg 13560
gcaacaagag tgaaacttca tctcaaaaaa aaaaaaaaaa aagtactaat ttacaggctg 13620
ggcatggtgg ctcacgcttg gaatcccagc actttgggag gctgaagtgg acggattgct 13680
tcagcccagg agttcaagac cagcctgagc aacataatga gaccctgtct ctacaaaaaa 13740
ttgaaaaaat cgtgccaggc atggtggtct gtgcctgcag tcctagctac tcaggagtct 13800
gaagtaggag aatcacttga gcctggagtt tgaggcttca gtgagccatg atagattcca 13860
gcctaggcaa caaagtgaga cctggtctca acaaaagtat taattacaca aataatgcat 13920
tgcttatcac aagtaaatta gaaaatacag ataaggaaaa ggaagttgat atctcgtgag 13980
ctcaccagat ggcagtggtc cctggctcac acgtgtactg acacatgttt aaatagtgga 14040
gaacaggtgt ttttttggtt tgtttttttc cccttcctca tgctactttg tctaagagaa 14100
cagttggttt tctagtcagc ttttattact ggacaacatt acacatacta taccttatca 14160
ttaatgaact ccagcttgat tctgaaccgc tgcggggcct gaacggtggg tcaggattga 14220
acccatcctc tattagaacc caggcgcatg tccaggatag ctaggtcctg agccgtgttc 14280
ccacaggagg gactgctggg ttggagggga cagccacttc ataccccagg gaggagctgt 14340
ccccttccca cagctgagtg gggtgtgctg acctcaagtt gccatcttgg ggtcccatgc 14400
ccagtcttag gaccacatct gtggaggtgg ccagagccaa gcagtctccc catcaggtcg 14460
gcctccctgt cctgaggccc tgagaagagg ggtctgcagc ggtcacatgt caagggagga 14520
gatgagctga ccctagaaca tgggggtctg gaccccaagt ccctgcagaa ggtttagaaa 14580
gagcagctcc caggggccca aggccaggag aggggcaggg cttttcctaa gcagaggagg 14640
ggctattggc ctacctggga ctctgttctc ttcgctctgc tgctcccctt cctcaaatca 14700
ggaggtcttg gaagcagctg cccctaccca caggccagaa gttctggttc tccaccagag 14760
aatcagcatt ctgtctccct ccccactccc tcctcctctc cccagggaca gtgaggtccc 14820
aggccccaca cccatggaac tggaggccga gcagctgctt gagccacacg tgcaagcgcc 14880
cagcctggag ccctcggtgt ccccacagga tgaaacagta agttggtgga ggggaggggg 14940
tccgtcaggg acaattggga gagaaaaggt gagggcttcc cgggtggcgt gcactgtaga 15000
gccctctagg gacttcctga acagaagcag acagaaacca cggagagacg aggttacttc 15060
agacatggga cggtctctgt agttacagtg gggcattaag taagggtgtg tgtgttgctg 15120
gggatctgag aagtcgatct ttgagctgag cgctggtgaa ggagaaacaa gccatggaag 15180
gaaaggtgcc aagtggtcag gcgagagcct ccagggcaaa ggccttgggc aggtgggaat 15240
cctgatttgt tcctgaaagg tagtttggct gaatcattcc tgagaaggct ggagaggcca 15300
gcaggaaaca aaacccagca aggccttttg tcgtgagggc attagggagc tggagggatt 15360
ttgagcagca gagggacata ggttgtgtta gtgtttgagc accagccctc tggtccctgt 15420
gtagatttag aggaccagac tcagggatgg ggctgaggga ggtagggaag ggagggggct 15480
tggatcattg caggagctat ggggattcca gaaatgttga ggggacggag gagtagggga 15540
taaacaagga ttcctagcct ggaaccagtg cccaagtcct gagtcttcca ggagccacag 15600
gcagccttaa gcctggtccc catacacagg ctgaagtggc agttccagcg gctgtccctg 15660
cggcagaggc tgaggccgag gtgacgctgc gggagctcca ggaagccctg gaggaggagg 15720
tgctcacccg gcagagcctg agccgggaga tggaggccat ccgcacggac aaccagaact 15780
tcgccaggtc gggatcgggg ccggggccgg ggccgggatg cgggccggtg gcaacccttg 15840
gcatcccctc tcgtccggcc cggacggact caccgtcctt acctccccac agtcaactac 15900
gcgaggcaga ggctcggaac cgggacctag aggcacacgt ccggcagttg caggagcgga 15960
tggagttgct gcaggcagag ggagccacag gtgagtccct catgtgtccc cttccccgga 16020
ggaccgggag gaggtgggcc gtctgctccg cggggcgtgt atagacacct ggaggaggga 16080
agggacccac gctggggcac gccgcgccac cgccctcctt cgcccctcca cgcgccctat 16140
gcctctttct tctccttcca gctgtcacgg gggtccccag tccccgggcc acggatccac 16200
cttcccatgt aagacccctc tctttcccct gcctcagacc tgctgcccat tctgcagatc 16260
ccctccctgg ctcctggtct ccccgtccag atatagggct caccctacgt ctttgcgact 16320
ttagagggca gaagcccttt attcagcccc agatctccct ccgttcaggc ctcaccagat 16380
tccctccggg atctccctag ataacctccc caacctcgat tcccctcgct gtctctcgcc 16440
ccaccgctga gggctgggct gggctccgat cgggtcacct gtcccttctc tctccagcta 16500
gatggccccc cggccgtggc tgtgggccag tgcccgctgg tggggccagg ccccatgcac 16560
cgccgccacc tgctgctccc tgccagggta cgtccggctg cccacgcccc cctccgccgt 16620
cgcgccccgc gctccacccg ccccttgcca cccgcttagc tgcgcatttg cggggctggg 16680
cccacggcag gagggcggat cttcgggcag ccaatcaaca caggccgcta ggaagcagcc 16740
aatgacgagt tcggacggga ttcgaggcgt gcgagtggac taacaacagc tgtaggctgt 16800
tggggcgggg gcggggcgca gggaagagtg cgggcccacc tatgggcgta ggcggggcga 16860
gtcccaggag ccaatcagag gcccatgccg ggtgttgacc tcgccctctc cccgcaggtc 16920
cctaggcctg gcctatcgga ggcgctttcc ctgctcctgt tcgccgttgt tctgtctcgt 16980
gccgccgccc tgggctgcat tgggttggtg gcccacgccg gccaactcac cgcagtctgg 17040
cgccgcccag gagccgcccg cgctccctga accctagaac tgtcttcgac tccggggccc 17100
cgttggaaga ctgagtgccc ggggcacggc acagaagccg cgcccaccgc ctgccagttc 17160
acaaccgctc cgagcgtggg tctccgccca gctccagtcc tgtgatccgg gcccgccccc 17220
tagcggccgg ggagggaggg gccgggtccg cggccggcga acggggctcg aagggtcctt 17280
gtagccggga atgctgctgc tgctgctgct gctgctgctg ctgctgctgc tgctgctgct 17340
gctgctgctg ctggggggat cacagaccat ttctttcttt cggccaggct gaggccctga 17400
cgtggatggg caaactgcag gcctgggaag gcagcaagcc gggccgtccg tgttccatcc 17460
tccacgcacc cccacctatc gttggttcgc aaagtgcaaa gctttcttgt gcatgacgcc 17520
ctgctctggg gagcgtctgg cgcgatctct gcctgcttac tcgggaaatt tgcttttgcc 17580
aaacccgctt tttcggggat cccgcgcccc cctcctcact tgcgctgctc tcggagcccc 17640
agccggctcc gcccgcttcg gcggtttgga tatttattga cctcgtcctc cgactcgctg 17700
acaggctaca ggacccccaa caaccccaat ccacgttttg gatgcactga gaccccgaca 17760
ttcctcggta tttattgtct gtccccacct aggaccccca cccccgaccc tcgcgaataa 17820
aaggccctcc atctgcccaa agctctggac tccacagtgt ccgcggtttg cgttgtgggc 17880
cggaggctcc gcagcgggcc aatccggagg cgtgtggagg cggccgaagg tctgggagga 17940
gctagcggga tgcgaagcgg ccgaatcagg gttgggggag gaaaagccac ggggcggggc 18000
tttggcgtcc ggccaatagg agggcgagcg ggccacccgg aggcaccgcc cccgcccagc 18060
tgtggcccag ctgtgccacc gagcgtcgag aagagggggc tgggctggca gcgcgcgcgg 18120
ccatcctcct tccactgcgc ctgcgcacgc cacgcgcatc cgctcctggg acgcaagctc 18180
gagaaaagtt gctgcaaact ttctagcccg ttccccgccc ctcctcccgg ccagacccgc 18240
cccccctgcg gagccgggaa ttccgagggg cggagcgcag gccgagatgg ggaatgtggg 18300
ggcctgcaga ggaccctgga gacggaggcg tgcagaagct cagtctcggg gcggaggctt 18360
cgcgccctta gtcctcctgg acggcccgtt accttctgcg ttgtcccgat ggggaaactg 18420
aggccctgag ccagaagcac acgctggggg gaggcagaaa gcgcggccag aggcggaggg 18480
aaaacaaagg gagaatcaca gacagacggg agggggacgg acacacacaa ggggacagag 18540
acccgagtgg agagctggat ctcgccttcc cggcgtgggg cgcagggtcg gccagaaaga 18600
agatcgagaa gagcggggag tgggggcgaa aaggggggac aggtggggga ggaggctggg 18660
gaaagcccga gggaggaaga gagggaggga ggaacttccc aaagttgcaa aacatggcta 18720
ccttgcctgc ggagccgagc gcggggccgg cggctggggg ggaggcggtg gcggcggcgg 18780
cggcgaccga agaggaggag gaggaagcgc gccagctctt gcagactttg caggcggccg 18840
agggtgaggc ggcggcggcg gccggggccg gggcgggcgc agcggctgcg ggagctgagg 18900
gcccgggatc cccgggcgtc cccgggtcgc cccccgaggc cgcttccgaa ccgcccacgg 18960
gcctccgctt ctcgcccgag caggtggcgt gcgtctgcga ggcgctgctc caggcgggcc 19020
acgccggccg cttgagccgc ttcctgggcg cactgccccc ggccgagcgc ctacgtggca 19080
gcgacccggt gttgcgcgcg cgggccctgg tggccttcca gcggggcgag tacgccgagc 19140
tctaccggct actcgagagc cgccccttcc ccgccgccca ccacgccttc ctgcaggacc 19200
tctacctgcg cgcgcgctac catgaggccg agcgggcccg cggccgcgcg cttggcgcag 19260
tggacaagta tcgactgcgc aagaagttcc cgctgcccaa gaccatctgg gacggcgagg 19320
agacagtcta ctgcttcaag gagcgctccc gcgcagcgct caaggcctgc taccgcggca 19380
accgctaccc cacgccggac gagaagcgcc gcctggccac actcaccggc ctgtcgctca 19440
cgcaggtcag caactggttc aagaaccggc gacagcgcga ccggaccggg gccggaggcg 19500
gcgcgccctg caagaggtga ggggcctcgg gcggcgcaag tccagctctc ccggggacat 19560
cccgtccacc agccctcttc ccccgtgccc actgctgggg ccggcgcgcc gaggtcctcg 19620
gacatctccc gggaccagct cacaatctca ggcgcccgcg gggcgcgggg actaagtgtg 19680
gacgggacag gcacccgccc gggccctctc cccgcacgcg tctcctcttc cagcggctcc 19740
attccgagct ccttcccaaa tcccatcggt gttggggaat cacactgcgg ggggcactag 19800
agggactgag gaaaaaggac agggcctgtg gccactccac t 19841
<210> 66
<211> 842
<212> PRT
<213> Homo sapiens
<400> 66
Met Ser Arg Pro Leu Ser Asp Gln Glu Lys Arg Lys Gln Ile Ser Val
1 5 10 15
Arg Gly Leu Ala Gly Val Glu Asn Val Thr Glu Leu Lys Lys Asn Phe
20 25 30
Asn Arg His Leu His Phe Thr Leu Val Lys Asp Arg Asn Val Ala Thr
35 40 45
Pro Arg Asp Tyr Tyr Phe Ala Leu Ala His Thr Val Arg Asp His Leu
50 55 60
Val Gly Arg Trp Ile Arg Thr Gln Gln His Tyr Tyr Glu Lys Asp Pro
65 70 75 80
Lys Arg Ile Tyr Tyr Leu Ser Leu Glu Phe Tyr Met Gly Arg Thr Leu
85 90 95
Gln Asn Thr Met Val Asn Leu Ala Leu Glu Asn Ala Cys Asp Glu Ala
100 105 110
Thr Tyr Gln Leu Gly Leu Asp Met Glu Glu Leu Glu Glu Ile Glu Glu
115 120 125
Asp Ala Gly Leu Gly Asn Gly Gly Leu Gly Arg Leu Ala Ala Cys Phe
130 135 140
Leu Asp Ser Met Ala Thr Leu Gly Leu Ala Ala Tyr Gly Tyr Gly Ile
145 150 155 160
Arg Tyr Glu Phe Gly Ile Phe Asn Gln Lys Ile Ser Gly Gly Trp Gln
165 170 175
Met Glu Glu Ala Asp Asp Trp Leu Arg Tyr Gly Asn Pro Trp Glu Lys
180 185 190
Ala Arg Pro Glu Phe Thr Leu Pro Val His Phe Tyr Gly His Val Glu
195 200 205
His Thr Ser Gln Gly Ala Lys Trp Val Asp Thr Gln Val Val Leu Ala
210 215 220
Met Pro Tyr Asp Thr Pro Val Pro Gly Tyr Arg Asn Asn Val Val Asn
225 230 235 240
Thr Met Arg Leu Trp Ser Ala Lys Ala Pro Asn Asp Phe Asn Leu Lys
245 250 255
Asp Phe Asn Val Gly Gly Tyr Ile Gln Ala Val Leu Asp Arg Asn Leu
260 265 270
Ala Glu Asn Ile Ser Arg Val Leu Tyr Pro Asn Asp Asn Phe Phe Glu
275 280 285
Gly Lys Glu Leu Arg Leu Lys Gln Glu Tyr Phe Val Val Ala Ala Thr
290 295 300
Leu Gln Asp Ile Ile Arg Arg Phe Lys Ser Ser Lys Phe Gly Cys Arg
305 310 315 320
Asp Pro Val Arg Thr Asn Phe Asp Ala Phe Pro Asp Lys Val Ala Ile
325 330 335
Gln Leu Asn Asp Thr His Pro Ser Leu Ala Ile Pro Glu Leu Met Arg
340 345 350
Ile Leu Val Asp Leu Glu Arg Met Asp Trp Asp Lys Ala Trp Asp Val
355 360 365
Thr Val Arg Thr Cys Ala Tyr Thr Asn His Thr Val Leu Pro Glu Ala
370 375 380
Leu Glu Arg Trp Pro Val His Leu Leu Glu Thr Leu Leu Pro Arg His
385 390 395 400
Leu Gln Ile Ile Tyr Glu Ile Asn Gln Arg Phe Leu Asn Arg Val Ala
405 410 415
Ala Ala Phe Pro Gly Asp Val Asp Arg Leu Arg Arg Met Ser Leu Val
420 425 430
Glu Glu Gly Ala Val Lys Arg Ile Asn Met Ala His Leu Cys Ile Ala
435 440 445
Gly Ser His Ala Val Asn Gly Val Ala Arg Ile His Ser Glu Ile Leu
450 455 460
Lys Lys Thr Ile Phe Lys Asp Phe Tyr Glu Leu Glu Pro His Lys Phe
465 470 475 480
Gln Asn Lys Thr Asn Gly Ile Thr Pro Arg Arg Trp Leu Val Leu Cys
485 490 495
Asn Pro Gly Leu Ala Glu Val Ile Ala Glu Arg Ile Gly Glu Asp Phe
500 505 510
Ile Ser Asp Leu Asp Gln Leu Arg Lys Leu Leu Ser Phe Val Asp Asp
515 520 525
Glu Ala Phe Ile Arg Asp Val Ala Lys Val Lys Gln Glu Asn Lys Leu
530 535 540
Lys Phe Ala Ala Tyr Leu Glu Arg Glu Tyr Lys Val His Ile Asn Pro
545 550 555 560
Asn Ser Leu Phe Asp Ile Gln Val Lys Arg Ile His Glu Tyr Lys Arg
565 570 575
Gln Leu Leu Asn Cys Leu His Val Ile Thr Leu Tyr Asn Arg Ile Lys
580 585 590
Arg Glu Pro Asn Lys Phe Phe Val Pro Arg Thr Val Met Ile Gly Gly
595 600 605
Lys Ala Ala Pro Gly Tyr His Met Ala Lys Met Ile Ile Arg Leu Val
610 615 620
Thr Ala Ile Gly Asp Val Val Asn His Asp Pro Ala Val Gly Asp Arg
625 630 635 640
Leu Arg Val Ile Phe Leu Glu Asn Tyr Arg Val Ser Leu Ala Glu Lys
645 650 655
Val Ile Pro Ala Ala Asp Leu Ser Glu Gln Ile Ser Thr Ala Gly Thr
660 665 670
Glu Ala Ser Gly Thr Gly Asn Met Lys Phe Met Leu Asn Gly Ala Leu
675 680 685
Thr Ile Gly Thr Met Asp Gly Ala Asn Val Glu Met Ala Glu Glu Ala
690 695 700
Gly Glu Glu Asn Phe Phe Ile Phe Gly Met Arg Val Glu Asp Val Asp
705 710 715 720
Lys Leu Asp Gln Arg Gly Tyr Asn Ala Gln Glu Tyr Tyr Asp Arg Ile
725 730 735
Pro Glu Leu Arg Gln Val Ile Glu Gln Leu Ser Ser Gly Phe Phe Ser
740 745 750
Pro Lys Gln Pro Asp Leu Phe Lys Asp Ile Val Asn Met Leu Met His
755 760 765
His Asp Arg Phe Lys Val Phe Ala Asp Tyr Glu Asp Tyr Ile Lys Cys
770 775 780
Gln Glu Lys Val Ser Ala Leu Tyr Lys Asn Pro Arg Glu Trp Thr Arg
785 790 795 800
Met Val Ile Arg Asn Ile Ala Thr Ser Gly Lys Phe Ser Ser Asp Arg
805 810 815
Thr Ile Ala Gln Tyr Ala Arg Glu Ile Trp Gly Val Glu Pro Ser Arg
820 825 830
Gln Arg Leu Pro Ala Pro Asp Glu Ala Ile
835 840
<210> 67
<211> 429
<212> PRT
<213> Homo sapiens
<400> 67
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 68
<211> 952
<212> PRT
<213> Homo sapiens
<400> 68
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 69
<211> 210
<212> PRT
<213> Homo sapiens
<400> 69
Met Trp Thr Leu Gly Arg Arg Ala Val Ala Gly Leu Leu Ala Ser Pro
1 5 10 15
Ser Pro Ala Gln Ala Gln Thr Leu Thr Arg Val Pro Arg Pro Ala Glu
20 25 30
Leu Ala Pro Leu Cys Gly Arg Arg Gly Leu Arg Thr Asp Ile Asp Ala
35 40 45
Thr Cys Thr Pro Arg Arg Ala Ser Ser Asn Gln Arg Gly Leu Asn Gln
50 55 60
Ile Trp Asn Val Lys Lys Gln Ser Val Tyr Leu Met Asn Leu Arg Lys
65 70 75 80
Ser Gly Thr Leu Gly His Pro Gly Ser Leu Asp Glu Thr Thr Tyr Glu
85 90 95
Arg Leu Ala Glu Glu Thr Leu Asp Ser Leu Ala Glu Phe Phe Glu Asp
100 105 110
Leu Ala Asp Lys Pro Tyr Thr Phe Glu Asp Tyr Asp Val Ser Phe Gly
115 120 125
Ser Gly Val Leu Thr Val Lys Leu Gly Gly Asp Leu Gly Thr Tyr Val
130 135 140
Ile Asn Lys Gln Thr Pro Asn Lys Gln Ile Trp Leu Ser Ser Pro Ser
145 150 155 160
Ser Gly Pro Lys Arg Tyr Asp Trp Thr Gly Lys Asn Trp Val Tyr Ser
165 170 175
His Asp Gly Val Ser Leu His Glu Leu Leu Ala Ala Glu Leu Thr Lys
180 185 190
Ala Leu Lys Thr Lys Leu Asp Leu Ser Ser Leu Ala Tyr Ser Gly Lys
195 200 205
Asp Ala
210
Claims (28)
- 변이체 AAV 캡시드 단백질과 동일한 야생형 AAV 혈청형의 동일한 AAV 캡시드 단백질이지만 변이체 AAV 캡시드 단백질의 펩타이드 삽입을 포함하지 않는 상응하는 모 AAV 캡시드 단백질에 대해 캡시드 단백질의 GH-루프에 5개 아미노산 내지 20개 아미노산의 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며,
펩타이드 삽입은 아미노산 서열 NKTTNKD(서열 식별 번호 14) 또는 NKIQRTD(서열 식별 번호 13)를 포함하고,
삽입 부위는 AAV2(서열 식별 번호 2)의 VP1의 아미노산 570과 611 사이의 위치 또는 다른 AAV 혈청형의 캡시드 단백질에서 삽입 부위가
(i) AAV1 VP1의 아미노산 571-612,
(ii) AAV3A VP1의 아미노산 571-612,
(iii) AAV3B VP1의 아미노산 571-612,
(iv) AAV4 VP1의 아미노산 569-610,
(v) AAV5 VP1의 아미노산 560-601,
(vi) AAV6 VP1의 아미노산 571-612,
(vii) AAV7 VP1의 아미노산 572-613,
(viii) AAV8 VP1의 아미노산 573-614,
(ix) AAV9 VP1의 아미노산 571-612, 또는
(x) AAVIO VP1의 아미노산 573-614; 내에 위치하는 상응하는 위치에서 2개의 인접한 아미노산 사이에 위치하고,
변이체 캡시드 단백질은 AAV 비리온에 존재할 때 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여하는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질. - 제 1항에 있어서,
(a) 펩타이드 삽입은 LANKTTNKDA(서열 식별 번호 27) 또는 LANKIQRTDA(서열 식별 번호 26)이고;
(b) 삽입 부위는 AAV2(서열 식별 번호 2)의 VP1의 아미노산 587 과 588에 상응하는 아미노산 사이에 위치하며;
(c) 펩타이드 삽입 길이가 7 내지 10개 아미노산이고; 및/또는
(d) 펩타이드 삽입은 아미노 및/또는 카르복실 말단에 1 내지 4개의 스페이서 아미노산을 갖는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질. - 제 1항에 있어서,
펩티드 삽입이 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하고, AAV 캡시드 단백질이 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 V708I 아미노산 치환을 포함하며, 임의로 AAV 캡시드 단백질이 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 S109T 아미노산 치환, W694C 아미노산 치환 및 W606C 아미노 치환 중 하나 이상을 추가로 포함하는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질. - 제 3항에 있어서,
AAV 캡시드 단백질은 서열 식별 번호 48로 표시되는 아미노산 서열의 전체 길이와 적어도 90% 동일, 적어도 95% 동일, 적어도 98% 동일 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 변이체 AAV 캡시드 단백질은 서열 식별 번호 48로 표시되는 아미노산 서열로 이루어지는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질. - 제 1항에 있어서,
펩티드 삽입은 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하고, AAV 캡시드 단백질은 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 V708I 아미노산 치환을 포함하고, 임의로 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 S109T 아미노산 치환, RS88M 아미노산 치환 및 A593E 아미노 치환 중 하나 이상을 추가로 포함하며, 임의로
AAV 캡시드 단백질은 서열 식별 번호 43으로 표시된 아미노산 서열의 전체 길이와 적어도 90% 동일, 적어도 95% 동일, 적어도 98% 동일 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 AAV 캡시드 단백질은 서열 식별 번호 43으로 표시된 아미노산 서열로 이루어지는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질. - 제 1항에 있어서,
캡시드 단백질은 야생형 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성, 바람직하게는 적어도 2배 또는 적어도 5배 증가된 감염성을 감염성 rAAV 비리온에 부여하며/또는 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV와 비교하여 중화 항체에 의한 중화에 대한 증가된 내성, 바람직하게는 적어도 2배 또는 적어도 5배 증가된 내성을 감염성 rAAV 비리온에 부여하는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질. - 제 1항 내지 제 6항 중 어느 한 항의 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는, 단리된 핵산.
- 제 1항 내지 제 6항 중 어느 한 항의 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 포함하는, 감염성 재조합 아데노-관련 바이러스(rAAV) 비리온.
- 제 8항에 있어서,
유전자 산물을 인코딩하는 뉴클레오타이드 서열을 포함하는 이종성 핵산을 추가로 포함하며, 바람직하게는 유전자 산물이 단백질, 작은 간섭 RNA(small interfering RNA), 안티센스 RNA(antisense RNA), 마이크로 RNA(micro RNA), 또는 짧은 헤어핀 RNA(short hairpin RNA)인, 감염성 재조합 AAV(rAAV) 비리온. - 제 9항에 있어서,
rAAV 비리온이 알파-갈락토시다제 A(alpha galactosidase A)(GLA), 프랙탁신(fractaxin)(FXN), 디스트로핀(dystrophin)(DMD) 또는 이의 기능적 단편, 산 알파 글루코시다아제(acid alpha glucosidase)(GAA), 및 근육 글리코겐 인산화효소(glycogen phosphorylase, muscle)(PYGM)로부터 선택되는 단백질을 인코딩하는 이종성 핵산을 포함하는, 감염성 재조합 AAV(rAAV) 비리온. - 제 10항에 있어서,
변이체 AAV 캡시드 단백질이 서열 식별 번호 48로 표시되는 아미노산 서열과 적어도 90%, 적어도 95%, 또는 적어도 98% 아미노산 서열 동일성을 갖거나 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하며, 이종성 핵산이 알파-갈락토시다제 A(GLA) 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하고, 바람직하게는 GLA를 인코딩하는 뉴클레오타이드 서열은 CAG 프로모터에 작동 가능하게 연결되는, 감염성 재조합 AAV(rAAV) 비리온. - 제 10항에 있어서,
변이체 AAV 캡시드 단백질이 서열 식별 번호 48로 표시되는 아미노산 서열과 적어도 90%, 적어도 95%, 또는 적어도 98% 아미노산 서열 동일성을 갖거나 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하며, 이종성 핵산이 프랙탁신(frataxin) 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하고, 바람직하게는 프랙탁신을 인코딩하는 뉴클레오타이드 서열은 CAG 프로모터에 작동 가능하게 연결되는, 감염성 재조합 AAV(rAAV) 비리온. - 제 10항에 있어서,
변이체 AAV 캡시드 단백질이 서열 식별 번호 48로 표시되는 아미노산 서열과 적어도 90%, 적어도 95%, 또는 적어도 98% 아미노산 서열 동일성을 갖거나 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하며, 이종성 핵산이 GAA 단백질을 인코딩하는을 인코딩하는 뉴클레오타이드 서열을 포함하고, 바람직하게는 GAA 단백질을 인코딩하는 뉴클레오타이드 서열은 CBA 프로모터에 작동 가능하게 연결되는, 감염성 재조합 AAV(rAAV) 비리온. - 제 9항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
- 제 10항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
- 제 11항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
- 제 12항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
- 제 13항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
- 제 9항에 있어서,
근육 세포, 바람직하게는 심장 및/또는 골격근 세포에, 바람직하게는 정맥 내 및/또는 근육 내 주사에 의해 이종성 핵산을 전달하는 방법의 용도인, 감염성 재조합 AAV(rAAV) 비리온. - 제 9항에 있어서,
약물(medicament)로서의 용도인, 감염성 재조합 AAV(rAAV) 비리온. - 제 11항에 있어서,
파브리병(Fabry disease)을 치료하는 용도이며, 바람직하게는 rAAV가 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 감염성 재조합 AAV(rAAV) 비리온. - 제 12항에 있어서,
프리드리히 운동실조(Friedreich's ataxia)을 치료하는 용도이며, 바람직하게는 rAAV가 정맥 내 주사에 의해 투여되는, 감염성 재조합 AAV(rAAV) 비리온. - 제 13항에 있어서,
폼페병(Pompe disease)을 치료하는 용도이며, 바람직하게는 rAAV가 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 감염성 재조합 AAV(rAAV) 비리온. - 제 14항에 있어서,
근육 세포, 바람직하게는 심장 및/또는 골격근 세포에, 바람직하게는 정맥 내 및/또는 근육 내 주사에 의해 이종성 핵산을 전달하는 방법의 용도인, 약학적 조성물. - 제 14항에 있어서,
약물(medicament)로서의 용도인, 약학적 조성물. - 제 16항에 있어서,
파브리병(Fabry disease)을 치료하는 용도이며, 바람직하게는 조성물이 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 약학적 조성물. - 제 17항에 있어서,
프리드리히 운동실조(Friedreich's ataxia)를 치료하는 용도이며, 바람직하게는 조성물이 정맥 내 주사에 의해 투여되는, 약학적 조성물. - 제 18항에 있어서,
폼페병(Pompe disease)을 치료하는 용도이며, 바람직하게는 조성물이 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 약학적 조성물.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762560901P | 2017-09-20 | 2017-09-20 | |
US62/560,901 | 2017-09-20 | ||
KR1020207009936A KR20200052333A (ko) | 2017-09-20 | 2018-09-19 | 아데노-관련 바이러스 변이체 캡시드 및 그 용도 |
PCT/US2018/051812 WO2019060454A2 (en) | 2017-09-20 | 2018-09-19 | CAPSID VARIANT ADENO-ASSOCIATED VIRUSES AND METHODS OF USE |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207009936A Division KR20200052333A (ko) | 2017-09-20 | 2018-09-19 | 아데노-관련 바이러스 변이체 캡시드 및 그 용도 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220070075A true KR20220070075A (ko) | 2022-05-27 |
Family
ID=65810888
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207009936A KR20200052333A (ko) | 2017-09-20 | 2018-09-19 | 아데노-관련 바이러스 변이체 캡시드 및 그 용도 |
KR1020227017132A KR20220070075A (ko) | 2017-09-20 | 2018-09-19 | 아데노-관련 바이러스 변이체 캡시드 및 그 용도 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207009936A KR20200052333A (ko) | 2017-09-20 | 2018-09-19 | 아데노-관련 바이러스 변이체 캡시드 및 그 용도 |
Country Status (25)
Country | Link |
---|---|
US (4) | US11118192B2 (ko) |
EP (2) | EP4218828A3 (ko) |
JP (1) | JP6825167B2 (ko) |
KR (2) | KR20200052333A (ko) |
CN (1) | CN111836649A (ko) |
AU (1) | AU2018337833B2 (ko) |
BR (1) | BR112020005436B1 (ko) |
CA (1) | CA3076348A1 (ko) |
CL (1) | CL2020000728A1 (ko) |
CO (1) | CO2020004738A2 (ko) |
CR (1) | CR20200165A (ko) |
DK (1) | DK3684423T5 (ko) |
ES (1) | ES2948902T3 (ko) |
FI (1) | FI3684423T3 (ko) |
IL (1) | IL273261A (ko) |
MX (1) | MX2020003176A (ko) |
NZ (1) | NZ763018A (ko) |
PE (1) | PE20201264A1 (ko) |
PH (1) | PH12020550094A1 (ko) |
PT (1) | PT3684423T (ko) |
RU (1) | RU2770922C2 (ko) |
SG (1) | SG11202002276VA (ko) |
UA (1) | UA127455C2 (ko) |
WO (1) | WO2019060454A2 (ko) |
ZA (1) | ZA202001679B (ko) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200015932A (ko) | 2017-06-07 | 2020-02-13 | 리제너론 파마슈티칼스 인코포레이티드 | 효소 내재화를 위한 조성물 및 방법 |
MX2020003176A (es) * | 2017-09-20 | 2020-08-20 | 4D Molecular Therapeutics Inc | Variantes de capsides de virus adenoasociados y metodos de uso de estas. |
JP7184894B2 (ja) | 2017-11-27 | 2022-12-06 | 4ディー モレキュラー セラピューティクス インコーポレイテッド | アデノ随伴ウイルス変異キャプシドおよび血管新生の阻害のための使用 |
CA3111076A1 (en) | 2018-08-30 | 2020-03-05 | Tenaya Therapeutics, Inc. | Cardiac cell reprogramming with myocardin and ascl1 |
US11149256B2 (en) | 2018-09-26 | 2021-10-19 | California Institute Of Technology | Adeno-associated virus compositions for targeted gene therapy |
CN110437317B (zh) * | 2019-01-30 | 2023-05-02 | 上海科技大学 | 具有变异衣壳蛋白的腺相关病毒及其用途 |
US20220184232A1 (en) * | 2019-03-25 | 2022-06-16 | The Regents Of The University Of California | Methods of treating tnni3-mediated cardiomyopathy |
EP3947700A4 (en) * | 2019-04-01 | 2023-01-04 | Tenaya Therapeutics, Inc. | ADENO-ASSOCIATED VIRUS WITH MANIPULATED CAPSID |
EP3997226A1 (en) | 2019-07-11 | 2022-05-18 | Tenaya Therapeutics, Inc. | Cardiac cell reprogramming with micrornas and other factors |
CA3155154A1 (en) * | 2019-10-23 | 2021-04-29 | The Trustees Of The University Of Pennsylvania | Compositions for drg-specific reduction of transgene expression |
CA3159113A1 (en) * | 2019-11-22 | 2021-05-27 | Beverly Davidson | Adeno-associated viral vector variants |
EP4103214A2 (en) | 2020-02-13 | 2022-12-21 | Tenaya Therapeutics, Inc. | Gene therapy vectors for treating heart disease |
CA3169922A1 (en) * | 2020-04-08 | 2021-10-14 | University Of Utah Research Foundation | Methods for rehabilitating heart failure using gene therapy |
US11198858B2 (en) * | 2020-04-27 | 2021-12-14 | 4D Molecular Therapeutics Inc. | Codon optimized GLA genes and uses thereof |
US11900272B2 (en) | 2020-05-13 | 2024-02-13 | Factset Research System Inc. | Method and system for mapping labels in standardized tables using machine learning |
IL298001A (en) | 2020-05-13 | 2023-01-01 | Voyager Therapeutics Inc | Redirecting tropism of adeno-associated virus capsids |
IL298178A (en) * | 2020-05-14 | 2023-01-01 | Univ Pennsylvania | Useful preparations for the treatment of Pompe disease |
KR20230031329A (ko) * | 2020-06-30 | 2023-03-07 | 칠드런스 내셔널 메디컬 센터 | 골격 근섬유 복구를 개선하기 위한 재조합 인간 산성 스핑고미엘리나제의 용도 |
WO2022020806A2 (en) * | 2020-07-24 | 2022-01-27 | The Trustees Of The University Of Pennsylvania | Utrophin genome editing for treating duchenne muscular dystrophy (dmd) |
CN113754727B (zh) * | 2020-09-30 | 2022-07-12 | 广州派真生物技术有限公司 | 腺相关病毒突变体及其应用 |
US11781156B2 (en) | 2020-10-09 | 2023-10-10 | Tenaya Therapeutics, Inc. | Plakophillin-2 gene therapy methods and compositions |
EP4243848A2 (en) * | 2020-11-10 | 2023-09-20 | Avirmax Biopharma Inc. | Engineered viral capsids and methods of use |
CN112725342B (zh) * | 2021-02-02 | 2024-05-17 | 中国科学院深圳先进技术研究院 | 一种启动子pCALM2及其应用 |
US20230062110A1 (en) * | 2021-03-26 | 2023-03-02 | Adverum Biotechnologies, Inc. | Intravitreal dosing for delivery of polynucleotides to retinal cones |
EP4322974A2 (en) * | 2021-04-13 | 2024-02-21 | Capsida, Inc. | Adeno-associated virus compositions having increased brain enrichment |
CN113121653B (zh) * | 2021-04-19 | 2021-11-19 | 上海信致医药科技有限公司 | 肌肉和视网膜特异性的新型腺相关病毒衣壳蛋白 |
WO2022256557A1 (en) * | 2021-06-03 | 2022-12-08 | Dyno Therapeutics, Inc. | Capsid variants and methods of using the same |
CN113480615B (zh) * | 2021-07-30 | 2022-05-31 | 上海信致医药科技有限公司 | 高视网膜亲和性的新型腺相关病毒衣壳蛋白及其应用 |
WO2023005906A1 (zh) * | 2021-07-30 | 2023-02-02 | 上海信致医药科技有限公司 | 新型腺相关病毒血清型介导的血管生成抑制剂及其应用 |
CN118159663A (zh) * | 2021-08-25 | 2024-06-07 | 北海康成制药有限公司 | 包含嗜肝衣壳蛋白和酸性α-葡糖苷酶(GAA)的AAV颗粒及其治疗庞贝病的用途 |
AU2022358779A1 (en) | 2021-10-08 | 2024-04-18 | Dyno Therapeutics, Inc. | Capsid variants and methods of using the same |
CA3242262A1 (en) * | 2021-12-10 | 2023-06-15 | University Of Florida Research Foundation, Incorporated | Methods and compositions for treating mybpc3 related hypertrophic cardiomyopathy with a viral vector |
AU2023230885A1 (en) * | 2022-03-07 | 2024-09-26 | 4D Molecular Therapeutics Inc. | Adeno-associated virus variant capsids with improved lung tropism and uses thereof |
AR129033A1 (es) * | 2022-04-11 | 2024-07-10 | Tenaya Therapeutics Inc | Cápsides para terapia con el gen de placofilina-2 |
WO2024054864A1 (en) | 2022-09-06 | 2024-03-14 | Tenaya Therapeutics, Inc. | Cardioprotective heart disease therapies |
WO2024064782A2 (en) * | 2022-09-21 | 2024-03-28 | Rejuvenate Bio | Adeno-associated virus capsids |
WO2024073735A2 (en) * | 2022-09-30 | 2024-04-04 | University Of Massachusetts | Oligonucleotides targeting s6k1 |
CN115960177B (zh) * | 2022-10-09 | 2023-07-07 | 广州派真生物技术有限公司 | 腺相关病毒突变体及其应用 |
CN117304256B (zh) * | 2022-12-08 | 2024-04-16 | 广州派真生物技术有限公司 | 腺相关病毒突变体及其应用 |
WO2024130070A2 (en) * | 2022-12-17 | 2024-06-20 | The Trustees Of The University Of Pennsylvania | Recombinant aav capsids with cardiac- and skeletal muscle- specific targeting motifs and uses thereof |
CN116041443B (zh) * | 2022-12-30 | 2023-09-22 | 广州派真生物技术有限公司 | 腺相关病毒突变体及其应用 |
CN115925819B (zh) * | 2022-12-30 | 2023-10-13 | 广州派真生物技术有限公司 | 腺相关病毒突变体及其应用 |
WO2024191778A1 (en) | 2023-03-10 | 2024-09-19 | Dyno Therapeutics, Inc. | Capsid polypeptides and methods of use thereof |
WO2024206831A1 (en) * | 2023-03-31 | 2024-10-03 | Duke University | Compositions comprising brain-tropic aavs and methods of use thereof |
WO2024215653A1 (en) | 2023-04-10 | 2024-10-17 | Tenaya Therapeutics, Inc. | Guide rnas, vectors, and virions for targeting mutations in the pln gene |
WO2024215655A1 (en) | 2023-04-10 | 2024-10-17 | Tenaya Therapeutics, Inc. | Cardioprotective bag3 therapies |
Family Cites Families (94)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0932694A2 (en) | 1996-09-11 | 1999-08-04 | THE UNITED STATES GOVERNMENT as represented by THE DEPARTMENT OF HEALTH AND HUMAN SERVICES | Aav4 vector and uses thereof |
US6156303A (en) | 1997-06-11 | 2000-12-05 | University Of Washington | Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom |
US7323179B2 (en) | 1997-12-19 | 2008-01-29 | Naomi Balaban | Methods and compositions for the treatment and prevention of Staphylococcus and other bacterial infections |
US6506559B1 (en) | 1997-12-23 | 2003-01-14 | Carnegie Institute Of Washington | Genetic inhibition by double-stranded RNA |
DE69939169D1 (de) | 1998-05-28 | 2008-09-04 | Us Gov Health & Human Serv | Aav5 vektoren und deren verwendung |
US6984517B1 (en) | 1998-05-28 | 2006-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | AAV5 vector and uses thereof |
ES2288037T3 (es) | 1998-11-05 | 2007-12-16 | The Trustees Of The University Of Pennsylvania | Secuencia de acido nucleico del serotipo 1 de adenovirus asociado, vectores y celulas huesped que las contienen. |
US6759237B1 (en) | 1998-11-05 | 2004-07-06 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus serotype 1 nucleic acid sequences, vectors and host cells containing same |
AU780231B2 (en) | 1998-11-10 | 2005-03-10 | University Of North Carolina At Chapel Hill, The | Virus vectors and methods of making and administering the same |
DE19956568A1 (de) | 1999-01-30 | 2000-08-17 | Roland Kreutzer | Verfahren und Medikament zur Hemmung der Expression eines vorgegebenen Gens |
AU1086501A (en) | 1999-10-15 | 2001-04-30 | Carnegie Institution Of Washington | Rna interference pathway genes as tools for targeted genetic interference |
IL151928A0 (en) | 2000-03-30 | 2003-04-10 | Whitehead Biomedical Inst | Rna sequence-specific mediators of rna interference |
AU2001264862B2 (en) | 2000-05-23 | 2006-03-30 | University Of Rochester | Method of producing herpes simplex virus amplicons, resulting amplicons, and their use |
US20100305186A1 (en) | 2000-05-30 | 2010-12-02 | Johnson & Johnson Research Pty Limited | Methods for mediating gene suppression |
CA2456008A1 (en) | 2000-08-19 | 2002-02-28 | Axordia Limited | Stem cell differentiation |
WO2002029858A2 (en) | 2000-09-29 | 2002-04-11 | Infineon Technologies North America Corp. | Deep trench etching method to reduce/eliminate formation of black silicon |
US7749492B2 (en) | 2001-01-05 | 2010-07-06 | Nationwide Children's Hospital, Inc. | AAV vectors and methods |
US6962815B2 (en) | 2001-01-05 | 2005-11-08 | Children's Hopital Inc. | AAV2 vectors and methods |
EP1572893B1 (en) | 2001-11-09 | 2009-01-07 | THE GOVERNMENT OF THE UNITED STATES OF AMERICA as represented by THE SECRETARY of the DEPARTMENT OF HEALTH AND HUMAN SERVICES | Production of adeno-associated virus in insect cells |
ES2455126T3 (es) | 2001-11-13 | 2014-04-14 | The Trustees Of The University Of Pennsylvania | Secuencias Cy.5 de virus adeno-asociados (AAV), vectores que las contienen y uso de las mismas. |
WO2003052051A2 (en) | 2001-12-17 | 2003-06-26 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (aav) serotype 8 sequences |
JP4769417B2 (ja) | 2001-12-17 | 2011-09-07 | ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア | アデノ随伴ウイルス(aav)血清型9の配列、それを含むベクターおよびその使用 |
ES2467156T3 (es) | 2001-12-21 | 2014-06-12 | Medigene Ag | Una biblioteca de genes estructurales modificados o de partículas modificadas de cápside útiles para la identificación de clones virales con tropismo celular deseado |
AU2003253595A1 (en) | 2002-04-05 | 2003-11-03 | The Children's Hospital Of Philadelphia | Methods for the production of chimeric adeno-associated virus (aav) vectors, compositions of chimeric aav vectors, and methods of use thereof |
AU2003221733A1 (en) | 2002-04-17 | 2003-11-03 | University Of Florida Research Foundation, Inc. | Improved raav vectors |
EP1496944B1 (en) | 2002-05-01 | 2008-08-20 | University of Florida Research Foundation, Inc. | Improved raav expression systems for genetic modification of specific capsid proteins |
US20040023390A1 (en) | 2002-08-05 | 2004-02-05 | Davidson Beverly L. | SiRNA-mediated gene silencing with viral vectors |
WO2004020600A2 (en) | 2002-08-28 | 2004-03-11 | University Of Florida | Modified aav |
WO2004083441A2 (en) * | 2003-03-19 | 2004-09-30 | Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts | Random peptide library displayed on aav vectors |
US7186522B2 (en) | 2003-03-31 | 2007-03-06 | Cytyc Corporation | Papanicolau staining process |
US20060286545A1 (en) | 2003-05-23 | 2006-12-21 | Mount Sinai School Of Medicine Of New York University | Viral vectors with improved properties |
EP1486567A1 (en) | 2003-06-11 | 2004-12-15 | Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts | Improved adeno-associated virus (AAV) vector for gene therapy |
US8071028B2 (en) | 2003-06-12 | 2011-12-06 | Abbott Diabetes Care Inc. | Method and apparatus for providing power management in data communication systems |
DK3235827T3 (da) | 2003-06-19 | 2021-04-19 | Genzyme Corp | Aav-virioner med reduceret immunreaktivitet og anvendelser deraf |
US9233131B2 (en) | 2003-06-30 | 2016-01-12 | The Regents Of The University Of California | Mutant adeno-associated virus virions and methods of use thereof |
US9441244B2 (en) | 2003-06-30 | 2016-09-13 | The Regents Of The University Of California | Mutant adeno-associated virus virions and methods of use thereof |
DK2345731T3 (en) | 2003-09-30 | 2016-01-25 | Univ Pennsylvania | Adeno-associated virus (AAV) groupings, sequences, vectors containing the same and uses thereof |
ATE465173T1 (de) | 2004-09-24 | 2010-05-15 | Intercell Ag | Verändertes vp-1capsidprotein von parvovirus b19 |
US7892809B2 (en) | 2004-12-15 | 2011-02-22 | The University Of North Carolina At Chapel Hill | Chimeric vectors |
ES2434723T3 (es) | 2005-04-07 | 2013-12-17 | The Trustees Of The University Of Pennsylvania | Método de incremento de la función de un vector AAV |
US8283151B2 (en) | 2005-04-29 | 2012-10-09 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Isolation, cloning and characterization of new adeno-associated virus (AAV) serotypes |
DK1945779T3 (da) | 2005-10-20 | 2013-06-03 | Uniqure Ip Bv | Forbedrede AAV vektorer frembragt i insektceller |
WO2007089632A2 (en) | 2006-01-27 | 2007-08-09 | The University Of North Carolina At Chapel Hill | Heparin and heparan sulfate binding chimeric vectors |
EP2007795B1 (en) | 2006-03-30 | 2016-11-16 | The Board Of Trustees Of The Leland Stanford Junior University | Aav capsid proteins |
US20090317417A1 (en) | 2006-04-28 | 2009-12-24 | The Trustees Of The University Of Pennsylvania | Modified AAV Vectors Having Reduced Capsid Immunogenicity and Use Thereof |
LT2191001T (lt) | 2007-04-09 | 2016-10-10 | University Of Florida Research Foundation, Inc. | Raav vektoriaus kompozicijos, turinčios tirozin-modifikuotų kapsidės baltymų ir jų panaudojimo būdai |
WO2008124015A1 (en) | 2007-04-09 | 2008-10-16 | The Regents Of The University Of California | Methods for purifying adeno-associated virus virions |
EP2012122A1 (en) | 2007-07-06 | 2009-01-07 | Medigene AG | Mutated parvovirus structural proteins as vaccines |
WO2008145400A2 (en) | 2007-05-31 | 2008-12-04 | Medigene Ag | Mutated structural protein of a parvovirus |
CA2693712C (en) | 2007-07-14 | 2018-05-29 | The University Of Iowa Research Foundation | Methods and compositions for treating brain diseases |
WO2009108274A2 (en) | 2008-02-26 | 2009-09-03 | The University Of North Carolina At Chapel Hill | Methods and compositions for adeno-associated virus (aav) with hi loop mutations |
WO2009137006A2 (en) | 2008-04-30 | 2009-11-12 | The University Of North Carolina At Chapel Hill | Directed evolution and in vivo panning of virus vectors |
WO2009154452A1 (en) | 2008-06-17 | 2009-12-23 | Amsterdam Molecular Therapeutics B.V. | Parvoviral capsid with incorporated Gly-Ala repeat region |
JP2010002479A (ja) | 2008-06-18 | 2010-01-07 | Crossfor:Kk | メガネレンズ用装飾体およびメガネ用装飾体装着具 |
EP2342567A1 (en) | 2008-09-19 | 2011-07-13 | Charité Universitätsmedizin Berlin | Identification and characterisation of recombinant viral gene therapy vectors |
WO2010093784A2 (en) | 2009-02-11 | 2010-08-19 | The University Of North Carolina At Chapel Hill | Modified virus vectors and methods of making and using the same |
WO2010138263A2 (en) | 2009-05-28 | 2010-12-02 | University Of Massachusetts | Novel aav 's and uses thereof |
WO2010141706A1 (en) | 2009-06-03 | 2010-12-09 | Cedars-Sinai Medical Center | Effective vector platform for gene transfer and gene therapy |
WO2011038187A1 (en) | 2009-09-25 | 2011-03-31 | The Trustees Of The University Of Pennsylvania | Controlled adeno-associated virus (aav) diversification and libraries prepared therefrom |
US8299295B2 (en) | 2009-10-15 | 2012-10-30 | Johnson Matthey Public Limited Company | Polymorphs of bromfenac sodium and methods for preparing bromfenac sodium polymorphs |
US8263396B2 (en) | 2010-04-01 | 2012-09-11 | Weidong Xiao | Methods and compositions for the production of recombinant virus vectors |
CA2833908C (en) | 2010-04-23 | 2021-02-09 | University Of Massachusetts | Cns targeting aav vectors and methods of use thereof |
US8927514B2 (en) | 2010-04-30 | 2015-01-06 | City Of Hope | Recombinant adeno-associated vectors for targeted treatment |
US8628966B2 (en) | 2010-04-30 | 2014-01-14 | City Of Hope | CD34-derived recombinant adeno-associated vectors for stem cell transduction and systemic therapeutic gene transfer |
WO2011146121A1 (en) | 2010-05-17 | 2011-11-24 | Sangamo Biosciences, Inc. | Novel dna-binding proteins and uses thereof |
US8663624B2 (en) | 2010-10-06 | 2014-03-04 | The Regents Of The University Of California | Adeno-associated virus virions with variant capsid and methods of use thereof |
US10415056B2 (en) | 2010-11-10 | 2019-09-17 | Fred Hutchinson Cancer Research Center | Compositions and methods for generating adeno-associated viral vectors with undetectable capsid gene contamination |
WO2012109570A1 (en) | 2011-02-10 | 2012-08-16 | The University Of North Carolina At Chapel Hill | Viral vectors with modified transduction profiles and methods of making and using the same |
EP2675484B1 (en) | 2011-02-14 | 2018-05-30 | The Children's Hospital of Philadelphia | Improved aav8 vector with enhanced functional activity and methods of use thereof |
SG192268A1 (en) | 2011-02-17 | 2013-08-30 | Univ Pennsylvania | Compositions and methods for altering tissue specificity and improving aav9-mediated gene transfer |
EP2500434A1 (en) * | 2011-03-12 | 2012-09-19 | Association Institut de Myologie | Capsid-free AAV vectors, compositions, and methods for vector production and gene delivery |
HRP20220036T1 (hr) * | 2011-04-22 | 2022-04-01 | The Regents Of The University Of California | Virioni adeno-povezanog virusa s varijantom kapsida i postupci njihove upotrebe |
EP2748185A1 (en) | 2011-08-24 | 2014-07-02 | The Board of Trustees of The Leland Stanford Junior University | New aav capsid proteins for nucleic acid transfer |
US20140359799A1 (en) | 2011-12-23 | 2014-12-04 | Case Western Reserve University | Targeted gene modification using hybrid recombinant adeno-associated virus |
SG11201404956PA (en) | 2012-02-17 | 2014-09-26 | Philadelphia Children Hospital | Aav vector compositions and methods for gene transfer to cells, organs and tissues |
DK2839014T3 (da) | 2012-04-18 | 2021-03-08 | Childrens Hospital Philadelphia | Sammensætning og fremgangsmåder til højeffektiv genoverførsel ved anvendelse af aav-capsid-varianter |
EP2660325A3 (en) | 2012-05-02 | 2014-02-12 | Christian Medical College | AAV vectors and corresponding nucleotide sequences and methods |
JP6385920B2 (ja) | 2012-05-09 | 2018-09-05 | オレゴン ヘルス アンド サイエンス ユニバーシティー | アデノ随伴ウイルスプラスミド及びベクター |
WO2013174760A1 (en) | 2012-05-25 | 2013-11-28 | Deutsches Krebsforschungszentrum | Optimized aav-vectors for high transduction rates in dendritic cells |
EP2692731A1 (en) | 2012-07-31 | 2014-02-05 | Paul-Ehrlich-Institut Bundesamt für Sera und Impfstoffe | Recombinant Adeno-Associated virus (AAV) vector particles displaying high-affinity ligands for cell-type specific gene delivery |
ES2814901T3 (es) | 2012-09-28 | 2021-03-29 | Univ North Carolina Chapel Hill | Vectores de AAV dirigidos a oligodendrocitos |
WO2014103957A1 (ja) | 2012-12-25 | 2014-07-03 | タカラバイオ株式会社 | Aav変異体 |
DK2954051T3 (da) | 2013-02-08 | 2019-07-08 | Univ Pennsylvania | Modificeret kapsid til genoverførsel til behandling af nethinden |
EP2970946A4 (en) | 2013-03-13 | 2016-09-07 | Philadelphia Children Hospital | ADENOASSOZED VIRUS VECTORS AND METHOD FOR USE THEREOF |
CN105247044B (zh) | 2013-05-31 | 2021-05-07 | 加利福尼亚大学董事会 | 腺相关病毒变体及其使用方法 |
EP3777980B1 (en) * | 2013-10-29 | 2023-12-06 | President and Fellows of Harvard College | Nuclear factor erythroid 2-like 2 (nrf2) for use in treatment of age-related macular degeneration |
CA2942776C (en) | 2014-03-17 | 2023-01-24 | Adverum Biotechnologies, Inc. | Polyneucleotide cassette and expression vector for expression of a gene in cone cells using truncated m-opsin promoter |
SG11201707063TA (en) * | 2015-03-02 | 2017-09-28 | Adverum Biotechnologies Inc | Compositions and methods for intravitreal delivery of polynucleotides to retinal cones |
JP6836999B2 (ja) | 2015-03-24 | 2021-03-03 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニアThe Regents Of The University Of California | アデノ随伴ウイルス変異体及びその使用方法 |
US10385320B2 (en) | 2015-12-02 | 2019-08-20 | The Board Of Trustees Of The Leland Stanford Junior University | Recombinant adeno-associated virus capsids with enhanced human skeletal muscle tropism |
SG11201809684YA (en) | 2016-05-13 | 2018-11-29 | 4D Molecular Therapeutics Inc | Adeno-associated virus variant capsids and methods of use thereof |
KR102508820B1 (ko) * | 2016-07-29 | 2023-03-13 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | 변이체 캡시드를 갖는 아데노-관련된 바이러스 비리온 및 이의 사용 방법 |
MX2020003176A (es) * | 2017-09-20 | 2020-08-20 | 4D Molecular Therapeutics Inc | Variantes de capsides de virus adenoasociados y metodos de uso de estas. |
US11198858B2 (en) * | 2020-04-27 | 2021-12-14 | 4D Molecular Therapeutics Inc. | Codon optimized GLA genes and uses thereof |
-
2018
- 2018-09-19 MX MX2020003176A patent/MX2020003176A/es unknown
- 2018-09-19 CA CA3076348A patent/CA3076348A1/en active Pending
- 2018-09-19 NZ NZ763018A patent/NZ763018A/en unknown
- 2018-09-19 SG SG11202002276VA patent/SG11202002276VA/en unknown
- 2018-09-19 EP EP23157104.3A patent/EP4218828A3/en active Pending
- 2018-09-19 PE PE2020000407A patent/PE20201264A1/es unknown
- 2018-09-19 KR KR1020207009936A patent/KR20200052333A/ko not_active IP Right Cessation
- 2018-09-19 EP EP18859241.4A patent/EP3684423B1/en active Active
- 2018-09-19 US US16/648,195 patent/US11118192B2/en active Active
- 2018-09-19 JP JP2020516735A patent/JP6825167B2/ja active Active
- 2018-09-19 WO PCT/US2018/051812 patent/WO2019060454A2/en active Application Filing
- 2018-09-19 KR KR1020227017132A patent/KR20220070075A/ko not_active Application Discontinuation
- 2018-09-19 PT PT188592414T patent/PT3684423T/pt unknown
- 2018-09-19 RU RU2020113681A patent/RU2770922C2/ru active
- 2018-09-19 CN CN201880071752.3A patent/CN111836649A/zh active Pending
- 2018-09-19 CR CR20200165A patent/CR20200165A/es unknown
- 2018-09-19 BR BR112020005436-4A patent/BR112020005436B1/pt active IP Right Grant
- 2018-09-19 UA UAA202002445A patent/UA127455C2/uk unknown
- 2018-09-19 FI FIEP18859241.4T patent/FI3684423T3/fi active
- 2018-09-19 AU AU2018337833A patent/AU2018337833B2/en active Active
- 2018-09-19 ES ES18859241T patent/ES2948902T3/es active Active
- 2018-09-19 DK DK18859241.4T patent/DK3684423T5/da active
-
2020
- 2020-03-12 IL IL273261A patent/IL273261A/en unknown
- 2020-03-17 ZA ZA2020/01679A patent/ZA202001679B/en unknown
- 2020-03-19 PH PH12020550094A patent/PH12020550094A1/en unknown
- 2020-03-19 CL CL2020000728A patent/CL2020000728A1/es unknown
- 2020-04-17 CO CONC2020/0004738A patent/CO2020004738A2/es unknown
-
2021
- 2021-08-11 US US17/400,041 patent/US20210380643A1/en active Pending
-
2022
- 2022-04-12 US US17/718,870 patent/US11613766B2/en active Active
- 2022-12-21 US US18/069,701 patent/US11840704B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11840704B2 (en) | Adeno-associated virus variant capsids and methods of use thereof | |
EP3717636B1 (en) | Adeno-associated virus variant capsids and use for inhibiting angiogenesis | |
EP3445773B1 (en) | Adeno-associated virus variant capsids and methods of use thereof | |
JP6836999B2 (ja) | アデノ随伴ウイルス変異体及びその使用方法 | |
JP2022530457A (ja) | 遺伝子操作aav | |
CN116194154A (zh) | 使用aav载体的plakophilin-2(pkp2)基因疗法 | |
US20150045416A1 (en) | Methods and Compositions for Gene Delivery | |
EP3262065B1 (en) | Methods and compositions for treating dystroglycanopathy disorders | |
US20230374541A1 (en) | Recombinant adeno-associated viruses for cns or muscle delivery | |
EP4089171A1 (en) | Recombinant tert-encoding viral genomes and vectors | |
WO2020187272A1 (zh) | 一种用于基因治疗的融合蛋白及其应用 | |
US20240335560A1 (en) | Adeno-associated virus variant capsids and use for inhibiting angiogenesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |