KR20220066225A - 선택적 유전자 조절을 위한 조성물 및 방법 - Google Patents
선택적 유전자 조절을 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR20220066225A KR20220066225A KR1020217043048A KR20217043048A KR20220066225A KR 20220066225 A KR20220066225 A KR 20220066225A KR 1020217043048 A KR1020217043048 A KR 1020217043048A KR 20217043048 A KR20217043048 A KR 20217043048A KR 20220066225 A KR20220066225 A KR 20220066225A
- Authority
- KR
- South Korea
- Prior art keywords
- expression cassette
- seq
- sequence
- dbd
- binding site
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 303
- 238000000034 method Methods 0.000 title claims description 147
- 239000000203 mixture Substances 0.000 title description 11
- 230000033228 biological regulation Effects 0.000 title description 3
- 230000014509 gene expression Effects 0.000 claims abstract description 441
- 230000027455 binding Effects 0.000 claims abstract description 329
- 108060005874 Parvalbumin Proteins 0.000 claims abstract description 294
- 102000001675 Parvalbumin Human genes 0.000 claims abstract description 294
- 108700011259 MicroRNAs Proteins 0.000 claims abstract description 186
- 239000002679 microRNA Substances 0.000 claims abstract description 182
- 210000002569 neuron Anatomy 0.000 claims abstract description 81
- 102000040945 Transcription factor Human genes 0.000 claims abstract description 75
- 108091023040 Transcription factor Proteins 0.000 claims abstract description 75
- 210000004027 cell Anatomy 0.000 claims description 286
- 102000004169 proteins and genes Human genes 0.000 claims description 156
- 230000004568 DNA-binding Effects 0.000 claims description 134
- 230000001105 regulatory effect Effects 0.000 claims description 120
- 102000040430 polynucleotide Human genes 0.000 claims description 119
- 108091033319 polynucleotide Proteins 0.000 claims description 119
- 239000002157 polynucleotide Substances 0.000 claims description 119
- 239000011701 zinc Substances 0.000 claims description 118
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 117
- 229910052725 zinc Inorganic materials 0.000 claims description 117
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 108
- 239000012634 fragment Substances 0.000 claims description 103
- 108700019146 Transgenes Proteins 0.000 claims description 93
- 241000282414 Homo sapiens Species 0.000 claims description 71
- 108091028049 Mir-221 microRNA Proteins 0.000 claims description 60
- 201000010099 disease Diseases 0.000 claims description 58
- 241000700605 Viruses Species 0.000 claims description 55
- 239000002773 nucleotide Substances 0.000 claims description 53
- 125000003729 nucleotide group Chemical group 0.000 claims description 52
- 101000944074 Homo sapiens Cbp/p300-interacting transactivator 4 Proteins 0.000 claims description 50
- 239000013603 viral vector Substances 0.000 claims description 48
- 208000035475 disorder Diseases 0.000 claims description 45
- 206010010904 Convulsion Diseases 0.000 claims description 44
- 101000944098 Homo sapiens Cbp/p300-interacting transactivator 2 Proteins 0.000 claims description 44
- 102100033487 Cbp/p300-interacting transactivator 4 Human genes 0.000 claims description 43
- 101000896450 Homo sapiens Early growth response protein 3 Proteins 0.000 claims description 42
- 108091061917 miR-221 stem-loop Proteins 0.000 claims description 42
- 108091063489 miR-221-1 stem-loop Proteins 0.000 claims description 42
- 108091055391 miR-221-2 stem-loop Proteins 0.000 claims description 42
- 108091031076 miR-221-3 stem-loop Proteins 0.000 claims description 42
- 101001049697 Homo sapiens Early growth response protein 1 Proteins 0.000 claims description 41
- 108091070946 miR-128 stem-loop Proteins 0.000 claims description 41
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 39
- 102100033471 Cbp/p300-interacting transactivator 2 Human genes 0.000 claims description 36
- 108020005004 Guide RNA Proteins 0.000 claims description 32
- 101000631760 Homo sapiens Sodium channel protein type 1 subunit alpha Proteins 0.000 claims description 32
- 101710163270 Nuclease Proteins 0.000 claims description 31
- 108020004414 DNA Proteins 0.000 claims description 30
- 206010015037 epilepsy Diseases 0.000 claims description 29
- 101710185494 Zinc finger protein Proteins 0.000 claims description 27
- 102100023597 Zinc finger protein 816 Human genes 0.000 claims description 27
- 230000001965 increasing effect Effects 0.000 claims description 27
- 230000035772 mutation Effects 0.000 claims description 27
- 208000024891 symptom Diseases 0.000 claims description 27
- 102100026398 Cyclic AMP-responsive element-binding protein 3 Human genes 0.000 claims description 25
- 101000855520 Homo sapiens Cyclic AMP-responsive element-binding protein 3 Proteins 0.000 claims description 25
- 101710149136 Protein Vpr Proteins 0.000 claims description 25
- 210000003169 central nervous system Anatomy 0.000 claims description 24
- 208000011580 syndromic disease Diseases 0.000 claims description 24
- 230000002964 excitative effect Effects 0.000 claims description 23
- 102100028910 Sodium channel protein type 1 subunit alpha Human genes 0.000 claims description 21
- JLRGJRBPOGGCBT-UHFFFAOYSA-N Tolbutamide Chemical group CCCCNC(=O)NS(=O)(=O)C1=CC=C(C)C=C1 JLRGJRBPOGGCBT-UHFFFAOYSA-N 0.000 claims description 21
- 101000895309 Homo sapiens Cyclic AMP-responsive element-binding protein 3-like protein 4 Proteins 0.000 claims description 20
- 108091033409 CRISPR Proteins 0.000 claims description 19
- 241000288906 Primates Species 0.000 claims description 19
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 19
- 108091080321 miR-222 stem-loop Proteins 0.000 claims description 18
- 230000001537 neural effect Effects 0.000 claims description 16
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 101150016368 TAD1 gene Proteins 0.000 claims description 15
- -1 VP64 Proteins 0.000 claims description 15
- 208000015114 central nervous system disease Diseases 0.000 claims description 15
- 101100337966 Arabidopsis thaliana GSDA gene Proteins 0.000 claims description 14
- 101000799048 Homo sapiens Probable inactive tRNA-specific adenosine deaminase-like protein 3 Proteins 0.000 claims description 14
- 101000799057 Homo sapiens tRNA-specific adenosine deaminase 2 Proteins 0.000 claims description 14
- 241000713666 Lentivirus Species 0.000 claims description 14
- 208000012902 Nervous system disease Diseases 0.000 claims description 14
- 102100034006 Probable inactive tRNA-specific adenosine deaminase-like protein 3 Human genes 0.000 claims description 14
- 102100034045 tRNA-specific adenosine deaminase 2 Human genes 0.000 claims description 14
- 238000006467 substitution reaction Methods 0.000 claims description 13
- 239000003623 enhancer Substances 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 238000003780 insertion Methods 0.000 claims description 11
- 230000037431 insertion Effects 0.000 claims description 11
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 claims description 9
- 230000004064 dysfunction Effects 0.000 claims description 9
- 210000001320 hippocampus Anatomy 0.000 claims description 9
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 9
- 241000282693 Cercopithecidae Species 0.000 claims description 8
- 241000124008 Mammalia Species 0.000 claims description 8
- 230000001936 parietal effect Effects 0.000 claims description 7
- 229920001184 polypeptide Polymers 0.000 claims description 7
- 210000004556 brain Anatomy 0.000 claims description 6
- 210000005153 frontal cortex Anatomy 0.000 claims description 6
- 210000001222 gaba-ergic neuron Anatomy 0.000 claims description 6
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 claims description 5
- 241000282553 Macaca Species 0.000 claims description 5
- 241000282405 Pongo abelii Species 0.000 claims description 5
- 208000013403 hyperactivity Diseases 0.000 claims description 5
- 241001515942 marmosets Species 0.000 claims description 5
- 241000282575 Gorilla Species 0.000 claims description 4
- 241000282560 Macaca mulatta Species 0.000 claims description 4
- 241000282561 Macaca nemestrina Species 0.000 claims description 4
- 241000282577 Pan troglodytes Species 0.000 claims description 4
- 210000001130 astrocyte Anatomy 0.000 claims description 4
- 230000004777 loss-of-function mutation Effects 0.000 claims description 4
- 210000004498 neuroglial cell Anatomy 0.000 claims description 4
- 210000000278 spinal cord Anatomy 0.000 claims description 4
- 210000003594 spinal ganglia Anatomy 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 4
- 241000271897 Viperidae Species 0.000 claims description 2
- 210000001052 bipolar neuron Anatomy 0.000 claims description 2
- 210000003078 multipolar neuron Anatomy 0.000 claims description 2
- 210000004248 oligodendroglia Anatomy 0.000 claims description 2
- 210000004116 schwann cell Anatomy 0.000 claims description 2
- 210000001057 smooth muscle myoblast Anatomy 0.000 claims description 2
- 210000003242 unipolar neuron Anatomy 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 210000002919 epithelial cell Anatomy 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 201000007547 Dravet syndrome Diseases 0.000 abstract description 18
- 208000036572 Myoclonic epilepsy Diseases 0.000 abstract description 16
- 206010073677 Severe myoclonic epilepsy of infancy Diseases 0.000 abstract description 15
- 230000003827 upregulation Effects 0.000 abstract description 8
- 208000037765 diseases and disorders Diseases 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 145
- 150000007523 nucleic acids Chemical class 0.000 description 109
- 108090000144 Human Proteins Proteins 0.000 description 70
- 102000003839 Human Proteins Human genes 0.000 description 70
- 108091028043 Nucleic acid sequence Proteins 0.000 description 67
- 239000013598 vector Substances 0.000 description 53
- 239000002245 particle Substances 0.000 description 52
- 239000013604 expression vector Substances 0.000 description 48
- 230000003612 virological effect Effects 0.000 description 47
- 102000039446 nucleic acids Human genes 0.000 description 43
- 108020004707 nucleic acids Proteins 0.000 description 43
- 210000002845 virion Anatomy 0.000 description 41
- 238000011282 treatment Methods 0.000 description 37
- 238000004519 manufacturing process Methods 0.000 description 32
- 230000006870 function Effects 0.000 description 31
- 239000013612 plasmid Substances 0.000 description 31
- 102100021717 Early growth response protein 3 Human genes 0.000 description 27
- 239000008194 pharmaceutical composition Substances 0.000 description 24
- 102100023226 Early growth response protein 1 Human genes 0.000 description 22
- 230000005847 immunogenicity Effects 0.000 description 22
- 241000699670 Mus sp. Species 0.000 description 21
- 238000004806 packaging method and process Methods 0.000 description 21
- 108091026890 Coding region Proteins 0.000 description 20
- 238000001415 gene therapy Methods 0.000 description 20
- 210000001519 tissue Anatomy 0.000 description 20
- 235000001014 amino acid Nutrition 0.000 description 19
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 18
- 241001465754 Metazoa Species 0.000 description 18
- 210000000349 chromosome Anatomy 0.000 description 18
- 230000000694 effects Effects 0.000 description 18
- 230000007423 decrease Effects 0.000 description 17
- 239000013607 AAV vector Substances 0.000 description 16
- 101150022529 Scn1a gene Proteins 0.000 description 16
- 238000003556 assay Methods 0.000 description 16
- 238000002347 injection Methods 0.000 description 16
- 239000007924 injection Substances 0.000 description 16
- 230000002103 transcriptional effect Effects 0.000 description 16
- 125000003275 alpha amino acid group Chemical group 0.000 description 15
- 230000002829 reductive effect Effects 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 241000701161 unidentified adenovirus Species 0.000 description 15
- 108090000565 Capsid Proteins Proteins 0.000 description 14
- 102100023321 Ceruloplasmin Human genes 0.000 description 14
- 108020004999 messenger RNA Proteins 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 13
- 210000000234 capsid Anatomy 0.000 description 13
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 12
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 12
- 125000000539 amino acid group Chemical group 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 230000001225 therapeutic effect Effects 0.000 description 12
- 239000003981 vehicle Substances 0.000 description 12
- 241000702421 Dependoparvovirus Species 0.000 description 11
- 108010067390 Viral Proteins Proteins 0.000 description 11
- 208000002091 Febrile Seizures Diseases 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 9
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 9
- 230000002068 genetic effect Effects 0.000 description 9
- 238000003018 immunoassay Methods 0.000 description 9
- 230000001177 retroviral effect Effects 0.000 description 9
- 241001430294 unidentified retrovirus Species 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 8
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 8
- 208000024827 Alzheimer disease Diseases 0.000 description 8
- 238000011510 Elispot assay Methods 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 8
- 239000005090 green fluorescent protein Substances 0.000 description 8
- 238000000126 in silico method Methods 0.000 description 8
- 238000007914 intraventricular administration Methods 0.000 description 8
- 230000009437 off-target effect Effects 0.000 description 8
- 239000013608 rAAV vector Substances 0.000 description 8
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 7
- 241000282412 Homo Species 0.000 description 7
- 208000018737 Parkinson disease Diseases 0.000 description 7
- 108700009124 Transcription Initiation Site Proteins 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 238000007913 intrathecal administration Methods 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 230000004083 survival effect Effects 0.000 description 7
- 230000008685 targeting Effects 0.000 description 7
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 108020004485 Nonsense Codon Proteins 0.000 description 6
- 108010052164 Sodium Channels Proteins 0.000 description 6
- 102000018674 Sodium Channels Human genes 0.000 description 6
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 6
- 102000052687 human CITED4 Human genes 0.000 description 6
- 210000004962 mammalian cell Anatomy 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 241000701447 unidentified baculovirus Species 0.000 description 6
- 241001529453 unidentified herpesvirus Species 0.000 description 6
- 241000271566 Aves Species 0.000 description 5
- 108091006146 Channels Proteins 0.000 description 5
- 102100035857 Glutamate decarboxylase 2 Human genes 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- 101000873786 Homo sapiens Glutamate decarboxylase 2 Proteins 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 239000000356 contaminant Substances 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 230000037434 nonsense mutation Effects 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 108091006106 transcriptional activators Proteins 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 4
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 4
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 4
- 241000649045 Adeno-associated virus 10 Species 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 102100023227 E3 SUMO-protein ligase EGR2 Human genes 0.000 description 4
- 102100021720 Early growth response protein 4 Human genes 0.000 description 4
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 4
- 102100035902 Glutamate decarboxylase 1 Human genes 0.000 description 4
- 102100030087 Homeobox protein DLX-1 Human genes 0.000 description 4
- 102100022373 Homeobox protein DLX-5 Human genes 0.000 description 4
- 101001049692 Homo sapiens E3 SUMO-protein ligase EGR2 Proteins 0.000 description 4
- 101000896533 Homo sapiens Early growth response protein 4 Proteins 0.000 description 4
- 101000873546 Homo sapiens Glutamate decarboxylase 1 Proteins 0.000 description 4
- 101000864690 Homo sapiens Homeobox protein DLX-1 Proteins 0.000 description 4
- 101000901627 Homo sapiens Homeobox protein DLX-5 Proteins 0.000 description 4
- 102100025169 Max-binding protein MNT Human genes 0.000 description 4
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 4
- 101150111110 NKX2-1 gene Proteins 0.000 description 4
- 241001494479 Pecora Species 0.000 description 4
- 238000010459 TALEN Methods 0.000 description 4
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 4
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 101150063416 add gene Proteins 0.000 description 4
- 201000008181 benign familial infantile epilepsy Diseases 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 239000012636 effector Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000005714 functional activity Effects 0.000 description 4
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 4
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- 238000001476 gene delivery Methods 0.000 description 4
- 201000008186 generalized epilepsy with febrile seizures plus Diseases 0.000 description 4
- 238000003306 harvesting Methods 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000010172 mouse model Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 108091006107 transcriptional repressors Proteins 0.000 description 4
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 3
- 241000649046 Adeno-associated virus 11 Species 0.000 description 3
- 241000649047 Adeno-associated virus 12 Species 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- 108010060434 Co-Repressor Proteins Proteins 0.000 description 3
- 102000008169 Co-Repressor Proteins Human genes 0.000 description 3
- 241000699800 Cricetinae Species 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- 101710096438 DNA-binding protein Proteins 0.000 description 3
- 229920002307 Dextran Polymers 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 208000034308 Grand mal convulsion Diseases 0.000 description 3
- 208000026139 Memory disease Diseases 0.000 description 3
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 229920002873 Polyethylenimine Polymers 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000036760 body temperature Effects 0.000 description 3
- 210000003855 cell nucleus Anatomy 0.000 description 3
- 230000008045 co-localization Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000001268 conjugating effect Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000006735 deficit Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 230000001037 epileptic effect Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 206010016284 febrile convulsion Diseases 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 230000000971 hippocampal effect Effects 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 238000003364 immunohistochemistry Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000000099 in vitro assay Methods 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 210000001926 inhibitory interneuron Anatomy 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000003094 microcapsule Substances 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000004770 neurodegeneration Effects 0.000 description 3
- 230000009871 nonspecific binding Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 3
- 230000001144 postural effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000069 prophylactic effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000009885 systemic effect Effects 0.000 description 3
- 238000003151 transfection method Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 208000000044 Amnesia Diseases 0.000 description 2
- 241000272525 Anas platyrhynchos Species 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 206010003805 Autism Diseases 0.000 description 2
- 208000020706 Autistic disease Diseases 0.000 description 2
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 2
- 241000714266 Bovine leukemia virus Species 0.000 description 2
- 208000014644 Brain disease Diseases 0.000 description 2
- 206010059027 Brugada syndrome Diseases 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 206010012559 Developmental delay Diseases 0.000 description 2
- 102100037985 Dickkopf-related protein 3 Human genes 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 208000032274 Encephalopathy Diseases 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 241000713730 Equine infectious anemia virus Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241000713800 Feline immunodeficiency virus Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 208000003078 Generalized Epilepsy Diseases 0.000 description 2
- 241001272567 Hominoidea Species 0.000 description 2
- 101000951342 Homo sapiens Dickkopf-related protein 3 Proteins 0.000 description 2
- 101000852596 Homo sapiens Inositol-trisphosphate 3-kinase A Proteins 0.000 description 2
- 101000880310 Homo sapiens SH3 and cysteine-rich domain-containing protein Proteins 0.000 description 2
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 2
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 2
- 206010020843 Hyperthermia Diseases 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 102100027004 Inhibin beta A chain Human genes 0.000 description 2
- 102100036405 Inositol-trisphosphate 3-kinase A Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 101150008942 J gene Proteins 0.000 description 2
- 108700021430 Kruppel-Like Factor 4 Proteins 0.000 description 2
- 241000282567 Macaca fascicularis Species 0.000 description 2
- 208000019695 Migraine disease Diseases 0.000 description 2
- 208000000060 Migraine with aura Diseases 0.000 description 2
- 208000016285 Movement disease Diseases 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 101100058900 Mus musculus Ca12 gene Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 206010061334 Partial seizures Diseases 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- 108010007568 Protamines Proteins 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 102100037646 SH3 and cysteine-rich domain-containing protein Human genes 0.000 description 2
- 101150064913 SV2B gene Proteins 0.000 description 2
- 101150112804 SYT17 gene Proteins 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 101150028062 Slc17a7 gene Proteins 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 102100036415 Synaptotagmin-17 Human genes 0.000 description 2
- 208000034799 Tauopathies Diseases 0.000 description 2
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 230000000573 anti-seizure effect Effects 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000006736 behavioral deficit Effects 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 210000005056 cell body Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 230000003920 cognitive function Effects 0.000 description 2
- 231100000870 cognitive problem Toxicity 0.000 description 2
- 238000009295 crossflow filtration Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 210000001947 dentate gyrus Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 210000005064 dopaminergic neuron Anatomy 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 241001493065 dsRNA viruses Species 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 108700004025 env Genes Proteins 0.000 description 2
- 230000008029 eradication Effects 0.000 description 2
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 208000014205 familial febrile seizures Diseases 0.000 description 2
- 206010067039 familial hemiplegic migraine Diseases 0.000 description 2
- 238000013230 female C57BL/6J mice Methods 0.000 description 2
- 230000003371 gabaergic effect Effects 0.000 description 2
- 108700004026 gag Genes Proteins 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 238000009650 gentamicin protection assay Methods 0.000 description 2
- 238000011194 good manufacturing practice Methods 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000000688 human artificial chromosome Anatomy 0.000 description 2
- 230000036031 hyperthermia Effects 0.000 description 2
- 230000002977 hyperthermial effect Effects 0.000 description 2
- 201000001993 idiopathic generalized epilepsy Diseases 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 108010019691 inhibin beta A subunit Proteins 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000011813 knockout mouse model Methods 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 230000013016 learning Effects 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000012092 media component Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000002483 medication Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004779 membrane envelope Anatomy 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 210000000274 microglia Anatomy 0.000 description 2
- 206010027599 migraine Diseases 0.000 description 2
- 230000007659 motor function Effects 0.000 description 2
- 210000002161 motor neuron Anatomy 0.000 description 2
- 208000005264 motor neuron disease Diseases 0.000 description 2
- 230000000926 neurological effect Effects 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 108700004029 pol Genes Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 2
- 230000002028 premature Effects 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 101150066583 rep gene Proteins 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 208000002320 spinal muscular atrophy Diseases 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000008174 sterile solution Substances 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 210000005167 vascular cell Anatomy 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- 102100032282 26S proteasome non-ATPase regulatory subunit 14 Human genes 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 102100033282 ADP-ribosylation factor GTPase-activating protein 2 Human genes 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 241000300529 Adeno-associated virus 13 Species 0.000 description 1
- 206010001497 Agitation Diseases 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 102000013455 Amyloid beta-Peptides Human genes 0.000 description 1
- 108010090849 Amyloid beta-Peptides Proteins 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 206010003062 Apraxia Diseases 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 206010003658 Atrial Fibrillation Diseases 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 102100027878 Bardet-Biedl syndrome 5 protein Human genes 0.000 description 1
- 102100028282 Bile salt export pump Human genes 0.000 description 1
- 201000009707 Brugada syndrome 1 Diseases 0.000 description 1
- 208000005079 Brugada syndrome 5 Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 101710186200 CCAAT/enhancer-binding protein Proteins 0.000 description 1
- 101150061077 CERS6 gene Proteins 0.000 description 1
- 238000010454 CRISPR gRNA design Methods 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101100011365 Caenorhabditis elegans egl-13 gene Proteins 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 241000713756 Caprine arthritis encephalitis virus Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 101710182302 Cbp/p300-interacting transactivator 2 Proteins 0.000 description 1
- 101710182300 Cbp/p300-interacting transactivator 4 Proteins 0.000 description 1
- 102100035434 Ceramide synthase 6 Human genes 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000004051 Chronic Traumatic Encephalopathy Diseases 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102100029653 Cordon-bleu protein-like 1 Human genes 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 102100031061 Cysteine/serine-rich nuclear protein 3 Human genes 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 101150026402 DBP gene Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 102100036504 Dehydrogenase/reductase SDR family member 9 Human genes 0.000 description 1
- 206010012335 Dependence Diseases 0.000 description 1
- 208000012239 Developmental disease Diseases 0.000 description 1
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101150029662 E1 gene Proteins 0.000 description 1
- 102100037237 E3 ubiquitin-protein ligase UBR3 Human genes 0.000 description 1
- 108010051542 Early Growth Response Protein 1 Proteins 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 102100037789 FAST kinase domain-containing protein 1, mitochondrial Human genes 0.000 description 1
- 102100037010 Fidgetin Human genes 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 208000000666 Fowlpox Diseases 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108010008945 General Transcription Factors Proteins 0.000 description 1
- 102000006580 General Transcription Factors Human genes 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- 101710088083 Glomulin Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102100023911 Growth factor receptor-bound protein 14 Human genes 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 206010019468 Hemiplegia Diseases 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000590281 Homo sapiens 26S proteasome non-ATPase regulatory subunit 14 Proteins 0.000 description 1
- 101000927511 Homo sapiens ADP-ribosylation factor GTPase-activating protein 2 Proteins 0.000 description 1
- 101000697666 Homo sapiens Bardet-Biedl syndrome 5 protein Proteins 0.000 description 1
- 101000939779 Homo sapiens Cordon-bleu protein-like 1 Proteins 0.000 description 1
- 101000922013 Homo sapiens Cysteine/serine-rich nuclear protein 3 Proteins 0.000 description 1
- 101000928746 Homo sapiens Dehydrogenase/reductase SDR family member 9 Proteins 0.000 description 1
- 101000908391 Homo sapiens Dipeptidyl peptidase 4 Proteins 0.000 description 1
- 101000878541 Homo sapiens FAST kinase domain-containing protein 1, mitochondrial Proteins 0.000 description 1
- 101000878296 Homo sapiens Fidgetin Proteins 0.000 description 1
- 101000904875 Homo sapiens Growth factor receptor-bound protein 14 Proteins 0.000 description 1
- 101001015064 Homo sapiens Integrin beta-6 Proteins 0.000 description 1
- 101001006875 Homo sapiens Kelch-like protein 23 Proteins 0.000 description 1
- 101001027192 Homo sapiens Kelch-like protein 41 Proteins 0.000 description 1
- 101000711455 Homo sapiens Kinetochore protein Spc25 Proteins 0.000 description 1
- 101000583016 Homo sapiens Myosin-IIIb Proteins 0.000 description 1
- 101001091194 Homo sapiens Peptidyl-prolyl cis-trans isomerase G Proteins 0.000 description 1
- 101000886179 Homo sapiens Polypeptide N-acetylgalactosaminyltransferase 3 Proteins 0.000 description 1
- 101001067140 Homo sapiens Porphobilinogen deaminase Proteins 0.000 description 1
- 101001047090 Homo sapiens Potassium voltage-gated channel subfamily H member 2 Proteins 0.000 description 1
- 101000884614 Homo sapiens Protein CFAP210 Proteins 0.000 description 1
- 101001071164 Homo sapiens Pyridoxal phosphate phosphatase PHOSPHO2 Proteins 0.000 description 1
- 101000668165 Homo sapiens RNA-binding motif, single-stranded-interacting protein 1 Proteins 0.000 description 1
- 101000701497 Homo sapiens STE20/SPS1-related proline-alanine-rich protein kinase Proteins 0.000 description 1
- 101001126009 Homo sapiens Secretory phospholipase A2 receptor Proteins 0.000 description 1
- 101000684826 Homo sapiens Sodium channel protein type 2 subunit alpha Proteins 0.000 description 1
- 101000684820 Homo sapiens Sodium channel protein type 3 subunit alpha Proteins 0.000 description 1
- 101000694025 Homo sapiens Sodium channel protein type 7 subunit alpha Proteins 0.000 description 1
- 101000654386 Homo sapiens Sodium channel protein type 9 subunit alpha Proteins 0.000 description 1
- 101000595526 Homo sapiens T-box brain protein 1 Proteins 0.000 description 1
- 101000658648 Homo sapiens Tetratricopeptide repeat protein 21B Proteins 0.000 description 1
- 101001012529 Homo sapiens rRNA N6-adenosine-methyltransferase METTL5 Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 108010044240 IFIH1 Interferon-Induced Helicase Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100033011 Integrin beta-6 Human genes 0.000 description 1
- 102100027353 Interferon-induced helicase C domain-containing protein 1 Human genes 0.000 description 1
- 102100027795 Kelch-like protein 23 Human genes 0.000 description 1
- 102100037644 Kelch-like protein 41 Human genes 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 102100022742 Lupus La protein Human genes 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 108010093662 Member 11 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 1
- 208000019022 Mood disease Diseases 0.000 description 1
- 208000026072 Motor neurone disease Diseases 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 208000008238 Muscle Spasticity Diseases 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 102100030369 Myosin-IIIb Human genes 0.000 description 1
- 101150011840 NOSTRIN gene Proteins 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 241000714209 Norwalk virus Species 0.000 description 1
- 102100039030 Nostrin Human genes 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 208000021384 Obsessive-Compulsive disease Diseases 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102100035593 POU domain, class 2, transcription factor 1 Human genes 0.000 description 1
- 101710084414 POU domain, class 2, transcription factor 1 Proteins 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 208000027089 Parkinsonian disease Diseases 0.000 description 1
- 206010034010 Parkinsonism Diseases 0.000 description 1
- 102100034850 Peptidyl-prolyl cis-trans isomerase G Human genes 0.000 description 1
- CXOFVDLJLONNDW-UHFFFAOYSA-N Phenytoin Chemical compound N1C(=O)NC(=O)C1(C=1C=CC=CC=1)C1=CC=CC=C1 CXOFVDLJLONNDW-UHFFFAOYSA-N 0.000 description 1
- 241000425347 Phyla <beetle> Species 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 101710093976 Plasmid-derived single-stranded DNA-binding protein Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 102100039685 Polypeptide N-acetylgalactosaminyltransferase 3 Human genes 0.000 description 1
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 1
- 102100022807 Potassium voltage-gated channel subfamily H member 2 Human genes 0.000 description 1
- 208000032319 Primary lateral sclerosis Diseases 0.000 description 1
- 102100023832 Prolyl endopeptidase FAP Human genes 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 102100038136 Protein CFAP210 Human genes 0.000 description 1
- 206010037213 Psychomotor retardation Diseases 0.000 description 1
- 208000028017 Psychotic disease Diseases 0.000 description 1
- 102100025793 Putative sodium-coupled neutral amino acid transporter 11 Human genes 0.000 description 1
- 102100036843 Pyridoxal phosphate phosphatase PHOSPHO2 Human genes 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 102100039692 RNA-binding motif, single-stranded-interacting protein 1 Human genes 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 206010038997 Retroviral infections Diseases 0.000 description 1
- 241000712907 Retroviridae Species 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 101150057235 SCN1B gene Proteins 0.000 description 1
- 101150086694 SLC22A3 gene Proteins 0.000 description 1
- 108091006931 SLC38A11 Proteins 0.000 description 1
- 108091006265 SLC4A10 Proteins 0.000 description 1
- 102100030491 STE20/SPS1-related proline-alanine-rich protein kinase Human genes 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 102100029392 Secretory phospholipase A2 receptor Human genes 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100023776 Signal peptidase complex subunit 2 Human genes 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 1
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 1
- 208000032140 Sleepiness Diseases 0.000 description 1
- 102100023150 Sodium channel protein type 2 subunit alpha Human genes 0.000 description 1
- 102100023720 Sodium channel protein type 3 subunit alpha Human genes 0.000 description 1
- 102100027190 Sodium channel protein type 7 subunit alpha Human genes 0.000 description 1
- 102100031367 Sodium channel protein type 9 subunit alpha Human genes 0.000 description 1
- 102000006633 Sodium-Bicarbonate Symporters Human genes 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 206010041349 Somnolence Diseases 0.000 description 1
- 241000713675 Spumavirus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 102000001435 Synapsin Human genes 0.000 description 1
- 108050009621 Synapsin Proteins 0.000 description 1
- 102100036083 T-box brain protein 1 Human genes 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 102100034908 Tetratricopeptide repeat protein 21B Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 208000030886 Traumatic Brain injury Diseases 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 208000026911 Tuberous sclerosis complex Diseases 0.000 description 1
- 101150008036 UL29 gene Proteins 0.000 description 1
- 101150011902 UL52 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 206010046298 Upper motor neurone lesion Diseases 0.000 description 1
- 108091034131 VA RNA Proteins 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000713325 Visna/maedi virus Species 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000036982 action potential Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229960003965 antiepileptics Drugs 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 229910052586 apatite Inorganic materials 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 208000029560 autism spectrum disease Diseases 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 229960000686 benzalkonium chloride Drugs 0.000 description 1
- CADWTSSKOVRVJC-UHFFFAOYSA-N benzyl(dimethyl)azanium;chloride Chemical compound [Cl-].C[NH+](C)CC1=CC=CC=C1 CADWTSSKOVRVJC-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- HUTDDBSSHVOYJR-UHFFFAOYSA-H bis[(2-oxo-1,3,2$l^{5},4$l^{2}-dioxaphosphaplumbetan-2-yl)oxy]lead Chemical compound [Pb+2].[Pb+2].[Pb+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O HUTDDBSSHVOYJR-UHFFFAOYSA-H 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 230000007177 brain activity Effects 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229960000623 carbamazepine Drugs 0.000 description 1
- FFGPTBGBLSHEPO-UHFFFAOYSA-N carbamazepine Chemical compound C1=CC2=CC=CC=C2N(C(=O)N)C2=CC=CC=C21 FFGPTBGBLSHEPO-UHFFFAOYSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000011128 cardiac conduction Effects 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 238000000423 cell based assay Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 210000001612 chondrocyte Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 208000017004 dementia pugilistica Diseases 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 229940090124 dipeptidyl peptidase 4 (dpp-4) inhibitors for blood glucose lowering Drugs 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 201000009028 early myoclonic encephalopathy Diseases 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 210000003989 endothelium vascular Anatomy 0.000 description 1
- 101150030339 env gene Proteins 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 230000010326 executive functioning Effects 0.000 description 1
- 201000007830 familial atrial fibrillation Diseases 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 201000007186 focal epilepsy Diseases 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 101150098622 gag gene Proteins 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- 230000005099 host tropism Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 239000010954 inorganic particle Substances 0.000 description 1
- 206010022437 insomnia Diseases 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003585 interneuronal effect Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000001738 isopycnic centrifugation Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000032297 kinesis Effects 0.000 description 1
- 229960000448 lactic acid Drugs 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 201000010901 lateral sclerosis Diseases 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 101150111214 lin-28 gene Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000001767 medulla oblongata Anatomy 0.000 description 1
- 230000008384 membrane barrier Effects 0.000 description 1
- 230000006984 memory degeneration Effects 0.000 description 1
- 230000006993 memory improvement Effects 0.000 description 1
- 208000023060 memory loss Diseases 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 201000000585 muscular atrophy Diseases 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 230000002151 myoclonic effect Effects 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 238000001728 nano-filtration Methods 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 239000007908 nanoemulsion Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 230000008587 neuronal excitability Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 208000021090 palsy Diseases 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- VSIIXMUUUJUKCM-UHFFFAOYSA-D pentacalcium;fluoride;triphosphate Chemical compound [F-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O VSIIXMUUUJUKCM-UHFFFAOYSA-D 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 229960002036 phenytoin Drugs 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 101150088264 pol gene Proteins 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000004926 polymethyl methacrylate Substances 0.000 description 1
- 108010055896 polyornithine Proteins 0.000 description 1
- 229920002714 polyornithine Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 229940070353 protamines Drugs 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 210000002763 pyramidal cell Anatomy 0.000 description 1
- 102100029739 rRNA N6-adenosine-methyltransferase METTL5 Human genes 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 102220285550 rs730881360 Human genes 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 239000002047 solid lipid nanoparticle Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 208000018198 spasticity Diseases 0.000 description 1
- 208000020431 spinal cord injury Diseases 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- SFVFIFLLYFPGHH-UHFFFAOYSA-M stearalkonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CC1=CC=CC=C1 SFVFIFLLYFPGHH-UHFFFAOYSA-M 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 208000003265 stomatitis Diseases 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 210000003699 striated muscle Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 201000008914 temporal lobe epilepsy Diseases 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000009529 traumatic brain injury Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 208000009999 tuberous sclerosis Diseases 0.000 description 1
- 101150113424 ubr3 gene Proteins 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 150000003751 zinc Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/08—Antiepileptics; Anticonvulsants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/14—Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
- A61P25/16—Anti-Parkinson drugs
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4705—Regulators; Modulating activity stimulating, promoting or activating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/71—Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/32—Special delivery means, e.g. tissue-specific
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10344—Chimeric viral vector comprising heterologous viral elements for production of another viral vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14171—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/007—Vectors comprising a special translation-regulating system cell or tissue specific
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Pain & Pain Management (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- Psychology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
SCN1a의 선택적 상향조절을 위한 조작된 전사 인자 및 질환 및 장애, 예컨대 드라베 증후군을 치료하기 위한 그의 용도가 본원에 제공된다. 또한, 마이크로RNA 결합 부위 및 파르브알부민 뉴런에서의 선택적 발현을 위한 그의 용도가 제공된다.
Description
상호 참조
본 출원은 2019년 5월 29일에 출원된 미국 특허 가출원 번호 62/854,238; 2019년 6월 5일에 출원된 미국 특허 가출원 번호 62/857,727; 및 2020년 4월 10일에 출원된 미국 특허 가출원 번호 63/008,569를 우선권 주장하며, 이들 각각은 그 전문이 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 함유하며, 이는 그 전문이 본원에 참조로 포함된다. 2020년 5월 28일에 생성된 상기 ASCII 카피는 파일명이 46482-724_601_SL.txt이고, 크기가 418,483 바이트이다.
광범위한 인간 질환은 유전자의 비정상적 발현과 연관된다. 일부 경우에, 유전자 내의 유전자 돌연변이는 유전자가 이상조절되거나, 하향조절되거나 또는 전혀 발현되지 않도록 하여, 반수체기능부전을 초래한다. 일부 경우에, 유전자 내의 유전자 돌연변이는 유전자가 상향조절되도록 하여, 유전자의 과다발현을 초래한다. 유전 장애 또는 질환을 치료하는데 많은 도전과제가 존재한다. 하나의 접근법은 환자 세포 내로의 핵산의 치료적 전달을 수반하는 유전자 요법이다. 그러나, 유전자 요법과 연관된 다양한 도전과제, 예컨대 유전자 요법에 의해 도출된 원치않는 면역 반응, 오프-타겟 효과, 유전자 요법 비히클 (예를 들어, 바이러스)의 클로닝 능력에 대한 한계, 보다 긴 기간에 걸친 치료 효과의 지속 등은 여전히 해결되지 않고 있다. 중추 신경계 (CNS)는 유전자 및/또는 단백질 발현의 근본적인 손상을 다루는 요법의 개발을 위한 많은 고유한 도전과제를 제기한다. CNS 질환/장애의 증상의 관리를 돕는 약물이 있지만, 많은 CNS 질환/장애, 예를 들어 드라베 증후군은 특이적 치료법 또는 치유법이 없다. 따라서, 질환 또는 장애의 영향을 역전시키는 것을 돕기 위해 임의의 내인성 유전자의 발현을 조정할 수 있는 신규 조성물 및 방법, 특히 감소된 면역원성, 감소된 오프-타겟 효과, 표적 유전자에 대한 증가된 특이성 및/또는 증가된 치료 효능을 갖는 요법에 대한 필요가 존재한다.
한 측면에서, 본 출원은 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함하는 발현 카세트이며, 여기서 비-자연 발생 전사 인자는 적어도 2개의 전사 활성화 도메인 (TAD)에 작동가능하게 연결된 DNA 결합 도메인 (DBD)을 포함하고 이들은 하기 방식: TAD1-TAD2-DBD, DBD-TAD3-TAD4 또는 TAD1-TAD2-DBD-TAD3-TAD4로 연결된 것인 발현 카세트를 제공한다. 특정 실시양태에서, TAD1, TAD2, TAD3 및 TAD4는 하기: VP16, VP64, Viper, CITED2, CITED4, CREB3 또는 그의 기능적 단편으로부터 독립적으로 선택된다. 특정 실시양태에서, TAD1 및 TAD2는 동일한 TAD이다. 특정 실시양태에서, TAD1 및 TAD2는 CITED2 또는 그의 기능적 단편이다. 특정 실시양태에서, TAD1 및 TAD2는 CITED4 또는 그의 기능적 단편이다. 특정 실시양태에서, TAD3 및 TAD4는 동일한 TAD이다. 특정 실시양태에서, TAD3 및 TAD4는 CITED2 또는 그의 기능적 단편이다. 특정 실시양태에서, TAD3 및 TAD4는 CITED4 또는 그의 기능적 단편이다. 특정 실시양태에서, TAD1, TAD2, TAD3 및 TAD4는 동일한 TAD이다. 특정 실시양태에서, TAD1, TAD2, TAD3 및 TAD4는 CITED2 또는 그의 기능적 단편이다. 특정 실시양태에서, TAD1, TAD2, TAD3 및 TAD4는 CITED4 또는 그의 기능적 단편이다.
특정 실시양태에서, 적어도 2개의 TAD 도메인 사이에 링커가 없다.
특정 실시양태에서, 적어도 2개의 TAD 도메인 사이에 링커가 있다. 특정 실시양태에서, 링커는 GGSGGGSG (서열식별번호: 177) 또는 GGSGGGSGGGSGGGSG (서열식별번호: 178)를 포함하거나 그로 이루어진다.
특정 실시양태에서, DBD는 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다.
특정 실시양태에서, DBD는 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함한다. 특정 실시양태에서, DBD는 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함한다. 특정 실시양태에서, DBD 및 적어도 2개의 TAD는 각각 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함한다. 특정 실시양태에서, DBD 및 적어도 2개의 TAD는 각각 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함한다.
특정 실시양태에서, DBD는 가이드 RNA 및 뉴클레아제 불활성화된 Cas 단백질을 포함한다. 특정 실시양태에서, 뉴클레아제 불활성화된 Cas 단백질은 뉴클레아제 불활성화된 Cas9이다.
특정 실시양태에서, DBD는 아연 핑거 도메인을 포함한다. 특정 실시양태에서, DBD는 6 내지 9개의 아연 핑거 도메인을 포함한다. 특정 실시양태에서, DBD는 6개의 아연 핑거를 포함한다. 특정 실시양태에서, DBD는 18개의 뉴클레오티드를 갖는 게놈 영역에 결합한다. 특정 실시양태에서, DBD는 9개의 아연 핑거를 포함한다. 특정 실시양태에서, DBD는 27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다.
특정 실시양태에서, DBD는 서열식별번호: 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DBD는 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함한다.
특정 실시양태에서, DBD는 인간 EGR1 또는 인간 EGR3으로부터 유래된다.
특정 실시양태에서, DBD는 서열식별번호: 77-98 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DBD는 서열식별번호: 77-98을 포함한다.
특정 실시양태에서, DBD는 서열식별번호: 92에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DBD는 서열식별번호: 92를 포함한다.
특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 130 또는 131에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 130 또는 131을 포함한다.
특정 실시양태에서, 발현 카세트는 서열식별번호: 72 또는 73 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 발현 카세트는 서열식별번호: 72 또는 73 중 어느 하나의 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 발현 카세트는 다른 세포 유형에서보다 PV 뉴런에서 더 높은 수준으로 전사 인자의 발현을 구동하는 조절 요소를 추가로 포함한다. 특정 실시양태에서, 조절 요소는 서열식별번호: 1-4 중 어느 하나를 포함한다. 특정 실시양태에서, 조절 요소는 서열식별번호: 2 또는 3을 포함한다.
특정 실시양태에서, 발현 카세트는 PV 선택적 마이크로RNA 결합 부위를 추가로 포함한다. 특정 실시양태에서, PV 선택적 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일성을 포함한다. 특정 실시양태에서, PV 선택적 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15 중 어느 하나를 포함한다.
특정 실시양태에서, 발현 카세트는 바이러스 벡터의 일부이다. 특정 실시양태에서, 바이러스 벡터는 AAV 바이러스이다. 특정 실시양태에서, AAV 바이러스는 AAV9 바이러스 또는 scAAV9 바이러스이다. 특정 실시양태에서, 바이러스 벡터는 렌티바이러스이다.
또 다른 측면에서, 본 출원은 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함하는 발현 카세트이며, 여기서 비-자연 발생 전사 인자는 전사 활성화 도메인에 작동가능하게 연결된 DNA 결합 도메인을 포함하고, 여기서 DNA 결합 도메인은 서열 LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (서열식별번호: 147)를 포함하는 아연 핑거 단백질이고, DNA 결합 도메인과 전사 활성화 도메인 사이에 HA 태그 (서열식별번호: 303)가 없는 것인 발현 카세트를 제공한다. 특정 실시양태에서, 전사 활성화 도메인은 VP16, VPR 또는 VP64 서열 또는 그의 기능적 단편을 포함한다. 특정 실시양태에서, 전사 활성화 도메인은 VP64를 포함한다.
특정 실시양태에서, DNA 결합 도메인은 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다. 특정 실시양태에서, DNA 결합 도메인은 n = 6 내지 9인 서열식별번호: 147을 포함하는 아연 핑거 도메인이다. 특정 실시양태에서, DNA 결합 도메인은 n = 6인 서열식별번호: 147을 포함하는 아연 핑거 도메인이다. 특정 실시양태에서, DNA 결합 도메인은 18개의 뉴클레오티드를 갖는 게놈 영역에 결합한다. 특정 실시양태에서, DNA 결합 도메인은 n = 9인 서열식별번호: 147을 포함하는 아연 핑거 도메인이다. 특정 실시양태에서, DNA 결합 도메인은 27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다.
특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함한다.
특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 77-91 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 77-91 중 어느 하나를 포함한다.
특정 실시양태에서, 발현 카세트는 다른 세포 유형에서보다 PV 뉴런에서 더 높은 수준으로 전사 인자의 발현을 구동하는 조절 요소를 추가로 포함한다. 특정 실시양태에서, 조절 요소는 서열식별번호: 1-4 중 어느 하나를 포함한다. 특정 실시양태에서, 조절 요소는 서열식별번호: 2 또는 3을 포함한다.
특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 127에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 127을 포함한다.
특정 실시양태에서, 발현 카세트는 서열식별번호: 93 또는 71 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 발현 카세트는 서열식별번호: 93 또는 71 중 어느 하나의 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 발현 카세트는 PV 선택적 마이크로RNA 결합 부위를 추가로 포함한다. 특정 실시양태에서, PV 선택적 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일성을 포함한다. 특정 실시양태에서, PV 선택적 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15 중 어느 하나를 포함한다.
특정 실시양태에서, 발현 카세트는 바이러스 벡터의 일부이다. 특정 실시양태에서, 바이러스 벡터는 AAV 바이러스이다. 특정 실시양태에서, AAV 바이러스는 AAV9 바이러스 또는 scAAV9 바이러스이다. 특정 실시양태에서, 바이러스 벡터는 렌티바이러스이다.
또 다른 측면에서, 본 출원은 서열식별번호: 14 또는 15에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드이며, 여기서 마이크로RNA 결합 부위는 흥분성 뉴런에서 트랜스진의 발현을 감소시키는 것인 폴리뉴클레오티드를 제공한다. 특정 실시양태에서, PV 선택적 마이크로RNA 결합 부위는 서열식별번호: 14를 포함한다. 특정 실시양태에서, PV 선택적 마이크로RNA 결합 부위는 서열식별번호: 15를 포함한다. 또 다른 측면에서, 본 출원은 PV 선택적 마이크로RNA 결합 부위 및 프로모터 및/또는 인핸서를 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 프로모터 및/또는 인핸서는 다른 세포 유형에서보다 파르브알부민 (PV) 뉴런에서 더 높은 수준으로 트랜스진의 발현을 구동하는 PV 선택적 조절 요소이다. 특정 실시양태에서, PV 선택적 조절 요소는 트랜스진에 작동가능하게 연결된다.
또 다른 측면에서, 본 출원은 트랜스진에 작동가능하게 연결된 조절 요소 및 적어도 1개의 마이크로RNA 결합 부위를 포함하는 발현 카세트이며, 여기서 조절 요소는 다른 세포 유형에서보다 파르브알부민 (PV) 뉴런에서 더 높은 수준으로 트랜스진의 발현을 구동하고, 여기서 마이크로RNA 결합 부위는 흥분성 뉴런에서 트랜스진의 발현을 감소시키는 것인 발현 카세트를 제공한다. 특정 실시양태에서, 발현 카세트는 서열식별번호: 67을 포함하지 않는다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위 및 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위, MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위 및 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15를 포함한다.
특정 실시양태에서, 트랜스진은 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 포함하는 폴리펩티드를 코딩한다. 특정 실시양태에서, 전사 인자는 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다. 특정 실시양태에서, 전사 인자는 DNA 결합 도메인을 포함한다. 특정 실시양태에서, 전사 인자는 DNA 결합 도메인 및 전사 활성화 도메인을 포함한다.
특정 실시양태에서, DNA 결합 도메인은 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함한다. 특정 실시양태에서, DNA 결합 도메인 및 전사 활성화 도메인은 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함한다. 특정 실시양태에서, DNA 결합 도메인 및 전사 활성화 도메인은 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함한다.
특정 실시양태에서, DNA 결합 도메인은 가이드 RNA 및 뉴클레아제 불활성화된 Cas 단백질을 포함한다. 특정 실시양태에서, 뉴클레아제 불활성화된 Cas 단백질은 뉴클레아제 불활성화된 Cas9이다.
특정 실시양태에서, DNA 결합 도메인은 아연 핑거 도메인을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 6 내지 9개의 아연 핑거 도메인을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 6개의 아연 핑거를 포함한다. 특정 실시양태에서, DNA 결합 도메인은 18개의 뉴클레오티드를 갖는 게놈 영역에 결합한다. 특정 실시양태에서, DNA 결합 도메인은 9개의 아연 핑거를 포함한다. 특정 실시양태에서, DNA 결합 도메인은 27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다.
특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 92-98 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 92-98 중 어느 하나를 포함한다.
특정 실시양태에서, DNA 결합 도메인은 서열 LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (서열식별번호: 147)를 포함하는 아연 핑거 단백질이다.
특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 77-91 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 77-91 중 어느 하나를 포함한다.
특정 실시양태에서, DNA 결합 도메인은 인간 EGR1 또는 인간 EGR3으로부터 유래된다.
특정 실시양태에서, 전사 활성화 도메인은 VP16, VPR, VP64, CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함한다. 특정 실시양태에서, 전사 활성화 도메인은 인간 CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함한다.
특정 실시양태에서, 조절 요소는 서열식별번호: 1-4 중 어느 하나를 갖는 서열을 포함한다. 특정 실시양태에서, 조절 요소는 서열식별번호: 2 또는 3을 갖는 서열을 포함한다.
특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 105, 106 및 127-129 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 105, 106 및 127-129 중 어느 하나를 포함한다.
특정 실시양태에서, 트랜스진은 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 트랜스진은 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나를 포함한다.
특정 실시양태에서, 발현 카세트는 바이러스 벡터의 일부이다. 특정 실시양태에서, 바이러스 벡터는 AAV 바이러스이다. 특정 실시양태에서, AAV 바이러스는 AAV9 바이러스 또는 scAAV9 바이러스이다. 특정 실시양태에서, 바이러스 벡터는 렌티바이러스이다.
또 다른 측면에서, 본 출원은 영장류에게 트랜스진 및 적어도 1개의 마이크로RNA 결합 부위를 포함하는 바이러스 벡터를 투여하는 것을 포함하며, 여기서 마이크로RNA 결합 부위는 흥분성 뉴런에서 트랜스진의 발현을 감소시키는 것인, 영장류의 파르브알부민 (PV) 뉴런에서의 트랜스진의 선택적 발현을 위한 방법을 제공한다.
특정 실시양태에서, 바이러스 벡터는 트랜스진에 작동가능하게 연결된 조절 요소를 추가로 포함하며, 여기서 조절 요소는 다른 세포 유형에서보다 파르브알부민 (PV) 뉴런에서 더 높은 수준으로 트랜스진의 발현을 구동한다.
특정 실시양태에서, 마이크로RNA 결합 부위는 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위 및 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위, MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위 및 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, 마이크로RNA 결합 부위는 서열식별번호: 7, 14 또는 15를 포함한다.
특정 실시양태에서, 트랜스진은 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함한다.
특정 실시양태에서, 전사 인자는 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다.
특정 실시양태에서, 전사 인자는 DNA 결합 도메인을 포함한다.
특정 실시양태에서, 전사 인자는 DNA 결합 도메인 및 전사 활성화 도메인을 포함한다.
특정 실시양태에서, DNA 결합 도메인은 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함한다. 특정 실시양태에서, DNA 결합 도메인 및 전사 활성화 도메인은 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함한다. 특정 실시양태에서, DNA 결합 도메인 및 전사 활성화 도메인은 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함한다.
특정 실시양태에서, DNA 결합 도메인은 가이드 RNA 및 뉴클레아제 불활성화된 Cas 단백질을 포함한다. 특정 실시양태에서, 뉴클레아제 불활성화된 Cas 단백질은 뉴클레아제 불활성화된 Cas9이다.
특정 실시양태에서, DNA 결합 도메인은 아연 핑거 도메인을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 6 내지 9개의 아연 핑거 도메인을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 6개의 아연 핑거를 포함한다. 특정 실시양태에서, DNA 결합 도메인은 18개의 뉴클레오티드를 갖는 게놈 영역에 결합한다. 특정 실시양태에서, DNA 결합 도메인은 9개의 아연 핑거를 포함한다. 특정 실시양태에서, DNA 결합 도메인은 27개의 뉴클레오티드를 갖는 게놈 영역에 결합한다.
특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함한다.
특정 실시양태에서, DNA 결합 도메인은 인간 EGR1 또는 인간 EGR3으로부터 유래된다.
특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 92-98 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 92-98 중 어느 하나를 포함한다.
특정 실시양태에서, DNA 결합 도메인은 서열 LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (서열식별번호: 147)를 포함하는 아연 핑거 단백질이다.
특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 77-91 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, DNA 결합 도메인은 서열식별번호: 77-91 중 어느 하나를 포함한다.
특정 실시양태에서, 전사 활성화 도메인은 VP16, VPR, VP64, CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함한다. 특정 실시양태에서, 전사 활성화 도메인은 인간 CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함한다.
특정 실시양태에서, 조절 요소는 서열식별번호: 1-4 중 어느 하나를 갖는 서열을 포함한다. 특정 실시양태에서, 조절 요소는 서열식별번호: 2 또는 3을 갖는 서열을 포함한다.
특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 105, 106 및 127-129 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 105, 106 및 127-129 중 어느 하나를 포함한다.
특정 실시양태에서, 트랜스진은 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 트랜스진은 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나를 포함한다.
특정 실시양태에서, 바이러스 벡터는 AAV 바이러스이다. 특정 실시양태에서, AAV 바이러스는 AAV9 바이러스 또는 scAAV9 바이러스이다. 특정 실시양태에서, 바이러스 벡터는 렌티바이러스이다.
특정 실시양태에서, 영장류는 인간이다. 특정 실시양태에서, 영장류는 비-인간 영장류이다. 특정 실시양태에서, 비-인간 영장류는 구세계 원숭이, 오랑우탄, 고릴라, 침팬지, 마모셋, 게잡이 마카크, 레서스 마카크 또는 돼지-꼬리 마카크이다.
또 다른 측면에서, 본 출원은 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함하는 발현 카세트이며, 여기서 비-자연 발생 전사 인자는 서열식별번호: 128 또는 129에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트를 제공한다. 특정 실시양태에서, 비-자연 발생 전사 인자는 서열식별번호: 128 또는 129를 포함한다.
또 다른 측면에서, 본 출원은 본원에 제공된 발현 카세트 중 어느 것을 투여함으로써 세포에서 SCN1A의 발현을 증가시키는 방법을 제공한다. 특정 실시양태에서, 세포는 뉴런 세포이다. 특정 실시양태에서, 뉴런 세포는 단극, 양극, 다극 또는 가단극 뉴런으로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 세포는 GABA성(GABAergic) 뉴런이다. 특정 실시양태에서, 세포는 PV 뉴런이다. 특정 실시양태에서, 세포는 비-뉴런 세포이다. 특정 실시양태에서, 세포는 신경교 세포이다. 특정 실시양태에서, 신경교 세포는 성상세포, 핍지교세포, 상의 세포, 슈반 세포 및 위성 세포로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 세포는 대상체 내의 세포이다. 특정 실시양태에서, 대상체는 포유동물이다. 특정 실시양태에서, 대상체는 인간이다. 특정 실시양태에서, SCN1A의 발현을 증가시키는 것은 질환, 장애 또는 증상을 치료한다. 특정 실시양태에서, 장애는 중추 신경계 장애이다. 특정 실시양태에서, 장애는 SCN1A 반수체기능부전과 연관된 간질이다. 특정 실시양태에서, 반수체기능부전은 대상체가 SCN1A 유전자의 기능 상실 돌연변이에 대해 이형접합인 결과이다. 특정 실시양태에서, 장애는 SCN1A 유전자 내의 삽입, 결실 또는 치환과 연관된 간질이다. 특정 실시양태에서, 장애는 SCN1A 유전자 내의 점 돌연변이와 연관된 간질이다. 특정 실시양태에서, 장애는 드라베 증후군이다. 특정 실시양태에서, 중추 신경계 장애의 증상은 뉴런 과다활성이다. 특정 실시양태에서, 중추 신경계 장애를 치료하는 것은 뉴런 과다활성을 감소시키는 것을 포함한다. 특정 실시양태에서, 중추 신경계 장애의 증상은 발작이다. 특정 실시양태에서, 중추 신경계 장애를 치료하는 것은 발작의 빈도를 감소시키는 것을 포함한다. 특정 실시양태에서, 중추 신경계 장애를 치료하는 것은 발작의 중증도를 감소시키는 것을 포함한다.
또 다른 측면에서, 본 출원은 본원에 제공된 발현 카세트 중 어느 하나를 투여함으로써 CNS에서 SCN1A의 발현을 증가시키는 방법을 제공한다. 특정 실시양태에서, 발현 카세트는 일측 뇌실내 (ICV) 투여를 통해 투여된다. 특정 실시양태에서, 발현 카세트는 양측 뇌실내 (ICV) 투여를 통해 투여된다. 특정 실시양태에서, SCN1A의 증가된 발현은 뇌에서 발생한다. 특정 실시양태에서, SCN1A의 증가된 발현은 전두 피질, 두정 피질, 측두 피질, 해마, 수질 및/또는 후두 피질에서 발생한다. 특정 실시양태에서, SCN1A의 증가된 발현은 척추에서 발생한다. 특정 실시양태에서, SCN1A의 증가된 발현은 척수 및/또는 후근 신경절에서 발생한다.
참조로 포함됨
본 명세서에서 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적으로 및 개별적으로 나타내어진 것과 동일한 정도로 본원에 참조로 포함된다.
본 발명의 신규 특색은 첨부된 청구범위에 구체적으로 제시된다. 본 발명의 특색 및 이점의 보다 나은 이해는 본 발명의 원리가 이용되는 예시적인 경우들을 제시하는 하기 상세한 설명 및 첨부된 도면을 참조하여 얻어질 것이다:
도 1은 염색체 2 상의 다양한 영역 (GRCh38.p12를 참조함)에 결합하는 조작된 전사 인자를 사용한 내인성 SCN1A의 상향조절을 예시한다. 데이터는 대조군 (EGFP-KASH) 조건 대비 SCN1A 발현의 배수 변화로서 제시된다.
도 2a, 도 2b 및 도 2c는 SCN1A-특이적 전사 활성인자를 사용한 HEK293 세포에서의 내인성 SCN1A의 상대 발현을 예시한다 (표 1 참조). 데이터는 대조군 조건 대비 배수 변화로서 제시되고, Log10 스케일로 제시된다.
도 3a는 SCN1A-특이적 전사 활성인자 (구축물 30)를 사용한 GABA 뉴런에서의 내인성 SCN1A의 상대 발현을 예시한다. 데이터는 대조군 조건 (CBA-EGFP) 대비 배수 변화로서 제시된다.
도 3b는 SCN1A-특이적 전사 활성인자 (구축물 25 및 16)를 사용한 GABA 뉴런에서의 내인성 SCN1A의 상대 발현을 예시한다. 데이터는 대조군 조건 (CBA-EGFP) 대비 배수 변화로서 Log10으로 제시된다.
도 4는 내인성 SCN1A 및 SCN1A 특이적 전사 인자 (구축물 30)에 의해 구동되는 40개의 가장 가까운 이웃 유전자의 상대 발현을 예시한다. 데이터는 대조군 조건 (CBA-EGFP-KASH) 대비 배수 변화로서 Log10으로 제시된다.
도 5a 및 도 5b는 eGFP를 발현한 대조군 발현 카세트와 비교하여 생체내 SCN1A-특이적 전사 활성인자의 발현을 예시한다. 도 5a는 대조군 eGFP 또는 SCN1A 전사 활성인자를 포함하는 구축물 4가 주사된 마우스에서의 SCN1A 유전자의 상대 발현을 예시한다. 도 5b는 백분율 평균 eGFP의 면에서 SCN1A 발현의 변화를 예시한다. 이들 실험은 구축물 4에 의한 전사 활성화가 SCN1A 발현의 약 20-30% 상향조절을 유발하였다는 것을 나타낸다.
도 6a, 도 6b, 도 6c, 도 6d, 도 6e, 도 6f 및 도 6g는 대조군과 비교하여 다양한 SCN1A 특이적 전사 인자를 사용하였을 때 드라베 증후군의 Scn1atm1Kea 녹아웃 마우스 모델에서의 고체온 발작에 대한 효과를 예시한다. P1 Scn1a +/- 마우스 (이형접합; HET)에게 AAV9-EGFP 또는 SCN1A 특이적 전사 인자 (구축물 31-34, 42 및 43 중 하나)를 발현하는 AAV9 벡터를 주입하였다. P26-P28에서 주입된 마우스에 대해 고체온 유발 발작 검정을 실행하고, 이들이 긴장성-간대성 발작을 경험한 내부 온도를 기록하였다. 도 6d는 DBD와 TAD 사이에 위치한 HA 태그를 함유하는 구축물 32와 HA 태그를 함유하지 않는 구축물 34 사이의 직접적 비교를 보여준다. 도 6e는 코딩 영역과 폴리A 테일 사이에 위치한 m1 마이크로RNA 결합 부위를 함유하는 구축물 31과 m1 마이크로RNA 결합 부위를 함유하지 않는 구축물 32 사이의 직접적 비교를 보여준다. 도 6h는 구축물 31을 사용하였을 때 드라베 증후군의 Scn1aRX 돌연변이 마우스 모델에서의 고체온 발작에 대한 효과를 예시한다 (PBS 주사된 대조군과 비교).
도 7a, 도 7b, 도 7c 및 도 7d는 다양한 조건 하의 드라베 증후군의 Scn1atm1Kea 녹아웃 마우스 모델에서의 생존을 예시한다. 도 7a는 생존 검정에서 야생형 (PBS WT)과 Scn1a +/- 마우스 (PBS HET) 사이의 비교를 예시한다. P1 Scn1a +/- (N=53) 및 Scn1a +/+ (N=54) 마우스에게 PBS를 주입하였다. 마우스의 홈 케이지에서 매일 마우스를 관찰하였고, 임의의 사망의 경우에는 그 날짜를 기록하였다. Scn1a +/- 동물과 Scn1a +/+ 동물 사이에 생존에 있어서 유의한 차이가 있었다 (P<0.0001). 도 7b-d는 대조군과 비교하여 다양한 SCN1A 특이적 전사 인자로 처리된 마우스에 대한 드라베 증후군의 마우스 모델에서의 생존에 대한 효과를 예시한다. P1 Scn1a +/- 마우스에게 PBS 또는 SCN1A 특이적 전사 인자 (구축물 31 또는 33)를 발현하는 AAV9 벡터를 주입하였다. 마우스의 홈 케이지에서 매일 마우스를 관찰하였고, 임의의 사망의 경우에는 그 날짜를 기록하였다. 도 7d는 코딩 영역과 폴리A 테일 사이에 위치한 m1 마이크로RNA 결합 부위를 함유하는 구축물 31과 m1 마이크로RNA 결합 부위를 함유하지 않는 구축물 33 사이의 직접적 비교를 보여준다. 도 7e는 구축물 31을 사용한 드라베 증후군의 Scn1aRX 돌연변이 마우스 모델에서의 생존을 예시한다 (PBS 주사된 대조군과 비교).
도 8은 2마리의 시노몰구스 마카크에게 1.2x1012 gc/동물로 투여된 SCN1A 특이적 전사 인자 (구축물 33)를 코딩하는 AAV9 벡터의 실질내 전달 후 상이한 뇌 조직에서의 상대 Scn1A mRNA 발현을 예시하며, 이는 2마리의 비처리 대조군 동물에 대해 정규화된 것이다. 주사 28일 후에 모든 동물을 희생시키고, 택맨 PCR에 의해 조직 샘플에서 Scn1A mRNA를 정량화하였다. 데이터는 뇌로부터의 상이한 조직 절편에서의 표적 mRNA의 정규화된 발현으로서 보고된다. 상이한 세트의 Scn1a 유전자 유래 프라이머/프로브로도 유사한 결과가 기록되었다.
도 9a-f는 EF1a 프로모터, RE 2 프로모터 (서열식별번호: 2), 또는 EGFP 코딩 영역과 폴리A 부위 사이에 위치한 m1 마이크로RNA 결합 부위 (서열식별번호: 7)와 함께 RE 2 프로모터 (서열식별번호: 2)의 제어 하에 EGFP 트랜스진을 포함하는 AAV9 벡터로 처리한 후 마모셋 해마 치상회 영역에서의 EGFP의 발현 패턴을 보여준다. 해마의 치상회 영역의 대표적인 영역이 각각의 벡터 처리에 대해 제시된다. 상단 열은 DAPI로 염색된 세포 핵을 보여주고, 하단 열은 항-GFP 항체로 염색된 GFP 양성 영역을 보여준다. 도 9a (EF1a 처리)에서, 해마 CA4 문 영역은 황색으로 윤곽이 그려져 있으며, 화살표는 치상 세포 과립 세포체 층 (DG)을 가리킨다. 도 9b 및 도 9c는 동일한 영역을 중심으로 한 것이다. 흥분성 개재뉴런과 억제성 개재뉴런의 혼합물인 CA4 영역이 RE 2 + m1 조건에서 유일한 유의한 발현 영역이었기 때문에 강조된다. EF1a 및 RE 2가 트랜스진 발현을 구동하였을 때, GFP 발현은 더 넓어졌고, 해마의 다른 영역을 포함하였다. DG 세포 층은 주로 흥분성 뉴런을 함유하는 것으로 생각된다. EF1a 및 RE 2에 의해 구동된 GFP 발현은 DG 세포 층에서 가시적이지만 (도 9d 및 도 9e), RE 2 + m1 처리된 동물에서는 존재하지 않는다 (도 9f) (백색 화살촉).
도 10a-l은 EF1a 프로모터, RE 2 프로모터 (서열식별번호: 2), 또는 EGFP 코딩 영역과 폴리A 부위 사이에 위치한 m1 마이크로RNA 결합 부위 (서열식별번호: 7)와 함께 RE 2 프로모터 (서열식별번호: 2)의 제어 하에 EGFP 트랜스진을 포함하는 AAV9 벡터로 처리한 후 마모셋 해마 치상회 영역에서의 EGFP 발현 패턴이 RE 2 및 RE 2 + m1로 처리된 동물에서 파르브알부민 (PV) 양성 세포에 주로 국재화된다는 것을 보여준다. 해마의 치상회 영역의 대표적인 영역이 각각의 벡터 처리에 대해 제시된다. 상단 열은 GFP 양성 영역을 보여주고, 다음 하단 열은 PV에 대한 억제성 개재뉴런 마커로 염색된 동일한 영역을 보여준다. 도 10a-f의 박스 내 영역은 도 10g-l에서 더 높은 배율로 제시된다. RE 2 및 RE 2 + m1에 의해 구동된 GFP 발현은 주로 억제성 개재뉴런 마커 PV와 공동-국재화되는 반면 (도 10h 및 10k, 10i 및 10l 백색 화살촉), EG-EF1a에서는 GFP 발현이 PV 양성 세포에 용이하게 국재화되지 않는다 (도 10g 및 10j 백색 화살촉). 추가로, GFP 양성 세포는 EF1a 처리된 동물에서의 덜 뚜렷한 세포체 형태 (도 10g 황색 화살촉)와 비교하여 RE 2 및 RE 2+ m1 처리된 동물에서 피라미드 세포체를 갖는 고도로 분지된 세포의 뚜렷한 개재뉴런 형태 (도 10h 및 10i 황색 화살촉)를 갖는다.
도 11은 일측 뇌실내 (ICV) 투여를 통해 4.8E+13 또는 8E+13 vg/동물로 투여되는 AAV9-REGABA-eTFSCN1A로 처리된 동물 (실시예 10 및 실시예 11)에 대한 전두 피질 (FC), 문측 두정 피질 (문측 PC), 측두 피질 (TC), 미측 두정 피질 (미측 PC), 해마 (Hip), 수질 (Med) 및 후두 피질 (OC) 조직 샘플에서의 VG/이배체 게놈을 보여준다. 각각의 데이터 포인트는 조직 샘플에 대한 VG/이배체 게놈을 나타내고, 수평 막대는 각각의 동물에서의 모든 조직 샘플에 대한 평균 VG/이배체 게놈을 나타낸다.
도 12는 일측 뇌실내 (ICV) 투여를 통해 4.8E+13 또는 8E+13 vg/동물로 투여되는 AAV9-REGABA-eTFSCN1A로 처리된 동물 (실시예 10 및 실시예 11)에 대한 전두 피질 (FC), 문측 두정 피질 (문측 PC), 측두 피질 (TC), 미측 두정 피질 (미측 PC), 해마 (Hip), 수질 (Med) 및 후두 피질 (OC) 조직 샘플에서의 전사체/μg RNA를 보여준다. 각각의 데이터 포인트는 조직 샘플에 대한 VG/이배체 게놈을 나타내고, 수평 막대는 각각의 동물에서의 모든 조직 샘플에 대한 평균 VG/이배체 게놈을 나타낸다. ARFGAP2에 대한 평균 전사체는 1.85E+6/μg RNA였고, 파선 상부 경계선으로 표시된다. 검출 한계는 파선 하부 경계선으로 표시된다.
도 13은 뇌 외부의 말초 조직 샘플에서의 벡터 생체분포 (VG/이배체 게놈) 및 트랜스진 발현 (전사체/μg RNA)을 보여준다. 제시된 말초 조직 샘플은 척수 C2/L4 (SC C2/L4), 후근 신경절 C2/L4 (DRG C2/L4), 간, 비장, 심장, 신장, 폐, 췌장 및 고환/난소이다. 영장류 뇌에서의 평균 VCN (벡터 생체분포) 및 전사체 (트랜스진 발현)는 파선으로 표시된다.
도 1은 염색체 2 상의 다양한 영역 (GRCh38.p12를 참조함)에 결합하는 조작된 전사 인자를 사용한 내인성 SCN1A의 상향조절을 예시한다. 데이터는 대조군 (EGFP-KASH) 조건 대비 SCN1A 발현의 배수 변화로서 제시된다.
도 2a, 도 2b 및 도 2c는 SCN1A-특이적 전사 활성인자를 사용한 HEK293 세포에서의 내인성 SCN1A의 상대 발현을 예시한다 (표 1 참조). 데이터는 대조군 조건 대비 배수 변화로서 제시되고, Log10 스케일로 제시된다.
도 3a는 SCN1A-특이적 전사 활성인자 (구축물 30)를 사용한 GABA 뉴런에서의 내인성 SCN1A의 상대 발현을 예시한다. 데이터는 대조군 조건 (CBA-EGFP) 대비 배수 변화로서 제시된다.
도 3b는 SCN1A-특이적 전사 활성인자 (구축물 25 및 16)를 사용한 GABA 뉴런에서의 내인성 SCN1A의 상대 발현을 예시한다. 데이터는 대조군 조건 (CBA-EGFP) 대비 배수 변화로서 Log10으로 제시된다.
도 4는 내인성 SCN1A 및 SCN1A 특이적 전사 인자 (구축물 30)에 의해 구동되는 40개의 가장 가까운 이웃 유전자의 상대 발현을 예시한다. 데이터는 대조군 조건 (CBA-EGFP-KASH) 대비 배수 변화로서 Log10으로 제시된다.
도 5a 및 도 5b는 eGFP를 발현한 대조군 발현 카세트와 비교하여 생체내 SCN1A-특이적 전사 활성인자의 발현을 예시한다. 도 5a는 대조군 eGFP 또는 SCN1A 전사 활성인자를 포함하는 구축물 4가 주사된 마우스에서의 SCN1A 유전자의 상대 발현을 예시한다. 도 5b는 백분율 평균 eGFP의 면에서 SCN1A 발현의 변화를 예시한다. 이들 실험은 구축물 4에 의한 전사 활성화가 SCN1A 발현의 약 20-30% 상향조절을 유발하였다는 것을 나타낸다.
도 6a, 도 6b, 도 6c, 도 6d, 도 6e, 도 6f 및 도 6g는 대조군과 비교하여 다양한 SCN1A 특이적 전사 인자를 사용하였을 때 드라베 증후군의 Scn1atm1Kea 녹아웃 마우스 모델에서의 고체온 발작에 대한 효과를 예시한다. P1 Scn1a +/- 마우스 (이형접합; HET)에게 AAV9-EGFP 또는 SCN1A 특이적 전사 인자 (구축물 31-34, 42 및 43 중 하나)를 발현하는 AAV9 벡터를 주입하였다. P26-P28에서 주입된 마우스에 대해 고체온 유발 발작 검정을 실행하고, 이들이 긴장성-간대성 발작을 경험한 내부 온도를 기록하였다. 도 6d는 DBD와 TAD 사이에 위치한 HA 태그를 함유하는 구축물 32와 HA 태그를 함유하지 않는 구축물 34 사이의 직접적 비교를 보여준다. 도 6e는 코딩 영역과 폴리A 테일 사이에 위치한 m1 마이크로RNA 결합 부위를 함유하는 구축물 31과 m1 마이크로RNA 결합 부위를 함유하지 않는 구축물 32 사이의 직접적 비교를 보여준다. 도 6h는 구축물 31을 사용하였을 때 드라베 증후군의 Scn1aRX 돌연변이 마우스 모델에서의 고체온 발작에 대한 효과를 예시한다 (PBS 주사된 대조군과 비교).
도 7a, 도 7b, 도 7c 및 도 7d는 다양한 조건 하의 드라베 증후군의 Scn1atm1Kea 녹아웃 마우스 모델에서의 생존을 예시한다. 도 7a는 생존 검정에서 야생형 (PBS WT)과 Scn1a +/- 마우스 (PBS HET) 사이의 비교를 예시한다. P1 Scn1a +/- (N=53) 및 Scn1a +/+ (N=54) 마우스에게 PBS를 주입하였다. 마우스의 홈 케이지에서 매일 마우스를 관찰하였고, 임의의 사망의 경우에는 그 날짜를 기록하였다. Scn1a +/- 동물과 Scn1a +/+ 동물 사이에 생존에 있어서 유의한 차이가 있었다 (P<0.0001). 도 7b-d는 대조군과 비교하여 다양한 SCN1A 특이적 전사 인자로 처리된 마우스에 대한 드라베 증후군의 마우스 모델에서의 생존에 대한 효과를 예시한다. P1 Scn1a +/- 마우스에게 PBS 또는 SCN1A 특이적 전사 인자 (구축물 31 또는 33)를 발현하는 AAV9 벡터를 주입하였다. 마우스의 홈 케이지에서 매일 마우스를 관찰하였고, 임의의 사망의 경우에는 그 날짜를 기록하였다. 도 7d는 코딩 영역과 폴리A 테일 사이에 위치한 m1 마이크로RNA 결합 부위를 함유하는 구축물 31과 m1 마이크로RNA 결합 부위를 함유하지 않는 구축물 33 사이의 직접적 비교를 보여준다. 도 7e는 구축물 31을 사용한 드라베 증후군의 Scn1aRX 돌연변이 마우스 모델에서의 생존을 예시한다 (PBS 주사된 대조군과 비교).
도 8은 2마리의 시노몰구스 마카크에게 1.2x1012 gc/동물로 투여된 SCN1A 특이적 전사 인자 (구축물 33)를 코딩하는 AAV9 벡터의 실질내 전달 후 상이한 뇌 조직에서의 상대 Scn1A mRNA 발현을 예시하며, 이는 2마리의 비처리 대조군 동물에 대해 정규화된 것이다. 주사 28일 후에 모든 동물을 희생시키고, 택맨 PCR에 의해 조직 샘플에서 Scn1A mRNA를 정량화하였다. 데이터는 뇌로부터의 상이한 조직 절편에서의 표적 mRNA의 정규화된 발현으로서 보고된다. 상이한 세트의 Scn1a 유전자 유래 프라이머/프로브로도 유사한 결과가 기록되었다.
도 9a-f는 EF1a 프로모터, RE 2 프로모터 (서열식별번호: 2), 또는 EGFP 코딩 영역과 폴리A 부위 사이에 위치한 m1 마이크로RNA 결합 부위 (서열식별번호: 7)와 함께 RE 2 프로모터 (서열식별번호: 2)의 제어 하에 EGFP 트랜스진을 포함하는 AAV9 벡터로 처리한 후 마모셋 해마 치상회 영역에서의 EGFP의 발현 패턴을 보여준다. 해마의 치상회 영역의 대표적인 영역이 각각의 벡터 처리에 대해 제시된다. 상단 열은 DAPI로 염색된 세포 핵을 보여주고, 하단 열은 항-GFP 항체로 염색된 GFP 양성 영역을 보여준다. 도 9a (EF1a 처리)에서, 해마 CA4 문 영역은 황색으로 윤곽이 그려져 있으며, 화살표는 치상 세포 과립 세포체 층 (DG)을 가리킨다. 도 9b 및 도 9c는 동일한 영역을 중심으로 한 것이다. 흥분성 개재뉴런과 억제성 개재뉴런의 혼합물인 CA4 영역이 RE 2 + m1 조건에서 유일한 유의한 발현 영역이었기 때문에 강조된다. EF1a 및 RE 2가 트랜스진 발현을 구동하였을 때, GFP 발현은 더 넓어졌고, 해마의 다른 영역을 포함하였다. DG 세포 층은 주로 흥분성 뉴런을 함유하는 것으로 생각된다. EF1a 및 RE 2에 의해 구동된 GFP 발현은 DG 세포 층에서 가시적이지만 (도 9d 및 도 9e), RE 2 + m1 처리된 동물에서는 존재하지 않는다 (도 9f) (백색 화살촉).
도 10a-l은 EF1a 프로모터, RE 2 프로모터 (서열식별번호: 2), 또는 EGFP 코딩 영역과 폴리A 부위 사이에 위치한 m1 마이크로RNA 결합 부위 (서열식별번호: 7)와 함께 RE 2 프로모터 (서열식별번호: 2)의 제어 하에 EGFP 트랜스진을 포함하는 AAV9 벡터로 처리한 후 마모셋 해마 치상회 영역에서의 EGFP 발현 패턴이 RE 2 및 RE 2 + m1로 처리된 동물에서 파르브알부민 (PV) 양성 세포에 주로 국재화된다는 것을 보여준다. 해마의 치상회 영역의 대표적인 영역이 각각의 벡터 처리에 대해 제시된다. 상단 열은 GFP 양성 영역을 보여주고, 다음 하단 열은 PV에 대한 억제성 개재뉴런 마커로 염색된 동일한 영역을 보여준다. 도 10a-f의 박스 내 영역은 도 10g-l에서 더 높은 배율로 제시된다. RE 2 및 RE 2 + m1에 의해 구동된 GFP 발현은 주로 억제성 개재뉴런 마커 PV와 공동-국재화되는 반면 (도 10h 및 10k, 10i 및 10l 백색 화살촉), EG-EF1a에서는 GFP 발현이 PV 양성 세포에 용이하게 국재화되지 않는다 (도 10g 및 10j 백색 화살촉). 추가로, GFP 양성 세포는 EF1a 처리된 동물에서의 덜 뚜렷한 세포체 형태 (도 10g 황색 화살촉)와 비교하여 RE 2 및 RE 2+ m1 처리된 동물에서 피라미드 세포체를 갖는 고도로 분지된 세포의 뚜렷한 개재뉴런 형태 (도 10h 및 10i 황색 화살촉)를 갖는다.
도 11은 일측 뇌실내 (ICV) 투여를 통해 4.8E+13 또는 8E+13 vg/동물로 투여되는 AAV9-REGABA-eTFSCN1A로 처리된 동물 (실시예 10 및 실시예 11)에 대한 전두 피질 (FC), 문측 두정 피질 (문측 PC), 측두 피질 (TC), 미측 두정 피질 (미측 PC), 해마 (Hip), 수질 (Med) 및 후두 피질 (OC) 조직 샘플에서의 VG/이배체 게놈을 보여준다. 각각의 데이터 포인트는 조직 샘플에 대한 VG/이배체 게놈을 나타내고, 수평 막대는 각각의 동물에서의 모든 조직 샘플에 대한 평균 VG/이배체 게놈을 나타낸다.
도 12는 일측 뇌실내 (ICV) 투여를 통해 4.8E+13 또는 8E+13 vg/동물로 투여되는 AAV9-REGABA-eTFSCN1A로 처리된 동물 (실시예 10 및 실시예 11)에 대한 전두 피질 (FC), 문측 두정 피질 (문측 PC), 측두 피질 (TC), 미측 두정 피질 (미측 PC), 해마 (Hip), 수질 (Med) 및 후두 피질 (OC) 조직 샘플에서의 전사체/μg RNA를 보여준다. 각각의 데이터 포인트는 조직 샘플에 대한 VG/이배체 게놈을 나타내고, 수평 막대는 각각의 동물에서의 모든 조직 샘플에 대한 평균 VG/이배체 게놈을 나타낸다. ARFGAP2에 대한 평균 전사체는 1.85E+6/μg RNA였고, 파선 상부 경계선으로 표시된다. 검출 한계는 파선 하부 경계선으로 표시된다.
도 13은 뇌 외부의 말초 조직 샘플에서의 벡터 생체분포 (VG/이배체 게놈) 및 트랜스진 발현 (전사체/μg RNA)을 보여준다. 제시된 말초 조직 샘플은 척수 C2/L4 (SC C2/L4), 후근 신경절 C2/L4 (DRG C2/L4), 간, 비장, 심장, 신장, 폐, 췌장 및 고환/난소이다. 영장류 뇌에서의 평균 VCN (벡터 생체분포) 및 전사체 (트랜스진 발현)는 파선으로 표시된다.
비-자연 발생이고 게놈 표적 부위에 결합하며 관심 내인성 유전자의 발현을 조정하도록 설계된 조작된 전사 인자 또는 eTF가 본원에 제공된다. 이러한 eTF는 관심 유전자의 발현 (RNA 및/또는 단백질 발현)을 상향조절 또는 하향조절하도록 설계될 수 있다. 또한, 바이러스 벡터 내로 혼입될 수 있고 파르브알부민 (PV) 뉴런에서 트랜스진의 선택적 발현을 제공할 수 있는 마이크로RNA 결합 부위가 본원에 제공된다.
한 측면에서, 본 출원은 나트륨 전압 게이팅 채널 알파 서브유닛 1 (SCN1A) 유전자의 발현을 상향조절할 수 있고 그의 상응하는 단백질 산물 Nav1.1의 발현을 증가시킬 수 있는 eTF; 및 Nav1.1의 결핍과 연관된 질환 또는 장애, 예컨대, 예를 들어 드라베 증후군을 치료하기 위한 그의 사용 방법을 제공한다.
또 다른 측면에서, 본 출원은 흥분성 뉴런에서 마이크로RNA 결합 부위를 함유하는 mRNA의 발현을 감소시킴으로써 GABA성 또는 파르브알부민 (PV) 뉴런에서의 유전자의 선택적 발현을 유도하는 마이크로RNA 결합 부위 및 PV 뉴런에서의 관심 유전자의 선택적 발현을 위한 그의 사용 방법을 제공한다.
정의
본원에 사용된 단수 형태는 문맥이 달리 명확하게 나타내지 않는 한 복수 형태를 또한 포함하는 것으로 의도된다. 추가로, 용어 "포함한", "포함한다", "갖는", "갖는다", "가진" 또는 그의 변형어가 상세한 설명 및/또는 청구범위에 사용되는 경우에, 이러한 용어는 용어 "포함하는"과 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 관련 기술분야의 통상의 기술자에 의해 결정시 특정한 값에 대한 허용 오차 범위 내를 의미하며, 이는 부분적으로 값이 측정 또는 결정되는 방법, 즉 측정 시스템의 한계에 좌우될 것이다. 예를 들어, "약"은 관련 기술분야의 실시에 따라 1 또는 1 초과의 표준 편차 내에 있음을 의미할 수 있다. 대안적으로, "약"은 주어진 값의 20% 이하, 15% 이하, 10% 이하, 5% 이하 또는 1% 이하의 범위를 의미할 수 있다.
용어 "결정하는", "측정하는", "평가하는", "사정하는", "검정하는", "분석하는" 및 그의 문법적 등가물은 임의의 형태의 측정을 지칭하는 것으로 본원에서 상호교환가능하게 사용될 수 있고, 요소가 존재하는지 아닌지를 결정하는 것 (예를 들어, 검출)을 포함한다. 이들 용어는 정량적 및/또는 정성적 결정 둘 다를 포함할 수 있다. 평가는 상대적이거나 절대적일 수 있다.
용어 "발현"은 핵산 서열 또는 폴리뉴클레오티드가 DNA 주형으로부터 (예컨대 mRNA 또는 다른 RNA 전사체로) 전사되는 과정 및/또는 전사된 mRNA가 후속적으로 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩티드는 집합적으로 "유전자 산물"로 지칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된 경우에, 발현은 진핵 세포에서의 mRNA의 스플라이싱을 포함할 수 있다.
본원에 사용된 "작동가능하게 연결된", "작동가능한 연결", "작동적으로 연결된" 또는 그의 문법적 등가물은 유전자 요소, 예를 들어 프로모터, 인핸서, 폴리아데닐화 서열 등의 병렬배치를 지칭하며, 여기서 요소는 이들이 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소가 코딩 서열의 전사를 개시하는 것을 돕는 경우에 조절 요소가 코딩 영역에 작동적으로 연결된다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.
본원에 사용된 "벡터"는 폴리뉴클레오티드를 포함하거나 그와 회합하고 세포로의 폴리뉴클레오티드의 전달을 매개하는데 사용될 수 있는 거대분자 또는 거대분자의 회합을 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포솜 및 다른 유전자 전달 비히클을 포함한다. 벡터는 일반적으로 표적에서 유전자의 발현을 용이하게 하기 위해 유전자에 작동적으로 연결된 유전 요소, 예를 들어 조절 요소를 포함한다.
본원에 사용된 "발현 카세트" 및 "핵산 카세트"는 함께 발현되거나 발현을 위해 작동가능하게 연결된 핵산 서열 또는 요소의 조합을 지칭하는 것으로 상호교환가능하게 사용된다. 일부 경우에, 발현 카세트는 조절 요소 및 발현을 위해 작동가능하게 연결된 유전자 또는 유전자들의 조합을 지칭한다.
용어 "AAV"는 아데노-연관 바이러스의 약어이고, 바이러스 자체 또는 그의 유도체를 지칭하는 것으로 사용될 수 있다. 상기 용어는 달리 요구되는 경우를 제외하고는 모든 혈청형, 하위유형 및 자연 발생 및 재조합 형태 둘 다를 포괄한다. 약어 "rAAV"는 재조합 아데노-연관 바이러스를 지칭하며, 재조합 AAV 벡터 (또는 "rAAV 벡터")로도 지칭된다. 용어 "AAV"는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10 및 그의 하이브리드, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 영장류 AAV, 비-영장류 AAV 및 양 AAV를 포함한다. AAV의 다양한 혈청형의 게놈 서열, 뿐만 아니라 천연 말단 반복부 (TR), Rep 단백질 및 캡시드 서브유닛의 서열은 관련 기술분야에 공지되어 있다. 이러한 서열은 문헌 또는 공공 데이터베이스, 예컨대 진뱅크(GenBank)에서 찾아볼 수 있다. 본원에 사용된 "rAAV 벡터"는 AAV 기원이 아닌 폴리뉴클레오티드 서열 (즉, AAV에 대해 이종인 폴리뉴클레오티드), 전형적으로 세포의 유전자 형질전환을 위한 관심 서열을 포함하는 AAV 벡터를 지칭한다. 일반적으로, 이종 폴리뉴클레오티드는 적어도 1개, 일반적으로 2개의 AAV 역전된 말단 반복 서열 (ITR)이 플랭킹되어 있다. rAAV 벡터는 단일-가닥 (ssAAV) 또는 자기-상보적 (scAAV)일 수 있다. "AAV 바이러스" 또는 "AAV 바이러스 입자"는 적어도 1종의 AAV 캡시드 단백질 및 캡시드화 폴리뉴클레오티드 rAAV 벡터로 구성된 바이러스 입자를 지칭한다. 입자가 이종 폴리뉴클레오티드 (즉, 야생형 AAV 게놈 이외의 폴리뉴클레오티드, 예컨대 포유동물 세포로 전달될 트랜스진)를 포함하는 경우, 이는 전형적으로 "rAAV 벡터 입자" 또는 간단히 "rAAV 입자"로 지칭된다. 따라서, rAAV 입자의 생산은 반드시 rAAV 벡터의 생산을 포함하는데, 이는 이러한 벡터가 rAAV 입자 내에 함유되기 때문이다.
본원에 사용된 용어 "치료하다", "치료", "요법" 등은 질환 또는 장애의 진행의 완화, 지연 또는 둔화, 예방, 약화, 효과 또는 증상의 감소, 발병의 방지, 발병의 억제 또는 호전을 지칭한다. 본 개시내용의 방법은 임의의 포유동물에 사용될 수 있다. 예시적인 포유동물은 래트, 고양이, 개, 말, 소, 양, 돼지 및 보다 바람직하게는 인간을 포함하나 이에 제한되지는 않는다. 치료 이익은 치료될 기저 장애의 근절 또는 호전을 포함한다. 또한, 치료 이익은 대상체가 여전히 기저 장애를 앓을 수 있음에도 불구하고 대상체에서 개선이 관찰되도록 기저 장애와 연관된 생리학적 증상 중 1종 이상의 근절 또는 호전에 의해 달성된다. 일부 경우에, 예방적 이익을 위해, 특정한 질환이 발생할 위험이 있는 대상체에게 또는 질환이 진단되지 않았을 수 있더라도 이러한 질환의 생리학적 증상 중 1종 이상을 보고하는 대상체에게 치료제가 투여될 수 있다. 본 개시내용의 방법은 임의의 포유동물에 사용될 수 있다. 일부 경우에, 치료는 증상의 감소 또는 중지 (예를 들어, 발작의 빈도, 지속기간 및/또는 중증도의 감소)을 유발할 수 있다. 예방적 효과는 질환 또는 상태의 출현의 지연 또는 제거, 질환 또는 상태의 증상의 발병의 지연 또는 제거, 질환 또는 상태의 진행의 둔화, 정지 또는 역전 또는 그의 임의의 조합을 포함한다.
용어 "유효량" 또는 "치료 유효량"은 하기 정의된 바와 같은 질환 치료를 포함하나 이에 제한되지는 않는 의도된 적용에 영향을 미치기에 충분한 본원에 기재된 조성물의 양을 지칭한다. 치료 유효량은 의도된 치료 용도 (생체내), 또는 치료될 대상체 및 질환 상태, 예를 들어 대상체의 체중 및 연령, 질환 상태의 중증도, 투여 방식 등에 따라 달라질 수 있으며, 이는 관련 기술분야의 통상의 기술자에 의해 용이하게 결정될 수 있다. 상기 용어는 또한 표적 세포에서 특정한 반응을 유도할 용량에 적용된다. 구체적 용량은 선택된 특정한 조성물, 따를 투여 요법, 다른 화합물과 조합되어 투여되는지 여부, 투여 시기, 투여될 조직 및 수행될 물리적 전달 시스템에 따라 달라질 것이다.
뉴클레오티드 또는 펩티드 서열의 "단편"은 참조 또는 "전장" 서열보다 짧은 서열을 지칭한다.
분자의 "변이체"는 이러한 서열의 대립유전자 변이, 즉 전체 분자 또는 그의 단편과 구조적 및 생물학적 활성이 실질적으로 유사한 서열을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성 (기능적 또는 구조적)을 보유하는 단편을 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인하는 것으로 알려진 방식으로 발현에 영향을 미치는 그의 능력일 수 있다.
용어 "대상체" 및 "개체"는 척추동물, 바람직하게는 포유동물, 보다 바람직하게는 인간을 지칭하는 것으로 본원에서 상호교환가능하게 사용된다. 본원에 기재된 방법은 질환 또는 상태의 동물 모델에서의 인간 치료, 수의학적 적용 및/또는 전임상 연구에 유용할 수 있다.
용어 "생체내"는 대상체의 신체에서 일어나는 사건을 지칭한다.
용어 "시험관내"는 대상체의 신체 외부에서 일어나는 사건을 지칭한다. 예를 들어, 시험관내 검정은 대상체 외부에서 실행되는 임의의 검정을 포괄한다. 시험관내 검정은 살아있거나 죽은 세포가 사용되는 세포-기반 검정을 포괄한다. 시험관내 검정은 또한 어떤 무손상 세포도 사용되지 않는 무세포 검정을 포괄한다.
일반적으로, 상호교환가능하게 사용될 수 있는 "서열 동일성" 또는 "서열 상동성"은 각각 2개의 폴리뉴클레오티드 또는 폴리펩티드 서열의 정확한 뉴클레오티드-대-뉴클레오티드 또는 아미노산-대-아미노산 상응성을 지칭한다. 전형적으로, 서열 동일성을 결정하기 위한 기술은 2개의 뉴클레오티드 또는 아미노산 서열을 비교하는 것 및 그의 퍼센트 동일성을 결정하는 것을 포함한다. 서열 비교는, 예컨대 동일성을 평가하기 위한 목적으로, 니들만-분쉬(Needleman-Wunsch) 알고리즘 (예를 들어, www.ebi.ac.uk/Tools/psa/emboss_needle/에서 이용가능한 EMBOSS 니들 정렬기 (임의로 디폴트 설정을 가짐) 참조), BLAST 알고리즘 (예를 들어, blast.ncbi.nlm.nih.gov/Blast.cgi에서 이용가능한 BLAST 정렬 도구 (임의로 디폴트 설정을 가짐) 참조), 및 스미스-워터만(Smith-Waterman) 알고리즘 (예를 들어, www.ebi.ac.uk/Tools/psa/emboss_water/에서 이용가능한 EMBOSS 워터 정렬기 (임의로 디폴트 설정을 가짐) 참조)을 포함하나 이에 제한되지는 않는 임의의 적합한 정렬 알고리즘에 의해 수행될 수 있다. 최적 정렬은 디폴트 파라미터를 포함한 선택된 알고리즘의 임의의 적합한 파라미터를 사용하여 평가될 수 있다. 2개의 서열 사이의 "퍼센트 상동성"으로도 지칭되는 "퍼센트 동일성"은 2개의 최적으로 정렬된 서열 사이의 정확한 매치의 수를 참조 서열의 길이로 나누고 100을 곱하여 계산될 수 있다. 퍼센트 동일성은 또한, 예를 들어 국립 보건원으로부터 입수가능한 버전 2.2.9를 포함한 진보된 BLAST 컴퓨터 프로그램을 사용하여 서열 정보를 비교함으로써 결정될 수 있다. BLAST 프로그램은 문헌 [Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87:2264-2268 (1990)]의 정렬 방법에 기초하고, 문헌 [Altschul, et al., J. Mol. Biol. 215:403-410 (1990); Karlin and Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5877 (1993); 및 Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)]에서 논의된 바와 같다. 간략하게, BLAST 프로그램은 동일한 정렬된 기호 (즉, 뉴클레오티드 또는 아미노산)의 수를 2개의 서열 중 더 짧은 것에서의 기호의 총수로 나눈 것으로 동일성을 정의한다. 상기 프로그램은 비교될 서열의 전체 길이에 걸쳐 퍼센트 동일성을 결정하는데 사용될 수 있다. 디폴트 파라미터는 짧은 질의 서열을 사용한, 예를 들어 blastp 프로그램을 사용한 검색을 최적화하기 위해 제공된다. 상기 프로그램은 또한 문헌 [Wootton and Federhen, Computers and Chemistry 17:149-163 (1993)]의 SEG 프로그램에 의해 결정시 질의 서열의 절편을 차폐하기 위한 SEG 필터의 사용을 가능하게 한다. 높은 서열 동일성은 일반적으로 대략 80% 내지 100%의 서열 동일성 범위 및 그 사이의 정수 값을 포함한다.
단백질과 관련하여 본원에 사용된 "조작된"은 비-자연 발생 단백질, 예컨대 비제한적으로 자연 발생 단백질로부터 유래된 단백질 또는 자연 발생 단백질이 특정 특성을 갖도록 변형 또는 재프로그램화된 경우를 지칭한다.
본원에 사용된 "합성" 및 "인공"은 자연 발생 인간 단백질에 대해 낮은 서열 동일성 (예를 들어, 50% 미만의 서열 동일성)을 갖는 단백질 또는 그의 도메인을 지칭하는 것으로 상호교환가능하게 사용된다. 예를 들어, VPR 및 VP64 도메인은 합성 전사활성화 도메인이다.
본원에 사용된 "조작된 전사 인자" 또는 "eTF"는 특이적 표적 결합 부위에 결합하고/거나 변형 또는 대체된 전사 이펙터 도메인을 포함하도록 변형 또는 재프로그램화된 비-자연 발생 DNA 결합 단백질 또는 비-자연 발생 전사 조정제를 지칭한다.
본원에 사용된 "DNA 결합 도메인"은 DNA 결합 단백질의 일부로서 1개 이상의 DNA 결합 모티프, 예컨대 아연 핑거 또는 염기성 헬릭스-루프-헬릭스 (bHLH) 모티프를 개별적으로 또는 집합적으로 지칭하는 것으로 사용될 수 있다.
용어 "전사 활성화 도메인", "전사의 활성화 도메인", "전사활성화 도메인", "트랜스-활성화 도메인" 및 "TAD"는 본원에서 상호교환가능하게 사용되고, DNA 결합 도메인과 함께 전사 기구 (예를 들어, 일반적 전사 인자 및/또는 RNA 폴리머라제)에 직접 또는 보조-활성화제로 공지된 다른 단백질을 통해 접촉함으로써 프로모터로부터의 전사를 활성화시킬 수 있는 단백질의 도메인을 지칭한다.
용어 "전사 억제인자 도메인", "전사의 억제인자 도메인" 및 "TRD"는 본원에서 상호교환가능하게 사용되고, DNA 결합 도메인과 함께 전사 기구 (예를 들어, 일반적 전사 인자 및/또는 RNA 폴리머라제)에 직접 또는 보조-억제인자로 공지된 다른 단백질을 통해 접촉함으로써 프로모터로부터의 전사를 억제할 수 있는 단백질의 도메인을 지칭한다.
용어 "GRCh38.p12"는 2017년 12월 21일자로 진뱅크 어셈블리 수탁 번호 GCA_000001405.27을 갖는 게놈 참조 컨소시엄 휴먼 빌드(Genome Reference Consortium Human Build) 38 패치 릴리스 12 (GRCh38.p12)를 지칭한다.
달리 나타내지 않는 한, 본원에 사용된 모든 용어는 관련 기술분야의 통상의 기술자에게 동일한 의미를 갖고, 본 발명의 실시는 관련 기술분야의 통상의 기술자의 지식 내에 있는 분자 생물학, 미생물학 및 재조합 DNA 기술의 통상적인 기술을 사용할 것이다.
SCN1A를 상향조절하는 조작된 전사 인자 (eTF)
한 측면에서, 본 출원은 나트륨 전압 게이팅 채널 알파 서브유닛 1 (SCN1A) 유전자의 발현을 상향조절할 수 있고 그의 상응하는 단백질 산물 Nav1.1의 발현을 증가시킬 수 있는 eTF를 제공한다. SCN1A 유전자는 나트륨 채널을 조립하는데 사용되는 서브유닛을 코딩하는 유전자의 패밀리에 속한다. 양으로 하전된 나트륨 이온을 세포 내로 수송하는 이들 채널은 전기 신호를 생성하고 전송하는 세포의 능력에서 중요한 역할을 한다. SCN1A 유전자는 Nav1.1로 불리는 나트륨 채널의 한 부분 (알파 서브유닛)을 코딩한다. 이들 채널은 주로 뇌에서 발견되며, 여기서 이들은 세포 내로의 나트륨 이온의 유동을 제어한다. Nav1.1 채널은 하나의 신경 세포 (또는 뉴런)로부터 또 다른 것으로 신호를 전송하는데 관여한다. SCN1A 유전자 내의 여러 돌연변이는 다양한 중증도의 발작 장애의 스펙트럼인 열성 발작 플러스 동반 유전적 간질 (GEFS+)을 유발하는 것으로 밝혀졌다. 이들 상태는 영아기에서 시작하여 통상적으로 5세에 멈추는 단순 열성 (열-연관) 발작 및 열성 발작 플러스 (FS+)를 포함한다. FS+는 열성 발작 및 소아기를 지나 계속되는 열과 관련되지 않은 발작 (무열성 발작)을 포함한 다른 유형의 발작을 수반한다. GEFS+ 스펙트럼은 또한 보다 오래 지속되고 제어하기 어려울 수 있는 보다 심각한 발작을 유발하는 다른 상태, 예컨대 드라베 증후군 (영아기의 중증 근간대성 간질 또는 SMEI로도 공지됨)을 포함한다. 이들 재발성 발작 (간질)은 시간 경과에 따라 악화될 수 있고, 종종 뇌 기능의 저하를 동반한다. 많은 다른 돌연변이는 가족에서 진행되는 편두통 형태인 가족성 편마비성 편두통과 연관되었고, 적어도 1개의 돌연변이는 특정 항발작 의약의 유효성과 연관되었다. 따라서, SCN1A의 발현을 증가시키는 본원에 제공된 eTF는 Nav1.1 채널에서의 돌연변이와 연관된 다양한 질환 또는 장애를 치료하기 위해 사용될 수 있다.
전사 인자 (TF)는 게놈 내의 특이적 서열에 결합하고 유전자의 발현을 제어하는 단백질이다. SCN1A를 상향조절하는 본원에 제공된 조작된 전사 인자 또는 eTF는 DNA 결합 도메인 (DBD), 및 전사 조정인자, 예를 들어 전사 활성화 도메인 (TAD) 또는 전사 억제인자 도메인 (TRD)인 적어도 1개의 도메인을 포함하는 비-자연 발생 단백질이다. 한 실시양태에서, SCN1A를 상향조절하는 eTF는 DBD 및 TAD (예를 들어, TAD-DBD 또는 DBD-TAD)를 포함할 수 있으며, 여기서 DBD 및 TAD는 동일한 단백질로부터 또는 상이한 단백질로부터 유래될 수 있다. 또 다른 실시양태에서, SCN1A를 상향조절하는 eTF는 DBD 및 2개의 TAD를 포함할 수 있으며, 여기서 DBD 및 TAD는 동일한 단백질로부터 유래되거나, DBD는 제1 단백질로부터 유래되고 TAD 둘 다는 제2 단백질로부터 유래되거나, DBD 및 1개의 TAD는 제1 단백질로부터 유래되고 제2 TAD는 제2 단백질로부터 유래되거나, 또는 DBD는 제1 단백질로부터 유래되고 1개의 TAD는 제2 단백질로부터 유래되고 제2 TAD는 제3 단백질로부터 유래된다 (예를 들어, TAD1-DBD-TAD1, TAD1-DBD-TAD2, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 또는 DBD-TAD1-TAD2). 또 다른 실시양태에서, SCN1A를 상향조절하는 eTF는 DBD 및 3개의 TAD를 포함할 수 있으며, 여기서 DBD 및 TAD는 동일한 단백질로부터 유래되거나, DBD는 제1 단백질로부터 유래되고 TAD는 1종 이상의 상이한 단백질로부터 유래되거나, 또는 DBD 및 모든 TAD는 모두 상이한 단백질로부터 유래되고, 예를 들어 TADX-TADX-TADX-DBD, TADX-TADX-DBD-TADX, TADX-DBD-TADX-TADX 또는 DBD-TADX-TADX-TADX이며, 여기서 각각의 X는 독립적으로 선택되고 다른 TAD 중 하나 또는 모두와 동일하거나 상이할 수 있다. 예는, 예를 들어 TAD1-TAD1-DBD-TAD1, TAD1-TAD1-DBD-TAD2, TAD1-TAD2-DBD-TAD1, TAD1-TAD2-DBD-TAD2, TAD1-TAD2-DBD-TAD3, TAD1-DBD-TAD1-TAD1, TAD1- DBD-TAD2-TAD2, TAD1-DBD-TAD1-TAD2, TAD2-DBD-TAD1-TAD2, TAD1-DBD-TAD2-TAD3, TAD1-TAD1-TAD1-DBD, TAD1-TAD2-TAD2-DBD, TAD1-TAD2-TAD2-DBD, TAD1-TAD2-TAD3-DBD, DBD-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2, DBD-TAD1-TAD2-TAD2 또는 DBD-TAD1-TAD2-TAD3 등을 포함한다. 또 다른 실시양태에서, SCN1A를 상향조절하는 eTF는 DBD 및 4종의 TAD를 포함할 수 있으며, 여기서 DBD 및 TAD는 동일한 단백질로부터 유래되거나, DBD는 제1 단백질로부터 유래되고 TAD는 1종 이상의 상이한 단백질로부터 유래되거나, 또는 DBD 및 모든 TAD는 모두 상이한 단백질로부터 유래되고, 예를 들어 TADX-TADX-TADX-TADX-DBD, TADX-TADX-TADX-DBD-TADX, TADX-TADX-DBD-TADX-TADX, TADX- DBD-TADX-TADX-TADX 또는 DBD-TADX-TADX-TADX-TADX이며, 여기서 각각의 X는 독립적으로 선택되고 다른 TAD 중 하나 또는 모두와 동일하거나 상이할 수 있다. 예는, 예를 들어 TAD1-TAD1-DBD-TAD1-TAD1, TAD1-TAD1-DBD-TAD2-TAD2, TAD1-TAD2-DBD-TAD1-TAD2, TAD1-TAD2-DBD-TAD2-TAD1, TAD1-TAD2-DBD-TAD1-TAD3, TAD1-TAD3-DBD-TAD1-TAD2, TAD1-TAD2-DBD-TAD3-TAD4, TAD1-TAD1-TAD1-DBD-TAD2, TAD1-TAD2-TAD3-DBD-TAD4, TAD1-DBD-TAD1-TAD1-TAD2, TAD1-DBD-TAD2-TAD3-TAD4, TAD1-DBD-TAD1-TAD2-TAD3, TAD2-DBD-TAD1-TAD2-TAD3, TAD1-DBD-TAD2-TAD3-TAD4, TAD1-TAD1-TAD1-TAD1-DBD, TAD1-TAD2-TAD2-TAD3-DBD, TAD1-TAD2-TAD3-TAD4-DBD, DBD-TAD1-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2-TAD2, DBD-TAD1-TAD2-TAD3-TAD4 또는 DBD-TAD1-TAD2-TAD3-TAD3 등을 포함한다. 한 실시양태에서, SCN1A를 상향조절하는 eTF는 DBD 및 DBD의 동일한 말단 (예를 들어, N-말단 또는 C-말단)에 위치한 2개의 TAD를 포함하며, 여기서 DBD는 제1 단백질로부터 유래되고 TAD 둘 다는 제2 단백질로부터 유래되거나, 또는 DBD는 제1 단백질로부터 유래되고 1개의 TAD는 제2 단백질로부터 유래되고 제2 TAD는 제3 단백질로부터 유래된다 (예를 들어, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 또는 DBD-TAD1-TAD2). 특정 실시양태에서, DBD는 다중 단백질로부터의 도메인을 함유하는 합성 구축물일 수 있다.
특정 실시양태에서, DBD 및 TAD 및/또는 2개의 TAD는, 예를 들어 개재 아미노산 서열 없이 직접 접합될 수 있거나, DBD 및 TAD 및/또는 2개의 TAD는 펩티드 링커를 사용하여 접합될 수 있거나, 또는 그의 조합일 수 있다. 특정 실시양태에서, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 75, 80, 90 또는 100개의 아미노산 또는 1-5, 1-10, 1-20, 1-30, 1-40, 1-50, 1-75, 1-100, 5-10, 5-20, 5-30, 5-40, 5-50, 5-75, 5-100, 10-20, 10-30, 10-40, 10-50, 10-75, 10-100, 20-30, 20-40, 20-50, 20-75 또는 20-100개의 아미노산을 갖는 링커를 통해 DBD가 TAD에 접합되고/거나 1개의 TAD가 제2 TAD에 접합된다. 일부 경우에, DBD 및 TAD 및/또는 2개의 TAD는 이러한 도메인이 유래된 자연 발생 단백질에서 발견되는 자연 발생 개재 잔기를 통해 접합된다. 다른 실시양태에서, DBD 및 TAD 및/또는 2개의 TAD는 합성 또는 외인성 링커 서열을 통해 접합된다. 적합한 링커는 가요성, 절단가능, 비-절단가능, 친수성 및/또는 소수성일 수 있다. 특정 실시양태에서, DBD 및 TAD 및/또는 2개의 TAD는 복수의 글리신 및/또는 세린 잔기를 포함하는 링커를 통해 함께 융합될 수 있다. 글리신/세린 펩티드 링커의 예는 [GS]n, [GGGS]n (서열식별번호: 179), [GGGGS]n (서열식별번호: 180), [GGSG]n (서열식별번호: 181)을 포함하며, 여기서 n은 1 이상의 정수이다. 특정 실시양태에서, DBD 및 TAD 및/또는 2개의 TAD를 접합시키는데 유용한 링커는 GGSGGGSG (서열식별번호: 177)이다. 특정 실시양태에서, DBD 및 TAD 및/또는 2개의 TAD를 접합시키는데 유용한 링커는 GGSGGGSGGGSGGGSG (서열식별번호: 178)이다. 특정 실시양태에서, DBD가 2개의 TAD에 접합되는 경우에, 제1 및 제2 TAD는 동일하거나 상이한 링커로 DBD에 접합될 수 있거나, 또는 하나의 TAD는 링커로 DBD에 접합될 수 있고 다른 TAD는 DBD에 직접 (예를 들어, 개재 링커 서열 없이) 접합될 수 있거나, 또는 TAD 둘 다는 DBD에 직접 (예를 들어, 개재 링커 서열 없이) 접합될 수 있다. 특정 실시양태에서, DBD가 동일한 말단 (예를 들어, N-말단 또는 C-말단) 상의 2개의 TAD에 접합되는 경우에, 2개의 TAD를 연결하는 링커는 TAD를 DBD에 연결하는 링커와 동일하거나 상이할 수 있거나, 또는 TAD는 링커로 서로 접합될 수 있지만 TAD는 DBD에 직접 (예를 들어, 개재 링커 서열 없이) 접합되거나, 또는 TAD는 서로 직접 (예를 들어, 개재 링커 서열 없이) 접합될 수 있지만 TAD는 링커로 DBD에 접합된다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 DBD와 1개 이상의 TAD 사이에 위치한 1개 이상의 HA 태그(들) (예를 들어, 서열식별번호: 171)를 포함하지 않는다.
SCN1A를 상향조절하는 본원에 제공된 eTF는 자연 발생 전사 인자와 상이한 특성을 갖는다. 특정 실시양태에서, SCN1A를 상향조절하는 eTF는 DBD가 유래된 자연 발생 단백질과 비교하여 상이한 표적 부위에 결합하도록 변형된 자연 발생 단백질로부터 유래된 DBD를 포함하고, 이러한 변형된 DBD를 포함하는 eTF는 DBD가 유래된 자연 발생 단백질 (예를 들어, SCN1A 이외의 유전자)과 비교하여 상이한 유전자 (예를 들어, SCN1A)로부터의 발현을 조정한다. 다른 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 변형된 TAD를 포함하는 eTF가 TAD가 유래된 자연 발생 단백질 (예를 들어, SCN1A 이외의 유전자)과 비교하여 상이한 유전자 (예를 들어, SCN1A)로부터의 발현을 조정하도록 변형되고/거나 이러한 변형된 TAD를 포함하는 eTF가 TAD가 유래된 자연 발생 단백질과 비교하여 SCN1A의 발현을 상이하게 조정 (예를 들어, 상향조절 대 하향조절)하도록 변형된 자연 발생 단백질로부터 유래된 TAD를 포함한다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 자연 발생 단백질로부터 유래된 DBD 및 자연 발생 단백질 (동일하거나 상이한 단백질)로부터 유래된 TAD를 포함하며, 여기서 DBD 및 TAD는 둘 다 변형되었다. 이러한 실시양태에서, DBD는 그것이 유래된 자연 발생 단백질과 비교하여 상이한 표적 부위에 결합할 수 있고/거나, 이러한 변형된 DBD 및 TAD를 포함하는 eTF는 도메인이 유래된 자연 발생 단백질 (예를 들어, SCN1A 이외의 유전자(들))과 비교하여 상이한 유전자 (예를 들어, SCN1A)로부터의 발현을 조정하고/거나, 이러한 변형된 DBD 및 TAD를 포함하는 eTF는 DBD 및 TAD 도메인이 유래된 자연 발생 단백질과 비교하여 SCN1A의 발현을 상이하게 조정한다 (예를 들어, 상향조절 대 하향조절함).
DNA 결합 도메인 (DBD)
SCN1A를 상향조절하는 본원에 제공된 eTF는 관심 표적 부위 (예를 들어, 본원에 제공된 eTF에 의해 결합되는 경우에 SCN1A의 상향조절을 유발하는 표적 부위)에 결합하는 임의의 적합한 DBD를 포함할 수 있다. 특정 실시양태에서, DBD는 합성적으로 설계된 DBD일 수 있다. 다른 실시양태에서, DBD는 자연 발생 단백질로부터 유래될 수 있다. DBD 패밀리는 염기성 헬릭스-루프-헬릭스 (bHLH) (예를 들어, c-Myc), 염기성-류신 지퍼 (예를 들어, C/EBP), 헬릭스-턴-헬릭스 (예를 들어, Oct-1) 및 아연 핑거 (예를 들어, EGR1 또는 EGR3)를 포함한다. 이들 패밀리는 광범위한 DNA 결합 특이성 및 유전자 표적을 나타낸다. 본원에서 고려된 바와 같이, 공지된 인간 전사 인자 단백질 중 어느 하나는 특이적 표적 부위를 인식하도록 DBD를 조작 및/또는 재프로그램화하여 내인성 SCN1A 유전자의 발현을 조정하기 위한 단백질 플랫폼으로서의 역할을 할 수 있다. 예시적인 실시양태에서, 본원에 제공된 DBD는 아연 핑거 도메인, TALEN 결합 도메인 또는 gRNA/Cas 복합체를 포함한다.
본원에 제공된 DBD는 SCN1A의 상향조절을 유발하는 임의의 표적 부위를 인식하도록 설계될 수 있다. 예시적인 실시양태에서, DBD는 게놈 위치를 인식하고 eTF에 의해 결합되는 경우에 내인성 SCN1A 유전자의 발현을 상향조절하도록 설계된다. 본원에 제공된 eTF에 의해 결합되는 경우에 내인성 SCN1A 유전자의 발현을 조정할 수 있는 결합 부위는 SCN1A 유전자 발현의 조정을 유발하는 곳이라면 게놈 내의 어디에나 위치할 수 있다. 다양한 실시양태에서, 결합 부위는 SCN1A와 상이한 염색체 상에, SCN1A와 동일한 염색체 상에, SCN1A 유전자의 전사 개시 부위 (TSS)의 상류에, SCN1A 유전자의 TSS의 하류에, SCN1A 유전자의 TSS에 대해 근위에, SCN1A 유전자에 대해 원위에, SCN1A 유전자의 코딩 영역 내에, SCN1A 유전자의 인트론 내에, SCN1A 유전자의 폴리A 테일의 하류에, SCN1A 유전자를 조절하는 프로모터 서열 내에 또는 SCN1A 유전자를 조절하는 인핸서 서열 내에 위치할 수 있다.
DBD는, 예를 들어 오프-타겟 결합이 최소이거나 없이 DBD에 의한 표적 결합 부위 서열의 특이적 인식을 제공하는 한, 임의의 길이의 표적 결합 부위에 결합하도록 설계될 수 있다. 특정 실시양태에서, 표적 결합 부위는 eTF에 의해 결합되는 경우에 다른 모든 유전자와 비교하여 적어도 2배, 5배, 10배, 20배, 50배, 75배, 100배, 150배, 200배, 250배, 500배 또는 그 초과인 수준으로 SCN1A의 발현을 조정할 수 있다. 특정 실시양태에서, 표적 결합 부위는 eTF에 의해 결합되는 경우에 40개의 가장 가까운 이웃 유전자 (예를 들어, SCN1A의 코딩 서열의 상류 또는 하류에 있는, 염색체 상에 가장 가깝게 위치한 40개의 유전자)와 비교하여 적어도 2배, 5배, 10배, 20배, 50배, 75배, 100배, 150배, 200배, 250배, 500배 또는 그 초과인 수준으로 SCN1A의 발현을 조정할 수 있다. 특정 실시양태에서, 표적 결합 부위는 적어도 5 bp, 10 bp, 15 bp, 20 bp, 25 bp, 30 bp, 35 bp, 40 bp, 45 bp 또는 50 bp 또는 그 초과일 수 있다. 결합 부위의 특정 길이는 eTF 내의 DBD 유형에 의해 정보가 제공될 것이다. 일반적으로, 결합 부위의 길이가 길수록, 유전자 발현의 결합 및 조정에 대한 특이성이 더 크다 (예를 들어, 결합 부위가 길수록 오프-타겟 효과가 더 적음). 특정 실시양태에서, 보다 긴 표적 결합 부위를 인식하는 DBD를 갖는 eTF는 보다 짧은 표적 부위에 결합하는 DBD를 갖는 eTF에서 관찰된 오프-타겟 효과에 비해 비-특이적 결합과 연관된 오프-타겟 효과 (예컨대, 예를 들어 오프-타겟 유전자 또는 SCN1A 이외의 유전자의 발현의 조정)가 더 적다. 일부 경우에, 오프-타겟 결합의 감소는 더 짧은 표적 결합 부위를 인식하는 DBD를 갖는 대등한 eTF와 비교하여 적어도 1.2, 1.3, 1.4, 1.5, 2, 3, 4, 5, 6, 7, 8, 9 또는 10배 더 낮다.
특정 실시양태에서, 본원에 제공된 DBD는 증가된 결합 친화도를 갖도록 변형되어, 그가 보다 긴 기간 동안 표적 결합 부위에 결합함으로써, DBD에 접합된 TAD가 보다 많은 전사 인자를 동원하고/거나 이러한 전사 인자를 보다 긴 기간 동안 동원하여 내인성 SCN1A 유전자의 발현 수준에 대해 보다 큰 효과를 발휘하도록 할 수 있다. 특정 실시양태에서, DBD는 목적하는 표적 부위에 대한 그의 특이적 결합 (또는 온-타겟 결합)을 증가시키도록 변형될 수 있고/거나 그의 비-특이적 또는 오프-타겟 결합을 감소시키도록 변형될 수 있다.
다양한 실시양태에서, DBD 또는 eTF와 표적 결합 부위 사이의 결합은 다양한 방법을 이용하여 결정될 수 있다. 특정 실시양태에서, DBD 또는 eTF와 표적 결합 부위 사이의 특이적 결합은 이동성 변화 검정, DNase 보호 검정, 또는 단백질-DNA 결합을 검정하기 위한 관련 기술분야에 공지된 임의의 다른 시험관내 방법을 사용하여 결정될 수 있다. 다른 실시양태에서, eTF와 표적 결합 부위 사이의 특이적 결합은 기능적 검정을 사용하여, 예를 들어 표적 결합 부위가 eTF에 의해 결합되는 경우에 유전자 (예를 들어, SCN1A)의 발현 (RNA 또는 단백질)을 측정함으로써 결정될 수 있다. 예를 들어, 표적 결합 부위는 세포에 함유되거나 세포의 게놈 내로 통합된 벡터 상의 리포터 유전자 (예컨대, 예를 들어 eGFP) 또는 SCN1A 유전자의 상류에 위치할 수 있으며, 여기서 세포는 eTF를 발현한다. 대안적으로, eTF를 발현하는 벡터는 SCN1A 유전자를 자연 함유하는 세포 유형 내로 도입될 수 있다. 대조군 (예를 들어, eTF가 없거나 또는 상이한 표적 부위를 인식하는 eTF)과 비교하여 eTF의 존재 하에 리포터 유전자 (또는 SCN1A)의 발현 수준이 더 큰 것은 eTF의 DBD가 표적 부위에 결합한다는 것을 나타낸다. 적합한 시험관내 (예를 들어, 비-세포 기반) 전사 및 번역 시스템이 또한 유사한 방식으로 사용될 수 있다. 특정 실시양태에서, 표적 부위에 결합하는 eTF는 대조군 (예를 들어, eTF가 없거나 상이한 표적 부위를 인식하는 eTF)과 비교하여 리포터 유전자 또는 SCN1A의 적어도 2배, 3배, 5배, 10배, 15배, 20배, 30배, 50배, 75배, 100배, 150배 또는 그 초과의 발현을 가질 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 적어도 9bp, 12bp, 15bp, 18bp, 21bp, 24bp, 27bp, 30bp, 33bp 또는 36bp 크기; 9bp, 12bp, 15bp, 18bp, 21bp, 24bp, 27bp 또는 30bp 초과; 또는 9-33bp, 9-30bp, 9-27bp, 9-24bp, 9-21bp, 9-18bp, 9-15bp, 9-12bp, 12-33bp, 12-30bp, 12-27bp, 12-24bp, 12-21bp, 12-18bp, 12-15bp, 15-33bp, 15-30bp, 15-27bp, 15-24bp, 15-21bp, 15-18bp, 18-33bp, 18-30bp, 18-27bp, 18-24bp, 18-21bp, 21-33bp, 21-30bp, 21-27bp, 21-24bp, 24-33bp, 24-30bp, 24-27bp, 27-33bp, 27-30bp 또는 30-33bp인 표적 결합 부위를 인식한다. 예시적 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 18-27bp, 18bp 또는 27bp인 표적 결합 부위를 인식한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 염색체 2 상에 위치하는 표적 결합 부위를 인식한다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 염색체 2 상에 위치하는 SCN1A의 TSS의 상류 또는 하류 110 kb, 100 kb, 90 kb, 80 kb, 70 kb, 60 kb, 50 kb, 40 kb, 30 kb, 20 kb, 10 kb, 5 kb, 4 kb, 3 kb, 2 kb 또는 1 kb 내의 표적 결합 부위를 인식한다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 염색체 2 상에 위치하는 SCN1A의 TSS의 상류 110 kb 내의 표적 결합 부위를 인식한다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 염색체 2 상에 위치하는 SCN1A의 TSS의 하류 110 kb 내의 표적 결합 부위를 인식한다. 예시적 실시양태에서, 이러한 표적 결합 부위는 18-27bp, 18bp 또는 27bp이다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 염색체 2 상에 위치하는 위치 166179652-165989571, 위치 166128050-166127958, 위치 166155414-166140590, 위치 166179652-1661777272 또는 위치 1659990246-165989592 (모두 GRCh38.p12를 참조함) 내의 표적 결합 부위를 인식한다. 예시적 실시양태에서, 이러한 표적 결합 부위는 18-27bp, 18bp 또는 27bp이다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 염색체 2 상의 166178880, 166177369, 166177362, 166177299, 166155393, 166155264, 166149373, 166149176, 166149165, 166149118, 166148953, 166148565, 166142396, 166142391, 166142344, 166142239, 166141162, 166140928, 166140590, 165990076, 165989684, 165989571, 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 또는 166128025 (모두 GRCh38.p12를 참조함)로부터 선택된 위치와 중첩되며, (iii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 1.2배 증가를 가져올 수 있는 표적 결합 부위를 인식한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 18, 25, 30, 31 또는 35-66 중 어느 것을 포함하거나 그로 이루어진 표적 부위에 결합하고, (ii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 1.2배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 염색체 2 상의 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 또는 166128025 (모두 GRCh38.p12를 참조함)로부터 선택된 위치와 중첩되며, (iii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 2배 증가를 가져올 수 있는 표적 결합 부위를 인식한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 18, 30, 31, 37, 38, 45, 47, 48, 49, 55, 61, 62 또는 64 중 어느 것을 포함하거나 그로 이루어진 표적 부위에 결합하고, (ii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 2배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 염색체 2 상의 166149168, 166127991, 166128002, 166128037 또는 166128025 (모두 GRCh38.p12를 참조함)로부터 선택된 위치와 중첩되며, (iii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 5배 증가를 가져올 수 있는 표적 결합 부위를 인식한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 18, 30, 31, 37 또는 38 중 어느 것을 포함하거나 그로 이루어진 표적 부위에 결합하고, (ii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 5배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 염색체 2 상의 166128002, 166128037 또는 166128025 (모두 GRCh38.p12를 참조함)로부터 선택된 위치와 중첩되며, (iii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 15배 증가를 가져올 수 있는 표적 결합 부위를 인식한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 30, 37 또는 38 중 어느 것을 포함하거나 그로 이루어진 표적 부위에 결합하고, (ii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 15배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 염색체 2 상의 166128037 또는 166128025 (모두 GRCh38.p12를 참조함)로부터 선택된 위치와 중첩되며, (iii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 20배 증가를 가져올 수 있는 표적 결합 부위를 인식한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 30 또는 38 중 어느 것을 포함하거나 그로 이루어진 표적 부위에 결합하고, (ii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 20배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 염색체 2 상의 위치 166128025에서의 위치와 중첩되며, (iii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 25배 증가를 가져올 수 있는 표적 결합 부위를 인식한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 30을 포함하거나 그로 이루어진 표적 부위에 결합하고, (ii) 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 25배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 서열식별번호: 18, 25, 30, 31 또는 35-66 중 어느 하나의 서열을 갖는 게놈 위치의 적어도 1 kb, 750 bp, 500 bp, 400 bp, 300 bp, 200 bp, 100 bp 또는 50 bp 내에 있는 게놈 영역에 결합하는 표적 결합 부위를 인식한다. 특정 실시양태에서, 표적 결합 부위는 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 1.2배, 2배, 5배, 15배, 20배 또는 25배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 18-27bp, 18bp 또는 27bp이고, (ii) 서열식별번호: 18, 25, 30, 31 또는 35-66 중 어느 하나의 서열을 갖는 게놈 위치와 적어도 부분적으로 중첩되는 게놈 영역에 결합하는 표적 결합 부위를 인식한다. 특정 실시양태에서, 표적 결합 부위는 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 1.2배, 2배, 5배, 15배, 20배 또는 25배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 하기 서열: 서열식별번호: 18, 25, 30, 31 또는 35-66 중 어느 하나를 갖는 표적 결합 부위를 인식한다. 특정 실시양태에서, 표적 결합 부위는 본원에 개시된 eTF에 의해 결합되는 경우에 SCN1A의 발현의 적어도 1.2배, 2배, 5배, 15배, 20배 또는 25배 증가를 가져올 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 대조군 (예를 들어, eTF가 없거나 또는 표적 부위를 인식하지 않는 eTF)과 비교하여 세포 또는 생체내에서 SCN1A 발현 (SCN1A RNA 및/또는 Nav1.1 단백질)의 적어도 1.5배, 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 25배, 50배, 100배 또는 그 초과 또는 적어도 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과의 상향조절을 유발한다. 다양한 실시양태에서, SCN1A 발현의 상향조절은 PCR 방법, 웨스턴 블롯 또는 면역검정을 사용하여 검출될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 전사 활성화 검정에서 대조군에 비해 SCN1A 발현을 적어도 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 3배, 4배, 5배, 8배, 10배, 12배, 15배, 18배, 20배, 25배, 30배, 40배, 50배, 75배, 100배 또는 그 초과만큼 또는 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 증가시킬 수 있는 표적 부위에 결합한다. 예시적인 SCN1A 전사 활성화 검정이 본원의 실시예 3에 제공된다. 간략하게, HEK293을 eTF 또는 대조군 eGFP 리포터 구축물을 보유하는 플라스미드로 형질감염시킨다. 형질감염 48시간 후에, 세포를 수집하고, RNA를 단리하고, 역전사시키고, 생성된 cDNA 샘플을 qPCR (예를 들어, 서열식별번호: 185 및 186을 갖는 프라이머를 사용함)에 의해 분석하여 내인성 SCN1A 전사체의 수준을 정량화한다. GAPDH는 SCN1A 발현의 상대 수준을 결정하기 위한 참조 유전자로서 사용될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 최소의 오프-타겟 효과, 예를 들어 비-특이적 결합과 연관된 오프-타겟 효과를 가지며, 예컨대, 예를 들어 오프-타겟 유전자 또는 SCN1A 이외의 유전자의 발현을 조정한다. 한 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 대조군과 비교하여 1개 이상의 오프-타겟 유전자에 대한 eTF에 의해 생산된 발현보다 적어도 5배, 10배, 15배, 20배, 25배, 30배, 40배 또는 50배 더 크게, 대조군과 비교하여 SCN1A를 특이적으로 상향조절한다. 예시적 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 대조군에 비해 eTF에 의해 생산된 40개의 가장 가까운 이웃 유전자 (예를 들어, 염색체 2 상의 SCN1A의 코딩 서열에 위치한 40개의 가장 가까운 유전자), 예를 들어 PLA2R1, ITGB6, RBMS1, TANK, PSMD14, TBR1, SLC4A10, DPP4, FAP, IFIH1, GCA, FIGN, GRB14, COBLL1, SLC38A11, SCN3A, SCN2A, CSRNP3, GALNT3, TTC21B, SCN9A, SCN7A, B3GALT1, STK39, CERS6, NOSTRIN, SPC25, ABCB11, DHRS9, BBS5, KLHL41, FASTKD1, PPIG, CCDC173, PHOSPHO2, KLHL23, SSB, METTL5, UBR3 및 MYO3B의 전사보다 적어도 15배 더 크게, 대조군과 비교하여 SCN1A 유전자로부터의 전사를 특이적으로 상향조절한다 (표 14 참조). 다양한 실시양태에서, SCN1A 유전자로부터의 전사의 상향조절은 PCR 방법을 사용하여 검출될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 드라베 증후군의 Scn1atm1kea 마우스 모델에서의 고체온 발작 (HTS) 검정에서 발작의 빈도를 감소시킬 수 있다. 특정 실시양태에서, 본원에 개시된 eTF는 HTS 검정에서 42.6℃에서의 발작 빈도를 대조군 (예를 들어, PBS 처리되거나 또는 eGFP를 코딩하는 서열을 포함하는 AAV 벡터로 처리됨)과 비교하여 적어도 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2.0배 또는 그 초과만큼 또는 적어도 20%, 30% 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 그 초과만큼 감소시킬 수 있다. 특정 실시양태에서, 본원에 개시된 eTF는 HTS 검정이 실행된 마우스의 적어도 60%, 62%, 65%, 70%, 75%, 76%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%가 42.6℃에서의 발작이 없도록 상기 검정에서 42.6℃에서의 발작의 빈도를 감소시킬 수 있다. 예시적인 HTS 검정은 본원의 실시예 6에 기재되어 있다. 간략하게, 암컷 C57Bl/6J 마우스와 교배된 수컷 Scn1a +/- 마우스로부터 생산된 한배새끼들에게 본원에 제공된 바와 같은 SCN1A를 상향조절하는 eTF를 코딩하는 AAV9 벡터 또는 eGFP를 코딩하는 대조군 벡터를 P1에서 양측 ICV를 통해 투여할 수 있다. 마우스에게 ~1.0E10-5.0E12 gc/마우스를 투여할 수 있다. HTS 검정은 혼합된 129Stac X C57BL/6 배경의 P26-P28 SCN1A 이형접합 마우스 및 SCN1A 야생형 마우스에서 자세 상실이 동반된 제1 긴장성-간대성 발작의 발병까지 또는 43℃의 체온에 도달할 때까지 마우스의 체온을 2분마다 ~0.5℃만큼 증가시킴으로써 (제어 조건 하에 체온 모니터링을 수반함) 수행된다. 마우스는 실험의 전체 과정에 걸쳐 자세 상실이 동반된 발작이 검출되지 않는 경우에 발작이 없는 것으로 간주된다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 SCN1A에 대해 이형접합인 마우스, 예를 들어 Scn1atm1kea 마우스 계통의 생존을 증가시킬 수 있다. 특정 실시양태에서, 본원에 개시된 eTF는 P100에서 SCN1A 이형접합 마우스의 생존율을 대조군 (예를 들어, PBS 처리되거나 또는 eGFP를 코딩하는 서열을 포함하는 AAV 벡터로 처리됨)과 비교하여 적어도 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2.0배 또는 그 초과만큼 또는 적어도 20%, 30% 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 그 초과만큼 증가시킬 수 있다. 특정 실시양태에서, 본원에 개시된 eTF는 검정이 실행된 마우스의 적어도 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%가 P100에서 여전히 살아있도록 P100에서 SCN1A 이형접합 마우스의 생존율을 증가시킬 수 있다. 예시적인 생존 검정이 본원의 실시예 7에 기재되어 있다. 간략하게, 암컷 C57Bl/6J 마우스와 교배된 수컷 Scn1a +/- 마우스로부터 생산된 한배새끼들에게 P1에서 양측 ICV를 통해 AAV9 벡터를 투여할 수 있다. 마우스에게 ~1.0E10-5.0E12 gc/마우스를 투여할 수 있다. P100까지 생존한 마우스의 수를 결정한다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 아연 핑거 단백질로부터의 것이거나, 아연 핑거 단백질로부터 유래되거나 또는 뉴클레아제 불활성화된 아연 핑거 단백질인 DBD를 포함할 수 있다. 아연 핑거는 폴드를 안정화시키기 위해 1개 이상의 아연 이온 (Zn2+)의 배위를 특징으로 하는 작은 단백질 구조적 모티프이다. 아연 핑거 (Znf) 도메인은 DNA 표적 부위와 탠덤 접촉하는 다수의 핑거-유사 돌출부를 함유하는 비교적 작은 단백질 모티프이다. 아연 핑거 모티프의 모듈 성질은 DNA 서열의 다수의 조합이 고도의 친화도 및 특이성으로 결합되는 것을 가능하게 하고, 따라서 특이적 DNA 서열에 표적화하고 결합할 수 있는 단백질의 조작에 이상적으로 적합하다. 많은 조작된 아연 핑거 어레이는 뮤린 전사 인자 Zif268의 아연 핑거 도메인에 기초한다. Zif268은 9 bp 서열에 고친화도로 집합적으로 결합하는 3개의 개별 아연 핑거 모티프를 갖는다. 매우 다양한 아연 핑거 단백질이 확인되었고, 본원에 추가로 기재된 바와 같이 구조에 기초하여 상이한 유형으로 특징화된다. 임의의 이러한 아연 핑거 단백질은 본원에 기재된 DBD와 관련하여 유용하다.
아연 핑거 단백질을 설계하는 다양한 방법이 이용가능하다. 예를 들어, 관심 표적 DNA 서열에 결합하도록 아연 핑거 단백질을 설계하는 방법이 기재되어 있다 (예를 들어, 문헌 [Liu Q, et al., Design of polydactyl zinc-finger proteins for unique addressing within complex genomes, Proc Natl Acad Sci USA. 94 (11): 5525-30 (1997); Wright DA et al., Standardized reagents and protocols for engineering zinc finger nucleases by modular assembly, Nat Protoc . Nat Protoc. 2006;1(3):1637-52; 및 CA Gersbach and T Gaj, Synthetic Zinc Finger Proteins: The Advent of Targeted Gene Regulation and Genome Modification Technologies, Am Chem Soc 47: 2309-2318 (2014)] 참조). 추가로, 관심 DNA 표적 서열에 결합하도록 아연 핑거 단백질을 설계하기 위한 다양한 웹 기반 도구가 공개적으로 입수가능하다 (예를 들어, 월드 와이드 웹 omictools.com/zfns-category에서 이용가능한 OmicX로부터의 아연 핑거 뉴클레아제 설계 소프트웨어 툴 및 게놈 조작 데이터 분석 웹사이트; 및 월드 와이드 웹 scripps.edu/barbas/zfdesign/zfdesignhome.php에서 이용가능한 Scripps로부터의 아연 핑거 툴 설계 웹사이트 참조). 추가로, 관심 DNA 표적 서열에 결합하도록 아연 핑거 단백질을 설계하기 위한 다양한 상업적으로 입수가능한 서비스가 이용가능하다 (예를 들어, 크리에이티브 바이오랩스(Creative Biolabs)에 의해 제공된 상업적으로 입수가능한 서비스 또는 키트 (월드 와이드 웹 creative-biolabs.com/Design-and-Synthesis-of-Artificial-Zinc-Finger-Proteins.html), 애드진(Addgene)으로부터 이용가능한 아연 핑거 컨소시엄 모듈 어셈블리 키트 (월드 와이드 웹 addgene.org/kits/zfc-modular-assembly/), 또는 시그마 알드리치(Sigma Aldrich)로부터의 CompoZr 커스텀 ZFN 서비스 (월드 와이드 웹 sigmaaldrich.com/life-science/zinc-finger-nuclease-technology/custom-zfn.html) 참조).
특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 1개 이상의 아연 핑거를 포함하는 DBD를 포함하거나 또는 아연 핑거 단백질의 DBD로부터 유래된다. 일부 경우에, DBD는 다수의 아연 핑거를 포함하며, 여기서 각각의 아연 핑거는 그의 N-말단 또는 C-말단 또는 둘 다에서 아미노산 링커를 통해 또 다른 아연 핑거 또는 또 다른 도메인에 연결된다. 일부 경우에, 본원에 제공된 DBD는 표 9에 기재된 아연 핑거 유형 중 1개 이상으로부터의 1개 이상의 아연 핑거를 포함한다. 일부 경우에, 본원에 제공된 DBD는 복수의 아연 핑거 구조 또는 모티프, 또는 서열식별번호: 152-167 중 1개 이상을 갖는 복수의 아연 핑거 또는 그의 임의의 조합을 포함한다. 특정 실시양태에서, DBD는 X-[ZF-X]n 및/또는 [X-ZF]n-X를 포함하며, 여기서 ZF는 표 9에 열거된 모티프 중 어느 하나 (예를 들어, 서열식별번호: 136-146 중 어느 하나)를 갖는 아연 핑거 도메인이고, X는 1-50개의 아미노산을 포함하는 아미노산 링커이고, n은 1-15의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이고, 각각의 ZF는 독립적으로 DBD 내의 다른 ZF 서열과 동일한 서열 또는 상이한 서열을 가질 수 있고, 각각의 링커 X는 독립적으로 DBD 내의 다른 X 서열과 동일한 서열 또는 상이한 서열을 가질 수 있다. 각각의 아연 핑거는 그의 C-말단, N-말단 또는 둘 다에서 또 다른 서열, 아연 핑거 또는 도메인에 연결될 수 있다. DBD에서, 각각의 링커 X는 서열, 길이 및/또는 성질 (예를 들어, 가요성 또는 전하)이 동일할 수 있거나 또는 서열, 길이 및/또는 성질이 상이할 수 있다. 일부 경우에, 2개 이상의 링커는 동일할 수 있는 반면, 다른 링커는 상이하다. 예시적 실시양태에서, 링커는 표 9에 제공된 1개 이상의 자연 발생 아연 핑거 단백질에서 발견되는 아연 핑거를 연결하는 서열로부터 수득되거나 유래될 수 있다. 다른 실시양태에서, 적합한 링커 서열은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조하며, 이들 각각은 그 전문이 본원에 포함된다. 본원에 제공된 DBD 단백질은 단백질의 개별 아연 핑거들 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 본원에 기재된 DBD 단백질은 단백질의 개별 아연 핑거들 사이에 적합한 링커의 임의의 조합을 포함할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 1개 이상의 전형적 아연 핑거를 포함하는 DBD를 포함한다. 전형적 C2H2 아연-핑거는 아연 이온에 의해 배위되는, 하나의 쇄 내의 2개의 시스테인 및 또 다른 쇄 내의 2개의 히스티딘 잔기를 갖는다. 전형적 아연-핑거 도메인은 2개의 β-시트 및 1개의 α-헬릭스를 가지며, 여기서 α-헬릭스는 DNA 분자와 상호작용하고, 표적 부위에 대한 DBD 결합의 기초를 형성하고, "인식 헬릭스"로 지칭될 수 있다. 예시적 실시양태에서, 아연 핑거의 인식 헬릭스는 위치 -1, 2, 3 또는 6에서 적어도 1개의 아미노산 치환을 포함함으로써 아연 핑거 도메인의 결합 특이성을 변화시킨다. 다른 실시양태에서, 본원에 제공된 DBD는 1개 이상의 비-전형적 아연-핑거, 예를 들어 C2-H2, C2-CH 및 C2-C2를 포함한다.
또 다른 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 하기 구조를 갖는 아연 핑거 모티프를 포함하는 DBD를 포함한다: LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (서열식별번호: 147), 여기서 n은 1-15의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이고, 각각의 X는 독립적으로 3 bp의 표적 서열에 결합할 수 있는 인식 서열 (예를 들어, 인식 헬릭스)이다. 예시적 실시양태에서, n은 3, 6 또는 9이다. 특히 바람직한 실시양태에서, n은 6이다. 다양한 실시양태에서, 각각의 X는 독립적으로 DBD 내의 다른 X 서열과 비교하여 동일한 아미노산 서열 또는 상이한 아미노산 서열을 가질 수 있다. 예시적 실시양태에서, 각각의 X는 월드 와이드 웹 scripps.edu/barbas/zfdesign/zfdesignhome.php에 위치한 Scripps로부터의 아연 핑거 설계 툴을 사용하여 3 bp의 관심 표적 결합 부위와 상호작용하도록 설계된 7개의 아미노산을 포함하는 서열이다.
DBD 내의 각각의 아연 핑거가 3 bp를 인식하기 때문에, DBD에 포함된 아연 핑거의 수는 DBD에 의해 인식되는 결합 부위의 길이에 대한 정보를 제공하며, 예를 들어 1개의 아연 핑거를 수반한 DBD는 3 bp를 갖는 표적 결합 부위를 인식할 것이고, 2개의 아연 핑거를 수반한 DBD는 6 bp를 갖는 표적 결합 부위를 인식할 것이고, 3개의 아연 핑거를 수반한 DBD는 9 bp를 갖는 표적 결합 부위를 인식할 것이고, 4개의 아연 핑거를 수반한 DBD는 12 bp를 갖는 표적 결합 부위를 인식할 것이고, 5개의 아연 핑거를 수반한 DBD는 15 bp를 갖는 표적 결합 부위를 인식할 것이고, 6개의 아연 핑거를 수반한 DBD는 18 bp를 갖는 표적 결합 부위를 인식할 것이고, 9개의 아연 핑거를 수반한 DBD는 27 bp를 갖는 표적 결합 부위를 인식할 것이라는 점 등이다. 일반적으로, 보다 긴 표적 결합 부위를 인식하는 DBD는 보다 큰 결합 특이성 (예를 들어, 보다 적은 오프-타겟 결합 또는 비-특이적 결합)을 나타낼 것이다.
다른 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 DBD의 결합 특이성을 변화시키도록 (예를 들어, DBD에 의해 인식되는 표적 부위를 변화시키도록) 아연 핑거 도메인의 인식 헬릭스 중 1개 이상에 1개 이상의 아미노산 치환을 생성함으로써 자연 발생 아연 핑거 단백질로부터 유래된 DBD를 포함한다. 본원에 제공된 DBD는 임의의 자연 발생 아연 핑거 단백질로부터 유래될 수 있다. 다양한 실시양태에서, 이러한 DBD는 임의의 종, 예를 들어 마우스, 래트, 인간 등의 아연 핑거 단백질로부터 유래될 수 있다. 예시적 실시양태에서, 본원에 제공된 DBD는 인간 아연 핑거 단백질로부터 유래된다. 특정 실시양태에서, 본원에 제공된 DBD는 표 9에 열거된 자연 발생 단백질로부터 유래된다. 예시적 실시양태에서, 본원에 제공된 DBD 단백질은 인간 EGR 아연 핑거 단백질, 예를 들어 EGR1, EGR2, EGR3 또는 EGR4로부터 유래된다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 자연 발생 단백질의 DBD 내에서 1개 이상의 아연 핑거를 반복시켜 DBD 단백질 내의 아연 핑거 도메인의 수를 증가시키도록 DBD를 변형시킴으로써 자연 발생 단백질로부터 유래된 DBD를 포함한다. 특정 실시양태에서, 이러한 변형은 자연 발생 단백질의 DBD 내의 이중반복, 삼중반복, 사중반복 또는 추가 다중반복의 아연 핑거를 포함한다. 일부 경우에, 인간 단백질의 DBD로부터의 1개의 아연 핑거가 다중반복되며, 예를 들어 동일한 아연 핑거 모티프의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 카피가 eTF의 DBD에서 반복된다. 일부 경우에, 자연 발생 단백질의 DBD로부터의 아연 핑거의 세트가 다중반복되며, 예를 들어 자연 발생 단백질의 DBD로부터의 3개 아연 핑거의 세트가 이중반복되어 6개의 아연 핑거를 수반한 DBD를 갖는 eTF가 생성되거나, 삼중반복되어 9개의 아연 핑거를 수반한 eTF의 DBD가 생성되거나, 또는 사중반복되어 12개의 아연 핑거를 수반한 eTF의 DBD가 생성되는 등이다. 일부 경우에, 자연 발생 단백질의 DBD로부터의 아연 핑거의 세트가 부분적으로 반복되어 더 많은 수의 아연 핑거를 갖는 eTF의 DBD가 형성되며, 예를 들어 eTF의 DBD는 4개의 아연 핑거를 포함하고, 여기서 이러한 아연 핑거는 eTF의 DBD 내의 총 4개의 아연 핑거에 대해 자연 발생 단백질로부터의 제1 아연 핑거의 1개 카피, 제2 아연 핑거의 1개 카피 및 제3 아연 핑거의 2개 카피를 나타낸다. 이어서, 이러한 DBD는 DBD의 결합 특이성을 변화시키도록 (예를 들어, DBD에 의해 인식되는 표적 부위를 변화시키도록) 아연 핑거 도메인의 인식 헬릭스 중 1개 이상에 1개 이상의 아미노산 치환을 만듦으로써 추가로 변형된다. 예시적 실시양태에서, DBD는 자연 발생 인간 단백질, 예컨대 인간 EGR 아연 핑거 단백질, 예를 들어 EGR1, EGR2, EGR3 또는 EGR4로부터 유래된다.
인간 EGR1 및 EGR3은 3개 핑거의 C2H2 아연 핑거 DBD를 특징으로 한다. 아연 핑거에 대한 일반적 결합 규칙은 모든 3개의 핑거가 각각의 아연 핑거의 알파 헬릭스에서 동일한 아미노산을 사용하여 유사한 기하구조를 갖는 그의 동족 DNA 서열과 상호작용함으로써 표적 결합 부위 서열의 특이성 또는 인식을 결정하는 것을 제공한다. 이러한 결합 규칙은 목적하는 표적 결합 부위를 인식하는 DBD를 조작하도록 EGR1 또는 EGR3의 DBD를 변형시키는 것을 가능하게 한다. 일부 경우에, EGR1 또는 EGR3의 아연 핑거 모티프 내의 7-아미노산 DNA 인식 헬릭스는 공개된 아연 핑거 설계 규칙에 따라 변형된다. 특정 실시양태에서, EGR1 또는 EGR3의 3개 핑거의 DBD 내의 각각의 아연 핑거는, 예를 들어 1개 이상의 인식 헬릭스의 서열을 변경시킴으로써 및/또는 DBD 내의 아연 핑거의 수를 증가시킴으로써 변형된다. 특정 실시양태에서, EGR1 또는 EGR3은 목적하는 표적 부위에서 적어도 9, 12, 15, 18, 21, 24, 27, 30, 33, 36개 또는 그 초과의 염기 쌍의 표적 결합 부위를 인식하도록 재프로그램화된다. 특정 실시양태에서, ERG1 또는 EGR3으로부터 유래된 이러한 DBD는 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 아연 핑거를 포함한다. 예시적 실시양태에서, DBD 내의 아연 핑거 중 1개 이상은 인식 헬릭스의 위치 -1, 2, 3 또는 6에서 적어도 1개의 아미노산 치환을 포함한다.
다양한 실시양태에서, EGR1 또는 EGR3으로부터 유래된 DBD를 포함하는 SCN1A를 상향조절하는 eTF는 자연 발생 EGR1 또는 EGR3의 결합 특이성과 상이한 DNA 결합 특이성을 가지며, 예를 들어 DBD는 비변형된 EGR1 또는 EGR3에 의해 인식되는 결합 부위의 서열과 상이한 서열: (GCG(T/G)GGGCG) (서열식별번호: 182)을 갖는 표적 결합 부위를 인식한다.
다른 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 gRNA/Cas 복합체인 DBD를 포함한다. CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)/Cas9는 부위-특이적 게놈 표적화를 가능하게 하는 게놈 편집 도구이다. 유형 II CRISPR/Cas 시스템은 비코딩 RNA를 사용하여 Cas9 뉴클레아제가 부위-특이적 DNA 절단을 유도하도록 안내하는 원핵 적응 면역 반응 시스템이다. CRISPR/Cas9 시스템은 포유동물 세포에서 게놈 편집을 매개하는 간단한 RNA-프로그램가능한 방법을 생성하기 위해 이용되어 왔다. 단일 가이드 RNA (sgRNA)는 Cas9 뉴클레아제를 특이적 게놈 위치로 지시하기 위해 생성될 수 있고, 이어서 그 위치에 gRNA/Cas9 복합체가 결합한다. gRNA는 다양한 방법 및 도구를 사용하여 관심 표적 부위에 결합하도록 설계될 수 있다. 예를 들어, 관심 표적 DNA 서열에 결합하도록 gRNA를 설계하는 방법은 문헌 [Aach, et al. Flexible algorithm for identifying specific Cas9 targets in genomes. BioRxiv, Cold Spring Harbor Labs. doi: http://dx.doi.org/10.1101/005074 (2014); Bae, et al. Cas-OFFinder: a fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics. 30(10):1473-1475 (2014); Doench, J. G. et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9. Nat Biotech 34, 184-191 (2016); Gratz, et al. Highly specific and efficient CRISPR/Cas9-catalyzed homology-directed repair in Drosophila. Genetics. 196(4):961-971 (2014); Heigwer, et al. E-CRISP: fast CRISPR target site identification. Nat Methods. 11(2):122-123 (2014); Ma, et al. A guide RNA sequence design platform for the CRISPR/Cas9 system for model organism genomes. Biomed Res Int. doi:http://doi.org/10.1155/2013/270805 (2013); Montague, et al. CHOPCHOP: a CRISPR/Cas9 and TALEN web tool for genome editing. Nucleic Acids Res. 42(W1):W401-W407 (2014); Liu, et al. CRISPR-ERA: a comprehensive design tool for CRISPR-mediated gene editing, repression and activation. Bioinformatics. 31(22):3676-3678 (2015); Ran, et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature. 520(7546):186-191 (2015); Wu, et al. Target specificity of the CRISPR-Cas9 system. Quant Biol. 2(2):59-70 (2015); Xiao, et al. CasOT: a genome-wide Cas9/gRNA off-target searching tool. Bioinformatics. 30(8):1180-1182 (2014); Zetsche, et al. Cpf1 is a single RNA-guided endonuclease of a Class 2 CRISPR-Cas System. Cell. 163(3):759-771 (2015)]에 기재되어 있다. 추가로, 관심 DNA 표적 서열에 결합하도록 gRNA를 설계하기 위한 다양한 웹 기반 도구가 공개적으로 입수가능하다 (예를 들어, 월드 와이드 웹 atum.bio/eCommerce/cas9/input?multipleContacts=false의 AUTM으로부터 입수가능한 CRISPR gRNA 설계 도구; 월드 와이드 웹 portals.broadinstitute.org/gpp/public/analysis-tools/sgrna-design-crisprai의 브로드 인스티튜트(Broad Institute)로부터 입수가능한 CRISPRa/i gRNA 설계 도구; 월드 와이드 웹 e-crisp.org/E-CRISP/의 DKFZ 저먼 캔서 리서치 센터(DKFZ German Cancer Research Center)로부터 입수가능한 E-CRISP 설계 도구; 및 월드 와이드 웹 design.synthego.com/#/의 신테고(Synthego)로부터 입수가능한 녹아웃 가이드 설계 도구 참조). 추가로, 관심 DNA 표적 서열에 결합하도록 gRNA를 설계하기 위한 다양한 상업적으로 입수가능한 서비스가 이용가능하며, 예를 들어 IDT (월드 와이드 웹 idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE), 써모피셔(ThermoFisher) (월드 와이드 웹 thermofisher.com/order/custom-oligo/crispr) 및 진스크립트(GenScript) (월드 와이드 웹 genscript.com/gRNA-design-tool.html)에 의해 제공된 상업적으로 입수가능한 서비스를 참조한다.
예시적 실시양태에서, gRNA/Cas 복합체인 DBD는 뉴클레아제 비활성화된 Cas 단백질 또는 dCas, 예컨대, 예를 들어 dCas9, 예컨대 뉴클레아제 비활성화된 스타필로코쿠스 아우레우스(Staphylococcus aureus) (dSaCas9) 또는 뉴클레아제 비활성화된 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) Cas9 (dSpCas9)를 포함한다. gRNA는 gRNA/Cas 복합체를 목적하는 표적 부위로 표적화하는 표적화 영역 및 Cas 단백질과의 상호작용을 용이하게 하는 스캐폴드 영역을 포함하는 서열로서 제공된다. 임의의 적합한 gRNA 스캐폴드가 본원에 제공된 gRNA와 함께 사용될 수 있다. 예시적 실시양태에서, gRNA는 단일 gRNA 또는 sgRNA이고, 하기 스캐폴드 서열을 포함한다: 5'-GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGA-3' (서열식별번호: 183). 가이드 RNA의 표적화 영역은 스캐폴드 서열의 5' 말단에 부착되어 완전한 sgRNA를 형성한다. 특정 실시양태에서, gRNA 및 dCas 단백질은 동일한 발현 카세트로부터 발현될 수 있다. 특정 실시양태에서, U6 프로모터가 gRNA를 발현시키는데 사용된다. 다른 실시양태에서, gRNA는 dCas-TAD 단백질을 안정하게 발현하도록 조작된 세포에서, 예를 들어 dCas를 게놈 내로 안정하게 통합시킴으로써 또는 염색체외에서 안정하게 유지되는 플라스미드 상에서 발현될 수 있다.
다른 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 TALEN으로부터의 것이거나, TALEN으로부터 유래되거나 또는 뉴클레아제 불활성화된 TALEN인 DBD를 포함할 수 있다. 전사 활성인자-유사 이펙터 뉴클레아제 (TALEN)는 DNA의 특이적 서열을 절단하도록 조작될 수 있는 뉴클레아제 도메인 및 DBD를 함유하는 제한 효소이다. TALEN은 TAL 이펙터 DNA 결합 도메인을 DNA 절단 도메인 (예를 들어, 뉴클레아제)에 접합시킴으로써 생성된다. 전사 활성인자-유사 이펙터 (TALE)는 목적하는 표적 DNA 서열에 결합함으로써 뉴클레아제 도메인을 특이적 위치로 지시하도록 조작될 수 있다.
TAL 이펙터는 크산토모나스(Xanthomonas) 박테리아로부터의 박테리아 단백질이다. DNA 결합 도메인은 분기 제12 및 제13 아미노산을 갖는 반복된 고도로 보존된 33-34개 아미노산 서열을 함유한다. 반복 가변 이잔기 (RVD)로 지칭되는 이들 2개의 위치는 고도로 가변적이고, 특이적 뉴클레오티드 인식과 강한 상관관계를 나타낸다. 아미노산 서열과 DNA 인식 사이의 이러한 직접적인 관계는 적절한 RVD를 함유하는 반복 절편들의 조합을 선택함으로써 목적하는 서열을 특이적으로 표적화하는 DBD의 조작을 가능하게 한다.
TALE를 설계하는 다양한 방법이 이용가능하다. 예를 들어, 관심 표적 DNA 서열에 결합하도록 TALE를 설계하는 방법은 문헌 [T. Cermak et al., Nucleic Acids Research. 39 (12): e82 (2011); F. Zhang F et al., Nature Biotechnology. 29 (2): 149-53 (2011); R. Morbitzer et al., Nucleic Acids Research. 39 (13): 5790-9 (2011); T. Li et al., Nucleic Acids Research. 39 (14): 6315-25 (2011); R. Geissler et al., PLOS One. 6(5): e19509 (2011); 및 E. Weber et al., PLOS One. 6 (5): e19722 (2011)]에 기재되어 있다. 추가로, 관심 DNA 표적 서열에 결합하도록 TALE를 설계하기 위한 다양한 웹 기반 도구가 공개적으로 입수가능하며, 예를 들어 월드 와이드 웹 e-talen.org/E-TALEN/TAL에서 이용가능한 E-Talen 및 월드 와이드 웹 tale-nt.cac.cornell.edu/node/add/single-tale에서 이용가능한 이펙터 뉴클레오티드 타겟터 2.0 도구를 참조한다. 추가로, 관심 DNA 표적 서열에 결합하도록 TALE를 설계하기 위한 다양한 상업적으로 입수가능한 서비스가 이용가능하며, 예를 들어 OmicX (월드 와이드 웹 omictools.com/), 애드진 (월드 와이드 웹 addgene.org/talen/guide/) 또는 써모피셔 (월드 와이드 웹 thermofisher.com/us/en/home/life-science/genome-editing/geneart-tals/tal-design-tool.html)에 의해 제공된 상업적으로 입수가능한 서비스를 참조한다. 추가로, TALE의 어셈블리에 적합한 올리고뉴클레오티드를 설계하기 위해 공개적으로 입수가능한 소프트웨어 프로그램 (DNAWorks)을 사용할 수 있다 (예를 들어, 문헌 [D. Hoover D Methods in Molecular Biology. 852: 215-23 (2012)] 참조).
전사 조정 도메인
SCN1A를 상향조절하는 본원에 제공된 eTF는 전사를 조정할 수 있거나 (예를 들어, RNA 폴리머라제 II, CBP/p300, CREB 또는 KRAB) 또는 eTF가 DBD (예를 들어, 아연 핑거 DBD, gRNA/Cas DBD 또는 TALE DBD)를 통해 표적 부위에 결합되는 경우에 관심 유전자로부터의 유전자 발현 수준을 조정할 수 있는 1종 이상의 단백질 인자를 동원할 수 있는 임의의 적합한 도메인을 포함할 수 있다. 특정 실시양태에서, 이러한 도메인은 관심 유전자의 전사 또는 유전자 발현의 수준을 증가시키는 단백질 인자를 동원하며, 이는 전사 활성화 도메인 (TAD)이다. 다른 실시양태에서, 이러한 도메인은 관심 유전자로부터의 전사 또는 유전자 발현의 수준을 감소시키는 단백질 인자를 동원하며, 이는 전사 억제인자 도메인 (TRD)이다. 특정 실시양태에서, 전사 조정 도메인 (TAD 또는 TRD)은 합성적으로 설계된 도메인일 수 있다. 다른 실시양태에서, 전사 조정 도메인 (TAD 또는 TRD)은 자연 발생 단백질, 예를 들어 전사 인자, 전사 보조-활성인자, 전사 보조-억제인자 또는 사일렌서 단백질로부터 유래될 수 있다. 다양한 실시양태에서, 전사 조정 도메인 (TAD 또는 TRD)은 임의의 종, 예를 들어 마우스, 래트, 원숭이, 바이러스 또는 인간의 단백질로부터 유래될 수 있다.
하나의 예시적 실시양태에서, SNC1A를 상향조절하는 본원에 제공된 eTF에 사용하기에 적합한 TAD는 바이러스 단백질로부터 유래된다. 바이러스 단백질로부터 유래된 예시적인 TAD는, 예를 들어 VP64 (서열식별번호: 133), VPR (서열식별번호: 132), VP16, VP128, p65, p300의 TAD 도메인 또는 그의 임의의 기능적 단편 또는 변이체 또는 그에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 서열을 포함한다.
또 다른 예시적 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF에 사용하기에 적합한 TAD는 인간 단백질로부터 유래된다. 인간 단백질로부터 유래된 예시적인 TAD는, 예를 들어 CBP/p300-상호작용 전사활성인자 2 (CITED2) (서열식별번호: 134), CBP/p300-상호작용 전사활성인자 4 (CITED4) (서열식별번호: 135), EGR1 (서열식별번호: 176), CREB3 (서열식별번호: 224) 또는 EGR3 (서열식별번호: 175)의 TAD 도메인 또는 그의 임의의 기능적 단편 또는 변이체 또는 그에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 서열을 포함한다.
특정 실시양태에서, SCN1A를 상향조절하는 eTF는 전사 활성화 도메인 또는 TAD와 접합되는 아연 핑거 DBD를 포함한다. 다양한 실시양태에서, 아연 핑거 DBD는 바이러스 단백질, 예컨대 VP64 또는 VPR로부터의 TAD, 또는 인간 단백질, 예컨대 CITED2, CITED4 또는 CREB3으로부터의 TAD에 접합될 수 있다. 특정 실시양태에서, 인간 단백질, 예를 들어 EGR1 또는 EGR3으로부터 유래된 아연 핑거 DBD는 인간 단백질, 예를 들어 CITED2, CITED4 또는 CREB3으로부터 유래된 TAD에 접합된다. 특정 실시양태에서, 인간 단백질, 예를 들어 EGR1 또는 EGR3으로부터 유래된 아연 핑거 DBD는 VP64 또는 VPR TAD에 접합된다. 특정 실시양태에서, 합성 아연 핑거 DBD 또는 인간 단백질, 예를 들어 EGR1 또는 EGR3에 대해 75% 미만의 서열 동일성을 갖는 아연 핑거 DBD는 인간 단백질, 예를 들어 CITED2, CITED4 또는 CREB3으로부터 유래된 TAD에 접합된다. 특정 실시양태에서, 합성 아연 핑거 DBD 또는 인간 단백질, 예를 들어 EGR1 또는 EGR3에 대해 75% 미만의 서열 동일성을 갖는 아연 핑거 DBD는 VP64 또는 VPR TAD에 접합된다.
특정 실시양태에서, dCas 단백질은 TAD에 접합된다. 다양한 실시양태에서, dCas9는 바이러스 단백질, 예컨대 VP64 또는 VPR로부터의 TAD, 또는 인간 단백질, 예컨대 CITED2, CITED4 또는 CREB3으로부터의 TAD에 접합될 수 있다. 예시적 실시양태에서, dCas9는 VP64 또는 VPR TAD에 접합된다.
특정 실시양태에서, TALE 단백질은 TAD에 접합된다. 다양한 실시양태에서, TALE는 바이러스 단백질, 예컨대 VP64 또는 VPR로부터의 TAD, 또는 인간 단백질, 예컨대 CITED2, CITED4 또는 CREB3으로부터의 TAD에 접합될 수 있다. 예시적 실시양태에서, TALE는 VP64 또는 VPR TAD에 접합된다.
SCN1A를 상향조절하고 인간 단백질에 고도로 상동인 eTF
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 1종 이상의 인간 단백질 (하기에 추가로 기재되는 바와 같음)에 대해 높은 퍼센트 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 전체 서열 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 전체 퍼센트 서열 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 나타낸다. 다양한 실시양태에서, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다. 특정 실시양태에서, 이러한 eTF는 인간 EGR1 또는 EGR3으로부터 유래된 DBD 및 인간 EGR1, EGR3, CITED2, CITED4 또는 CREB3으로부터 유래된 TAD를 포함할 수 있다. 이러한 eTF는 대상체에게 투여되는 경우에 면역원성을 거의 내지 전혀 갖지 않거나 또는 인간 단백질 서열에 대해 더 낮은 퍼센트 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 갖는다.
특정 실시양태에서, SNC1A를 상향조절하는 본원에 제공된 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는다. SCN1A를 상향조절하는 본원에 제공된 eTF가 동일한 단백질로부터 유래된 DBD 및 TAD를 포함하는 경우에, 인간 단백질에 대한 퍼센트 동일성은 그것이 유래된 인간 단백질 (예를 들어, EGR1 또는 EGR3)과 매칭되는 eTF 내의 아미노산 잔기의 총수를, eTF 내의 아미노산 잔기의 총수로 나눔으로써 결정될 수 있다. SCN1A를 상향조절하는 것으로 제공된 eTF가 하나의 인간 단백질로부터의 DBD 및 상이한 인간 단백질로부터 유래된 TAD를 포함하는 경우에, 인간에 대한 퍼센트 동일성은 각각의 도메인의 인간에 대한 퍼센트 동일성을 별개로 계산하고 이 둘을 함께 합산함으로써 결정될 수 있으며, 예를 들어 (i) 그것이 유래된 인간 단백질 (예를 들어, EGR1 또는 EGR3)과 매칭되는 DBD 내의 아미노산 잔기의 총수를, eTF 내의 아미노산 잔기의 총수로 나누어 계산하고; (ii) 그것이 유래된 인간 단백질 (예를 들어, CITED2, CITED4 또는 CREB3)과 매칭되는 TAD 내의 아미노산 잔기의 총수를, eTF 내의 아미노산 잔기의 총수로 나누어 계산하고; (iii) (i)과 (ii)의 총수를 합산함으로써 결정될 수 있다. 이러한 한 실시양태에서, 도메인은 하기와 같이 나누어진다: 제1 도메인은 eTF의 N-말단으로부터 제2 도메인에 대한 코딩 서열의 시작까지이고, 제2 도메인은 제2 도메인에 대한 코딩 서열의 시작으로부터 eTF의 C-말단까지이다 (예를 들어, 구성 NLS-DBD-링커-NLS-TAD를 갖는 eTF의 경우, 제1 도메인은 NLS-DBD-링커일 것이고, 제2 도메인은 NLS-TAD일 것임). SNC1A를 상향조절하는 본원에 제공된 eTF가 1종의 인간 단백질로부터의 DBD 및 1종 이상의 상이한 인간 단백질로부터 유래된 2종의 TAD를 포함하는 경우에, 인간에 대한 퍼센트 동일성은 각각의 도메인의 인간에 대한 퍼센트 동일성을 별개로 계산하고 3개 모두를 함께 합산함으로써 결정될 수 있으며, 예를 들어 (i) 그것이 유래된 인간 단백질 (예를 들어, EGR1 또는 EGR3)과 매칭되는 DBD 내의 아미노산 잔기의 총수를, eTF 내의 아미노산 잔기의 총수로 나누어 계산하고; (ii) 그것이 유래된 인간 단백질 (예를 들어, CITED2, CITED4 또는 CREB3)과 매칭되는 제1 TAD 내의 아미노산 잔기의 총수를, eTF 내의 아미노산 잔기의 총수로 나누어 계산하고; (iii) 그것이 유래된 인간 단백질 (예를 들어, CITED2, CITED4 또는 CREB3)과 매칭되는 제2 TAD 내의 아미노산 잔기의 총수를, eTF 내의 아미노산 잔기의 총수로 나누어 계산하고; (iv) (i), (ii) 및 (iii)의 총수를 합산함으로써 결정될 수 있다. 이러한 한 실시양태에서, 도메인은 하기와 같이 나누어진다: 제1 도메인은 eTF의 N-말단으로부터 제2 도메인에 대한 코딩 서열의 시작까지이고, 제2 도메인은 제2 도메인에 대한 코딩 서열의 시작으로부터 제3 도메인에 대한 코딩 서열의 시작까지이고, 제3 도메인은 제3 도메인에 대한 코딩 서열의 시작으로부터 eTF의 C-말단까지이다 (예를 들어, 구성 NLS-TAD1-링커-NLS-DBD-링커-NLS-TAD2를 갖는 eTF의 경우, 제1 도메인은 NLS-TAD1-링커일 것이고, 제2 도메인은 NLS-DBD-링커일 것이고, 제3 도메인은 NLS-TAD2일 것임). 본 섹션에 기재된 바와 같은 1종 이상의 인간 단백질에 대한 퍼센트 동일성은 NCBI 웹사이트로부터의 월드 와이드 웹 blast.ncbi.nlm.nih.gov/에서 입수가능한, NCBI로부터 입수가능한 표준 단백질 BLAST 도구 (예를 들어, 디폴트 파라미터를 갖는 blastp (단백질 -> 단백질) 알고리즘을 사용하는 blastp 스위트 정렬 도구)를 사용하여 수득된 퍼센트 동일성 결과를 사용하여 결정될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 자연 발생 인간 단백질에 대한 고도의 서열 동일성으로 인해 인간 대상체에서 유해한 면역 반응을 거의 유발하지 않거나, 최소로 유발하거나 또는 전혀 유발하지 않는 이점을 갖는다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 제공된 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 퍼센트 동일성을 포함하는 eTF, 예를 들어 1종 이상의 인간 단백질에 대해 50%, 55%, 65% 또는 70% 미만의 서열 동일성을 포함하는 eTF로 관찰된 면역원성과 비교하여 감소된 면역원성, 예를 들어 면역원성의 적어도 0.5, 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 10, 15, 20, 25, 30, 35, 40, 45 또는 50배 또는 그 초과의 감소를 유발한다. 일부 경우에, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다. 낮은 또는 최소 면역원성을 갖는 유전자 요법은 개선된 환자 내성, 치료 효과를 달성하는데 필요한 감소된 투여량, 1회 투여 후 연장된 치료 효과, 필요에 따라 다수회 또는 다중 용량으로 투여되는 능력, 투여당 보다 긴 기간에 걸친 지속적인 치료 효능, 증가된 안전성 및/또는 유전자 요법의 증가된 유효성을 포함한 여러 이점을 갖는다.
특정 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 1종 이상의 자연 발생 인간 단백질로부터 유래된 DBD 및 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD를 포함하는 임의의 자연 발생 인간 단백질로부터 유래된 DBD를 포함할 수 있다. 예시적 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 자연 발생 아연 핑거 단백질, 예컨대, 예를 들어 표 1에 열거된 구축물 5-27, 36-41 또는 44-53 중 어느 하나로부터 유래된 DBD를 포함한다. 특정 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 인간 EGR 단백질, 예컨대 EGR1, EGR2, EGR3 또는 EGR4로부터 유래된 DBD를 포함한다. 예시적 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 인간 EGR1 또는 EGR3으로부터 유래된 DBD를 포함한다. 다양한 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 DBD의 1개 이상의 아연 핑거 도메인에서 최소 아미노산 변화 (예를 들어, 1, 2, 3, 4, 5, 6, 7 또는 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 2-3, 2-4, 2-5, 2-6, 2-7, 3-4, 3-5, 36 또는 3-7개 아미노산 변화)가 이루어져 DBD의 결합 특이성을 변경시켜 관심 표적 결합 부위를 인식하는, 인간 아연 핑거 단백질로부터 유래된 DBD를 포함한다. 이러한 서열 변형은 바람직하게는 DBD의 아연 핑거 도메인의 인식 헬릭스에서 이루어지는 반면, 나머지 인간 아연 핑거 DBD 또는 단백질 (TAD 포함)은 자연 발생 인간 단백질에 대해 가능한 한 많은 서열 동일성을 보존하도록 비변형된 채로 남아있다.
특정 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 인간 단백질로부터 유래된 DBD에 접합된 인간 단백질로부터 유래된 1개 이상의 전사 조정 도메인 (예를 들어, TAD)을 포함한다. 다양한 실시양태에서, 전사 조정 도메인은 전사를 조정할 수 있거나 (예를 들어, RNA 폴리머라제 II, 보조-활성인자 단백질 또는 보조-억제인자 단백질) 또는 eTF가 DBD를 통해 표적 부위에 결합되는 경우에 관심 유전자로부터의 유전자 발현 수준을 조정할 수 있는 1종 이상의 단백질 인자를 동원할 수 있는 도메인을 갖는 임의의 자연 발생 인간 단백질로부터 유래될 수 있다. 예시적 실시양태에서, TAD는 인간 EGR 단백질, 예를 들어 인간 EGR1, EGR2, EGR3 또는 EGR4 또는 인간 인용 단백질, 예를 들어 인간 CITED2 또는 CITED4 단백질로부터 유래된다. 예시적 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 인간 EGR1 또는 EGR3 단백질로부터의 TAD를 포함한다. 또 다른 예시적 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 인간 CITED2 또는 CITED4 단백질로부터의 TAD를 포함한다.
한 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 인간 DBD (hDBD) 및 인간 TAD (hTAD) (예를 들어, hTAD-hDBD 또는 hDBD-hTAD)를 포함할 수 있으며, 여기서 hDBD 및 hTAD는 동일한 인간 단백질로부터 또는 인간의 상이한 단백질로부터 유래될 수 있다. 또 다른 실시양태에서, 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 hDBD 및 2개의 hTAD를 포함할 수 있으며, 여기서 hDBD 및 hTAD는 동일한 인간 단백질로부터 유래되거나, hDBD는 제1 인간 단백질로부터 유래되고 hTAD 둘 다는 제2 인간 단백질로부터 유래되거나, hDBD 및 하나의 hTAD는 제1 인간 단백질로부터 유래되고 제2 hTAD는 제2 인간 단백질로부터 유래되거나, 또는 hDBD는 제1 인간 단백질로부터 유래되고, 하나의 hTAD는 제2 인간 단백질로부터 유래되고 제2 hTAD는 제3 인간 단백질로부터 유래된다 (예를 들어, hTAD1-hDBD-hTAD1, hTAD1-hDBD-hTAD2, hTAD1-hTAD1-hDBD, hTAD1-hTAD2-hDBD, hDBD-hTAD1-hTAD1 또는 hDBD-hTAD1-hTAD2).
예시적 실시양태에서, 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 하기 구성 중 어느 하나를 포함한다: (i) 둘 다 인간 EGR1로부터 유래된 hDBD 및 hTAD; (ii) 둘 다 인간 EGR3으로부터 유래된 hDBD 및 hTAD; (iii) 인간 EGR1로부터 유래된 hDBD 및 CITED2로부터 유래된 hTAD (예를 들어, hEGR1 DBD-hCITED2 TAD 또는 hCITED2 TAD-hEGR1 DBD); (iv) 인간 EGR1로부터 유래된 hDBD 및 인간 CITED4로부터 유래된 hTAD (예를 들어, hEGR1 DBD-hCITED4 TAD 또는 hCITED4 TAD-hEGR1 DBD); (v) 인간 EGR3으로부터 유래된 hDBD 및 CITED2로부터 유래된 hTAD (예를 들어, hEGR3 DBD-hCITED2 TAD 또는 hCITED2 TAD-hEGR3 DBD); (vi) 인간 EGR3으로부터 유래된 hDBD 및 인간 CITED4로부터 유래된 hTAD (예를 들어, hEGR3 DBD-hCITED4 TAD 또는 hCITED4 TAD-hEGR3 DBD); (vii) 인간 EGR1로부터 유래된 hDBD 및 CITED2로부터 유래된 2개의 hTAD (예를 들어, hCITED2 TAD-hEGR1 DBD-hCITED2 TAD, hCITED2 TAD-hCITED2 TAD-hEGR1 DBD 또는 hEGR1 DBD-hCITED2 TAD-hCITED2 TAD); (viii) 인간 EGR1로부터 유래된 hDBD 및 인간 CITED4로부터 유래된 2개의 hTAD (예를 들어, hCITED4 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR1 DBD 또는 hEGR1 DBD-hCITED4 TAD-hCITED4 TAD); (ix) 인간 EGR3으로부터 유래된 hDBD 및 인간 CITED2로부터 유래된 2개의 hTAD (예를 들어, hCITED2 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TAD-hCITED2 TAD-hEGR3 DBD 또는 hEGR3 DBD-hCITED2 TAD-hCITED2 TAD); (x) 인간 EGR3으로부터 유래된 hDBD 및 인간 CITED4로부터 유래된 2개의 hTAD (예를 들어, hCITED4 TAD-hEGR3 DBD-hCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR3 DBD 또는 hEGR3 DBD-hCITED4 TAD-hCITED4 TAD); (xi) 인간 EGR1로부터 유래된 hDBD, 인간 CITED2로부터 유래된 제1 hTAD, 인간 CITED4로부터 유래된 제2 hTAD (예를 들어, hCITED2 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hEGR1 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR1 DBD, hCITED4 TAD-hCITED2 TAD-hEGR1 DBD, hEGR1 DBD-hCITED4 TAD-hCITED2 TAD 또는 hEGR1 DBD-hCITED2 TAD-hCITED4 TAD); 또는 (xii) 인간 EGR3으로부터 유래된 hDBD, 인간 CITED2로부터 유래된 제1 hTAD, 인간 CITED4로부터 유래된 제2 hTAD (예를 들어, hCITED2 TAD-hEGR3 DBD-hCITED4 TAD, hCITED4 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR3 DBD, hCITED4 TAD-hCITED2 TAD-hEGR3 DBD, hEGR3 DBD-hCITED4 TAD-hCITED2 TAD 또는 hEGR3 DBD-hCITED2 TAD-hCITED4 TAD).
특정 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 (i) 서열식별번호: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 포함하는 서열; (ii) 서열식별번호: 92-98 중 어느 하나를 포함하는 서열; (iii) (i) 또는 (ii)의 서열 중 어느 것에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iv) (i), (ii) 또는 (iii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다. 예시적 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 전체 서열 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 전체 퍼센트 서열 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 나타낸다. 다양한 실시양태에서, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하고 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF는 DBD 및 TAD 도메인 이외에도 1개 이상의 아미노산 서열 또는 도메인, 예컨대 핵 국재화 신호 또는 링커 등을 추가로 포함할 수 있다. 추가로, 1종 이상의 인간 단백질에 대해 높은 퍼센트 서열 동일성을 갖는 본원에 제공된 eTF를 코딩하는 폴리뉴클레오티드는 eTF에 대한 코딩 서열 이외에도 1개 이상의 핵산 서열, 예컨대 프로모터, 인핸서, 폴리A 테일 등을 추가로 포함할 수 있다. 이러한 실시양태에서, 추가의 아미노산 서열 및/또는 핵산 서열 중 1개 이상은 바람직하게는 인간 서열로부터 유래된 인간 서열이거나 또는 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는다.
예시적인 SCN1A eTF
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 서열식별번호: 152-167 중 어느 하나를 포함하는 인식 헬릭스를 포함하는 1개 이상의 아연 핑거 도메인을 갖는 DNA 결합 도메인을 포함한다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 아연 핑거 도메인을 갖는 DNA 결합 도메인을 포함하며, 여기서 각각의 아연 핑거 도메인은 독립적으로 서열식별번호: 152-167 중 어느 하나를 포함하는 인식 헬릭스를 포함한다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 6개의 아연 핑거 도메인을 갖는 DNA 결합 도메인을 포함하며, 여기서 각각의 아연 핑거 도메인은 독립적으로 서열식별번호: 152-167 중 어느 하나를 포함하는 인식 헬릭스를 포함한다. 특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 9개의 아연 핑거 도메인을 갖는 DNA 결합 도메인을 포함하며, 여기서 각각의 아연 핑거 도메인은 독립적으로 서열식별번호: 152-167 중 어느 하나를 포함하는 인식 헬릭스를 포함한다. 예시적 실시양태에서, 이러한 eTF는 서열식별번호: 147을 갖는 DNA 결합 도메인을 포함하며, 여기서 각각의 X는 독립적으로 서열식별번호: 152-167 중 어느 하나로부터 선택되고, n은 6 또는 9이다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) RSDNLVR x REDNLHT x RSDELVR x QSGNLTE x TSGHLVR x QNSTLTE (서열식별번호: 148) (여기서 x는 1-50개 아미노산의 링커일 수 있음)를 포함하는 서열, (ii) 서열식별번호: 148에 대해 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 서열, 또는 (ii) (i) 또는 (ii)의 기능적 단편 중 어느 하나를 갖는 DNA 결합 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 VP64, VPR, CITED2, CITED4 또는 CREB3으로부터 선택된 1개 이상의 TAD를 추가로 포함한다. 한 실시양태에서, 이러한 eTF는 DBD의 C-말단에 접합된 VPR TAD 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED2 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단 또는 C-말단에 접합된 2개의 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 서열식별번호: 18을 갖는 표적 부위에 결합할 수 있고, SCN1A의 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (서열식별번호: 149) (여기서 x는 1-50개 아미노산의 링커일 수 있음)를 포함하는 서열, (ii) 서열식별번호: 149에 대해 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 서열, 또는 (ii) (i) 또는 (ii)의 기능적 단편 중 어느 하나를 갖는 DNA 결합 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 VP64, VPR, CITED2, CITED4 또는 CREB3으로부터 선택된 1개 이상의 TAD를 추가로 포함한다. 한 실시양태에서, 이러한 eTF는 DBD의 C-말단에 접합된 VPR TAD 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED2 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단 또는 C-말단에 접합된 2개의 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 서열식별번호: 30을 갖는 표적 부위에 결합할 수 있고, SCN1A의 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) RRDELNV x RSDHLTN x RSDDLVR x RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (서열식별번호: 151)를 포함하는 서열, (ii) 서열식별번호: 151에 대해 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 서열, 또는 (ii) (i) 또는 (ii)의 기능적 단편 중 어느 하나를 갖는 DNA 결합 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 VP64, VPR, CITED2, CITED4 또는 CREB3으로부터 선택된 1개 이상의 TAD를 추가로 포함한다. 한 실시양태에서, 이러한 eTF는 DBD의 C-말단에 접합된 VPR TAD 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED2 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단 또는 C-말단에 접합된 2개의 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 서열식별번호: 32를 갖는 표적 부위에 결합할 수 있고, SCN1A의 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) DPGALVR x RSDNLVR x QSGDLRR x THLDLIR x TSGNLVR x RSDNLVR (서열식별번호: 150)을 포함하는 서열, (ii) 서열식별번호: 150에 대해 적어도 89%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 서열, 또는 (ii) (i) 또는 (ii)의 기능적 단편 중 어느 하나를 갖는 DNA 결합 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 VP64, VPR, CITED2, CITED4 또는 CREB3으로부터 선택된 1개 이상의 TAD를 추가로 포함한다. 한 실시양태에서, 이러한 eTF는 DBD의 C-말단에 접합된 VPR TAD 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED2 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 DBD의 N-말단 또는 C-말단에 접합된 2개의 CITED4 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 서열식별번호: 31을 갖는 표적 부위에 결합할 수 있고, SCN1A의 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 99-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 포함하는 서열; (ii) 서열식별번호: 77-98 중 어느 하나를 포함하는 서열; (iii) (i) 또는 (ii)의 서열 중 어느 것에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iv) (i), (ii) 또는 (iii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 99-102 또는 125-127 중 어느 하나를 포함하는 서열; (ii) 서열식별번호: 77-91 중 어느 하나를 포함하는 서열; (iii) (i) 또는 (ii)의 서열 중 어느 것에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iv) (i), (ii) 또는 (iii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 포함하는 서열; (ii) 서열식별번호: 92-98 중 어느 하나를 포함하는 서열; (iii) (i) 또는 (ii)의 서열 중 어느 것에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iv) (i), (ii) 또는 (iii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다. 예시적 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 전체 서열 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 전체 퍼센트 서열 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 나타낸다. 다양한 실시양태에서, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 127을 포함하는 서열; (ii) 서열식별번호: 127에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 서열식별번호: 77을 포함하고, 서열식별번호: 18을 갖는 표적 부위에 결합한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 128을 포함하는 서열; (ii) 서열식별번호: 128에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 서열식별번호: 92를 포함하고, 서열식별번호: 18을 갖는 표적 부위에 결합한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다. 예시적 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 전체 서열 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 전체 퍼센트 서열 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 나타낸다. 다양한 실시양태에서, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 129를 포함하는 서열; (ii) 서열식별번호: 129에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 서열식별번호: 92를 포함하고, 서열식별번호: 18을 갖는 표적 부위에 결합한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다. 예시적 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 전체 서열 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 전체 퍼센트 서열 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 나타낸다. 다양한 실시양태에서, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 130을 포함하는 서열; (ii) 서열식별번호: 130에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 서열식별번호: 92를 포함하고, 서열식별번호: 18을 갖는 표적 부위에 결합한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다. 예시적 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 전체 서열 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 전체 퍼센트 서열 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 나타낸다. 다양한 실시양태에서, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 (i) 서열식별번호: 131을 포함하는 서열; (ii) 서열식별번호: 131에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 것의 기능적 단편 또는 변이체 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 eTF는 서열식별번호: 92를 포함하고, 서열식별번호: 18을 갖는 표적 부위에 결합한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있거나 또는 대조군과 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% 또는 500% 또는 그 초과만큼 상향조절할 수 있다. 예시적 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 전체 서열 동일성을 갖는다. 특정 실시양태에서, 이러한 eTF는 1종 이상의 인간 단백질에 대해 더 낮은 전체 퍼센트 서열 동일성을 갖는 eTF와 비교하여 감소된 면역원성을 나타낸다. 다양한 실시양태에서, 면역원성의 감소는 엘리스팟 검정, 면역검정 또는 인 실리코 방법을 사용하여 측정될 수 있다.
특정 실시양태에서, SCN1A를 상향조절하는 본원에 개시된 eTF는 gRNA/Cas 복합체를 포함하는 DBD를 포함하며, 여기서 gRNA는 서열식별번호: 35-66 중 어느 하나를 포함하는 표적화 서열을 포함한다. gRNA의 표적 서열은 서열: 5'-GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGA-3' (서열식별번호: 183)를 갖는 스캐폴드 서열의 5' 말단에 부착된다. 예시적 실시양태에서, Cas 단백질은 뉴클레아제 비활성화된 Cas9 단백질이다. 특정 실시양태에서, 이러한 eTF는 Cas 단백질에 접합된 1개 이상의 TAD를 추가로 포함하며, 여기서 TAD는 VP64, VPR, CITED2, CITED4 또는 CREB3으로부터 선택된다. 한 실시양태에서, 이러한 eTF는 Cas 단백질의 C-말단에 접합된 VPR TAD 도메인을 포함한다. 특정 실시양태에서, 이러한 eTF는 Cas 단백질의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED2 TAD를 포함한다. 특정 실시양태에서, 이러한 eTF는 Cas 단백질의 N-말단, C-말단 또는 N-말단 및 C-말단에 접합된 CITED4 TAD를 포함한다. 예시적 실시양태에서, 이러한 eTF는 SCN1A 발현을 대조군과 비교하여 적어도 2배, 5배, 10배, 15배, 20배, 25배, 30배, 40배, 50배 또는 그 초과만큼 상향조절할 수 있다.
폴리뉴클레오티드
또 다른 측면에서, 본 출원은 본원에 개시된 SNC1A를 상향조절하는 eTF 중 어느 것을 코딩하는 폴리뉴클레오티드를 제공한다. 또 다른 측면에서, 본 출원은 PV 선택적 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 특정 실시양태에서, 본 출원은 트랜스진에 작동가능하게 연결된 PV 선택적 조절 요소 및 PV 선택적 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 특정 실시양태에서, 본 출원은 본원에 개시된 바와 같은 SCN1A를 상향조절하는 eTF를 코딩하는 서열 및 PV 선택적 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 특정 실시양태에서, 본 출원은 SCN1A를 상향조절하는 eTF를 코딩하는 트랜스진에 작동가능하게 연결된 PV 선택적 조절 요소 및 PV 선택적 조절 요소를 제공한다.
SCN1A를 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드
특정 실시양태에서, 본 출원은 하기: (i) 서열식별번호: 77-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 포함하는, SCN1A를 상향조절하는 eTF 또는 그의 변이체 또는 기능적 단편을 코딩하는 핵산 서열; (ii) 서열식별번호: 77-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 갖는, SCN1A를 상향조절하는 eTF의 기능적 단편을 코딩하는 핵산; 또는 (iii) 서열식별번호: 77-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 갖는, SCN1A를 상향조절하는 eTF 또는 그의 변이체 또는 기능적 단편에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는, SCN1A를 상향조절하는 eTF를 코딩하는 핵산 중 어느 하나를 포함하는 폴리뉴클레오티드를 제공한다.
특정 실시양태에서, 본 출원은 하기: (i) 서열식별번호: 92-98 중 어느 하나를 포함하는 DBD 또는 그의 변이체 또는 기능적 단편을 코딩하는 핵산 서열; (ii) 서열식별번호: 92-98 중 어느 하나를 갖는 DBD의 기능적 단편을 코딩하는 핵산; 또는 (iii) 서열식별번호: 92-98 중 어느 하나를 갖는 DBD 또는 그의 변이체 또는 기능적 단편에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 DBD를 코딩하는 핵산 중 어느 하나를 포함하며, 여기서 DBD는 서열식별번호: 92-98 중 어느 하나에 의해 결합된 표적 부위에 결합할 수 있는 것인 폴리뉴클레오티드를 제공한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 포함하는 eTF를 코딩하는 핵산 서열; (ii) 서열식별번호: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 갖는 eTF의 기능적 단편을 코딩하는 핵산; 또는 (iii) 서열식별번호: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 갖는 eTF에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 eTF를 코딩하는 핵산 중 어느 하나를 포함하고, 여기서 eTF는 SCN1A를 상향조절할 수 있다.
특정 실시양태에서, 본 출원은 본원에 개시된 eTF에 의해 결합되는 경우에 내인성 SCN1A를 상향조절할 수 있는 게놈 표적 부위에 결합하는 DBD를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 77-98 중 어느 하나를 포함하는 DBD를 코딩하는 핵산 서열; (ii) 서열식별번호: 77-98 중 어느 하나를 갖는 DBD의 기능적 단편을 코딩하는 핵산; 또는 (iii) 서열식별번호: 77-98 중 어느 하나를 갖는 DBD에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 eTF를 코딩하는 핵산 중 어느 하나를 포함하고, 여기서 DBD는 서열식별번호: 77-98 중 어느 하나에 의해 결합되는 표적 부위에 결합할 수 있다.
특정 실시양태에서, 본 출원은 본원에 개시된 eTF에 의해 결합되는 경우에 내인성 SCN1A를 상향조절할 수 있는 게놈 표적 부위에 결합하는 DBD를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 148-151 중 어느 하나를 포함하는 DBD를 코딩하는 핵산 서열; (ii) 서열식별번호: 148-151 중 어느 하나를 갖는 DBD의 기능적 단편을 코딩하는 핵산; 또는 (iii) 서열식별번호: 148-151 중 어느 하나를 갖는 DBD에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 eTF를 코딩하는 핵산 중 어느 하나를 포함하고, 여기서 DBD는 서열식별번호: 92-98 중 어느 하나에 의해 결합된 표적 부위에 결합할 수 있다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 70-76 또는 184 중 어느 것을 갖는 핵산 서열; (ii) (i)의 서열 중 어느 하나의 기능적 단편을 갖는 핵산; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함하고, 여기서 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 eTF를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 70을 갖는 핵산 서열; (ii) 서열식별번호: 70의 기능적 단편을 갖는 핵산; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 127을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 71을 갖는 핵산 서열; (ii) 서열식별번호: 71의 기능적 단편을 갖는 핵산; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 127을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 72를 갖는 핵산 서열; (ii) 서열식별번호: 72의 기능적 단편을 갖는 핵산; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 130을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 73을 갖는 핵산 서열; (ii) 서열식별번호: 73의 기능적 단편을 갖는 핵산 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 131을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 74를 갖는 핵산 서열; (ii) 서열식별번호: 74의 기능적 단편을 갖는 핵산 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 127을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 75를 갖는 핵산 서열; (ii) 서열식별번호: 75의 기능적 단편을 갖는 핵산 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 127을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 76을 갖는 핵산 서열; (ii) 서열식별번호: 76의 기능적 단편을 갖는 핵산 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 106을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
특정 실시양태에서, 본 출원은 내인성 SCN1A를 조절할 수 있는 eTF를 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 하기: (i) 서열식별번호: 184를 갖는 핵산 서열; (ii) 서열식별번호: 184의 기능적 단편을 갖는 핵산 서열; 또는 (iii) (i) 또는 (ii)의 서열 중 어느 하나에 대해 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 핵산 중 어느 하나를 포함한다. 예시적 실시양태에서, 이러한 폴리뉴클레오티드는 SCN1A를 상향조절할 수 있는 서열식별번호: 106을 갖는 eTF 또는 그의 기능적 단편 또는 변이체를 코딩한다.
PV 뉴런에서의 선택적 발현을 위한 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드
또 다른 측면에서, 본 출원은 파르브알부민 (PV) 뉴런에서 관심 유전자의 선택적 발현을 유도하는 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 마이크로RNA 또는 miRNA는 mRNA 분자 내의 상보적 인식 부위에 혼성화함으로써 전사후 유전자 발현을 조절하고, mRNA 전사체의 분해를 촉진함으로써 또는 mRNA에 의해 코딩되는 단백질의 번역을 억제함으로써 유전자 발현의 억제를 유도하는 작은 비-코딩 RNA (~20개 뉴클레오티드)이다. 본원에 제공된 마이크로RNA 결합 부위는 흥분성 뉴런에서 관심 유전자의 발현을 억제함으로써 PV 뉴런에서 관심 유전자의 선택적 발현을 촉진한다 (예를 들어, PV 선택적 마이크로RNA 결합 부위). 특정 실시양태에서, 흥분성 뉴런은 STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA 및/또는 DKK3 중 1종 이상을 발현하는 뉴런이다. 예시적 실시양태에서, 흥분성 뉴런은 CamKII를 발현하는 뉴런이다.
특정 실시양태에서, 본 출원은 PV 선택적 발현을 촉진하는, 예를 들어 흥분성 뉴런에서 마이크로RNA 결합 부위를 포함하는 mRNA의 분해를 촉진하는 1개 이상의 마이크로RNA에 대한 1개 이상의 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. PV 선택적 발현을 촉진하는 예시적인 마이크로RNA는, 예를 들어 miR-128, miR-221 및 miR-222를 포함한다. 특정 실시양태에서, 본 출원은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 PV 선택적 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 miR-128 결합 부위 (서열식별번호: 9)를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 miR-221 결합 부위 (서열식별번호: 11)를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 miR-222 결합 부위 (서열식별번호: 13)를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 1개의 miR-128 결합 부위, 적어도 1개의 miR-221 결합 부위 및 적어도 1개의 miR-222 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 1개의 miR-128 결합 부위 및 적어도 1개의 miR-222 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 1개의 miR-221 결합 부위 및 적어도 1개의 miR-222 결합 부위를 포함하는 폴리뉴클레오티드를 제공한다. 예시적 실시양태에서, 본 출원은 적어도 1개의 miR-128 결합 부위 (서열식별번호: 9) 및 적어도 1개의 miR-221 결합 부위 (서열식별번호: 11)를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 2개의 miR-128 결합 부위 (서열식별번호: 9) 및 적어도 2개의 miR-221 결합 부위 (서열식별번호: 11)를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 3개의 miR-128 결합 부위 (서열식별번호: 9) 및 적어도 3개의 miR-221 결합 부위 (서열식별번호: 11)를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 4개의 miR-128 결합 부위 (서열식별번호: 9) 및 적어도 4개의 miR-221 결합 부위 (서열식별번호: 11)를 포함하는 폴리뉴클레오티드를 제공한다. 한 실시양태에서, 본 출원은 적어도 5개의 miR-128 결합 부위 (서열식별번호: 9) 및 적어도 5개의 miR-221 결합 부위 (서열식별번호: 11)를 포함하는 폴리뉴클레오티드를 제공한다. 이러한 실시양태에서, 결합 부위는 임의의 순서로 배열될 수 있다. 예를 들어, 2개의 miR-128 결합 부위 및 2개의 miR-221 결합 부위를 함유하는 구축물의 경우, 결합 부위는 하기 구성 중 어느 것으로 배열될 수 있다: miR-128 - miR-128 - miR-221 - miR221, miR-128 - miR-221 - miR-128 - miR-221, miR-128 - miR221 - miR221 - miR-128, miR-221 - miR128 - miR221 - miR128, miR-221 - miR128 - miR128 - miR221, or miR221 - miR221- miR128 - miR128. 예시적 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 4개의 miR-128 결합 부위 (서열식별번호: 9)에 이어서 4개의 miR-221 결합 부위 (서열식별번호: 11)를 갖는 서열, 예를 들어 miR-128 - miR-128 - miR128 - miR-128 - miR221 - miR221 - miR-221 - miR221을 포함한다. 또 다른 예시적 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 1개의 miR-221 서열 (서열식별번호: 11), 1개의 miR-222 서열 (서열식별번호: 13) 및 1개의 miR-128 결합 부위 (서열식별번호: 9)를 갖는 서열, 예를 들어 miR-221 - miR222 - miR128을 포함한다. 또 다른 예시적 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 하기 순서로 배열된 2개의 miR-221 서열 (서열식별번호: 11), 2개의 miR-222 서열 (서열식별번호: 13) 및 2개의 miR-128 결합 부위 (서열식별번호: 9)를 갖는 서열을 포함한다: miR-221 - miR222 - miR128 - miR-221 - miR222 - miR128.
1개 초과의 마이크로RNA 결합 부위를 갖는 폴리뉴클레오티드에서, 결합 부위들은 폴리뉴클레오티드 서열에서 서로 바로 인접할 수 있거나 (예를 들어, 결합 부위들 사이에 링커 또는 개재 서열이 없음), 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 그 초과의 뉴클레오티드 또는 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 또는 1-2개의 뉴클레오티드만큼 서로 분리되어 있을 수 있다. 예시적 실시양태에서, 마이크로RNA 결합 부위는 약 5개의 뉴클레오티드만큼 또는 5개의 뉴클레오티드만큼 분리되어 있다. 예시적 실시양태에서, 마이크로RNA 결합 부위들을 분리하는 서열 (뿐만 아니라 마이크로RNA 결합 부위들 사이에 형성된 접합부 또는 마이크로RNA 결합 부위와 마이크로RNA 결합 부위들을 분리하는 서열 사이에 형성된 접합부)은 임의의 다른 마이크로RNA 또는 임의의 다른 뉴런 마이크로RNA에 상보적이지 않다.
특정 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 서열식별번호: 7에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 마이크로RNA 결합 부위를 포함한다. 예시적 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 서열식별번호: 7을 포함하는 마이크로RNA 결합 부위를 포함한다.
특정 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 서열식별번호: 14에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 마이크로RNA 결합 부위를 포함한다. 예시적 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 서열식별번호: 14를 포함하는 마이크로RNA 결합 부위를 포함한다.
특정 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 서열식별번호: 15에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 마이크로RNA 결합 부위를 포함한다. 예시적 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 서열식별번호: 15를 포함하는 마이크로RNA 결합 부위를 포함한다.
특정 실시양태에서, 본원에 제공된 마이크로RNA 결합 부위는 mRNA 전사체의 3' 비번역 영역 내에, 예를 들어 번역 종결 코돈 (즉, TAA, TGA 또는 TAG) 다음에 및 폴리A 테일 앞에 위치한다. 마이크로RNA 결합 부위는 번역 종결 코돈에 바로 인접하여 위치할 수 있거나 또는 번역 종결 코돈으로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 그 초과의 뉴클레오티드 또는 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 또는 1-2개의 뉴클레오티드만큼 분리되어 있을 수 있고/거나, 폴리A 테일에 인접하여 위치할 수 있거나 또는 폴리A 테일로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 그 초과의 뉴클레오티드 또는 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 또는 1-2개의 뉴클레오티드만큼 분리되어 있을 수 있다.
특정 실시양태에서, 본원에 제공된 마이크로RNA 결합 부위는 오프-타겟 세포 유형과 비교하여 PV 세포에서 선택적 유전자 발현을 일으킨다. 일부 경우에, 오프-타겟 세포 유형은 흥분성 뉴런, 비-PV CNS 세포-유형 및 비-뉴런 CNS 세포 유형을 포함하나 이에 제한되지는 않는다. 특정 실시양태에서, PV 선택적 마이크로RNA 결합 부위는 적어도 1, 2, 3, 4, 5종 또는 그 초과의 비-PV CNS 세포 유형에 비해 PV 뉴런에서 선택적 유전자 발현을 일으킨다. 일부 경우에, 비-PV CNS 세포는 흥분성 뉴런, 도파민성 뉴런, 성상세포, 소교세포, 운동 뉴런, 혈관 세포 또는 비-GABA성 뉴런 (예를 들어, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST 및 VIP 중 1종 이상을 발현하지 않는 세포), 비-PV 뉴런 (예를 들어, 파르브알부민을 발현하지 않는 GABA성 뉴런), 또는 다른 CNS 세포 (예를 들어, PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST 및 VIP 중 어떤 것도 발현하지 않는 CNS 세포 유형)이다. 예시적 실시양태에서, 본원에 제공된 PV 선택적 마이크로RNA 결합 부위는 흥분성 뉴런 (예를 들어, STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA 및/또는 DKK3 중 1종 이상을 발현하는 뉴런)에서의 발현을 감소시킴으로써 이러한 흥분성 뉴런과 비교하여 PV 뉴런에서 유전자 발현의 선택성 증가를 일으킨다. 일부 경우에, 세포 유형은 상이한 세포 마커, 형태, 표현형, 유전자형, 기능 및/또는 세포 유형을 분류하기 위한 임의의 다른 수단을 가짐으로써 구별된다.
PV 선택적 마이크로RNA 결합 부위에 의해 유도된 발현의 선택성은 다수의 방식으로 측정될 수 있다. 한 실시양태에서, 비-PV 세포 대비 PV 세포에서의 유전자 발현의 선택성은 PV 선택적 마이크로RNA 결합 부위를 함유하는 유전자로부터 검출가능한 수준의 전사체를 발현하는 PV 세포의 수를 유전자를 발현하는 세포의 총수와 비교함으로써 (예를 들어, 유전자를 발현하는 총 세포 (PV + 비-PV 세포) 대비 PV 세포의 비) 측정될 수 있다. 예를 들어, PV 뉴런에 대한 선택성은 형광 단백질 (예를 들어, eGFP)을 코딩하는 유전자 및 유전자 발현을 측정하기 위한 PV 선택적 마이크로RNA 결합 부위 및 제2 형광 표지 (예를 들어, 적색 형광 단백질)에 연결된 PV 세포를 확인하는 항체 (예를 들어, PV 뉴런과 특이적으로 상호작용하는 항-PV 항체)를 포함하는 발현 카세트를 사용한 면역조직화학 기반 공동국재화 검정을 사용하여 결정될 수 있다. PV 세포에서의 발현의 선택성은 PV 및 eGFP를 둘 다 발현하는 세포 (예를 들어, PV 세포)의 수를 eGFP를 발현하는 세포 (예를 들어, PV 세포 및 비-PV 세포)의 총수로 나누고 100을 곱하여 백분율로 전환시킴으로써 계산될 수 있다. 또 다른 예에서, PV 뉴런에 대한 선택성은 형광 단백질 (예를 들어, eGFP)을 코딩하는 유전자 및 유전자 발현을 측정하기 위한 PV 선택적 마이크로RNA 결합 부위 및 제2 형광 표지 (예를 들어, 적색 형광 단백질)에 연결된 PV 세포를 확인하는 제1 항체 (예를 들어, PV 뉴런과 특이적으로 상호작용하는 항-PV 항체) 및 흥분성 세포를 확인하는 제2 항체 (예를 들어, 흥분성 뉴런과 특이적으로 상호작용하는 항-CamKII 항체)를 포함하는 발현 카세트를 사용한 면역조직화학 기반 공동국재화 검정을 사용하여 결정될 수 있다. PV 세포에서의 발현의 선택성은 PV 및 eGFP를 둘 다 발현하는 세포 (예를 들어, PV 세포)의 수를 eGFP + PV 및 eGFP + CamKII를 발현하는 세포 (예를 들어, PV 세포 및 흥분성 세포)의 수로 나누고 100을 곱하여 백분율로 전환시킴으로써 계산될 수 있다. 트랜스진을 발현하는 PV 세포의 백분율이 높을수록, 마이크로RNA 결합 부위가 PV 세포에 대해 더 선택적이다. 특정 실시양태에서, 본원에 제공된 PV 선택적 마이크로RNA 결합 부위는 PV 세포에서의 발현에 대해 고도로 선택적일 수 있다. 예를 들어, 본원에 제공된 PV 선택적 마이크로RNA 결합 부위는 PV 뉴런에 대해 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 약 99% 초과의 선택성 (예를 들어, PV 뉴런/총 세포 x 100 또는 PV 뉴런/PV + 흥분성 뉴런 x 100)을 나타낼 수 있다.
일부 경우에, 본원에 제공된 PV 선택적 마이크로RNA 결합 부위는 짧다. 일부 경우에, PV 선택적 마이크로RNA 결합 부위의 크기는 벡터, 예를 들어 바이러스 벡터 또는 rAAV의 클로닝 능력에 적합하여, 트랜스진, 프로모터 (및 임의적인 인핸서) 및 마이크로RNA 결합 부위의 합한 크기가 벡터의 클로닝 능력을 초과하지 않는다. 일부 경우에, PV 선택적 마이크로RNA 결합 부위는 약 500 bp, 400 bp, 300 bp, 250 bp, 225 bp, 215 bp, 210 bp, 200 bp, 150 bp, 140 bp, 135 bp, 130 bp, 125 bp, 120 bp, 115 bp, 110 bp, 100 bp, 90 bp, 80 bp, 75 bp, 70 bp, 65 bp, 60 bp 또는 50 bp 이하의 길이를 갖는다. 일부 경우에, PV 선택적 마이크로RNA 결합 부위는 약 50-500 bp, 50-400 bp, 50-300 bp, 50-250 bp, 50-200 bp, 50-100 bp, 50-75 bp, 50-70 bp, 100-500 bp, 100-400 bp, 100-300 bp, 100-250 bp, 100-200 bp, 100-150 bp, 100-140 bp, 100-135 bp, 200-500 bp, 200-400 bp, 200-300 bp 또는 200-250 bp이다.
예시적 실시양태에서, 1개 이상의 PV 선택적 마이크로RNA 결합 부위를 포함하는 본원에 제공된 폴리뉴클레오티드는 서열식별번호: 67을 포함하지 않는다.
발현 카세트
또 다른 측면에서, 본 출원은 본원에 제공된 폴리뉴클레오티드 (예를 들어, SCN1A를 상향조절하고/거나 PV 선택적 마이크로RNA 결합 부위를 함유하는 eTF를 코딩하는 서열을 포함하는 폴리뉴클레오티드) 및 1개 이상의 조절 요소를 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 본 출원은 본원에 제공된 폴리뉴클레오티드 (예를 들어, SCN1A를 상향조절하고/거나 PV 선택적 마이크로RNA 결합 부위를 함유하는 eTF를 코딩하는 서열을 포함하는 폴리뉴클레오티드) 및 PV 선택적 프로모터를 포함하는 발현 카세트를 제공한다.
특정 실시양태에서, 본원에 제공된 폴리뉴클레오티드 (예를 들어, SCN1A를 상향조절하고/거나 PV 선택적 마이크로RNA 결합 부위를 함유하는 eTF를 코딩하는 서열을 포함하는 폴리뉴클레오티드)는 eTF를 코딩하는 서열에 추가로 1개 이상의 조절 요소를 포함하는 발현 카세트의 일부이다. 예시적 실시양태에서, 본원에 제공된 폴리뉴클레오티드 (예를 들어, SCN1A를 상향조절하고/거나 PV 선택적 마이크로RNA 결합 부위를 함유하는 eTF를 코딩하는 서열을 포함하는 폴리뉴클레오티드)는 세포에서 트랜스진 (예를 들어, SCN1A를 선택적으로 상향조절하는 eTF)의 발현을 구동할 수 있도록 트랜스진 서열의 상류에 위치한 프로모터를 포함하는 발현 카세트의 일부이다.
특정 실시양태에서, 본원에 개시된 발현 카세트는 본원에 제공된 폴리뉴클레오티드 (예를 들어, SCN1A를 상향조절하고/거나 PV 선택적 마이크로RNA 결합 부위를 함유하는 eTF를 코딩하는 서열을 포함하는 폴리뉴클레오티드) 및 세포에서 트랜스진 (예를 들어, SCN1A를 선택적으로 상향조절하는 eTF)의 발현을 구동할 수 있도록 트랜스진을 코딩하는 서열의 상류에 위치한 구성적 프로모터를 포함한다. 구성적 프로모터의 예는 GAD2 프로모터, 인간 시냅신 프로모터, CBA 프로모터, CMV 프로모터, minCMV 프로모터, TATA 박스, 슈퍼 코어 프로모터 또는 EF1α 프로모터 또는 그의 조합을 포함한다.
특정 실시양태에서, 본원에 개시된 발현 카세트는 본원에 제공된 폴리뉴클레오티드 (예를 들어, SCN1A를 상향조절하고/거나 PV 선택적 마이크로RNA 결합 부위를 함유하는 eTF를 코딩하는 서열을 포함하는 폴리뉴클레오티드) 및 세포에서 트랜스진 (예를 들어, SCN1A를 선택적으로 상향조절하는 eTF)의 발현을 구동할 수 있는 짧은 프로모터를 포함한다. 특정 실시양태에서, 본원에 기재된 핵산 분자에 따라 사용하기에 적합한 짧은 프로모터는 500 bp, 450 bp, 400 bp, 350 bp, 300 bp, 250 bp, 225 bp, 200 bp, 175 bp, 150 bp, 145 bp, 140 bp, 135 bp, 130 bp, 125 bp, 120 bp, 115 bp, 110 bp, 105 bp, 100 bp, 95 bp, 90 bp, 85 bp, 80 bp 또는 75 bp 미만, 또는 약 80-300 bp, 80-275 bp, 80-250 bp, 80-200 bp, 80-150 bp, 80-125 bp, 80-120 bp, 80-115 bp, 80-110 bp, 80-105 bp, 80-100 bp, 85-300 bp, 85-275 bp, 85-250 bp, 85-200 bp, 85-150 bp, 85-125 bp, 85-120 bp, 85-115 bp, 85-110 bp, 85-105 bp, 85-100 bp, 90-300 bp, 90-275 bp, 90-250 bp, 90-200 bp, 90-150 bp, 90-125 bp, 90-120 bp, 90-115 bp, 90-110 bp, 90-105 bp, 90-100 bp, 95-300 bp, 95-275 bp, 95-250 bp, 95-200 bp, 95-150 bp, 95-125 bp, 95-120 bp, 95-115 bp, 95-110 bp, 95-105 bp, 95-100 bp, 100-300 bp, 100-275 bp, 100-250 bp, 100-200 bp, 100-150 bp, 100-125 bp, 100-120 bp, 100-115 bp, 100-110 bp 또는 100-105 bp를 포함한다. 예시적 실시양태에서, 본원에 기재된 발현 카세트에 따라 사용하기에 적합한 짧은 프로모터는 약 100-120 bp, 약 117 bp 또는 약 100 bp를 포함한다.
특정 실시양태에서, 본원에 개시된 발현 카세트는, 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF 중 어느 하나를 코딩하고 본원에 개시된 바와 같은 마이크로RNA 결합 부위를 임의로 함유하는 폴리뉴클레오티드에 작동가능하게 연결된 (i) 서열식별번호: 1; (ii) 그의 변이체 또는 기능적 단편; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열 중 어느 하나를 포함하거나 그로 이루어진 짧은 프로모터를 포함한다. 짧은 프로모터 서열의 다른 예는 PCT 공개 번호 WO 2018/213786에서 찾아볼 수 있다.
특정 실시양태에서, 본원에 개시된 발현 카세트는 본원에 제공된 폴리뉴클레오티드 (예를 들어, SCN1A를 상향조절하고/거나 PV 선택적 마이크로RNA 결합 부위를 함유하는 eTF를 코딩하는 서열을 포함하는 폴리뉴클레오티드) 및 관심 세포에서 트랜스진 (예를 들어, SCN1A를 선택적으로 상향조절하는 eTF)의 발현을 선택적으로 구동할 수 있도록 이러한 트랜스진을 코딩하는 서열의 상류에 위치한 세포 유형 선택적 프로모터를 포함한다. 특정 실시양태에서, 세포 유형 선택적 프로모터는 임의의 관심 세포 유형, 예컨대, 예를 들어 심장 세포, 간 세포, 근육 세포, 골 세포, 뉴런 또는 그의 하위 집단에 대해 선택적일 수 있다 (예를 들어, 그에서의 발현을 선택적으로 구동할 수 있음). 예시적 실시양태에서, 본원에 개시된 발현 카세트는 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드, 및 PV 세포에서 eTF의 발현을 선택적으로 구동할 수 있도록 eTF를 코딩하는 서열의 상류에 위치한 PV 선택적 조절 요소 (예를 들어, 프로모터, 인핸서 및/또는 프로모터 및 인핸서), 및 임의로 PV 선택적 마이크로RNA 결합 부위를 포함한다. PV 선택적 조절 요소는 PV 뉴런에서의 유전자 발현을 특이적으로 조정하는 조절 요소를 지칭한다. 특정 실시양태에서, PV 선택적 조절 요소는 1종 이상의 다른 CNS 세포 유형에 비해 PV 뉴런에서 발현을 증진시킨다. 특정 실시양태에서, PV 선택적 조절 요소는 오프-타겟 세포 유형에서 전사 및/또는 번역 프로세스를 억제한다.
특정 실시양태에서, 본원에 제공된 PV 선택적 조절 요소는 오프-타겟 세포 유형과 비교하여 PV 세포에서 선택적 유전자 발현을 일으킨다. 일부 경우에, 오프-타겟 세포 유형은 흥분성 뉴런, 비-PV CNS 세포-유형 및 비-뉴런 CNS 세포 유형을 포함하나 이에 제한되지는 않는다. 특정 실시양태에서, PV 선택적 조절 요소는 적어도 1, 2, 3, 4, 5종 또는 그 초과의 비-PV CNS 세포 유형에 비해 PV 뉴런에서 선택적 유전자 발현을 일으킨다. 일부 경우에, 비-PV CNS 세포는 흥분성 뉴런, 도파민성 뉴런, 성상세포, 소교세포, 운동 뉴런, 혈관 세포 또는 비-GABA성 뉴런 (예를 들어, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST 및 VIP 중 1종 이상을 발현하지 않는 세포), 비-PV 뉴런 (예를 들어, 파르브알부민을 발현하지 않는 GABA성 뉴런), 또는 다른 CNS 세포 (예를 들어, PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST 및 VIP 중 어떤 것도 발현하지 않는 CNS 세포 유형)이다. 일부 경우에, 본원에 제공된 PV 선택적 조절 요소는 비-PV GABA성 세포와 비교하여 PV 뉴런에서 유전자 발현의 선택성 증가를 일으킨다. 일부 경우에, 세포 유형은 상이한 세포 마커, 형태, 표현형, 유전자형, 기능 및/또는 세포 유형을 분류하기 위한 임의의 다른 수단을 가짐으로써 구별된다.
PV 선택적 조절 요소에 의해 구동되는 발현의 선택성은 다수의 방식으로 측정될 수 있다. 한 실시양태에서, 비-PV 세포 대비 PV 세포에서의 유전자 발현의 선택성은 PV 선택적 조절 요소에 작동가능하게 연결된 유전자로부터 검출가능한 수준의 전사체를 발현하는 PV 세포의 수를 유전자를 발현하는 세포의 총수와 비교함으로써 (예를 들어, 유전자를 발현하는 총 세포 (PV + 비-PV 세포) 대비 PV 세포의 비) 측정될 수 있다. 예를 들어, PV 뉴런에 대한 선택성은 유전자 발현을 측정하기 위한 PV 선택적 조절 요소에 작동가능하게 연결된 형광 단백질 (예를 들어, eGFP)을 코딩하는 유전자 및 제2 형광 표지 (예를 들어, 적색 형광 단백질)에 연결된 PV 세포를 확인하는 항체 (예를 들어, PV 뉴런과 특이적으로 상호작용하는 항-PV 항체)를 사용한 면역조직화학 기반 공동국재화 검정을 사용하여 결정될 수 있다. PV 세포에서의 발현의 선택성은 PV 및 eGFP를 둘 다 발현하는 세포 (예를 들어, PV 세포)의 수를 eGFP를 발현하는 세포 (예를 들어, PV 세포 및 비-PV 세포)의 총수로 나누고 100을 곱하여 백분율로 전환시킴으로써 계산될 수 있다. 트랜스진을 발현하는 PV 세포의 백분율이 높을수록, 조절 요소가 PV 세포에 대해 더 선택적이다. 특정 실시양태에서, 본원에 제공된 PV 선택적 조절 요소는 PV 세포에서의 발현에 대해 고도로 선택적일 수 있다. 예를 들어, 본원에 제공된 PV 선택적 조절 요소는 PV 뉴런에 대해 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 약 99% 초과의 선택성 (예를 들어, PV 뉴런/총 세포 x 100)을 나타낼 수 있다.
일부 경우에, 본원에 제공된 PV 선택적 조절 요소는 짧다. 일부 경우에, PV 선택적 조절 요소의 크기는 벡터, 예를 들어 바이러스 벡터 또는 rAAV의 클로닝 능력에 적합하여, 트랜스진 및 1개 이상의 PV 선택적 조절 요소의 합한 크기가 벡터의 클로닝 능력을 초과하지 않는다. 일부 경우에, PV 선택적 조절 요소는 약 2050bp, 2000bp, 1900bp, 1800bp, 1700bp, 1600bp, 1500bp, 1400bp, 1300bp, 1200bp, 1100bp, 1000bp, 900bp, 800bp, 700bp, 600bp, 500bp, 400bp, 300bp, 200bp 또는 100bp 이하의 길이를 갖는다. 일부 경우에, PV 선택적 조절 요소는 약 500-600bp, 500-700bp, 500-800bp, 500-900bp, 500-1000bp, 500-1500bp, 500-2000bp 또는 500-2050bp이다.
특정 실시양태에서, 본원에 제공된 PV 선택적 조절 요소는 (i) 서열식별번호: 2-4; (ii) 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열 중 어느 하나를 포함하거나 그로 이루어진다. 일부 경우에, 조절 요소는 서열식별번호: 2-4 중 어느 하나를 포함한다. PV 선택적 조절 요소의 다른 예는 PCT 공개 번호 WO 2018/187363에서 찾아볼 수 있다.
예시적 실시양태에서, 본 출원은 PV 선택적 조절 요소의 제어 하에 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 핵산 서열을 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 본 출원은 서열식별번호: 2-4 중 어느 하나를 갖는 PV 선택적 조절 요소의 제어 하에 하기 서열: 서열식별번호: 77-98 중 어느 하나를 갖는 DBD를 포함하는, SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 핵산 서열을 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 본 출원은 서열식별번호: 2-4 중 어느 하나를 갖는 PV 선택적 조절 요소의 제어 하에 하기 서열: 서열식별번호: 99-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 포함하는, SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 핵산 서열을 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 본 출원은 서열식별번호: 2-4 중 어느 하나를 갖는 PV 선택적 조절 요소의 제어 하에 하기 서열: 서열식별번호: 67-73 중 어느 하나를 포함하는 핵산 서열을 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 본 출원은 서열식별번호: 2 중 어느 하나를 갖는 PV 선택적 조절 요소의 제어 하에 하기 서열: 서열식별번호: 148-151 중 어느 하나를 갖는 DBD를 포함하는, SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 핵산 서열을 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 본 출원은 서열식별번호: 2 중 어느 하나를 갖는 PV 선택적 조절 요소의 제어 하에 하기 서열: 서열식별번호: 99-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나를 포함하는, SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 핵산 서열을 포함하는 발현 카세트를 제공한다. 특정 실시양태에서, 본 출원은 서열식별번호: 2 중 어느 하나를 갖는 PV 선택적 조절 요소의 제어 하에 하기 서열: 서열식별번호: 67-76 또는 316 중 어느 하나를 포함하는 핵산 서열을 포함하는 발현 카세트를 제공한다.
특정 실시양태에서, 본 출원은 PV 선택적 마이크로RNA 결합 부위 및 프로모터 및/또는 인핸서 서열을 포함하는 발현 카세트를 제공한다. 본원에 기재된 임의의 프로모터가 발현 카세트에 포함될 수 있다. 예시적 실시양태에서, 본원에 제공된 발현 카세트는 PV 선택적 마이크로RNA 결합 부위 및 PV 선택적 조절 요소를 포함한다. 특정 실시양태에서, 본원에 제공된 발현 카세트는 PV 선택적 마이크로RNA 결합 부위 및 (i) 서열식별번호: 2-4 중 어느 하나; (ii) 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소를 포함한다. 특정 실시양태에서, 본원에 제공된 발현 카세트는 (1) (i) 서열식별번호: 7, 14 또는 15 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위, 및 (2) (i) 서열식별번호: 2-4 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소를 포함한다. 특정 실시양태에서, 본원에 제공된 발현 카세트는 (1) (i) 서열식별번호: 7; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위, 및 (2) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소를 포함한다. 한 실시양태에서, 본원에 제공된 발현 카세트는 서열식별번호: 7을 포함하는 마이크로RNA 결합 부위 및 서열식별번호: 2를 포함하는 PV 선택적 조절 요소를 포함한다. 특정 실시양태에서, 본원에 제공된 폴리뉴클레오티드는 (1) (i) 서열식별번호: 14; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위, 및 (2) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소를 포함한다. 한 실시양태에서, 본원에 제공된 발현 카세트는 서열식별번호: 15를 포함하는 마이크로RNA 결합 부위 및 서열식별번호: 2를 포함하는 PV 선택적 조절 요소를 포함한다. 특정 실시양태에서, 본원에 제공된 발현 카세트는 (1) (i) 서열식별번호: 15; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위, 및 (2) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소를 포함한다. 한 실시양태에서, 본원에 제공된 발현 카세트는 서열식별번호: 15를 포함하는 마이크로RNA 결합 부위 및 서열식별번호: 2를 포함하는 PV 선택적 조절 요소를 포함한다.
특정 실시양태에서, 본원에 제공된 발현 카세트는 PV 선택적 마이크로RNA 결합 부위 및 본원에 제공된 바와 같은 SCN1A의 발현을 상향조절하는 eTF를 코딩하는 서열을 포함한다. 예시적 실시양태에서, 본 출원은 PV 선택적 조절 요소, 본원에 제공된 바와 같은 SCN1A의 발현을 상향조절하는 eTF 및 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다. 예시적 실시양태에서, 본 출원은 (1) (i) 서열식별번호: 2-4 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소, (2) (i) 서열식별번호: 77-131, 205, 207, 209, 213, 217, 219, 221 또는 223 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는, SCN1A를 상향조절하는 eTF를 코딩하는 서열, 및 (3) (i) 서열식별번호: 7, 14 또는 15 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다. 또 다른 예시적 실시양태에서, 본 출원은 (1) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소, (2) (i) 서열식별번호: 77 또는 127 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는, SCN1A를 상향조절하는 eTF를 코딩하는 서열, 및 (3) (i) 서열식별번호: 7; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다. 또 다른 예시적 실시양태에서, 본 출원은 (1) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소, (2) (i) 서열식별번호: 77 또는 127 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는, SCN1A를 상향조절하는 eTF를 코딩하는 서열, 및 (3) (i) 서열식별번호: 14; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다. 또 다른 예시적 실시양태에서, 본 출원은 (1) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소, (2) (i) 서열식별번호: 77 또는 127 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는, SCN1A를 상향조절하는 eTF를 코딩하는 서열, 및 (3) (i) 서열식별번호: 15; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다. 또 다른 예시적 실시양태에서, 본 출원은 (1) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소, (2) (i) 서열식별번호: 92 또는 106 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는, SCN1A를 상향조절하는 eTF를 코딩하는 서열, 및 (3) (i) 서열식별번호: 7; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다. 또 다른 예시적 실시양태에서, 본 출원은 (1) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소, (2) (i) 서열식별번호: 92 또는 106 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는, SCN1A를 상향조절하는 eTF를 코딩하는 서열, 및 (3) (i) 서열식별번호: 14; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다. 또 다른 예시적 실시양태에서, 본 출원은 (1) (i) 서열식별번호: 2; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 조절 요소, (2) (i) 서열식별번호: 92 또는 106 중 어느 하나; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는, SCN1A를 상향조절하는 eTF를 코딩하는 서열, 및 (3) (i) 서열식별번호: 15; (ii) (i)의 그의 변이체, 기능적 단편 또는 조합; 또는 (iii) (i) 또는 (ii) 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트를 제공한다.
특정 실시양태에서, PV 선택적 조절 요소 및 PV 선택적 마이크로RNA 결합 부위를 포함하는 본원에 제공된 발현 카세트는 5 kb, 4.9 kb, 4.8 kb, 4.7 kb, 4.6 kb, 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2.3 kb, 2.2 kb, 2.1 kb, 2.0 kb, 1.9 kb, 1.8 kb, 1.7 kb, 1.6 kb 또는 1.5 kb 미만, 또는 약 1.5-5 kb, 1.5-4.7 kb, 1.5-4.5 kb, 1.5-4.0 kb, 1.5-3.5 kb, 1.5-3.0 kb, 1.5-2.5 kb, 1.5-2.0 kb 크기이다.
특정 실시양태에서, 본원에 제공된 발현 카세트는 프로모터에 추가로 1개 이상의 추가의 조절 요소, 예컨대, 예를 들어 전사 개시 또는 종결과 연관된 서열, 인핸서 서열 및 효율적인 RNA 프로세싱 신호를 포함할 수 있다. 예시적인 조절 요소는, 예를 들어 인트론, 인핸서, UTR, 안정성 요소, WPRE 서열, 코작 컨센서스 서열, 번역후 반응 요소, 마이크로RNA 결합 부위 또는 폴리아데닐화 (폴리A) 서열 또는 그의 조합을 포함한다. 조절 요소는 유전자 발현의 전사기, 전사후기 또는 번역기에서 유전자 발현을 조정하는 기능을 할 수 있다. RNA 수준에서, 조절은 번역 (예를 들어, 번역을 위해 mRNA를 안정화시키는 안정성 요소), RNA 절단, RNA 스플라이싱 및/또는 전사 종결의 수준에서 발생할 수 있다. 다양한 실시양태에서, 조절 요소는 관심 세포 유형에서 유전자 발현 선택성을 증가시키고/거나, RNA 전사체가 생산되는 속도를 증가시키고/거나, 생산된 RNA의 안정성을 증가시키고/거나, RNA 전사체로부터의 단백질 합성 속도를 증가시키는 전사 인자를 코딩 영역으로 동원할 수 있다. 예시적 실시양태에서, 본원에 제공된 발현 카세트는 본원에 제공된 바와 같은 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함한다.
특정 실시양태에서, 본원에 기재된 발현 카세트는 폴리A 서열을 추가로 포함한다. 적합한 폴리A 서열은, 예를 들어 길이가 약 75 bp인 인공 폴리A (PA75) (예를 들어, WO 2018/126116 참조), 소 성장 호르몬 폴리A, SV40 초기 폴리A 신호, SV40 후기 폴리A 신호, 토끼 베타 글로빈 폴리A, HSV 티미딘 키나제 폴리A, 프로타민 유전자 폴리A, 아데노바이러스 5 EIb 폴리A, 성장 호르몬 폴리A 또는 PBGD 폴리A를 포함한다. 예시적 실시양태에서, 본원에 제공된 발현 카세트에 사용하기에 적합한 폴리A 서열은 hGH 폴리A (서열식별번호: 17) 또는 합성 폴리A (서열식별번호: 16)이다. 전형적으로, 폴리A 서열은 본원에 기재된 발현 카세트에서 eTF를 코딩하는 폴리뉴클레오티드의 하류에 위치한다.
특정 실시양태에서, 본원에 제공된 발현 카세트는 1개 이상의 핵 국재화 신호 (NLS)를 코딩하는 1개 이상의 핵산 서열을 추가로 포함한다. 세포 핵 내로 부착되는 단백질의 유입을 용이하게 하는 임의의 NLS 펩티드가 사용될 수 있다. NLS의 예는, 예를 들어 SV40 대형 T-항원 NLS, 뉴클레오플라스민 NLS, EGL-13 NLS, c-Myc NLS 및 TUS-단백질 NLS를 포함한다. 예를 들어, 문헌 [C. Dingwall et al., J. Cell Biol. 107: 841-9 (1988); J.P. Makkerh et al., Curr Biol. 6: 1025-7 (1996); 및 M. Ray et al., Bioconjug. Chem. 26: 1004-7 (2015)]을 참조한다. NLS는 eTF 단백질 서열 상의 어디에나 위치할 수 있지만, 바람직한 실시양태에서 eTF의 N-말단 또는 eTF의 도메인에 접합된다. 예시적 실시양태에서, 본원에 제공된 핵산 카세트는 eTF의 N-말단에 융합된 NLS를 수반한 eTF를 코딩한다. 다른 실시양태에서, 본원에 제공된 핵산 카세트는 eTF의 N-말단에 융합된 제1 NLS 및 eTF의 DBD와 TAD 도메인 사이에 위치한 제2 NLS를 수반한 eTF를 코딩한다.
발현 벡터
특정 실시양태에서, 본원에 기재된 발현 카세트는 발현 벡터 내로 혼입될 수 있다. 발현 벡터는 형질감염 또는 형질도입을 통해 발현 카세트를 표적 세포로 전달하는데 사용될 수 있다. 벡터는 발현 카세트 또는 트랜스진을 숙주 세포의 게놈 내로 통합시키는 벡터의 능력을 지칭하는 통합 또는 비-통합 벡터일 수 있다. 발현 벡터의 예는 (a) 비-바이러스 벡터, 예컨대 선형 올리고뉴클레오티드 및 원형 플라스미드를 포함하는 핵산 벡터; 인공 염색체, 예컨대 인간 인공 염색체 (HAC), 효모 인공 염색체 (YAC) 및 박테리아 인공 염색체 (BAC 또는 PAC); 에피솜 벡터; 트랜스포존 (예를 들어, 피기백); 및 (b) 바이러스 벡터, 예컨대 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터 및 아데노-연관 바이러스 벡터를 포함하나 이에 제한되지는 않는다.
발현 벡터는 선형 올리고뉴클레오티드 또는 원형 플라스미드일 수 있고, 물리적 및 화학적 방법을 포함한 다양한 형질감염 방법을 통해 세포로 전달될 수 있다. 물리적 방법은 일반적으로 유전 물질의 세포내 전달을 용이하게 하는데 있어서 세포 막 장벽을 상쇄시키는 물리적 힘을 사용한 전달 방법을 지칭한다. 물리적 방법의 예는 바늘, 탄도 DNA, 전기천공, 초음파천공, 포토포레이션, 마그네토펙션 및 히드로포레이션의 사용을 포함한다. 화학적 방법은 일반적으로 화학적 담체가 핵산 분자를 세포로 전달하는 방법을 지칭하고, 무기 입자, 지질-기반 벡터, 중합체-기반 벡터 및 펩티드-기반 벡터를 포함할 수 있다.
일부 실시양태에서, 발현 벡터는 양이온성 지질 (예를 들어, 양이온성 리포솜)을 사용하여 표적 세포에 투여된다. 다양한 유형의 지질, 예컨대, 예를 들어 지질 나노 에멀젼 (예를 들어, 하나의 불혼화성 액체가 또 다른 액체 중에 분산된, 유화제에 의해 안정화된 분산액임) 또는 고체 지질 나노입자가 유전자 전달을 위해 조사되었다.
일부 실시양태에서, 발현 벡터는 펩티드 기반 전달 비히클을 사용하여 표적 세포에 투여된다. 펩티드 기반 전달 비히클은 전달될 유전 물질을 보호하고, 특이적 세포 수용체를 표적화하고, 엔도솜 막을 파괴하고, 유전 물질을 핵 내로 전달하는 이점을 가질 수 있다. 일부 실시양태에서, 발현 벡터는 중합체 기반 전달 비히클을 사용하여 표적 세포에 투여된다. 중합체 기반 전달 비히클은 천연 단백질, 펩티드 및/또는 폴리사카라이드 또는 합성 중합체를 포함할 수 있다. 한 실시양태에서, 중합체 기반 전달 비히클은 폴리에틸렌이민 (PEI)을 포함한다. PEI는 DNA를 양으로 하전된 입자로 축합시킬 수 있으며, 이는 음이온성 세포 표면 잔기에 결합하고 세포내이입을 통해 세포 내로 도입된다. 다른 실시양태에서, 중합체 기반 전달 비히클은 폴리-L-리신 (PLL), 폴리 (DL-락트산) (PLA), 폴리 (DL-락티드-코-글리코시드) (PLGA), 폴리오르니틴, 폴리아르기닌, 히스톤, 프로타민, 덴드리머, 키토산, 덱스트란의 합성 아미노 유도체 및/또는 양이온성 아크릴 중합체를 포함할 수 있다. 특정 실시양태에서, 중합체 기반 전달 비히클은 중합체, 예컨대, 예를 들어 PEG 및 PLL의 혼합물을 포함할 수 있다.
특정 실시양태에서, 발현 벡터는 유전자 요법에 적합한 바이러스 벡터일 수 있다. 바이러스 유전자 요법 벡터 또는 유전자 전달 벡터의 바람직한 특징은 높은 역가로 재현가능하고 안정하게 증식 및 정제되는 능력; 표적화된 전달을 매개하는 능력 (예를 들어, 다른 곳에 광범위한 벡터 전파 없이 관심 조직 또는 기관에 특이적으로 트랜스진을 전달하는 능력); 및 유해 부작용을 유도하지 않으면서 유전자 전달 및 트랜스진 발현을 매개하는 능력을 포함할 수 있다.
여러 유형의 바이러스, 예를 들어 아데노-연관 바이러스로 지칭되는 비-병원성 파르보바이러스가, 바이러스 감염 경로를 이용하지만 복제 및 독성으로 이어질 수 있는 바이러스 유전자의 후속 발현을 피함으로써 유전자 요법의 목적을 위해 조작되었다. 이러한 바이러스 벡터는, 바이러스 게놈으로부터 코딩 영역의 전부 또는 일부를 결실시키지만, 벡터 게놈을 바이러스 캡시드 내로 패키징하는 것 또는 벡터 핵산 (예를 들어, DNA)을 숙주 염색질 내로 통합시키는 것과 같은 기능에 필요할 수 있는 서열 (예를 들어, 말단 반복 서열)을 무손상으로 남김으로써 수득될 수 있다.
다양한 실시양태에서, 적합한 바이러스 벡터는 레트로바이러스 (예를 들어, A-유형, B-유형, C-유형 및 D-유형 바이러스), 아데노바이러스, 파르보바이러스 (예를 들어 아데노-연관 바이러스 또는 AAV), 코로나바이러스, 음성 가닥 RNA 바이러스, 예컨대 오르토믹소바이러스 (예를 들어, 인플루엔자 바이러스), 랍도바이러스 (예를 들어, 광견병 및 수포성 구내염 바이러스), 파라믹소바이러스 (예를 들어 홍역 및 센다이), 양성 가닥 RNA 바이러스, 예컨대 피코르나바이러스 및 알파바이러스, 및 이중-가닥 DNA 바이러스, 예컨대 아데노바이러스, 헤르페스바이러스 (예를 들어, 단순 포진 바이러스 유형 1 및 2, 엡스타인-바르 바이러스, 시토메갈로바이러스) 및 폭스바이러스 (예를 들어, 백시니아, 계두 및 카나리폭스)를 포함한다. 레트로바이러스의 예는 조류 백혈증-육종 바이러스, 인간 T-림프향성 바이러스 유형 1 (HTLV-1), 소 백혈병 바이러스 (BLV), 렌티바이러스 및 스푸마바이러스를 포함한다. 다른 바이러스는, 예를 들어 노워크 바이러스, 토가바이러스, 플라비바이러스, 레오바이러스, 파포바바이러스, 헤파드나바이러스 및 간염 바이러스를 포함한다. 바이러스 벡터는 숙주 게놈 내로 통합되는 그의 능력에 따라 2개의 군 - 통합 및 비-통합으로 분류될 수 있다. 온코레트로바이러스 및 렌티바이러스는 숙주 세포 염색질 내로 통합될 수 있는 한편, 아데노바이러스, 아데노-연관 바이러스 및 포진 바이러스는 염색체외 에피솜으로서 세포 핵에서 우세하게 지속된다.
특정 실시양태에서, 적합한 바이러스 벡터는 레트로바이러스 벡터이다. 레트로바이러스는 레트로비리다에 과의 바이러스를 지칭한다. 레트로바이러스의 예는 온코레트로바이러스, 예컨대 뮤린 백혈병 바이러스 (MLV), 및 렌티바이러스, 예컨대 인간 면역결핍 바이러스 1 (HIV-1)을 포함한다. 레트로바이러스 게놈은 단일-가닥 (ss) RNA이고, 시스 또는 트랜스로 제공될 수 있는 다양한 유전자를 포함한다. 예를 들어, 레트로바이러스 게놈은 유전자 발현, 역전사 및 숙주 염색체 내로의 통합을 위한 요소와 함께, 시스-작용 서열, 예컨대 2개의 긴 말단 반복부 (LTR)를 함유할 수 있다. 다른 성분은 새롭게 형성된 비리온으로의 특이적 RNA 패키징을 위한 패키징 신호 (psi 또는 ψ), 및 역전사 동안 양성 가닥 DNA 합성의 개시 부위인 폴리퓨린 트랙 (PPT)을 포함한다. 추가로, 레트로바이러스 게놈은 gag, pol 및 env 유전자를 포함할 수 있다. gag 유전자는 구조 단백질을 코딩하고, pol 유전자는 ssRNA를 동반하며 바이러스 RNA의 DNA로의 역전사를 수행하는 효소를 코딩하고, env 유전자는 바이러스 외피를 코딩한다. 일반적으로, gag, pol 및 env는 바이러스 복제 및 패키징을 위해 트랜스로 제공된다.
특정 실시양태에서, 본원에 제공된 레트로바이러스 벡터는 렌티바이러스 벡터일 수 있다. 렌티바이러스의 적어도 5종의 혈청군 또는 혈청형이 인식된다. 상이한 혈청형의 바이러스는 특정 세포 유형 및/또는 숙주를 차등적으로 감염시킬 수 있다. 렌티바이러스는, 예를 들어 영장류 레트로바이러스 및 비-영장류 레트로바이러스를 포함한다. 영장류 레트로바이러스는 HIV 및 원숭이 면역결핍 바이러스 (SIV)를 포함한다. 비-영장류 레트로바이러스는 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV) 및 비스나바이러스를 포함한다. 렌티바이러스 또는 렌티벡터는 정지 세포를 형질도입할 수 있다. 온코레트로바이러스 벡터와 같이, 렌티벡터의 설계는 시스- 및 트랜스-작용 서열의 분리에 기초할 수 있다.
특정 실시양태에서, 본 출원은 최적화된 치료 레트로바이러스 벡터에 의한 전달을 위해 설계된 발현 벡터를 제공한다. 레트로바이러스 벡터는 좌측 (5') LTR; 바이러스의 패키징 및/또는 핵 유입을 보조하는 서열; 프로모터; 임의로 1개 이상의 추가의 조절 요소 (예컨대, 예를 들어, 인핸서 또는 폴리A 서열); 임의로 렌티바이러스 역 반응 요소 (RRE); eTF를 코딩하는 서열에 작동가능하게 연결된 PV 선택적 조절 요소를 포함하는 구축물; 임의로 인슐레이터; 및 우측 (3') 레트로바이러스 LTR을 포함하는 렌티바이러스일 수 있다.
예시적 실시양태에서, 본원에 제공된 바이러스 벡터는 아데노-연관 바이러스 (AAV)이다. AAV는 인간 및 일부 다른 영장류 종을 감염시키는 작은 복제-결손 비-외피보유 동물 바이러스이다. AAV는 인간 질환을 유발하지 않는 것으로 알려져 있고, 경도 면역 반응을 유도한다. AAV 벡터는 또한 숙주 세포 게놈 내로의 통합 없이 분열 세포 및 정지 세포 둘 다를 감염시킬 수 있다.
AAV 게놈은 ~4.7kb 길이인 선형 단일 가닥 DNA로 이루어진다. 게놈은 약 145bp 길이인 역전된 말단 반복부 (ITR) 서열이 플랭킹되어 있는 2개의 오픈 리딩 프레임 (ORF)으로 이루어진다. ITR은 5' 말단의 뉴클레오티드 서열 (5' ITR) 및 회문식 서열을 함유하는 3' 말단에 위치하는 뉴클레오티드 서열 (3' ITR)로 이루어진다. ITR은 제2 가닥 합성을 위한 DNA 복제의 개시 동안 프라이머로서 기능하는 T-형상 헤어핀 구조를 상보적 염기 쌍형성에 의해 형성하도록 폴딩됨으로써 시스로 기능한다. 2개의 오픈 리딩 프레임은 비리온의 복제 및 패키징에 수반되는 rep 및 cap 유전자를 코딩한다. 예시적 실시양태에서, 본원에 제공된 AAV 벡터는 rep 또는 cap 유전자를 함유하지 않는다. 이러한 유전자는 하기에 추가로 기재된 바와 같이 비리온을 생산하기 위해 트랜스로 제공될 수 있다.
특정 실시양태에서, AAV 벡터는 스터퍼 핵산을 포함할 수 있다. 일부 실시양태에서, 스터퍼 핵산은 녹색 형광 단백질 또는 항생제 내성 유전자, 예컨대 카나마이신 또는 암피실린을 코딩할 수 있다. 특정 실시양태에서, 스터퍼 핵산은 (예를 들어, 5'와 3' ITR 서열들 사이에 위치하는 eTF 트랜스진 서열 및 조절 서열과 비교하여) ITR 서열의 외부에 위치할 수 있다.
AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 및 AAV13을 포함한 AAV의 다양한 혈청형이 존재한다. 이들 혈청형은 그의 향성 또는 그가 감염시키는 세포의 유형이 상이하다. AAV는 다수의 혈청형 (예를 들어, 위형)으로부터의 게놈 및 캡시드를 포함할 수 있다. 예를 들어, AAV는 혈청형 5 또는 혈청형 9로부터의 캡시드에 패키징된 혈청형 2 (예를 들어, ITR)의 게놈을 포함할 수 있다. 유사형은 형질도입 효율을 개선시킬 뿐만 아니라 향성을 변경시킬 수 있다.
일부 경우에, 혈액 뇌 장벽을 가로지르거나 CNS의 세포를 감염시킬 수 있는 AAV 혈청형이 바람직하다. 일부 경우에, AAV9 또는 그의 변이체는 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 트랜스진에 작동가능하게 연결된 PV 선택적 조절 요소를 포함하는 본 개시내용의 발현 카세트를 전달하기 위해 사용된다. 일부 경우에, AAV9 또는 그의 변이체는 PV 선택적 마이크로RNA 결합 부위를 포함하는 본 개시내용의 발현 카세트를 전달하기 위해 사용된다. 일부 경우에, AAV9 또는 그의 변이체는 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 트랜스진에 작동가능하게 연결된 PV 선택적 조절 요소 및 PV 선택적 마이크로RNA 결합 부위를 포함하는 본 개시내용의 발현 카세트를 전달하기 위해 사용된다.
예시적 실시양태에서, 본 출원은 AAV에 의한 전달을 위해 설계된 발현 벡터를 제공한다. AAV는 임의의 혈청형, 예를 들어 AAV1, AAV2, AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ 또는 키메라, 하이브리드 또는 변이체 AAV일 수 있다. AAV는 또한 자기-상보적 AAV (scAAV)일 수 있다. 특정 실시양태에서, AAV에 의한 전달을 위해 설계된 발현 벡터는 5' ITR 및 3' ITR을 포함한다. 특정 실시양태에서, AAV에 의한 전달을 위해 설계된 발현 벡터는 5' ITR, 프로모터, eTF를 코딩하는 트랜스진 및 3' ITR을 포함한다. 특정 실시양태에서, AAV에 의한 전달을 위해 설계된 발현 벡터는 5' ITR, 인핸서, 프로모터, eTF를 코딩하는 트랜스진, 폴리A 서열 및 3' ITR을 포함한다.
숙주 세포
또 다른 측면에서, 본 발명은 본원에 개시된 바와 같은 발현 카세트 또는 발현 벡터를 포함하는 숙주 세포에 관한 것이다. 숙주 세포는 박테리아 세포, 효모 세포, 곤충 세포 또는 포유동물 세포일 수 있다. 예시적 실시양태에서, 숙주 세포는 관심 바이러스에 의해 감염되기 쉽고 시험관내 배양에 적용가능한 임의의 세포주를 지칭한다.
특정 실시양태에서, 본원에 제공된 숙주 세포는 생체외 유전자 요법 목적을 위해 사용될 수 있다. 이러한 실시양태에서, 세포는 PV 선택적 마이크로RNA 결합 부위 및/또는 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열을 포함하는 핵산 분자 또는 발현 벡터로 형질감염되고, 후속적으로 환자 또는 대상체 내로 이식된다. 이식된 세포는 자가, 동종 또는 이종 기원을 가질 수 있다. 임상 사용을 위해, 세포 단리는 일반적으로 우수 제조 관리기준 (GMP) 조건 하에 수행될 것이다. 이식 전에, 세포 품질 및 미생물 또는 다른 오염물의 부재가 전형적으로 검사되고, 예컨대 방사선 및/또는 면역억제 처리를 사용한 사전조건화가 수행될 수 있다. 추가로, 숙주 세포가 세포 증식 및/또는 분화를 자극하는 성장 인자와 함께 이식될 수 있다.
특정 실시양태에서, 숙주 세포는 생체외 유전자 요법에 사용될 수 있다. 바람직하게는, 상기 세포는 진핵 세포, 예컨대 포유동물 세포이고, 이들은 인간, 비-인간 영장류, 예컨대 유인원; 침팬지; 원숭이 및 오랑우탄, 개 및 고양이를 비롯한 가정 동물, 뿐만 아니라 말, 소, 돼지, 양 및 염소와 같은 가축, 또는 마우스, 래트, 기니 피그, 토끼, 햄스터 등을 비제한적으로 포함하는 다른 포유동물 종을 포함하나 이에 제한되지는 않는다. 관련 기술분야의 통상의 기술자는 이식될 환자 또는 대상체에 따라 보다 적절한 세포를 선택할 것이다.
특정 실시양태에서, 본원에 제공된 숙주 세포는 자기-재생 및 다능성 특성을 갖는 세포, 예컨대 줄기 세포 또는 유도된 만능 줄기 세포일 수 있다. 줄기 세포는 바람직하게는 중간엽 줄기 세포이다. 중간엽 줄기 세포 (MSC)는 골모세포, 연골세포, 지방세포 또는 근세포 중 적어도 1종으로 분화될 수 있고, 임의의 유형의 조직으로부터 단리될 수 있다. 일반적으로, MSC는 골수, 지방 조직, 제대 또는 말초 혈액으로부터 단리될 것이다. 그의 수득 방법은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 유도된 만능 줄기 세포 (iPS 세포 또는 iPSC로도 공지됨)는 성체 세포로부터 직접적으로 생성될 수 있는 만능 줄기 세포의 한 유형이다. 야마나카(Yamanaka) 등은 Oct3/4, Sox2, Klf4 및 c-Myc 유전자를 마우스 및 인간 섬유모세포 내로 전달하고 세포가 유전자를 발현하도록 강제함으로써 iPS 세포를 유도하였다 (WO 2007/069666). 후속적으로 톰슨(Thomson) 등은 Klf4 및 c-Myc 대신 Nanog 및 Lin28을 사용하여 인간 iPS 세포를 생산하였다 (WO 2008/118820).
예시적 실시양태에서, 본원에 제공된 숙주 세포는 패키징 세포이다. 상기 세포는 부착 세포 또는 현탁 세포일 수 있다. 패키징 세포 및 헬퍼 벡터 또는 바이러스 또는 DNA 구축물(들)은 바이러스 벡터의 완전한 복제 및 패키징에 요구되는 모든 누락 기능을 트랜스로 함께 제공한다.
바람직하게는, 상기 패키징 세포는 진핵 세포, 예컨대 원숭이, 인간, 개 및 설치류 세포를 포함한 포유동물 세포이다. 인간 세포의 예는 PER.C6 세포 (WO01/38362), MRC-5 (ATCC CCL-171), WI-38 (ATCC CCL-75), HEK-293 세포 (ATCC CRL-1573), HeLa 세포 (ATCC CCL2) 및 태아 레서스 폐 세포 (ATCC CL-160)이다. 비-인간 영장류 세포의 예는 베로 세포 (ATCC CCL81), COS-1 세포 (ATCC CRL-1650) 또는 COS-7 세포 (ATCC CRL-1651)이다. 개 세포의 예는 MDCK 세포 (ATCC CCL-34)이다. 설치류 세포의 예는 햄스터 세포, 예컨대 BHK21-F, HKCC 세포 또는 CHO 세포이다.
포유동물 공급원에 대한 대안으로서, 본 발명에 사용하기 위한 세포주는 조류 공급원, 예컨대 닭, 오리, 거위, 메추라기 또는 꿩으로부터 유래될 수 있다. 조류 세포주의 예는 조류 배아 줄기 세포 (WO01/85938 및 WO03/076601), 불멸화 오리 망막 세포 (WO2005/042728), 및 조류 배아 줄기 세포 유래 세포, 예컨대 닭 세포 (WO2006/108846) 또는 오리 세포, 예컨대 EB66 세포주 (WO2008/129058 및 WO2008/142124)를 포함한다.
또 다른 실시양태에서, 상기 숙주 세포는 곤충 세포, 예컨대 SF9 세포 (ATCC CRL-1711), Sf21 세포 (IPLB-Sf21), MG1 세포 (BTI-TN-MG1) 또는 하이 파이브(High Five)™ 세포 (BTI-TN-5B1-4)이다.
특정 실시양태에서, 본 발명의 재조합 AAV 벡터/게놈 (예를 들어, PV 선택적 마이크로RNA 결합 부위 및/또는 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열을 포함함)을 포함하는 본원에 제공된 숙주 세포는 1개 이상의 추가의 핵산 구축물, 예컨대, 예를 들어 (i) rep 및 cap 유전자를 코딩하지만 ITR 서열을 보유하지 않는 핵산 구축물 (예를 들어, AAV 헬퍼 플라스미드); 및/또는 (ii) AAV 복제에 필요한 아데노바이러스 기능을 제공하는 핵산 구축물 (예를 들어, 플라스미드)을 추가로 포함할 수 있다. 예시적 실시양태에서, 본원에 제공된 숙주 세포는 i) PV 선택적 마이크로RNA 결합 부위 및/또는 본원에 제공된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 (즉, 재조합 AAV 게놈)을 포함하는 발현 벡터; ii) ITR 서열을 보유하지 않는, AAV rep 및 cap 유전자를 코딩하는 핵산 구축물; 및 iii) 아데노바이러스 헬퍼 유전자를 포함하는 핵산 구축물 (하기에 추가로 기재된 바와 같음)을 포함한다.
특정 실시양태에서, rep, cap 및 아데노바이러스 헬퍼 유전자는 단일 플라스미드 상에서 조합될 수 있다 (Blouin V et al. J Gene Med. 2004; 6(suppl): S223-S228; Grimm D. et al. Hum. Gene Ther. 2003; 7: 839-850). 따라서, 또 다른 예시적 실시양태에서, 본원에 제공된 숙주 세포는 i) PV 선택적 마이크로RNA 결합 부위 및/또는 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 (즉, 재조합 AAV 게놈)을 포함하는 발현 벡터; 및 ii) ITR 서열을 보유하지 않고 아데노바이러스 헬퍼 유전자를 추가로 포함하는, AAV rep 및 cap 유전자를 코딩하는 플라스미드를 포함한다.
또 다른 실시양태에서, 본원에 제공된 숙주 세포는 a) PV 선택적 마이크로RNA 결합 부위 및/또는 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 (즉, 재조합 AAV 게놈)을 포함하는 발현 벡터; b) ITR 서열을 보유하지 않는, AAV rep 및 cap 유전자를 코딩하는 플라스미드; 및 c) 아데노바이러스 헬퍼 유전자 E2a, E4 및 VA RNA를 포함하는 플라스미드를 포함하며; 여기서 공동-형질감염은 아데노바이러스 E1 유전자를 구성적으로 발현하고 교차보완하는 세포, 바람직하게는 포유동물 세포, 예컨대 HEK-293 세포 (ATCC CRL-1573)에서 수행된다.
특정 실시양태에서, AAV 벡터의 대규모 생산에 적합한 숙주 세포는 재조합 바큘로바이러스의 조합으로 감염될 수 있는 곤충 세포이다 (Urabe et al. Hum. Gene Ther. 2002; 13: 1935-1943). 예를 들어, SF9 세포는 AAV rep, AAV cap 및 패키징될 AAV 벡터를 각각 발현하는 3개의 바큘로바이러스 벡터로 공동-감염될 수 있다. 재조합 바큘로바이러스 벡터는 바이러스 복제 및/또는 패키징에 요구되는 바이러스 헬퍼 유전자 기능을 제공할 것이다.
본 발명에 따른 유전자 요법을 위한 비리온의 구축 및 생산에 대한 추가의 지침은 문헌 [Viral Vectors for Gene Therapy, Methods and Protocols. Series: Methods in Molecular Biology, Vol. 737. Merten and Al-Rubeai (Eds.); 2011 Humana Press (Springer); Gene Therapy. M. Giacca. 2010 Springer-Verlag; Heilbronn R. and Weger S. Viral Vectors for Gene Transfer: Current Status of Gene Therapeutics. In: Drug Delivery, Handbook of Experimental Pharmacology 197; M. Schafer-Korting (Ed.). 2010 Springer-Verlag; pp. 143-170; Adeno-Associated Virus: Methods and Protocols. R. O. Snyder and P. Moulllier (Eds). 2011 Humana Press (Springer); Bunning H. et al. Recent developments in adeno-associated virus technology. J. Gene Med. 2008; 10:717-733; 및 Adenovirus: Methods and Protocols. M. Chillon and A. Bosch (Eds.); Third. Edition. 2014 Humana Press (Springer)]에서 찾아볼 수 있다.
비리온 및 비리온의 제조 방법
특정 실시양태에서, 본 출원은 PV 선택적 마이크로RNA 결합 부위 및/또는 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열을 포함하는 바이러스 벡터를 포함하는 바이러스 입자를 제공한다. 용어 "바이러스 입자" 및 "비리온"은 본원에서 상호교환가능하게 사용되고, 캡시드 내에 패키징된 바이러스 게놈 (예를 들어, 바이러스 발현 벡터)을 포함하는 감염성 및 전형적으로 복제-결손 바이러스 입자에 관한 것이며, 경우에 따라, 예를 들어 레트로바이러스의 경우, 캡시드를 둘러싸는 지질 외피일 수 있다. "캡시드"는 바이러스 게놈이 패키징되는 구조를 지칭한다. 캡시드는 단백질로 제조된 여러 올리고머 구조 서브유닛으로 이루어진다. 예를 들어, AAV는 3종의 캡시드 단백질: VP1, VP2 및 VP3의 상호작용에 의해 형성된 이십면체 캡시드를 갖는다. 한 실시양태에서, 본원에 제공된 비리온은 PV 선택적 조절 요소 및 PV 선택적 마이크로RNA 결합 부위를 포함하는 AAV 벡터를 패키징함으로써 수득된 재조합 AAV 비리온 또는 rAAV 비리온이다. 또 다른 실시양태에서, 본원에 제공된 비리온은 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열에 작동가능하게 연결된 PV 선택적 조절 요소를 포함하는 AAV 벡터를 단백질 쉘에 패키징함으로써 수득된 재조합 AAV 비리온 또는 rAAV 비리온이다. 또 다른 실시양태에서, 본원에 제공된 비리온은 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열에 작동가능하게 연결된 PV 선택적 조절 요소 및 PV 선택적 마이크로RNA 결합 부위를 포함하는 AAV 벡터를 단백질 쉘에 패키징함으로써 수득된 재조합 AAV 비리온 또는 rAAV 비리온이다.
특정 실시양태에서, 본원에 제공된 재조합 AAV 비리온은 특정한 AAV 혈청형으로부터 유래된 AAV 게놈을 동일한 특정한 혈청형의 AAV에 상응하는 천연 Cap 단백질에 의해 형성된 바이러스 입자 내에 캡시드화함으로써 제조될 수 있다. 다른 실시양태에서, 본원에 제공된 AAV 바이러스 입자는 상이한 혈청형으로부터의 단백질 내로 패키징된 소정의 AAV 혈청형의 ITR(들)을 포함하는 바이러스 벡터를 포함한다. 예를 들어, 문헌 [Bunning H et al. J Gene Med 2008; 10: 717-733]을 참조한다. 예를 들어, 소정의 AAV 혈청형으로부터의 ITR을 갖는 바이러스 벡터는 a) 동일하거나 상이한 AAV 혈청형으로부터 유래된 캡시드 단백질로 구성된 바이러스 입자 (예를 들어, AAV2 ITR 및 AAV9 캡시드 단백질; AAV2 ITR 및 AAV8 캡시드 단백질 등); b) 상이한 AAV 혈청형 또는 돌연변이체로부터의 캡시드 단백질의 혼합물로 구성된 모자이크 바이러스 입자 (예를 들어, AAV1 및 AAV9 캡시드 단백질을 갖는 AAV2 ITR); c) 상이한 AAV 혈청형 또는 변이체 사이의 도메인 스와핑에 의해 말단절단된 캡시드 단백질로 구성된 키메라 바이러스 입자 (예를 들어, AAV9 도메인을 갖는 AAV8 캡시드 단백질을 갖는 AAV2 ITR); 또는 d) 표적 세포 특이적 수용체와의 엄격한 상호작용을 가능하게 하는, 선택적 결합 도메인을 디스플레이하도록 조작된 표적화된 바이러스 입자 (예를 들어, 펩티드 리간드의 삽입에 의해 유전자 말단절단된 AAV9 캡시드 단백질을 갖는 AAV5 ITR; 또는 캡시드 표면에의 펩티드 리간드의 커플링에 의해 비-유전자 변형된 AAV9 캡시드 단백질) 내로 패키징될 수 있다.
통상의 기술자는 본원에 제공된 AAV 비리온이 임의의 AAV 혈청형의 캡시드 단백질을 포함할 수 있다는 것을 인지할 것이다. 한 실시양태에서, 바이러스 입자는 AAV1, AAV2, AAV5, AAV8 및 AAV9로 이루어진 군으로부터 선택된 AAV 혈청형으로부터의 캡시드 단백질을 포함하며, 이는 CNS로의 전달에 보다 적합하다 (M. Hocquemiller et al., Hum Gene Ther 27(7): 478-496 (2016)). 특정한 실시양태에서, 바이러스 입자는 발현 카세트의 5'ITR 및 3'ITR 서열이 AAV2 혈청형의 것이고 캡시드 단백질이 AAV9 혈청형의 것인 본 발명의 발현 카세트를 포함한다.
형질감염, 안정한 세포주 생산 및 아데노바이러스-AAV 하이브리드, 헤르페스바이러스-AAV 하이브리드 (Conway, J E et al., (1997) J. Virology 71(11):8780-8789) 및 바큘로바이러스-AAV 하이브리드를 포함하는 감염성 하이브리드 바이러스 생산 시스템을 비롯한, rAAV 비리온의 생산을 위한 수많은 방법이 관련 기술분야에 공지되어 있다. rAAV 바이러스 입자의 생산을 위한 rAAV 생산 배양물은 모두 다음을 요구한다: 1) 바큘로바이러스 생산 시스템의 경우에, 예를 들어 인간-유래 세포주, 예컨대 HeLa, A549 또는 293 세포, 또는 곤충-유래 세포주, 예컨대 SF-9를 포함한 적합한 숙주 세포; 2) 야생형 또는 돌연변이 아데노바이러스 (예컨대 온도 감수성 아데노바이러스), 포진 바이러스, 바큘로바이러스, 또는 헬퍼 기능을 제공하는 플라스미드 구축물에 의해 제공되는 적합한 헬퍼 바이러스 기능; 3) AAV rep 및 cap 유전자 및 유전자 산물; 4) AAV ITR 서열이 플랭킹되어 있는 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함); 및 5) rAAV 생산을 지지하는 적합한 배지 및 배지 성분을 요구한다.
다양한 실시양태에서, 본원에 기재된 숙주 세포는 하기 3종의 성분을 포함한다: (1) rep 유전자 및 cap 유전자, (2) 헬퍼 기능을 제공하는 유전자, 및 (3) ITR이 플랭킹되어 있는 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함). AAV rep 유전자, AAV cap 유전자 및 헬퍼 기능을 제공하는 유전자는, 상기 유전자를 벡터, 예컨대, 예를 들어 플라스미드 내로 혼입시키고, 상기 벡터를 숙주 세포 내로 도입함으로써 세포 내로 도입될 수 있다. rep, cap 및 헬퍼 기능 유전자는 동일한 플라스미드 내로 또는 상이한 플라스미드 내로 혼입될 수 있다. 바람직한 실시양태에서, AAV rep 및 cap 유전자는 하나의 플라스미드 내로 혼입되고, 헬퍼 기능을 제공하는 유전자는 또 다른 플라스미드 내로 혼입된다. 비리온 생산을 위한 숙주 세포의 생성을 위한 다양한 플라스미드 (예를 들어, AAV rep 및 cap 유전자, 헬퍼 기능 또는 트랜스진을 포함함)는 관련 기술분야에 널리 공지된 임의의 적합한 방법을 사용하여 세포 내로 도입될 수 있다. 형질감염 방법의 예는 인산칼슘과의 공동-침전, DEAE-덱스트란, 폴리브렌, 전기천공, 미세주사, 리포솜-매개 융합, 리포펙션, 레트로바이러스 감염 및 바이오리스틱 형질감염을 포함하나 이에 제한되지는 않는다. 특정 실시양태에서, rep 및 cap 유전자, 헬퍼 기능 및 ITR이 플랭킹되어 있는 트랜스진을 제공하는 플라스미드는 세포 내로 동시에 도입될 수 있다. 또 다른 실시양태에서, rep 및 cap 유전자 및 헬퍼 기능을 제공하는 플라스미드는 트랜스진을 포함하는 플라스미드의 도입 전 또는 후에 세포에 도입될 수 있다. 예시적 실시양태에서, 세포는 다음 3종의 플라스미드로 동시에 형질감염된다 (예를 들어, 삼중 형질감염 방법): (1) ITR이 플랭킹되어 있는 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함)을 포함하는 플라스미드, (2) AAV rep 및 cap 유전자를 포함하는 플라스미드, 및 (3) 헬퍼 기능을 제공하는 유전자를 포함하는 플라스미드. 예시적인 숙주 세포는 293, A549 또는 HeLa 세포일 수 있다.
다른 실시양태에서, (1) AAV rep 및 cap 유전자, (2) 헬퍼 기능을 제공하는 유전자, 및 (3) ITR이 플랭킹되어 있는 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함) 중 1종 이상은 에피솜으로 및/또는 패키징 세포의 게놈 내로 통합되어 패키징 세포에 의해 보유될 수 있다. 한 실시양태에서, 숙주 세포는 AAV rep 및 cap 유전자 및 헬퍼 기능이 숙주 세포에서 안정하게 유지되고 ITR이 플랭킹되어 있는 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함)을 함유하는 플라스미드로 숙주 세포가 일시적으로 형질감염된 패키징 세포일 수 있다. 또 다른 실시양태에서, 숙주 세포는 AAV rep 및 cap 유전자가 숙주 세포에서 안정하게 유지되고 ITR이 플랭킹된 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함)을 함유하는 플라스미드 및 헬퍼 기능을 함유하는 플라스미드로 숙주 세포가 일시적으로 형질감염된 패키징 세포이다. 또 다른 실시양태에서, 숙주 세포는 헬퍼 기능이 숙주 세포에서 안정적으로 유지되고 ITR이 플랭킹되어 있는 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함)을 함유하는 플라스미드 및 rep 및 cap 유전자를 함유하는 플라스미드로 숙주 세포가 일시적으로 형질감염된 패키징 세포일 수 있다. 또 다른 실시양태에서, 숙주 세포는 rep 및 cap 유전자, 헬퍼 기능 및 ITR이 플랭킹되어 있는 트랜스진 서열 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함)로 안정적으로 형질감염된 생산자 세포주일 수 있다. 예시적인 패키징 및 생산자 세포는 293, A549 또는 HeLa 세포로부터 유래될 수 있다.
또 다른 실시양태에서, 생산자 세포주는 Rep 및 Cap 단백질을 제공하는 바큘로바이러스 발현 벡터로 감염된 곤충 세포주 (전형적으로 Sf9 세포)이다. 이 시스템은 아데노바이러스 헬퍼 유전자를 요구하지 않는다 (Ayuso E, et al., Curr. Gene Ther. 2010, 10:423-436).
본원에 사용된 용어 "cap 단백질"은 천연 AAV Cap 단백질 (예를 들어 VP1, VP2, VP3)의 적어도 1종의 기능적 활성을 갖는 폴리펩티드를 지칭한다. cap 단백질의 기능적 활성의 예는 캡시드의 형성을 유도하고, 단일-가닥 DNA의 축적을 용이하게 하고, 캡시드 내로의 AAV DNA 패키징 (즉, 캡시드화)을 용이하게 하고, 세포 수용체에 결합하고, 숙주 세포 내로의 비리온의 진입을 용이하게 하는 능력을 포함한다. 원칙적으로, 임의의 Cap 단백질이 본 발명의 문맥에 사용될 수 있다.
Cap 단백질은 숙주 향성, 세포, 조직 또는 기관 특이성, 수용체 용법, 감염 효율 및 AAV 바이러스의 면역원성에 영향을 미치는 것으로 보고되었다. 따라서, rAAV에 사용하기 위한 AAV 캡은, 예를 들어 대상체의 종 (예를 들어 인간 또는 비-인간), 대상체의 면역학적 상태, 장기 또는 단기 치료에 대한 대상체의 적합성, 또는 특정한 치료 용도 (예를 들어 특정한 질환 또는 장애의 치료 또는 특정한 세포, 조직 또는 기관으로의 전달)를 고려하여 선택될 수 있다. 특정 실시양태에서, cap 단백질은 AAV1, AAV2, AAV5, AAV8 및 AAV9 혈청형으로 이루어진 군의 AAV로부터 유래된다. 예시적 실시양태에서, cap 단백질은 AAV9로부터 유래된다.
일부 실시양태에서, 본 발명의 방법에 사용하기 위한 AAV Cap은 상기 언급된 AAV cap 중 1종 또는 그의 코딩 핵산의 돌연변이유발 (즉, 삽입, 결실 또는 치환)에 의해 생성될 수 있다. 일부 실시양태에서, AAV cap은 상기 언급된 AAV cap 중 1종 이상에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 또는 그 초과로 유사하다.
일부 실시양태에서, AAV cap은 상기 언급된 AAV cap 중 2, 3, 4종 또는 그 초과로부터의 도메인을 포함하는 키메라이다. 일부 실시양태에서, AAV cap은 2 또는 3종의 상이한 AAV 또는 재조합 AAV로부터 기원하는 VP1, VP2 및 VP3 단량체의 모자이크이다. 일부 실시양태에서, rAAV 조성물은 상기 언급된 cap 중 1종 초과를 포함한다.
일부 실시양태에서, rAAV 비리온에 사용하기 위한 AAV cap은 이종 서열 또는 다른 변형을 함유하도록 조작된다. 예를 들어, 선택적 표적화 또는 면역 회피를 부여하는 펩티드 또는 단백질 서열은 cap 단백질로 조작될 수 있다. 대안적으로 또는 추가로, cap은 rAAV의 표면이 폴리에틸렌 글리콜화 (즉, PEG화)되도록 화학적으로 변형될 수 있으며, 이는 면역 회피를 용이하게 할 수 있다. cap 단백질은 또한 (예를 들어, 그의 천연 수용체 결합을 제거하도록 또는 면역원성 에피토프를 차폐하도록) 돌연변이유발될 수 있다.
본원에 사용된 용어 "rep 단백질"은 천연 AAV rep 단백질 (예를 들어 rep 40, 52, 68, 78)의 적어도 1종의 기능적 활성을 갖는 폴리펩티드를 지칭한다. rep 단백질의 기능적 활성의 예는 DNA 헬리카제 활성뿐만 아니라 AAV DNA 복제 기점의 인식, 결합 및 닉킹을 통한 DNA의 복제를 용이하게 하는 것을 포함한, 단백질의 생리학적 기능과 연관된 임의의 활성을 포함한다. 추가의 기능은 AAV (또는 다른 이종) 프로모터로부터의 전사의 조정 및 숙주 염색체 내로의 AAV DNA의 부위-특이적 통합을 포함한다. 특정한 실시양태에서, AAV rep 유전자는 혈청형 AAV1, AAV2, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAVrh10; 보다 바람직하게는 AAV1, AAV2, AAV5, AAV8 및 AAV9로 이루어진 군으로부터 선택된 AAV 혈청형으로부터의 것일 수 있다.
일부 실시양태에서, 본 발명의 방법에 사용하기 위한 AAV rep 단백질은 상기 언급된 AAV rep 중 1종 또는 그의 코딩 핵산의 돌연변이유발 (즉, 삽입, 결실 또는 치환)에 의해 생성될 수 있다. 일부 실시양태에서, AAV rep는 상기 언급된 AAV rep 중 1종 이상에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 또는 그 초과로 유사하다.
본원에 사용된 표현 "헬퍼 기능" 또는 "헬퍼 유전자"는 AAV가 복제에 의존하는 바이러스 단백질을 지칭한다. 헬퍼 기능은 AAV 유전자 전사의 활성화, 단계 특이적 AAV mRNA 스플라이싱, AAV DNA 복제, cap 발현 산물의 합성 및 AAV 캡시드 어셈블리에 수반되는 단백질을 비제한적으로 포함하는, AAV 복제에 요구되는 단백질을 포함한다. 바이러스-기반 보조 기능은 임의의 공지된 헬퍼 바이러스, 예컨대 아데노바이러스, 헤르페스바이러스 (단순 포진 바이러스 유형-1 이외의 것) 및 백시니아 바이러스로부터 유래될 수 있다. 헬퍼 기능은 아데노바이러스 E1, E2a, VA 및 E4 또는 헤르페스바이러스 UL5, ULB, UL52 및 UL29 및 헤르페스바이러스 폴리머라제를 비제한적으로 포함한다. 바람직한 실시양태에서, AAV가 복제에 의존하는 단백질은 아데노바이러스로부터 유래된다.
일부 실시양태에서, AAV가 본 발명의 방법에서의 사용을 위해 복제에 의존하는 바이러스 단백질은 상기 언급된 바이러스 단백질 중 1종 또는 그의 코딩 핵산의 돌연변이유발 (즉, 삽입, 결실 또는 치환)에 의해 생성될 수 있다. 일부 실시양태에서, 바이러스 단백질은 상기 언급된 바이러스 단백질 중 1종 이상에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 또는 그 초과로 유사하다.
AAV가 복제에 의존하는 cap 단백질, rep 단백질 및 바이러스 단백질의 기능을 검정하는 방법은 관련 기술분야에 널리 공지되어 있다.
관심 트랜스진 (예를 들어, PV 선택적 마이크로RNA 결합 부위, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및/또는 PV 선택적 프로모터 중 1종 이상을 포함함)을 발현하기 위한 숙주 세포는 AAV 비리온의 어셈블리에 적절한 조건 하에 성장될 수 있다. 특정 실시양태에서, 숙주 세포는 AAV 비리온의 어셈블리 및 배지 내로의 비리온의 방출을 촉진하기 위해 적합한 기간 동안 성장된다. 일반적으로, 세포는 약 24시간, 약 36시간, 약 48시간, 약 72시간, 약 4일, 약 5일, 약 6일, 약 7일, 약 8일, 약 9일 또는 최대 약 10일 동안 성장될 수 있다. 약 10일 후 (또는 배양 조건 및 사용된 특정한 숙주 세포에 따라 더 빨리), 생산 수준은 일반적으로 유의하게 감소한다. 일반적으로, 배양 시간은 바이러스 생산 시점으로부터 측정된다. 예를 들어, AAV의 경우에, 바이러스 생산은 일반적으로 본원에 기재된 바와 같은 적절한 숙주 세포에 헬퍼 바이러스 기능을 공급할 때 시작된다. 일반적으로, 세포는 헬퍼 바이러스 감염 약 48 내지 약 100시간, 바람직하게는 약 48 내지 약 96시간, 바람직하게는 약 72 내지 약 96시간, 바람직하게는 약 68 내지 약 72시간 후에 (또는 바이러스 생산이 시작된 후에) 수거된다.
rAAV 생산 배양물은 이용되는 특정한 숙주 세포에 적합한 다양한 조건 하에 (넓은 온도 범위에 걸쳐, 다양한 시간 길이 등 동안) 성장될 수 있다. rAAV 생산 배양물은 적합한 부착-의존성 용기, 예컨대, 예를 들어 롤러 병, 중공 섬유 필터, 마이크로캐리어 및 충전층 또는 유동층 생물반응기에서 배양될 수 있는 부착-의존성 배양물을 포함한다. rAAV 벡터 생산 배양물은 또한, 예를 들어 스피너 플라스크, 교반 탱크 생물반응기 및 일회용 시스템, 예컨대 웨이브 백 시스템을 포함한 다양한 방식으로 배양될 수 있는 현탁액-적합화 숙주 세포, 예컨대 HeLa, 293 및 SF-9 세포를 포함할 수 있다.
관련 기술분야에 공지된 적합한 배지가 rAAV 비리온의 생산에 사용될 수 있다. 이들 배지는 변형 이글 배지 (MEM), 둘베코 변형 이글 배지 (DMEM)를 포함한, 하이클론 래보러토리즈(Hyclone Laboratories) 및 JRH에 의해 생산된 배지를 비제한적으로 포함하며, 이들 각각은 그 전체가 본원에 참조로 포함된다. 특정 실시양태에서, rAAV 생산 배양 배지는 0.5%-20% (v/v 또는 w/v) 수준의 혈청 또는 혈청-유래 재조합 단백질로 보충될 수 있다. 대안적으로, rAAV 벡터는 동물-유래 산물이 없는 배지로도 지칭될 수 있는 무혈청 조건에서 생산될 수 있다.
숙주 세포를 배양하여 AAV 비리온을 생산한 후, 이어서 생성된 비리온을 수거하고 정제할 수 있다. 특정 실시양태에서, AAV 비리온은 (1) 숙주 세포의 용해에 의해 생산 배양물의 숙주 세포로부터 수득될 수 있고/거나 (2) 형질감염 후 일정 기간, 바람직하게는 72시간 후 상기 세포의 배양 배지로부터 수득될 수 있다. rAAV 비리온은 세포가 무손상 세포로부터 배지 내로 rAAV 비리온의 방출을 유발하는 조건 하에 배양되는 한, 생산 배양물로부터 소비된 배지로부터 수거될 수 있다 (예를 들어, 미국 특허 번호 6,566,118 참조). 세포를 용해시키는 적합한 방법은 또한 관련 기술분야에 공지되어 있고, 예를 들어 다수의 동결/해동 사이클, 초음파처리, 마이크로유동화 및 화학물질, 예컨대 세제 및/또는 프로테아제로의 처리를 포함한다.
수거 후, rAAV 비리온을 정제할 수 있다. 본원에 사용된 용어 "정제된"은 rAAV 비리온이 자연 발생하거나 초기에 제조되는 경우에 또한 존재할 수 있는 다른 성분 중 적어도 일부가 결여된 rAAV 비리온의 제제를 포함한다. 따라서, 예를 들어 정제된 rAAV 비리온은 공급원 혼합물, 예컨대 배양 용해물 또는 생산 배양물 상청액으로부터 그를 풍부화하기 위한 단리 기술을 사용하여 제조될 수 있다. 풍부화는 다양한 방식으로, 예컨대, 예를 들어 용액 중에 존재하는 DNase-저항성 입자 (DRP) 또는 게놈 카피 (gc)의 비율에 의해 또는 감염성에 의해 측정될 수 있거나, 또는 공급원 혼합물 중에 존재하는 제2의 잠재적 간섭 물질, 예컨대 오염물, 예컨대 생산 배양 오염물을 포함한 오염물, 또는 헬퍼 바이러스, 배지 성분 등을 포함한 공정중 오염물과 관련하여 측정될 수 있다.
특정 실시양태에서, rAAV 생산 배양 수거물은 숙주 세포 파편을 제거하기 위해 정화될 수 있다. 일부 실시양태에서, 생산 배양 수거물은 다양한 표준 기술, 예컨대 원심분리 또는 0.2 μm 이상의 세공 크기의 필터 (예를 들어, 셀룰로스 아세테이트 필터 또는 일련의 심층 필터)를 통한 여과를 사용하여 정화될 수 있다.
특정 실시양태에서, rAAV 생산 배양 수거물은 벤조나제(Benzonase)™로 추가로 처리되어 생산 배양물에 존재하는 임의의 고분자량 DNA를 소화시킨다. 일부 실시양태에서, 벤조나제™ 소화는 표준 조건 하에, 예를 들어 최종 농도 1-2.5 단위/ml의 벤조나제™로 주위 온도 내지 37℃ 범위의 온도에서 30분 내지 수시간의 기간 동안 수행된다.
특정 실시양태에서, rAAV 비리온은 하기 정제 단계 중 1개 이상을 사용하여 단리 또는 정제될 수 있다: 평형 원심분리; 관통형 음이온 교환 여과; rAAV 입자를 농축시키기 위한 접선 흐름 여과 (TFF); 아파타이트 크로마토그래피에 의한 rAAV 포획; 헬퍼 바이러스의 열 불활성화; 소수성 상호작용 크로마토그래피에 의한 rAAV 포획; 크기 배제 크로마토그래피 (SEC)에 의한 완충제 교환; 나노여과; 및 음이온 교환 크로마토그래피, 양이온 교환 크로마토그래피 또는 친화성 크로마토그래피에 의한 rAAV 포획. 이들 단계는 단독으로, 다양한 조합으로, 또는 상이한 순서로 사용될 수 있다. rAAV 입자를 정제하는 방법은, 예를 들어 문헌 [Xiao et al., (1998) Journal of Virology 72:2224-2232]; 미국 특허 번호 6,989,264 및 8,137,948; 및 WO 2010/148143에서 발견된다.
특정 실시양태에서, 정제된 AAV 비리온은 PBS에 대해 투석되고, 여과되고, -80℃에서 저장될 수 있다. 바이러스 게놈의 역가는 표준 곡선으로서 선형화된 플라스미드 DNA를 사용하여 정량적 PCR에 의해 결정될 수 있다 (예를 들어, 문헌 [Lock M, et al., Hum. Gene Ther. 2010; 21:1273-1285] 참조).
제약 조성물
특정 실시양태에서, 본 출원은 PV 선택적 마이크로RNA 결합 부위 및/또는 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및 제약상 허용되는 담체를 포함하는 조성물을 제공한다. 다른 실시양태에서, 본 출원은 PV 선택적 마이크로RNA 결합 부위 및/또는 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 서열 및 제약상 허용되는 담체를 포함하는 비리온을 제공한다. 예시적 실시양태에서, 이러한 조성물은 유전자 요법 적용에 적합하다. 제약 조성물은 바람직하게는 멸균되고, 제조 및 저장 조건 하에 안정하다. 멸균 용액은, 예를 들어 멸균 여과 막을 통한 여과에 의해 달성될 수 있다.
제약 조성물 중 허용되는 담체 및 부형제는 바람직하게는 사용되는 투여량 및 농도에서 수용자에게 비독성이다. 허용되는 담체 및 부형제는 완충제, 예컨대 포스페이트, 시트레이트, HEPES 및 TAE, 항산화제, 예컨대 아스코르브산 및 메티오닌, 보존제, 예컨대 헥사메토늄 클로라이드, 옥타데실디메틸벤질 암모늄 클로라이드, 레조르시놀 및 벤즈알코늄 클로라이드, 단백질, 예컨대 인간 혈청 알부민, 젤라틴, 덱스트란 및 이뮤노글로불린, 친수성 중합체, 예컨대 폴리비닐피롤리돈, 아미노산, 예컨대 글리신, 글루타민, 히스티딘 및 리신 및 탄수화물, 예컨대 글루코스, 만노스, 수크로스 및 소르비톨을 포함할 수 있다. 본 개시내용의 제약 조성물은 주사가능한 제제의 형태로 비경구로 투여될 수 있다. 주사용 제약 조성물은 멸균 용액 또는 임의의 제약상 허용되는 액체를 비히클로서 사용하여 제제화될 수 있다. 제약상 허용되는 비히클은 멸균수 및 생리 염수를 포함하나 이에 제한되지는 않는다.
본 개시내용의 제약 조성물은 마이크로캡슐, 예컨대 히드록실메틸셀룰로스 또는 젤라틴-마이크로캡슐 및 폴리메틸메타크릴레이트 마이크로캡슐로 제조될 수 있다. 본 개시내용의 제약 조성물은 또한 다른 약물 전달 시스템, 예컨대 리포솜, 알부민 마이크로구체, 마이크로에멀젼, 나노입자 및 나노캡슐로 제조될 수 있다. 유전자 요법을 위한 제약 조성물은 허용되는 희석제일 수 있거나 또는 유전자 전달 비히클이 포매되어 있는 느린 방출 매트릭스를 포함할 수 있다.
본원에 제공된 제약 조성물은 비경구 투여, 피하 투여, 정맥내 투여, 근육내 투여, 동맥내 투여, 실질내 투여, 척수강내 투여, 대수조내 투여, 뇌실내 투여 또는 복강내 투여를 위해 제제화될 수 있다. 제약 조성물은 또한 비강, 분무, 경구, 에어로졸, 직장 또는 질 투여를 위해 제제화되거나 또는 그를 통해 투여될 수 있다. 한 실시양태에서, 본원에 제공된 제약 조성물은 CNS 또는 뇌 척수액 (CSF)에, 즉 실질내 주사, 척수강내 주사, 대수조내 주사 또는 뇌실내 주사에 의해 투여된다. 조직 표적은 특이적, 예를 들어 CNS일 수 있거나 또는 이는 여러 조직, 예를 들어 근육 및 CNS 조직의 조합일 수 있다. 예시적인 조직 또는 다른 표적은 간, 골격근, 심장 근육, 지방 침착물, 신장, 폐, 혈관 내피, 상피, 조혈 세포, CNS 및/또는 CSF를 포함할 수 있다. 바람직한 실시양태에서, PV 선택적 마이크로RNA 결합 부위 및/또는 SCN1A를 선택적으로 상향조절하는 eTF를 포함하는 본원에 제공된 제약 조성물은 CNS 또는 CSF 주사에, 즉 실질내 주사, 척수강내 주사, 대수조내 주사 또는 뇌실내 주사에 의해 투여된다. 이들 방법 중 1개 이상은 본 개시내용의 제약 조성물을 투여하는데 사용될 수 있다.
특정 실시양태에서, 본원에 제공된 제약 조성물은 "유효량" 또는 "치료 유효량"을 포함한다. 본원에 사용된 이러한 양은 목적하는 치료 결과를 달성하는데 필요한 투여량에서 및 필요한 기간 동안, 예컨대 SCN1A 발현의 수준을 증가시키고/거나 발작의 빈도 및/또는 지속기간을 감소시키는데 효과적인 양을 지칭한다.
본 개시내용의 제약 조성물의 투여량은 투여 경로, 치료될 질환 및 대상체의 신체적 특징 (예를 들어, 연령, 체중, 전반적 건강)을 포함한 인자에 좌우된다. 투여량은 최적의 치료 반응을 제공하도록 조정될 수 있다. 전형적으로, 투여량은 유의한 독성을 유도하지 않으면서 질환을 효과적으로 치료하는 양일 수 있다. 한 실시양태에서, 본원에 제공된 AAV 벡터는 SCN1A 결핍 (예를 들어, 드라베 증후군 포함)의 치료를 위해 5x1011 내지 1x1014 gc/kg (환자 체중 킬로그램당 게놈 카피 (gc/kg))의 범위 내의 양 또는 용량으로 환자에게 투여될 수 있다. 보다 특정한 실시양태에서, AAV 벡터는 약 5x1011 gc/kg 내지 약 3x10 13 gc/kg 또는 약 1x1012 내지 약 1x1014 gc/kg 또는 약 1x1012 내지 약 1x1013 gc/kg 또는 약 5x1011 gc/kg, 1x1012 gc/kg, 1.5x1012 gc/kg, 2.0x1012 gc/kg, 2.5x1012 gc/kg, 3x1012 gc/kg, 3.5x1012 gc/kg, 4x1012 gc/kg, 4.5x1012 gc/kg, 5x1012 gc/kg, 5.5x1012 gc/kg, 6x1012 gc/kg, 6.5x1012 gc/kg, 7x1012 gc/kg, 7.5x1012 gc/kg, 8x1012 gc/kg, 8.5x1012 gc/kg, 9x1012 gc/kg 또는 9.5x1012 gc/kg의 범위 내에 포함되는 양으로 투여된다. gc/kg는, 예를 들어 qPCR 또는 디지털 액적 PCR (ddPCR)에 의해 결정될 수 있다 (예를 들어, 문헌 [M. Lock et al., Hum Gene Ther Methods. 2014 Apr;25(2): 115-25] 참조). 또 다른 실시양태에서, 본원에 제공된 AAV 벡터는 SCN1A 결핍 (예를 들어, 드라베 증후군 포함)의 치료를 위해 1x109 내지 1x1011 iu/kg (벡터의 감염 단위 (iu)/대상체 또는 환자 체중 (kg))의 범위 내의 양 또는 용량으로 환자에게 투여될 수 있다. 특정 실시양태에서, 제약 조성물은 필요에 따라 단위 용량으로 형성될 수 있다. 이러한 단일 투여 단위는 약 1x109 gc 내지 약 1x1015 gc를 함유할 수 있다.
본 개시내용의 제약 조성물은 그를 필요로 하는 대상체에게, 예를 들어 1회 이상 (예를 들어, 1-10회 이상) 매일, 매주, 매월, 2년마다, 매년 또는 의학적으로 필요한만큼 투여될 수 있다. 예시적 실시양태에서, 단일 투여로 충분하다. 한 실시양태에서, PV 선택적 마이크로RNA 결합 부위 및/또는 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 발현 카세트를 포함하는 제약 조성물은 인간 대상체에 사용하기에 적합하고, 실질내 주사, 척수강내 주사, 대수조내 주사 또는 뇌실내 주사에 의해 투여된다. 한 실시양태에서, 제약 조성물은 볼루스 주사에 의해 말초 정맥을 통해 전달된다. 다른 실시양태에서, 제약 조성물은 약 10분 (±5분), 약 20분 (±5분), 약 30분 (±5분), 약 60분 (±5분) 또는 약 90분 (±10분)에 걸친 주입에 의해 말초 정맥을 통해 전달된다.
또 다른 측면에서, 본 출원은 1개 이상의 용기 내에 본원에 기재된 바와 같은 핵산 분자, 벡터, 숙주 세포, 비리온 또는 제약 조성물을 포함하는 키트를 추가로 제공한다. 키트는 환자에게 키트 내에 함유된 핵산 분자, 벡터, 숙주 세포 또는 비리온을 투여하는 방법을 기재하는 지침서 또는 패키징 물질을 포함할 수 있다. 키트의 용기는 임의의 적합한 물질, 예를 들어 유리, 플라스틱, 금속 등 및 임의의 적합한 크기, 모양 또는 형상일 수 있다. 특정 실시양태에서, 키트는 적합한 액체 또는 용액 형태로 핵산 분자, 벡터, 숙주 세포, 비리온 또는 제약 조성물을 함유하는 1개 이상의 앰풀 또는 주사기를 포함할 수 있다.
치료 방법
한 측면에서, 본 출원은 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 사용하는 방법을 제공한다. 특정 실시양태에서, 본 출원은 세포에서 SCN1A의 발현을 상향조절하기 위해 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 방법을 제공한다. 다양한 실시양태에서, 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF는 시험관내, 생체내 또는 생체외 세포에서 SCN1A의 발현을 조정하는데 사용될 수 있다.
특정 실시양태에서, 본 출원은 SCN1A와 연관된 질환 또는 장애의 치료를 필요로 하는 대상체에게 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여함으로써 상기 질환 또는 장애를 치료하는 방법을 제공한다. 특정 실시양태에서, 장애는 중추 신경계 장애이다. 예시적 실시양태에서, 질환 또는 장애는 SCN1A의 반수체기능부전과 연관된다. 특정 실시양태에서, 장애는 SCN1A 반수체기능부전과 연관된 간질이다. 특정 실시양태에서, 반수체기능부전은 대상체가 SCN1A 유전자의 기능 상실 돌연변이에 대해 이형접합인 결과이다. 특정 실시양태에서, 장애는 SCN1A 유전자 내의 삽입, 결실 또는 치환과 연관된 간질이다. 특정 실시양태에서, 장애는 SCN1A 유전자 내의 점 돌연변이와 연관된 간질이다. 특정 실시양태에서, 질환 또는 장애를 치료하는 방법은 SCN1A의 과소발현이 교정되거나, 건강한 개체의 수준 이내가 되거나 또는 표준 의료 관리에 의해 정의된 바와 같은 정상 범위 이내가 되도록 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것을 포함한다. 특정 실시양태에서, 본원에 개시된 방법은 SCN1A의 비정상적 발현을 유발하는 1개 이상의 돌연변이를 포함하는 내인성 SCN1A와 연관된 질환 또는 장애를 치료하는데 사용된다.
특정 실시양태에서, 본 출원은 질환 또는 장애와 연관된 증상의 호전을 필요로 하는 대상체에게 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여함으로써 질환 또는 장애와 연관된 증상을 호전시키는 방법을 제공한다.
예시적 실시양태에서, 본 출원은 SCN1A에서의 돌연변이 (예를 들어, 점 돌연변이, 치환, 결실, 역위 등), Nav1.1의 결핍 및/또는 Nav1.1의 감소된 활성과 연관된 질환, 장애 또는 증상의 치료를 필요로 하는 대상체에게 SCN1A 유전자 또는 그의 단백질 산물 Nav1.1의 발현을 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여함으로써 상기 질환, 장애 또는 증상을 치료하는 방법을 제공한다. 전압-게이팅 나트륨 이온 채널은 가로무늬근 및 뉴런 조직에서의 활동 전위의 생성 및 전파에 중요하다. 전압-게이팅 나트륨 이온 채널은 큰 중심 세공-형성 글리코실화 알파 서브유닛 및 2개의 보다 작은 보조 베타 서브유닛으로 이루어진 이형체 복합체이다. SCN1A 유전자에 의해 코딩되는 큰 알파 서브유닛 Nav1.1 서브유닛은 다양한 질환 또는 장애, 예컨대 드라베 증후군과 관련된다. Nav1.1은 뉴런에서 발현되고, SCN1B 유전자에 의해 발현된 Navβ1을 포함한 다양한 베타 서브유닛과 어셈블링될 수 있다.
특정 실시양태에서, 본 출원은 내인성 SCN1A 유전자의 발현을 선택적으로 상향조절하는 eTF를 사용하여 SCN1A에서의 돌연변이 (예를 들어, 결실, 삽입, 역위, 점 돌연변이 (예를 들어, 넌센스 돌연변이, 미스센스 돌연변이) 등) 또는 Nav1.1의 감소된 활성과 연관된 질환을 치료하는 방법을 제공한다. SCN1A 돌연변이와 연관된 질환 및 장애는 드라베 증후군, 오타하라 증후군, 간질, 조기 영아 간질성 뇌병증 6 (EIEE6), 가족성 열성 발작 3A (FEB3A), 전신 긴장성-간대성 발작 동반 난치성 소아기 간질 (ICEGTC), 편두통, 가족성 편마비 3 (FHM3), 파나이이오토풀로스 증후군, 가족성 심방 세동 13 (ATFB13), 열성 발작 플러스 동반 전신 간질 유형 1 (gefs+ 유형 1), 브루가다 증후군, 비특이적 심장 전도 결손, 열성 발작 플러스 동반 전신 간질, 양성 가족성 영아 발작, 조기 영아 간질성 뇌병증11 (EIEE11), 양성 가족성 영아 간질, 신경변성, 타우병증 및 알츠하이머병을 포함하나 이에 제한되지는 않는다. 일부 경우에, 신경계 상태는 드라베 증후군이다. SCN1A에서의 돌연변이 또는 이상은 또한 발작 장애, 간질, 자폐증, 가족성 편마비성 편두통 유형 3 (FHM3), 열성 발작 플러스 동반 유전적 간질 (GEFS+), 및 특정 항발작 의약의 유효성과 연관되었다. 예를 들어, SCN1A에서의 ICS5N+5G>A 돌연변이는 항발작 약물 페니토인 및 카르바마제핀의 최대 안전 양 (용량)과 연관된다.
특정 실시양태에서, 본 출원은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여함으로써 드라베 증후군을 갖거나 드라베 증후군이 발생할 위험이 있는 대상체를 치료하는 방법을 제공한다. 드라베 증후군은 생후 1년 내에 장기간의 열성 및 비-열성 발작을 특징으로 한다. 이 질환은 근간대성 및 부분 발작, 정신운동 지연 및 운동실조와 같은 다른 발작 유형으로 진행된다. 이는 인지 장애, 행동 장애 및 운동 결핍을 특징으로 한다. 행동 결핍은 종종 과잉행동 및 충동성 및 보다 드문 경우에는 자폐-유사 행동을 포함한다. 드라베 증후군은 또한 졸림 및 불면증을 포함한 수면 장애와 연관된다. 많은 환자에서, 드라베 증후군은 비-기능적 단백질의 생산을 유도하는 유전자 돌연변이에 의해 유발된다. 유전적 원인과 연관된 장애를 치료하는데 많은 난제가 존재한다. 따라서, 대부분의 기존 치료는 발작 및 다른 증상의 예방적 의학적 관리를 위한 것이었다.
환자의 70-90%에서, 드라베 증후군은 SCN1A 유전자 내의 넌센스 돌연변이가 조기 정지 코돈 및 이에 따른 비-기능적 단백질을 생성함으로써 유발된다. 전형적으로, 나트륨 채널 세공의 S5 또는 S6 절편에서의 미스센스 돌연변이는 채널 기능의 상실 및 드라베 증후군의 발생을 유발한다. SCN1A 돌연변이, 예를 들어 넌센스 돌연변이, 미스센스 돌연변이, 결실, 삽입, 역위 등의 이형접합 유전은 모두 결손 나트륨 채널을 발생시키는데 필요한 것이고; 드라베 증후군을 갖는 환자는 여전히 1개의 정상 유전자 카피를 가질 것이다. 따라서, 질환은 반수체기능부전 중 하나를 특징으로 하고, 이에 따라 SCN1A의 기능적 카피의 발현을 증가시키는 것은 Nav1.1의 정상 생산 수준을 회복시킬 수 있다.
드라베 증후군과 연관된 증상은 발작, 기억 결함, 발달 지연, 불량한 근긴장도 및/또는 인지 문제를 포함한다. 본원에 기재된 발현 카세트, 발현 벡터 또는 바이러스 입자를 사용한 치료는 1종 이상의 증상의 개선, 예컨대 발작의 수, 지속기간 및/또는 강도의 감소를 유발할 수 있다. 드라베 증후군이 발생할 위험이 있는 대상체에게 본원에 기재된 바와 같은 유전자 요법을 투여하는 것은 드라베의 1종 이상의 증상의 발달을 예방하거나 또는 그의 진행을 늦출 수 있다.
특정 실시양태에서, 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 사용한 치료는 발작 지속기간 및/또는 빈도, 예를 들어 드라베 증후군과 연관된 발작을, 비치료 대조군과 비교하여 또는 치료 전 수준과 비교하여 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 그 초과만큼 감소시킨다.
일부 알츠하이머 환자에서, 뉴런의 흥분성에 영향을 미칠 수 있는 많은 펩티드 및 프로테아제를 수반하는 아밀로이드 β (Aβ)의 생산은 PV 뉴런에서 발작 및 Nav1.1 나트륨 채널의 하향조절을 유발한다. 또 다른 실시양태에서, 본 출원은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 본원에 기재된 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여함으로써 알츠하이머병을 앓고 있는 대상체를 치료하는 방법을 제공한다. 알츠하이머병과 연관된 증상은 단기 기억 상실, 인지 곤란, 발작, 및 언어 곤란, 실행 기능 곤란, 지각 곤란 (실인증) 및 운동 실행 곤란 (실행증)을 포함한다. SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 사용한 치료는 1종 이상의 알츠하이머병 증상의 개선, 예컨대 기억 상실의 진행의 감소 또는 1종 이상의 증상의 예방을 가져올 수 있다. 일부 경우에, 치료는 높은 감마 파워 뇌 활성의 교정을 가져올 수 있다. 치료는 치료 부재와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70% 또는 그 초과만큼 발작 빈도 및/또는 발작 중증도의 감소 또는 높은 감마 파워 활성의 감소를 유발할 수 있다. 일부 경우에, 치료는 인지 기능의 개선을 가져올 수 있다. 학습 및/또는 기억은 본원에 개시된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 사용한 치료 부재 또는 치료 전과 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% 또는 100% 초과만큼 개선될 수 있다.
일부 경우에, SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 사용한 치료는 높은 감마 파워 활성 (예를 들어, 알츠하이머병과 연관된 높은 감마 파워 활성)을, 비치료 대조군과 비교하여 또는 치료 전 수준과 비교하여 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%만큼 감소시킨다.
파킨슨증은 느림 (운동완만), 강직 (강성), 진전 및 불균형 (자세 불안정)을 포함한, 파킨슨병 (PD)에서 발견되는 징후 및 증상의 집합을 지칭한다. 일부 경우에, 파킨슨병이 발생할 위험이 있거나 또는 파킨슨병을 앓고 있는 대상체에게 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것은 그의 1종 이상의 증상의 발생을 예방할 수 있거나 또는 파킨슨병의 진행을 치료 부재와 비교하여 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80% 또는 적어도 90%만큼 늦출 수 있다.
특정 실시양태에서, 본 출원은 질환이 발생할 위험이 있는 대상체를 치료하는데 사용될 수 있는 방법을 제공한다. 대상체는 질환, 예를 들어 신경계 질환 또는 간질, 발작 및/또는 뇌병증과 연관된 질환에 걸리기 쉬운 것으로 알려져 있을 수 있다. 대상체는 유전적 사건으로 인해 또는 공지된 위험 인자로 인해 질환에 걸리기 쉬울 수 있다. 예를 들어, 대상체는 간질과 연관된 SCN1A에서의 돌연변이 (예컨대, 예를 들어 드라베 증후군)를 보유할 수 있다. SCN1A 유전자 내의 삽입, 결실, 역위, 전위 또는 치환 (예를 들어, 넌센스 돌연변이 및/또는 미스센스 돌연변이를 포함한 점 돌연변이) 중 어느 1개 이상을 포함한, (발현 수준을 감소시키거나, 단백질 기능을 손상시키거나 또는 둘 다의 조합에 의해) 그의 활성을 감소시키는 SCN1A 유전자 내의 임의의 돌연변이로 인해 대상체는 질환에 걸리기 쉬울 수 있다. 일부 경우에, 대상체는 대상체의 연령으로 인해 알츠하이머병과 같은 질환에 걸리기 쉬울 수 있다. 일부 경우에, 대상체는 불충분한 양의 SCN1A 단백질을 가질 수 있고, SCN1A와 연관된 질환을 치료하는 것은 본원에 기재된 바와 같은 내인성 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것을 수반한다.
특정 실시양태에서, 본원에 제공된 내인성 SCN1A를 선택적으로 상향조절하는 eTF를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 사용한 치료는 드라베 또는 다른 SCN1A 연관 질환 또는 장애와 연관된 증상, 예를 들어 SCN1A 반수체기능부전과 연관된 간질의 감소 또는 중지를 유발할 수 있다. 예를 들어, 치료는 학습, 기억, 인지 기능 및/또는 운동 기능을 개선시키고/거나; 발작의 빈도 및/또는 지속기간을 감소시키고/거나; 온도 감수성을 감소시킬 수 있다 (또는 발작을 촉발하기 위한 온도 임계치를 증가시킬 수 있음).
또 다른 측면에서, 본 출원은 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것에 의한 PV 뉴런에서의 트랜스진의 선택적 발현을 위한 방법을 제공한다. 특정 실시양태에서, 본 출원은 트랜스진 및 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것에 의한 영장류의 PV 뉴런에서의 트랜스진의 선택적 발현을 위한 방법을 제공한다. 특정 실시양태에서, 본 출원은 트랜스진에 작동가능하게 연결된 PV 선택적 조절 요소 및 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것에 의한 PV 뉴런에서의 트랜스진의 선택적 발현을 위한 방법을 제공한다. 예시적 실시양태에서, 트랜스진은 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF 중 어느 것을 코딩하는 서열을 포함한다.
특정 실시양태에서, 본 출원은 대상체에게 트랜스진 및 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것을 포함하는 유전자 요법을 위한 방법을 제공한다. 특정 실시양태에서, 본 출원은 대상체에게 트랜스진에 작동가능하게 연결된 PV 선택적 조절 요소 및 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것을 포함하는 유전자 요법을 위한 방법을 제공한다. 예시적 실시양태에서, 트랜스진은 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF 중 어느 것을 코딩하는 서열을 포함한다.
특정 실시양태에서, 본 출원은 발현 카세트, 발현 벡터 또는 트랜스진 및 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함하는 바이러스 입자를 투여하는 것을 포함하는, 질환 또는 장애를 치료하는 방법을 제공한다. 특정 실시양태에서, 본 출원은 대상체에게 트랜스진에 작동가능하게 연결된 PV 선택적 조절 요소 및 적어도 1개의 PV 선택적 마이크로RNA 결합 부위를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 투여하는 것을 포함하는, 질환 또는 장애를 치료하는 방법을 제공한다. 예시적 실시양태에서, 트랜스진은 본원에 기재된 바와 같은 SCN1A를 선택적으로 상향조절하는 eTF 중 어느 것을 코딩하는 서열을 포함한다. 특정 실시양태에서, 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 PV 선택적 조절 요소를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자는 PV 뉴런이 연루된 질환 또는 장애를 치료하는데 사용될 수 있다. 특정 실시양태에서, 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 PV 선택적 조절 요소를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자는 뉴런 상태를 치료하는데 사용된다. 치료에 적절한 뉴런 질환 또는 장애는 드라베 증후군, 알츠하이머병, 파킨슨병, 헌팅톤병, 근위축성 측삭 경화증 (ALS), 척수성 근육 위축 (SMA), 간질, 신경변성 장애, 운동 장애, 운동 장애, 기분 장애, 운동 뉴런 질환, 진행성 근육 위축 (PMA), 진행성 연수 마비, 가성구 마비, 원발성 측삭 경화증, AIDS의 신경계 결과, 발달 장애, 다발성 경화증, 신경발생 장애, 졸중, 척수 손상, 외상성 뇌 손상, 타우병증, 뉴런 과소흥분성 및/또는 발작을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 PV 선택적 조절 요소를 포함하는 바이러스 벡터, 바이러스 입자 또는 제약 조성물은 정신 장애 (예를 들어, 정신분열증, 강박 장애, 중독, 우울증, 불안, 정신병); 자폐증 스펙트럼 장애 (예를 들어, 유약 X 증후군, 레트 증후군); 간질 (예를 들어, 드라베 증후군, 만성 외상성 뇌병증, 열성 발작 플러스 동반 전신 간질 (GEFS+), 간질성 뇌병증, 측두엽 간질, 초점성 간질, 결절성 경화증, SCN1A 반수체기능부전과 연관된 간질); 및/또는 신경변성 (예를 들어, 알츠하이머병, 파킨슨병)을 치료하는데 사용된다. 기능장애성 PV 뉴런과 연관된 질환, 예컨대 SCN1A 또는 Nav1.1에서의 기능 상실 돌연변이로 인한 것은 드라베 증후군, 오타하라 증후군, 간질, 조기 영아 간질성 뇌병증 6 (EIEE6), 가족성 열성 발작 3A (FEB3A), 전신 긴장성-간대성 발작 동반 난치성 소아기 간질 (ICEGTC), 편두통, 가족성 편마비 3 (FHM3), 파나이이오토풀로스 증후군, 가족성 심방 세동 13 (ATFB13), 열성 발작 플러스 동반 전신 간질 유형 1 (gefs+ 유형 1), 브루가다 증후군, 비특이적 심장 전도 결손, 열성 발작 플러스 동반 전신 간질, 양성 가족성 영아 발작, 조기 영아 간질성 뇌병증11 (EIEE11), 양성 가족성 영아 간질, 신경변성, 타우병증 및 알츠하이머병을 포함한다.
특정 실시양태에서, 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 본원에 기재된 PV 선택적 조절 요소를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자를 사용한 치료는 뉴런 질환 또는 장애와 연관된 증상을 개선시킨다. 예를 들어, 파킨슨병 환자는 치료에 대한 양성 반응을 나타내는 개선된 운동 기능에 대해 대증적으로 모니터링될 수 있다. 뉴런 장애가 발생할 위험이 있는 대상체에게 본원에 기재된 바와 같은 방법을 사용한 요법을 투여하는 것은 1종 이상의 증상의 발생을 예방하거나 또는 그의 진행을 늦출 수 있다.
특정 실시양태에서, 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 PV 선택적 조절 요소를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자는 뉴런 질환, 예를 들어 SCN1A 반수체기능부전과 연관된 간질, 예컨대, 예를 들어 드라베 증후군으로 진단된 대상체를 치료하는데 사용될 수 있다. 다양한 실시양태에서, 본원에 개시된 임의의 뉴런 질환 또는 장애는 기지의 유전적 사건 (예를 들어, 관련 기술분야에 공지된 임의의 SCN1A 돌연변이)에 의해 유발되거나 또는 미지의 원인을 갖는다.
특정 실시양태에서, 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 본원에 제공되는 PV 선택적 조절 요소를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자는 질환 또는 장애가 발생할 위험이 있는 대상체를 치료하는데 사용될 수 있다. 일부 실시양태에서, 대상체는 질환, 예를 들어 뉴런 질환 (예를 들어 SCN1A 반수체기능부전과 연관된 간질, 예컨대, 예를 들어 드라베 증후군)에 걸리기 쉬운 것으로 알려져 있을 수 있다. 일부 실시양태에서, 대상체는 유전적 사건으로 인해 또는 공지된 위험 인자로 인해 질환에 걸리기 쉬울 수 있다. 예를 들어, 대상체는 간질 또는 드라베 증후군과 연관된 SCN1A에서의 돌연변이, 예를 들어 삽입, 결실, 역위, 전위 또는 치환 (예를 들어, 넌센스 돌연변이 및/또는 미스센스 돌연변이를 포함한 점 돌연변이)을 보유할 수 있다.
특정 실시양태에서, 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 본원에 제공된 PV 선택적 조절 요소를 포함하는 발현 카세트, 발현 벡터 또는 바이러스 입자는 질환 또는 장애와 연관된 1종 이상의 증상을 감소시키는데 사용될 수 있다. 예를 들어, 드라베 증후군과 연관된 증상은 발작, 기억 결함, 발달 지연, 불량한 근긴장도 및/또는 인지 문제를 포함한다. 본원에 제공된 트랜스진 및 PV 선택적 마이크로RNA 결합 부위 및 임의로 PV 선택적 조절 요소를 포함하는 바이러스 벡터, 바이러스 입자 또는 제약 조성물을 사용한 치료는 1종 이상의 증상의 개선, 예컨대 발작의 수, 지속기간 및/또는 강도의 감소를 유발할 수 있다.
특정 실시양태에서, 본원에 기재된 방법은 PV 뉴런에서 트랜스진의 발현을 증가시키기 위해, 유전자 요법을 위해 또는 영장류에서 질환 또는 장애를 치료하기 위해 사용된다. 특정 실시양태에서, 영장류는 인간이다. 특정 실시양태에서, 영장류는 비-인간 영장류이다. 특정 실시양태에서, 비-인간 영장류는 구세계 원숭이, 오랑우탄, 고릴라, 침팬지, 게잡이 마카크, 레서스 마카크 또는 돼지-꼬리 마카크이다.
용어 "대상체" 및 "개체"는 척추동물, 바람직하게는 포유동물, 보다 바람직하게는 인간을 지칭하는 것으로 본원에서 상호교환가능하게 사용된다. 본원에 기재된 방법은 질환 또는 상태의 동물 모델에서의 인간 치료, 수의학적 적용 및/또는 전임상 연구에 유용할 수 있다. 다양한 실시양태에서, 본원에 기재된 방법에 따라 치료될 수 있는 대상체는 포유동물, 예컨대, 예를 들어 마우스, 래트, 햄스터, 기니 피그, 저빌, 소, 양, 돼지, 염소, 당나귀, 말, 개, 고양이, 라마, 원숭이 (예를 들어, 구세계 원숭이, 마모셋 또는 마카크, 예컨대 레서스 마카크, 돼지-꼬리 마카크 또는 게잡이 마카크 (즉, 시노몰구스 원숭이)), 유인원 (예를 들어, 오랑우탄, 고릴라 또는 침팬지) 또는 인간이다. 예시적 실시양태에서, 대상체는 인간이다.
하기 표는 본원에 개시된 서열을 제공한다.
표 1. 예시적인 조작된 전사 인자가 본원에 개시된다. 조절 요소 (RE)의 서열은 하기 표 2 및 8에 개시된다. RE에 대해, m1이 나타나 있는 경우, 이는 m1 마이크로RNA 결합 부위 (서열식별번호: 7, 표 8)가 코딩 영역과 폴리A 테일 사이에 포함된다는 것을 의미한다. DNA 결합 도메인 (DBD)에 대한 서열은 하기 표 3에 개시된다. DBD의 경우, 조작된 아연 핑거 (eZF)는 구축물이 서열식별번호: 147에 제시된 식 (표 10)을 갖는다는 것을 나타내고; EGR1은 DBD가 야생형 인간 EGR1 (서열식별번호: 176; 표 12)로부터 유래된다는 것을 나타내며; EGR3은 DBD가 야생형 인간 EGR3 (서열식별번호: 175, 표 12)으로부터 유래된다는 것을 나타낸다. 표적 부위에 대한 서열 (예를 들어, DBD에 의해 결합된 서열)은 하기 표 4에 제공된다. 전사 활성화 도메인 (TAD)에 대한 서열은 하기 표 5에 개시된다. TAD의 경우, (c)는 TAD가 DBD의 c-말단에 위치한다는 것을 나타내고, (n)은 TAD가 DBD의 n-말단에 위치한다는 것을 나타내고, (n/c)는 TAD가 DBD의 n-말단 및 c-말단 둘 다에 위치한다는 것을 의미하고, 2x CITED4 (n)는 CITED4 TAD의 2 카피가 DBD의 n-말단에 위치한다는 것을 나타낸다. 전장 조작된 전사 인자 (DBD + TAD)에 대한 서열은 하기 표 6에 제공된다.
표 2. 본원에 개시된 다양한 조절 요소 (RE)에 대한 핵산 서열.
표 3. 본원에 제공된 예시적인 DNA 결합 도메인 (DBD)에 대한 아미노산 서열. DBD의 경우, 조작된 아연 핑거 (eZF)는 구축물이 서열식별번호: 147에 제시된 식 (표 10)을 갖는다는 것을 나타내고; EGR1은 DBD가 야생형 인간 EGR1 (서열식별번호: 176; 표 12)로부터 유래된다는 것을 나타내며; EGR3은 DBD가 야생형 인간 EGR3 (서열식별번호: 175, 표 12)으로부터 유래된다는 것을 나타낸다. 표적 부위는 DBD에 의해 결합된 서열이고, 하기 표 4에 제공된다.
표 4. 본원에 개시된 DNA 결합 도메인에 의해 결합된 예시적인 표적 부위에 대한 표적 부위 서열 및 염색체 위치.
표 5. 본원에 개시된 예시적인 전사 활성화 도메인 (TAD)에 대한 아미노산 서열.
표 6. 본원에 개시된 예시적인 조작된 전사 인자 (DBD + TAD)에 대한 아미노산 서열.
표 7. 본원에 개시된 예시적인 조작된 전사 인자를 코딩하는 핵산 서열.
표 8. 예시적인 마이크로RNA 및 마이크로RNA 결합 부위에 대한 핵산 서열.
표 9. eTF를 생성하기 위한 상이한 유형의 아연 핑거 구조 및 예시적인 아연 핑거 단백질.
표 10. 예시적인 아연 핑거 DNA 결합 도메인에 대한 아미노산 서열.
표 11. 본원에 개시된 예시적인 아연 핑거 인식 서열에 대한 아미노산 서열.
표 12. 본원에 개시된 다른 뉴클레오티드 및 아미노산 서열.
실시예
하기 실시예는 본 개시내용의 일부 측면을 추가로 기재하기 위해 포함되며, 본 발명의 범주를 제한하는데 사용되지 않아야 한다.
실시예 1
SCN1A 특이적 전사 활성인자를 사용하여 SCN1A를 상향조절할 수 있는 표적 영역의 확인
내인성 SCN1A 발현을 상향조절할 수 있는 게놈의 영역을 확인하기 위해, 상기 표 4 및 13에 제시된 바와 같은 게놈의 다양한 영역을 표적화하는 다양한 조작된 전사 인자 (아연 핑거 뉴클레아제 또는 gRNA/daCas9 구축물)를 설계하였다. gRNA/daCas9 구축물의 경우, gRNA는 상보적 게놈 가닥을 표적화하도록 설계되었기 때문에 gRNA는 표적 영역과 동일한 서열을 가졌다. dCas9 단백질은 dCAS9-VP64 구축물 (서열식별번호: 174)이었다.
HEK293 세포를 표준 방법에 따라 배양하고, 6-웰 플레이트의 웰당 조작된 전사 인자 또는 대조군 구축물을 보유하는 플라스미드 3ug으로 형질감염시켰다 (퓨진 HD, 프로메가(Promega)). 세포를 하기 표 13에 나타낸 구축물을 발현하는 플라스미드로 형질감염시켰다. 형질감염 48시간 후에, 세포를 수집하고, RNA를 단리하고 (퀴아젠(Qiagen) RNeasy 미니 키트), DNase 처리하였다. 올리고DT 프라이머 (슈퍼스크립트 IV, 인비트로젠(Invitrogen))를 사용하여 RNA (3ug)를 역전사시켰다. 퓨전 폴리머라제 (뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 SYBR 그린 I을 사용하여 qPCR에 의해 cDNA 샘플을 분석하였다: (98℃에서 30초, 40x[98℃에서 10초, 66℃에서 15초, 72℃에서 15초]). SCN1A에 대한 프라이머 (5'-TGTCTCGGCATTGAGAACATTC-3' (서열식별번호: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (서열식별번호: 186))를 사용하여 내인성 SCN1A 전사체의 수준을 정량화하고, 참조 유전자 (5'-ACCACAGTCCATGCCATCAC'-3' (서열식별번호: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (서열식별번호: 188))로서 GAPDH를 사용한 델타-델타 Ct 방법에 의해 SCN1A 발현의 상대 수준을 결정하였다. 데이터는 대조군 조건 대비 배수 변화로서 제시된다.
결과는 도 1 및 하기 표 13에 대조군 조건 (예를 들어, EGFP-KASH 리포터 구축물) 대비 SCN1A 전사의 배수 변화로서 제시된다. 표 13은 대조군 조건 대비 전사의 적어도 1.5배 증가를 가져온 구축물에 대한 값을 보고한다.
표 13. 상이한 게놈 표적 부위 및 상응하는 eTF가 전사에 미치는 효과. CON은 실험에 사용된 아연 핑거 구축물을 나타낸다 (표 1 참조). gRNA 구축물의 경우, gRNA가 상보적 DNA 가닥을 표적화하도록 설계되었기 때문에 표적 부위와 gRNA 서열은 동일하다.
실시예 2
SCN1A 특이적 전사 인자를 사용한 HEK293 세포에서의 내인성 SCN1A의 상향조절
HEK293 세포를 표준 방법에 따라 배양하고, 6-웰 플레이트에 플레이팅하였다. 각각의 웰 내의 세포를 단일 조작된 전사 인자 구축물, WT 인간 CREB3 (서열식별번호: 211) 또는 EGFP 대조군 구축물을 보유하는 플라스미드 3ug으로 형질감염시켰다 (퓨진HD, 프로메가). 시험된 조작된 전사 인자 구축물은 구축물 1-27 및 46-53 (표 1) 및 CREB3-TRE (서열식별번호: 215; bZIP DNA 결합 도메인이 TET 프로모터-표적화 합성 ZF 도메인으로 대체된 CREB3)를 발현하는 플라스미드 (각각 개별적으로 시험됨)를 포함하였다. 형질감염 48시간 후에, 세포를 수집하고, RNA를 단리하고 (퀴아젠 RNeasy 미니 키트), DNase 처리하였다. 올리고DT 프라이머 (슈퍼스크립트 IV, 인비트로젠)를 사용하여 RNA (3ug)를 역전사시켰다. 퓨전 폴리머라제 (뉴 잉글랜드 바이오랩스) 및 SYBR 그린 I을 사용하여 qPCR에 의해 cDNA 샘플을 분석하였다: (98℃에서 30초, 40x[98℃에서 10초, 66℃에서 15초, 72℃에서 15초]). SCN1A에 대한 프라이머 (5'-TGTCTCGGCATTGAGAACATTC-3' (서열식별번호: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (서열식별번호: 186))를 사용하여 내인성 SCN1A 전사체의 수준을 정량화하고, 참조 유전자 (5'-ACCACAGTCCATGCCATCAC'3' (서열식별번호: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (서열식별번호: 188))로서 GAPDH를 사용한 델타-델타 Ct 방법에 의해 SCN1A 발현의 상대 수준을 결정하였다. 데이터는 대조군 조건 대비 배수 변화로서 제시된다 (도 2a, 도 2b 및 도 2c 참조). 대조군 구축물은 RE 1 (서열식별번호: 1)의 제어 하에 발현된 EGFP로 이루어졌다. 조작된 전사 인자의 전달은 EGFP 조건에 비해 내인성 SCN1A 전사체에서 다양한 정도의 상향조절을 유도하였다.
실시예 3
SCN1A 특이적 전사 인자를 사용한 GABA 뉴런에서의 내인성 SCN1A의 상향조절
iCell GABA 뉴런 (셀룰러 다이나믹스(Cellular Dynamics))을 6-웰 플레이트에 플레이팅하고 (~1E6개 세포/웰), 제조업체의 권장 프로토콜에 따라 유지하였다. 플레이팅 72시간 후에, 편재성 프로모터 (CBA 프로모터)의 제어 하에 EGFP 또는 도 3a의 활성인자 구축물 30 또는 도 3b의 구축물 25 또는 구축물 16을 발현하는 재조합 AAV (혈청형 AAV-DJ)를 대략 2E11 게놈 카피/웰로 배양 배지에 첨가하였다. 감염 후 1주 (도 3a) 또는 2주 (도 3b)에, RNA를 배양된 세포로부터 단리하고 (퀴아젠 RNeasy 미니 키트), DNase 처리하였다. 회수된 RNA를 올리고DT 프라이머 (슈퍼스크립트 IV, 인비트로젠)를 사용하여 역전사시켰다. 퓨전 폴리머라제 (뉴 잉글랜드 바이오랩스) 및 SYBR 그린 I을 사용하여 qPCR에 의해 cDNA 샘플을 분석하였다: (98℃에서 30초, 40x[98℃에서 10초, 66℃에서 15초, 72℃에서 15초]). SCN1A에 대한 프라이머 (5'-TGTCTCGGCATTGAGAACATTC-3' (서열식별번호: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (서열식별번호: 186))를 사용하여 내인성 SCN1A 전사체의 수준을 정량화하고, 참조 유전자 (5'-ACCACAGTCCATGCCATCAC'3' (서열식별번호: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (서열식별번호: 188))로서 GAPDH를 사용한 델타-델타 Ct 방법에 의해 SCN1A 발현의 상대 수준을 결정하였다. 데이터는 대조군 조건 대비 배수 변화로서 제시된다 (도 3a 및 도 3b 참조). 조작된 전사 인자의 AAV-구동 발현은 배양된 iPS-유래 GABA 뉴런에서 내인성 SCN1A 전사체의 유의한 상향조절을 가져왔다.
실시예 4
SCN1A 특이적 전사 인자를 사용한 GABA 뉴런에서의 내인성 SCN1A의 특이적 상향조절
iCell GABA 뉴런 (셀룰러 다이나믹스)을 6-웰 플레이트에 플레이팅하고 (~1E6개 세포/웰), 제조업체의 권장 프로토콜에 따라 유지하였다. 플레이팅 72시간 후에, CBA 프로모터의 제어 하에, CBA 프로모터에 의해 구동되는 VPR TAD에 융합된 아연 핑거 DBD를 포함하는, EGFP 또는 활성인자 (구축물 30)를 발현하는 재조합 AAV (혈청형 AAV-DJ)를 대략 2E11 게놈 카피/웰로 배양 배지에 첨가하였다.
감염 1주 후에, RNA를 배양된 세포로부터 단리하고 (퀴아젠 RNeasy 미니 키트), DNase 처리하였다. 회수된 RNA로부터 TruSeq 가닥 mRNA 라이브러리 키트 (일루미나(Illumina))를 사용하여 RNAseq 라이브러리를 제조하고, 일루미나 NextSeq (2 x 75 사이클의 쌍형성된 말단 서열분석) 상에서 서열분석하였다. 서열분석 판독물을 인간 게놈 (RNASTAR)에 대해 정렬하고, DESeq2로 차등 발현 분석을 수행하였다. 데이터는 대조군 (AAVDJ-CBA-EGFP) 샘플 대비 배수 변화로서 제시된다 (도 4 참조). 결과는 표 14에 제시되고, 도 4는 대조군 조건 대비 배수 변화로서 제시된 내인성 SCN1A 및 40개의 가장 가까운 이웃 유전자 전사체의 상대 발현을 예시한다. 표 1에 기재된 바와 같은 구축물 30은 검사된 다른 유전자와 비교하여 SCN1A 유전자 또는 Nav1.1 단백질의 발현을 특이적으로 증가시킬 수 있었다. 이는 구축물 30의 전사 활성인자에 의해 인식되는 표적 부위가 SCN1A 유전자에 대해 특이적이어서, GABA 뉴런에서의 SCN1A 유전자 발현의 증가를 유발하였다는 것을 나타냈다.
표 14. SCN1A 특이적 전사 인자 (구축물 30)로 처리된 GABA 뉴런에서의 내인성 SCN1A 및 40개의 가장 가까운 이웃 유전자의 전사에 대한 효과.
실시예 5
생체내 발현 카세트로부터의 SCN1A의 발현
생체내 SCN1A의 전사 활성인자의 발현을 시험하기 위해, 재조합 AAV9 벡터를 벡터 바이오랩스(Vector Biolabs) (펜실베니아주 말번)에 의해 생성하였다. 수컷 C57Bl/6 마우스 (군당 N=5, 7-8주령)에게 총 4개의 주사 부위에 대해, 배측 해마 (AP -2.0 mm, 측면 ±1.5, DV -1.4 mm, 경막으로부터) 및 복측 해마 (AP -3.1 mm, 측면 ±2.8, DV -3.8 mm, 경막으로부터) 내 양측으로 1.5 ul의 정제된 AAV 벡터를 주입하였다. AAV를 각각의 주사 후에 4m 휴지 기간으로 0.3 ul/분의 속도로 전달하였다. 처리 4주 후에, 마우스를 안락사시키고, 해마 조직을 해부하였다. 각각의 군에 대해, 대부분의 동물 (N=4)에서 좌측 및 우측 해마 조직 둘 다로부터의 조직을 수집하고 균질화를 위해 풀링하였으며, 예외로 1마리 동물에서는 좌측 해마만을 수집하고 균질화하였다. RNA를 균질물로부터 단리하고 (퀴아젠 RNeasy 미니 키트), DNase 처리하였다. 올리고DT 프라이머 (슈퍼스크립트 IV, 인비트로젠)를 사용하여 RNA (3μg)를 역전사시켰다. 퓨전 폴리머라제 (뉴 잉글랜드 바이오랩스) 및 SYBR 그린 I을 사용하여 qPCR에 의해 cDNA 샘플을 마우스 SCN1A의 발현에 대해 분석하였다: 98℃에서 30초, 40x[98℃에서 10초, 64℃에서 15초, 72℃에서 15초]. 마우스 SCN1A에 대한 프라이머 (5'-CAAAAAAGCCACAAAAGCCT-3' (서열식별번호: 189); 5'-TTAGCTCCGCAAGAAACATC-3' (서열식별번호: 190))를 사용하여 내인성 SCN1A 전사체의 수준을 정량화하고, 참조 유전자 (5'-ACCACAGTCCATGCCATCAC'3' (서열식별번호: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (서열식별번호: 188))로서 GAPDH를 사용한 델타-델타 Ct 방법에 의해 생체내 SCN1A 발현의 상대 수준을 결정하였다.
도 5a 및 도 5b는 각각 AAV9 구축물이 주사된 5마리 동물의 평균 결과를 예시한다. eGFP 대조군 구축물은 eGFP 리포터 트랜스진을 포함하였다. 구축물 4 (표 1 참조)는 상기 표 1에 기재된 바와 같은 서열식별번호: 18을 포함하는 표적 서열을 인식하는 전사 활성인자를 포함하였다. 도 5a는 생체내 SCN1A의 상대 발현을 예시한다. 도 5b는 생체내 SCN1A 발현의 변화를 평균 eGFP 발현의 백분율로서 예시한다. 이들 결과는 발현 카세트 A의 SCN1A 전사 활성인자가 생체내에서 SCN1A 발현의 대략 20%-30% 상향조절을 유발하였다는 것을 나타냈다.
이러한 발현 카세트는 드라베 증후군, 간질, 발작, 알츠하이머병, 파킨슨병 및/또는 SCN1A의 결핍 및/또는 손상된 활성과 연관된 임의의 다른 질환 또는 상태를 치료하기 위해 인간에서 사용되도록 적합화될 수 있다.
실시예 6
드라베 증후군의 마우스 모델에서의 고체온 발작 (HTS) 검정
A. 이형접합 Scn1a 녹아웃 마우스 모델
Scn1atm1Kea 마우스 계통에서 발현 카세트를 사용한 드라베 증후군 및/또는 그의 증상의 치료를 시험하였다. 이러한 마우스 계통은 드라베 증후군에 대해 확립된 마우스 모델이다. Scn1atm1Kea 마우스 계통은 CRE 레콤비나제를 요구하지 않는다. Scn1atm1Kea 마우스 (잭슨 래보러토리(Jackson Laboratory)로부터 입수가능함; 문헌 [Hawkins et al., Scientific Reports, vol. 7: 15327 (2017)]에 기재됨)는 SCN1A의 제1 코딩 엑손의 결실을 포함한다. SCN1A 녹아웃 대립유전자에 대해 동형접합인 마우스는 진전, 운동실조, 발작을 특징으로 하고, 출생후 제16일에 사망한다. C57BL/6 배경의 이형접합 마우스는 자발적 발작이 발생하고, 수주 내에 큰 백분율로 사망한다. 이러한 마우스 계통은 간질 및 드라베 증후군 치료의 안전성 및 효능을 연구하는데 사용될 수 있다. 추가의 정보에 대해서는 문헌 [Miller et al., Genes Brain Behav. 2014 Feb;13(2):163-72]을 참조한다.
Scn1atm1Kea 마우스 계통에서 전사 활성인자의 효능을 시험하기 위해, 암컷 C57Bl/6J 사육동물과 +/- 교배된 수컷 Scn1a로부터 생산된 한배새끼에게 P1에서 양측 ICV를 통해 AAV 벡터를 투여하였다. 마우스에게 구축물 31-34 (표 1)를 투여하였다. 마우스를 P18에서의 이유시까지 그의 어미에 의해 방해받지 않게 둔 다음, 고체온 발작 (HTS) 검정을 개시할 때인 P26-P28까지 다시 방해받지 않게 두었다. 투여된 P1 마우스의 개별 한배새끼를 P18에서 이유시키고, 매일 사망을 관찰하였다. 혼합된 129Stac X C57BL/6 배경의 P26-P28 이형접합 (HET) 및 WT Scn1a 마우스에서 고체온 발작 유도를 수행하였다. 검정 전에 마우스는 가열 램프 (HL-1)와 직렬로 연결된 온도 제어 모듈 (TCAT 2DF, 피지템프(Physitemp))에 삽입 및 연결된 윤활 직장 온도 프로브 (Ret-4)를 가졌다. 이어서, 마우스를 큰 유리 비커에 넣고, 잠시 환경과 평형을 이루도록 하였다. 이후, 자세 상실이 동반된 제1 긴장성-간대성 발작의 발병까지 또는 43℃에 도달할 때까지 체온을 2분마다 ~0.5℃만큼 증가시켰다. 마우스가 자세 상실이 동반된 발작을 경험한 경우에, 실험을 종료하고, 마우스의 내부 체온을 기록하였다. 실험의 전체 과정에 걸쳐 자세 상실이 동반된 발작이 검출되지 않은 경우에, 그 마우스는 발작이 없는 것으로 간주하고, 검정을 종결하였다. P1에서 마우스로부터 조직 샘플을 수득하고, 실시간 PCR을 사용하여 실험 과정 동안 마우스의 유전자형결정을 수행하였다. 검정을 완료한 후 유전자형결정을 맹검해제하였으며, HET 또는 WT로서의 마우스의 상태는 수득된 데이터와 상관관계가 있었다. 데이터를 카플란-마이어 생존 곡선에 플롯팅하고, 유의성을 만텔-콕스 검정에 의해 결정하였다. 결과는 표 15 및 표 16 및 도 6a-e에 제시된다.
표 15. 실시예 6에서 사용된 조건의 요약.
표 16. 고체온 발작 검정의 결과의 요약.
상기 기재된 바와 같은 Scn1atm1Kea 마우스에서 추가의 실험을 수행하여, HTS 검정에서 구축물 42 및 43을 발작에 대한 그의 효과에 대해 시험하였다. 이들 실험에서, 구축물 42를 P1에서 양측 ICV를 통해 9x1010 gc/마우스로 투여하고, 구축물 43을 P1 또는 P5에서 양측 ICV를 통해 6x1010 gc/마우스로 투여하였다. 결과는 도 6f (구축물 42) 및 도 6g (구축물 43)에 제시된다. 구축물 둘 다는 EGFP 대조군과 비교하여 발작의 유의한 감소를 나타냈다 (구축물 42 및 43 둘 다에 대해 P < 0.0001).
B. 이형접합 Scn1aRX 돌연변이 마우스 모델
Scn1aRX 마우스 계통에서 본 개시내용의 발현 카세트를 사용한 드라베 증후군 및/또는 그의 증상의 치료를 시험하였다. 이러한 마우스 계통은 드라베 증후군에 대해 확립된 마우스 모델이다. Scn1aRX 마우스 계통은 CRE 레콤비나제를 요구하지 않는다. Scn1aRX 마우스 (잭슨 래보러토리로부터 입수가능함; 문헌 [Ogiwara et al., J. Neuroscience, vol. 27: 5903-5914 (2007)]에 기재됨)는 SCN1A 유전자의 엑손 21에 기능 상실 단일 염기 넌센스 돌연변이 (CgG에서 TgA로; R1407X)를 포함한다. C57BL/6 배경의 이형접합 마우스는 자발적 발작이 발생하고, 수주 내에 큰 백분율로 사망한다.
Scn1aRX 마우스 계통에서 전사 활성인자의 효능을 시험하기 위해, Scn1aRX/+ 정자와 CD-1 어미 내로 이식된 배아를 갖는 암컷 C57Bl/6J 난자의 수컷 및 IVF 교배로부터 생산된 한배새끼에게 P1에서 양측 ICV를 통해 AAV 벡터 (구축물 31)를 5.1x1010 게놈 카피 (gc)/마우스로 투여하거나 또는 PBS 대조군을 투여하였다. 마우스를 P18에서의 이유시까지 그의 어미에 의해 방해받지 않게 둔 다음, HTS 검정을 개시할 때인 P26-P28까지 다시 방해받지 않게 두었다. 투여된 P1 마우스의 개별 한배새끼를 P18에서 이유시키고, 매일 사망을 관찰하였다. C57BL/6 배경의 P26-P28 이형접합 (HET) 및 WT Scn1a 마우스에서 고체온 발작 유도를 수행하였다. 검정 전에 마우스는 가열 램프 (HL-1)와 직렬로 연결된 온도 제어 모듈 (TCAT 2DF, 피지템프(Physitemp))에 삽입 및 연결된 윤활 직장 온도 프로브 (Ret-4)를 가졌다. 이어서, 마우스를 큰 유리 비커에 넣고, 잠시 환경과 평형을 이루도록 하였다. 이후, 자세 상실이 동반된 제1 긴장성-간대성 발작의 발병까지 또는 43℃에 도달할 때까지 체온을 2분마다 ~0.5℃만큼 증가시켰다. 마우스가 자세 상실이 동반된 발작을 경험한 경우에, 실험을 종료하고, 마우스의 내부 체온을 기록하였다. 실험의 전체 과정에 걸쳐 자세 상실이 동반된 발작이 검출되지 않은 경우에, 그 마우스는 발작이 없는 것으로 간주하고, 검정을 종결하였다. P1에서 마우스로부터 조직 샘플을 수득하고, 실시간 PCR을 사용하여 실험 과정 동안 마우스의 유전자형결정을 수행하였다. 검정을 완료한 후 유전자형결정을 맹검해제하였으며, HET 또는 WT로서의 마우스의 상태는 수득된 데이터와 상관관계가 있었다. 시험된 WT Scna1 마우스 중 어느 것도 발작을 경험하지 않았다. 구축물 31 처리된 (n=13) 및 PBS 대조군 처리된 (n=14) HET 마우스에 대한 데이터를 카플란-마이어 생존 곡선에 플롯팅하고, 유의성을 만텔-콕스 검정에 의해 결정하였다. 도 6h에 제시된 바와 같이, 구축물 31 처리된 HET 마우스는 PBS 대조군 처리된 HET 마우스에 비해 고체온 발작 유도의 유의한 감소를 나타냈다 (P < 0.01).
실시예 7
드라베 증후군의 마우스 모델에서의 생존 검정
A. 이형접합 Scn1a 녹아웃 마우스 모델
Scn1atm1Kea 마우스 계통에서 전사 활성인자의 효능을 시험하기 위해, 암컷 C57Bl/6J 사육동물과 +/- 교배된 수컷 Scn1a로부터 생산된 한배새끼에게 P1에서 양측 ICV를 통해 AAV 벡터를 투여하였다. 마우스를 이유시까지 그의 어미에 의해 방해받지 않게 두었다. Scn1a +/- 마우스의 건강 상태의 관찰을 P18에서의 이유 후 매일 수행하였다. 어떤 원인으로든 그의 홈 케이지에서 죽은 채로 발견된 마우스는 그 날짜를 기록하였다. 데이터를 카플란-마이어 생존 곡선에 플롯팅하고, 유의성을 만텔-콕스 검정에 의해 결정하였다.
결과는 표 17 및 도 7a-d에 제시된다.
표 17. 생존 검정에 대한 조건 및 결과의 요약.
B. 이형접합 Scn1aRX 돌연변이 마우스 모델
Scn1aRX 마우스 계통에서 전사 활성인자의 효능을 시험하기 위해, Scn1aRX/+ 정자와 CD-1 어미 내로 이식된 배아를 갖는 암컷 C57Bl/6J 난자의 수컷 및 IVF 교배로부터 생산된 한배새끼에게 P1에서 양측 ICV를 통해 AAV 벡터 (구축물 31)를 5.1x1010 게놈 카피 (gc)/마우스로 투여하거나 또는 PBS 대조군을 투여하였다. 마우스를 이유시까지 그의 어미에 의해 방해받지 않게 두었다. Scn1aRX/+ 마우스의 건강 상태의 관찰을 P18에서의 이유 후 매일 수행하였다. 어떤 원인으로든 그의 홈 케이지에서 죽은 채로 발견된 마우스는 그 날짜를 기록하였다. 구축물 31 처리군 (n=27) 및 대조군 처리군 (n=18)에 대한 데이터를 카플란-마이어 생존 곡선에 플롯팅하고, 유의성을 만텔-콕스 검정에 의해 결정하였다.
도 7e에 제시된 바와 같이, 구축물 31 처리된 Scn1aRX/+ 마우스는 PBS 대조군 처리된 Scn1aRX/+ 마우스에 비해 증가된 생존을 나타냈다 (P < 0.0001).
실시예 8
SCN1A 특이적 전사 인자를 코딩하는 AAV로의 처리 후 비-인간 영장류에서의 SCN1A 전사 수준
연구는 2 내지 3세의 수컷 시노몰구스 마카크 (마카카 파시쿨라리스(macaca fascicularis))를 사용하였다. 동물을 연구에 등록하기 전 세포-기반 중화 항체 검정에 의해 AAV9에 대한 교차-반응성 항체에 대해 사전스크리닝하였다. SCN1A 특이적 전사 인자 (구축물 33)를 발현하는 AAV9 또는 대조군을 PBS 중에 희석하고, 1.2E12 gc/동물로 실질내로 주사하였다. 각각의 반구에서 3개의 상이한 정위 좌표, 동물당 6개의 주사 부위를 주사에 대해 확인하였다. 부위당 10 ul 부피를 주사하였다. 우측 반구에서의 주사는 좌측에서의 주사와 대칭이었다. 2마리의 비처리 동물을 대조군으로서 사용하였다.
Scn1A mRNA 발현을 평가하기 위해, 역전사에 이어서 qPCR 방법을 수행하였다. 투여 28일 후의 부검에서, 대조군 및 처리군 동물로부터의 다양한 뇌 영역으로부터의 조직 절편 (전두 피질, 두정 피질, 측두 피질, 후두 피질, 해마, 수질, 소뇌; 각각 200 mg)을 RNAlater에 수집한 다음, 동결시켰다. 간략하게, 30 mg의 조직을 해부하고, RNA를 추출하고 (퀴아젠 Rneasy 지질 조직 미니 키트, 카탈로그 # 1023539 사용), 역전사에 의해 cDNA로 전환시키고 (어플라이드 바이오시스템즈(Applied Biosystems) 고용량 cDNA 역전사 키트, 카탈로그 # 4368814 사용), Scn1A 및 하우스키핑 유전자 GAPDH (어플라이드 바이오시스템즈, 카탈로그 # Rh02621745-gI FAM)에 대한 프라이머/프로브 세트를 사용하여 qPCR을 수행하였다.
SCN1A에 대한 프라이머/프로브 세트가 하기에 제공된다.
표 18. 실시예 8에 사용된 프라이머 서열.
비교 Ct (ΔCt) 방법을 사용하여 상대 정량화 (RQ)에 의해 각각의 시험 샘플에서의 Scn1A의 유전자 발현을 결정하였다. 이 방법은 표적 유전자와 하우스키핑 유전자 사이의 Ct 차이 (ΔCt)를 측정한 다음, 처리 샘플의 ΔCt 값을 대조군 샘플과 비교한다.
ΔCt = 표적 유전자의 Ct 평균 - 하우스키핑 유전자의 Ct 평균
ΔΔCt = 처리 샘플의 ΔCt - 대조군 샘플의 ΔCt
상대 발현 (처리 샘플) = 2 -ΔΔCt
데이터는 뇌로부터의 상이한 조직 절편에서의 표적 mRNA의 정규화된 발현으로서 보고된다 (도 8 참조). 도 8에 예시된 바와 같이, 실질내 주사 부위에 근접한 뇌 내의 부위가 가장 높은 수준의 SCN1A 전사체 발현을 나타냈다.
실시예 9
PV 선택적 프로모터 및 마이크로RNA 결합 부위를 갖는 AAV로의 처리 후 비-인간 영장류의 PV 뉴런에서의 선택적 트랜스진 발현
연구는 연구 등록 전 AAV9에 대한 교차-반응성 항체에 대해 사전스크리닝한 6마리의 마모셋 (칼리트릭스 자쿠스(Callithrix jacchus))을 사용하였다. 2마리의 원숭이를 EF1알파 프로모터의 제어 하에 EGFP 트랜스진을 함유하는 AAV9로 처리하고, 2마리의 원숭이를 RE 2 (서열식별번호: 2)의 제어 하에 EGFP 트랜스진을 함유하는 AAV9로 처리하고, 2마리의 원숭이를 RE 2 (서열식별번호: 2)의 제어 하에 EGFP 트랜스진을 함유하고 또한 EGFP의 코딩 영역과 폴리A 테일 사이에 위치한 마이크로RNA 결합 부위 (서열식별번호: 7)를 함유하는 AAV9로 처리하였다. AAV9 벡터를 PBS 중에 희석하고, 동물을 동물당 총 6개의 주사 부위에 대해 각각의 반구의 해마/내후각 피질 내로의 3회 뇌내 주사 (각각 2 uL)로 처리하였다. EF1알파-EGFP를 함유하는 AAV9 벡터로 처리된 2마리의 동물은 각각 5.8E+11 gc/동물의 총 용량을 받았고, RE 2-EGFP를 함유하는 AAV9 벡터로 처리된 2마리의 동물은 각각 3.0E+11 gc/동물의 총 용량을 받았으며, RE 2 + m1-EGFP를 함유하는 AAV9 벡터로 처리된 2마리의 동물은 각각 2.3E+11 gc/동물의 총 용량을 받았다.
면역조직화학을 사용하여 파르브알부민 (PV) 선택적 발현을 평가하였다. 투여 28일 후의 부검에서, 뇌의 다양한 영역으로부터의 조직 절편을 수집하였다. 부유 마모셋 뇌 절편 (35um)을 4% 파라포름알데히드 중에 고정시키고, 완충제 (PBS, 3% BSA, 3% 당나귀 혈청, 0.3% 트리톤-X 100, 0.2% 트윈-20)로 차단한 다음, 항-GFP (압캠(Abcam) ab290)에 이어서 알렉사-488에 접합된 2차 항체 (써모 A21206)로 염색하였다. 이어서, 항-PV 항체 (스완트(Swant)), 및 알렉사-647에 접합된 2차 항체 (써모 A31571) 및 4',6-디아미디노-2-페닐인돌 (DAPI)이 이어졌다. 절편을 탑재하고, 퍼킨엘머 벡트라3을 사용하여 영상화하였다.
결과는 도 9a-f 및 10a-l에 제시된다.
실시예 10
eTFSCN1A 생체분포
본 연구의 목적은 일측 뇌실내 (ICV) 주사를 통해 4.8E+13의 용량으로 투여되었을 때 어린 시노몰구스 마카크 원숭이의 중추 신경계 (CNS)에서의 eTFSCN1A의 생체분포를 비교하는 것이었다. 각각의 동물에게 GABA 선택적 조절 요소의 제어 하에 eTFSCN1A를 코딩하는 발현 카세트 (REGABA-eTFSCN1A)를 함유하는 AAV9를 주사하였다. AAV9 입자를 PBS + 0.001% 플루론산 중에 제제화하고, 4.8E+13 또는 8E+13 vg/동물의 용량으로 투여하였다. 2 ml 부피의 제제화된 바이러스 입자를 각각의 동물에게 투여하였다. 연구 설계는 표 19에 제시된다.
24개월령 시노몰구스 마카크 원숭이를 표 19에 나타낸 바와 같이 군분류하였다. 연구의 개시 전에, 상기 기재된 NAb 역가 검정을 사용하여 동물로부터의 혈액 샘플을 AAV9에 대한 중화 항체 역가의 수준에 대해 시험하였다. 항체에 대해 낮은 또는 음성 결과를 갖는 동물을 연구용으로 선택하였다. 표준 외과적 절차를 사용하여 ICV 주사를 통해 샘플을 투여하였다. 해동된 투여 물질을 잠시 습윤 얼음 상에 저장하고, 투여 직전에 실온으로 가온하였다. 동물을 마취시키고, 수술을 위해 준비하고, MRI 호환 정위 프레임 (Kopf)에 탑재하였다. 기준선 MRI를 수행하여 표적 좌표를 확립하였다. 절개부를 만들고, 표적 위치 위의 두개골을 통해 단일 구멍을 뚫었다. 36" 마이크로-보어 연장 세트에 부착된 3 mL BD 시린지를 샘플과 함께 준비하고, 주입 펌프에 넣었다. 연장 라인을 프라이밍하였다. 경막을 개방하고, 투여 바늘을 구멍으로부터 13.0 내지 18.1 mm의 깊이로 전진시켰다. 조영 매체 주사 및 형광투시법을 사용하여 우측뇌실 내로의 척추 바늘의 배치를 확인하였다. 3.0" 22g 퀸케 BD 척추 후버 포인트 바늘에 조영제를 충전하여 배치를 결정한 후 프라이밍된 연장 라인 및 시린지를 부착하였다. 펌프 설정은 19 내지 20분 동안 0.1 mL/분이었다. 투여 후 완충제를 수동으로 밀어내어 연장 라인을 제거하였다. 주입 완료 후 1 내지 2분 동안 바늘을 제자리에 유지시킨 다음, 바늘을 회수하였다. 비히클 및 시험 물품을 제1일에 1회 투여하고, 대상체를 27- 또는 29-일 회복 기간 동안 유지하였다.
표 19. 생체분포 연구 설계
투여 후, 연구 지속기간에 걸쳐 동물을 일상적으로 모니터링하고, 혈액 샘플을 주기적으로 회수하였다. eTFSCN1A 투여는 어떤 예상밖의 사망, 임상 소견 또는 육안 관찰과도 연관되지 않았다. AAV9-REGABA-eTFSCN1A 처리된 동물은 제28일 ± 2일에 예정된 부검까지 생존하였다. 매일 또는 매주 신체 검사 동안 임상 또는 행동 징후, 체온 증가 또는 체중 감소가 관찰되지 않았다. AAV9-REGABA-eTFSCN1A 처리된 동물에서 간 트랜스아미나제 (ALT 및 AST)의 일시적 상승이 관찰되었지만, 면역조정 없이 연구의 종료시까지 완전히 해소되었고, 혈청 빌리루빈 또는 알칼리성 포스파타제의 동반 증가는 나타나지 않았다. 다른 측정된 임상 화학 종점은 주목할 만하지 않았다. 현미경 관찰은 간 조직병리학 연구에서 보고되지 않았다. CSF 백혈구는 말단 수집물에서 처리전 값에 비해 상승하였지만, 대조군과 AAV9-REGABA-eTFSCN1A 처리된 동물 사이에 대등하였다. AAV9-REGABA-eTFSCN1A 연관된 뇌척수액세포증가증은 관찰되지 않았다. 모든 동물에 걸친 비-뉴런 조직의 거시적-관찰 및 상세한 미세-조직병리학 검사는 주목할 만하지 않았다. 조직은 주요 말초 기관 (즉, 심장, 폐, 비장, 간 및 생식선)을 포함하였다. 뉴런 조직의 거시적-관찰 및 상세한 미세-조직병리학은 어떤 주목할 만한 소견도 나타내지 않았다. 조직은 뇌, 척수 및 연관된 후근 신경절 (경부, 흉부 및 요추 영역으로부터)을 포함하였다. 연구는 전문 신경병리학 장소에 있는 병리학자를 포함한 3명의 독립적인 병리학자에 의해 수행하였다.
항-AAV9 캡시드 중화 항체가 투여 4주 후에 관찰되었기 때문에, AAV9의 ICV 투여는 투여후 혈청에서 면역 반응을 방지하지 않았다. 그러나, CSF에서의 중화 항-AAV9 항체 수준은 변화하지 않고 투여전 수준과 대등하게 유지되었다 (표 20).
표 20. AAV9 혈청 NAb 역가
예정된 부검 동안 주요 기관 (심실, 간엽, 폐심장엽, 신장, 비장, 췌장 및 자궁경부 림프절)으로부터 투여 27-29일 후 샘플을 수집하였다. 8 밀리미터 펀치를 통해 펀칭물을 수집하고, 하기 논의된 바와 같이 추가로 가공하였다.
실시예 11
뇌에서의 eTFSCN1A의 생체분포
ddPCR을 사용하여 뇌에서의 eTFSCN1A 생체분포를 측정하였다. 시노몰구스 마카크 뇌 조직의 다양한 영역으로부터의 샘플 (FC: 전두 피질; PC: 두정 피질; TC: 측두 피질; Hip: 해마; Med: 수질; OC: 후두 피질)을 벡터 카피수에 대해 측정하여, 일측 ICV에 의해 AAV9로 투여되었을 때 GABA 선택적 조절 요소의 제어 하의 eTFSCN1A (REGABA-eTFSCN1A)의 생체분포를 평가하였다. 조직 DNA를 DNeasy 혈액 & 조직 키트 (퀴아젠)로 단리하였다. DNA 양을 결정하고, UV 분광광도계를 사용하여 정규화하였다. 20 나노그램의 조직 DNA를, 프로브용 ddPCR 슈퍼 믹스 (dUTP 없음) (바이오-라드(Bio-Rad)) 및 eTFSCN1A 서열의 영역에 대하여 지시된 택맨 프라이머 및 프로브와 함께 20 마이크로리터 반응물에 첨가하였다. 액적을 생성하고, 자동화 액적 발생기 및 써모 사이클러 (바이오-라드)를 사용하여 주형을 증폭시켰다. PCR 단계 후에, 플레이트에 로딩하고, QX2000 액적 판독기에 의해 판독하여 조직 내의 벡터 카피수를 결정하였다. 원숭이 알부민 (MfAlb) 유전자는 게놈 DNA 함량을 정규화하기 위한 내부 대조군으로서의 역할을 하였으며, 이를 동일한 반응에서 증폭시켰다. eTFSCN1A 및 MfAlb에 대한 프라이머 및 프로브는 표 21에 제시된다.
표 21. eTFSCN1A 및 MfAlb에 대한 프라이머 및 프로브
eTFSCN1A은 동물당 4.8E+13 바이러스 게놈으로 투여되었을 때 뇌 전반에 걸쳐 광범위하게 분포되었고, 평균 1.3-3.5 VG/이배체 게놈이었다 (도 11). 추가로, 동물당 4.8E+13 바이러스 게놈으로 투여된 REGABA-eTFSCN1A의 뇌 전체에 걸친 유전자 전달을, 다양한 용량으로 ICV를 통해 투여된 eGFP의 뇌 전체에 걸친 유전자 전달과 비교하였을 때, 용량 증가에 따라 VG/이배체 게놈의 증가가 관찰되었다. 이는 뇌에서의 유전자 전달이 ICV를 통해 AAV9로 투여되었을 때 용량-의존적 방식으로 발생하였다는 것을 나타냈다.
실시예 12
뇌에서의 eTFSCN1A 전사
GABA 선택적 조절 요소 REGABA (REGABA-eTFSCN1A)의 제어 하의 eTFSCN1A의 전사를, ddPCR-기반 유전자 발현 검정을 사용하여 eTFSCN1A mRNA를 측정함으로써 평가하였다. 뇌 조직에 대해 RNeasy 플러스 미니 키트 (퀴아젠) 또는 RNeasy 지질 조직 미니 키트 (퀴아젠)로 조직 RNA를 단리하였다. RNA 양을 결정하고, UV 분광광도계를 사용하여 정규화하고, 바이오애널라이저 RNA 칩을 사용하여 RNA 품질 (RIN)을 검사하였다. 1 마이크로그램의 조직 RNA를 DNase 처리, 및 ezDNase™ 효소 키트 (써모 피셔)를 수반한 슈퍼스크립트 VILO cDNA 합성 키트에 의한 cDNA 합성에 사용하였다. 50 마이크로그램의 RNA를 cDNA로 전환시켰다. cDNA를 프로브용 ddPCR 슈퍼 믹스 (dUTP 없음) (바이오-라드) 및 eTFSCN1A 서열의 영역에 대하여 지시된 택맨 프라이머 및 프로브와 함께 20 마이크로리터 반응물에 첨가하였다 (표 22). 액적을 생성하고, 자동화 액적 발생기 및 써모 사이클러 (바이오-라드)를 사용하여 주형을 증폭시켰다. PCR 증폭 후에, 플레이트에 로딩하고, QX2000 액적 판독기에 의해 판독하여 조직에서의 유전자 발현 수준을 제공하였다. 원숭이 유전자 ARFGAP2 (MfARFGAP2) (써모 피셔 사이언티픽)는 유전자 발현 수준을 정규화하기 위한 내인성 대조군으로서의 역할을 하였으며, 이를 동일한 반응에서 증폭시켰다. ARFGAP2에 대한 평균 전사체는 1.85E+6/ug RNA였다 (도 12, 상부 경계선). 검출 한계는 하부 경계선에 의해 표시된다.
eTFSCN1A mRNA가 모든 동물에서 뇌 전반에 걸쳐 관찰되었으며, 이는 GABA-선택적 프로모터 REGABA가 모든 AAV9-REGABA-eTFSCN1A 처리된 마카크의 뇌 조직에서 전사상 활성이었다는 것을 나타낸다 (도 12). FC: 전두 피질; PC: 두정 피질; TC: 측두 피질; Hip: 해마; Med: 수질; OC: 후두 피질.
표 22. eTFSCN1A 서열의 영역에 대하여 지시된 택맨 프라이머 및 프로브
실시예 13
말초 조직에서의 eTFSCN1A 생체분포 및 전사
추가로 다양한 기관에서 벡터 카피수를 측정하여, 일측 ICV에 의해 AAV9로 투여되었을 때 신체 전반에 걸친 조직에서의 REGABA-eTFSCN1A의 형질도입을 평가하였다. 또한 ddPCR에 의해 eTFSCN1A의 전사체 수준을 측정하여, 일측 ICV에 의해 AAV9로 투여되었을 때 신체 전반에 걸친 조직에서 GABA-선택적 조절 요소 REGABA의 제어 하의 eTFSCN1A 전사 활성을 평가하였다. 두 방법은 일반적으로 상기 기재된 바와 같이 수행하였다. 척수 (SC) 및 후근 신경절 (DRG)에서의 REGABA-eTFSCN1A 형질도입 및 eTFSCN1A의 전사는 뇌에서 관찰된 수준과 대등하였다. 간을 제외하고, REGABA-eTFSCN1A 형질도입은 뇌 외부의 말초 조직에서 보다 낮았다 (도 13). 간에서의 REGABA-eTFSCN1A의 형질도입은 뇌에서보다 더 높았다. eTFSCN1A의 전사는 심장, 폐 및 생식선을 포함한 말초 조직에서 검출되지 않았다. 그러나, 간에서의 eTFSCN1A 전사체 수준은 뇌에서 측정된 eTFSCN1A의 수준과 대등하였다. 추가로, 간에서의 eTFSCN1A 전사는 존재하는 벡터 카피 수에 대해 정규화될 때 극도로 낮다 (뇌에서의 eTFSCN1A의 전사와 비교하여 대략 1000배 더 낮음). 종합하면, 이는 GABA-선택적 조절 요소 REGABA의 제어 하의 eTFSCN1A의 전사가 CNS로 제한된다는 것을 입증하였다.
SEQUENCE LISTING
<110> ENCODED THERAPEUTICS, INC.
<120> COMPOSITIONS AND METHODS FOR SELECTIVE GENE REGULATION
<130> 46482-724.601
<140>
<141>
<150> 63/008,569
<151> 2020-04-10
<150> 62/857,727
<151> 2019-06-05
<150> 62/854,238
<151> 2019-05-29
<160> 226
<170> PatentIn version 3.5
<210> 1
<211> 259
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180
tgggaggtct atataagcag agctggtacc gtgtgtatgc tcaggggctg ggaaaggagg 240
ggagggagct ccggctcag 259
<210> 2
<211> 2051
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 2
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct g 2051
<210> 3
<211> 1878
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 3
tcaacagggg gacacttggg aaagaaggat ggggacagag ccgagaggac tgttacacat 60
tagagaaaca tcagtgactg tgccagcttt ggggtagact gcacaaaagc cctgaggcag 120
cacaggcagg atccagtctg ctggtcccag gaagctaacc gtctcagaca gagcacaaag 180
caccgagaca tgtgccacaa ggcttgtgta gagaggtcag aggacagcgt acaggtccca 240
gagatcaaac tcaacctcac caggcttggc agcaagcctt taccaaccca cccccacccc 300
acccaccctg cacgcgcccc tctcccctcc ccatggtctc ccatggctat ctcacttggc 360
cctaaaatgt ttaaggatga cactggctgc tgagtggaaa tgagacagca gaagtcaaca 420
gtagatttta ggaaagccag agaaaaaggc ttgtgctgtt tttagaaagc caagggacaa 480
gctaagatag ggcccaagta atgctagtat ttacatttat ccacacaaaa cggacgggcc 540
tccgctgaac cagtgaggcc ccagacgtgc gcataaataa cccctgcgtg ctgcaccacc 600
tggggagagg gggaggacca cggtaaatgg agcgagcgca tagcaaaagg gacgcggggt 660
ccttttctct gccggtggca ctgggtagct gtggccaggt gtggtacttt gatggggccc 720
agggctggag ctcaaggaag cgtcgcaggg tcacagatct gggggaaccc cggggaaaag 780
cactgaggca aaaccgccgc tcgtctccta caatatatgg gagggggagg ttgagtacgt 840
tctggattac tcataagacc tttttttttt ccttccgggc gcaaaaccgt gagctggatt 900
tataatcgcc ctataaagct ccagaggcgg tcaggcacct gcagaggagc cccgccgctc 960
cgccgactag ctgcccccgc gagcaacggc ctcgtgattt ccccgccgat ccggtccccg 1020
cctccccact ctgcccccgc ctaccccgga gccgtgcagc cgcctctccg aatctctctc 1080
ttctcctggc gctcgcgtgc gagagggaac tagcgagaac gaggaagcag ctggaggtga 1140
cgccgggcag attacgcctg tcagggccga gccgagcgga tcgctgggcg ctgtgcagag 1200
gaaaggcggg agtgcccggc tcgctgtcgc agagccgagg tgggtaagct agcgaccacc 1260
tggacttccc agcgcccaac cgtggctttt cagccaggtc ctctcctccc gcggcttctc 1320
aaccaacccc atcccagcgc cggccaccca acctcccgaa atgagtgctt cctgccccag 1380
cagccgaagg cgctactagg aacggtaacc tgttactttt ccaggggccg tagtcgaccc 1440
gctgcccgag ttgctgtgcg actgcgcgcg cggggctaga gtgcaaggtg actgtggttc 1500
ttctctggcc aagtccgagg gagaacgtaa agatatgggc ctttttcccc ctctcacctt 1560
gtctcaccaa agtccctagt ccccggagca gttagcctct ttctttccag ggaattagcc 1620
agacacaaca acgggaacca gacaccgaac cagacatgcc cgccccgtgc gccctccccg 1680
ctcgctgcct ttcctccctc ttgtctctcc agagccggat cttcaagggg agcctccgtg 1740
cccccggctg ctcagtccct ccggtgtgca ggaccccgga agtcctcccc gcacagctct 1800
cgcttctctt tgcagcctgt ttctgcgccg gaccagtcga ggactctgga cagtagaggc 1860
cccgggacga ccgagctg 1878
<210> 4
<211> 509
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 4
gccctctagg ccacctgacc aggtcccctc agtccccccc ttcccacact cccacactca 60
gcccccctcc cccccccccg acccctgcag gattatcctg tctgtgttcc tgactcagcc 120
tgggagccac ctgggcagca ggggccaagg gtgtcctaga agggacctgg agtccacgct 180
gggccaagcc tgccctttct ccctctgtct tccgtccctg cttgcggttc tgctgaatgt 240
ggttatttct ctggctcctt ttacagagaa tgctgctgct aattttatgt ggagctctga 300
ggcagtgtaa ttggaagcca gacaccctgt cagcagtggg ctcccgtcct gagctgccat 360
gcttcctgct ctcctcccgt cccggctcct catttcatgc agccacctgt cccagggaga 420
gaggagtcac ccaggcccct cagtccgccc cttaaataag aaagcctccg ttgctcggca 480
cacataccaa gcagccgctg gtgcaatct 509
<210> 5
<211> 1644
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 5
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catgggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 360
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 420
ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga 480
ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg 540
cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cgggagtcgc tgcgttgcct 600
tcgccccgtg ccccgctccg cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 660
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 720
gtttaatgac ggctcgtttc ttttctgtgg ctgcgtgaaa gccttaaagg gctccgggag 780
ggccctttgt gcggggggga gcggctcggg gggtgcgtgc gtgtgtgtgt gcgtggggag 840
cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 900
tgtgcgctcc gcgtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 960
gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg 1020
tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga gttgctgagc 1080
acggcccggc ttcgggtgcg gggctccgtg cggggcgtgg cgcggggctc gccgtgccgg 1140
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 1200
gctcggggga ggggcgcggc ggccccggag cgccggcggc tgtcgaggcg cggcgagccg 1260
cagccattgc cttttatggt aatcgtgcga gagggcgcag ggacttcctt tgtcccaaat 1320
ctggcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cgggcgaagc 1380
ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc 1440
gtccccttct ccatctccag cctcggggct gccgcagggg gacggctgcc ttcggggggg 1500
acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag cctctgctaa 1560
ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg ttgttgtgct 1620
gtctcatcat tttggcaaag aatt 1644
<210> 6
<211> 1335
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 6
gagtaattca tacaaaagga ctcgcccctg ccttggggaa tcccagggac cgtcgttaaa 60
ctcccactaa cgtagaaccc agagatcgct gcgttcccgc cccctcaccc gcccgctctc 120
gtcatcactg aggtggagaa gagcatgcgt gaggctccgg tgcccgtcag tgggcagagc 180
gcacatcgcc cacagtcccc gagaagttgg ggggaggggt cggcaattga accggtgcct 240
agagaaggtg gcgcggggta aactgggaaa gtgatgtcgt gtactggctc cgcctttttc 300
ccgagggtgg gggagaaccg tatataagtg cagtagtcgc cgtgaacgtt ctttttcgca 360
acgggtttgc cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct 420
ttacgggtta tggcccttgc gtgccttgaa ttacttccac gcccctggct gcagtacgtg 480
attcttgatc ccgagcttcg ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa 540
ggagcccctt cgcctcgtgc ttgagttgag gcctggcttg ggcgctgggg ccgccgcgtg 600
cgaatctggt ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa 660
aatttttgat gacctgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc 720
caagatctgc acactggtat ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg 780
tcccagcgca catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg 840
gggtagtctc aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc 900
ccgccctggg cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg 960
cttcccggcc ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg 1020
ggtgagtcac ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac 1080
tccacggagt accgggcgcc gtccaggcac ctcgattagt tctcgagctt ttggagtacg 1140
tcgtctttag gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg 1200
gagactgaag ttaggccagc ttggcacttg atgtaattct ccttggaatt tgcccttttt 1260
gagtttggat cttggttcat tctcaagcct cagacagtgg ttcaaagttt ttttcttcca 1320
tttcaggtgt cgtga 1335
<210> 7
<211> 214
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
aaagagaccg gttcactgtg acagtaaaag agaccggttc actgtgagaa tgaaagagac 60
cggttcactg tgatcggaaa agagaccggt tcactgtgag cggccttgaa acccagcaga 120
caatgtagct cagtagaaac ccagcagaca atgtagctga atggaaaccc agcagacaat 180
gtagcttcgg agaaacccag cagacaatgt agct 214
<210> 8
<211> 21
<212> RNA
<213> Homo sapiens
<400> 8
ucacagugaa ccggucucuu u 21
<210> 9
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 9
aaagagaccg gttcactgtg a 21
<210> 10
<211> 23
<212> RNA
<213> Homo sapiens
<400> 10
agcuacauug ucugcugggu uuc 23
<210> 11
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 11
gaaacccagc agacaatgta gct 23
<210> 12
<211> 23
<212> RNA
<213> Homo sapiens
<400> 12
agcuacaucu ggcuacuggg ucu 23
<210> 13
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
agacccagta gccagatgta gct 23
<210> 14
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 14
gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc 60
actgtga 67
<210> 15
<211> 134
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 15
gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc 60
actgtgagaa acccagcaga caatgtagct agacccagta gccagatgta gctaaagaga 120
ccggttcact gtga 134
<210> 16
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 16
aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtgc ggaccgcacg 60
tg 62
<210> 17
<211> 477
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 17
gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca 60
gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc 120
ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca 180
acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg 240
ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg 300
ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg 360
ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct 420
tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 477
<210> 18
<211> 18
<212> DNA
<213> Homo sapiens
<400> 18
ctaggtcaag tgtaggag 18
<210> 19
<211> 18
<212> DNA
<213> Homo sapiens
<400> 19
acttgaccta gacagcct 18
<210> 20
<211> 18
<212> DNA
<213> Homo sapiens
<400> 20
tgaataactc attagtga 18
<210> 21
<211> 18
<212> DNA
<213> Homo sapiens
<400> 21
aaagtacatt aggctaat 18
<210> 22
<211> 18
<212> DNA
<213> Homo sapiens
<400> 22
ccagcactgg tgcttcgt 18
<210> 23
<211> 18
<212> DNA
<213> Homo sapiens
<400> 23
aaggctgtct aggtcaag 18
<210> 24
<211> 24
<212> DNA
<213> Homo sapiens
<400> 24
ctaggtcaag tgtaggagac acac 24
<210> 25
<211> 18
<212> DNA
<213> Homo sapiens
<400> 25
ggtcaagtgt aggagaca 18
<210> 26
<211> 18
<212> DNA
<213> Homo sapiens
<400> 26
caagtgtagg agacacac 18
<210> 27
<211> 24
<212> DNA
<213> Homo sapiens
<400> 27
agtgtaggag acacactgct ggcc 24
<210> 28
<211> 18
<212> DNA
<213> Homo sapiens
<400> 28
agtgtaggag acacactg 18
<210> 29
<211> 21
<212> DNA
<213> Homo sapiens
<400> 29
aggagacaca ctgctggcct g 21
<210> 30
<211> 18
<212> DNA
<213> Homo sapiens
<400> 30
taggtaccat agagtgag 18
<210> 31
<211> 18
<212> DNA
<213> Homo sapiens
<400> 31
gaggatactg cagaggtc 18
<210> 32
<211> 27
<212> DNA
<213> Homo sapiens
<400> 32
taggtaccat agagtgaggc gaggatg 27
<210> 33
<211> 27
<212> DNA
<213> Homo sapiens
<400> 33
atagagtgag gcgaggatga agccgag 27
<210> 34
<211> 27
<212> DNA
<213> Homo sapiens
<400> 34
tgaagccgag aggatactgc agaggtc 27
<210> 35
<211> 21
<212> DNA
<213> Homo sapiens
<400> 35
aaggctgtct aggtcaagtg t 21
<210> 36
<211> 21
<212> DNA
<213> Homo sapiens
<400> 36
tgttcctcca gattaacact t 21
<210> 37
<211> 21
<212> DNA
<213> Homo sapiens
<400> 37
gatgaagccg agaggatact g 21
<210> 38
<211> 21
<212> DNA
<213> Homo sapiens
<400> 38
gctgatttgt attaggtacc a 21
<210> 39
<211> 21
<212> DNA
<213> Homo sapiens
<400> 39
agaaagctga tacagataca a 21
<210> 40
<211> 21
<212> DNA
<213> Homo sapiens
<400> 40
ggtacgggca aagatttctt g 21
<210> 41
<211> 21
<212> DNA
<213> Homo sapiens
<400> 41
agaaagctga tacagataca a 21
<210> 42
<211> 21
<212> DNA
<213> Homo sapiens
<400> 42
acacaatgag ccacctacaa g 21
<210> 43
<211> 21
<212> DNA
<213> Homo sapiens
<400> 43
gtggctcatt gtgtgtgtgc c 21
<210> 44
<211> 21
<212> DNA
<213> Homo sapiens
<400> 44
catatccctg caggttcaga a 21
<210> 45
<211> 21
<212> DNA
<213> Homo sapiens
<400> 45
agagagagag agagagagag a 21
<210> 46
<211> 21
<212> DNA
<213> Homo sapiens
<400> 46
ttctcagttt tgaaattaaa a 21
<210> 47
<211> 21
<212> DNA
<213> Homo sapiens
<400> 47
tggattctct tctgaacctg c 21
<210> 48
<211> 21
<212> DNA
<213> Homo sapiens
<400> 48
tgctgaggca ggacacagtg t 21
<210> 49
<211> 21
<212> DNA
<213> Homo sapiens
<400> 49
atcatctgta accatcaagg a 21
<210> 50
<211> 21
<212> DNA
<213> Homo sapiens
<400> 50
tcctgcctac ttagtttcaa g 21
<210> 51
<211> 21
<212> DNA
<213> Homo sapiens
<400> 51
attacagttc tgtcagcatg c 21
<210> 52
<211> 21
<212> DNA
<213> Homo sapiens
<400> 52
tggtctcatt ctttttgtgg g 21
<210> 53
<211> 21
<212> DNA
<213> Homo sapiens
<400> 53
cgatattttc atggattcct t 21
<210> 54
<211> 21
<212> DNA
<213> Homo sapiens
<400> 54
ctgacactta ctttgtctaa a 21
<210> 55
<211> 21
<212> DNA
<213> Homo sapiens
<400> 55
aaaactggaa ccgcattccc a 21
<210> 56
<211> 21
<212> DNA
<213> Homo sapiens
<400> 56
acaaagtaag tgtcagtgtg g 21
<210> 57
<211> 21
<212> DNA
<213> Homo sapiens
<400> 57
ataatagttg tgtctttata a 21
<210> 58
<211> 21
<212> DNA
<213> Homo sapiens
<400> 58
tgtacaagca gggctgcaaa g 21
<210> 59
<211> 21
<212> DNA
<213> Homo sapiens
<400> 59
gttaacaaat acactaaaca c 21
<210> 60
<211> 21
<212> DNA
<213> Homo sapiens
<400> 60
ttcaacaagc tcccaagaag t 21
<210> 61
<211> 21
<212> DNA
<213> Homo sapiens
<400> 61
atgttcaagg tgcagaagga a 21
<210> 62
<211> 21
<212> DNA
<213> Homo sapiens
<400> 62
tgtttgctca aacgtgcacc a 21
<210> 63
<211> 21
<212> DNA
<213> Homo sapiens
<400> 63
aaataagaca tgaaaacaag a 21
<210> 64
<211> 21
<212> DNA
<213> Homo sapiens
<400> 64
aaatatgtac cacaagaaat g 21
<210> 65
<211> 21
<212> DNA
<213> Homo sapiens
<400> 65
tatctggttt ctctcactgc t 21
<210> 66
<211> 21
<212> DNA
<213> Homo sapiens
<400> 66
attgcaaagc ataatttgga t 21
<210> 67
<211> 3585
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 67
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc 2700
catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc 2760
tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg 2820
actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat 2880
aaactagtaa agagaccggt tcactgtgac agtaaaagag accggttcac tgtgagaatg 2940
aaagagaccg gttcactgtg atcggaaaag agaccggttc actgtgagcg gccttgaaac 3000
ccagcagaca atgtagctca gtagaaaccc agcagacaat gtagctgaat ggaaacccag 3060
cagacaatgt agcttcggag aaacccagca gacaatgtag ctaagcttgg gtggcatccc 3120
tgtgacccct ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc 3180
cttgtcctaa taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt 3240
atggggtgga ggggggtggt atggagcaag gggcaagttg ggaagacaac ctgtagggcc 3300
tgcggggtct attgggaacc aagctggagt gcagtggcac aatcttggct cactgcaatc 3360
tccgcctcct gggttcaagc gattctcctg cctcagcctc ccgagttgtt gggattccag 3420
gcatgcatga ccaggctcag ctaatttttg tttttttggt agagacgggg tttcaccata 3480
ttggccaggc tggtctccaa ctcctaatct caggtgatct acccaccttg gcctcccaaa 3540
ttgctgggat tacaggcgtg aaccactgct cccttccctg tcctt 3585
<210> 68
<211> 3371
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 68
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc 2700
catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc 2760
tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg 2820
actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat 2880
aaactagtaa gcttgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 2940
aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 3000
ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 3060
aagttgggaa gacaacctgt agggcctgcg gggtctattg ggaaccaagc tggagtgcag 3120
tggcacaatc ttggctcact gcaatctccg cctcctgggt tcaagcgatt ctcctgcctc 3180
agcctcccga gttgttggga ttccaggcat gcatgaccag gctcagctaa tttttgtttt 3240
tttggtagag acggggtttc accatattgg ccaggctggt ctccaactcc taatctcagg 3300
tgatctaccc accttggcct cccaaattgc tgggattaca ggcgtgaacc actgctccct 3360
tccctgtcct t 3371
<210> 69
<211> 4380
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 69
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc 2700
catacgacgt accagattac gctctcgagg aggccagcgg ttccggacgg gctgacgcat 2760
tggacgattt tgatctggat atgctgggaa gtgacgccct cgatgatttt gaccttgaca 2820
tgcttggttc ggatgccctt gatgactttg acctcgacat gctcggcagt gacgcccttg 2880
atgatttcga cctggacatg ctgattaact ctagaagttc cggatctccg aaaaagaaac 2940
gcaaagttgg tagccagtac ctgcccgaca ccgacgaccg gcaccggatc gaggaaaagc 3000
ggaagcggac ctacgagaca ttcaagagca tcatgaagaa gtcccccttc agcggcccca 3060
ccgaccctag acctccacct agaagaatcg ccgtgcccag cagatccagc gccagcgtgc 3120
caaaacctgc cccccagcct taccccttca ccagcagcct gagcaccatc aactacgacg 3180
agttccctac catggtgttc cccagcggcc agatctctca ggcctctgct ctggctccag 3240
cccctcctca ggtgctgcct caggctcctg ctcctgcacc agctccagcc atggtgtctg 3300
cactggctca ggcaccagca cccgtgcctg tgctggctcc tggacctcca caggctgtgg 3360
ctccaccagc ccctaaacct acacaggccg gcgagggcac actgtctgaa gctctgctgc 3420
agctgcagtt cgacgacgag gatctgggag ccctgctggg aaacagcacc gatcctgccg 3480
tgttcaccga cctggccagc gtggacaaca gcgagttcca gcagctgctg aaccagggca 3540
tccctgtggc ccctcacacc accgagccca tgctgatgga ataccccgag gccatcaccc 3600
ggctcgtgac aggcgctcag aggcctcctg atccagctcc tgcccctctg ggagcaccag 3660
gcctgcctaa tggactgctg tctggcgacg aggacttcag ctctatcgcc gatatggatt 3720
tctcagcctt gctgggctct ggcagcggca gccgggattc cagggaaggg atgtttttgc 3780
cgaagcctga ggccggctcc gctattagtg acgtgtttga gggccgcgag gtgtgccagc 3840
caaaacgaat ccggccattt catcctccag gaagtccatg ggccaaccgc ccactccccg 3900
ccagcctcgc accaacacca accggtccag tacatgagcc agtcgggtca ctgaccccgg 3960
caccagtccc tcagccactg gatccagcgc ccgcagtgac tcccgaggcc agtcacctgt 4020
tggaggatcc cgatgaagag acgagccagg ctgtcaaagc ccttcgggag atggccgata 4080
ctgtgattcc ccagaaggaa gaggctgcaa tctgtggcca aatggacctt tcccatccgc 4140
ccccaagggg ccatctggat gagctgacaa ccacacttga gtccatgacc gaggatctga 4200
acctggactc acccctgacc ccggaattga acgagattct ggataccttc ctgaacgacg 4260
agtgcctctt gcatgccatg catatcagca caggactgtc catcttcgac acatctctgt 4320
tttaaactag taataaaaga tctttatttt cattagatct gtgtgttggt tttttgtgtg 4380
<210> 70
<211> 3332
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 70
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatccgacg 2700
cgctggacga tttcgatctc gacatgctgg gttctgatgc cctcgatgac tttgacctgg 2760
atatgttggg aagcgacgca ttggatgact ttgatctgga catgctcggc tccgatgctc 2820
tggacgattt cgatctcgat atgttataaa agcttgggtg gcatccctgt gacccctccc 2880
cagtgcctct cctggccctg gaagttgcca ctccagtgcc caccagcctt gtcctaataa 2940
aattaagttg catcattttg tctgactagg tgtccttcta taatattatg gggtggaggg 3000
gggtggtatg gagcaagggg caagttggga agacaacctg tagggcctgc ggggtctatt 3060
gggaaccaag ctggagtgca gtggcacaat cttggctcac tgcaatctcc gcctcctggg 3120
ttcaagcgat tctcctgcct cagcctcccg agttgttggg attccaggca tgcatgacca 3180
ggctcagcta atttttgttt ttttggtaga gacggggttt caccatattg gccaggctgg 3240
tctccaactc ctaatctcag gtgatctacc caccttggcc tcccaaattg ctgggattac 3300
aggcgtgaac cactgctccc ttccctgtcc tt 3332
<210> 71
<211> 3546
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 71
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatccgacg 2700
cgctggacga tttcgatctc gacatgctgg gttctgatgc cctcgatgac tttgacctgg 2760
atatgttggg aagcgacgca ttggatgact ttgatctgga catgctcggc tccgatgctc 2820
tggacgattt cgatctcgat atgttataaa aagagaccgg ttcactgtga cagtaaaaga 2880
gaccggttca ctgtgagaat gaaagagacc ggttcactgt gatcggaaaa gagaccggtt 2940
cactgtgagc ggccttgaaa cccagcagac aatgtagctc agtagaaacc cagcagacaa 3000
tgtagctgaa tggaaaccca gcagacaatg tagcttcgga gaaacccagc agacaatgta 3060
gctaagcttg ggtggcatcc ctgtgacccc tccccagtgc ctctcctggc cctggaagtt 3120
gccactccag tgcccaccag ccttgtccta ataaaattaa gttgcatcat tttgtctgac 3180
taggtgtcct tctataatat tatggggtgg aggggggtgg tatggagcaa ggggcaagtt 3240
gggaagacaa cctgtagggc ctgcggggtc tattgggaac caagctggag tgcagtggca 3300
caatcttggc tcactgcaat ctccgcctcc tgggttcaag cgattctcct gcctcagcct 3360
cccgagttgt tgggattcca ggcatgcatg accaggctca gctaattttt gtttttttgg 3420
tagagacggg gtttcaccat attggccagg ctggtctcca actcctaatc tcaggtgatc 3480
tacccacctt ggcctcccaa attgctggga ttacaggcgt gaaccactgc tcccttccct 3540
gtcctt 3546
<210> 72
<211> 1707
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 72
atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60
gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120
cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180
ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240
cctcctccag ccgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300
gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360
gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420
gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480
ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540
ggctctgtgt cctgcgccga ccacctgatg ctcgccgagg gctaccgcct ggtgcagagg 600
ccgccgtccg ccgccgccgc ccatggccct catgcgctcc ggactctgcc gccgtacgcg 660
ggcccgggcc tggacagtgg gctgaggccg cggggggctc cgctggggcc gccgccgccc 720
cgccaacccg gggccctggc gtacggggcc ttcgggccgc cgtcctcctt ccagcccttt 780
ccggccgtgc ctccgccggc cgcgggcatc gcgcacctgc agcctgtggc gacgccgtac 840
cccggccgcg ccgccgcgcc ccccaacgct ccgggaggcc ccccgggccc gcagccggcc 900
ccaagcgccg cagccccgcc gccgcccgcg cacgccctgg gcggcatgga cgccgaactc 960
atcgacgagg aggcgctgac gtcgctggag ctggagctgg ggctgcaccg cgtgcgcgag 1020
ctgcccgagc tgttcctggg ccagagcgag ttcgactgct tctcggactt ggggtccgcg 1080
ccgcccgccg gctccgtgag ctgccagtcc cagctcatca aacccagccg catgcgcaag 1140
taccccaacc ggcccagcaa gacgcccccc cacgaacgcc cttacgcttg cccagtggag 1200
tcctgtgatc gccgcttctc ccgcagcgac aacctggtga gacacatccg catccacaca 1260
ggccagaagc ccttccagtg ccgcatctgc atgagaaact tcagccgaga ggataacttg 1320
cacactcaca tccgcaccca cacaggcgaa aagcccttcg cctgcgacat ctgtggaaga 1380
aagtttgccc ggagcgatga acttgtccga cataccaaga tccacttgcg gcagaaggac 1440
cgcccttacg cttgcccagt ggagtcctgt gatcgccgct tctcccaatc agggaatctg 1500
actgagcaca tccgcatcca cacaggccag aagcccttcc agtgccgcat ctgcatgaga 1560
aacttcagca caagtggaca tctggtacgc cacatccgca cccacacagg cgaaaagccc 1620
ttcgcctgcg acatctgtgg aagaaagttt gcccagaata gtaccctgac cgaacatacc 1680
aagatccact tgcggcagaa ggacaag 1707
<210> 73
<211> 1755
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 73
atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60
gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120
cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180
ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240
cctcctccag ctgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300
gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360
gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420
gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480
ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540
ggctctgtgt cctgcggcgg cagcggcggc ggaagcggcg ccgaccacct gatgctcgcc 600
gagggctacc gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg 660
ctccggactc tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg 720
gctccgctgg ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg 780
ccgccgtcct ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac 840
ctgcagcctg tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga 900
ggccccccgg gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc 960
ctgggcggca tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag 1020
ctggggctgc accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac 1080
tgcttctcgg acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt 1140
ggtggttctg gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg 1200
cccagcaaga cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc 1260
cgcttctccc gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc 1320
ttccagtgcc gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc 1380
cgcacccaca caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg 1440
agcgatgaac ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct 1500
tgcccagtgg agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc 1560
cgcatccaca caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca 1620
agtggacatc tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac 1680
atctgtggaa gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg 1740
cggcagaagg acaag 1755
<210> 74
<211> 3438
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 74
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc 2700
catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc 2760
tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg 2820
actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat 2880
aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag 2940
accggttcac tgtgaaagct tgggtggcat ccctgtgacc cctccccagt gcctctcctg 3000
gccctggaag ttgccactcc agtgcccacc agccttgtcc taataaaatt aagttgcatc 3060
attttgtctg actaggtgtc cttctataat attatggggt ggaggggggt ggtatggagc 3120
aaggggcaag ttgggaagac aacctgtagg gcctgcgggg tctattggga accaagctgg 3180
agtgcagtgg cacaatcttg gctcactgca atctccgcct cctgggttca agcgattctc 3240
ctgcctcagc ctcccgagtt gttgggattc caggcatgca tgaccaggct cagctaattt 3300
ttgttttttt ggtagagacg gggtttcacc atattggcca ggctggtctc caactcctaa 3360
tctcaggtga tctacccacc ttggcctccc aaattgctgg gattacaggc gtgaaccact 3420
gctcccttcc ctgtcctt 3438
<210> 75
<211> 3505
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 75
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg 2100
gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat 2160
cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt 2220
ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac 2280
gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga 2340
gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg 2400
agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg 2460
gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg 2520
tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa 2580
gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga 2640
gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc 2700
catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc 2760
tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg 2820
actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat 2880
aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag 2940
accggttcac tgtgagaaac ccagcagaca atgtagctag acccagtagc cagatgtagc 3000
taaagagacc ggttcactgt gaaagcttgg gtggcatccc tgtgacccct ccccagtgcc 3060
tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa taaaattaag 3120
ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga ggggggtggt 3180
atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct attgggaacc 3240
aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct gggttcaagc 3300
gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga ccaggctcag 3360
ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc tggtctccaa 3420
ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat tacaggcgtg 3480
aaccactgct cccttccctg tcctt 3505
<210> 76
<211> 3804
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 76
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccg ccgaccacct gatgctcgcc gagggctacc 2100
gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg ctccggactc 2160
tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg gctccgctgg 2220
ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg ccgccgtcct 2280
ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac ctgcagcctg 2340
tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga ggccccccgg 2400
gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc ctgggcggca 2460
tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag ctggggctgc 2520
accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac tgcttctcgg 2580
acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt ggtggttctg 2640
gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg cccagcaaga 2700
cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc cgcttctccc 2760
gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc ttccagtgcc 2820
gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc cgcacccaca 2880
caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg agcgatgaac 2940
ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct tgcccagtgg 3000
agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc cgcatccaca 3060
caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca agtggacatc 3120
tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac atctgtggaa 3180
gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg cggcagaagg 3240
acaagtaact cgaggaaacc cagcagacaa tgtagctaga cccagtagcc agatgtagct 3300
aaagagaccg gttcactgtg aaagcttggg tggcatccct gtgacccctc cccagtgcct 3360
ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat aaaattaagt 3420
tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag gggggtggta 3480
tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta ttgggaacca 3540
agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg ggttcaagcg 3600
attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac caggctcagc 3660
taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct ggtctccaac 3720
tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt acaggcgtga 3780
accactgctc ccttccctgt cctt 3804
<210> 77
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 77
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu
35 40 45
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Asn
145 150 155 160
Ser Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 78
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 78
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala
35 40 45
Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg
65 70 75 80
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr His
145 150 155 160
Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 79
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 79
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu
35 40 45
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr
65 70 75 80
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala
145 150 155 160
Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 80
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 80
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser
35 40 45
Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
65 70 75 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg
145 150 155 160
Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 81
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 81
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Ser Arg Arg Thr Cys Arg Ala His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr
35 40 45
Gly Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser
145 150 155 160
His Ser Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 82
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 82
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Lys Asp Asn Leu Lys Asn His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro
35 40 45
Gly Ala Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
65 70 75 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Lys
145 150 155 160
Asp Asn Leu Lys Asn His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 83
<211> 232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 83
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro
35 40 45
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
145 150 155 160
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly His Leu Val
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
195 200 205
Cys Gly Lys Ser Phe Ser Gln Asn Ser Thr Leu Thr Glu His Gln Arg
210 215 220
Thr His Thr Gly Lys Lys Thr Ser
225 230
<210> 84
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 84
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
35 40 45
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
65 70 75 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser
145 150 155 160
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 85
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 85
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro
35 40 45
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
145 150 155 160
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 86
<211> 232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 86
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn
35 40 45
Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr
65 70 75 80
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Asp Pro Gly Asn Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg
145 150 155 160
Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
195 200 205
Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr Asn His Gln Arg
210 215 220
Thr His Thr Gly Lys Lys Thr Ser
225 230
<210> 87
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 87
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro
35 40 45
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly Asn Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Arg
145 150 155 160
Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 88
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 88
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro
35 40 45
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu
145 150 155 160
Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr
180 185 190
Asn His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
195 200
<210> 89
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 89
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Arg
35 40 45
Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
65 70 75 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu
145 150 155 160
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 90
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 90
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
35 40 45
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Thr Ser Gly Asn Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
145 150 155 160
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
165 170 175
<210> 91
<211> 260
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 91
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
35 40 45
Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser His Arg Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu
145 150 155 160
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr
180 185 190
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
195 200 205
Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
210 215 220
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
225 230 235 240
Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly
245 250 255
Lys Lys Thr Ser
260
<210> 92
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 92
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg
1 5 10 15
Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu
35 40 45
His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
50 55 60
Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His Thr
65 70 75 80
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu
85 90 95
Ser Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile
100 105 110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
115 120 125
Asn Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His Thr
130 135 140
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln
145 150 155 160
Asn Ser Thr Leu Thr Glu His Thr Lys Ile His Leu Arg Gln Lys Asp
165 170 175
Lys
<210> 93
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 93
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg
1 5 10 15
Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu
35 40 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
50 55 60
Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Thr
65 70 75 80
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu
85 90 95
Ser Cys Asp Arg Arg Phe Ser Thr Ser His Ser Leu Thr Glu His Ile
100 105 110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
115 120 125
Asn Phe Ser Gln Ser Ser Ser Leu Val Arg His Ile Arg Thr His Thr
130 135 140
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg
145 150 155 160
Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg Gln Lys Asp
165 170 175
Lys
<210> 94
<211> 264
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 94
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg
1 5 10 15
Arg Asp Glu Leu Asn Val His Ile Arg Ile His Thr Gly Gln Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu
35 40 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
50 55 60
Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu Val Arg His Thr
65 70 75 80
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu
85 90 95
Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Ile
100 105 110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
115 120 125
Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr His Thr
130 135 140
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg
145 150 155 160
Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg Gln Lys Asp
165 170 175
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Thr
180 185 190
Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro
195 200 205
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ser Ser Leu
210 215 220
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
225 230 235 240
Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Thr
245 250 255
Lys Ile His Leu Arg Gln Lys Asp
260
<210> 95
<211> 264
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 95
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Asp
1 5 10 15
Pro Gly Ala Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu
35 40 45
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
50 55 60
Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Asp Leu Arg Arg His Thr
65 70 75 80
Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu
85 90 95
Ser Cys Asp Arg Arg Phe Ser Thr His Leu Asp Leu Ile Arg His Ile
100 105 110
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
115 120 125
Asn Phe Ser Thr Ser Gly Asn Leu Val Arg His Ile Arg Thr His Thr
130 135 140
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg
145 150 155 160
Ser Asp Asn Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
165 170 175
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Gln
180 185 190
Ser Gly His Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro
195 200 205
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu Arg Ser His Leu
210 215 220
Arg Glu His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
225 230 235 240
Ile Cys Gly Arg Lys Phe Ala Gln Ala Gly His Leu Ala Ser His Thr
245 250 255
Lys Ile His Leu Arg Gln Lys Asp
260
<210> 96
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 96
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
1 5 10 15
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly His Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Glu Asp Asn Leu
35 40 45
His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
50 55 60
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His Ala
65 70 75 80
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly Cys
85 90 95
Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His Leu Arg Ile
100 105 110
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe
115 120 125
Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His Thr Gly Glu
130 135 140
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Gln Asn Ser
145 150 155 160
Thr Leu Thr Glu His Ala Lys Ile His Leu Lys Gln Lys Glu Lys
165 170 175
<210> 97
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 97
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
1 5 10 15
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly His Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser His Arg Thr Thr Leu
35 40 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
50 55 60
Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Ala
65 70 75 80
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly Cys
85 90 95
Asp Arg Arg Phe Ser Thr Ser His Ser Leu Thr Glu His Leu Arg Ile
100 105 110
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe
115 120 125
Ser Gln Ser Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu
130 135 140
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp
145 150 155 160
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln Lys Glu Lys
165 170 175
<210> 98
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 98
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
1 5 10 15
Arg Asp Glu Leu Asn Val His Leu Arg Ile His Thr Gly His Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Ser Asp His Leu
35 40 45
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
50 55 60
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu Val Arg His Ala
65 70 75 80
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly Cys
85 90 95
Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile
100 105 110
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe
115 120 125
Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr His Thr Gly Glu
130 135 140
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp
145 150 155 160
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln Lys Glu His Ala
165 170 175
Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Thr Ser His Ser Leu
180 185 190
Thr Glu His Leu Arg Ile His Thr Gly His Lys Pro Phe Gln Cys Arg
195 200 205
Ile Cys Met Arg Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Ile
210 215 220
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg
225 230 235 240
Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Ala Lys Ile His Leu
245 250 255
Lys Gln Lys Glu Lys
260
<210> 99
<211> 753
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 99
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr
35 40 45
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His
50 55 60
Arg Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys Pro
65 70 75 80
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu
85 90 95
His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
100 105 110
Glu Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr Glu His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
165 170 175
Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Glu Ala
210 215 220
Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
225 230 235 240
Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
245 250 255
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
260 265 270
Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly Ser
275 280 285
Pro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr Asp
290 295 300
Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe
305 310 315 320
Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg
325 330 335
Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val
340 345 350
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr
355 360 365
Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile
370 375 380
Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln
385 390 395 400
Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln
405 410 415
Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val
420 425 430
Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser
435 440 445
Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu
450 455 460
Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val
465 470 475 480
Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala
485 490 495
Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr
500 505 510
Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro
515 520 525
Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp
530 535 540
Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Gly Ser Gly
545 550 555 560
Ser Gly Ser Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu
565 570 575
Ala Gly Ser Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln
580 585 590
Pro Lys Arg Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn
595 600 605
Arg Pro Leu Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His
610 615 620
Glu Pro Val Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp
625 630 635 640
Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro
645 650 655
Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp
660 665 670
Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp
675 680 685
Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr
690 695 700
Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro
705 710 715 720
Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu
725 730 735
His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu
740 745 750
Phe
<210> 100
<211> 753
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 100
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr
35 40 45
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
50 55 60
Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro
65 70 75 80
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu
85 90 95
Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
100 105 110
Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln
165 170 175
Asn Ser Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Glu Ala
210 215 220
Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
225 230 235 240
Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
245 250 255
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
260 265 270
Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly Ser
275 280 285
Pro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr Asp
290 295 300
Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe
305 310 315 320
Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg
325 330 335
Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val
340 345 350
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr
355 360 365
Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile
370 375 380
Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln
385 390 395 400
Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln
405 410 415
Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val
420 425 430
Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser
435 440 445
Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu
450 455 460
Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val
465 470 475 480
Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala
485 490 495
Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr
500 505 510
Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro
515 520 525
Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp
530 535 540
Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Gly Ser Gly
545 550 555 560
Ser Gly Ser Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu
565 570 575
Ala Gly Ser Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln
580 585 590
Pro Lys Arg Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn
595 600 605
Arg Pro Leu Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His
610 615 620
Glu Pro Val Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp
625 630 635 640
Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro
645 650 655
Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp
660 665 670
Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp
675 680 685
Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr
690 695 700
Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro
705 710 715 720
Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu
725 730 735
His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu
740 745 750
Phe
<210> 101
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 101
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr
35 40 45
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His
50 55 60
Arg Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys Pro
65 70 75 80
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu
85 90 95
His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
100 105 110
Glu Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr Glu His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
165 170 175
Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
245 250 255
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
260 265 270
<210> 102
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 102
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr
35 40 45
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
50 55 60
Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro
65 70 75 80
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu
85 90 95
Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
100 105 110
Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln
165 170 175
Asn Ser Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
245 250 255
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
260 265 270
<210> 103
<211> 580
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 103
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
195 200 205
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
210 215 220
Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
225 230 235 240
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
245 250 255
Arg Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr His
260 265 270
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
275 280 285
Arg Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg Gln Lys
290 295 300
Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
305 310 315 320
Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys
325 330 335
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ser Ser
340 345 350
Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
355 360 365
Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His
370 375 380
Thr Lys Ile His Leu Arg Gln Lys Asp Lys Leu Glu Met Ala Asp His
385 390 395 400
Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg Pro Pro Ser Ala
405 410 415
Ala Ala Ala His Gly Pro His Ala Leu Arg Thr Leu Pro Pro Tyr Ala
420 425 430
Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala Pro Leu Gly
435 440 445
Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala Tyr Gly Ala Phe Gly
450 455 460
Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro Pro Pro Ala Ala
465 470 475 480
Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr Pro Gly Arg Ala
485 490 495
Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly Pro Gln Pro Ala
500 505 510
Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala Leu Gly Gly Met
515 520 525
Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser Leu Glu Leu Glu
530 535 540
Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu Phe Leu Gly Gln
545 550 555 560
Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala Pro Pro Ala Gly
565 570 575
Ser Val Ser Cys
580
<210> 104
<211> 394
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 104
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
195 200 205
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
210 215 220
Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
225 230 235 240
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
245 250 255
Arg Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr His
260 265 270
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
275 280 285
Arg Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg Gln Lys
290 295 300
Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
305 310 315 320
Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys
325 330 335
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ser Ser
340 345 350
Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
355 360 365
Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His
370 375 380
Thr Lys Ile His Leu Arg Gln Lys Asp Lys
385 390
<210> 105
<211> 580
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 105
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
195 200 205
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
210 215 220
Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
225 230 235 240
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
245 250 255
Arg Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His
260 265 270
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
275 280 285
Arg Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys
290 295 300
Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
305 310 315 320
Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys
325 330 335
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His
340 345 350
Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
355 360 365
Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His
370 375 380
Thr Lys Ile His Leu Arg Gln Lys Asp Lys Leu Glu Met Ala Asp His
385 390 395 400
Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg Pro Pro Ser Ala
405 410 415
Ala Ala Ala His Gly Pro His Ala Leu Arg Thr Leu Pro Pro Tyr Ala
420 425 430
Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala Pro Leu Gly
435 440 445
Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala Tyr Gly Ala Phe Gly
450 455 460
Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro Pro Pro Ala Ala
465 470 475 480
Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr Pro Gly Arg Ala
485 490 495
Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly Pro Gln Pro Ala
500 505 510
Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala Leu Gly Gly Met
515 520 525
Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser Leu Glu Leu Glu
530 535 540
Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu Phe Leu Gly Gln
545 550 555 560
Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala Pro Pro Ala Gly
565 570 575
Ser Val Ser Cys
580
<210> 106
<211> 394
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 106
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
195 200 205
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
210 215 220
Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
225 230 235 240
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
245 250 255
Arg Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His
260 265 270
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
275 280 285
Arg Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys
290 295 300
Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
305 310 315 320
Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys
325 330 335
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His
340 345 350
Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
355 360 365
Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His
370 375 380
Thr Lys Ile His Leu Arg Gln Lys Asp Lys
385 390
<210> 107
<211> 388
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 107
Met Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
1 5 10 15
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
20 25 30
Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
35 40 45
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
50 55 60
Arg Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
85 90 95
Arg Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys
100 105 110
Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
115 120 125
Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys
130 135 140
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His
145 150 155 160
Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
165 170 175
Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His
180 185 190
Thr Lys Ile His Leu Arg Gln Lys Asp Lys Leu Glu Met Ala Asp His
195 200 205
Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg Pro Pro Ser Ala
210 215 220
Ala Ala Ala His Gly Pro His Ala Leu Arg Thr Leu Pro Pro Tyr Ala
225 230 235 240
Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala Pro Leu Gly
245 250 255
Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala Tyr Gly Ala Phe Gly
260 265 270
Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro Pro Pro Ala Ala
275 280 285
Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr Pro Gly Arg Ala
290 295 300
Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly Pro Gln Pro Ala
305 310 315 320
Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala Leu Gly Gly Met
325 330 335
Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser Leu Glu Leu Glu
340 345 350
Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu Phe Leu Gly Gln
355 360 365
Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala Pro Pro Ala Gly
370 375 380
Ser Val Ser Cys
385
<210> 108
<211> 479
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 108
Met Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn
1 5 10 15
Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val
20 25 30
Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His
35 40 45
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
50 55 60
Arg Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
85 90 95
Arg Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys
100 105 110
Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
115 120 125
Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys
130 135 140
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His
145 150 155 160
Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
165 170 175
Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His
180 185 190
Thr Lys Ile His Leu Arg Gln Lys Asp Lys Leu Glu Met Ser Gly Leu
195 200 205
Glu Met Ala Asp His Met Met Ala Met Asn His Gly Arg Phe Pro Asp
210 215 220
Gly Thr Asn Gly Leu His His His Pro Ala His Arg Met Gly Met Gly
225 230 235 240
Gln Phe Pro Ser Pro His His His Gln Gln Gln Gln Pro Gln His Ala
245 250 255
Phe Asn Ala Leu Met Gly Glu His Ile His Tyr Gly Ala Gly Asn Met
260 265 270
Asn Ala Thr Ser Gly Ile Arg His Ala Met Gly Pro Gly Thr Val Asn
275 280 285
Gly Gly His Pro Pro Ser Ala Leu Ala Pro Ala Ala Arg Phe Asn Asn
290 295 300
Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly Gly Ser Leu Pro
305 310 315 320
Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr Phe Asn His His
325 330 335
Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His Pro Ala Ala Gly
340 345 350
His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp Cys Asn Pro Lys
355 360 365
His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly Gly Ser Ser Thr
370 375 380
Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala Gly Ser Ser Asn
385 390 395 400
Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala Ser Val Ala His
405 410 415
Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp Thr Asp Phe Ile
420 425 430
Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met Gly Leu Asp Arg
435 440 445
Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn Glu Phe Asp Phe
450 455 460
Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg Val Ser Cys
465 470 475
<210> 109
<211> 476
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 109
Met Ser Gly Leu Glu Met Ala Asp His Met Met Ala Met Asn His Gly
1 5 10 15
Arg Phe Pro Asp Gly Thr Asn Gly Leu His His His Pro Ala His Arg
20 25 30
Met Gly Met Gly Gln Phe Pro Ser Pro His His His Gln Gln Gln Gln
35 40 45
Pro Gln His Ala Phe Asn Ala Leu Met Gly Glu His Ile His Tyr Gly
50 55 60
Ala Gly Asn Met Asn Ala Thr Ser Gly Val Arg His Ala Met Gly Pro
65 70 75 80
Gly Thr Val Asn Gly Gly His Pro Pro Ser Ala Leu Ala Pro Ala Ala
85 90 95
Arg Phe Asn Asn Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly
100 105 110
Gly Ser Leu Pro Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr
115 120 125
Phe Asn His His Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
130 135 140
Pro Ala Ala Gly His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
145 150 155 160
Cys Asn Pro Lys His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
165 170 175
Gly Ser Ser Thr Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
180 185 190
Gly Ser Ser Asn Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala
195 200 205
Ser Val Ala His Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
210 215 220
Thr Asp Phe Ile Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
225 230 235 240
Gly Leu Asp Arg Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
245 250 255
Glu Phe Asp Phe Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
260 265 270
Val Ser Cys Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr
275 280 285
Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys
290 295 300
Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val
305 310 315 320
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile
325 330 335
Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg
340 345 350
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
355 360 365
Phe Ala Arg Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg
370 375 380
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg
385 390 395 400
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly
405 410 415
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser
420 425 430
Gly His Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
435 440 445
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr
450 455 460
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Lys
465 470 475
<210> 110
<211> 554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 110
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser
195 200 205
Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly His Lys
210 215 220
Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Glu Asp Asn
225 230 235 240
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
245 250 255
Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His
260 265 270
Ala Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly
275 280 285
Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His Leu Arg
290 295 300
Ile His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser
305 310 315 320
Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His Thr Gly
325 330 335
Glu Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Gln Asn
340 345 350
Ser Thr Leu Thr Glu His Ala Lys Ile His Leu Lys Gln Lys Glu Lys
355 360 365
Leu Glu Met Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val
370 375 380
Gln Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg
385 390 395 400
Thr Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro
405 410 415
Arg Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu
420 425 430
Ala Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala
435 440 445
Val Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr
450 455 460
Pro Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro
465 470 475 480
Pro Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala
485 490 495
His Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu
500 505 510
Thr Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro
515 520 525
Glu Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly
530 535 540
Ser Ala Pro Pro Ala Gly Ser Val Ser Cys
545 550
<210> 111
<211> 362
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 111
Met Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser
1 5 10 15
Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly His Lys
20 25 30
Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Glu Asp Asn
35 40 45
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
50 55 60
Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His
65 70 75 80
Ala Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly
85 90 95
Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His Leu Arg
100 105 110
Ile His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser
115 120 125
Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Gln Asn
145 150 155 160
Ser Thr Leu Thr Glu His Ala Lys Ile His Leu Lys Gln Lys Glu Lys
165 170 175
Leu Glu Met Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val
180 185 190
Gln Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg
195 200 205
Thr Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro
210 215 220
Arg Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu
225 230 235 240
Ala Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala
245 250 255
Val Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr
260 265 270
Pro Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro
275 280 285
Pro Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala
290 295 300
His Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu
305 310 315 320
Thr Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro
325 330 335
Glu Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly
340 345 350
Ser Ala Pro Pro Ala Gly Ser Val Ser Cys
355 360
<210> 112
<211> 479
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 112
Met Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser
1 5 10 15
Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly His Lys
20 25 30
Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Glu Asp Asn
35 40 45
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
50 55 60
Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His
65 70 75 80
Ala Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly
85 90 95
Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His Leu Arg
100 105 110
Ile His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser
115 120 125
Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Gln Asn
145 150 155 160
Ser Thr Leu Thr Glu His Ala Lys Ile His Leu Lys Gln Lys Glu Lys
165 170 175
Lys Ala Glu Lys Gly Gly Ala Pro Ser Ala Ser Ser Ala Pro Pro Val
180 185 190
Ser Leu Ala Pro Val Val Thr Thr Cys Ala Leu Glu Met Ser Gly Leu
195 200 205
Glu Met Ala Asp His Met Met Ala Met Asn His Gly Arg Phe Pro Asp
210 215 220
Gly Thr Asn Gly Leu His His His Pro Ala His Arg Met Gly Met Gly
225 230 235 240
Gln Phe Pro Ser Pro His His His Gln Gln Gln Gln Pro Gln His Ala
245 250 255
Phe Asn Ala Leu Met Gly Glu His Ile His Tyr Gly Ala Gly Asn Met
260 265 270
Asn Ala Thr Ser Gly Ile Arg His Ala Met Gly Pro Gly Thr Val Asn
275 280 285
Gly Gly His Pro Pro Ser Ala Leu Ala Pro Ala Ala Arg Phe Asn Asn
290 295 300
Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly Gly Ser Leu Pro
305 310 315 320
Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr Phe Asn His His
325 330 335
Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His Pro Ala Ala Gly
340 345 350
His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp Cys Asn Pro Lys
355 360 365
His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly Gly Ser Ser Thr
370 375 380
Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala Gly Ser Ser Asn
385 390 395 400
Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala Ser Val Ala His
405 410 415
Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp Thr Asp Phe Ile
420 425 430
Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met Gly Leu Asp Arg
435 440 445
Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn Glu Phe Asp Phe
450 455 460
Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg Val Ser Cys
465 470 475
<210> 113
<211> 476
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 113
Met Ser Gly Leu Glu Met Ala Asp His Met Met Ala Met Asn His Gly
1 5 10 15
Arg Phe Pro Asp Gly Thr Asn Gly Leu His His His Pro Ala His Arg
20 25 30
Met Gly Met Gly Gln Phe Pro Ser Pro His His His Gln Gln Gln Gln
35 40 45
Pro Gln His Ala Phe Asn Ala Leu Met Gly Glu His Ile His Tyr Gly
50 55 60
Ala Gly Asn Met Asn Ala Thr Ser Gly Val Arg His Ala Met Gly Pro
65 70 75 80
Gly Thr Val Asn Gly Gly His Pro Pro Ser Ala Leu Ala Pro Ala Ala
85 90 95
Arg Phe Asn Asn Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly
100 105 110
Gly Ser Leu Pro Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr
115 120 125
Phe Asn His His Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
130 135 140
Pro Ala Ala Gly His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
145 150 155 160
Cys Asn Pro Lys His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
165 170 175
Gly Ser Ser Thr Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
180 185 190
Gly Ser Ser Asn Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala
195 200 205
Ser Val Ala His Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
210 215 220
Thr Asp Phe Ile Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
225 230 235 240
Gly Leu Asp Arg Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
245 250 255
Glu Phe Asp Phe Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
260 265 270
Val Ser Cys Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg
275 280 285
Phe Ser Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly
290 295 300
His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Glu
305 310 315 320
Asp Asn Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
325 330 335
Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val
340 345 350
Arg His Ala Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala
355 360 365
Glu Gly Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His
370 375 380
Leu Arg Ile His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met
385 390 395 400
Arg Ser Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His
405 410 415
Thr Gly Glu Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala
420 425 430
Gln Asn Ser Thr Leu Thr Glu His Ala Lys Ile His Leu Lys Gln Lys
435 440 445
Glu Lys Lys Ala Glu Lys Gly Gly Ala Pro Ser Ala Ser Ser Ala Pro
450 455 460
Pro Val Ser Leu Ala Pro Val Val Thr Thr Cys Ala
465 470 475
<210> 114
<211> 559
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 114
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr Met Ser Ser Leu
1 5 10 15
Leu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu Glu Ile Pro Ser Ala
20 25 30
Leu Asn Leu Phe Ser Gly Ser Ser Asp Ser Val Val His Tyr Asn Gln
35 40 45
Met Ala Thr Glu Asn Val Met Asp Ile Gly Leu Thr Asn Glu Lys Pro
50 55 60
Asn Pro Glu Leu Ser Tyr Ser Gly Ser Phe Gln Pro Ala Pro Gly Asn
65 70 75 80
Lys Thr Val Thr Tyr Leu Gly Lys Phe Ala Phe Asp Ser Pro Ser Asn
85 90 95
Trp Cys Gln Asp Asn Ile Ile Ser Leu Met Ser Ala Gly Ile Leu Gly
100 105 110
Val Pro Pro Ala Ser Gly Ala Leu Ser Thr Gln Thr Ser Thr Ala Ser
115 120 125
Met Val Gln Pro Pro Gln Gly Asp Val Glu Ala Met Tyr Pro Ala Leu
130 135 140
Pro Pro Tyr Ser Asn Cys Gly Asp Leu Tyr Ser Glu Pro Val Ser Phe
145 150 155 160
His Asp Pro Gln Gly Asn Pro Gly Leu Ala Tyr Ser Pro Gln Asp Tyr
165 170 175
Gln Ser Ala Lys Pro Ala Leu Asp Ser Asn Leu Phe Pro Met Ile Pro
180 185 190
Asp Tyr Asn Leu Tyr His His Pro Asn Asp Met Gly Ser Ile Pro Glu
195 200 205
His Lys Pro Phe Gln Gly Met Asp Pro Ile Arg Val Asn Pro Pro Pro
210 215 220
Ile Thr Pro Leu Glu Thr Ile Lys Ala Phe Lys Asp Lys Gln Ile His
225 230 235 240
Pro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro Ile
245 250 255
Arg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His Glu
260 265 270
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
275 280 285
Arg Asp Glu Leu Asn Val His Leu Arg Ile His Thr Gly His Lys Pro
290 295 300
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Ser Asp His Leu
305 310 315 320
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
325 330 335
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu Val Arg His Ala
340 345 350
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly Cys
355 360 365
Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile
370 375 380
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe
385 390 395 400
Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr His Thr Gly Glu
405 410 415
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp
420 425 430
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln Lys Glu His Ala
435 440 445
Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Thr Ser His Ser Leu
450 455 460
Thr Glu His Leu Arg Ile His Thr Gly His Lys Pro Phe Gln Cys Arg
465 470 475 480
Ile Cys Met Arg Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Ile
485 490 495
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg
500 505 510
Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Ala Lys Ile His Leu
515 520 525
Lys Gln Lys Glu Lys Lys Ala Glu Lys Gly Gly Ala Pro Ser Ala Ser
530 535 540
Ser Ala Pro Pro Val Ser Leu Ala Pro Val Val Thr Thr Cys Ala
545 550 555
<210> 115
<211> 631
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 115
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345 350
Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu Thr
370 375 380
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Thr Lys
405 410 415
Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser
420 425 430
Cys Asp Arg Arg Phe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg
435 440 445
Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser Gln Ser Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly
465 470 475 480
Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu
485 490 495
Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg Gln Lys Asp Lys
500 505 510
Lys Ala Asp Lys Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser
515 520 525
Ser Tyr Pro Ser Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr
530 535 540
Ser Tyr Pro Ser Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr
545 550 555 560
Ser Phe Ser Ser Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser
565 570 575
Gly Phe Pro Ser Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro
580 585 590
Ala Phe Pro Ala Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn
595 600 605
Ser Phe Ser Ala Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser
610 615 620
Pro Arg Thr Ile Glu Ile Cys
625 630
<210> 116
<211> 719
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 116
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Arg
340 345 350
Asp Glu Leu Asn Val His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr
370 375 380
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu Val Arg His Thr Lys
405 410 415
Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser
420 425 430
Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Ile Arg
435 440 445
Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg Thr His Thr Gly
465 470 475 480
Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu
485 490 495
Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg Gln Lys Asp Arg
500 505 510
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Thr Ser
515 520 525
His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
530 535 540
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ser Ser Leu Val
545 550 555 560
Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
565 570 575
Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Thr Lys
580 585 590
Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys Ser Val Val Ala
595 600 605
Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser Pro Val Ala Thr
610 615 620
Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser Pro Ala Thr Thr
625 630 635 640
Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser Pro Gly Ser Ser
645 650 655
Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser Pro Ser Val Ala
660 665 670
Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala Gln Val Ser Ser
675 680 685
Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala Ser Thr Gly Leu
690 695 700
Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile Glu Ile Cys
705 710 715
<210> 117
<211> 627
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 117
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345 350
Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu Thr
370 375 380
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Ile Arg
405 410 415
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
420 425 430
Phe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly
435 440 445
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
450 455 460
Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
465 470 475 480
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His
485 490 495
Thr His Thr Lys Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys
500 505 510
Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser
515 520 525
Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser
530 535 540
Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser
545 550 555 560
Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser
565 570 575
Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala
580 585 590
Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala
595 600 605
Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile
610 615 620
Glu Ile Cys
625
<210> 118
<211> 631
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 118
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345 350
Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His
370 375 380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His Thr Lys
405 410 415
Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser
420 425 430
Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg
435 440 445
Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His Thr Gly
465 470 475 480
Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn
485 490 495
Ser Thr Leu Thr Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Lys
500 505 510
Lys Ala Asp Lys Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser
515 520 525
Ser Tyr Pro Ser Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr
530 535 540
Ser Tyr Pro Ser Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr
545 550 555 560
Ser Phe Ser Ser Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser
565 570 575
Gly Phe Pro Ser Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro
580 585 590
Ala Phe Pro Ala Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn
595 600 605
Ser Phe Ser Ala Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser
610 615 620
Pro Arg Thr Ile Glu Ile Cys
625 630
<210> 119
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 119
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr Met Ser Ser Leu
1 5 10 15
Leu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu Glu Ile Pro Ser Ala
20 25 30
Leu Asn Leu Phe Ser Gly Ser Ser Asp Ser Val Val His Tyr Asn Gln
35 40 45
Met Ala Thr Glu Asn Val Met Asp Ile Gly Leu Thr Asn Glu Lys Pro
50 55 60
Asn Pro Glu Leu Ser Tyr Ser Gly Ser Phe Gln Pro Ala Pro Gly Asn
65 70 75 80
Lys Thr Val Thr Tyr Leu Gly Lys Phe Ala Phe Asp Ser Pro Ser Asn
85 90 95
Trp Cys Gln Asp Asn Ile Ile Ser Leu Met Ser Ala Gly Ile Leu Gly
100 105 110
Val Pro Pro Ala Ser Gly Ala Leu Ser Thr Gln Thr Ser Thr Ala Ser
115 120 125
Met Val Gln Pro Pro Gln Gly Asp Val Glu Ala Met Tyr Pro Ala Leu
130 135 140
Pro Pro Tyr Ser Asn Cys Gly Asp Leu Tyr Ser Glu Pro Val Ser Phe
145 150 155 160
His Asp Pro Gln Gly Asn Pro Gly Leu Ala Tyr Ser Pro Gln Asp Tyr
165 170 175
Gln Ser Ala Lys Pro Ala Leu Asp Ser Asn Leu Phe Pro Met Ile Pro
180 185 190
Asp Tyr Asn Leu Tyr His His Pro Asn Asp Met Gly Ser Ile Pro Glu
195 200 205
His Lys Pro Phe Gln Gly Met Asp Pro Ile Arg Val Asn Pro Pro Pro
210 215 220
Ile Thr Pro Leu Glu Thr Ile Lys Ala Phe Lys Asp Lys Gln Ile His
225 230 235 240
Pro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro Ile
245 250 255
Arg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His Glu
260 265 270
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
275 280 285
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly His Lys Pro
290 295 300
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser His Arg Thr Thr Leu
305 310 315 320
Thr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
325 330 335
Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Ala
340 345 350
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly Cys
355 360 365
Asp Arg Arg Phe Ser Thr Ser His Ser Leu Thr Glu His Leu Arg Ile
370 375 380
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe
385 390 395 400
Ser Gln Ser Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu
405 410 415
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp
420 425 430
Asn Leu His Thr His Ala Lys Ile His Leu Lys Gln Lys Glu Lys Lys
435 440 445
Ala Glu Lys Gly Gly Ala Pro Ser Ala Ser Ser Ala Pro Pro Val Ser
450 455 460
Leu Ala Pro Val Val Thr Thr Cys Ala
465 470
<210> 120
<211> 719
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 120
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Asp Pro
340 345 350
Gly Ala Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu Val
370 375 380
Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Gln Ser Gly Asp Leu Arg Arg His Thr Lys
405 410 415
Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser
420 425 430
Cys Asp Arg Arg Phe Ser Thr His Leu Asp Leu Ile Arg His Ile Arg
435 440 445
Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser Thr Ser Gly Asn Leu Val Arg His Ile Arg Thr His Thr Gly
465 470 475 480
Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser
485 490 495
Asp Asn Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys Asp Arg
500 505 510
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Gln Ser
515 520 525
Gly His Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
530 535 540
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu Arg Ser His Leu Arg
545 550 555 560
Glu His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
565 570 575
Cys Gly Arg Lys Phe Ala Gln Ala Gly His Leu Ala Ser His Thr Lys
580 585 590
Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys Ser Val Val Ala
595 600 605
Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser Pro Val Ala Thr
610 615 620
Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser Pro Ala Thr Thr
625 630 635 640
Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser Pro Gly Ser Ser
645 650 655
Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser Pro Ser Val Ala
660 665 670
Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala Gln Val Ser Ser
675 680 685
Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala Ser Thr Gly Leu
690 695 700
Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile Glu Ile Cys
705 710 715
<210> 121
<211> 627
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 121
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345 350
Asp Asn Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His Ser Thr Thr Leu Thr
370 375 380
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Arg Lys Thr His Ile Arg
405 410 415
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
420 425 430
Phe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly
435 440 445
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
450 455 460
Ser Ser Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
465 470 475 480
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Arg Lys
485 490 495
Thr His Thr Lys Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys
500 505 510
Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser
515 520 525
Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser
530 535 540
Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser
545 550 555 560
Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser
565 570 575
Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala
580 585 590
Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala
595 600 605
Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile
610 615 620
Glu Ile Cys
625
<210> 122
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 122
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr Met Ser Ser Leu
1 5 10 15
Leu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu Glu Ile Pro Ser Ala
20 25 30
Leu Asn Leu Phe Ser Gly Ser Ser Asp Ser Val Val His Tyr Asn Gln
35 40 45
Met Ala Thr Glu Asn Val Met Asp Ile Gly Leu Thr Asn Glu Lys Pro
50 55 60
Asn Pro Glu Leu Ser Tyr Ser Gly Ser Phe Gln Pro Ala Pro Gly Asn
65 70 75 80
Lys Thr Val Thr Tyr Leu Gly Lys Phe Ala Phe Asp Ser Pro Ser Asn
85 90 95
Trp Cys Gln Asp Asn Ile Ile Ser Leu Met Ser Ala Gly Ile Leu Gly
100 105 110
Val Pro Pro Ala Ser Gly Ala Leu Ser Thr Gln Thr Ser Thr Ala Ser
115 120 125
Met Val Gln Pro Pro Gln Gly Asp Val Glu Ala Met Tyr Pro Ala Leu
130 135 140
Pro Pro Tyr Ser Asn Cys Gly Asp Leu Tyr Ser Glu Pro Val Ser Phe
145 150 155 160
His Asp Pro Gln Gly Asn Pro Gly Leu Ala Tyr Ser Pro Gln Asp Tyr
165 170 175
Gln Ser Ala Lys Pro Ala Leu Asp Ser Asn Leu Phe Pro Met Ile Pro
180 185 190
Asp Tyr Asn Leu Tyr His His Pro Asn Asp Met Gly Ser Ile Pro Glu
195 200 205
His Lys Pro Phe Gln Gly Met Asp Pro Ile Arg Val Asn Pro Pro Pro
210 215 220
Ile Thr Pro Leu Glu Thr Ile Lys Ala Phe Lys Asp Lys Gln Ile His
225 230 235 240
Pro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro Ile
245 250 255
Arg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His Glu
260 265 270
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
275 280 285
Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr Gly His Lys Pro
290 295 300
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Glu Asp Asn Leu
305 310 315 320
His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
325 330 335
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His Ala
340 345 350
Lys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro Ala Glu Gly Cys
355 360 365
Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His Leu Arg Ile
370 375 380
His Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe
385 390 395 400
Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His Thr Gly Glu
405 410 415
Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe Ala Gln Asn Ser
420 425 430
Thr Leu Thr Glu His Ala Lys Ile His Leu Lys Gln Lys Glu Lys Lys
435 440 445
Ala Glu Lys Gly Gly Ala Pro Ser Ala Ser Ser Ala Pro Pro Val Ser
450 455 460
Leu Ala Pro Val Val Thr Thr Cys Ala
465 470
<210> 123
<211> 627
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 123
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345 350
Asp Asn Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu Thr
370 375 380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ile Arg
405 410 415
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
420 425 430
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly
435 440 445
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser
450 455 460
Gly His Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
465 470 475 480
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser Thr Arg Lys
485 490 495
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys
500 505 510
Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser
515 520 525
Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser
530 535 540
Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser
545 550 555 560
Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser
565 570 575
Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala
580 585 590
Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala
595 600 605
Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile
610 615 620
Glu Ile Cys
625
<210> 124
<211> 627
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 124
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345 350
Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His
370 375 380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His Ile Arg
405 410 415
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
420 425 430
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly
435 440 445
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser
450 455 460
Gly His Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
465 470 475 480
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr
485 490 495
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys
500 505 510
Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser
515 520 525
Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser
530 535 540
Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser
545 550 555 560
Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser
565 570 575
Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala
580 585 590
Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala
595 600 605
Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile
610 615 620
Glu Ile Cys
625
<210> 125
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 125
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His Thr
35 40 45
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
50 55 60
Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
65 70 75 80
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu
85 90 95
His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
100 105 110
Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr
165 170 175
Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
245 250 255
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
260 265 270
<210> 126
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 126
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg Thr His Thr
35 40 45
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
50 55 60
Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
65 70 75 80
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu
85 90 95
Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
100 105 110
Glu Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Thr Ser Gly Asn Leu Val Arg His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
165 170 175
Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
245 250 255
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
260 265 270
<210> 127
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 127
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr
35 40 45
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
50 55 60
Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro
65 70 75 80
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu
85 90 95
Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
100 105 110
Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln
115 120 125
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
130 135 140
Ser Phe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr
145 150 155 160
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln
165 170 175
Asn Ser Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr
180 185 190
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
195 200 205
Lys Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
210 215 220
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
225 230 235 240
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
245 250 255
Asp Leu Asp Met Leu
260
<210> 128
<211> 386
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 128
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gln Ser Gln Leu Ile Lys Pro
180 185 190
Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His
195 200 205
Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
210 215 220
Arg Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys
225 230 235 240
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Glu Asp Asn
245 250 255
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
260 265 270
Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His
275 280 285
Thr Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val
290 295 300
Glu Ser Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His
305 310 315 320
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
325 330 335
Arg Asn Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His
340 345 350
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
355 360 365
Gln Asn Ser Thr Leu Thr Glu His Thr Lys Ile His Leu Arg Gln Lys
370 375 380
Asp Lys
385
<210> 129
<211> 402
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 129
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gln Ser Gln Leu Ile Lys Pro
195 200 205
Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His
210 215 220
Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
225 230 235 240
Arg Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys
245 250 255
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Glu Asp Asn
260 265 270
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
275 280 285
Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His
290 295 300
Thr Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val
305 310 315 320
Glu Ser Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His
325 330 335
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
340 345 350
Arg Asn Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His
355 360 365
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
370 375 380
Gln Asn Ser Thr Leu Thr Glu His Thr Lys Ile His Leu Arg Gln Lys
385 390 395 400
Asp Lys
<210> 130
<211> 569
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 130
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Ala Asp His Leu Met Leu Ala
180 185 190
Glu Gly Tyr Arg Leu Val Gln Arg Pro Pro Ser Ala Ala Ala Ala His
195 200 205
Gly Pro His Ala Leu Arg Thr Leu Pro Pro Tyr Ala Gly Pro Gly Leu
210 215 220
Asp Ser Gly Leu Arg Pro Arg Gly Ala Pro Leu Gly Pro Pro Pro Pro
225 230 235 240
Arg Gln Pro Gly Ala Leu Ala Tyr Gly Ala Phe Gly Pro Pro Ser Ser
245 250 255
Phe Gln Pro Phe Pro Ala Val Pro Pro Pro Ala Ala Gly Ile Ala His
260 265 270
Leu Gln Pro Val Ala Thr Pro Tyr Pro Gly Arg Ala Ala Ala Pro Pro
275 280 285
Asn Ala Pro Gly Gly Pro Pro Gly Pro Gln Pro Ala Pro Ser Ala Ala
290 295 300
Ala Pro Pro Pro Pro Ala His Ala Leu Gly Gly Met Asp Ala Glu Leu
305 310 315 320
Ile Asp Glu Glu Ala Leu Thr Ser Leu Glu Leu Glu Leu Gly Leu His
325 330 335
Arg Val Arg Glu Leu Pro Glu Leu Phe Leu Gly Gln Ser Glu Phe Asp
340 345 350
Cys Phe Ser Asp Leu Gly Ser Ala Pro Pro Ala Gly Ser Val Ser Cys
355 360 365
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg
370 375 380
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val Glu
385 390 395 400
Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Ile
405 410 415
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
420 425 430
Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His Thr
435 440 445
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg
450 455 460
Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
465 470 475 480
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Gln
485 490 495
Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro
500 505 510
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His Leu
515 520 525
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
530 535 540
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
545 550 555 560
Lys Ile His Leu Arg Gln Lys Asp Lys
565
<210> 131
<211> 585
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 131
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg
195 200 205
Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr Leu
210 215 220
Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly
225 230 235 240
Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala Tyr
245 250 255
Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro
260 265 270
Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr
275 280 285
Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly
290 295 300
Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala
305 310 315 320
Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser
325 330 335
Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu
340 345 350
Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala
355 360 365
Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser Gly
370 375 380
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg
385 390 395 400
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val Glu
405 410 415
Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Ile
420 425 430
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
435 440 445
Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His Thr
450 455 460
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg
465 470 475 480
Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
485 490 495
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Gln
500 505 510
Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro
515 520 525
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His Leu
530 535 540
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
545 550 555 560
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
565 570 575
Lys Ile His Leu Arg Gln Lys Asp Lys
580 585
<210> 132
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 132
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys
50 55 60
Val Gly Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
65 70 75 80
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
85 90 95
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
100 105 110
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
115 120 125
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
130 135 140
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
145 150 155 160
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
165 170 175
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
180 185 190
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
195 200 205
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
210 215 220
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
225 230 235 240
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
245 250 255
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
260 265 270
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
275 280 285
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
290 295 300
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
305 310 315 320
Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser
325 330 335
Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser
340 345 350
Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro
355 360 365
Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser
370 375 380
Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu
385 390 395 400
Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr
405 410 415
Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln
420 425 430
Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys
435 440 445
Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro
450 455 460
Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu
465 470 475 480
Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu
485 490 495
Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser
500 505 510
Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
515 520
<210> 133
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 133
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu
50
<210> 134
<211> 275
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 134
Met Ser Gly Leu Glu Met Ala Asp His Met Met Ala Met Asn His Gly
1 5 10 15
Arg Phe Pro Asp Gly Thr Asn Gly Leu His His His Pro Ala His Arg
20 25 30
Met Gly Met Gly Gln Phe Pro Ser Pro His His His Gln Gln Gln Gln
35 40 45
Pro Gln His Ala Phe Asn Ala Leu Met Gly Glu His Ile His Tyr Gly
50 55 60
Ala Gly Asn Met Asn Ala Thr Ser Gly Ile Arg His Ala Met Gly Pro
65 70 75 80
Gly Thr Val Asn Gly Gly His Pro Pro Ser Ala Leu Ala Pro Ala Ala
85 90 95
Arg Phe Asn Asn Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly
100 105 110
Gly Ser Leu Pro Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr
115 120 125
Phe Asn His His Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His
130 135 140
Pro Ala Ala Gly His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp
145 150 155 160
Cys Asn Pro Lys His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly
165 170 175
Gly Ser Ser Thr Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala
180 185 190
Gly Ser Ser Asn Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala
195 200 205
Ser Val Ala His Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp
210 215 220
Thr Asp Phe Ile Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met
225 230 235 240
Gly Leu Asp Arg Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn
245 250 255
Glu Phe Asp Phe Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg
260 265 270
Val Ser Cys
275
<210> 135
<211> 183
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 135
Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg Pro
1 5 10 15
Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr Leu Pro
20 25 30
Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala
35 40 45
Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala Tyr Gly
50 55 60
Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro Pro
65 70 75 80
Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr Pro
85 90 95
Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly Pro
100 105 110
Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala Leu
115 120 125
Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser Leu
130 135 140
Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu Phe
145 150 155 160
Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala Pro
165 170 175
Pro Ala Gly Ser Val Ser Cys
180
<210> 136
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<400> 136
Cys Xaa Cys Xaa His Xaa His
1 5
<210> 137
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Any amino acid
<400> 137
Cys Xaa Cys Xaa Cys Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa
1 5 10 15
Cys
<210> 138
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Any amino acid
<400> 138
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa His Xaa Cys Xaa Cys Xaa
1 5 10 15
Cys
<210> 139
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Cys, His, or Asp
<400> 139
Cys Xaa Cys Xaa His Xaa Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa
1 5 10 15
<210> 140
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Any amino acid
<400> 140
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa
1 5 10 15
Cys
<210> 141
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<400> 141
Cys Xaa Cys Xaa Cys Xaa His
1 5
<210> 142
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<400> 142
Cys Xaa Cys Xaa His Xaa Cys
1 5
<210> 143
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Any amino acid
<400> 143
Cys Xaa Cys Xaa His Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa
1 5 10 15
Cys
<210> 144
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Any amino acid
<400> 144
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa
1 5 10 15
Cys
<210> 145
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<400> 145
Cys Xaa Cys Xaa Cys Xaa Cys
1 5
<210> 146
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Any amino acid
<400> 146
Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa His Xaa His Xaa
1 5 10 15
Cys
<210> 147
<211> 344
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MISC_FEATURE
<222> (8)..(322)
<223> This region may encompass 1-15 "Tyr Lys Cys Pro Glu Cys
Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys
Pro" repeating units
<220>
<221> NON_CONS
<222> (18)..(19)
<220>
<221> NON_CONS
<222> (39)..(40)
<220>
<221> NON_CONS
<222> (60)..(61)
<220>
<221> NON_CONS
<222> (81)..(82)
<220>
<221> NON_CONS
<222> (102)..(103)
<220>
<221> NON_CONS
<222> (123)..(124)
<220>
<221> NON_CONS
<222> (144)..(145)
<220>
<221> NON_CONS
<222> (165)..(166)
<220>
<221> NON_CONS
<222> (186)..(187)
<220>
<221> NON_CONS
<222> (207)..(208)
<220>
<221> NON_CONS
<222> (228)..(229)
<220>
<221> NON_CONS
<222> (249)..(250)
<220>
<221> NON_CONS
<222> (270)..(271)
<220>
<221> NON_CONS
<222> (291)..(292)
<220>
<221> NON_CONS
<222> (312)..(313)
<220>
<221> NON_CONS
<222> (333)..(334)
<220>
<223> See specification as filed for detailed description of
substitutions and preferred embodiments
<400> 147
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
20 25 30
Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys
35 40 45
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr
50 55 60
His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
65 70 75 80
Ser His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro
100 105 110
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr His
115 120 125
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
130 135 140
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
145 150 155 160
Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr His Thr
180 185 190
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His
195 200 205
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
210 215 220
Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
225 230 235 240
Cys Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly
245 250 255
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Gln
260 265 270
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
275 280 285
Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
290 295 300
Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu
305 310 315 320
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg
325 330 335
Thr His Thr Gly Lys Lys Thr Ser
340
<210> 148
<211> 292
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (8)..(57)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (8)..(57)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (65)..(114)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (65)..(114)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (122)..(171)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (122)..(171)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (179)..(228)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (179)..(228)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (236)..(285)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (236)..(285)
<223> This region may encompass 1-50 residues
<400> 148
Arg Ser Asp Asn Leu Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp Asn Leu His Thr
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Arg Ser Asp Glu Leu Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Ser Gly Asn Leu
165 170 175
Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Xaa Xaa Xaa Thr Ser Gly His Leu Val Arg Xaa Xaa Xaa Xaa Xaa
225 230 235 240
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
245 250 255
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
260 265 270
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Asn Ser
275 280 285
Thr Leu Thr Glu
290
<210> 149
<211> 292
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (8)..(57)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (8)..(57)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (65)..(114)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (65)..(114)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (122)..(171)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (122)..(171)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (179)..(228)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (179)..(228)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (236)..(285)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (236)..(285)
<223> This region may encompass 1-50 residues
<400> 149
Arg Ser Asp Asn Leu Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Arg Thr Thr Leu Thr Asn
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Arg Glu Asp Asn Leu His Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Ser His Ser Leu
165 170 175
Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Xaa Xaa Xaa Gln Ser Ser Ser Leu Val Arg Xaa Xaa Xaa Xaa Xaa
225 230 235 240
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
245 250 255
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
260 265 270
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp
275 280 285
Asn Leu His Thr
290
<210> 150
<211> 292
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (8)..(57)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (8)..(57)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (65)..(114)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (65)..(114)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (122)..(171)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (122)..(171)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (179)..(228)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (179)..(228)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (236)..(285)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (236)..(285)
<223> This region may encompass 1-50 residues
<400> 150
Asp Pro Gly Ala Leu Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Ser Asp Asn Leu Val Arg
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Gln Ser Gly Asp Leu Arg Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr His Leu Asp Leu
165 170 175
Ile Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Xaa Xaa Xaa Thr Ser Gly Asn Leu Val Arg Xaa Xaa Xaa Xaa Xaa
225 230 235 240
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
245 250 255
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
260 265 270
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Ser Asp
275 280 285
Asn Leu Val Arg
290
<210> 151
<211> 463
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (8)..(57)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (8)..(57)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (65)..(114)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (65)..(114)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (122)..(171)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (122)..(171)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (179)..(228)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (179)..(228)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (236)..(285)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (236)..(285)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (293)..(342)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (293)..(342)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (350)..(399)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (350)..(399)
<223> This region may encompass 1-50 residues
<220>
<221> MOD_RES
<222> (407)..(456)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (407)..(456)
<223> This region may encompass 1-50 residues
<400> 151
Arg Arg Asp Glu Leu Asn Val Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Ser Asp His Leu Thr Asn
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Arg Ser Asp Asp Leu Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Ser Asp Asn Leu
165 170 175
Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Xaa Xaa Xaa His Arg Thr Thr Leu Thr Asn Xaa Xaa Xaa Xaa Xaa
225 230 235 240
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
245 250 255
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
260 265 270
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp
275 280 285
Asn Leu His Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
290 295 300
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
305 310 315 320
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
325 330 335
Xaa Xaa Xaa Xaa Xaa Xaa Thr Ser His Ser Leu Thr Glu Xaa Xaa Xaa
340 345 350
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
355 360 365
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
370 375 380
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln
385 390 395 400
Ser Ser Ser Leu Val Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
405 410 415
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
420 425 430
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
435 440 445
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp Asn Leu His Thr
450 455 460
<210> 152
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 152
Arg Ser Asp Asn Leu Val Arg
1 5
<210> 153
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 153
Arg Glu Asp Asn Leu His Thr
1 5
<210> 154
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 154
Arg Ser Asp Glu Leu Val Arg
1 5
<210> 155
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 155
Gln Ser Gly Asn Leu Thr Glu
1 5
<210> 156
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 156
Thr Ser Gly His Leu Val Arg
1 5
<210> 157
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 157
Gln Asn Ser Thr Leu Thr Glu
1 5
<210> 158
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 158
Asp Pro Gly Ala Leu Val Arg
1 5
<210> 159
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 159
His Arg Thr Thr Leu Thr Asn
1 5
<210> 160
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 160
Gln Ser Gly Asp Leu Arg Arg
1 5
<210> 161
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 161
Thr Ser His Ser Leu Thr Glu
1 5
<210> 162
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 162
Thr His Leu Asp Leu Ile Arg
1 5
<210> 163
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 163
Gln Ser Ser Ser Leu Val Arg
1 5
<210> 164
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 164
Thr Ser Gly Asn Leu Val Arg
1 5
<210> 165
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 165
Arg Arg Asp Glu Leu Asn Val
1 5
<210> 166
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 166
Arg Ser Asp Asp Leu Val Arg
1 5
<210> 167
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 167
Arg Ser Asp His Leu Thr Asn
1 5
<210> 168
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 168
Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys
1 5 10 15
<210> 169
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 169
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 170
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 170
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 171
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 171
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 172
<211> 2009
<212> PRT
<213> Homo sapiens
<400> 172
Met Glu Gln Thr Val Leu Val Pro Pro Gly Pro Asp Ser Phe Asn Phe
1 5 10 15
Phe Thr Arg Glu Ser Leu Ala Ala Ile Glu Arg Arg Ile Ala Glu Glu
20 25 30
Lys Ala Lys Asn Pro Lys Pro Asp Lys Lys Asp Asp Asp Glu Asn Gly
35 40 45
Pro Lys Pro Asn Ser Asp Leu Glu Ala Gly Lys Asn Leu Pro Phe Ile
50 55 60
Tyr Gly Asp Ile Pro Pro Glu Met Val Ser Glu Pro Leu Glu Asp Leu
65 70 75 80
Asp Pro Tyr Tyr Ile Asn Lys Lys Thr Phe Ile Val Leu Asn Lys Gly
85 90 95
Lys Ala Ile Phe Arg Phe Ser Ala Thr Ser Ala Leu Tyr Ile Leu Thr
100 105 110
Pro Phe Asn Pro Leu Arg Lys Ile Ala Ile Lys Ile Leu Val His Ser
115 120 125
Leu Phe Ser Met Leu Ile Met Cys Thr Ile Leu Thr Asn Cys Val Phe
130 135 140
Met Thr Met Ser Asn Pro Pro Asp Trp Thr Lys Asn Val Glu Tyr Thr
145 150 155 160
Phe Thr Gly Ile Tyr Thr Phe Glu Ser Leu Ile Lys Ile Ile Ala Arg
165 170 175
Gly Phe Cys Leu Glu Asp Phe Thr Phe Leu Arg Asp Pro Trp Asn Trp
180 185 190
Leu Asp Phe Thr Val Ile Thr Phe Ala Tyr Val Thr Glu Phe Val Asp
195 200 205
Leu Gly Asn Val Ser Ala Leu Arg Thr Phe Arg Val Leu Arg Ala Leu
210 215 220
Lys Thr Ile Ser Val Ile Pro Gly Leu Lys Thr Ile Val Gly Ala Leu
225 230 235 240
Ile Gln Ser Val Lys Lys Leu Ser Asp Val Met Ile Leu Thr Val Phe
245 250 255
Cys Leu Ser Val Phe Ala Leu Ile Gly Leu Gln Leu Phe Met Gly Asn
260 265 270
Leu Arg Asn Lys Cys Ile Gln Trp Pro Pro Thr Asn Ala Ser Leu Glu
275 280 285
Glu His Ser Ile Glu Lys Asn Ile Thr Val Asn Tyr Asn Gly Thr Leu
290 295 300
Ile Asn Glu Thr Val Phe Glu Phe Asp Trp Lys Ser Tyr Ile Gln Asp
305 310 315 320
Ser Arg Tyr His Tyr Phe Leu Glu Gly Phe Leu Asp Ala Leu Leu Cys
325 330 335
Gly Asn Ser Ser Asp Ala Gly Gln Cys Pro Glu Gly Tyr Met Cys Val
340 345 350
Lys Ala Gly Arg Asn Pro Asn Tyr Gly Tyr Thr Ser Phe Asp Thr Phe
355 360 365
Ser Trp Ala Phe Leu Ser Leu Phe Arg Leu Met Thr Gln Asp Phe Trp
370 375 380
Glu Asn Leu Tyr Gln Leu Thr Leu Arg Ala Ala Gly Lys Thr Tyr Met
385 390 395 400
Ile Phe Phe Val Leu Val Ile Phe Leu Gly Ser Phe Tyr Leu Ile Asn
405 410 415
Leu Ile Leu Ala Val Val Ala Met Ala Tyr Glu Glu Gln Asn Gln Ala
420 425 430
Thr Leu Glu Glu Ala Glu Gln Lys Glu Ala Glu Phe Gln Gln Met Ile
435 440 445
Glu Gln Leu Lys Lys Gln Gln Glu Ala Ala Gln Gln Ala Ala Thr Ala
450 455 460
Thr Ala Ser Glu His Ser Arg Glu Pro Ser Ala Ala Gly Arg Leu Ser
465 470 475 480
Asp Ser Ser Ser Glu Ala Ser Lys Leu Ser Ser Lys Ser Ala Lys Glu
485 490 495
Arg Arg Asn Arg Arg Lys Lys Arg Lys Gln Lys Glu Gln Ser Gly Gly
500 505 510
Glu Glu Lys Asp Glu Asp Glu Phe Gln Lys Ser Glu Ser Glu Asp Ser
515 520 525
Ile Arg Arg Lys Gly Phe Arg Phe Ser Ile Glu Gly Asn Arg Leu Thr
530 535 540
Tyr Glu Lys Arg Tyr Ser Ser Pro His Gln Ser Leu Leu Ser Ile Arg
545 550 555 560
Gly Ser Leu Phe Ser Pro Arg Arg Asn Ser Arg Thr Ser Leu Phe Ser
565 570 575
Phe Arg Gly Arg Ala Lys Asp Val Gly Ser Glu Asn Asp Phe Ala Asp
580 585 590
Asp Glu His Ser Thr Phe Glu Asp Asn Glu Ser Arg Arg Asp Ser Leu
595 600 605
Phe Val Pro Arg Arg His Gly Glu Arg Arg Asn Ser Asn Leu Ser Gln
610 615 620
Thr Ser Arg Ser Ser Arg Met Leu Ala Val Phe Pro Ala Asn Gly Lys
625 630 635 640
Met His Ser Thr Val Asp Cys Asn Gly Val Val Ser Leu Val Gly Gly
645 650 655
Pro Ser Val Pro Thr Ser Pro Val Gly Gln Leu Leu Pro Glu Val Ile
660 665 670
Ile Asp Lys Pro Ala Thr Asp Asp Asn Gly Thr Thr Thr Glu Thr Glu
675 680 685
Met Arg Lys Arg Arg Ser Ser Ser Phe His Val Ser Met Asp Phe Leu
690 695 700
Glu Asp Pro Ser Gln Arg Gln Arg Ala Met Ser Ile Ala Ser Ile Leu
705 710 715 720
Thr Asn Thr Val Glu Glu Leu Glu Glu Ser Arg Gln Lys Cys Pro Pro
725 730 735
Cys Trp Tyr Lys Phe Ser Asn Ile Phe Leu Ile Trp Asp Cys Ser Pro
740 745 750
Tyr Trp Leu Lys Val Lys His Val Val Asn Leu Val Val Met Asp Pro
755 760 765
Phe Val Asp Leu Ala Ile Thr Ile Cys Ile Val Leu Asn Thr Leu Phe
770 775 780
Met Ala Met Glu His Tyr Pro Met Thr Asp His Phe Asn Asn Val Leu
785 790 795 800
Thr Val Gly Asn Leu Val Phe Thr Gly Ile Phe Thr Ala Glu Met Phe
805 810 815
Leu Lys Ile Ile Ala Met Asp Pro Tyr Tyr Tyr Phe Gln Glu Gly Trp
820 825 830
Asn Ile Phe Asp Gly Phe Ile Val Thr Leu Ser Leu Val Glu Leu Gly
835 840 845
Leu Ala Asn Val Glu Gly Leu Ser Val Leu Arg Ser Phe Arg Leu Leu
850 855 860
Arg Val Phe Lys Leu Ala Lys Ser Trp Pro Thr Leu Asn Met Leu Ile
865 870 875 880
Lys Ile Ile Gly Asn Ser Val Gly Ala Leu Gly Asn Leu Thr Leu Val
885 890 895
Leu Ala Ile Ile Val Phe Ile Phe Ala Val Val Gly Met Gln Leu Phe
900 905 910
Gly Lys Ser Tyr Lys Asp Cys Val Cys Lys Ile Ala Ser Asp Cys Gln
915 920 925
Leu Pro Arg Trp His Met Asn Asp Phe Phe His Ser Phe Leu Ile Val
930 935 940
Phe Arg Val Leu Cys Gly Glu Trp Ile Glu Thr Met Trp Asp Cys Met
945 950 955 960
Glu Val Ala Gly Gln Ala Met Cys Leu Thr Val Phe Met Met Val Met
965 970 975
Val Ile Gly Asn Leu Val Val Leu Asn Leu Phe Leu Ala Leu Leu Leu
980 985 990
Ser Ser Phe Ser Ala Asp Asn Leu Ala Ala Thr Asp Asp Asp Asn Glu
995 1000 1005
Met Asn Asn Leu Gln Ile Ala Val Asp Arg Met His Lys Gly Val
1010 1015 1020
Ala Tyr Val Lys Arg Lys Ile Tyr Glu Phe Ile Gln Gln Ser Phe
1025 1030 1035
Ile Arg Lys Gln Lys Ile Leu Asp Glu Ile Lys Pro Leu Asp Asp
1040 1045 1050
Leu Asn Asn Lys Lys Asp Ser Cys Met Ser Asn His Thr Ala Glu
1055 1060 1065
Ile Gly Lys Asp Leu Asp Tyr Leu Lys Asp Val Asn Gly Thr Thr
1070 1075 1080
Ser Gly Ile Gly Thr Gly Ser Ser Val Glu Lys Tyr Ile Ile Asp
1085 1090 1095
Glu Ser Asp Tyr Met Ser Phe Ile Asn Asn Pro Ser Leu Thr Val
1100 1105 1110
Thr Val Pro Ile Ala Val Gly Glu Ser Asp Phe Glu Asn Leu Asn
1115 1120 1125
Thr Glu Asp Phe Ser Ser Glu Ser Asp Leu Glu Glu Ser Lys Glu
1130 1135 1140
Lys Leu Asn Glu Ser Ser Ser Ser Ser Glu Gly Ser Thr Val Asp
1145 1150 1155
Ile Gly Ala Pro Val Glu Glu Gln Pro Val Val Glu Pro Glu Glu
1160 1165 1170
Thr Leu Glu Pro Glu Ala Cys Phe Thr Glu Gly Cys Val Gln Arg
1175 1180 1185
Phe Lys Cys Cys Gln Ile Asn Val Glu Glu Gly Arg Gly Lys Gln
1190 1195 1200
Trp Trp Asn Leu Arg Arg Thr Cys Phe Arg Ile Val Glu His Asn
1205 1210 1215
Trp Phe Glu Thr Phe Ile Val Phe Met Ile Leu Leu Ser Ser Gly
1220 1225 1230
Ala Leu Ala Phe Glu Asp Ile Tyr Ile Asp Gln Arg Lys Thr Ile
1235 1240 1245
Lys Thr Met Leu Glu Tyr Ala Asp Lys Val Phe Thr Tyr Ile Phe
1250 1255 1260
Ile Leu Glu Met Leu Leu Lys Trp Val Ala Tyr Gly Tyr Gln Thr
1265 1270 1275
Tyr Phe Thr Asn Ala Trp Cys Trp Leu Asp Phe Leu Ile Val Asp
1280 1285 1290
Val Ser Leu Val Ser Leu Thr Ala Asn Ala Leu Gly Tyr Ser Glu
1295 1300 1305
Leu Gly Ala Ile Lys Ser Leu Arg Thr Leu Arg Ala Leu Arg Pro
1310 1315 1320
Leu Arg Ala Leu Ser Arg Phe Glu Gly Met Arg Val Val Val Asn
1325 1330 1335
Ala Leu Leu Gly Ala Ile Pro Ser Ile Met Asn Val Leu Leu Val
1340 1345 1350
Cys Leu Ile Phe Trp Leu Ile Phe Ser Ile Met Gly Val Asn Leu
1355 1360 1365
Phe Ala Gly Lys Phe Tyr His Cys Ile Asn Thr Thr Thr Gly Asp
1370 1375 1380
Arg Phe Asp Ile Glu Asp Val Asn Asn His Thr Asp Cys Leu Lys
1385 1390 1395
Leu Ile Glu Arg Asn Glu Thr Ala Arg Trp Lys Asn Val Lys Val
1400 1405 1410
Asn Phe Asp Asn Val Gly Phe Gly Tyr Leu Ser Leu Leu Gln Val
1415 1420 1425
Ala Thr Phe Lys Gly Trp Met Asp Ile Met Tyr Ala Ala Val Asp
1430 1435 1440
Ser Arg Asn Val Glu Leu Gln Pro Lys Tyr Glu Glu Ser Leu Tyr
1445 1450 1455
Met Tyr Leu Tyr Phe Val Ile Phe Ile Ile Phe Gly Ser Phe Phe
1460 1465 1470
Thr Leu Asn Leu Phe Ile Gly Val Ile Ile Asp Asn Phe Asn Gln
1475 1480 1485
Gln Lys Lys Lys Phe Gly Gly Gln Asp Ile Phe Met Thr Glu Glu
1490 1495 1500
Gln Lys Lys Tyr Tyr Asn Ala Met Lys Lys Leu Gly Ser Lys Lys
1505 1510 1515
Pro Gln Lys Pro Ile Pro Arg Pro Gly Asn Lys Phe Gln Gly Met
1520 1525 1530
Val Phe Asp Phe Val Thr Arg Gln Val Phe Asp Ile Ser Ile Met
1535 1540 1545
Ile Leu Ile Cys Leu Asn Met Val Thr Met Met Val Glu Thr Asp
1550 1555 1560
Asp Gln Ser Glu Tyr Val Thr Thr Ile Leu Ser Arg Ile Asn Leu
1565 1570 1575
Val Phe Ile Val Leu Phe Thr Gly Glu Cys Val Leu Lys Leu Ile
1580 1585 1590
Ser Leu Arg His Tyr Tyr Phe Thr Ile Gly Trp Asn Ile Phe Asp
1595 1600 1605
Phe Val Val Val Ile Leu Ser Ile Val Gly Met Phe Leu Ala Glu
1610 1615 1620
Leu Ile Glu Lys Tyr Phe Val Ser Pro Thr Leu Phe Arg Val Ile
1625 1630 1635
Arg Leu Ala Arg Ile Gly Arg Ile Leu Arg Leu Ile Lys Gly Ala
1640 1645 1650
Lys Gly Ile Arg Thr Leu Leu Phe Ala Leu Met Met Ser Leu Pro
1655 1660 1665
Ala Leu Phe Asn Ile Gly Leu Leu Leu Phe Leu Val Met Phe Ile
1670 1675 1680
Tyr Ala Ile Phe Gly Met Ser Asn Phe Ala Tyr Val Lys Arg Glu
1685 1690 1695
Val Gly Ile Asp Asp Met Phe Asn Phe Glu Thr Phe Gly Asn Ser
1700 1705 1710
Met Ile Cys Leu Phe Gln Ile Thr Thr Ser Ala Gly Trp Asp Gly
1715 1720 1725
Leu Leu Ala Pro Ile Leu Asn Ser Lys Pro Pro Asp Cys Asp Pro
1730 1735 1740
Asn Lys Val Asn Pro Gly Ser Ser Val Lys Gly Asp Cys Gly Asn
1745 1750 1755
Pro Ser Val Gly Ile Phe Phe Phe Val Ser Tyr Ile Ile Ile Ser
1760 1765 1770
Phe Leu Val Val Val Asn Met Tyr Ile Ala Val Ile Leu Glu Asn
1775 1780 1785
Phe Ser Val Ala Thr Glu Glu Ser Ala Glu Pro Leu Ser Glu Asp
1790 1795 1800
Asp Phe Glu Met Phe Tyr Glu Val Trp Glu Lys Phe Asp Pro Asp
1805 1810 1815
Ala Thr Gln Phe Met Glu Phe Glu Lys Leu Ser Gln Phe Ala Ala
1820 1825 1830
Ala Leu Glu Pro Pro Leu Asn Leu Pro Gln Pro Asn Lys Leu Gln
1835 1840 1845
Leu Ile Ala Met Asp Leu Pro Met Val Ser Gly Asp Arg Ile His
1850 1855 1860
Cys Leu Asp Ile Leu Phe Ala Phe Thr Lys Arg Val Leu Gly Glu
1865 1870 1875
Ser Gly Glu Met Asp Ala Leu Arg Ile Gln Met Glu Glu Arg Phe
1880 1885 1890
Met Ala Ser Asn Pro Ser Lys Val Ser Tyr Gln Pro Ile Thr Thr
1895 1900 1905
Thr Leu Lys Arg Lys Gln Glu Glu Val Ser Ala Val Ile Ile Gln
1910 1915 1920
Arg Ala Tyr Arg Arg His Leu Leu Lys Arg Thr Val Lys Gln Ala
1925 1930 1935
Ser Phe Thr Tyr Asn Lys Asn Lys Ile Lys Gly Gly Ala Asn Leu
1940 1945 1950
Leu Ile Lys Glu Asp Met Ile Ile Asp Arg Ile Asn Glu Asn Ser
1955 1960 1965
Ile Thr Glu Lys Thr Asp Leu Thr Met Ser Thr Ala Ala Cys Pro
1970 1975 1980
Pro Ser Tyr Asp Arg Val Thr Lys Pro Ile Val Glu Lys His Glu
1985 1990 1995
Gln Glu Gly Lys Asp Glu Lys Ala Lys Gly Lys
2000 2005
<210> 173
<211> 1052
<212> PRT
<213> Homo sapiens
<400> 173
Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 174
<211> 1148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 174
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
20 25 30
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
35 40 45
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
50 55 60
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
65 70 75 80
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
85 90 95
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105 110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120 125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135 140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155 160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
165 170 175
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
180 185 190
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
195 200 205
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
210 215 220
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
225 230 235 240
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
245 250 255
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
260 265 270
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
275 280 285
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
290 295 300
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
305 310 315 320
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
325 330 335
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
340 345 350
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
355 360 365
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
370 375 380
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
385 390 395 400
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
405 410 415
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
420 425 430
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
435 440 445
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
450 455 460
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
465 470 475 480
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
485 490 495
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
500 505 510
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
515 520 525
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
530 535 540
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
545 550 555 560
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
565 570 575
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
580 585 590
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
595 600 605
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
610 615 620
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
625 630 635 640
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
645 650 655
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
660 665 670
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
675 680 685
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
690 695 700
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
705 710 715 720
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
725 730 735
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
740 745 750
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
755 760 765
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
770 775 780
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
785 790 795 800
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
805 810 815
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
820 825 830
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
835 840 845
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
850 855 860
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
865 870 875 880
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
885 890 895
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
900 905 910
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
915 920 925
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
930 935 940
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
945 950 955 960
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
965 970 975
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
980 985 990
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
995 1000 1005
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn
1010 1015 1020
Met Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser
1025 1030 1035
Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn
1040 1045 1050
Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys
1055 1060 1065
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1070 1075 1080
Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu
1085 1090 1095
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1100 1105 1110
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp
1115 1120 1125
Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
1130 1135 1140
Asp Leu Asp Met Leu
1145
<210> 175
<211> 387
<212> PRT
<213> Homo sapiens
<400> 175
Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr Met Ser Ser Leu
1 5 10 15
Leu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu Glu Ile Pro Ser Ala
20 25 30
Leu Asn Leu Phe Ser Gly Ser Ser Asp Ser Val Val His Tyr Asn Gln
35 40 45
Met Ala Thr Glu Asn Val Met Asp Ile Gly Leu Thr Asn Glu Lys Pro
50 55 60
Asn Pro Glu Leu Ser Tyr Ser Gly Ser Phe Gln Pro Ala Pro Gly Asn
65 70 75 80
Lys Thr Val Thr Tyr Leu Gly Lys Phe Ala Phe Asp Ser Pro Ser Asn
85 90 95
Trp Cys Gln Asp Asn Ile Ile Ser Leu Met Ser Ala Gly Ile Leu Gly
100 105 110
Val Pro Pro Ala Ser Gly Ala Leu Ser Thr Gln Thr Ser Thr Ala Ser
115 120 125
Met Val Gln Pro Pro Gln Gly Asp Val Glu Ala Met Tyr Pro Ala Leu
130 135 140
Pro Pro Tyr Ser Asn Cys Gly Asp Leu Tyr Ser Glu Pro Val Ser Phe
145 150 155 160
His Asp Pro Gln Gly Asn Pro Gly Leu Ala Tyr Ser Pro Gln Asp Tyr
165 170 175
Gln Ser Ala Lys Pro Ala Leu Asp Ser Asn Leu Phe Pro Met Ile Pro
180 185 190
Asp Tyr Asn Leu Tyr His His Pro Asn Asp Met Gly Ser Ile Pro Glu
195 200 205
His Lys Pro Phe Gln Gly Met Asp Pro Ile Arg Val Asn Pro Pro Pro
210 215 220
Ile Thr Pro Leu Glu Thr Ile Lys Ala Phe Lys Asp Lys Gln Ile His
225 230 235 240
Pro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro Ile
245 250 255
Arg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His Glu
260 265 270
Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg
275 280 285
Ser Asp Glu Leu Thr Arg His Leu Arg Ile His Thr Gly His Lys Pro
290 295 300
Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Ser Asp His Leu
305 310 315 320
Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu
325 330 335
Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ala
340 345 350
Lys Ile His Leu Lys Gln Lys Glu Lys Lys Ala Glu Lys Gly Gly Ala
355 360 365
Pro Ser Ala Ser Ser Ala Pro Pro Val Ser Leu Ala Pro Val Val Thr
370 375 380
Thr Cys Ala
385
<210> 176
<211> 543
<212> PRT
<213> Homo sapiens
<400> 176
Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile
1 5 10 15
Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr
20 25 30
Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe
35 40 45
Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser
50 55 60
Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser
65 70 75 80
Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro
85 90 95
Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn
100 105 110
Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu
115 120 125
Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn
130 135 140
Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly
145 150 155 160
Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser
165 170 175
Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys
180 185 190
Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr
195 200 205
Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala
210 215 220
Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr
225 230 235 240
Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu
245 250 255
Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln Lys
260 265 270
Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr Pro
275 280 285
Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp Leu
290 295 300
Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser Arg
305 310 315 320
Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg
325 330 335
Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser
340 345 350
Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe
355 360 365
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr
370 375 380
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
385 390 395 400
Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Thr Lys
405 410 415
Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys Ser Val Val Ala
420 425 430
Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser Pro Val Ala Thr
435 440 445
Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser Pro Ala Thr Thr
450 455 460
Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser Pro Gly Ser Ser
465 470 475 480
Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser Pro Ser Val Ala
485 490 495
Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala Gln Val Ser Ser
500 505 510
Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala Ser Thr Gly Leu
515 520 525
Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile Glu Ile Cys
530 535 540
<210> 177
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 177
Gly Gly Ser Gly Gly Gly Ser Gly
1 5
<210> 178
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 178
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
1 5 10 15
<210> 179
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> See specification as filed for detailed description of
substitutions and preferred embodiments
<400> 179
Gly Gly Gly Ser
1
<210> 180
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> See specification as filed for detailed description of
substitutions and preferred embodiments
<400> 180
Gly Gly Gly Gly Ser
1 5
<210> 181
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> See specification as filed for detailed description of
substitutions and preferred embodiments
<400> 181
Gly Gly Ser Gly
1
<210> 182
<211> 9
<212> DNA
<213> Homo sapiens
<400> 182
gcgkgggcg 9
<210> 183
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 183
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
caacttgttg gcgaga 76
<210> 184
<211> 3871
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 184
ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat 60
attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc 120
gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag 180
tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca 240
gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt 300
taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc 360
ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420
caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg 480
cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540
ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata 600
ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg 660
gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg 720
aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag 780
agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc 840
tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg 900
gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag 960
gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat 1020
tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc 1080
gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac 1140
tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc 1200
actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260
ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg 1320
cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc 1380
gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt 1440
cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac 1500
cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga 1560
aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc 1620
gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg 1680
gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740
caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca 1800
acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg 1860
cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg 1920
ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct 1980
ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga 2040
cgaccgagct ggaattcgcc accatggccg ccgaccacct gatgctcgcc gagggctacc 2100
gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg ctccggactc 2160
tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg gctccgctgg 2220
ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg ccgccgtcct 2280
ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac ctgcagcctg 2340
tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga ggccccccgg 2400
gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc ctgggcggca 2460
tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag ctggggctgc 2520
accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac tgcttctcgg 2580
acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt ggtggttctg 2640
gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg cccagcaaga 2700
cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc cgcttctccc 2760
gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc ttccagtgcc 2820
gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc cgcacccaca 2880
caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg agcgatgaac 2940
ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct tgcccagtgg 3000
agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc cgcatccaca 3060
caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca agtggacatc 3120
tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac atctgtggaa 3180
gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg cggcagaagg 3240
acaagtaact cgaggaaacc cagcagacaa tgtagctaga cccagtagcc agatgtagct 3300
aaagagaccg gttcactgtg agaaacccag cagacaatgt agctagaccc agtagccaga 3360
tgtagctaaa gagaccggtt cactgtgaaa gcttgggtgg catccctgtg acccctcccc 3420
agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg tcctaataaa 3480
attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg ggtggagggg 3540
ggtggtatgg agcaaggggc aagttgggaa gacaacctgt agggcctgcg gggtctattg 3600
ggaaccaagc tggagtgcag tggcacaatc ttggctcact gcaatctccg cctcctgggt 3660
tcaagcgatt ctcctgcctc agcctcccga gttgttggga ttccaggcat gcatgaccag 3720
gctcagctaa tttttgtttt tttggtagag acggggtttc accatattgg ccaggctggt 3780
ctccaactcc taatctcagg tgatctaccc accttggcct cccaaattgc tgggattaca 3840
ggcgtgaacc actgctccct tccctgtcct t 3871
<210> 185
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 185
tgtctcggca ttgagaacat tc 22
<210> 186
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 186
attggtggga ggccattgta t 21
<210> 187
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 187
accacagtcc atgccatcac 20
<210> 188
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 188
tccaccaccc tgttgctgta 20
<210> 189
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 189
caaaaaagcc acaaaagcct 20
<210> 190
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 190
ttagctccgc aagaaacatc 20
<210> 191
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 191
ccatggaact ggctcgattt cac 23
<210> 192
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 192
attggtggga ggccactgta t 21
<210> 193
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 193
aggcctgaaa accattgtgg gagccct 27
<210> 194
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 194
gaatgtggga aatcattcag tcgc 24
<210> 195
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 195
gcaagttatc ctctcgtgag aagg 24
<210> 196
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 196
gcgacaacct ggtgagacat caacgcacc 29
<210> 197
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 197
gctgttatct cttgtgggct gt 22
<210> 198
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 198
aaactcatgg gagctgccgg tt 22
<210> 199
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 199
ccacacaaat ctctccctgg cattg 25
<210> 200
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 200
gaatgtggga aatcattcag tcgc 24
<210> 201
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 201
gcaagttatc ctctcgtgag aagg 24
<210> 202
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 202
gcgacaacct ggtgagacat caacgcacc 29
<210> 203
<211> 1182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 203
atggccgccg accacctgat gctcgccgag ggctaccgcc tggtgcagag gccgccgtcc 60
gccgccgccg cccatggccc tcatgcgctc cggactctgc cgccgtacgc gggcccgggc 120
ctggacagtg ggctgaggcc gcggggggct ccgctggggc cgccgccgcc ccgccaaccc 180
ggggccctgg cgtacggggc cttcgggccg ccgtcctcct tccagccctt tccggccgtg 240
cctccgccgg ccgcgggcat cgcgcacctg cagcctgtgg cgacgccgta ccccggccgc 300
gcggccgcgc cccccaacgc tccgggaggc cccccgggcc cgcagccggc cccaagcgcc 360
gcagccccgc cgccgcccgc gcacgccctg ggcggcatgg acgccgaact catcgacgag 420
gaggcgctga cgtcgctgga gctggagctg gggctgcacc gcgtgcgcga gctgcccgag 480
ctgttcctgg gccagagcga gttcgactgc ttctcggact tggggtccgc gccgcccgcc 540
ggctccgtga gctgcggtgg ttctggtggt ggttctggtc agtcccagct catcaaaccc 600
agccgcatgc gcaagtaccc caaccggccc agcaagacgc ccccccacga acgcccttac 660
gcttgcccag tggagtcctg tgatcgccgc ttctcccgca gcgacaacct ggtgagacac 720
atccgcatcc acacaggcca gaagcccttc cagtgccgca tctgcatgag aaacttcagc 780
cgagaggata acttgcacac tcacatccgc acccacacag gcgaaaagcc cttcgcctgc 840
gacatctgtg gaagaaagtt tgcccggagc gatgaacttg tccgacatac caagatccac 900
ttgcggcaga aggaccgccc ttacgcttgc ccagtggagt cctgtgatcg ccgcttctcc 960
caatcaggga atctgactga gcacatccgc atccacacag gccagaagcc cttccagtgc 1020
cgcatctgca tgagaaactt cagcacaagt ggacatctgg tacgccacat ccgcacccac 1080
acaggcgaaa agcccttcgc ctgcgacatc tgtggaagaa agtttgccca gaatagtacc 1140
ctgaccgaac ataccaagat ccacttgcgg cagaaggaca ag 1182
<210> 204
<211> 1206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 204
atggccgccg accacctgat gctcgccgag ggctaccgcc tggtgcagag gccgccgtcc 60
gccgccgccg cccatggccc tcatgcgctc cggactctgc cgccgtacgc gggcccgggc 120
ctggacagtg ggctgaggcc gcggggggct ccgctggggc cgccgccgcc ccgccaaccc 180
ggggccctgg cgtacggggc cttcgggccg ccgtcctcct tccagccctt tccggccgtg 240
cctccgccgg ccgcgggcat cgcgcacctg cagcctgtgg cgacgccgta ccccggccgc 300
gcggccgcgc cccccaacgc tccgggaggc cccccgggcc cgcagccggc cccaagcgcc 360
gcagccccgc cgccgcccgc gcacgccctg ggcggcatgg acgccgaact catcgacgag 420
gaggcgctga cgtcgctgga gctggagctg gggctgcacc gcgtgcgcga gctgcccgag 480
ctgttcctgg gccagagcga gttcgactgc ttctcggact tggggtccgc gccgcccgcc 540
ggctccgtga gctgcggtgg ttctggtggt ggttctggtg gtggcagcgg gggaggttct 600
ggtcagtccc agctcatcaa acccagccgc atgcgcaagt accccaaccg gcccagcaag 660
acgccccccc acgaacgccc ttacgcttgc ccagtggagt cctgtgatcg ccgcttctcc 720
cgcagcgaca acctggtgag acacatccgc atccacacag gccagaagcc cttccagtgc 780
cgcatctgca tgagaaactt cagccgagag gataacttgc acactcacat ccgcacccac 840
acaggcgaaa agcccttcgc ctgcgacatc tgtggaagaa agtttgcccg gagcgatgaa 900
cttgtccgac ataccaagat ccacttgcgg cagaaggacc gcccttacgc ttgcccagtg 960
gagtcctgtg atcgccgctt ctcccaatca gggaatctga ctgagcacat ccgcatccac 1020
acaggccaga agcccttcca gtgccgcatc tgcatgagaa acttcagcac aagtggacat 1080
ctggtacgcc acatccgcac ccacacaggc gaaaagccct tcgcctgcga catctgtgga 1140
agaaagtttg cccagaatag taccctgacc gaacatacca agatccactt gcggcagaag 1200
gacaag 1206
<210> 205
<211> 402
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 205
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gln Ser Gln Leu Ile Lys Pro
195 200 205
Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His
210 215 220
Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
225 230 235 240
Arg Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys
245 250 255
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Glu Asp Asn
260 265 270
Leu His Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
275 280 285
Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg His
290 295 300
Thr Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val
305 310 315 320
Glu Ser Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu His
325 330 335
Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
340 345 350
Arg Asn Phe Ser Thr Ser Gly His Leu Val Arg His Ile Arg Thr His
355 360 365
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
370 375 380
Gln Asn Ser Thr Leu Thr Glu His Thr Lys Ile His Leu Arg Gln Lys
385 390 395 400
Asp Lys
<210> 206
<211> 1707
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 206
atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60
gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120
cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180
ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240
cctcctccag ccgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300
gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360
gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420
gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480
ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540
ggctctgtgt cctgcgccga ccacctgatg ctcgccgagg gctaccgcct ggtgcagagg 600
ccgccgtccg ccgccgccgc ccatggccct catgcgctcc ggactctgcc gccgtacgcg 660
ggcccgggcc tggacagtgg gctgaggccg cggggggctc cgctggggcc gccgccgccc 720
cgccaacccg gggccctggc gtacggggcc ttcgggccgc cgtcctcctt ccagcccttt 780
ccggccgtgc ctccgccggc cgcgggcatc gcgcacctgc agcctgtggc gacgccgtac 840
cccggccgcg ccgccgcgcc ccccaacgct ccgggaggcc ccccgggccc gcagccggcc 900
ccaagcgccg cagccccgcc gccgcccgcg cacgccctgg gcggcatgga cgccgaactc 960
atcgacgagg aggcgctgac gtcgctggag ctggagctgg ggctgcaccg cgtgcgcgag 1020
ctgcccgagc tgttcctggg ccagagcgag ttcgactgct tctcggactt ggggtccgcg 1080
ccgcccgccg gctccgtgag ctgccagtcc cagctcatca aacccagccg catgcgcaag 1140
taccccaacc ggcccagcaa gacgcccccc cacgaacgcc cttacgcttg cccagtggag 1200
tcctgtgatc gccgcttctc ccgcagcgac aacctggtga gacacatccg catccacaca 1260
ggccagaagc ccttccagtg ccgcatctgc atgagaaact tcagccgaga ggataacttg 1320
cacactcaca tccgcaccca cacaggcgaa aagcccttcg cctgcgacat ctgtggaaga 1380
aagtttgccc ggagcgatga acttgtccga cataccaaga tccacttgcg gcagaaggac 1440
cgcccttacg cttgcccagt ggagtcctgt gatcgccgct tctcccaatc agggaatctg 1500
actgagcaca tccgcatcca cacaggccag aagcccttcc agtgccgcat ctgcatgaga 1560
aacttcagca caagtggaca tctggtacgc cacatccgca cccacacagg cgaaaagccc 1620
ttcgcctgcg acatctgtgg aagaaagttt gcccagaata gtaccctgac cgaacatacc 1680
aagatccact tgcggcagaa ggacaag 1707
<210> 207
<211> 569
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 207
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Ala Asp His Leu Met Leu Ala
180 185 190
Glu Gly Tyr Arg Leu Val Gln Arg Pro Pro Ser Ala Ala Ala Ala His
195 200 205
Gly Pro His Ala Leu Arg Thr Leu Pro Pro Tyr Ala Gly Pro Gly Leu
210 215 220
Asp Ser Gly Leu Arg Pro Arg Gly Ala Pro Leu Gly Pro Pro Pro Pro
225 230 235 240
Arg Gln Pro Gly Ala Leu Ala Tyr Gly Ala Phe Gly Pro Pro Ser Ser
245 250 255
Phe Gln Pro Phe Pro Ala Val Pro Pro Pro Ala Ala Gly Ile Ala His
260 265 270
Leu Gln Pro Val Ala Thr Pro Tyr Pro Gly Arg Ala Ala Ala Pro Pro
275 280 285
Asn Ala Pro Gly Gly Pro Pro Gly Pro Gln Pro Ala Pro Ser Ala Ala
290 295 300
Ala Pro Pro Pro Pro Ala His Ala Leu Gly Gly Met Asp Ala Glu Leu
305 310 315 320
Ile Asp Glu Glu Ala Leu Thr Ser Leu Glu Leu Glu Leu Gly Leu His
325 330 335
Arg Val Arg Glu Leu Pro Glu Leu Phe Leu Gly Gln Ser Glu Phe Asp
340 345 350
Cys Phe Ser Asp Leu Gly Ser Ala Pro Pro Ala Gly Ser Val Ser Cys
355 360 365
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg
370 375 380
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val Glu
385 390 395 400
Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Ile
405 410 415
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
420 425 430
Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His Thr
435 440 445
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg
450 455 460
Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
465 470 475 480
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Gln
485 490 495
Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro
500 505 510
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His Leu
515 520 525
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
530 535 540
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
545 550 555 560
Lys Ile His Leu Arg Gln Lys Asp Lys
565
<210> 208
<211> 1755
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 208
atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60
gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120
cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180
ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240
cctcctccag ctgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300
gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360
gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420
gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480
ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540
ggctctgtgt cctgcggcgg cagcggcggc ggaagcggcg ccgaccacct gatgctcgcc 600
gagggctacc gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg 660
ctccggactc tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg 720
gctccgctgg ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg 780
ccgccgtcct ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac 840
ctgcagcctg tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga 900
ggccccccgg gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc 960
ctgggcggca tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag 1020
ctggggctgc accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac 1080
tgcttctcgg acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt 1140
ggtggttctg gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg 1200
cccagcaaga cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc 1260
cgcttctccc gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc 1320
ttccagtgcc gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc 1380
cgcacccaca caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg 1440
agcgatgaac ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct 1500
tgcccagtgg agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc 1560
cgcatccaca caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca 1620
agtggacatc tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac 1680
atctgtggaa gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg 1740
cggcagaagg acaag 1755
<210> 209
<211> 585
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 209
Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln
1 5 10 15
Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr
20 25 30
Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg
35 40 45
Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala
50 55 60
Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val
65 70 75 80
Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro
85 90 95
Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro
100 105 110
Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His
115 120 125
Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr
130 135 140
Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu
145 150 155 160
Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser
165 170 175
Ala Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg
195 200 205
Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr Leu
210 215 220
Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly
225 230 235 240
Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala Tyr
245 250 255
Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro
260 265 270
Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr
275 280 285
Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly
290 295 300
Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala
305 310 315 320
Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser
325 330 335
Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu
340 345 350
Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala
355 360 365
Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser Gly
370 375 380
Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg
385 390 395 400
Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val Glu
405 410 415
Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His Ile
420 425 430
Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
435 440 445
Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His Thr
450 455 460
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg
465 470 475 480
Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
485 490 495
Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Gln
500 505 510
Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly Gln Lys Pro
515 520 525
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His Leu
530 535 540
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
545 550 555 560
Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr
565 570 575
Lys Ile His Leu Arg Gln Lys Asp Lys
580 585
<210> 210
<211> 1113
<212> DNA
<213> Homo sapiens
<400> 210
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggaggaa gattcgaaat 480
aaaagatctg ctcaagagag ccgcaggaaa aagaaggtgt acgttggggg tttagagagc 540
cgggtcttga aatacacagc ccagaatatg gagcttcaga acaaagtaca gcttctggag 600
gaacagaatt tgtcccttct agatcaactg aggaaactcc aggccatggt gattgagatc 660
tcaaacaaaa ccagcagcag cagcacctgc atcttggtcc tgctagtctc cttctgcctc 720
ctccttgtac ctgctatgta ctcctctgac acaaggggga gcctgccagc tgagcatgga 780
gtgttgtccc gccagcttcg tgccctcccc agtgaggacc cttaccagct ggagctgcct 840
gccctgcagt cagaagtgcc gaaagacagc acacaccagt ggttggacgg ctcagactgt 900
gtactccagg cccctggcaa cacttcctgc ctgctgcatt acatgcctca ggctcccagt 960
gcagagcctc ccctggagtg gcccttccct gacctcttct cagagcctct ctgccgaggt 1020
cccatcctcc ccctgcaggc aaatctcaca aggaagggag gatggcttcc tactggtagc 1080
ccctctgtca ttttgcagga cagatactca ggc 1113
<210> 211
<211> 371
<212> PRT
<213> Homo sapiens
<400> 211
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Lys Ile Arg Asn
145 150 155 160
Lys Arg Ser Ala Gln Glu Ser Arg Arg Lys Lys Lys Val Tyr Val Gly
165 170 175
Gly Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu
180 185 190
Gln Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp
195 200 205
Gln Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser Asn Lys Thr
210 215 220
Ser Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser Phe Cys Leu
225 230 235 240
Leu Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro
245 250 255
Ala Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu
260 265 270
Asp Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys
275 280 285
Asp Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala
290 295 300
Pro Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser
305 310 315 320
Ala Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro
325 330 335
Leu Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys
340 345 350
Gly Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg
355 360 365
Tyr Ser Gly
370
<210> 212
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 212
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggctcga accaggtgaa 480
aaaccttaca aatgtcctga atgtgggaaa tcattcagtc gcagcgacaa cctggtgaga 540
catcaacgca cccatacagg agaaaaacct tataaatgtc cagaatgtgg aaagtccttc 600
tcacgagagg ataacttgca cactcatcaa cgaacacata ctggtgaaaa accatacaag 660
tgtcccgaat gtggtaaaag ttttagccgg agcgatgaac ttgtccgaca ccaacgaacc 720
catacaggcg agaagcctta caaatgtccc gagtgtggca agagcttctc acaatcaggg 780
aatctgactg agcatcaacg aactcatacc ggggaaaaac cttacaagtg tccagagtgt 840
gggaagagct tttccacaag tggacatctg gtacgccacc agaggacaca tacaggggag 900
aagccctaca aatgccccga atgcggtaaa agtttctctc agaatagtac cctgaccgaa 960
caccagcgaa cacacactgg gaaaaaaacg agtgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc 1200
cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg 1260
ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc 1320
ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta 1380
ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca 1440
gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc 1500
atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc 1560
tctgtcattt tgcaggacag atactcaggc 1590
<210> 213
<211> 530
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 213
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu Glu Pro Gly Glu
145 150 155 160
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp
165 170 175
Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
180 185 190
Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr
195 200 205
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
210 215 220
Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr
225 230 235 240
His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
245 250 255
Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu
260 265 270
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly
275 280 285
His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
290 295 300
Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Asn Ser Thr Leu Thr Glu
305 310 315 320
His Gln Arg Thr His Thr Gly Lys Lys Thr Ser Val Tyr Val Gly Gly
325 330 335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
340 345 350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
355 360 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser Asn Lys Thr Ser
370 375 380
Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser Phe Cys Leu Leu
385 390 395 400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro Ala
405 410 415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu Asp
420 425 430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys Asp
435 440 445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala Pro
450 455 460
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser Ala
465 470 475 480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro Leu
485 490 495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly
500 505 510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr
515 520 525
Ser Gly
530
<210> 214
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 214
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcttga gcccggagag 480
aagccgtaca agtgccctga gtgcggcaag tcttttagca gaagagacga acttaatgtc 540
caccagcgaa cgcatactgg tgaaaagccc tataaatgtc ctgaatgtgg gaaatcattc 600
tccagccgca gaacctgtag ggctcaccag cgaacacaca ccggcgaaaa accatacaaa 660
tgtccagaat gcgggaaatc cttttctcag tcatccaact tggtgagaca tcaacgcacg 720
cacactggag aaaagcctta caaatgcccg gaatgtggaa agtctttttc ccaattggcc 780
catttgcgag cccatcagag gactcacacg ggcgagaaac cttacaaatg cccggaatgc 840
gggaaatctt tttcaacgag tggcaacctc gtaagacacc aaagaacgca tacaggcgaa 900
aagccatata agtgtcctga gtgtggtaaa tcattctcac acaggaccac cctgacaaat 960
caccagcgca cgcacaccgg caagaagaca agcgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc 1200
cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg 1260
ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc 1320
ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta 1380
ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca 1440
gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc 1500
atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc 1560
tctgtcattt tgcaggacag atactcaggc 1590
<210> 215
<211> 530
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 215
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu Glu Pro Gly Glu
145 150 155 160
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Arg Asp
165 170 175
Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
180 185 190
Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Arg Arg Thr Cys Arg Ala
195 200 205
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
210 215 220
Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val Arg His Gln Arg Thr
225 230 235 240
His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
245 250 255
Ser Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu
260 265 270
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly
275 280 285
Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
290 295 300
Cys Pro Glu Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr Asn
305 310 315 320
His Gln Arg Thr His Thr Gly Lys Lys Thr Ser Val Tyr Val Gly Gly
325 330 335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
340 345 350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
355 360 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser Asn Lys Thr Ser
370 375 380
Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser Phe Cys Leu Leu
385 390 395 400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro Ala
405 410 415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu Asp
420 425 430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys Asp
435 440 445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala Pro
450 455 460
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser Ala
465 470 475 480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro Leu
485 490 495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly
500 505 510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr
515 520 525
Ser Gly
530
<210> 216
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 216
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcgccc ttacgcttgc 480
ccagtggagt cctgtgatcg ccgcttctcc cgcagcgaca acctggtgag acacatccgc 540
atccacacag gccagaagcc cttccagtgc cgcatctgca tgagaaactt cagccgagag 600
gataacttgc acactcacat ccgcacccac acaggcgaaa agcccttcgc ctgcgacatc 660
tgtggaagaa agtttgcccg gagcgatgaa cttgtccgac ataccaagat ccacttgcgg 720
cagaaggacc gcccttacgc ttgcccagtg gagtcctgtg atcgccgctt ctcccaatca 780
gggaatctga ctgagcacat ccgcatccac acaggccaga agcccttcca gtgccgcatc 840
tgcatgagaa acttcagcac aagtggacat ctggtacgcc acatccgcac ccacacaggc 900
gaaaagccct tcgcctgcga catctgtgga agaaagtttg cccagaatag taccctgacc 960
gaacatacca agatccactt gcggcagaag gacgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc 1200
cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg 1260
ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc 1320
ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta 1380
ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca 1440
gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc 1500
atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc 1560
tctgtcattt tgcaggacag atactcaggc 1590
<210> 217
<211> 530
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 217
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys
145 150 155 160
Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val
165 170 175
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile
180 185 190
Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg
195 200 205
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
210 215 220
Phe Ala Arg Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg
225 230 235 240
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg
245 250 255
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly
260 265 270
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser
275 280 285
Gly His Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
290 295 300
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr
305 310 315 320
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Val Tyr Val Gly Gly
325 330 335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
340 345 350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
355 360 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser Asn Lys Thr Ser
370 375 380
Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser Phe Cys Leu Leu
385 390 395 400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro Ala
405 410 415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu Asp
420 425 430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys Asp
435 440 445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala Pro
450 455 460
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser Ala
465 470 475 480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro Leu
485 490 495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly
500 505 510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr
515 520 525
Ser Gly
530
<210> 218
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 218
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcgccc ttacgcttgc 480
ccagtggagt cctgtgatcg ccgcttctcc cgctcagaca acctcgttcg acacatccgc 540
atccacacag gccagaagcc cttccagtgc cgcatctgca tgagaaactt cagccaccgg 600
actacactca cgaaccacat ccgcacccac acaggcgaaa agcccttcgc ctgcgacatc 660
tgtggaagaa agtttgccag agaagacaat ctccatactc ataccaagat ccacttgcgg 720
cagaaggacc gcccttacgc ttgcccagtg gagtcctgtg atcgccgctt ctccaccagc 780
cattctctca ctgaacacat ccgcatccac acaggccaga agcccttcca gtgccgcatc 840
tgcatgagaa acttcagcca gtctagctca ctggtgaggc acatccgcac ccacacaggc 900
gaaaagccct tcgcctgcga catctgtgga agaaagtttg ccagggagga taacctgcat 960
acgcatacca agatccactt gcggcagaag gacgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc 1200
cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg 1260
ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc 1320
ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta 1380
ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca 1440
gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc 1500
atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc 1560
tctgtcattt tgcaggacag atactcaggc 1590
<210> 219
<211> 530
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 219
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys
145 150 155 160
Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val
165 170 175
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile
180 185 190
Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg
195 200 205
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
210 215 220
Phe Ala Arg Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg
225 230 235 240
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg
245 250 255
Phe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly
260 265 270
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
275 280 285
Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
290 295 300
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His
305 310 315 320
Thr His Thr Lys Ile His Leu Arg Gln Lys Asp Val Tyr Val Gly Gly
325 330 335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
340 345 350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
355 360 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser Asn Lys Thr Ser
370 375 380
Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser Phe Cys Leu Leu
385 390 395 400
Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro Ala
405 410 415
Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu Asp
420 425 430
Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys Asp
435 440 445
Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala Pro
450 455 460
Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser Ala
465 470 475 480
Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro Leu
485 490 495
Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly
500 505 510
Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr
515 520 525
Ser Gly
530
<210> 220
<211> 1140
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 220
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggctcga accaggtgaa 480
aaaccttaca aatgtcctga atgtgggaaa tcattcagtc gcagcgacaa cctggtgaga 540
catcaacgca cccatacagg agaaaaacct tataaatgtc cagaatgtgg aaagtccttc 600
tcacgagagg ataacttgca cactcatcaa cgaacacata ctggtgaaaa accatacaag 660
tgtcccgaat gtggtaaaag ttttagccgg agcgatgaac ttgtccgaca ccaacgaacc 720
catacaggcg agaagcctta caaatgtccc gagtgtggca agagcttctc acaatcaggg 780
aatctgactg agcatcaacg aactcatacc ggggaaaaac cttacaagtg tccagagtgt 840
gggaagagct tttccacaag tggacatctg gtacgccacc agaggacaca tacaggggag 900
aagccctaca aatgccccga atgcggtaaa agtttctctc agaatagtac cctgaccgaa 960
caccagcgaa cacacactgg gaaaaaaacg agtgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatatca 1140
<210> 221
<211> 380
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 221
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu Glu Pro Gly Glu
145 150 155 160
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp
165 170 175
Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
180 185 190
Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr
195 200 205
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
210 215 220
Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr
225 230 235 240
His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
245 250 255
Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu
260 265 270
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly
275 280 285
His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
290 295 300
Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Asn Ser Thr Leu Thr Glu
305 310 315 320
His Gln Arg Thr His Thr Gly Lys Lys Thr Ser Val Tyr Val Gly Gly
325 330 335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
340 345 350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
355 360 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser
370 375 380
<210> 222
<211> 1140
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 222
atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60
ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg 120
ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc 180
ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc 240
tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag 300
gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta 360
gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca 420
cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcgccc ttacgcttgc 480
ccagtggagt cctgtgatcg ccgcttctcc cgcagcgaca acctggtgag acacatccgc 540
atccacacag gccagaagcc cttccagtgc cgcatctgca tgagaaactt cagccgagag 600
gataacttgc acactcacat ccgcacccac acaggcgaaa agcccttcgc ctgcgacatc 660
tgtggaagaa agtttgcccg gagcgatgaa cttgtccgac ataccaagat ccacttgcgg 720
cagaaggacc gcccttacgc ttgcccagtg gagtcctgtg atcgccgctt ctcccaatca 780
gggaatctga ctgagcacat ccgcatccac acaggccaga agcccttcca gtgccgcatc 840
tgcatgagaa acttcagcac aagtggacat ctggtacgcc acatccgcac ccacacaggc 900
gaaaagccct tcgcctgcga catctgtgga agaaagtttg cccagaatag taccctgacc 960
gaacatacca agatccactt gcggcagaag gacgtgtacg ttgggggttt agagagccgg 1020
gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa 1080
cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca 1140
<210> 223
<211> 380
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 223
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys
145 150 155 160
Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val
165 170 175
Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile
180 185 190
Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg
195 200 205
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
210 215 220
Phe Ala Arg Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg
225 230 235 240
Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg
245 250 255
Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr Gly
260 265 270
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser
275 280 285
Gly His Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
290 295 300
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr
305 310 315 320
Glu His Thr Lys Ile His Leu Arg Gln Lys Asp Val Tyr Val Gly Gly
325 330 335
Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln
340 345 350
Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln
355 360 365
Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser
370 375 380
<210> 224
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 224
Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu
1 5 10 15
Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg
20 25 30
Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp
35 40 45
Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu
50 55 60
Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr
65 70 75 80
Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser
85 90 95
Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu
100 105 110
Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser
115 120 125
Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr
130 135 140
Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg
145 150 155
<210> 225
<211> 199
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 225
Val Tyr Val Gly Gly Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln
1 5 10 15
Asn Met Glu Leu Gln Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu
20 25 30
Ser Leu Leu Asp Gln Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile
35 40 45
Ser Asn Lys Thr Ser Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val
50 55 60
Ser Phe Cys Leu Leu Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg
65 70 75 80
Gly Ser Leu Pro Ala Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala
85 90 95
Leu Pro Ser Glu Asp Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser
100 105 110
Glu Val Pro Lys Asp Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys
115 120 125
Val Leu Gln Ala Pro Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro
130 135 140
Gln Ala Pro Ser Ala Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu
145 150 155 160
Phe Ser Glu Pro Leu Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn
165 170 175
Leu Thr Arg Lys Gly Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile
180 185 190
Leu Gln Asp Arg Tyr Ser Gly
195
<210> 226
<211> 49
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 226
Val Tyr Val Gly Gly Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln
1 5 10 15
Asn Met Glu Leu Gln Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu
20 25 30
Ser Leu Leu Asp Gln Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile
35 40 45
Ser
Claims (206)
- 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함하는 발현 카세트이며, 여기서 비-자연 발생 전사 인자는 적어도 2개의 전사 활성화 도메인 (TAD)에 작동가능하게 연결된 DNA 결합 도메인 (DBD)을 포함하고 이들은 하기 방식: TAD1-TAD2-DBD, DBD-TAD3-TAD4 또는 TAD1-TAD2-DBD-TAD3-TAD4로 연결된 것인 발현 카세트.
- 제1항에 있어서, TAD1, TAD2, TAD3 및 TAD4가 하기: VP16, VP64, Viper, CITED2, CITED4, CREB3 또는 그의 기능적 단편으로부터 독립적으로 선택된 것인 발현 카세트.
- 제1항 또는 제2항에 있어서, TAD1 및 TAD2가 동일한 TAD인 발현 카세트.
- 제3항에 있어서, TAD1 및 TAD2가 CITED2 또는 그의 기능적 단편인 발현 카세트.
- 제3항에 있어서, TAD1 및 TAD2가 CITED4 또는 그의 기능적 단편인 발현 카세트.
- 제1항 내지 제5항 중 어느 한 항에 있어서, TAD3 및 TAD4가 동일한 TAD인 발현 카세트.
- 제6항에 있어서, TAD3 및 TAD4가 CITED2 또는 그의 기능적 단편인 발현 카세트.
- 제6항에 있어서, TAD3 및 TAD4가 CITED4 또는 그의 기능적 단편인 발현 카세트.
- 제1항 또는 제2항에 있어서, TAD1, TAD2, TAD3 및 TAD4가 동일한 TAD인 발현 카세트.
- 제9항에 있어서, TAD1, TAD2, TAD3 및 TAD4가 CITED2 또는 그의 기능적 단편인 발현 카세트.
- 제9항에 있어서, TAD1, TAD2, TAD3 및 TAD4가 CITED4 또는 그의 기능적 단편인 발현 카세트.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 적어도 2개의 TAD 도메인 사이에 링커가 없는 것인 발현 카세트.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 적어도 2개의 TAD 도메인 사이에 링커가 있는 것인 발현 카세트.
- 제13항에 있어서, 링커가 GGSGGGSG (서열식별번호: 177) 또는 GGSGGGSGGGSGGGSG (서열식별번호: 178)인 발현 카세트.
- 제1항 내지 제14항 중 어느 한 항에 있어서, DBD가 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제1항 내지 제15항 중 어느 한 항에 있어서, DBD가 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함하는 것인 발현 카세트.
- 제16항에 있어서, DBD가 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함하는 것인 발현 카세트.
- 제1항 내지 제15항 중 어느 한 항에 있어서, DBD 및 적어도 2개의 TAD가 각각 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함하는 것인 발현 카세트.
- 제18항에 있어서, DBD 및 적어도 2개의 TAD가 각각 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함하는 것인 발현 카세트.
- 제1항 내지 제15항 중 어느 한 항에 있어서, DBD가 가이드 RNA 및 뉴클레아제 불활성화된 Cas 단백질을 포함하는 것인 발현 카세트.
- 제20항에 있어서, 뉴클레아제 불활성화된 Cas 단백질이 뉴클레아제 불활성화된 Cas9인 발현 카세트.
- 제1항 내지 제19항 중 어느 한 항에 있어서, DBD가 아연 핑거 도메인을 포함하는 것인 발현 카세트.
- 제22항에 있어서, DBD가 6 내지 9개의 아연 핑거 도메인을 포함하는 것인 발현 카세트.
- 제23항에 있어서, DBD가 6개의 아연 핑거를 포함하는 것인 발현 카세트.
- 제24항에 있어서, DBD가 18개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제23항에 있어서, DBD가 9개의 아연 핑거를 포함하는 것인 발현 카세트.
- 제26항에 있어서, DBD가 27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제1항 내지 제19항 및 제22항 내지 제27항 중 어느 한 항에 있어서, DBD가 서열식별번호: 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제28항에 있어서, DBD가 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함하는 것인 발현 카세트.
- 제1항 내지 제19항 및 제22항 내지 제29항 중 어느 한 항에 있어서, DBD가 인간 EGR1 또는 인간 EGR3으로부터 유래된 것인 발현 카세트.
- 제1항 내지 제19항 및 제22항 내지 제30항 중 어느 한 항에 있어서, DBD가 서열식별번호: 77-98 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제31항에 있어서, DBD가 서열식별번호: 77-98을 포함하는 것인 발현 카세트.
- 제1항에 있어서, DBD가 서열식별번호: 92에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제33항에 있어서, DBD가 서열식별번호: 92를 포함하는 것인 발현 카세트.
- 제1항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 130 또는 131에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제35항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 130 또는 131을 포함하는 것인 발현 카세트.
- 제1항에 있어서, 서열식별번호: 72 또는 73 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제37항에 있어서, 서열식별번호: 72 또는 73 중 어느 하나의 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 다른 세포 유형에서보다 PV 뉴런에서 더 높은 수준으로 전사 인자의 발현을 구동하는 조절 요소를 추가로 포함하는 발현 카세트.
- 제39항에 있어서, 조절 요소가 서열식별번호: 1-4 중 어느 하나를 포함하는 것인 발현 카세트.
- 제40항에 있어서, 조절 요소가 서열식별번호: 2 또는 3을 포함하는 것인 발현 카세트.
- 제1항 내지 제41항 중 어느 한 항에 있어서, PV 선택적 마이크로RNA 결합 부위를 추가로 포함하는 발현 카세트.
- 제42항에 있어서, PV 선택적 마이크로RNA 결합 부위가 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일성을 포함하는 것인 발현 카세트.
- 제43항에 있어서, PV 선택적 마이크로RNA 결합 부위가 서열식별번호: 7, 14 또는 15 중 어느 하나를 포함하는 것인 발현 카세트.
- 제1항 내지 제44항 중 어느 한 항에 있어서, 바이러스 벡터의 일부인 발현 카세트.
- 제45항에 있어서, 바이러스 벡터가 AAV 바이러스인 발현 카세트.
- 제46항에 있어서, AAV 바이러스가 AAV9 바이러스 또는 scAAV9 바이러스인 발현 카세트.
- 제45항에 있어서, 바이러스 벡터가 렌티바이러스인 발현 카세트.
- 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함하는 발현 카세트이며, 여기서 비-자연 발생 전사 인자는 전사 활성화 도메인에 작동가능하게 연결된 DNA 결합 도메인을 포함하고, 여기서 DNA 결합 도메인은 서열 LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (서열식별번호: 147)를 포함하는 아연 핑거 단백질이고, DNA 결합 도메인과 전사 활성화 도메인 사이에 HA 태그 (서열식별번호: 171)가 없는 것인 발현 카세트.
- 제49항에 있어서, 전사 활성화 도메인이 VP16, VPR 또는 VP64 서열 또는 그의 기능적 단편을 포함하는 것인 발현 카세트.
- 제50항에 있어서, 전사 활성화 도메인이 VP64를 포함하는 것인 발현 카세트.
- 제49항 내지 제51항 중 어느 한 항에 있어서, DNA 결합 도메인이 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제49항 내지 제52항 중 어느 한 항에 있어서, n = 6 내지 9인 발현 카세트.
- 제53항에 있어서, n = 6인 발현 카세트.
- 제54항에 있어서, DNA 결합 도메인이 18개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제53항에 있어서, n = 9인 발현 카세트.
- 제56항에 있어서, DNA 결합 도메인이 27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제49항 내지 제57항 중 어느 한 항에 있어서, DNA 결합 도메인이 서열식별번호: 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제58항에 있어서, DNA 결합 도메인이 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함하는 것인 발현 카세트.
- 제49항 내지 제59항 중 어느 한 항에 있어서, DNA 결합 도메인이 서열식별번호: 77-91 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제60항에 있어서, DNA 결합 도메인이 서열식별번호: 77-91 중 어느 하나를 포함하는 것인 발현 카세트.
- 제49항 내지 제61항 중 어느 한 항에 있어서, 다른 세포 유형에서보다 PV 뉴런에서 더 높은 수준으로 전사 인자의 발현을 구동하는 조절 요소를 추가로 포함하는 발현 카세트.
- 제62항에 있어서, 조절 요소가 서열식별번호: 1-4 중 어느 하나를 포함하는 것인 발현 카세트.
- 제63항에 있어서, 조절 요소가 서열식별번호: 2 또는 3을 포함하는 것인 발현 카세트.
- 제49항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 127에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제65항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 127을 포함하는 것인 발현 카세트.
- 제49항에 있어서, 서열식별번호: 70 또는 71 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제67항에 있어서, 서열식별번호: 70 또는 71 중 어느 하나의 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제1항 내지 제68항 중 어느 한 항에 있어서, PV 선택적 마이크로RNA 결합 부위를 추가로 포함하는 발현 카세트.
- 제69항에 있어서, PV 선택적 마이크로RNA 결합 부위가 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일성을 포함하는 것인 발현 카세트.
- 제70항에 있어서, PV 선택적 마이크로RNA 결합 부위가 서열식별번호: 7, 14 또는 15 중 어느 하나를 포함하는 것인 발현 카세트.
- 제49항 내지 제71항 중 어느 한 항에 있어서, 바이러스 벡터의 일부인 발현 카세트.
- 제72항에 있어서, 바이러스 벡터가 AAV 바이러스인 발현 카세트.
- 제73항에 있어서, AAV 바이러스가 AAV9 바이러스 또는 scAAV9 바이러스인 발현 카세트.
- 제72항에 있어서, 바이러스 벡터가 렌티바이러스인 발현 카세트.
- 서열식별번호: 14 또는 15에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 PV 선택적 마이크로RNA 결합 부위를 포함하는 폴리뉴클레오티드이며, 여기서 마이크로RNA 결합 부위는 흥분성 뉴런에서 트랜스진의 발현을 감소시키는 것인 폴리뉴클레오티드.
- 제76항에 있어서, PV 선택적 마이크로RNA 결합 부위가 서열식별번호: 14를 포함하는 것인 폴리뉴클레오티드.
- 제76항에 있어서, PV 선택적 마이크로RNA 결합 부위가 서열식별번호: 15를 포함하는 것인 폴리뉴클레오티드.
- 제76항 내지 제78항 중 어느 한 항의 PV 선택적 마이크로RNA 결합 부위 및 프로모터 및/또는 인핸서를 포함하는 발현 카세트.
- 제79항에 있어서, 프로모터 및/또는 인핸서가 다른 세포 유형에서보다 파르브알부민 (PV) 뉴런에서 더 높은 수준으로 트랜스진의 발현을 구동하는 PV 선택적 조절 요소인 발현 카세트.
- 제80항에 있어서, PV 선택적 조절 요소가 트랜스진에 작동가능하게 연결된 것인 발현 카세트.
- 트랜스진에 작동가능하게 연결된 조절 요소 및 적어도 1개의 마이크로RNA 결합 부위를 포함하는 발현 카세트이며, 여기서 조절 요소는 다른 세포 유형에서보다 파르브알부민 (PV) 뉴런에서 더 높은 수준으로 트랜스진의 발현을 구동하고, 여기서 마이크로RNA 결합 부위는 흥분성 뉴런에서 트랜스진의 발현을 감소시키고, 여기서 발현 카세트는 서열식별번호: 67을 포함하지 않는 것인 발현 카세트.
- 제82항에 있어서, 마이크로RNA 결합 부위가 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위를 포함하는 것인 발현 카세트.
- 제82항 또는 제83항에 있어서, 마이크로RNA 결합 부위가 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함하는 것인 발현 카세트.
- 제82항 내지 제84항 중 어느 한 항에 있어서, 마이크로RNA 결합 부위가 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함하는 것인 발현 카세트.
- 제82항에 있어서, 마이크로RNA 결합 부위가 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위 및 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함하는 것인 발현 카세트.
- 제82항에 있어서, 마이크로RNA 결합 부위가 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위, MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위 및 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함하는 것인 발현 카세트.
- 제82항 내지 제84항 중 어느 한 항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제88항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 7을 포함하는 것인 발현 카세트.
- 제89항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 14를 포함하는 것인 발현 카세트.
- 제89항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 15를 포함하는 것인 발현 카세트.
- 제81항 내지 제91항 중 어느 한 항에 있어서, 트랜스진이 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 포함하는 폴리펩티드를 코딩하는 것인 발현 카세트.
- 제92항에 있어서, 전사 인자가 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제92항 또는 제93항에 있어서, 전사 인자가 DNA 결합 도메인을 포함하는 것인 발현 카세트.
- 제92항 내지 제94항 중 어느 한 항에 있어서, 전사 인자가 DNA 결합 도메인 및 전사 활성화 도메인을 포함하는 것인 발현 카세트.
- 제92항 내지 제95항 중 어느 한 항에 있어서, DNA 결합 도메인이 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함하는 것인 발현 카세트.
- 제96항에 있어서, DNA 결합 도메인이 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함하는 것인 발현 카세트.
- 제92항 내지 제96항 중 어느 한 항에 있어서, DNA 결합 도메인 및 전사 활성화 도메인이 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함하는 것인 발현 카세트.
- 제98항에 있어서, DNA 결합 도메인 및 전사 활성화 도메인이 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함하는 것인 발현 카세트.
- 제92항 내지 제95항 중 어느 한 항에 있어서, DNA 결합 도메인이 가이드 RNA 및 뉴클레아제 불활성화된 Cas 단백질을 포함하는 것인 발현 카세트.
- 제100항에 있어서, 뉴클레아제 불활성화된 Cas 단백질이 뉴클레아제 불활성화된 Cas9인 발현 카세트.
- 제92항 내지 제99항 중 어느 한 항에 있어서, DNA 결합 도메인이 아연 핑거 도메인을 포함하는 것인 발현 카세트.
- 제102항에 있어서, DNA 결합 도메인이 6 내지 9개의 아연 핑거 도메인을 포함하는 것인 발현 카세트.
- 제103항에 있어서, DNA 결합 도메인이 6개의 아연 핑거를 포함하는 것인 발현 카세트.
- 제104항에 있어서, DNA 결합 도메인이 18개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제103항에 있어서, DNA 결합 도메인이 9개의 아연 핑거를 포함하는 것인 발현 카세트.
- 제106항에 있어서, DNA 결합 도메인이 27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 발현 카세트.
- 제92항 내지 제99항 및 제102항 내지 제107항 중 어느 한 항에 있어서, DNA 결합 도메인이 서열식별번호: 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제108항에 있어서, DNA 결합 도메인이 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함하는 것인 발현 카세트.
- 제92항 내지 제99항 및 제102항 내지 제109항 중 어느 한 항에 있어서, DNA 결합 도메인이 서열식별번호: 92-98 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제110항에 있어서, DNA 결합 도메인이 서열식별번호: 92-98 중 어느 하나를 포함하는 것인 발현 카세트.
- 제92항 내지 제99항 및 제102항 내지 제111항 중 어느 한 항에 있어서, DNA 결합 도메인이 서열 LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (서열식별번호: 147)를 포함하는 아연 핑거 단백질인 발현 카세트.
- 제111항 또는 제112항에 있어서, DNA 결합 도메인이 서열식별번호: 77-91 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제113항에 있어서, DNA 결합 도메인이 서열식별번호: 77-91 중 어느 하나를 포함하는 것인 발현 카세트.
- 제92항 내지 제99항 및 제102항 내지 제111항 중 어느 한 항에 있어서, DNA 결합 도메인이 인간 EGR1 또는 인간 EGR3으로부터 유래된 것인 발현 카세트.
- 제95항 내지 제99항 중 어느 한 항에 있어서, 전사 활성화 도메인이 VP16, VPR, VP64, CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함하는 것인 발현 카세트.
- 제92항 내지 제99항 중 어느 한 항에 있어서, 전사 활성화 도메인이 인간 CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함하는 것인 발현 카세트.
- 제81항 내지 제117항 중 어느 한 항에 있어서, 조절 요소가 서열식별번호: 1-4 중 어느 하나를 갖는 서열을 포함하는 것인 발현 카세트.
- 제118항에 있어서, 조절 요소가 서열식별번호: 2 또는 3을 갖는 서열을 포함하는 것인 발현 카세트.
- 제81항 또는 제82항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 105, 106 및 127-129 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제120항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 105, 106 및 127-129 중 어느 하나를 포함하는 것인 발현 카세트.
- 제81항, 제82항 및 제120항 중 어느 한 항에 있어서, 트랜스진이 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인 발현 카세트.
- 제122항에 있어서, 트랜스진이 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나를 포함하는 것인 발현 카세트.
- 제81항 내지 제123항 중 어느 한 항에 있어서, 바이러스 벡터의 일부인 발현 카세트.
- 제124항에 있어서, 바이러스 벡터가 AAV 바이러스인 발현 카세트.
- 제125항에 있어서, AAV 바이러스가 AAV9 바이러스 또는 scAAV9 바이러스인 발현 카세트.
- 제124항에 있어서, 바이러스 벡터가 렌티바이러스인 발현 카세트.
- 영장류에게 트랜스진 및 적어도 1개의 마이크로RNA 결합 부위를 포함하는 바이러스 벡터를 투여하는 것을 포함하며, 여기서 마이크로RNA 결합 부위는 흥분성 뉴런에서 트랜스진의 발현을 감소시키는 것인, 영장류의 파르브알부민 (PV) 뉴런에서의 트랜스진의 선택적 발현을 위한 방법.
- 제128항에 있어서, 바이러스 벡터가 트랜스진에 작동가능하게 연결된 조절 요소를 추가로 포함하고, 여기서 조절 요소는 다른 세포 유형에서보다 파르브알부민 (PV) 뉴런에서 더 높은 수준으로 트랜스진의 발현을 구동하는 것인 방법.
- 제128항 또는 제129항에 있어서, 마이크로RNA 결합 부위가 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위를 포함하는 것인 방법.
- 제128항 내지 제130항 중 어느 한 항에 있어서, 마이크로RNA 결합 부위가 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함하는 것인 방법.
- 제128항 내지 제131항 중 어느 한 항에 있어서, 마이크로RNA 결합 부위가 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함하는 것인 방법.
- 제128항에 있어서, 마이크로RNA 결합 부위가 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위 및 MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위를 포함하는 것인 방법.
- 제128항에 있어서, 마이크로RNA 결합 부위가 MIR128 (서열식별번호: 9)에 대한 적어도 1개의 결합 부위, MIR221 (서열식별번호: 11)에 대한 적어도 1개의 결합 부위 및 MIR222 (서열식별번호: 13)에 대한 적어도 1개의 결합 부위를 포함하는 것인 방법.
- 제128항 내지 제134항 중 어느 한 항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 7, 14 또는 15 중 어느 하나에 대해 적어도 90% 동일한 서열을 포함하는 것인 방법.
- 제135항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 7을 포함하는 것인 방법.
- 제135항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 14를 포함하는 것인 방법.
- 제135항에 있어서, 마이크로RNA 결합 부위가 서열식별번호: 15를 포함하는 것인 방법.
- 제128항 내지 제138항 중 어느 한 항에 있어서, 트랜스진이 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함하는 것인 방법.
- 제139항에 있어서, 전사 인자가 18-27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 방법.
- 제139항 또는 제140항에 있어서, 전사 인자가 DNA 결합 도메인을 포함하는 것인 방법.
- 제139항 내지 제141항 중 어느 한 항에 있어서, 전사 인자가 DNA 결합 도메인 및 전사 활성화 도메인을 포함하는 것인 방법.
- 제139항 내지 제142항 중 어느 한 항에 있어서, DNA 결합 도메인이 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함하는 것인 방법.
- 제143항에 있어서, DNA 결합 도메인이 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함하는 것인 방법.
- 제142항 또는 제143항에 있어서, DNA 결합 도메인 및 전사 활성화 도메인이 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 80% 서열 동일성을 포함하는 것인 방법.
- 제145항에 있어서, DNA 결합 도메인 및 전사 활성화 도메인이 둘 다 그의 가장 가까운 인간 대응물에 대해 적어도 90% 서열 동일성을 포함하는 것인 방법.
- 제139항 내지 제142항 중 어느 한 항에 있어서, DNA 결합 도메인이 가이드 RNA 및 뉴클레아제 불활성화된 Cas 단백질을 포함하는 것인 방법.
- 제147항에 있어서, 뉴클레아제 불활성화된 Cas 단백질이 뉴클레아제 불활성화된 Cas9인 방법.
- 제139항 내지 제146항 중 어느 한 항에 있어서, DNA 결합 도메인이 아연 핑거 도메인을 포함하는 것인 방법.
- 제149항에 있어서, DNA 결합 도메인이 6 내지 9개의 아연 핑거 도메인을 포함하는 것인 방법.
- 제150항에 있어서, DNA 결합 도메인이 6개의 아연 핑거를 포함하는 것인 방법.
- 제151항에 있어서, DNA 결합 도메인이 18개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 방법.
- 제150항에 있어서, DNA 결합 도메인이 9개의 아연 핑거를 포함하는 것인 방법.
- 제153항에 있어서, DNA 결합 도메인이 27개의 뉴클레오티드를 갖는 게놈 영역에 결합하는 것인 방법.
- 제139항 내지 제146항 및 제149항 내지 제154항 중 어느 한 항에 있어서, DNA 결합 도메인이 148-151 중 어느 것에 대해 적어도 95% 서열 동일성을 갖는 서열을 포함하는 것인 방법.
- 제155항에 있어서, DNA 결합 도메인이 서열식별번호: 148-151 중 어느 하나를 갖는 서열을 포함하는 것인 방법.
- 제139항 내지 제146항 및 제149항 내지 제156항 중 어느 한 항에 있어서, DNA 결합 도메인이 인간 EGR1 또는 인간 EGR3으로부터 유래된 것인 방법.
- 제139항 내지 제146항 및 제149항 내지 제157항 중 어느 한 항에 있어서, DNA 결합 도메인이 서열식별번호: 92-98 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 방법.
- 제158항에 있어서, DNA 결합 도메인이 서열식별번호: 92-98 중 어느 하나를 포함하는 것인 방법.
- 제139항 내지 제146항 및 제149항 내지 제156항 중 어느 한 항에 있어서, DNA 결합 도메인이 서열 LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (서열식별번호: 147)를 포함하는 아연 핑거 단백질인 방법.
- 제160항에 있어서, DNA 결합 도메인이 서열식별번호: 77-91 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 방법.
- 제161항에 있어서, DNA 결합 도메인이 서열식별번호: 77-91 중 어느 하나를 포함하는 것인 방법.
- 제142항 내지 제162항 중 어느 한 항에 있어서, 전사 활성화 도메인이 VP16, VPR, VP64, CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함하는 것인 방법.
- 제163항에 있어서, 전사 활성화 도메인이 인간 CITED2, CITED4 또는 CREB3 서열 또는 그의 기능적 단편을 포함하는 것인 방법.
- 제128항 내지 제164항 중 어느 한 항에 있어서, 조절 요소가 서열식별번호: 1-4 중 어느 하나를 갖는 서열을 포함하는 것인 방법.
- 제165항에 있어서, 조절 요소가 서열식별번호: 2 또는 3을 갖는 서열을 포함하는 것인 방법.
- 제139항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 105, 106 및 127-129 중 어느 하나에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 방법.
- 제167항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 105, 106 및 127-129 중 어느 하나를 포함하는 것인 방법.
- 제139항에 있어서, 트랜스진이 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인 방법.
- 제169항에 있어서, 트랜스진이 서열식별번호: 71, 74, 75, 76 또는 184 중 어느 하나를 포함하는 것인 방법.
- 제128항 내지 제170항 중 어느 한 항에 있어서, 바이러스 벡터가 AAV 바이러스인 방법.
- 제171항에 있어서, AAV 바이러스가 AAV9 바이러스 또는 scAAV9 바이러스인 방법.
- 제128항 내지 제170항 중 어느 한 항에 있어서, 바이러스 벡터가 렌티바이러스인 방법.
- 제128항 내지 제173항 중 어느 한 항에 있어서, 영장류가 인간인 방법.
- 제128항 내지 제173항 중 어느 한 항에 있어서, 영장류가 비-인간 영장류인 방법.
- 제175항에 있어서, 비-인간 영장류가 구세계 원숭이, 오랑우탄, 고릴라, 침팬지, 마모셋, 게잡이 마카크, 레서스 마카크 또는 돼지-꼬리 마카크인 방법.
- 세포에서 SCN1A 유전자의 발현을 증가시키는 비-자연 발생 전사 인자를 코딩하는 서열을 포함하는 발현 카세트이며, 여기서 비-자연 발생 전사 인자는 서열식별번호: 128 또는 129에 대해 적어도 90% 동일성을 갖는 서열을 포함하는 것인 발현 카세트.
- 제177항에 있어서, 비-자연 발생 전사 인자가 서열식별번호: 128 또는 129를 포함하는 것인 발현 카세트.
- 제1항 내지 제127항, 제177항 및 제178항 중 어느 한 항의 발현 카세트를 투여함으로써 세포에서 SCN1A의 발현을 증가시키는 방법.
- 제179항에 있어서, 세포가 PV 뉴런인 방법.
- 제179항 또는 제180항에 있어서, 세포가 대상체 내의 세포인 방법.
- 제181항에 있어서, 대상체가 포유동물인 방법.
- 제182항에 있어서, 대상체가 인간인 방법.
- 제179항 내지 제183항 중 어느 한 항에 있어서, SCN1A의 발현을 증가시키는 것이 질환, 장애 또는 증상을 치료하는 것인 방법.
- 제184항에 있어서, 장애가 중추 신경계 장애인 방법.
- 제185항에 있어서, 장애가 SCN1A 반수체기능부전과 연관된 간질인 방법.
- 제186항에 있어서, 반수체기능부전이, 대상체가 SCN1A 유전자의 기능 상실 돌연변이에 대해 이형접합인 결과인 방법.
- 제187항에 있어서, 장애가 SCN1A 유전자 내의 삽입, 결실, 역위 또는 치환과 연관된 간질인 방법.
- 제188항에 있어서, 장애가 SCN1A 유전자 내의 점 돌연변이와 연관된 간질인 방법.
- 제186항 내지 제189항 중 어느 한 항에 있어서, 장애가 드라베 증후군인 방법.
- 제185항 내지 제190항 중 어느 한 항에 있어서, 중추 신경계 장애의 증상이 뉴런 과다활성인 방법.
- 제191항에 있어서, 중추 신경계 장애를 치료하는 것이 뉴런 과다활성을 감소시키는 것을 포함하는 것인 방법.
- 제185항 내지 제190항 중 어느 한 항에 있어서, 중추 신경계 장애의 증상이 발작인 방법.
- 제193항에 있어서, 중추 신경계 장애를 치료하는 것이 발작의 빈도를 감소시키는 것을 포함하는 것인 방법.
- 제193항 또는 제194항에 있어서, 중추 신경계 장애를 치료하는 것이 발작의 중증도를 감소시키는 것을 포함하는 것인 방법.
- 제179항에 있어서, 세포가 뉴런 세포인 방법.
- 제196항에 있어서, 뉴런 세포가 단극, 양극, 다극 또는 가단극 뉴런으로 이루어진 군으로부터 선택된 것인 방법.
- 제196항에 있어서, 세포가 GABA성 뉴런인 방법.
- 제179항에 있어서, 세포가 비-뉴런 세포인 방법.
- 제199항에 있어서, 세포가 신경교 세포인 방법.
- 제200항에 있어서, 신경교 세포가 성상세포, 핍지교세포, 상의 세포, 슈반 세포 및 위성 세포로 이루어진 군으로부터 선택된 것인 방법.
- 제1항 내지 제127항, 제177항 및 제178항 중 어느 한 항의 발현 카세트를 투여함으로써 CNS에서 SCN1A의 발현을 증가시키는 방법.
- 제202항에 있어서, SCN1A의 증가된 발현이 뇌에서 발생하는 것인 방법.
- 제203항에 있어서, SCN1A의 증가된 발현이 전두 피질, 두정 피질, 측두 피질, 해마, 수질 및/또는 후두 피질에서 발생하는 것인 방법.
- 제202항에 있어서, SCN1A의 증가된 발현이 척추에서 발생하는 것인 방법.
- 제205항에 있어서, SCN1A의 증가된 발현이 척수 및/또는 후근 신경절에서 발생하는 것인 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962854238P | 2019-05-29 | 2019-05-29 | |
US62/854,238 | 2019-05-29 | ||
US201962857727P | 2019-06-05 | 2019-06-05 | |
US62/857,727 | 2019-06-05 | ||
US202063008569P | 2020-04-10 | 2020-04-10 | |
US63/008,569 | 2020-04-10 | ||
PCT/US2020/035431 WO2020243651A1 (en) | 2019-05-29 | 2020-05-29 | Compositions and methods for selective gene regulation |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220066225A true KR20220066225A (ko) | 2022-05-24 |
Family
ID=73552430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217043048A KR20220066225A (ko) | 2019-05-29 | 2020-05-29 | 선택적 유전자 조절을 위한 조성물 및 방법 |
Country Status (15)
Country | Link |
---|---|
US (1) | US20220136009A1 (ko) |
EP (1) | EP3976798A4 (ko) |
JP (1) | JP7432621B2 (ko) |
KR (1) | KR20220066225A (ko) |
CN (1) | CN114174520A (ko) |
AU (2) | AU2020282352B2 (ko) |
BR (1) | BR112021024055A2 (ko) |
CA (1) | CA3141900C (ko) |
CL (1) | CL2021003151A1 (ko) |
CO (1) | CO2021017544A2 (ko) |
IL (1) | IL288313A (ko) |
MX (1) | MX2021014460A (ko) |
SG (1) | SG11202113048SA (ko) |
TW (1) | TW202113084A (ko) |
WO (1) | WO2020243651A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3083765A1 (en) | 2017-12-01 | 2019-06-06 | Encoded Therapeutics, Inc. | Engineered dna binding proteins |
US11149256B2 (en) | 2018-09-26 | 2021-10-19 | California Institute Of Technology | Adeno-associated virus compositions for targeted gene therapy |
SG11202111195VA (en) * | 2019-04-12 | 2021-11-29 | Encoded Therapeutics Inc | Compositions and methods for administration of therapeutics |
CN117980484A (zh) * | 2021-09-16 | 2024-05-03 | 诺华股份有限公司 | 新颖的转录因子 |
EP4151736A1 (en) * | 2021-09-21 | 2023-03-22 | SVAR Life Science AB | Novel system for the quantification of anti-aav neutralizing antibodies |
EP4457352A1 (en) * | 2021-12-30 | 2024-11-06 | Regel Therapeutics, Inc. | Compositions for modulating expression of sodium voltage-gated channel alpha subunit 1 and uses thereof |
CN114507693A (zh) * | 2022-02-09 | 2022-05-17 | 中国人民解放军陆军军医大学第一附属医院 | 重组腺相关病毒表达载体及其应用 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2046806A4 (en) * | 2006-07-05 | 2009-10-21 | Scripps Research Inst | CHIMERIC RECOMBINASES WITH ZINC FINGERS OPTIMIZED FOR CATALYSIS BY DIRECT EVOLUTION |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US20190127713A1 (en) * | 2016-04-13 | 2019-05-02 | Duke University | Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use |
US20180126003A1 (en) * | 2016-05-04 | 2018-05-10 | Curevac Ag | New targets for rna therapeutics |
WO2018049075A1 (en) * | 2016-09-07 | 2018-03-15 | Flagship Pioneering, Inc. | Methods and compositions for modulating gene expression |
JP2018088888A (ja) | 2016-12-06 | 2018-06-14 | 国立研究開発法人理化学研究所 | Scn1a遺伝子の発現増強法 |
EA201992358A1 (ru) * | 2017-04-03 | 2020-03-24 | Инкоудид Терапьютикс, Инк. | Тканеселективная экспрессия трансгена |
CN107759673B (zh) * | 2017-09-27 | 2021-06-04 | 复旦大学 | 可对hbv的dna进行表观甲基化修饰的蛋白分子及其应用 |
CA3083765A1 (en) * | 2017-12-01 | 2019-06-06 | Encoded Therapeutics, Inc. | Engineered dna binding proteins |
WO2019224864A1 (ja) * | 2018-05-21 | 2019-11-28 | 国立研究開発法人理化学研究所 | Scn1a遺伝子の発現増強法とそれによるドラベ症候群の治療法 |
-
2020
- 2020-05-29 JP JP2021570376A patent/JP7432621B2/ja active Active
- 2020-05-29 CA CA3141900A patent/CA3141900C/en active Active
- 2020-05-29 MX MX2021014460A patent/MX2021014460A/es unknown
- 2020-05-29 KR KR1020217043048A patent/KR20220066225A/ko not_active Application Discontinuation
- 2020-05-29 EP EP20815541.6A patent/EP3976798A4/en active Pending
- 2020-05-29 CN CN202080054248.XA patent/CN114174520A/zh active Pending
- 2020-05-29 BR BR112021024055A patent/BR112021024055A2/pt unknown
- 2020-05-29 AU AU2020282352A patent/AU2020282352B2/en active Active
- 2020-05-29 WO PCT/US2020/035431 patent/WO2020243651A1/en active Application Filing
- 2020-05-29 TW TW109118224A patent/TW202113084A/zh unknown
- 2020-05-29 SG SG11202113048SA patent/SG11202113048SA/en unknown
-
2021
- 2021-11-10 US US17/523,627 patent/US20220136009A1/en active Pending
- 2021-11-22 IL IL288313A patent/IL288313A/en unknown
- 2021-11-26 CL CL2021003151A patent/CL2021003151A1/es unknown
- 2021-12-21 CO CONC2021/0017544A patent/CO2021017544A2/es unknown
-
2023
- 2023-07-10 AU AU2023204555A patent/AU2023204555A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2020282352B2 (en) | 2023-05-18 |
CN114174520A (zh) | 2022-03-11 |
EP3976798A1 (en) | 2022-04-06 |
SG11202113048SA (en) | 2021-12-30 |
BR112021024055A2 (pt) | 2022-02-08 |
TW202113084A (zh) | 2021-04-01 |
IL288313A (en) | 2022-01-01 |
JP7432621B2 (ja) | 2024-02-16 |
CO2021017544A2 (es) | 2022-01-17 |
CA3141900A1 (en) | 2020-12-03 |
AU2020282352A1 (en) | 2021-12-23 |
AU2023204555A1 (en) | 2023-08-03 |
US20220136009A1 (en) | 2022-05-05 |
EP3976798A4 (en) | 2023-07-12 |
WO2020243651A1 (en) | 2020-12-03 |
CA3141900C (en) | 2023-06-06 |
MX2021014460A (es) | 2022-02-11 |
JP2022535749A (ja) | 2022-08-10 |
CL2021003151A1 (es) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI835761B (zh) | 工程化dna結合蛋白 | |
CN107438671B (zh) | 变体RNAi | |
KR20220066225A (ko) | 선택적 유전자 조절을 위한 조성물 및 방법 | |
TW202428875A (zh) | 用於靶向cyp4v2基因及治療結晶樣視網膜色素變性之核酸分子 | |
US20220193264A1 (en) | Compositions and methods for treating laminopathies | |
CN112639108A (zh) | 治疗非综合征性感觉神经性听力损失的方法 | |
KR20220007601A (ko) | 치료제 투여를 위한 조성물 및 방법 | |
TW202229321A (zh) | 核酸構築體、病毒載體及病毒顆粒 | |
EA046157B1 (ru) | Композиции и способы селективной регуляции экспрессии генов | |
TW202421789A (zh) | 用於去靶向背根神經節及/或肝臟中之基因表現的元件 | |
CN117836420A (zh) | 重组tert编码病毒基因组和运载体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |