CN101389214A - 具有基因修饰免疫系统的有蹄类动物 - Google Patents
具有基因修饰免疫系统的有蹄类动物 Download PDFInfo
- Publication number
- CN101389214A CN101389214A CNA2005800441766A CN200580044176A CN101389214A CN 101389214 A CN101389214 A CN 101389214A CN A2005800441766 A CNA2005800441766 A CN A2005800441766A CN 200580044176 A CN200580044176 A CN 200580044176A CN 101389214 A CN101389214 A CN 101389214A
- Authority
- CN
- China
- Prior art keywords
- nucleotide sequence
- gene
- ungulate
- cell
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000000987 immune system Anatomy 0.000 title description 5
- 108060003951 Immunoglobulin Proteins 0.000 claims abstract description 196
- 102000018358 immunoglobulin Human genes 0.000 claims abstract description 196
- 238000000034 method Methods 0.000 claims abstract description 122
- 241001465754 Metazoa Species 0.000 claims abstract description 116
- 230000014509 gene expression Effects 0.000 claims abstract description 102
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 39
- 210000000056 organ Anatomy 0.000 claims abstract description 23
- 108090000623 proteins and genes Proteins 0.000 claims description 367
- 210000004027 cell Anatomy 0.000 claims description 301
- 241000282898 Sus scrofa Species 0.000 claims description 222
- 108700005091 Immunoglobulin Genes Proteins 0.000 claims description 175
- 210000004507 artificial chromosome Anatomy 0.000 claims description 169
- 239000002773 nucleotide Substances 0.000 claims description 164
- 125000003729 nucleotide group Chemical group 0.000 claims description 162
- 239000012634 fragment Substances 0.000 claims description 150
- 108020004414 DNA Proteins 0.000 claims description 117
- 210000000349 chromosome Anatomy 0.000 claims description 92
- 230000008521 reorganization Effects 0.000 claims description 90
- 230000009261 transgenic effect Effects 0.000 claims description 85
- 108010044091 Globulins Proteins 0.000 claims description 81
- 239000000427 antigen Substances 0.000 claims description 56
- 108091007433 antigens Proteins 0.000 claims description 56
- 102000036639 antigens Human genes 0.000 claims description 56
- 210000001106 artificial yeast chromosome Anatomy 0.000 claims description 55
- 108010052160 Site-specific recombinase Proteins 0.000 claims description 47
- 239000003550 marker Substances 0.000 claims description 46
- 210000000415 mammalian chromosome Anatomy 0.000 claims description 39
- 238000012239 gene modification Methods 0.000 claims description 38
- 230000005017 genetic modification Effects 0.000 claims description 38
- 235000013617 genetically modified food Nutrition 0.000 claims description 38
- 102000006395 Globulins Human genes 0.000 claims description 37
- 102000039446 nucleic acids Human genes 0.000 claims description 35
- 108020004707 nucleic acids Proteins 0.000 claims description 35
- 150000007523 nucleic acids Chemical class 0.000 claims description 35
- 108010091086 Recombinases Proteins 0.000 claims description 33
- 102000018120 Recombinases Human genes 0.000 claims description 33
- 210000002950 fibroblast Anatomy 0.000 claims description 31
- 230000008707 rearrangement Effects 0.000 claims description 28
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 26
- 210000001519 tissue Anatomy 0.000 claims description 24
- 241000124008 Mammalia Species 0.000 claims description 22
- 238000009395 breeding Methods 0.000 claims description 21
- 230000001488 breeding effect Effects 0.000 claims description 21
- 230000002759 chromosomal effect Effects 0.000 claims description 19
- 230000002708 enhancing effect Effects 0.000 claims description 12
- 210000001082 somatic cell Anatomy 0.000 claims description 11
- 230000002779 inactivation Effects 0.000 claims description 10
- 239000008267 milk Substances 0.000 claims description 10
- 210000004080 milk Anatomy 0.000 claims description 10
- 235000013336 milk Nutrition 0.000 claims description 10
- 241001494479 Pecora Species 0.000 claims description 9
- 241000283707 Capra Species 0.000 claims description 7
- 239000003242 anti bacterial agent Substances 0.000 claims description 7
- 229940088710 antibiotic agent Drugs 0.000 claims description 7
- 210000005132 reproductive cell Anatomy 0.000 claims description 5
- 108700019146 Transgenes Proteins 0.000 claims description 4
- 230000001900 immune effect Effects 0.000 claims description 4
- 241000235342 Saccharomycetes Species 0.000 claims 1
- 230000000644 propagated effect Effects 0.000 claims 1
- 238000011160 research Methods 0.000 abstract description 10
- 238000013160 medical therapy Methods 0.000 abstract 1
- 210000000130 stem cell Anatomy 0.000 description 61
- 238000002744 homologous recombination Methods 0.000 description 38
- 230000006801 homologous recombination Effects 0.000 description 38
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 35
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 35
- 108700028369 Alleles Proteins 0.000 description 33
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 33
- 238000012546 transfer Methods 0.000 description 32
- 241000699666 Mus <mouse, genus> Species 0.000 description 31
- 230000008859 change Effects 0.000 description 31
- 238000005516 engineering process Methods 0.000 description 31
- 210000001161 mammalian embryo Anatomy 0.000 description 29
- 238000009396 hybridization Methods 0.000 description 24
- 230000008676 import Effects 0.000 description 23
- 230000010354 integration Effects 0.000 description 22
- 102000004169 proteins and genes Human genes 0.000 description 22
- 210000004962 mammalian cell Anatomy 0.000 description 21
- 230000006798 recombination Effects 0.000 description 21
- 238000005215 recombination Methods 0.000 description 21
- 238000012216 screening Methods 0.000 description 21
- 210000001671 embryonic stem cell Anatomy 0.000 description 20
- 230000036039 immunity Effects 0.000 description 20
- 239000000523 sample Substances 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 239000002609 medium Substances 0.000 description 19
- 239000013612 plasmid Substances 0.000 description 19
- 238000011282 treatment Methods 0.000 description 19
- 230000009849 deactivation Effects 0.000 description 18
- 238000000926 separation method Methods 0.000 description 18
- 108020005065 3' Flanking Region Proteins 0.000 description 16
- 238000013461 design Methods 0.000 description 16
- 241000894007 species Species 0.000 description 16
- 241000894006 Bacteria Species 0.000 description 15
- 230000003321 amplification Effects 0.000 description 15
- 238000002347 injection Methods 0.000 description 15
- 239000007924 injection Substances 0.000 description 15
- 238000003199 nucleic acid amplification method Methods 0.000 description 15
- 230000008034 disappearance Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 210000003754 fetus Anatomy 0.000 description 13
- 230000004927 fusion Effects 0.000 description 13
- 241000283690 Bos taurus Species 0.000 description 12
- 238000002105 Southern blotting Methods 0.000 description 12
- 230000004913 activation Effects 0.000 description 12
- 238000001994 activation Methods 0.000 description 12
- 210000002459 blastocyst Anatomy 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 239000003153 chemical reaction reagent Substances 0.000 description 12
- 210000002966 serum Anatomy 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 230000012010 growth Effects 0.000 description 11
- 239000001963 growth medium Substances 0.000 description 11
- 238000012872 hydroxylapatite chromatography Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 238000001890 transfection Methods 0.000 description 11
- 108020005029 5' Flanking Region Proteins 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 10
- 229910052799 carbon Inorganic materials 0.000 description 10
- 238000010367 cloning Methods 0.000 description 10
- 239000003814 drug Substances 0.000 description 10
- 230000001605 fetal effect Effects 0.000 description 10
- 238000010363 gene targeting Methods 0.000 description 10
- 230000011278 mitosis Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 9
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 229940050570 regu-mate Drugs 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 8
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 8
- 210000002230 centromere Anatomy 0.000 description 8
- 230000006378 damage Effects 0.000 description 8
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 8
- 230000005059 dormancy Effects 0.000 description 8
- 210000002919 epithelial cell Anatomy 0.000 description 8
- 238000013467 fragmentation Methods 0.000 description 8
- 238000006062 fragmentation reaction Methods 0.000 description 8
- 238000000520 microinjection Methods 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 210000004940 nucleus Anatomy 0.000 description 8
- 239000002953 phosphate buffered saline Substances 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 241000702191 Escherichia virus P1 Species 0.000 description 7
- 241000287828 Gallus gallus Species 0.000 description 7
- 239000013599 cloning vector Substances 0.000 description 7
- 101150036876 cre gene Proteins 0.000 description 7
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 239000005090 green fluorescent protein Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 230000035800 maturation Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000035935 pregnancy Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 108091035539 telomere Proteins 0.000 description 7
- 210000003411 telomere Anatomy 0.000 description 7
- 102000055501 telomere Human genes 0.000 description 7
- 238000002560 therapeutic procedure Methods 0.000 description 7
- 108010051219 Cre recombinase Proteins 0.000 description 6
- 108010046276 FLP recombinase Proteins 0.000 description 6
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 6
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- 241000699660 Mus musculus Species 0.000 description 6
- 108091034057 RNA (poly(A)) Proteins 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 206010042602 Supraventricular extrasystoles Diseases 0.000 description 6
- 150000001413 amino acids Chemical group 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 239000000969 carrier Substances 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 239000012636 effector Substances 0.000 description 6
- 230000004720 fertilization Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 210000004698 lymphocyte Anatomy 0.000 description 6
- 210000001672 ovary Anatomy 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000011830 transgenic mouse model Methods 0.000 description 6
- 241000251468 Actinopterygii Species 0.000 description 5
- 241000193388 Bacillus thuringiensis Species 0.000 description 5
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 5
- 241000701959 Escherichia virus Lambda Species 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 5
- 241000206602 Eukaryota Species 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 5
- 241000283973 Oryctolagus cuniculus Species 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- 102000006601 Thymidine Kinase Human genes 0.000 description 5
- 108020004440 Thymidine kinase Proteins 0.000 description 5
- 229940097012 bacillus thuringiensis Drugs 0.000 description 5
- 229910052791 calcium Inorganic materials 0.000 description 5
- 239000011575 calcium Substances 0.000 description 5
- 210000000805 cytoplasm Anatomy 0.000 description 5
- 230000005611 electricity Effects 0.000 description 5
- 230000012173 estrus Effects 0.000 description 5
- 210000003101 oviduct Anatomy 0.000 description 5
- 210000004508 polar body Anatomy 0.000 description 5
- 230000001681 protective effect Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- 108010061833 Integrases Proteins 0.000 description 4
- 101100343701 Mus musculus Loxl1 gene Proteins 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- 241000283984 Rodentia Species 0.000 description 4
- 108010020764 Transposases Proteins 0.000 description 4
- 102000008579 Transposases Human genes 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 4
- 238000003975 animal breeding Methods 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 210000003321 cartilage cell Anatomy 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 150000001768 cations Chemical class 0.000 description 4
- 210000003855 cell nucleus Anatomy 0.000 description 4
- 229960004407 chorionic gonadotrophin Drugs 0.000 description 4
- 239000004927 clay Substances 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 210000002216 heart Anatomy 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 230000028993 immune response Effects 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 210000002510 keratinocyte Anatomy 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 210000002540 macrophage Anatomy 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 210000001616 monocyte Anatomy 0.000 description 4
- 210000000107 myocyte Anatomy 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 230000003362 replicative effect Effects 0.000 description 4
- 230000035939 shock Effects 0.000 description 4
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 4
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- 206010069754 Acquired gene mutation Diseases 0.000 description 3
- VWAUPFMBXBWEQY-ANULTFPQSA-N Altrenogest Chemical compound C1CC(=O)C=C2CC[C@@H]([C@H]3[C@@](C)([C@](CC3)(O)CC=C)C=C3)C3=C21 VWAUPFMBXBWEQY-ANULTFPQSA-N 0.000 description 3
- 241000282817 Bovidae Species 0.000 description 3
- 241001550206 Colla Species 0.000 description 3
- 208000035473 Communicable disease Diseases 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- 101000897400 Homo sapiens CD59 glycoprotein Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 241001071864 Lethrinus laticaudis Species 0.000 description 3
- 102100039373 Membrane cofactor protein Human genes 0.000 description 3
- 241000288906 Primates Species 0.000 description 3
- 108020004487 Satellite DNA Proteins 0.000 description 3
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 3
- 229960000971 altrenogest Drugs 0.000 description 3
- 230000000890 antigenic effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 239000012298 atmosphere Substances 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004413 cardiac myocyte Anatomy 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 3
- 238000005336 cracking Methods 0.000 description 3
- 210000001771 cumulus cell Anatomy 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 239000002552 dosage form Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 210000002308 embryonic cell Anatomy 0.000 description 3
- 210000001339 epidermal cell Anatomy 0.000 description 3
- 210000003743 erythrocyte Anatomy 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 description 3
- 229960002963 ganciclovir Drugs 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 210000003128 head Anatomy 0.000 description 3
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 3
- 210000004458 heterochromatin Anatomy 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 210000000936 intestine Anatomy 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 230000013011 mating Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 210000002752 melanocyte Anatomy 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 210000000496 pancreas Anatomy 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 230000037439 somatic mutation Effects 0.000 description 3
- 210000002784 stomach Anatomy 0.000 description 3
- 238000005728 strengthening Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 210000003708 urethra Anatomy 0.000 description 3
- 210000003932 urinary bladder Anatomy 0.000 description 3
- 229960005486 vaccine Drugs 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- PRDFBSVERLRRMY-UHFFFAOYSA-N 2'-(4-ethoxyphenyl)-5-(4-methylpiperazin-1-yl)-2,5'-bibenzimidazole Chemical compound C1=CC(OCC)=CC=C1C1=NC2=CC=C(C=3NC4=CC(=CC=C4N=3)N3CCN(C)CC3)C=C2N1 PRDFBSVERLRRMY-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 101100230376 Acetivibrio thermocellus (strain ATCC 27405 / DSM 1237 / JCM 9322 / NBRC 103400 / NCIMB 10682 / NRRL B-4536 / VPI 7372) celI gene Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 102100022002 CD59 glycoprotein Human genes 0.000 description 2
- TXCIAUNLDRJGJZ-UHFFFAOYSA-N CMP-N-acetyl neuraminic acid Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-UHFFFAOYSA-N 0.000 description 2
- TXCIAUNLDRJGJZ-BILDWYJOSA-N CMP-N-acetyl-beta-neuraminic acid Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@]1(C(O)=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-BILDWYJOSA-N 0.000 description 2
- 101100485230 Campylobacter jejuni subsp. jejuni serotype O:2 (strain ATCC 700819 / NCTC 11168) xerH gene Proteins 0.000 description 2
- 108010067225 Cell Adhesion Molecules Proteins 0.000 description 2
- 241000282994 Cervidae Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 241000699802 Cricetulus griseus Species 0.000 description 2
- 201000003883 Cystic fibrosis Diseases 0.000 description 2
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 108090000204 Dipeptidase 1 Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 102000006471 Fucosyltransferases Human genes 0.000 description 2
- 108010019236 Fucosyltransferases Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 108010056307 Hin recombinase Proteins 0.000 description 2
- 101000961414 Homo sapiens Membrane cofactor protein Proteins 0.000 description 2
- 108010003272 Hyaluronate lyase Proteins 0.000 description 2
- 102000001974 Hyaluronidases Human genes 0.000 description 2
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 2
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 101150008942 J gene Proteins 0.000 description 2
- 241000270322 Lepidosauria Species 0.000 description 2
- 108090000143 Mouse Proteins Proteins 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- 241001045988 Neogene Species 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 2
- 101150071716 PCSK1 gene Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 229920002873 Polyethylenimine Polymers 0.000 description 2
- 108010039918 Polylysine Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102000003838 Sialyltransferases Human genes 0.000 description 2
- 108090000141 Sialyltransferases Proteins 0.000 description 2
- 208000033040 Somatoform disorder pregnancy Diseases 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 101150003725 TK gene Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108010010574 Tn3 resolvase Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 108010078334 UDP-galactose beta-D-galactosyl-1,4-glycosylceramide alpha-1,3-galactosyltransferase Proteins 0.000 description 2
- 101150050575 URA3 gene Proteins 0.000 description 2
- 108010078072 VDJ Recombinases Proteins 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 2
- 230000000845 anti-microbial effect Effects 0.000 description 2
- 230000005875 antibody response Effects 0.000 description 2
- 230000005784 autoimmunity Effects 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 102000006635 beta-lactamase Human genes 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 244000309466 calf Species 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 230000011712 cell development Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 108010087471 cin recombinase Proteins 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000004043 dyeing Methods 0.000 description 2
- 210000002889 endothelial cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 101150042777 flp gene Proteins 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 210000003917 human chromosome Anatomy 0.000 description 2
- 229960002773 hyaluronidase Drugs 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 230000016784 immunoglobulin production Effects 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229940065638 intron a Drugs 0.000 description 2
- 210000004153 islets of langerhan Anatomy 0.000 description 2
- 101150066555 lacZ gene Proteins 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 2
- 230000010198 maturation time Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000003716 mesoderm Anatomy 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 2
- 101150091879 neo gene Proteins 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 239000002751 oligonucleotide probe Substances 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 210000004409 osteocyte Anatomy 0.000 description 2
- 210000004681 ovum Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 229920000656 polylysine Polymers 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 235000013580 sausages Nutrition 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 238000003307 slaughter Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000010374 somatic cell nuclear transfer Methods 0.000 description 2
- 229940063673 spermidine Drugs 0.000 description 2
- 229940063675 spermine Drugs 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 210000001685 thyroid gland Anatomy 0.000 description 2
- 239000003104 tissue culture media Substances 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 210000004291 uterus Anatomy 0.000 description 2
- 238000002689 xenotransplantation Methods 0.000 description 2
- 101150060755 xerC gene Proteins 0.000 description 2
- 101150005813 xerD gene Proteins 0.000 description 2
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- TVZGACDUOSZQKY-LBPRGKRZSA-N 4-aminofolic acid Chemical compound C1=NC2=NC(N)=NC(N)=C2N=C1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 TVZGACDUOSZQKY-LBPRGKRZSA-N 0.000 description 1
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 1
- WOVKYSAHUYNSMH-RRKCRQDMSA-N 5-bromodeoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-RRKCRQDMSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- 108010000700 Acetolactate synthase Proteins 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 208000010370 Adenoviridae Infections Diseases 0.000 description 1
- 206010060931 Adenovirus infection Diseases 0.000 description 1
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241001247482 Amsonia Species 0.000 description 1
- 101100111164 Arabidopsis thaliana BAC2 gene Proteins 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 208000003508 Botulism Diseases 0.000 description 1
- 102000008203 CTLA-4 Antigen Human genes 0.000 description 1
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 1
- 229940045513 CTLA4 antagonist Drugs 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 101710115643 Cathelicidin-1 Proteins 0.000 description 1
- 102000016289 Cell Adhesion Molecules Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 208000037088 Chromosome Breakage Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 101150097493 D gene Proteins 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- -1 DAF Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 208000032163 Emerging Communicable disease Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241001331845 Equus asinus x caballus Species 0.000 description 1
- 241000283070 Equus zebra Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000010558 Gene Alterations Effects 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- 102000000340 Glucosyltransferases Human genes 0.000 description 1
- 108010055629 Glucosyltransferases Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 241000545744 Hirudinea Species 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 101150003028 Hprt1 gene Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 241000207840 Jasminum Species 0.000 description 1
- 235000010254 Jasminum officinale Nutrition 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 102100020880 Kit ligand Human genes 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- OJMMVQQUTAEWLP-UHFFFAOYSA-N Lincomycin Natural products CN1CC(CCC)CC1C(=O)NC(C(C)O)C1C(O)C(O)C(O)C(SC)O1 OJMMVQQUTAEWLP-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 229920000715 Mucilage Polymers 0.000 description 1
- 241000711408 Murine respirovirus Species 0.000 description 1
- 101001050287 Mus musculus Transcription factor Jun Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108700022034 Opsonin Proteins Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000283089 Perissodactyla Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000009516 Protein Serine-Threonine Kinases Human genes 0.000 description 1
- 108010009341 Protein Serine-Threonine Kinases Proteins 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 206010038997 Retroviral infections Diseases 0.000 description 1
- 241000282806 Rhinoceros Species 0.000 description 1
- 241000282849 Ruminantia Species 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 108010039445 Stem Cell Factor Proteins 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 241001493546 Suina Species 0.000 description 1
- 230000020385 T cell costimulation Effects 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 241000283068 Tapiridae Species 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 208000035199 Tetraploidy Diseases 0.000 description 1
- 241000970807 Thermoanaerobacterales Species 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241000338168 Tringa Species 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- GBOGMAARMMDZGR-UHFFFAOYSA-N UNPD149280 Natural products N1C(=O)C23OC(=O)C=CC(O)CCCC(C)CC=CC3C(O)C(=C)C(C)C2C1CC1=CC=CC=C1 GBOGMAARMMDZGR-UHFFFAOYSA-N 0.000 description 1
- 101150117115 V gene Proteins 0.000 description 1
- 108010032099 V(D)J recombination activating protein 2 Proteins 0.000 description 1
- 102100029591 V(D)J recombination-activating protein 2 Human genes 0.000 description 1
- 101710181904 Venom factor Proteins 0.000 description 1
- 238000005281 X-ray Gandolfi Methods 0.000 description 1
- 108010027570 Xanthine phosphoribosyltransferase Proteins 0.000 description 1
- 238000012452 Xenomouse strains Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 208000011589 adenoviridae infectious disease Diseases 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 230000009824 affinity maturation Effects 0.000 description 1
- 230000004520 agglutination Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000007720 allelic exclusion Effects 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 210000002821 alveolar epithelial cell Anatomy 0.000 description 1
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 1
- 229960003896 aminopterin Drugs 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 238000009175 antibody therapy Methods 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 210000002403 aortic endothelial cell Anatomy 0.000 description 1
- 210000003433 aortic smooth muscle cell Anatomy 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 229910052788 barium Inorganic materials 0.000 description 1
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229940126587 biotherapeutics Drugs 0.000 description 1
- 210000003443 bladder cell Anatomy 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 102000008395 cell adhesion mediator activity proteins Human genes 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000018486 cell cycle phase Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 230000000973 chemotherapeutic effect Effects 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 230000024321 chromosome segregation Effects 0.000 description 1
- 210000000254 ciliated cell Anatomy 0.000 description 1
- 238000013377 clone selection method Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000030944 contact inhibition Effects 0.000 description 1
- GBOGMAARMMDZGR-JREHFAHYSA-N cytochalasin B Natural products C[C@H]1CCC[C@@H](O)C=CC(=O)O[C@@]23[C@H](C=CC1)[C@H](O)C(=C)[C@@H](C)[C@@H]2[C@H](Cc4ccccc4)NC3=O GBOGMAARMMDZGR-JREHFAHYSA-N 0.000 description 1
- GBOGMAARMMDZGR-TYHYBEHESA-N cytochalasin B Chemical compound C([C@H]1[C@@H]2[C@@H](C([C@@H](O)[C@@H]3/C=C/C[C@H](C)CCC[C@@H](O)/C=C/C(=O)O[C@@]23C(=O)N1)=C)C)C1=CC=CC=C1 GBOGMAARMMDZGR-TYHYBEHESA-N 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- CEYULKASIQJZGP-UHFFFAOYSA-L disodium;2-(carboxymethyl)-2-hydroxybutanedioate Chemical compound [Na+].[Na+].[O-]C(=O)CC(O)(C(=O)O)CC([O-])=O CEYULKASIQJZGP-UHFFFAOYSA-L 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000032692 embryo implantation Effects 0.000 description 1
- 210000005168 endometrial cell Anatomy 0.000 description 1
- 210000003989 endothelium vascular Anatomy 0.000 description 1
- HKSZLNNOFSGOKW-UHFFFAOYSA-N ent-staurosporine Natural products C12=C3N4C5=CC=CC=C5C3=C3CNC(=O)C3=C2C2=CC=CC=C2N1C1CC(NC)C(OC)C4(C)O1 HKSZLNNOFSGOKW-UHFFFAOYSA-N 0.000 description 1
- 230000007159 enucleation Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 230000010502 episomal replication Effects 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000004996 female reproductive system Anatomy 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 210000004186 follicle cell Anatomy 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 108010074605 gamma-Globulins Proteins 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 150000002298 globosides Chemical class 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 101150106093 gpt gene Proteins 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 210000004024 hepatic stellate cell Anatomy 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 210000000003 hoof Anatomy 0.000 description 1
- 102000051442 human CD59 Human genes 0.000 description 1
- 230000000521 hyperimmunizing effect Effects 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 230000001861 immunosuppressant effect Effects 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000001524 infective effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000009027 insemination Effects 0.000 description 1
- 210000002570 interstitial cell Anatomy 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 230000005865 ionizing radiation Effects 0.000 description 1
- 230000000236 ionophoric effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 229940043355 kinase inhibitor Drugs 0.000 description 1
- 210000002415 kinetochore Anatomy 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- 229960005287 lincomycin Drugs 0.000 description 1
- OJMMVQQUTAEWLP-KIDUDLJLSA-N lincomycin Chemical compound CN1C[C@H](CCC)C[C@H]1C(=O)N[C@H]([C@@H](C)O)[C@@H]1[C@H](O)[C@H](O)[C@@H](O)[C@@H](SC)O1 OJMMVQQUTAEWLP-KIDUDLJLSA-N 0.000 description 1
- 210000000088 lip Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 210000002596 lutein cell Anatomy 0.000 description 1
- 210000003563 lymphoid tissue Anatomy 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 210000004216 mammary stem cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000003519 mature b lymphocyte Anatomy 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000031864 metaphase Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000002406 microsurgery Methods 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- 210000004457 myocytus nodalis Anatomy 0.000 description 1
- 210000003360 nephrocyte Anatomy 0.000 description 1
- 229940060155 neuac Drugs 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000002997 osteoclast Anatomy 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 210000002394 ovarian follicle Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 210000003681 parotid gland Anatomy 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000008055 phosphate buffer solution Substances 0.000 description 1
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 1
- 210000000280 pituicyte Anatomy 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 108010055896 polyornithine Proteins 0.000 description 1
- 229920002714 polyornithine Polymers 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000002064 post-exposure prophylaxis Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 210000001948 pro-b lymphocyte Anatomy 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 230000007420 reactivation Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 210000005000 reproductive tract Anatomy 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 239000000837 restrainer Substances 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000002427 ring chromosome Anatomy 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 229940126586 small molecule drug Drugs 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 239000003998 snake venom Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- HKSZLNNOFSGOKW-FYTWVXJKSA-N staurosporine Chemical compound C12=C3N4C5=CC=CC=C5C3=C3CNC(=O)C3=C2C2=CC=CC=C2N1[C@H]1C[C@@H](NC)[C@@H](OC)[C@]4(C)O1 HKSZLNNOFSGOKW-FYTWVXJKSA-N 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229910052712 strontium Inorganic materials 0.000 description 1
- CIOAGBVUUVVLOB-UHFFFAOYSA-N strontium atom Chemical compound [Sr] CIOAGBVUUVVLOB-UHFFFAOYSA-N 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 208000001608 teratocarcinoma Diseases 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 108010065972 tick anticoagulant peptide Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0276—Knock-out vertebrates
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/873—Techniques for producing new embryos, e.g. nuclear transfer, manipulation of totipotent cells or production of chimeric embryos
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/101—Bovine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/102—Caprine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/103—Ovine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/108—Swine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/01—Animal expressing industrially exogenous proteins
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/02—Animal zootechnically ameliorated
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/02—Animal zootechnically ameliorated
- A01K2267/025—Animal producing cells or organs for transplantation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/20—Pseudochromosomes, minichrosomosomes
- C12N2800/204—Pseudochromosomes, minichrosomosomes of bacterial origin, e.g. BAC
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/20—Pseudochromosomes, minichrosomosomes
- C12N2800/206—Pseudochromosomes, minichrosomosomes of yeast origin, e.g. YAC, 2u
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Environmental Sciences (AREA)
- Veterinary Medicine (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Developmental Biology & Embryology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了缺少功能内源免疫球蛋白基因座表达的有蹄类动物、组织和器官以及来自此类动物、组织和器官的细胞和细胞系。本发明还提供了表达异种的(如人)免疫球蛋白基因座的有蹄类动物、组织和器官以及来自此类动物、组织和器官的细胞和细胞系。本发明还提供了有蹄类动物,如猪的重链和轻链免疫球蛋白的基因组DNA序列。此类动物、组织、器官和细胞可以用于研究和医疗目的。此外,提供了制备此类动物、器官、组织和细胞的方法。
Description
本申请要求2004年10月22日提交的美国临时申请号60/621,433的优先权,将所述临时申请完整引入本文作为参考。
发明领域
本发明提供了缺少功能内源免疫球蛋白基因座表达的有蹄类动物、组织和器官以及来自此类动物、组织和器官的细胞和细胞系。本发明还提供了表达异种的(如人)免疫球蛋白基因座的有蹄类动物、组织和器官以及来自此类动物、组织和器官的细胞和细胞系。本发明还提供了有蹄类动物,如猪的重链和轻链免疫球蛋白的猪基因组DNA序列。此类动物、组织、器官和细胞可以用于研究和医学治疗。此外,提供了制备此类动物、器官、组织和细胞的方法。
发明背景
抗原是被身体识别为“外来的”试剂或者物质。通常它是作为抗原的更大的外来物质的仅仅一个相对较小的化学组,如细菌的细胞壁的组分。多数抗原是蛋白质,尽管糖类可以作为弱抗原。细菌、病毒和其他微生物通常含有许多抗原,花粉、尘螨、霉菌、食物和其他物质也一样。身体通过产生抗体对抗原产生反应。抗体(也称作免疫球蛋白(Ig))是免疫系统的细胞产生的蛋白质,其结合抗原或者外来蛋白质。抗体在血液的血清中循环以检测外来抗原并构成了血液蛋白质的γ球蛋白部分。这些抗体与抗原以高度特异的方式发生化学相互作用,像拼图玩具的两片一样,从而形成抗原/抗体复合体,或者免疫复合体。该结合中和抗原或者引起抗原的破坏。
当脊椎动物首次遇到抗原时,它显示出初次体液免疫应答。如果动物在几天后遇到相同的抗原,那么免疫应答更快速并且具有更大的量级。最初的相遇导致特异免疫细胞(B细胞)克隆增殖和分化。子代淋巴细胞不仅包括效应细胞(产生抗体的细胞),而且包括记忆细胞克隆,所述记忆细胞在最初抗原的随后刺激后保留产生效应细胞和记忆细胞的能力。效应细胞仅存活几天。记忆细胞终生活着并且可以通过用相同的抗原再次刺激而再活化。从而,当再次遇到抗原时,它的记忆细胞快速产生效应细胞,所述效应细胞快速产生大量抗体。
通过利用抗体与抗原以高度特异性方式相互作用的独特能力,已经开发抗体作为可以生产并用于诊断和治疗应用的分子。因为它们结合抗原性表位的独特能力,多克隆和单克隆抗体可以用于鉴定携带该表位的分子或者可以自身或者与另一部分结合导向特定部位用于诊断或治疗。可以对实际上任何病原体或者生物学靶产生多克隆和单克隆抗体。术语多克隆抗体指通常含有各种同种型和特异性的病原体特异性抗体的免疫血清。相反,单克隆抗体由单一免疫球蛋白类型组成,代表具有一种特异性的一种同种型。
在1890年,Shibasaburo Kitazato和Emil Behring进行了一个基础实验,其证明通过将来自免疫动物的血清转移到非免疫动物,可以将免疫性从一个动物转移到另一个动物。该划时代的实验奠定了将被动免疫引入临床实践的基础。然而,在二十世纪40年代,因为与施用异源血清有关的毒性和有效的抗微生物化学疗法的引入,大规模的血清疗法在很大程度上被抛弃。当前,此类多克隆抗体疗法适于治疗相对少的情况下的传染病,如免疫球蛋白缺陷患者中的替代疗法、针对几种病毒(如狂犬病、麻疹、甲型和乙型肝炎、水痘)的暴露后预防,和毒素中和(白喉、破伤风和肉毒中毒)。尽管血清疗法的用途有限,但是在美国,每年需要超过16公吨的人抗体用于静脉内抗体治疗。在大多数高度工业化国家的经济中需要相当水平的使用,并且预期在发展中国家中,该需要快速增长。当前,用于被动免疫的人抗体从供体的合并血清得到。从而,用于治疗性和预防性治疗的人抗体的量存在固有的限制。
抗体用于针对生物战争试剂的被动免疫代表了非常有希望的防御策略。对这种生物战争试剂的最终防线是所暴露的个体的免疫系统。当前对生物武器的防御策略包括这样的措施,如增强流行病学监护、接种、和使用抗微生物剂。因为生物战争和生物恐怖主义(bioterrotism)的潜在威胁与靶定群体中免疫人数成反比,所以生物制剂是仅对具有很大比例的易感人员的潜在武器。
接种可以减小群体对特定威胁的易感性,前提是存在可以诱导保护性应答的安全疫苗。不幸的是,通过接种产生保护性应答需要的时间比暴露于疾病和疾病发作之间的时间更长。此外,许多疫苗需要多剂来实现保护性免疫应答,其将限制它们在紧急情况下对于在受攻击后提供快速预防的有用性。此外,并不是所有的疫苗受体都产生保护性应答,即使在接受推荐的免疫方案之后。
当暴露于某些试剂后施用时,药物可以提供保护,但是对于生物战争的许多潜在试剂还没有药物。当前,没有可以用于在暴露于预先形成的毒素后预防该疾病的小分子药物。可以提供即刻免疫状态的唯一的当前可利用的干预是用保护性抗体进行被动免疫(ArturoCasadevall“Passive Antibody Administration(Immediate Immunity)as a Specific Defense Against Biological Weapons”from EmergingInfectious Diseases,Posted 09/12/2002)。
除了提供保护性免疫外,现代的基于抗体的疗法组成了对新出现的病原性细菌、真菌、病毒和寄生物的潜在有用的选择(A.Casadevall和M.D.Scharff,Clinical Infectious Diseases 1995;150)。恶性肿瘤和癌症患者的治疗(C.Botti等人,Leukemia 1997;Suppl 2:S55-59;B.Bodey,S.E.Siegel,和H.E.Kaiser,Anticancer Res 1996;16(2):661)、移植器官的类固醇抗性排斥以及自身免疫病的治疗也可以通过使用单克隆或者多克隆抗体制剂实现(N.Bonnefoy-Berard和J.P.Revillard,J Heart Lung Transplant 1996;15(5):435-442;C.Colby,等人Ann Pharmacother 1996;30(10):1164-1174;MJ.Dugan,等人,Ann Hematol 1997;75(1-2):41 2;W.Cendrowski,Boll Ist SieroterMilan 1997;58(4):339-343;L.K.Kastrukoff,等人Can J Neurol Sci1978;5(2):175178;J.E.Walker等人J Neurol Sci 1976;29(2-4):303309)。
在抗体生产技术中的最近的进展提供了产生人抗体试剂同时避免与人血清疗法有关的毒性的方法。基于抗体的疗法的优点包括多方适应性、低毒性、病原体特异性、免疫功能的增强和有利的药物代谢动力学。
最近才出现了单克隆抗体治疗剂的临床应用。现在单克隆抗体已被批准作为移植、癌症、传染病、心血管疾病和炎症的治疗。更多单克隆抗体处于治疗多种疾病适应症的最后阶段的临床试验中。结果,单克隆抗体代表当前开发的最大类别的药物之一。
尽管当前流行使用单克隆抗体作为治疗剂,但是它们的使用存在一些障碍。例如,单克隆抗体的许多治疗应用需要重复施用,特别对于慢性疾病如自身免疫或癌症。因为小鼠方便用于免疫并且识别大多数人抗原作为外来的,所以针对人靶的具有治疗潜力的单克隆抗体通常是鼠来源的。然而,鼠单克隆抗体作为人治疗剂具有内在的缺点。例如,它们需要更频繁的给药以维持单克隆抗体的治疗水平,因为它们在人中比人抗体具有更短的循环半衰期。更关键的是,反复施用鼠免疫球蛋白产生了人免疫系统将识别鼠蛋白质为外来的,从而产生人抗小鼠抗体应答的可能性,其可以导致严重的变态反应。这种减小的功效和安全性的可能性导致开发许多技术用于减小鼠单克隆抗体的免疫原性。
多克隆抗体对多种抗原性靶非常有效。它们具有靶定并杀死与复杂疾病关联的多种“进化中的靶(evolving target)”的独特能力。同样,在所有药物类别中,多克隆抗体对于在抗原突变事件中保持活性的可能性最高。此外,尽管单克隆抗体对传染物具有有限的治疗活性,但是多克隆抗体可以中和毒素和引导免疫应答以消除病原体,以及生物战争试剂。
开发多克隆和单克隆抗体生产平台以满足将来对生产能力的需求代表了有希望的领域,其是当前多数研究的主题。一个特别有希望的策略是向小鼠或者大的家畜中引入人免疫球蛋白基因。该技术的延伸将包括灭活它们的内源免疫球蛋白基因。大型动物,如羊、猪和牛当前都用于生产血清来源的产品,如超免疫血清和凝血因子用于人用途。这将支持因安全性和伦理学而使用来自此类物种的人多克隆抗体。这些物种的每一种在血清和乳中都天然产生相当大量的抗体。
编码免疫球蛋白的基因的排列
抗体分子从可变基因元件的组合装配而来,且组合种系中许多可变基因元件引起的可能性使得宿主能够合成针对巨大数目抗原的抗体。每个抗体分子由两类多肽链组成:轻(L)链(可以是κL-链或者λL-链)和重(H)链。重链和轻链结合在一起以限定表位的结合区。单个抗体分子具有L链的两个相同拷贝和两个H链。每条链都包含可变区(V)和恒定区(C)。可变区构成分子的抗原结合部位。为了实现多样的抗原识别,编码可变区的DNA经历基因重排。恒定区氨基酸序列对于抗体的特定同种型以及对于产生抗体的宿主是特异的,并且从而不经历重排。
DNA重排机制对于重链和轻链基因座的可变区是相似的,尽管仅仅需要一个结合事件来产生轻链基因,而需要两个结合事件来产生完整重链基因。最常见的重排模式涉及两个基因区段之间DNA的环出和缺失。这在两个基因区段的编码序列在DNA中处于相同方向时发生。在具有相反的转录方向的两个基因区段之间可以发生第二种重组模式。该重组模式较不常见,尽管这种重排可以占据高达所有Vκ与Jκ连接的半数;半数人Vκ基因区段的转录方向与Jκ基因区段的转录方向相反。
通过分离的基因区段的体细胞重组产生编码完整V区的DNA序列。免疫球蛋白重链或者轻链的V区或者V结构域由超过一个基因区段编码。对于轻链,V结构域由两个单独的DNA区段编码。第一个区段编码轻链的前95-101个氨基酸并且称作V基因区段,因为它编码V结构域的大部分。第二个区段编码V结构域的剩余部分(最多达13个氨基酸)并且称作连接或者J基因区段。V和J基因区段的连接产生了编码整个轻链V区的连续外显子。为了产生完整的免疫球蛋白轻链信使RNA,V区外显子在转录后通过RNA剪接连接到C区序列。
重链V区在三个基因区段中编码。除了V和J基因区段(称作VH和JH以将它们与轻链VL和JL区别开来),还存在第三个基因区段,称作多样性或者DH基因区段,其位于VH和JH基因区段之间。产生完整重链V区的重组过程在两个单独的阶段发生。在第一个阶段,DH基因区段连接到JH基因区段;然后VH基因区段重排到DJH以产生完整的VH-区外显子。如对于轻链基因那样,RNA剪接将装配的V区序列连接到邻近的C区基因。
抗体谱的多样化在两个阶段发生:主要通过存在于骨髓中的前体B细胞中的Ig V、D和J基因区段的重排(“V(D)J重组”),然后通过体细胞突变和这些重排的Ig基因的类别转换重组,此时成熟的B细胞被激活。免疫球蛋白体细胞突变和类别转换对于免疫应答的成熟和产生“记忆”应答是重要的。
抗体的基因组基因座非常大并且它们位于不同的染色体上。免疫球蛋白基因区段组织成三簇或者遗传基因座:κ、λ和重链基因座。每个组织稍有不同。例如,在人中,免疫球蛋白基因如下组织。λ轻链基因座位于22号染色体上并且一簇Vλ基因区段之后是四组Jλ基因区段,其每个都连接到单个Cλ基因。κ轻链基因座在2号染色体上并且Vκ基因区段簇之后是一簇Jκ基因区段,然后是单个Cκ基因。14号染色体上重链基因座的组织与κ基因座的相似,具有单独簇的VH、DH和JH基因区段和单独簇的CH基因。重链基因座在一个重要的方面不同:它不是含有单个C区,而是含有轮流排列的一系列C区,每个C区对应于一个不同的同种型。有5种免疫球蛋白重链同种型:IgM、IgG、IgA、IgE和IgD。通常,细胞一次仅表达一种同种型,以IgM开始。其他同种型如IgG的表达可以通过同种型转换发生。
各种V、D和J基因的连接是完全随机的事件,其对于VDJ(H)产生约50,000个不同的可能的组合,对于VJ(L)产生约1,000个组合。H和L链的随后的随机配对使抗体特异性总数达到约107种可能性。通过不同遗传区段的不精确连接进一步增加了多样性。重排在两个DNA链上发生,但是仅一条链被转录(由于等位基因排斥)。由于DNA中的不可逆缺失,在B细胞的生命中仅发生一次重排。因此,每个成熟B细胞维持一种免疫特异性并且在后代或者克隆中维持。这组成了克隆选择的分子基础;即每个抗原决定簇触发带有特异性受体分子的B淋巴细胞的原始克隆的应答。V(D)J重组确立的初级B细胞谱主要受到两个紧密连锁的基因:重组激活基因(RAG)-1和RAG-2的控制。
在过去10年里,已经揭示了脊椎动物在Ig基因多样性和抗体谱发育中的相当大的多样性。啮齿类动物和人具有5个重链类别:IgM、IgD、IgG、IgE和IgA,且每种具有IgG的四个亚类和IgA的一个或两个亚类,而兔具有一个IgG重链基因但是对于不同的IgA亚类有13种基因(Burnett,R.C等人EMBO J 8:4047;Honjo,In Honjo,T,Alt.F.W.T.H.eds,Immunoglobulin Genes p.123 Academic Press,New York)。猪具有至少6个IgG亚类(Kacskovics,I等人1994 JImmunol 153:3565),但是没有IgD(Butler等人1996 Inter.Immunol8:1897-1904)。编码IgD的基因仅已在啮齿类动物和灵长类动物中描述。通过将啮齿类和灵长类动物中看到的模式与对鸡、兔、猪和驯养的牛科(Bovidae)报导的模式比较例证了谱发育机理中的多样性。虽然前面的组具有属于7到10个家族的大量的VH基因(Rathbun,G.InHongo,T.Alt.F.W.和Rabbitts,T.H.,eds,Immunoglobulin Genes,p.63,Academic press New York),但后面组的每个成员的VH基因属于单个VH基因家族(Sun,J.等人1994 J.Immunol 1553:56118;Dufour,V等人1996,J Immunol.156:2163)。除了兔之外,该家族由小于25种基因组成。虽然啮齿类和灵长类动物可以利用4到6种JH区段,但鸡中仅一种JH可以用于谱发育(Reynaud等人1989 Adv.Immunol.57:353)。类似地,Butler等人(1996 Inter.Immunol 8:1897-1904)假定猪可能像鸡一样具有仅一个JH基因。这些物种通常具有较少的V、D和J基因;在猪和奶牛中,存在单个VH基因家族,其由小于20种基因区段组成(Butler等人,Advances in Swine in BiomedicalResearch,编著:Tumbleson和Schook,1996;Sinclair等人,J.Immunol.159:3883,1997)。与J和D基因区段的较低数目一起,这导致通过基因重排产生明显较低的多样性。然而,在这些物种中似乎有更大数目的轻链基因。类似于人和小鼠,这些物种表达单个κ轻链但是多个λ轻链基因。然而,这些似乎不影响通过重排实现的有限的多样性。
因为超过100种VH、20-30种DH和4到6种JH基因区段的组合连接是人中产生抗体谱的主要机制,所以具有较少的VH、DH或者JH区段的物种必须产生较小的谱或者使用谱发育的备选机制。反刍动物、猪、兔和鸡利用几种机制来产生抗体多样性。在这些物种中,似乎存在一个重要的次级谱发育,其在高度特化的淋巴组织如回肠的淋巴集结中发生(Binns和Licence,Adv.Exp.Med.Biol.186:661,1985)。次级谱发育在这些物种中通过体细胞突变过程发生,该过程是随机的并且是没有完全了解的过程。该谱多样化的机制似乎是模板化突变,或者基因转变(Sun等人,J.Immunol.153:5618,1994)或者体细胞高变。
基因转变对于一些高等脊椎动物如鸡、兔和奶牛中的抗体多样化是重要的。然而,在小鼠中,转变事件在内源抗体基因中似乎不频繁。基因转变是一种不同的多样化机制,其特征是来自供体抗体V基因区段的同源序列转移到受体V基因区段。如果供体和受体区段具有许多序列差别,那么基因转变可以通过单个事件将一组序列改变导入V区中。取决于物种,基因转变事件可以在B细胞分化期间抗原暴露之前和/或之后发生(Tsai等人International Immunology,Vol.14,No.1,55-64,2002年1月)。
体细胞高变实现所有高等脊椎动物物种中的抗体基因多样化。它的特征是向抗体V(D)J区段中导入单个点突变。通常,高变似乎通过抗原刺激在B细胞中激活。
产生具有人源化免疫系统的动物
为了减小在小鼠中产生的用于人治疗的抗体的免疫原性,已经做了各种努力来在现在称作人源化的方法中用人蛋白质序列替换鼠蛋白质序列。已经构建了转基因小鼠,其自身的免疫球蛋白基因已经被人免疫球蛋白基因功能地替换,从而它们在免疫后产生人抗体。通过使用基因寻靶技术缺失参与小鼠Ig基因重排和表达的过程中的关键的顺式作用序列,灭活胚胎干(ES)细胞中的小鼠Ig基因,消除了小鼠抗体的产生。通过引入含有人种系构型H链和κL链小基因座(minilocus)转基因的兆碱基大小的YAC,可以恢复这些突变小鼠中的B细胞发育。这些转基因小鼠中完全人抗体的表达是占优势的,处于几百μg/l血液的水平上。该水平的表达为在表达人Ig基因的野生型小鼠中检测到的水平的几百倍,从而表明灭活内源小鼠Ig基因以增强小鼠的人抗体产生的重要性。
首次人源化尝试利用分子生物学技术来构建重组抗体。例如,将来自对半抗原特异的小鼠抗体的互补性决定区(CDR)嫁接到人抗体构架上,从而实现CDR置换。该新抗体保留CDR序列赋予的结合特异性(P.T.Jones等人Nature 321:522-525(1986))。人源化的下一个水平涉及组合完整小鼠VH区与人恒定区如γ1(S.L.Morrison等人,Proc.Natl.Acad.Sci.,81,pp.6851-6855(1984))。然而,这些嵌合抗体仍然含有大于30%的异种序列,有时相对于完全异种抗体的免疫原性的降低仅仅是微小的(M.Bruggemann等人,J.Exp.Med.,170,pp.2153-2157(1989))。
随后,试图向小鼠中引入人免疫球蛋白基因,从而产生能够用具有人序列的抗体应答抗原的转基因小鼠(Bruggemann等人Proc.Nat′l.Acad.Sci.USA 86:6709-6713(1989))。由于人免疫球蛋白基因组基因座的大尺寸,认为这些尝试受到DNA的量的限制,所述DNA可以通过可利用的克隆载体稳定维持。结果,许多研究人员将注意力集中在产生小基因座上,该小基因座含有有限数目的V区基因并且与天然或者种系构型相比在基因之间具有改变的空间距离(见,例如,美国专利号5,569,825)。这些研究表明在小鼠中产生人序列抗体是可能的,但是在从这些转基因动物得到结合特异性和效应子功能(同种型)的足够多样性以满足对抗体治疗剂的不断增长的需求方面仍然存在巨大障碍。
为了提供额外的多样性,已经开展了将人Ig基因座的大种系片段加入转基因哺乳动物中的工作。例如,使用酵母人工染色体(YAC)克隆载体向小鼠中导入在人基因组的未重排种系中发现的以相同间隔排列的多数人V、D和J区基因和人Cμ和Cδ恒定区(见例如,WO 94/02602)。将包含编码人γ-2恒定区的序列和类别转换重组所需的上游序列的22kb DNA片段后来附加到前面的转基因中。此外,使用YAC向小鼠中导入包含Vκ、Jκ和Cκ区基因的人κ基因座的部分,所述Vκ、Jκ和Cκ区基因也在人基因组的未重排的种系中被发现以基本上相同的间隔排列。用基因寻靶灭活鼠IgH和κ轻链免疫球蛋白基因座并且将这种敲除品种与上面的转基因品种育种以产生小鼠品系,其具有人V、D、J、Cμ、Cδ和Cγ2恒定区以及人Vκ、Jκ和Cκ区基因,它们都处于灭活的鼠免疫球蛋白背景下(见,例如,Kucherlapati等人的PCT专利申请WO94/02602;也见Mendez等人,Nature Genetics15:146-156(1997))。
酵母人工染色体作为克隆载体与内源基因座的基因寻靶和转基因小鼠品种的育种组合提供了抗体多样性问题的一个解决方案。通过该方法得到了几个优点。一个优点是YAC可以用于向宿主细胞转移数百kb DNA。因此,使用YAC克隆载体允许向转基因小鼠中包含相当大部分的完整人Ig重链和轻链区,从而接近在人中可得到的潜在多样性水平。该方法的另一优点是已经表明许多V基因在鼠免疫球蛋白生产缺陷的小鼠中恢复完全的B细胞发育。这确保为这些重构的小鼠提供必要的细胞以对任何给定免疫原产生强烈的人抗体应答(见例如,WO 94/02602.;L.Green和A.Jakobovits,J.Exp.Med.188:483-495(1998))。另一优点是通过利用酵母中的高频率同源重组在YAC中缺失或插入序列。这提供了YAC转基因的容易的工程改造。
此外,Green等人Nature Genetics 7:13-21(1994)描述了产生分别含有人重链基因座和κ轻链基因座的245kb和190kb大小的种系构型片段的YAC,其含有核心可变和恒定区序列。Green等人的工作最近延伸到导入大于约80%的人抗体谱来产生XenoMouseTM小鼠,所述导入通过引入分别为人重链基因座和κ轻链基因座的兆碱基大小的种系构型YAC片段来实现。见例如,Mendez等人NatureGenetics 15:146-156(1997),Green和Jakobovits J.Exp.Med.188:483-495(1998),欧洲专利号EP 0 463 151 B1,PCT公开号WO94/02602,WO 96/34096和WO 98/24893。
存在几种策略用于产生生产人抗体的哺乳动物。具体地,有“小基因座”方法,其以GenPharm International,Inc.和MedicalResearch Council的工作为代表;YAC导入Ig基因座的大的和相当大的种系片段,其以Abgenix,Inc(以前Cell Genesys)的工作为代表。通过使用微细胞融合导入整个或者基本上整个基因座,以Kirin BeerKabushiki Kaisha的工作为代表。
在小基因座方法中,通过包括Ig基因座的片段(个体基因)模拟外源Ig基因座。从而,一个或多个VH基因、一个或多个DH基因、一个或多个JH基因、μ恒定区和第二个恒定区(如γ恒定区)形成用于插入动物中的构建体。见例如,美国专利号5,545,807,5,545,806,5,625,825,5,625,126,5,633,425,5,661,016,5,770,429,5,789,650,5,814,318,5,591,669,5,612,205,5,721,367,5,789,215,5,643,763;欧洲专利号0 546 073;PCT公开号WO 92/03918,WO 92/22645,WO92/22647,WO 92/22670,WO 93/12227,WO 94/00569,WO 94/25585,WO 96/14436,WO 97/13852和WO 98/24884;Taylor等人NucleicAcids Research 20:6287-6295(1992),Chen等人InternationalImmunology 5:647-656(1993),Tuaillon等人J.Immunol.154:6453-6465(1995),Choi等人Nature Genetics 4:117-123(1993),Lonberg等人Nature 368:856-859(1994),Taylor等人InternationalImmunology 6:579-591(1994),Tuaillon等人J.Immunol.154:6453-6465(1995),和Fishwild等人Nature Biotech.14:845-851(1996)。
在微细胞融合方法中,可以向小鼠中导入部分或者完整人染色体(见,例如,欧洲专利申请号EP 0 843 961 A1)。使用该方法产生并且含有人Ig重链基因座的小鼠将通常具有超过一个,并且可能所有的人恒定区基因。因此,此类小鼠将产生结合特定抗原的具有许多不同恒定区的抗体。
尽管小鼠仍然是关于在人中表达人免疫球蛋白研究最深入的动物,但是最近的技术发展已经允许开始在其他动物如奶牛中应用这些技术。小鼠中的一般方法是基因修饰小鼠的胚胎干细胞以敲除鼠免疫球蛋白,然后向ES细胞中插入含有人免疫球蛋白的YAC。然而,不能从奶牛和其他大的动物如羊和猪中得到ES细胞。从而,在甚至可能产生具有免疫球蛋白基因被敲除并且表达人抗体的大型动物之前,必须发生几个根本的发展。用ES细胞操作来产生基因修饰动物的备选方案是使用已经基因修饰的体细胞进行克隆。使用用于核转移的基因修饰体细胞进行克隆仅仅在最近才实现。
自从1997年宣布多莉(Dolly)(克隆的羊)从成年体细胞出生(Wilmut,L,等人(1997)Nature 385:810-813)以来,已经克隆了有蹄类动物,包括牛(Cibelli,J等人,1998 Science 280:1266-1258;Kubota,C.等人2000 Proc.Nat’l.Acad.Sci 97:990-995)、山羊(Baguisi,A.等人,(1999)Nat.Biotechnology 17:456-461)和猪(Polejaeva,I.A.,等人2000 Nature 407:86-90;Betthauser,J.等人2000 Nat.Biotechnology18:1055-1059)。
下一个技术进展是技术发展到在核转移前基因修饰细胞以产生基因修饰动物。关于PPL治疗的PCT公开号WO 00/51424描述了用于核转移的体细胞的定向基因修饰。
这些基础发展之后,已经报导了基因的单个和双等位基因敲除和具有这些修饰的活动物的出生。在2002到2004年之间,三个独立的小组:Immerge Biotherapeutics,Inc.与University of Missouri合作(Lai等人(Science(2002)295:1089-1092)& Kolber-Simonds等人(PNAS.(2004)101(19):7335-40)),Alexion Pharmaceuticals(Ramsoondar等人(Biol Reprod(2003)69:437-445)和Revivicor,Inc.(Dai等人(Nature Biotechnology(2002)20:251-255)和Phelps等人(Science(2003)Jan 17;299(5605):411-4))通过用定向遗传缺失从体细胞进行核转移,产生了缺少α-1,3-GT基因的一个等位基因或者两个等位基因的猪。在2003年,Sedai等人(Transplantation(2003)76:900-902)报导牛中α-1,3-GT基因的一个等位基因的定向破坏,接着成功地核转移基因修饰细胞的核并产生转基因胎儿。
从而,现在正刚开始研究在大型动物中敲除免疫球蛋白基因并向它们的细胞中插入人免疫球蛋白基因座的可行性。然而,由于免疫球蛋白基因的复杂性和物种差异,Igκ、λ和重链的基因组序列和重排在大多数物种中仍然知之甚少。例如,在猪中,仅仅对重链恒定α、重链恒定μ和重链恒定δ描述了部分基因组序列和组织(Brown和Butler Mol Immunol.1994 Jun;31(8):633-42,Butler等人VetImmunol Immunopathol.1994 Oct;43(l-3):5-12,和Zhao等人JImmunol.2003 Aug 1;171(3):1312-8)。
在奶牛中,已经对免疫球蛋白重链基因座作图(Zhao等人2003 J.Biol.Chem.278:35024-32)并且牛κ基因的cDNA序列是已知的(见,例如,美国专利公开号2003/0037347)。此外,已经对约4.6kb的牛μ重链基因座测序并且通过破坏牛μ重链的一个或两个等位基因,已经产生了重链免疫球蛋白表达降低的转基因小牛。此外,用牛胎儿成纤维细胞的微细胞介导的染色体转移和核转移技术,已经向奶牛(TC奶牛)中导入了含有人Ig H链和κL链的完全未排列的序列的哺乳动物人工染色体(MAC)载体(见例如,Kuroiwa等人2002 NatureBiotechnology 20:889,Kuroiwa等人2004 Nat Genet.Jun 6 Epub,美国专利公开号2003/0037347、2003/0056237、2004/0068760和PCT公开号WO 02/07648)。
尽管在产生表达人免疫球蛋白的牛的方面已经取得了重大进步,但是在其他大型动物,如羊、山羊和猪中收效甚微。尽管可以容易地从Genbank获得羊、山羊和猪的免疫球蛋白基因的cDNA序列信息,但是免疫球蛋白基因座(其经历大量重排)的独特性质使得需要表征已知的存在于mRNA(或者cDNA)的序列之外的序列。因为免疫球蛋白基因座是模块式的并且编码区域是冗余的,所以缺失已知的编码区不能确保改变基因座的功能。例如,如果人们缺失重链可变区的编码区,那么基因座的功能将不被显著改变,因为在该基因座中仍有数百其他功能可变基因。因此,人们必须首先表征基因座以鉴定潜在的“唯一弱点”。
尽管在牛中表达人抗体取得了一定进展,但是对于灭活内源牛Ig基因、增加人抗体的表达水平和在其他大型动物,如猪中产生人抗体表达方面仍然存在更大的挑战,所述其他大型动物的免疫球蛋白基因的序列和排列在很大程度上还未知。
因此,本发明的一个目的是提供有蹄类动物免疫球蛋白种系基因序列的排列。
本发明的另一个目的是提供新颖的有蹄类动物免疫球蛋白基因组序列。
本发明的另一个目的是提供缺少重链和/或轻链免疫球蛋白基因的至少一个等位基因的细胞、组织和动物。
本发明的另一个目的是提供表达人免疫球蛋白的有蹄类动物。
本发明的另一个目的是提供产生缺少新的有蹄类动物免疫球蛋白基因序列的至少一个等位基因的细胞、组织和动物和/或表达人免疫球蛋白的方法。
发明概述
本发明首次提供了有蹄类动物免疫球蛋白种系基因序列排列以及其新的基因组序列。此外,提供了缺少重链或轻链免疫球蛋白基因的至少一个等位基因的新的有蹄类动物细胞、组织和动物。基于该发现,可以产生完全缺少重链和/或轻链免疫球蛋白基因的至少一个等位基因的有蹄类动物。此外,可以进一步修饰这些有蹄类动物以表达异种的(例如人)免疫球蛋白基因座或者其片段。
在本发明的一方面,提供了缺少功能性内源免疫球蛋白的任何表达的转基因有蹄类动物。在一个实施方案中,该有蹄类动物可以缺少内源重链和/或轻链免疫球蛋白的任何表达。轻链免疫球蛋白可以是κ和/或λ免疫球蛋白。在额外实施方案中,提供了缺少内源免疫球蛋白的至少一个等位基因的表达的转基因有蹄类动物,其中该免疫球蛋白选自重链、κ轻链和λ轻链或者其任意组合。在一个实施方案中,通过内源免疫球蛋白基因座的遗传寻靶以防止内源免疫球蛋白的表达,可以实现功能性内源免疫球蛋白的表达。在一个实施方案中,通过同源重组可以完成遗传寻靶。在另一实施方案中,通过核转移可以产生转基因有蹄类动物。
在其他实施方案中,缺少功能性内源免疫球蛋白的任何表达的转基因有蹄类动物可以进一步基因修饰以表达异种免疫球蛋白基因座。在备选实施方案中,提供了含有异种免疫球蛋白基因座的猪动物。在一个实施方案中,异种免疫球蛋白基因座可以是重链和/或轻链免疫球蛋白或其片段。在另一实施方案中,异种免疫球蛋白基因座可以是κ链基因座或者其片段和/或λ链基因座或者其片段。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在另一实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或者其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
在本发明的另一方面,提供了表达异种免疫球蛋白基因座或者其片段的转基因有蹄类动物,其中该免疫球蛋白可以从整合在内源有蹄类动物染色体内的免疫球蛋白基因座表达。在一个实施方案中,提供了来自转基因动物的有蹄类动物细胞。在一个实施方案中,异种免疫球蛋白基因座可以被后代遗传。在另一实施方案中,异种免疫球蛋白基因座可以通过雄性种系由后代遗传。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在另一实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或者其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
在本发明的另一方面,提供了编码有蹄类动物免疫球蛋白的重链基因座的新的基因组序列。在一个实施方案中,提供了编码猪重链的分离的核苷酸序列,其包括至少一个可变区、两个多样性区、至少四个连接区和至少一个恒定区,如μ恒定区,例如,如Seq ID No.29中表示。在另一实施方案中,提供了分离的核苷酸序列,其包括猪重链基因组序列的至少四个连接区和至少一个恒定区,如μ恒定区,如Seq ID No.4中表示。在另一实施方案中,提供了核苷酸序列,其包括猪重链基因组序列的第一个连接区的5’侧翼序列,如Seq ID No.1中表示。此外,提供了核苷酸序列,其包括猪重链基因组序列的第一个连接区的3’侧翼序列,如Seq ID No.4的3’区中表示。在进一步实施方案中,提供了如Seq ID No.1、4或29所述的分离的核苷酸序列。还提供了与Seq ID No.1、4或29至少80、85、90、95、98或99%同源的核酸序列。此外,提供了含有Seq ID No.1、4或29的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。在一个实施方案中,该核苷酸序列含有Seq ID No 4的至少17、20、25或30个连续核苷酸或者Seq ID No.29的残基1-9,070。在另一实施方案中,该核苷酸序列含有Seq ID No.29的残基9,070-11039。还提供了任选在严格条件下与Seq ID No.1、4或29杂交的核苷酸序列以及其同源核苷酸。
在另一实施方案中,提供了编码有蹄类动物免疫球蛋白的κ轻链基因座的新的基因组序列。本发明提供了有蹄类动物κ轻链区的首次报导的基因组序列。在一个实施方案中,提供了编码猪κ轻链基因座的核酸序列。在另一实施方案中,该核酸序列可以含有κ轻链的至少一个连接区、一个恒定区和/或一个增强子区。在另一实施方案中,该核苷酸序列可以包括至少五个连接区、一个恒定区和一个增强子区,例如,如Seq ID No.30中表示。在另一实施方案中,提供了分离的核苷酸序列,其含有猪基因组κ轻链的至少一个、至少两个、至少三个、至少四或者五个连接区和连接区的3’侧翼序列,例如,如Seq ID No 12中表示。在另一实施方案中,提供了猪基因组κ轻链的分离的核苷酸序列,其含有第一个连接区的5’侧翼序列,如Seq ID No25中表示。在另一实施方案中,提供了分离的核苷酸序列,其含有猪基因组κ轻链的恒定区的3’侧翼序列和任选地,增强子区的5’部分,如Seq ID Nos.15、16和/或19中表示。
在另一实施方案中,提供了如Seq ID Nos 30、12、25、15、16或19中所述的分离的核苷酸序列。还提供了与Seq ID Nos 30、12、25、15、16或19至少80、85、90、95、98或99%同源的核酸序列。此外,提供了含有Seq ID Nos 30、12、25、15、16或19的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。还提供了任选在严格条件下与Seq ID Nos 30、12、25、15、16或19杂交的核苷酸序列,以及其同源核苷酸。
在另一实施方案中,提供了编码有蹄类动物免疫球蛋白的λ轻链基因座的新的基因组序列。本发明提供了有蹄类动物λ轻链区的首次报导的基因组序列。在一个实施方案中,猪λ轻链核苷酸包括J到C单位的多联体。在具体实施方案中,提供了如Seq ID No.28中描绘的分离的猪λ核苷酸序列。在一个实施方案中,提供了包括猪λ轻链基因组序列的第一个λJ/C区的5’侧翼序列的核苷酸序列,如Seq IDNo 32表示。此外,提供了包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列,如λJ/C下游约200个碱基对的核苷酸序列,如Seq ID No33表示。备选地,提供了包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列的核苷酸序列,如Seq ID No 34、35、36、37、38和/或39表示。在另一实施方案中,提供了编码牛λ轻链基因座的核酸序列,其可以包括至少一个连接区-恒定区对和/或至少一个可变区,如SeqID No.31表示。在进一步的实施方案中,提供了如Seq ID Nos 28、31、32、33、34、35、36、37、38或39中所述的分离的核苷酸序列。还提供了与Seq ID Nos 28、31、32、33、34、35、36、37、38或39至少80、85、90、95、98或99%同源的核酸序列。此外,提供了含有Seq ID Nos 28、31、32、33、34、35、36、37、38或39的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。还提供了任选在严格条件下与Seq ID Nos 28、31、32、33、34、35、36、37、38或39杂交的核苷酸序列,以及其同源核苷酸。
在另一实施方案中,还提供了核酸寻靶载体构建体。该寻靶载体可以设计成在细胞中完成同源重组。可以将这些寻靶载体转化到哺乳动物细胞中以通过同源重组靶定有蹄类动物重链、κ轻链或者λ轻链基因。在一个实施方案中,寻靶载体可以含有3’重组臂和5’重组臂(即侧翼序列),其与有蹄类动物重链、κ轻链或者λ轻链基因组序列,例如,如上述的Seq ID Nos.1、4、29、30、12、25、15、16、19、28或31表示的序列同源。同源DNA序列可以包括与基因组序列同源的序列的至少15bp、20bp、25bp、50bp、100bp、500bp、1kbp、2kbp、4kbp、5kbp、10kbp、15kbp、20kbp或50kbp。可以设计3’和5’重组臂,从而使得它们在基因组序列的至少一个功能可变区、连接区、多样性区和/或恒定区的3’和5’末端的侧翼。功能性区域的寻靶使得它失活,其导致细胞不能产生功能性免疫球蛋白分子。在另一实施方案中,同源DNA序列可以包括一个或多个内含子和/或外显子序列。除了核酸序列外,表达载体可以含有选择标记序列,如增强的绿色荧光蛋白(eGFP)基因序列、起始和/或增强子序列、聚腺苷酸化尾序列,和/或提供构建体在原核和/或真核宿主细胞中表达的核酸序列。选择标记可以位于5’和3’重组臂序列之间。
在一个具体实施方案中,寻靶载体可以含有5’和3’重组臂,该重组臂含有与猪免疫球蛋白重链基因座的J6区的3’和5’侧翼序列同源的序列。因为J6区是猪免疫球蛋白重链基因座的唯一的功能连接区,所以这将阻止功能性猪重链免疫球蛋白的表达。在特定实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与J6区5’的基因组序列,包括J1-4同源的序列,所述3’重组臂含有与J6区3’的基因组序列,包括μ恒定区同源的序列(“J6寻靶构建体”),见例如图1。此外,该J6寻靶构建体还可以含有位于5’和3’重组臂之间的选择标记基因,见例如,Seq ID No 5和图1。在其他实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与猪重链基因座的多样性区5’的基因组序列同源的序列,所述3’重组臂含有与猪重链基因座的多样性区3’的基因组序列同源的序列。在另一实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与猪重链基因座的μ恒定区5’的基因组序列同源的序列,所述3’重组臂含有与猪重链基因座的μ恒定区3’的基因组序列同源的序列。
在另一具体实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,它们含有猪免疫球蛋白重链基因座的恒定区的3’和5’侧翼序列同源的序列。因为本发明发现了猪免疫球蛋白κ轻链基因座仅有一个恒定区,这将阻止功能性猪κ轻链免疫球蛋白的表达。在具体实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与恒定区5’的基因组序列(任选包括连接区)同源的序列,所述3’重组臂含有与恒定区3’的基因组序列(任选包括增强子区的至少部分)同源的序列(“κ恒定寻靶构建体”),见例如图2。此外,该κ恒定寻靶构建体还可以含有位于5’和3’重组臂之间的选择标记基因,见例如Seq ID No 20和图2。在其他实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与猪κ轻链基因座的连接区5’的基因组序列同源的序列,所述3’重组臂含有与猪κ轻链基因座的连接区3’的基因组序列同源的序列。
在另一实施方案中,提供了用于产生寻靶载体的3’和5’序列的引物。寡核苷酸引物能够与猪免疫球蛋白基因组序列,如上述Seq IDNos.1、4、29、30、12、25、15、16、19、28或31杂交。在具体实施方案中,引物在严格条件下与如上述的Seq ID Nos.1、4、29、30、12、25、15、16、19、28或31杂交。另一实施方案提供了能够与猪重链、κ轻链或λ轻链核酸序列,如上述Seq ID Nos.1、4、29、30、12、25、15、16、19、28或31杂交的寡核苷酸探针。多核苷酸引物或者探针可以具有与本发明的多核苷酸杂交的至少14个碱基、20个碱基、30个碱基或者50个碱基。探针或引物可以长为至少14个核苷酸,且在具体实施方案中,长为至少15、20、25、28或30个核苷酸。
在一个实施方案中,提供了扩增猪Ig重链的包括功能连接区(J6区)的片段的引物。在一个非限制性实施方案中,所扩增的重链片段由Seq ID No 4表示并且用于扩增该片段的引物可以与J区的部分,如但不限于Seq ID No 2互补,以产生5’重组臂,并且与Ig重链μ恒定区的部分,如但不限于Seq ID No 3互补,以产生3’重组臂。在另一实施方案中,可以将猪Ig重链的区域(如但不限于Seq ID No 4)亚克隆并装配到寻靶载体中。
在其他实施方案中,提供了扩增猪Igκ轻链的包括恒定区的片段的引物。在另一实施方案中,提供了扩增猪Igκ轻链的包括J区的片段的引物。在一个非限制性实施方案中,用于扩增该片段的引物可以与J区的部分,如但不限于Seq ID No 21或10互补,以产生5’重组臂,并且与恒定区3’的基因组序列,如但不限于Seq ID No 14、24或18互补,以产生3’重组臂。在另一实施方案中,可以将猪Ig重链的区域(如但不限于Seq ID No 20)亚克隆并装配到寻靶载体中。
在本发明的另一方面,提供了根据本文描述的方法、序列和/或构建体产生的有蹄类动物细胞,其缺少有蹄类动物重链、κ轻链和/或λ轻链基因座的功能区的至少一个等位基因。这些细胞可以由于同源重组得到。具体地,通过灭活有蹄类动物重链、κ轻链或λ轻链基因的至少一个等位基因,可以产生表达有蹄类动物抗体的能力降低的细胞。在其他实施方案中,可以根据本文描述的方法、序列和/或构建体产生缺少有蹄类动物重链、κ轻链和/或λ轻链基因的两个等位基因的哺乳动物细胞。在进一步的实施方案中,提供了猪动物,其中通过根据本文描述的方法、序列和/或构建体产生的遗传寻靶事件灭活了有蹄类动物重链、κ轻链和/或λ轻链基因的至少一个等位基因。在本发明的另一方面,提供了猪动物,其中通过遗传寻靶事件灭活了有蹄类动物重链、κ轻链和/或λ轻链基因的两个等位基因。基因可以通过同源重组被靶定。
在其他实施方案中,可以破坏基因,即,可以改变遗传密码的部分,从而影响基因的该区段的转录和/或翻译。例如,可以通过替代、缺失(“敲除”)或者插入(“敲入”(knock-in))技术发生基因的破坏。可以插入所需蛋白质的额外基因或者调节现有序列转录的调节序列。为了实现有蹄类动物免疫球蛋白基因的多个基因修饰,在一个实施方案中,可以顺序修饰细胞以含有多个基因修饰。在其他实施方案中,可以将动物一起育种以产生含有免疫球蛋白基因的多个基因修饰的动物。作为阐明性实例,缺少表达有蹄类动物重链基因的至少一个等位基因的动物可以进一步基因修饰或者与缺少κ轻链基因的至少一个等位基因的动物育种。
在本发明的实施方案中,根据本文描述的方法、序列和/或构建体使得有蹄类动物重链、κ轻链或者λ轻链基因的等位基因失活,从而不再产生功能性有蹄类动物免疫球蛋白。在一个实施方案中,可以将靶定的免疫球蛋白基因转录成RNA,但是不翻译成蛋白质。在另一实施方案中,可以将靶定的免疫球蛋白基因以失活的截短形式转录。这种截短的RNA可以不被翻译或者可以翻译成无功能的蛋白质。在备选实施方案中,可以将靶定的免疫球蛋白基因以不发生基因的转录的方式灭活。在另一实施方案中,可以转录靶定的免疫球蛋白基因,然后翻译成无功能的蛋白质。
在本发明的另一方面,缺少有蹄类动物重链、κ轻链和/或λ轻链基因的一个等位基因、任选两个等位基因的有蹄类动物,如猪或者牛的细胞可以用作供体细胞以向受体细胞进行核转移,以产生克隆的转基因动物。备选地,可以在胚胎干细胞中产生有蹄类动物重链、κ轻链和/或λ轻链基因敲除,其然后用于产生后代。根据本文描述的方法、序列和/或构建体产生的缺少功能性有蹄类动物重链、κ轻链和/或λ轻链基因的一个等位基因的后代可以育种以进一步通过孟德尔型遗传产生在两个等位基因中都缺少功能性的后代。
在本发明的一方面,提供了破坏有蹄类动物免疫球蛋白基因的表达的方法,其通过(i)分析有蹄类动物重链、κ轻链或λ轻链基因组基因座的种系构型;(ii)确定该基因座的至少一个功能区域的5’末端和3’末端侧翼的核苷酸序列位置;和(iii)将含有侧翼序列的寻靶构建体转染到细胞中实现,其中,在成功地同源重组后,破坏了免疫球蛋白基因座的至少一个功能区,从而减小或者防止该免疫球蛋白基因的表达。在一个实施方案中,提供了猪重链基因座的种系构型。猪重链基因座含有至少四个可变区、两个多样性区、六个连接区和五个恒定区,例如,如图1图解的。在具体实施方案中,六个连接区的仅一个:J6是功能性的。在另一实施方案中,提供了猪κ轻链基因座的种系构型。猪κ轻链基因座含有至少六个可变区、六个连接区、一个恒定区和一个增强子区,例如,如图2图解的。在另一实施方案中,提供了猪λ轻链基因座的种系构型。
在本发明的其他方面,提供了根据本文描述的方法、序列和/或构建体产生的有蹄类动物和有蹄类动物细胞,它们缺少有蹄类动物重链、κ轻链和/或λ轻链基因座的功能区的至少一个等位基因,所述有蹄类动物和有蹄类动物细胞进一步修饰以表达人抗体(即,免疫球蛋白(Ig))基因座的至少部分。在额外实施方案中,提供了表达异种免疫球蛋白的猪动物。该人基因座可以经历重排并在有蹄类动物中表达人抗体分子的不同群体。这些克隆的转基因有蹄类动物提供了人抗体(如多克隆抗体)的可补充的、理论上无限的供应,所述抗体可以用于治疗、诊断、纯化和其他临床上相关的目的。在一个具体实施方案中,人工染色体(AC),如酵母或者哺乳动物人工染色体(YAC或者MAC)可以用于允许人免疫球蛋白基因在有蹄类动物细胞和动物中表达。可以将所有或者部分的人免疫球蛋白基因,如Ig重链基因(人414号染色体)、Igκ轻链基因(人2号染色体)和/或Igλ轻链基因(22号染色体)插入到人工染色体,其然后可插入到有蹄类动物细胞中。在进一步的实施方案中,提供了有蹄类动物和有蹄类动物细胞,其含有至少一种人抗体基因座的部分或者全部,该基因座经历重排并且表达不同群体的人抗体分子。
在额外实施方案中,提供了产生异种抗体的方法,其中该方法可以包括:(a)对有蹄类动物施用一种或多种目的抗原,所述有蹄类动物的细胞包含一个或多个人工染色体并且缺少功能性内源免疫球蛋白的任何表达,每个人工染色体包含一个或多个经历重排的异种免疫球蛋白基因座,从而导致产生针对所述一种或多种抗原的异种抗体;和/或(b)从有蹄类动物回收所述异种抗体。在一个实施方案中,免疫球蛋白基因座可以在B细胞中经历重排。
在本发明的一方面,通过根据本发明的任意方面的方法可以制备有蹄类动物,如猪或者奶牛。这些克隆的转基因有蹄类动物(例如,猪和牛动物)提供人多克隆抗体的可补充的、理论上无限的供应,所述抗体可以用作治疗、诊断和纯化目的。例如,根据本文描述的方法、序列和/或构建体产生的在血流中产生多克隆人抗体的转基因动物可以用于产生对所需抗原特异的一组不同的人抗体。大量多克隆抗体的可用性也可以用于治疗和预防传染病、对生物战争试剂接种、调节免疫系统、除去不希望的人细胞(如癌细胞)和调节特定人分子。
在其他实施方案中,根据本文描述的方法、序列和/或构建体产生的缺少功能性免疫球蛋白表达的动物或细胞可以含有额外的基因修饰以消除异种抗原的表达。可以修饰此类动物以消除α-1,3-半乳糖基转移酶基因、CMP-Neu5Ac羟化酶基因(见例如,USSN10/863,116)、iGb3合酶基因(见,例如,美国专利申请60/517,524)和/或福斯曼(Forssman)合酶基因(见例如,美国专利申请60/568,922)的至少一个等位基因的表达。在额外实施方案中,本文公开的动物还可以含有基因修饰以表达岩藻糖基转移酶和/或唾液酸转移酶。为了实现这些额外的基因修饰,在一个实施方案中,可以修饰细胞以含有多个基因修饰。在其他实施方案中,动物可以一起育种以实现多个基因修饰。在一个具体实施方案中,根据本文描述的方法、序列和/或构建体产生的缺少功能性免疫球蛋白表达的动物,如猪可以与缺少α-1,3-半乳糖基转移酶表达的动物如猪育种(如WO 04/028243中所述)。
附图简述
图1图解了寻靶载体的设计,该寻靶载体破坏猪重链免疫球蛋白基因的连接区的表达。
图2图解了寻靶载体的设计,该寻靶载体破坏猪κ轻链免疫球蛋白基因的恒定区的表达。
图3图解了猪λ免疫球蛋白基因座的基因组组织,该基因座包括J-C序列的多联体以及包括JC区5’的可变区的侧翼区域。细菌人工染色体(BAC1和BAC2)代表可以从BAC文库得到的猪免疫球蛋白基因组的片段。
图4代表寻靶载体的设计,该寻靶载体破坏猪λ轻链免疫球蛋白基因的JC簇区域的表达。“SM”代表选择标记基因,其可以用于寻靶载体中。
图5图解了向猪λ免疫球蛋白基因座的JC簇区域5’的区插入位点特异性重组酶靶或者识别位点的寻靶策略。“SM”代表选择标记基因,其可以用于寻靶载体中。“SSRRS”代表特异性重组酶靶或者识别位点。
图6图解了向猪λ免疫球蛋白基因座的JC簇区域3’的区插入位点特异性重组酶靶或者识别位点的寻靶策略。“SM”代表选择标记基因,其可以用于寻靶载体中。“SSRRS”代表特异性重组酶靶或者识别位点。
图7图解了YAC向宿主基因组的位点特异性重组酶介导的转移。“SSRRS”代表特异性重组酶靶或者识别位点。
详述
本发明首次提供了有蹄类动物免疫球蛋白种系基因序列排列以及其新的基因组序列。此外,提供了缺少重链或轻链免疫球蛋白基因的至少一个等位基因的新的有蹄类动物细胞、组织和动物。基于该发现,可以产生完全缺少重链和/或轻链免疫球蛋白基因的至少一个等位基因的有蹄类动物。此外,可以进一步修饰这些有蹄类动物以表达异种的(例如人)免疫球蛋白基因座或者其片段。
在本发明的一方面,提供了缺少功能性内源免疫球蛋白的任何表达的转基因有蹄类动物。在一个实施方案中,该有蹄类动物可以缺少内源重链和/或轻链免疫球蛋白的任何表达。轻链免疫球蛋白可以是κ和/或λ免疫球蛋白。在额外实施方案中,提供了缺少内源免疫球蛋白的至少一个等位基因的表达的转基因有蹄类动物,其中该免疫球蛋白选自重链、κ轻链和λ轻链或者其任意组合。在一个实施方案中,通过内源免疫球蛋白基因座的遗传寻靶以防止内源免疫球蛋白的表达,可以实现功能性内源免疫球蛋白的表达。在一个实施方案中,通过同源重组可以完成遗传寻靶。在另一实施方案中,通过核转移可以产生转基因有蹄类动物。
在其他实施方案中,缺少功能性内源免疫球蛋白任何表达的转基因有蹄类动物可以进一步基因修饰以表达异种免疫球蛋白基因座。在备选实施方案中,提供了含有异种免疫球蛋白基因座的猪动物。在一个实施方案中,异种免疫球蛋白基因座可以是重链和/或轻链免疫球蛋白或者其片段。在另一个实施方案中,异种免疫球蛋白基因座可以是κ链基因座或者其片段和/或λ链基因座或者其片段。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在另一实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或者其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
在本发明的另一方面,提供了表达异种免疫球蛋白基因座或者其片段的转基因有蹄类动物,其中该免疫球蛋白可以从整合在内源有蹄类动物染色体内的免疫球蛋白基因座表达。在一个实施方案中,提供了来自转基因动物的有蹄类动物细胞。在一个实施方案中,异种免疫球蛋白基因座可以被后代遗传。在另一实施方案中,异种免疫球蛋白基因座可以通过雄性种系由后代遗传。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在另一实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或者其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
定义
术语“重组DNA技术”、“DNA克隆”、“分子克隆”或者“基因克隆”指将DNA序列转移到细胞或者生物中的方法。DNA片段可以从一种生物转移到自身复制的遗传元件(例如,细菌质粒),其允许DNA(或者RNA)序列的任何特定部分的拷贝在许多其他序列中选择并以无限的量产生。质粒和其他类型的克隆载体如人工染色体可以用于拷贝基因和染色体的其他片段以产生足够的相同材料用于进一步研究。除了细菌质粒(其可以携带最高达20kb外源DNA)外,其他克隆载体包括病毒、粘粒、和人工染色体(例如,细菌人工染色体(BAC)或者酵母人工染色体(YAC))。当染色体DNA的片段最终与它的克隆载体在实验室中连接时,将它称作“重组DNA分子”。将重组质粒导入合适的宿主细胞后不久,新插入的区段将随着宿主细胞DNA一起繁殖。
“粘粒”是人工构建的克隆载体,其携带最高达45kb的外来DNA。它们可以在λ噬菌体颗粒中包装以用于转染到大肠杆菌(E.coli)细胞中。
如本文使用的术语“哺乳动物”(如在“基因修饰的(或者改变的)哺乳动物”中)意在包括任何非人哺乳动物,包括但不限于,猪、羊、山羊、牛、鹿、骡、马、猴、狗、猫、大鼠、小鼠、鸟、鸡、爬行动物、鱼和昆虫。在本发明的一个实施方案中,提供了基因改变的猪和其生产方法。
术语“有蹄类动物”指有蹄的哺乳动物。偶蹄类动物是偶数趾(分趾蹄的)有蹄类动物,包括羚羊、骆驼、奶牛、鹿、山羊、猪和羊。奇蹄类动物是奇数趾的有蹄类动物,其包括马、斑马、犀牛和貘。本文使用的术语有蹄类动物指成年、胚胎或者胎儿有蹄类动物。
本文使用的术语“猪(porcine)”、“猪动物”、“猪(pig)”和“猪(swine)”是一般术语,指相同类型的动物,而不关心性别、大小或者品种。
“同源DNA序列或者同源DNA”是与参考DNA序列至少约80%,85%、90%、95%、98%或99%相同的DNA序列。同源序列在严格条件下与靶序列杂交,严格杂交条件包括如果两个序列之间有至少85、至少95%或者98%同一性,那么将允许它们杂交的杂交条件。
“等基因或者基本上等基因DNA序列”是与参考DNA序列相同或者几乎相同的DNA序列。术语“基本上等基因”指与参考DNA序列至少约97-99%相同,或者与参考DNA序列至少约99.5-99.9%相同,并且在一些用途中与参考DNA序列100%相同的DNA。
“同源重组”指基于序列同源性的DNA重组过程。
“基因寻靶”指两个DNA序列之间的同源重组,所述序列之一位于染色体上并且另一个不在染色体上。
“非同源的或者随机整合”指DNA借以整合到基因组但是不涉及同源重组的任意过程。
“选择标记基因”是一种基因,其表达允许鉴定含有该基因的细胞。选择标记可以是允许细胞在防止或者延缓没有该基因的细胞生长的培养基上增殖的选择标记。实例包括抗生素抗性基因和允许生物在选择的代谢物上生长的基因。备选地,该基因可以通过赋予细胞容易鉴定的表型来促进转化体的视觉筛选。这种可鉴定的表型可以例如,是发光的产生或者有色化合物的产生,或者细胞周围培养基中可检测的改变的产生。
术语“连续的”在本文中以它的标准意思使用,即没有中断或者未中断的。
“严格条件”指这样的条件:(1)利用低离子强度和高温度进行洗涤,例如,0.015M NaCl/0.0015M柠檬酸钠/0.1% SDS于50℃,或者(2)在杂交过程中利用变性剂,如甲酰胺。本领域技术人员可以确定并适当改变严格条件以得到清楚和可检测的杂交信号。例如,在杂交和洗涤期间通过升高存在的盐含量、降低温度或者它们的组合一般可以降低严格性。见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbour Laboratory Press,ColdSpring Harbour,New York,(1989)。
I.免疫球蛋白基因
在本发明的一方面,提供了缺少功能性内源免疫球蛋白的任何表达的转基因有蹄类动物。在一个实施方案中,该有蹄类动物可以缺少内源重链和/或轻链免疫球蛋白的任何表达。轻链免疫球蛋白可以是κ和/或λ免疫球蛋白。在额外实施方案中,提供了缺少内源免疫球蛋白的至少一个等位基因的表达的转基因有蹄类动物,其中该免疫球蛋白选自重链、κ轻链和λ轻链或者其任意组合。在一个实施方案中,通过内源免疫球蛋白基因座的遗传寻靶以防止内源免疫球蛋白的表达,可以实现功能性内源免疫球蛋白的表达。在一个实施方案中,通过同源重组可以完成遗传寻靶。在另一实施方案中,通过核转移可以产生转基因有蹄类动物。
在本发明的另一方面,提供了破坏有蹄类动物免疫球蛋白基因表达的方法,其包括(i)分析有蹄类动物重链、κ轻链或λ轻链基因组基因座的种系构型;(ii)确定该基因座的至少一个功能区域的5’末端和3’末端侧翼的核苷酸序列位置;和(iii)将含有侧翼序列的寻靶构建体转染到细胞中,其中,在成功地同源重组后,破坏该免疫球蛋白基因座的至少一个功能区,从而减小或者防止该免疫球蛋白基因的表达。
在一个实施方案中,提供了猪重链基因座的种系构型。猪重链基因座含有至少四个可变区、两个多样性区、六个连接区和五个恒定区,例如,如图1图解。在特定实施方案中,六个连接区的仅一个:J6是功能性的。
在另一实施方案中,提供了猪κ轻链基因座的种系构型。猪κ轻链基因座含有至少六个可变区、六个连接区、一个恒定区和一个增强子区,例如,如图2图解。
在另一实施方案中,提供了猪λ轻链基因座的种系构型。
提供了如Seq ID Nos 1-39中所述的分离的核苷酸序列。还提供了与Seq ID Nos 1-39的任一个至少80、85、90、95、98或99%同源的核酸序列。此外,提供了含有Seq ID Nos 1-39任一个的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。还提供了任选在严格条件下与Seq ID Nos 1-39杂交的核苷酸序列,以及其同源核苷酸。
在核苷酸或者氨基酸序列水平上的同源性或者同一性可以通过BLAST(Basic Local Alignment Search Tool)分析,使用程序blastp、blastn、blastx、tblastn和tblastx(见例如,Altschul,S.F.等人,(1997)Nucleic Acids Res 25:3389-3402和Karlin等人,(1900)Proc.Natl.Acad.Sci.USA 87,2264-2268)(它们被定制以用于序列相似性搜索)所用的算法来确定。BLAST程序使用的方法是首先考虑查询序列和数据库序列之间的相似性区段(有和没有缺口),然后评估所鉴定的所有匹配的统计学显著性,并最后仅仅总结满足预先选择的显著性阈值的那些匹配。见例如,Altschul等人,(1994)(Nature Genetics 6,119-129)。直方图、描述、比对、期望(即,对数据库序列报告匹配的统计学显著性阈值)、截止值(cutoff)、矩阵和滤器(低复杂性)的搜索参数处于默认设置。blastp、blastx、tblastn和tblastx的默认评分矩阵是BLOSUM62矩阵(Henikoff等人,(1992)Proc.Natl.Acad.Sci.USA 89,10915-10919),推荐其用于长度超过85(核苷酸碱基或者氨基酸)的查询序列。
猪重链
在本发明的另一方面,提供了编码有蹄类动物免疫球蛋白的重链基因座的新的基因组序列。在一个实施方案中,提供了编码猪重链的分离的核苷酸序列,其包括至少一个可变区、两个多样性区、至少四个连接区和至少一个恒定区,如μ恒定区,例如,如Seq ID No.29中表示。在另一实施方案中,提供了分离的核苷酸序列,其包括猪重链基因组序列的至少四个连接区和至少一个恒定区,如μ恒定区,如Seq ID No.4中表示。在另一实施方案中,提供了核苷酸序列,其包括猪重链基因组序列的第一个连接区的5’侧翼序列,如Seq ID No.1中表示。此外,提供了核苷酸序列,其包括猪重链基因组序列的第一个连接区的3’侧翼序列,如Seq ID No.4的3’区中表示。在进一步实施方案中,提供了如Seq ID No.1、4或29所述的分离的核苷酸序列。还提供了与Seq ID No.1、4或29至少80、85、90、95、98或99%同源的核酸序列。还提供了任选在严格条件下与Seq ID No.1、4或29杂交的核苷酸序列以及其同源核苷酸。
此外,提供了含有Seq ID No.1、4或29的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。在一个实施方案中,该核苷酸序列含有Seq ID No 4的至少17、20、25或30个连续核苷酸或者SeqID No.29的残基1-9,070。在其他实施方案中,提供了含有Seq ID No.29的至少50、100、1,000、2,500、4,000、4,500、5,000、7,000、8,000、8,500、9,000、10,000或15,000个连续核苷酸的核苷酸序列。在另一实施方案中,该核苷酸序列含有Seq ID No.29的残基9,070-11039。
在进一步实施方案中,提供了如Seq ID No.1、4或29所述的分离的核苷酸序列。还提供了与Seq ID No.1、4或29至少80、85、90、95、98或99%同源的核酸序列。此外,提供了含有Seq ID No.1、4或29的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。还提供了任选在严格条件下与Seq ID No.1、4或29杂交的核苷酸序列以及其同源核苷酸。
在一个实施方案中,提供了编码猪重链的分离的核苷酸序列,其包括至少一个可变区、两个多样性区、至少四个连接区和至少一个恒定区,如μ恒定区,例如,如Seq ID No.29中表示。在Seq ID No.29中,重链的多样性区例如通过残基1089-1099(D(pseudo))表示,重链的连接区例如通过残基1887-3352(例如:J(psuedo):1887-1931,J(psuedo):2364-2411,J(psuedo):2756-2804,J(功能性J):3296-3352)表示,重组信号例如通过残基3001-3261(九碱基顺序),3292-3298(七碱基序列)表示,恒定区通过下面的残基表示:3353-9070(J到Cμ内含子)、5522-8700(转换区)、9071-9388(μ外显子1)、9389-9469(μ内含子A)、9470-9802(μ外显子2)、9830-10069(μ内含子B)、10070-10387(μ外显子3)、10388-10517(μ内含子C)、10815-11052(μ外显子4)、11034-11039(聚腺苷酸信号)。
Seq ID No.29 | tctagaagacgctggagagaggccagacttcctcggaacagctcaaagagctctgtcaaagccagatcccatcacacgtgggcaccaataggccatgccagcctccaagggccgaactgggttctccacggcgcacatgaagcctgcagcctggcttatcctcttccgtggtgaagaggcaggcccgggactggacgaggggctagcagggtgtggtaggcaccttgcgccccccaccccggcaggaaccagagaccctggggctgagagtgagcctccaaacaggatgccccacccttcaggccacctttctatccagctacactccacctgccattctcctctgggcacagggcccagcccctggatcttggccttggctcgacttgcacccacgcgcacacacacacttcctaacgtgctgtccgctcacccctccccagcgtggtccatgggcagcacggcagtgcgcgtccggcggtagtgagtgcagaggtccctttgcctctgccaggagcccctggggtgtgtgcagatctgggggctcctgtcccttacaccttcatgcccctcccctcatacccaccctccaggcgggaggcagcgagacctttgcccagggactcagccaacgggcacacgggaggccagccctcagcagctggctcccaaagaggaggtgggaggtaggtccacagctgccacagagagaaaccctgacggaccccacaggggccacgccagccggaaccagctccctcgtgggtgagcaatggccagggccccgccggccaccacggctggccttgcgccagctgagaactcacgtccagtgcagggagactcaagacagcctgtgcacacagcctcggatctgctcccatttcaagcagaaaaaggaaaccgtgcaggcagccctcagcatttcaaggattgtagcagcggccaactattcgtcggcagtggccgattagaatgaccgtggagaagggcggaagggtctctcgtgggctctgcggccaacaggccctggctccacctgcccgctgccagcccgaggggcttgggccgagccaggaaccacagtgctcaccgggaccacagtgactgaccaaactcccggccagagcagccccaggccagccgggctctcgccctggaggactcaccatcagatgcacaagggggcgagtgtggaagagacgtgtcgcccgggccatttgggaaggcgaagggaccttccaggtggacaggaggtgggacgcactccaggcaagggactgggtccccaaggcctggg |
gaaggggtactggcttgggggttagcctggccagggaacggggagcggggcggggggctgagcagggaggacctgacctcgtgggagcgaggcaagtcaggcttcaggcagcagccgcacatcccagaccaggaggctgaggcaggaggggcttgcagcggggcgggggcctgcctggctccgggggctcctgggggacgctggctcttgtttccgtgtcccgcagcacagggccagctcgctgggcctatgcttaccttgatgtctggggccggggcgtcagggtcgtcgtctcctcaggggagagtcccctgaggctacgctgggg*ggggactatggcagctccaccaggggcctggggaccaggggcctggaccaggctgcagcccggaggacgggcagggctctggctctccagcatctggccctcggaaatggcagaacccctggcgggtgagcgagctgagagcgggtcagacagacaggggccggccggaaaggagaagttgggggcagagcccgccaggggccaggcccaaggttctgtgtgccagggcctgggtgggcacattggtgtggccatggctacttagattcgtggggccagggcatcctggtcaccgtctcctcaggtgagcctggtgtctgatgtccagctaggcgctggtgggccgcgggtgggcctgtctcaggctagggcaggggctgggatgtgtatttgtcaaggaggggcaacagggtgcagactgtgcccctggaaacttgaccactggggcaggggcgtcctggtcacgtctcctcaggtaagacggccctgtgcccctctctcgcgggactggaaaaggaattttccaagattccttggtctgtgtggggccctctggggcccccgggggtggctcccctcctgcccagatggggcctcggcctgtggagcacgggctgggcacacagctcgagtctagggccacagaggcccgggctcagggctctgtgtggcccggcgactggcagggggctcgggtttttggacaccccctaatgggggccacagcactgtgaccatcttcacagctggggccgaggagtcgaggtcaccgtctcctcaggtgagtcctcgtcagccctctctcactctctggggggttttgctgcattttgtgggggaaagaggatgcctgggtctcaggtctaaaggtctagggccagcgccggggcccaggaaggggccgaggggccaggctcggctcggccaggagcagagcttccagacatctcgcctcctggcggctgcagtcaggcctttggccgggggggtctcagcaccaccaggcctcttggctcccgaggtccccggccccggctgcctcaccaggcaccgtgcgcggtgggcccgggctcttggtcggccaccctttcttaactgggatccgggcttagttgtcgcaatgtgacaacgggctcgaaagctggggccaggggaccctagtctacgacgcctcgggtgggtgtcccgcacccctccccactttcacggcactcggcgagacctggggagtcaggtgttggggacactttggaggtcaggaacgggagctggggagagggctctgtcagcggggtccagagatgggccgccctccaaggacgccctgcgcggggacaagggcttcttggcctggcctggccgcttcacttgggcgtcagggggggcttcccggggcaggcggtcagtcgaggcgggttggaattctgagtctgggttcggggttcggggttcggccttcatgaacagacagcccaggcgggccgttgtttggcccctgggggcctggttggaatgcgaggtctcgggaagtcaggagggagcctggccagcagagggttcccagccctgcggccgagggacctggagacgggcagggcattggccgtcgcagggccaggccacaccccccaGGTTTTTGTggggcgagcctggagattgcacCACTGTGATTACTATGCTATGGATCTCTGGGGCCCAGGCGTTGAAGTCGTCGTGTCCTCAGgtaagaacggccctccagggcctttaatttctgctctcgtctgtgggcttttctgactctgatcctcgggaggcgtctgtgccccccccggggatgaggccggcttgccaggaggggtcagggaccaggagcctgtgggaagttctgacgggggctgcaggcgggaagggccccaccggggggcgagccccaggccgctgggcggcaggagacccgtgagagtgcgccttgaggagggtgtctgcggaaccacgaacgcccgccgggaagggcttgctgcaatgcggtcttcagacgggaggcgtcttctgccctcaccgtctttcaagcccttgtgggtctgaaagagccatgtcggagagagaagggacaggcctgtcccgacctggccgagagcgggcagccccgggggagagcggggcgatcggcctgggctctgtgaggccaggtccaagggaggacgtgtggtcctcgtgacaggtgcacttgcgaaaccttagaagacggggtatgttggaagcggctcctgatgtttaagaaaagggagactgtaaagtgagcagagtcctcaagtgtgttaaggttttaaaggtcaaagtgttttaaacctttgtgactgcagttagcaagcgtgcggggagtgaatggggtgccagggtggccgagaggcagtacgagggccgtgccgtcctctaattcagggcttagttttgcagaataaagtcggcctgttttctaaaagcattgg |
tggtgctgagctggtggaggaggccgcgggcagccctggccacctgcagcaggtggcaggaagcaggtcggccaagaggctattttaggaagccagaaaacacggtcgatgaatttatagcttctggtttccaggaggtggttgggcatggctttgcgcagcgccacagaaccgaaagtgcccactgagaaaaaacaactcctgcttaatttgcatttttctaaaagaagaaacagaggctgacggaaactggaaagttcctgttttaactactcgaattgagttttcggtcttagcttatcaactgctcacttagattcattttcaaagtaaacgtttaagagccgaggcattcctatcctcttctaaggcgttattcctggaggctcattcaccgccagcacctccgctgcctgcaggcattgctgtcaccgtcaccgtgacggcgcgcacgattttcagttggcccgcttcccctcgtgattaggacagacgcgggcactctggcccagccgtcttggctcagtatctgcaggcgtccgtctcgggacggagctcaggggaagagcgtgactccagttgaacgtgatagtcggtgcgttgagaggagacccagtcgggtgtcgagtcagaaggggcccggggcccgaggccctgggcaggacggcccgtgccctgcatcacgggcccagcgtcctagaggcaggactctggtggagagtgtgagggtgcctggggcccctccggagctggggccgtgcggtgcaggttgggctctcggcgcggtgttggctgtttctgcgggatttggaggaattcttccagtgatgggagtcgccagtgaccgggcaccaggctggtaagagggaggccgccgtcgtggccagagcagctgggagggttcggtaaaaggctcgcccgtttcctttaatgaggacttttcctggagggcatttagtctagtcgggaccgttttcgactcgggaagagggatgcggaggagggcatgtgcccaggagccgaaggcgccgcggggagaagcccagggctctcctgtccccacagaggcgacgccactgccgcagacagacagggcctttccctctgatgacggcaaaggcgcctcggctcttgcggggtgctgggggggagtcgccccgaagccgctcacccagaggcctgaggggtgagactgaccgatgcctcttggccgggcctggggccggaccgagggggactccgtggaggcagggcgatggtggctgcgggagggaaccgaccctgggccgagcccggcttggcgattcccgggcgagggccctcagccgaggcgagtgggtccggcggaaccaccctttctggccagcgccacagggctctcgggactgtccggggcgacgctgggctgcccgtggcaggccTGGGCTGACCTGGACTTCACCAGACAGAACAGGGCTTTCAGGGCTGAGCTGAGCCAGGTTTAGCGAGGCCAAGTGGGGCTGAACCAGGCTCAACTGGCCTGAGCTGGGTTGAGCTGGGCTGACCTGGGCTGAGCTGAGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGACTGGCTGAGCTGAGCTGGGTTGAGCTGAGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGTTGAGCTGGGTTGATCTGAGCTGAGCTGGGCTGAGCTGAGCTAGGCTGGGGTGAGCTGGGCTGAGCTGGTTTGAGTTGGGTTGAGCTGAGCTGAGCTGGGCTGTGCTGGCTGAGCTAGGCTGAGCTAGGCTAGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGGGCTGATTTGGGCTGAGCTGAGCTGAGCTAGGCTGCGTTGAGCTGGCTGGGCTGGATTGAGCTGGCTGAGCTGGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGAGCTGGACTGGTTTGAGCTGGGTCGATCTGGGTTGAGCTGTCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCAGCAGAGCTGGGTTGGGCTGAGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGAGCTGAGCTGGGCTGAGCTGGCCTGTGTTGAGCTGGGCTGGGTTGAGCTGGGCTGAGCTGGATTGAGCTGGGTTGAGCTGAGCTGGGCTGGGCTGTGCTGACTGAGCTGGGCTGAGCTAGGCTGGGGTGAGCTGGGCTGAGCTGATCCGAGCTAGGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGGATTGATCTGGCTGAGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGTCTGAGCTGGCCTGGGTCGAGCTGAGCTGGACTGGTTTGAGCTGGGTCGATCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTGAGCTGAGGGCTGGGGTGAGCTGGGCTGAACTAGCCTAGCTAGGTTGGGCTGAGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTAGGCCTGCATTGAGCAGGCTGAGCTGGGCTGAGCAGGCCTGGGGTGAGCTGGGCTAGGTGGAGCTGAGCTGGGTCGAGCTGAGTTGGGCTGAGCTGGCCTGGGTTGAGGTAGGCTGAGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGTTGAGCTGGGCTCGGTTGAGCTGGGCTGAGCTGAGCCGACCTAGGCTGGGATGA |
GCTGGGCTGATTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCCTGGAGCCTGGCCTGGGGTGAGCTGGGCTGAGCTGCGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGATGAGCTGGGCCGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCTGGCCTGGGGTGAGCTGGGCTGAGCTAAGCTGAGCTGGGCTGGTTTGGGCTGAGCTGGCTGAGCTGGGTCCTGCTGAGCTGGGCTGAGCTGACCAGGGGTGAGCTGGGCTGAGTTAGGCTGGGCTCAGCTAGGCTGGGTTGATCTGGCAGGGCTGGTTTGCGCTGGGTCAAGCTCCCGGGAGATGGCCTGGGATGAGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCTGGCCTGGGGTGAGCTGGGCTGGGTGGAGCTGAGCTGGGCTGAACTGGGCTAAGCTGGCTGAGCTGGATCGAGCTGAGCTGGGCTGAGCTGGCCTGGGGTTAGCTGGGCTGAGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGCATTGAGCTGGCTGGGATGGATTGAGCTGGCTGAGCTGGCTGAGCTGGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGGCTCAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGGTGAGCTGGGCTGAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCGAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTGAGCTAGCTGGGCTCAGCTAGGCTGGGTTGAGCTGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAGCTGGGCTGAGCAGAGCTGGGCTGAGCAGAGCTGGGTTGGTCTGAGCTGGGTTGAGCTGGGCTGAGCTGGGCTGAGCAGAGTTGGGTTGAGCTGAGCTGGGTTCAGCTGGGCTGAGCTAGGCTGGGTTGAGCTGGGTTGAGTTGGGCTGAGCTGGGCTGGGTTGAGCGGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAGCGGAACTGGGTTGATCTGAATTGAGCTGGGCTGAGCCGGGCTGAGCCGGGCTGAGCTGGGCTAGGTTGAGCTTGGGTGAGCTTGCCTCAGCTGGTCTGAGCTAGGTTGGGTGGAGCTAGGCTGGATTGAGCTGGGCTGAGCTGAGCTGATCTGGCCTCAGCTGGGCTGAGGTAGGCTGAACTGGGCTGTGCTGGGCTGAGCTGAGCTGAGCCAGTTTGAGCTGGGTTGAGCTGGGCTGAGCTGGGCTGTGTTGATCTTTCCTGAACTGGGCTGAGCTGGGCTGAGCTGGCCTAGCTGGATTGAACGGGGGTAAGCTGGGCCAGGCTGGACTGGGCTGAGCTGAGCTAGGCTGAGCTGAGTTGAATTGGGTTAAGCTGGGCTGAGATGGGCTGAGCTGGGCTGAGCTGGGTTGAGCCAGGTCGGACTGGGTTACCCTGGGCCACACTGGGCTGAGCTGGGCGGAGCTCGattaacctggtcaggctgagtcgggtccagcagacatgcgctggccaggctggcttgacctggacacgttcgatgagctgccttgggatggttcacctcagctgagccaggtggctccagctgggctgagctggtgaccctgggtgacctcggtgaccaggttgtcctgagtccgggccaagccgaggctgcatcagactcgccagacccaaggcctgggccccggctggcaagccaggggcggtgaaggctgggctggcaggactgtcccggaaggaggtgcacgtggagccgcccggaccccgaccggcaggacctggaaagacgcctctcactcccctttctctttctgtcccctctcgggtcctcagAGAGCCAGTCTGCCCCGAATCTCTACCCCCTCGTCTCCTGCGTCAGCCCCCCGTCCGATGAGAGCCTGGTGGCCCTGGGCTGCCTGGCCCGGGACTTCCTGCCCAGCTCCGTCACCTTCTCCTGGAACTACAAGAACAGCAGCAAGGTCAGCAGCCAGAACATCCAGGACTTCCCGTCCGTCCTGAGAGGCGGCAAGTACTTGGCCTCCTCCCGGGTGCTCCTACCCTCTGTGAGCATCCCCCAGGACCCAGAGGCCTTCCTGGTGTGCGAGGTCCAGCACCCCAGTGGCACCAAGTCCGTGTCCATCTCTGGGCCAGgtgagctgggctccccctgtggctgtggcgggggcggggccgggtgccgccggcacagtgacgccccgttcctgcctgcagTCGTAGAGGAGCAGCCCCCCGTCTTGAACATCTTCGTCCCCACCCGGGAGTCCTTCTCCAGTACTCCCCAGCGCACGTCCAAGCTCATCTGCCAGGCCTCAGACTTCAGCCCCAAGCAGATCTCCATGGCCTGGTTCCGTGATGGGAAACGGGTGGTGTCTGGCGTCAGCACAGGCCCCGT |
GGAGACCCTACAGTCCAGTCCGGTGACCTACAGGCTCCACAGCATGCTGACCGTCACGGAGTCCGAGTGGCTCAGCCAGAGCGTCTTCACCTGCCAGGTGGAGCACAAAGGGCTGAACTACGAGAAGAACGCGTCCTCTCTGTGCACCTCCAgtgagtgcagcccctcgggccgggcggcggggcggcgggagccacacacacaccagctgctccctgagccttggcttccgggagtggccaaggcggggaggggctgtgcagggcagctggagggcactgtcagctggggcccagcaccccctcaccccggcagggcccgggctccgaggggccccgcagtcgcaggccctgctcttgggggaagccctacttggccccttcagggcgctgacgctccccccacccacccccgcctagATCCCAACTCTCCCATCACCGTCTTCGCCATCGCCCCCTCCTTCGCTGGCATCTTCCTCACCAAGTCGGCCAAGCTTTCCTGCCTGGTCACGGGCCTCGTCACCAGGGAGAGCCTCAACATCTCCTGGACCCGCCAGGACGGCGAGGTTCTGAAGACCAGTATCGTCTTCTCTGAGATCTACGCCAACGGCACCTTCGGCGCCAGGGGCGAAGCCTCCGTCTGCGTGGAGGACTGGGAGTCGGGCGACAGGTTCACGTGCACGGTGACCCACACGGACCTGCCCTCGCCGCTGAAGCAGAGCGTCTCCAAGCCCAGAGgtaggccctgccctgcccctgcctccgcccggcctgtgccttggccgccggggcgggagccgagcctggccgaggagcgccctcggccccccgcggtcccgacccacacccctcctgctctcctccccagGGATCGCCAGGCACATGCCGTCCGTGTACGTGCTGCCGCCGGCCCCGGAGGAGCTGAGCCTGCAGGAGTGGGCCTCGGTCACCTGCCTGGTGAAGGGCTTCTCCCCGGCGGACGTGTTCGTGCAGTGGCTGCAGAAGGGGGAGCCCGTGTCCGCCGACAAGTACGTGACCAGCGCGCCGGTGCCCGAGCCCGAGCCCAAGGCCCCCGCCTCCTACTTCGTGCAGAGCGTCCTGACGGTGAGCGCCAAGGACTGGAGCGACGGGGAGACCTACACCTGCGTCGTGGGCCACGAGGCCCTGCCCCACACGGTGACCGAGAGGACCGTGGACAAGTCCACCGGTAAACCCACCCTGTACAACGTCTCCCTGGTCCTGTCCGACACGGCCAGCACCTGCTACTGACCCCCTGGCTGCCCGCCGCGGCCGGGGCCAGAGCCCCCGGGCGACCATCGCTCTGTGTGGGCCTGTGTGCAACCCGACCCTGTCGGGGTGAGCGGTCGCATTTCTGAAAATTAGAaataaaAGATCTCGTGCCG | |
Seq ID No.1 | TCTAgAAGACGCTGGAGAGAGGCCagACTTCCTCGGAACAGCTCAAAGAGCTCTGTCAAAGCCAGATCCCATCACACGTGGGCACCAATAGGCCATGCCAGCCTCCAAGGGCCGAACTGGGTTCTCCACGGCGCACATGAAGCCTGCAGCCTGGCTTATCCTCTTCCGTGGTGAAGAGGCAGGCCCGGGACTGGACGAGGGGCTAGCAGGGTGTGGTAGGCACCTTGCGCCCCCCACCCCGGCAGGAACCAGAGACCCTGGGGCTGAGAGTGAGCCTCCAAACAGGATGCCCCACCCTTCAGGCCACCTTTCAATCCAGCTACACTCCACCTGCCATTCTCCTCTGGGCACAGGGCCCAGCCCCTGGATCTTGGCCTTGGCTCGACTTGCACCCACGCGCACACACACACTTCCTAACGTGCTGTCCGCTCACCCCTCCCCAGCGTGGTCCATGGGCAGCACGGCAGTGCGCGTCCGGCGGTAGTGAGTGCAGAGGTCCCTTCCCCTCCCCCAGGAGCCCCAGGGGTGTGTGCAGATCTGGGGGCTCCTGTCCCTTACACCTTCATGCCCCTCCCCTCATACCCACCCTCCAGGCGGGAGGCAGCGAGACCTTTGCCCAGGGACTCAGCCAACGGGCACACGGGAGGCCA GCCCTCAGCAGCTGGG |
Seq ID No.4 | GGCCAGACTTCCTCGGAACAGCTCAAAGAGCTCTGTCAAAGCCAGATCCCATCACACGTGGGCACCAATAGGCCATGCCAGCCTCCAAGGGCCGAACTGGGTTCTCCACGGCGCACATGAAGCCTGCAGCCTGGCTTATCCTCTTCCGTGGTGAAGAGGCAGGCCCGGGACTGGACGAGGGGCTAGCAGGGTGTGGTAGGCACCTTGCGCCCCCCACCCCGGCAGGAACCAGAGACCCTGGGGCTGAGAG |
TGAGCCTCCAAACAGGATGCCCCACCCTTCAGGCCACCTTTCAATCCAGCTACACTCCACCTGCCATTCTCCTCTGGGCACAGGGCCCAGCCCCTGGATCTTGGCCTTGGCTCGACTTGCACCCACGCGCACACACACACTTCCTAACGTGCTGTCCGCTCACCCCTCCCCAGCGTGGTCCATGGGCAGCACGGCAGTGCGCGTCCGGCGGTAGTGAGTGCAGAGGTCCCTTCCCCTCCCCCAGGAGCCCCAGGGGTGTGTGCAGATCTGGGGGCTCCTGTCCCTTACACCTTCATGCCCCTCCCCTCATACCCACCCTCCAGGCGGGAGGCAGCGAGACCTTTGCCCAGGGACTCAGCCAACGGGCACACGGGAGGCCAGCCCTCAGCAGCTGGCTCCCAAAGAGGAGGTGGGAGGTAGGTCCACAGCTGCCACAGAGAGAAACCCTGACGGACCCCACAGGGGCCACGCCAGCCGGAACCAGCTCCCTCGTGGGTGAGCAATGGCCAGGGCCCCGCCGGCCACCACGGCTGGCCTTGCGCCAGCTGAGAACTCACGTCCAGTGCAGGGAGACTCAAGACAGCCTGTGCACACAGCCTCGGATCTGCTCCCATTTCAAGCAGAAAAAGGAAACCGTGCAGGCAGCCCTCAGCATTTCAAGGATTGTAGCAGCGGCCAACTATTCGTCGGCAGTGGCCGATTAGAATGACCGTGGAGAAGGGCGGAAGGGTCTCTCGTGGGCTCTGCGGCCAACAGGCCCTGGCTCCACCTGCCCGCTGCCAGCCCGAGGGGCTTGGGCCGAGCCAGGAACCACAGTGCTCACCGGGACCACAGTGACTGACCAAACTCCCGGCCAGAGCAGCCCCAGGCCAGCCGGGCTCTCGCCCTGGAGGACTCACCATCAGATGCACAAGGGGGCGAGTGTGGAAGAGACGTGTCGCCCGGGCCATTTGGGAAGGCGAAGGGACCTTCCAGGTGGACAGGAGGTGGGACGCACTCCAGGCAAGGGACTGGGTCCCCAAGGCCTGGGGAAGGGGTACTGGCTTGGGGGTTAGCCTGGCCAGGGAACGGGGAGCGGGGCGGGGGGCTGAGCAGGGAGGACCTGACCTCGTGGGAGCGAGGCAAGTCAGGCTTCAGGCAGCAGCCGCACATCCCAGACCAGGAGGCTGAGGCAGGAGGGGCTTGCAGCGGGGCGGGGGCCTGCCTGGCTCCGGGGGCTCCTGGGGGACGCTGGCTCTTGTTTCCGTGTCCCGCAGCACAGGGCCAGCTCGCTGGGCCTATGCTTACCTTGATGTCTGGGGCCGGGGCGTCAGGGTCGTCGTCTCCTCAGGGGAGAGTCCCCTGAGGCTACGCTGGGG*GGGGACTATGGCAGCTCCACCAGGGGCCTGGGGACCAGGGGCCTGGACCAGGCTGCAGCCCGGAGGACGGGCAGGGCTCTGGCTCTCCAGCATCTGGCCCTCGGAAATGGCAGAACCCCTGGCGGGTGAGCGAGCTGAGAGCGGGTCAGACAGACAGGGGCCGGCCGGAAAGGAGAAGTTGGGGGCAGAGCCCGCCAGGGGCCAGGCCCAAGGTTCTGTGTGCCAGGGCCTGGGTGGGCACATTGGTGTGGCCATGGCTACTTAGATTCGTGGGGCCAGGGCATCCTGGTCACCGTCTCCTCAGGTGAGCCTGGTGTCTGATGTCCAGCTAGGCGCTGGTGGGCCGCGGGTGGGCCTGTCTCAGGCTAGGGCAGGGGCTGGGATGTGTATTTGTCAAGGAGGGGCAACAGGGTGCAGACTGTGCCCCTGGAAACTTGACCACTGGGGCAGGGGCGTCCTGGTCACGTCTCCTCAGGTAAGACGGCCCTGTGCCCCTCTCTCGCGGGACTGGAAAAGGAATTTTCCAAGtATTCCTTGGTCTGTGTGGGGCCCTCTGGGGCCCCCGGGGGTGGCTCCCCTCCTGCCCAGATGGGGCCTCGGCCTGTGGAGCACGGGCTGGGCACACAGCTCGAGTCTAGGGCCACAGAGGCCCGGGCTCAGGGCTCTGTGTGGCCCGGCGACTGGCAGGGGGCTCGGGTTTTTGGACACCCCCTAATGGGGGCCACAGCACTGTGACCATCTTCACAGCTGGGGCCGAGGAGTCGAGGTCACCGTCTCCTCAGGTGAGTCCTCGTCAGCCCTCTCTCACTCTCTGGGGGGTTTTGCTGCATTTTGTGGGGGAAAGAGGATGCCTGGGTCTCAGGTCTAAAGGTCTAGGGCCAGCGCCGGGGCCCAGGAAGGGGCCGAGGGGCCAGGCTCGGCTCGGCCAGGAGCAGAGCTTC |
CAGACATCTCGCCTCCTGGCGGCTGCAGTCAGGCCTTTGGCCGGGGGGGTCTCAGCACCACCAGGCCTCTTGGCTCCCGAGGTCCCCGGCCCCGGCTGCCTTCACCAGGCACCGTGCGCGGTGGGCCCGGGCTCTTGGTCGGCCACCCTTTCTTAACTGGGATCCGGGCTTAGTTGTCGCAATGTGACAACGGGCTCGAAAGCTGGGGCCAGGGGACCCTAGT*TACGACGCCTCGGGTGGGTGTCCCGCACCCCTCCCCACTTTCACGGCACTCGGCGAGACCTGGGGAGTCAGGTGTTGGGGACACTTTGGAGGTCAGGAACGGGAGCTGGGGAGAGGGCTCTGTCAGCGGGGTCCAGAGATGGGCCGCCCTCCAAGGACGCCCTGCGCGGGGACAAGGGCTTCTTGGCCTGGCCTGGCCGCTTCACTTGGGCGTCAGGGGGGGCTTCCCGGGGCAGGCGGTCAGTCGAGGCGGGTTGGAATTCTGAGTCTGGGTTCGGGGTTCGGGGTTCGGCCTTCATGAACAGACAGCCCAGGCGGGCCGTTGTTTGGCCCCTGGGGGCCTGGTTGGAATGCGAGGTCTCGGGAAGTCAGGAGGGAGCCTGGCCAGCAGAGGGTTCCCAGCCCTGCGGCCGAGGGACCTGGAGACGGGCAGGGCATTGGCCGTCGCAGGGCCAGGCCACACCCCCCAGGTTTTTGTGGGGCGAGCCTGGAGATTGCACCACTGTGATTACTATGCTATGGATCTCTGGGGCCCAGGCGTTGAAGTCGTCGTGTCCTCAGGTAAGAACGGCCCTCCAGGGCCTTTAATTTCTGCTCTCGTCTGTGGGCTTTTCTGACTCTGATCCTCGGGAGGCGTCTGTGCCCCCCCCGGGGATGAGGCCGGCTTGCCAGGAGGGGTCAGGGACCAGGAGCCTGTGGGAAGTTCTGACGGGGGCTGCAGGCGGGAAGGGCCCCACCGGGGGGCGAGCCCCAGGCCGCTGGGCGGCAGGAGACCCGTGAGAGTGCGCCTTGAGGAGGGTGTCTGCGGAACCACGAACGCCCGCCGGGAAGGGCTTGCTGCAATGCGGTCTTCAGACGGGAGGCGTCTTCTGCCCTCACCGTCTTTCAAGCCCTTGTGGGTCTGAAAGAGCCATGTCGGAGAGAGAAGGGACAGGCCTGTCCCGACCTGGCCGAGAGCGGGCAGCCCCGGGGGAGAGCGGGGCGATCGGCCTGGGCTCTGTGAGGCCAGGTCCAAGGGAGGACGTGTGGTCCTCGTGACAGGTGCACTTGCGAAACCTTAGAAGACGGGGTATGTTGGAAGCGGCTCCTGATGTTTAAGAAAAGGGAGACTGTAAAGTGAGCAGAGTCCTCAAGTGTGTTAAGGTTTTAAAGGTCAAAGTGTTTTAAACCTTTGTGACTGCAGTTAGCAAGCGTGCGGGGAGTGAATGGGGTGCCAGGGTGGCCGAGAGGCAGTACGAGGGCCGTGCCGTCCTCTAATTCAGGGCTTAGTTTTGCAGAATAAAGTCGGCCTGTTTTCTAAAAGCATTGGTGGTGCTGAGCTGGTGGAGGAGGCCGCGGGCAGCCCTGGCCACCTGCAGCAGGTGGCAGGAAGCAGGTCGGCCAAGAGGCTATTTTAGGAAGCCAGAAAACACGGTCGATGAATTTATAGCTTCTGGTTTCCAGGAGGTGGTTGGGCATGGCTTTGCGCAGCGCCACAGAACCGAAAGTGCCCACTGAGAAAAAACAACTCCTGCTTAATTTGCATTTTTCTAAAAGAAGAAACAGAGGCTGACGGAAACTGGAAAGTTCCTGTTTTAACTACTCGAATTGAGTTTTCGGTCTTAGCTTATCAACTGCTCACTTAGATTCATTTTCAAAGTAAACGTTTAAGAGCCGAGGCATTCCTATCCTCTTCTAAGGCGTTATTCCTGGAGGCTCATTCACCGCCAGCACCTCCGCTGCCTGCAGGCATTGCTGTCACCGTCACCGTGACGGCGCGCACGATTTTCAGTTGGCCCGCTTCCCCTCGTGATTAGGACAGACGCGGGCACTCTGGCCCAGCCGTCTTGGCTCAGTATCTGCAGGCGTCCGTCTCGGGACGGAGCTCAGGGGAAGAGCGTGACTCCAGTTGAACGTGATAGTCGGTGCGTTGAGAGGAGACCCAGTCGGGTGTCGAGTCAGAAGGGGCCCGGGGCCCGAGGCCCTGGGCAGGACGGCC |
CGTGCCCTGCATCACGGGCCCAGCGTCCTAGAGGCAGGACTCTGGTGGAGAGTGTGAGGGTGCCTGGGGCCCCTCCGGAGCTGGGGCCGTGCGGTGCAGGTTGGGCTCTCGGCGCGGTGTTGGCTGTTTCTGCGGGATTTGGAGGAATTCTTCCAGTGATGGGAGTCGCCAGTGACCGGGCACCAGGCTGGTAAGAGGGAGGCCGCCGTCGTGGCCAGAGCAGCTGGGAGGGTTCGGTAAAAGGCTCGCCCGTTTCCTTTAATGAGGACTTTTCCTGGAGGGCATTTAGTCTAGTCGGGACCGTTTTCGACTCGGGAAGAGGGATGCGGAGGAGGGCATGTGCCCAGGAGCCGAAGGCGCCGCGGGGAGAAGCCCAGGGCTCTCCTGTCCCCACAGAGGCGACGCCACTGCCGCAGACAGACAGGGCCTTTCCCTCTGATGACGGCAAAGGCGCCTCGGCTCTTGCGGGGTGCTGGGGGGGAGTCGCCCCGAAGCCGCTCACCCAGAGGCCTGAGGGGTGAGACTGACCGATGCCTCTTGGCCGGGCCTGGGGCCGGACCGAGGGGGACTCCGTGGAGGCAGGGCGATGGTGGCTGCGGGAGGGAACCGACCCTGGGCCGAGCCCGGCTTGGCGATTCCCGGGCGAGGGCCCTCAGCCGAGGCGAGTGGGTCCGGCGGAACCACCCTTTCTGGCCAGCGCCACAGGGCTCTCGGGACTGTCCGGGGCGACGCTGGGCTGCCCGTGGCAGGCCTGGGCTGACCTGGACTTCACCAGACAGAACAGGGCTTTCAGGGCTGAGCTGAGCCAGGTTTAGCGAGGCCAAGTGGGGCTGAACCAGGCTCAACTGGCCTGAGCTGGGTTGAGCTGGGCTGACCTGGGCTGAGCTGAGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGACTGGCTGAGCTGAGCTGGGTTGAGCTGAGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGTTGAGCTGGGTTGATCTGAGCTGAGCTGGGCTGAGCTGAGCTAGGCTGGGGTGAGCTGGGCTGAGCTGGTTTGAGTTGGGTTGAGCTGAGCTGAGCTGGGCTGTGCTGGCTGAGCTAGGCTGAGCTAGGCTAGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGGGCTGATTTGGGCTGAGCTGAGCTGAGCTAGGCTGCGTTGAGCTGGCTGGGCTGGATTGAGCTGGCTGAGCTGGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGAGCTGGACTGGTTTGAGCTGGGTCGATCTGGGTTGAGCTGTCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCAGCAGAGCTGGGTTGGGCTGAGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGAGCTGAGCTGGGCTGAGCTGGCCTGTGTTGAGCTGGGCTGGGTTGAGCTGGGCTGAGCTGGATTGAGCTGGGTTGAGCTGAGCTGGGCTGGGCTGTGCTGACTGAGCTGGGCTGAGCTAGGCTGGGGTGAGCTGGGCTGAGCTGATCCGAGCTAGGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGGATTGATCTGGCTGAGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGTCTGAGCTGGCCTGGGTCGAGCTGAGCTGGACTGGTTTGAGCTGGGTCGATCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTGAGCTGAGGGCTGGGGTGAGCTGGGCTGAACTAGCCTAGCTAGGTTGGGCTGAGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCAGGCCTGGGGTGAGCTGGGCTAGGTGGAGCTGAGCTGGGTCGAGCTGAGTTGGGCTGAGCTGGCCTGGGTTGAGGTAGGCTGAGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGTTGAGCTGGGCTCGGTTGAGCTGGGCTGAGCTGAGCCGACCTAGGCTGGGATGAGCTGGGCTGATTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCCTGGAGCCTGGCCTGGGGTGAGCTGGGCTGAGCTGCGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGATGAGCTGGGCCGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCTGGCCTGGGGTGAGCTGGGCTGAGCTAAGCTGAGCTGGGCTGGTTTGGGCTGAGCTGGCTGAGCTGGGTCCTGCTGAGCTGGGCTGAGCTGACCAGGGGTGAGCTGGGCTGAGTTAGGCTGGGCTCAGCTAGG |
CTGGGTTGATCTGGCAGGGCTGGTTTGCGCTGGGTCAAGCTCCCGGGAGATGGCCTGGGATGAGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCTGGCCTGGGGTGAGCTGGGCTGGGTGGAGCTGAGCTGGGCTGAACTGGGCTAAGCTGGCTGAGCTGGATCGAGCTGAGCTGGGCTGAGCTGGCCTGGGGTTAGCTGGGCTGAGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGCATTGAGCTGGCTGGGATGGATTGAGCTGGCTGAGCTGGCTGAGCTGGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGGCTCAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGGTGAGCTGGGCTGAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCGAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTGAGCTAGCTGGGCTCAGCTAGGCTGGGTTGAGCTGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAGCTGGGCTGAGCAGAGCTGGGCTGAGCAGAGCTGGGTTGGTCTGAGCTGGGTTGAGCTGGGCTGAGCTGGGCTGAGCAGAGTTGGGTTGAGCTGAGCTGGGTTCAGCTGGGCTGAGCTAGGCTGGGTTGAGCTGGGTTGAGTTGGGCTGAGCTGGGCTGGGTTGAGCGGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAGCGGAACTGGGTTGATCTGAATTGAGCTGGGCTGAGCCGGGCTGAGCCGGGCTGAGCTGGGCTAGGTTGAGCTTGGGTGAGCTTGCCTCAGCTGGTCTGAGCTAGGTTGGGTGGAGCTAGGCTGGATTGAGCTGGGCTGAGCTGAGCTGATCTGGCCTCAGCTGGGCTGAGGTAGGCTGAACTGGGCTGTGCTGGGCTGAGCTGAGCTGAGCCAGTTTGAGCTGGGTTGAGCTGGGCTGAGCTGGGCTGTGTTGATCTTTCCTGAACTGGGCTGAGCTGGGCTGAGCTGGCCTAGCTGGATTGAACGGGGGTAAGCTGGGCCAGGCTGGACTGGGCTGAGCTGAGCTAGGCTGAGCTGAGTTGAATTGGGTTAAGCTGGGCTGAGATGGGCTGAGCTGGGCTGAGCTGGGTTGAGCCAGGTCGGACTGGGTTACCCTGGGCCACACTGGGCTGAGCTGGGCGGAGCTCGATTAACCTGGTCAGGCTGAGTCGGGTCCAGCAGACATGCGCTGGCCAGGCTGGCTTGACCTGGACACGTTCGATGAGCTGCCTTGGGATGGTTCACCTCAGCTGAGCCAGGTGGCTCCAGCTGGGCTGAGCTGGTGACCCTGGGTGACCTCGGTGACCAGGTTGTCCTGAGTCCGGGCCAAGCCGAGGCTGCATCAGACTCGCCAGACCCAAGGCCTGGGCCCCGGCTGGCAAGCCAGGGGCGGTGAAGGCTGGGCTGGCAGGACTGTCCCGGAAGGAGGTGCACGTGGAGCCGCCCGGACCCCGACCGGCAGGACCTGGAAAGACGCCTCTCACTCCCCTTTCTCTTCTGTCCCCTCTCGGGTCCTCAGAGAGCCAGTCTGCCCCGAATCTCTACCCCCTCGTCTCCTGCGTCAGCCCCCCGTCCGATGAGAGCCTGGTGGCCCTGGGCTGCCTGGCCCGGGACTTCCTGCCCAGCTCCGTCACCTTCTCCTGGAA |
猪κ轻链
在另一实施方案中,提供了编码有蹄类动物免疫球蛋白的κ轻链基因座的新的基因组序列。本发明提供了有蹄类动物κ轻链区的首次报导的基因组序列。在一个实施方案中,提供了编码猪κ轻链基因座的核酸序列。在另一实施方案中,该核酸序列可以含有κ轻链的至少一个连接区、一个恒定区和/或一个增强子区。在另一实施方案中,该核苷酸序列可以包括至少五个连接区、一个恒定区和一个增强子区,例如,如Seq ID No.30中表示。在另一实施方案中,提供了分离的核苷酸序列,其含有猪基因组κ轻链的至少一个、至少两个、至少三个、至少四或者五个连接区和连接区的3’侧翼序列,例如,如Seq ID No 12中表示。在另一实施方案中,提供了猪基因组κ轻链的分离的核苷酸序列,其含有第一个连接区的5’侧翼序列,如Seq ID No25中表示。在另一实施方案中,提供了分离的核苷酸序列,其含有猪基因组κ轻链的恒定区的3’侧翼序列和任选地,增强子区的5’部分,如Seq ID Nos.15、16和/或19中表示。
在其他实施方案中,提供了如Seq ID Nos 30、12、25、15、16或19中所述的分离的核苷酸序列。还提供了与Seq ID Nos 30、12、25、15、16或19至少80、85、90、95、98或99%同源的核酸序列。此外,提供了含有Seq ID Nos 30、12、25、15、16或19的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。此外,提供了含有Seq ID No.1、4或29的至少10、15、17、20、25或30个连续核苷酸的核苷酸序列。在其他实施方案中,提供了含有Seq ID No.30的至少50、100、1,000、2,500、5,000、7,000、8,000、8,500、9,000、10,000或15,000个连续核苷酸的核苷酸序列。还提供了任选在严格条件下与Seq ID Nos 30、12、25、15、16或19杂交的核苷酸序列,以及其同源核苷酸。
在一个实施方案中,提供了编码κ轻链的分离的核苷酸序列,其包括至少五个连接区、一个恒定区和一个增强子区,例如,如Seq IDNo.30中表示。在Seq ID No.30中,κ轻链的编码区例如通过残基1-549和10026-10549表示,而内含子序列例如通过残基550-10025表示,κ轻链的连接区例如通过残基5822-7207(例如,J1:5822-5859,J2:6180-6218,J3:6486-6523,J4:6826-6863,J5:7170-7207)表示,恒定区通过下面的残基表示:10026-10549(C外显子)和10026-10354(C编码),10524-10529(聚腺苷酸信号)和11160-11264(SINE元件)。
Seq ID No 30 | GCGTCCGAAGTCAAAAATATCTGCAGCCTTCATGTATTCATAGAAACAAGGAATGTCTACATTTTCCAAAGTGGGACCAGAATCTTGGGTCATGTCTAAGGCATGTGCATTTGCACATGGTAGGCAAAGGACTTTGCTTCTCCCAGCACATCTTTCTGCAGAGATCCATGGAAACAAGACTCAACTCCAAAGCAGCAAAGAAGCAGCAAGTTCTCAAGTGATCTCCTCTGACTCCCTCCTCCCAGGCTAATGAAGCCATGTTGCCCCTGGGGGATTAAGGGCAGGTGTCCATTGTGGCACCCAGCCCGAAGACAAGCAATTTGATCAGGTTCTGAGCACTCCTGAATGTGGACTCTGGAATTTTCTCCTCACCTTGTGGCATATCAGCTTAAGTCAAGTACAAGTGACAAACAACATAATCCTAAGAAGAGAGGAATCAAGCTGAAGTCAAAGGATCACTGCCTTGGATTCTACTGTGAATGATGACCTGGAAAATATCCTGAACAACAGCTTCAGGGTGATCATCAGAGACAAAAGTTCCAGAGCCAGgtagggaaaccctcaagccttgcaaagagcaaaatcatgccattgggttcttaacctgctgagtgatttactatatgttactgtgggaggcaaagcgctcaaatagcctgggtaagtatgtcaaataaaaagcaaaagtggtgtttcttgaaatgttagacctgaggaaggaatattgataacttaccaataattttcagaatgatttatagatgtgcacttagtcagtgtctctccaccccgcacctgacaagcagtttagaatttattctaagaatctaggtttgctgggggctacatgggaatcagcttcagtgaagagtttgttggaatgattcactaaattttctatttccagcataaatccaagaacctctcagactagtttattgacactgcttttcctccataatccatctcatctccgtccatcatggacactttgtagaatgacaggtcctggcagagactcacagatgcttctgaaacatcctttgccttcaaagaatgaacagcacacatactaaggatctcagtgatccacaaattagtttttgccacaatggttcttatgataaaagtctttcattaacagcaaattgttttataatagttgttctgctttataataattgcatgcttcactttcttttcttttctttttttttctttttttgctttttagtgccgcaggtgcagcatatgaaatttcccaggctaggggtcaaatcagaactacacctactggcctacgccacagccacagcaactcaggatctaagccatgtcggtgacctacactacagctcatggcaatgccagatccttaacccaatgagcgaggccagggatcgaacccatgtcctcatggatactagtcaggctcattatccgctgagccataacaggaactcccgagtttgctttttatcaaaattggtacagccttattgtttctgaaaaccacaaaatgaatgtattcacataattttaaaaggttaaataatttatgatatacaagacaatagaaagagaaaacgtcattgcctctttcttccacgacaacacgcctccttaattgatttgaagaaataactactgagcatggtttagttgacttctttcagcaattagcctgtattcatagccatacatattcaattaaaatgagatcatgatatcacacaatacataccatacagcctatagggatttttacaatcatcttccacatgactacataaaaacctacctaaaaaaaaaaaaaaccctacttcatcctcctattggctgctttgtgctccattaaaaagctctatcataattaggttatgatgaggatttccattttctacctttcaagcaacatttcaatgcacagtcttatatacacatttgagcctacttttctttttctttctttttttggttttttttttttttttttttttggtctttttgtcttttcttaggctgcatatggaggttcccaggctagctgtctaatcagaactatagctgctggcctacgccacatccacagcaatacaagatctgagccatgtctgcaacttacaccacagctcacagcaacggtggatccttaaaccactgagcaaggccagggatcaaacccataacttcatggctcctagttggatttgttaaccactgagccatgatggcaactcctgagcctacttttctaatcatttccaaccctaggacacttttttaagtttcatttttctccccccaccccctgttttctgaagtgtgtttgcttccactgggtgacttcactcccaggatctcatctgcaggatactgcagctaagtgtatgagctctgaatttgaatcccaactctgccactcaaagggataggagtttccgatgtggcccaatgggatcagtggcatctctgcagtgccaggacgcaggttccatccctggcccagcacagtgggttaagaatctggcattgctgcagctgaggcatagatttcaattgtgcctcagatctgatccttggcccaaggactgcatatgcctcagggcaaccaaaaaagagaaaaggggggtgatagcattagtttctagatttgggggataattaaataaagtgatccatgtacaatgtatggcattttgtaaatgctcaacaaatttcaactattatggagttcccatcatggctca |
gtggaagggaatctgattagcatccatgaggacacaggtccaaccccgaccttgctcagtgggcattgctgtgagctgtggcatgggttacagacgaagctcggatctggcattgctgtggctgtggtgtaagccagcaactacagctctcattcagcccctagcctgggaacctccatatgcctaaaagacaaaaaataaaatttaaattaaaaataaagaaatgttaactattatgattggtactgcttgcattactgcaaagaaagtcactttctatactctttaatatcttagttgactgtgtgctcagtgaactattttggacacttaatttccactctcttctatctccaacttgacaactctctttcctctcttctggtgagatccactgctgactttgctctttaaggcaactagaaaagtgctcagtgacaaaatcaaagaaagttaccttaatcttcagaattacaatcttaagttctcttgtaaagcttactatttcagtggttagtattattccttggtcccttacaacttatcagctctgatctattgctgattttcaactatttattgttggagttttttccttttttccctgttcattctgcaaatgtttgctgagcatttgtcaagtgaagatactggactgggccttccaaatataagacaatgaaacatcgggagttctcattatggtgcagcagaaacgaatccaactaggaaatgtgaggttgcaggttcgatccctgcccttgctcagtgggttaaggatccagcattaccgtgagctgtggtgtaggttgcagacgtggctcagatcctgcgttgctgtggctgtggcataggctggcagctctagctctgattcgaccgctagcctgggaacctccatgcgccccgagtgcagcccttaaaaagcaaaaaaaaaagaaagaaagaaaaagacaatgaaacatcaaacagctaacaatccagtagggtagaaagaatctggcaacagataagagcgattaaatgttctaggtccagtgaccttgcctctgtgctctacacagtcgtgccacttgctgagggagaaggtctctcttgagttgagtcctgaaagacattagttgttcacaaactaatgccagtgagtgaaggtgtttccaagcagagggagagtttggtaaaaagctggaagtcacagaaagactctaaagagtttaggatggtgggagcaacatacgctgagatggggctggaaggttaagagggaaacaactatagtaagtgaagctggactcacagcaaagtgaggacctcagcatccttgatggggttaccatggaaacaccaaggcacaccttgatttccaaaacagcaggcacctgattcagcccaatgtgacatggtgggtacccctctagctctacctgttctgtgacaactgacaaccaacgaagttaagtctggattttctactctgctgatccttgtttttgtttcacacgtcatctatagcttcatgccaaaatagagttcaaggtaagacgcgggccttggtttgatatacatgtagtctatcttgtttgagacaatatggtggcaaggaagaggttcaaacaggaaaatactctctaattatgattaactgagaaaagctaaagagtcccataatgacactgaatgaagttcatcatttgcaaaagccttcccccccccccaggagactataaaaaagtgcaattttttaaatgaacttatttacaaaacagaaatagactcacagacataggaaacgaacagatggttaccaagggtgaaagggagtaggagggataaataaggagtctggggttagcagatacaccccagtgtacacaaaataaacaacagggacctactatatagcacagggaactatatgcagtagcttacaataacctataatggaaaagaatgtgaaaaagaatatatgtatgcgtgtgtgtgtaactgaatcactttgctgtaacctgaatctaacataacattgtaaatcaactacagttttttttttttttaagtgcagggttttggtgttttttttttttcatttttgtttttgtttttgttttttgctttttagggccacacccagacatatgggggttcccaggctaggggtctaattagagctacagttgccggcttgcaccacagccacagcaacatcagatccgagccgcacttgcgacttacaccgcagctcatggcaataccagatccttaacccactgagcaaggcccagggatcgtacccgcaacctcatggttcctagtcagattcatttctgctgcgctacaatgggaactccaagtgcagttttttgtaatgtgcttgtctttctttgtaattcatattcatcctacttcccaataaataaataaatacataaataataaacataccattgtaaatcaactacaattttttttaaatgcagggtttttgttttttgttttttgttttgtctttttgccttttctagggccgctcccatggcatatggaggttcccaggctaggggtcgaatcggagctgtagccaccggcctacgccagagccacagcaacgcgggatccgagccgcgtctgcaacctacaccacagctcacggcaacgccggatcgttaacccactgagcaagggcagggatcgaacctgcaacctcatggttcctagtcagattcgttaactactgagccacaacggaaactcctaaagtgcagtttttaaatgtgcttgtctttctttgtaatttacactc |
aacctacttcccaataaataaataaataaacaaataaatcatagacatggttgaattctaaaggaagggaccatcaggccttagacagaaatacgtcatcttctagtattttaaaacacactaaagaagacaaacatgctctgccagagaagcccagggcctccacagctgcttgcaaagggagttaggcttcagtagctgacccaaggctctgttcctcttcagggaaaagggtttttgttcagtgagacagcagacagctgtcactgtgGTGGACGTTCGGCCAAGGAACCAAGCTGGAACTCAAACgtaagtcaatccaaacgttccttccttggctgtctgtgtcttacggtctctgtggctctgaaatgattcatgtgctgactctctgaaaccagactgacattctccagggcaaaactaaagcctgtcatcaaactggaaaactgagggcacattttctgggcagaactaagagtcaggcactgggtgaggaaaaacttgttagaatgatagtttcagaaacttactgggaagcaaagcccatgttctgaacagagctctgctcaagggtcaggaggggaaccagtttttgtacaggagggaagttgagacgaacccctgtgTATATGGTTTCGGCGCGGGGACCAAGCTGGAGCTCAAACgtaagtggctttttccgactgattctttgctgtttctaattgttggttggctttttgtccatttttcagtgttttcatcgaattagttgtcagggaccaaacaaattgccttcccagattaggtaccagggaggggacattgctgcatgggagaccagagggtggctaatttttaacgtttccaagccaaaataactggggaagggggcttgctgtcctgtgagggtaggtttttatagaagtggaagttaaggggaaatcgctatgGTTCACTTTTGGCTCGGGGACCAAAGTGGAGCCCAAAAttgagtacattttccatcaattatttgtgagatttttgtcctgttgtgtcatttgtgcaagtttttgacattttggttgaatgagccattcccagggacccaaaaggatgagaccgaaaagtagaaaagagccaacttttaagctgagcagacagaccgaattgttgagtttgtgaggagagtagggtttgtagggagaaaggggaacagatcgctggctttttctctgaattagcctttctcatgggactggcttcagagggggtttttgatgagggaagtgttctagagccttaactgtgGGTTGTGTTCGGTAGCGGGACCAAGCTGGAAATCAAACgtaagtgcacttttctactcctttttctttcttatacgggtgtgaaattggggacttttcatgtttggagtatgagttgaggtcagttctgaagagagtgggactcatccaaaaatctgaggagtaagggtcagaacagagttgtctcatggaagaacaaagacctagttagttgatgaggcagctaaatgagtcagttgacttgggatccaaatggccagacttcgtctgtaaccaacaatctaatgagatgtagcagcaaaaagagatttccattgaggggaaagtaaaattgttaatattgtgGATCACCTTTGGTGAAGGGACATCCGTGGAGATTGAACgtaagtattttttctctactaccttctgaaatttgtctaaatgccagtgttgacttttagaggcttaagtgtcagttttgtgaaaaatgggtaaacaagagcatttcatatttattatcagtttcaaaagttaaactcagctccaaaaatgaatttgtagacaaaaagattaatttaagccaaattgaatgattcaaaggaaaaaaaaattagtgtagatgaaaaaggaattcttacagctccaaagagcaaaagcgaattaattttctttgaactttgccaaatcttgtaaatgatttttgttctttacaatttaaaaaggttagagaaatgtatttcttagtctgttttctctcttctgtctgataaattattatatgagataataatgaaaattaataggatgtgctaaaaaatcagtaagaagttagaaaaatatatgtttatgttaaagttgccacttaattgagaatcagaagcaatgttatttttaaagtctaaaatgagagataaactgtcaatacttaaattctgcagagattctatatcttgacagatatctcctttttcaaaaatccaatttctatggtagactaaatttgaaatgatcttcctcataatggagggaaaagatggactgaccccaaaagctcagatttaaagaaatctgtttaagtgaaagaaaataaaagaactgcattttttaaaggcccatgaatttgtagaaaaataggaaatattttaataagtgtattcttttattttcctgttattacttgatggtgtttttataccgccaaggaggccgtggcaccgtcagtgtgatctgtagaccccatggcggccttttttcgcgattgaatgaccttggcggtgggtccccagggctctggtggcagcgcaccagccgctaaaagccgctaaaaactgccgctaaaggccacagcaaccccgcgaccgcccgttcaactgtgctgacacagtgatacagataatgtcgctaacagaggagaatagaaatatgacgggcacacgctaatgtggggaaaagagggagaagcctgatttttattttttagagattctagagataaaattcccagtattatatccttttaataaaaaatttctattaggagatta |
taaagaatttaaagctatttttttaagtggggtgtaattctttcagtagtctcttgtcaaatggatttaagtaatagaggcttaatccaaatgagagaaatagacgcataaccctttcaaggcaaaagctacaagagcaaaaattgaacacagcagccagccatctagccactcagattttgatcagttttactgagtttgaagtaaatatcatgaaggtataattgctgataaaaaaataagatacaggtgtgacacatctttaagtttcagaaatttaatggcttcagtaggattatatttcacgtatacaaagtatctaagcagataaaaatgccattaatggaaacttaatagaaatatatttttaaattccttcattctgtgacagaaattttctaatctgggtcttttaatcacctaccctttgaaagagtttagtaatttgctatttgccatcgctgtttactccagctaatttcaaaagtgatacttgagaaagattatttttggtttgcaaccacctggcaggactattttagggccattttaaaactcttttcaaactaagtattttaaactgttctaaaccatttagggccttttaaaaatcttttcatgaatttcaaacttcgttaaaagttattaaggtgtctggcaagaacttccttatcaaatatgctaatagtttaatctgttaatgcaggatataaaattaaagtgatcaaggcttgacccaaacaggagtatcttcatagcatatttcccctcctttttttctagaattcatatgattttgctgccaaggctattttatataatctctggaaaaaaaatagtaatgaaggttaaaagagaagaaaatatcagaacattaagaattcggtattttactaactgcttggttaacatgaaggtttttattttattaaggtttctatctttataaaaatctgttcccttttctgctgatttctccaagcaaaagattcttgatttgttttttaactcttactctcccacccaagggcctgaatgcccacaaaggggacttccaggaggccatctggcagctgctcaccgtcagaagtgaagccagccagttcctcctgggcaggtggccaaaattacagttgacccctcctggtctggctgaaccttgccccatatggtgacagccatctggccagggcccaggtctccctctgaagcctttgggaggagagggagagtggctggcccgatcacagatgcggaaggggctgactcctcaaccggggtgcagactctgcagggtgggtctgggcccaacacacccaaagcacgcccaggaaggaaaggcagcttggtatcactgcccagagctaggagaggcaccgggaaaatgatctgtccaagacccgttcttgcttctaaactccgagggggtcagatgaagtggttttgtttcttggcctgaagcatcgtgttccctgcaagaagcggggaacacagaggaaggagagaaaagatgaactgaacaaagcatgcaaggcaaaaaaggccttaggatggctgcaggaagttagttcttctgcattggctccttactggctcgtcgatcgcccacaaacaacgcacccagtggagaacttccctgttacttaaacaccattctctgtgcttgcttcctcagGGGCTGATGCCAAGCCATCCGTCTTCATCTTCCCGCCATCGAAGGAGCAGTTAGCGACCCCAACTGTCTCTGTGGTGTGCTTGATCAATAACTTCTTCCCCAGAGAAATCAGTGTCAAGTGGAAAGTGGATGGGGTGGTCCAAAGCAGTGGTCATCCGGATAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTCTCGCTGCCCACGTCACAGTACCTAAGTCATAATTTATATTCCTGTGAGGTCACCCACAAGACCCTGGCCTCCCCTCTGGTCACAAGCTTCAACAGGAACGAGTGTGAGGCTtagAGGCCCACAGGCCCCTGGCCTGCCCCCAGCCCCAGCCCCCCTCCCCACCTCAAGCCTCAGGCCCTTGCCCCAGAGGATCCTTGGCAATCCCCCAGCCCCTCTTCCCTCCTCATCCCCTCCCCCTCTTTGGCTTTAACCGTGTTAATACTGGGGGGTGGGGGAATGAATAaataaaGTGAACCTTTGCACCTGTGAtttctctctcctgtctgattttaaggttgttaaatgttgttttccccattatagttaatcttttaaggaactacatactgagttgctaaaaactacaccatcacttataaaattcacgccttctcagttctcccctcccctcctgtcctccgtaagacaggcctccgtgaaacccataagcacttctctttacaccctctcctgggccggggtaggagactttttgatgtcccctcttcagcaagcctcagaaccattttgagggggacagttcttacagtcacat*tcctgtgatctaatgactttagttaccgaaaagccagtctctcaaaaagaagggaacggctagaaaccaagtcatagaaatatatatgtataaaatatatatatatccatatatgtaaaataacaaaataatgataacagcataggtcaacaggcaacagggaatgttgaagtccattctggcacttcaatttaagggaataggatgccttcattacattttaaatacaatacacatggagagcttcctatctgccaaagaccatcctgaatgccttccacactcactacaaggttaaaagcattcattacaat |
gttgatcgaggagttcccgttgtggctcagcaggttaagaacgtgactggtatccaggaggatgcgggtttggtccccagcctcgctcagtggattaaggatccagtgttgctgcaagctcacgggctcagatcccgtgttctatggctatggtgtaggctggtagctgcatgcagccctaatttgacccctagcctgggaactgccatatgccacatgtgaggcccttaaaacctaaaagaaaaaaaaagaaaagaaatatcttacacccaatttatagataagagagaagctaaggtggcaggcccaggatcaaagccctacctgcctatcttgacacctgatacaaattctgtcttctagggtttccaacactgcatagaacagagggtcaaacatgctaccctcccagggactcctcccttcaaatgacttaaattttgttgcccatctctgggggcaaaactcaacaatcaatggcatctctagtaccaagcaaggctcttctcatgaagcaaaactctgaagccagatccatcatgacccaaggaagtaaagacaggtgttactggttgaactgtatccttcaattcaatatgctcaatttccaactcccagtccccgtaaatacaaccccctttgggaagagagtccttgcagatgtagccacgttaaaaagagattatacagaaaggctagtgaggatgcagtgaaacgggatctttcatacattgctggtggaaatgtaaaatgctgcaggcactctagaaaataatttgccagttttttgaaaagctaaacaaaatagtttagttgcattctgggttatttatcccccagaaattaaaaattatgtccgcacaaaaacgtgtacataatcattcataacagccttgtac |
Seq ID No.12 | caaggaaccaagctggaactcaaacgtaagtcaatccaaacgttccttccttggctgtctgtgtcttacggtctctgtggctctgaaatgattcatgtgctgactctctgaaaccagactgacattctccagggcaaaactaaagcctgtcatcaaactggaaaactgagggcacattttctgggcagaactaagagtcaggcactgggtgaggaaaaacttgttagaatgatagtttcagaaacttactgggaagcaaagcccatgttctgaacagagctctgctcaagggtcaggaggggaaccagtttttgtacaggagggaagttgagacgaacccctgtgtatatggtttcggcgcggggaccaagctggagctcaaacgtaagtggctttttccgactgattctttgctgtttctaattgttggttggctttttgtccatttttcagtgttttcatcgaattagttgtcagggaccaaacaaattgccttcccagattaggtaccagggaggggacattgctgcatgggagaccagagggtggctaatttttaacgtttccaagccaaaataactggggaagggggcttgctgtcctgtgagggtaggtttttatagaagtggaagttaaggggaaatcgctatggttcacttttggctcggggaccaaagtggagcccaaaattgagtacattttccatcaattatttgtgagatttttgtcctgttgtgtcatttgtgcaagtttttgacattttggttgaatgagccattcccagggacccaaaaggatgagaccgaaaagtagaaaagagccaacttttaagctgagcagacagaccgaattgttgagtttgtgaggagagtagggtttgtagggagaaaggggaacagatcgctggctttttctctgaattagcctttctcatgggactggcttcagagggggtttttgatgagggaagtgttctagagccttaactgtgggttgtgttcggtagcgggaccaagctggaaatcaaacgtaagtgcacttttctactcctttttctttcttatacgggtgtgaaattggggacttttcatgtttggagtatgagttgaggtcagttctgaagagagtgggactcatccaaaaatctgaggagtaagggtcagaacagagttgtctcatggaagaacaaagacctagttagttgatgaggcagctaaatgagtcagttgacttgggatccaaatggccagacttcgtctgtaaccaacaatctaatgagatgtagcagcaaaaagagatttccattgaggggaaagtaaaattgttaatattgtggatcacctttggtgaagggacatccgtggagattgaacgtaagtattttttctctactaccttctgaaatttgtctaaatgccagtgttgacttttagaggcttaagtgtcagttttgtgaaaaatgggtaaacaagagcatttcatatttattatcagtttcaaaagttaaactcagctccaaaaatgaatttgtagacaaaaagattaatttaagccaaattgaatgattcaaaggaaaaaaaaattagtgtagatgaaaaaggaattcttacagctccaaagagcaaaagcgaattaattttctttgaactt |
tgccaaatcttgtaaatgatttttgttctttacaatttaaaaaggttagagaaatgtatttcttagtctgttttctctcttctgtctgataaattattatatgagataaaaatgaaaattaataggatgtgctaaaaaatcagtaagaagttagaaaaatatatgtttatgttaaagttgccacttaattgagaatcagaagcaatgttatttttaaagtctaaaatgagagataaactgtcaatacttaaattctgcagagattctatatcttgacagatatctcctttttcaaaaatccaatttctatggtagactaaatttgaaatgatcttcctcataatggagggaaaagatggactgaccccaaaagctcagattt*aagaaaacctgtttaag*gaaagaaaataaaagaactgcattttttaaaggcccatgaatttgtagaaaaataggaaatattttaataagtgtattcttttattttcctgttattacttgatggtgtttttataccgccaaggaggccgtggcaccgtcagtgtgatctgtagaccccatggcggccttttttcgcgattgaatgaccttggcggtgggtccccagggctctggtggcagcgcaccagccgctaaaagccgctaaaaactgccgctaaaggccacagcaaccccgcgaccgcccgttcaactgtgctgacacagtgatacagataatgtcgctaacagaggagaatagaaatatgacgggcacacgctaatgtggggaaaagagggagaagcctgatttttattttttagagattctagagataaaattcccagtattatatccttttaataaaaaatttctattaggagattataaagaatttaaagctatttttttaagtggggtgtaattctttcagtagtctcttgtcaaatggatttaagtaatagaggcttaatccaaatgagagaaatagacgcataaccctttcaaggcaaaagctacaagagcaaaaattgaacacagcagccagccatctagccactcagattttgatcagttttactgagtttgaagtaaatatcatgaaggtataattgctgataaaaaaataagatacaggtgtgacacatctttaagtttcagaaatttaatggcttcagtaggattatatttcacgtatacaaagtatctaagcagataaaaatgccattaatggaaacttaatagaaatatatttttaaattccttcattctgtgacagaaattttctaatctgggtcttttaatcacctaccctttgaaagagtttagtaatttgctatttgccatcgctgtttactccagctaatttcaaaagtgatacttgagaaagattatttttggtttgcaaccacctggcaggactattttagggccattttaaaactcttttcaaactaagtattttaaactgttctaaaccatttagggccttttaaaaatcttttcatgaattttcaaacttcgttaaaagttattaaggtgtctggcaagaacttccttatcaaatatgctaatagtttaatctgttaatgcaggatataaaattaaagtgatcaaggcttgacccaaacaggagtatcttcatagcatatttcccctcctttttttctagaattcatatgattttgctgccaaggctattttatataatctctggaaaaaaaatagtaatgaaggttaaaagagaagaaaatatcagaacattaagaattcggtattttactaactgcttggttaacatgaaggtttttattttattaaggtttctatctttataaaaatctgttcccttttctgctgatttctccaagcaaaagattcttgatttgttttttaactcttactctcccacccaagggcctgaatgcccacaaaggggacttccaggaggccatctggcagctgctcaccgtcagaagtgaagccagccagttcctcctgggcaggtggccaaaattacagttgacccctcctggtctggctgaaccttgccccatatggtgacagccatctggccagggcccaggtctccctctgaagcctttgggaggagagggagagtggctggcccgatcacagatgcggaaggggctgactcctcaaccggggtgcagactctgcagggtgggtctgggcccaacacacccaaagcacgcccaggaaggaaaggcagcttggtatcactgcccagagctaggagaggcaccgggaaaatgatctgtccaagacccgttcttgcttctaaactccgagggggtcagatgaagtggttttgtttcttggcctgaagcatcgtgttccctgcaagaagcggggaacacagaggaaggagagaaaagatgaactgaacaaagcatgcaaggcaaaaaaggccttaggatggctgcaggaagttagttcttctgcattggctccttactggctcgtcgatcgcccacaaacaacgcacccagtggagaacttccctgttacttaaacaccattctctgtgcttgcttcctcaggggctgatgccaagccttccgtcttcatcttcccgccatcgaaggagcagttagcgaccccaactgtctctgtggtgtgcttgatca | |
Seq ID No.15 | gatgccaagccatccgtcttcatcttcccgccatcgaaggagcagttagc |
gaccccaactgtctctgtggtgtgcttgatcaataacttcttccccagagaaatcagtgtcaagtggaaagtggatggggtggtccaaagcagtggtcatccggatagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctctcgctgcccacgtcacagtacctaagtcataatttatattcctgtgaggtcacccacaagaccctggcctcccctctggtcacAAGCTTCAACAGGAACGAGTGTGAGGCTTAGAGGCCCACAGGCCCCTGGCCTGCCCCCAGCCCCAGCCCCCCTCCCCACCTCAAGCCTCAGGCCCTTGCCCCAGAGGATCCTTGGCAATCCCCCAGCCCCTCTTCCCTCCTCATCCCCTCCCCCTCTTTGGCTTTAACCGTGTTAATACTGGGGGGTGGGGGAATGAATAAATAAAGTGAACCTTTGCACCTGTGATTTCTCTCTCCTGTCTGATTTTAAGGTTGTTAAATGTTGTTTTCCCCATTATAGTTAATCTTTTAAGGAACTACATACTGAGTTGCTAAAAACTACACCATCACTTATAAAATTCAcgCCTTCTCAGTTCTCCCCTCCCCTCCTGTCCTCCGTAAGACAGGCCTCCGTGAAACCCATAAGCACTTCTCTTTACACCCTCTCCTGGGCCGGGGTAGGAGACTTTTTGATGTCCCCTcTTCAGCAAGCCTCAGAACCATTTTGAGGGGGACAGTTCTTACAGTCACAT*TCCtGtGATCTAATGACTTTAGTTaCCGAAAAGCCAGTCTCTCAAAAAGAAGGGAACGGCTAGAAACCAAGTCATAGAAATATATATGTATAAAATATATATATATCCATATATGTAAAATAACAAAATAATGATAACAGCATAGGTCAACAGGCAACAGGGAATGTTGAAGTCCATTCTGGCACTTCAATTTAAGGGAATAGGATGCCTTCATTACATTTTAAATACAATACACATGGAGAGCTTCCTATCTGCCAAAGACCATCCTGAATGCCTTCCACACTCACTACAAGGTTAAAAGCATTCATTACAATGTTGATCGAGGAGTTCCCGTTGTGGCTCAGCAGGTTAAGAACGTGACTGGTATCCAGGAGGATGCGGGTTTGGTCCCCAGCCTCGCTCAGTGGATTAAGGATCCAGTGTTGCTGCAAGATCACGGGCTCAGATCCCGTGTTCTATGGCTATGGTGTAGGCTGGTAGCTGCATGCAGCCCTAATTTGACCCCTAGCCTGGGAACTGCCATAtGCCACATGTGAGGCCCTTAAAACCTAAAAGAAAAAaAAAGAAAAGAAATATCTTACACCCAATTTATAGATAAGAGAGAAGCTAAGGTGGCAGGCCCAGGATCAAAGCCCTACCTGCCTATCTTGACACCTGAtACAAATTCTGTCTTCTAGGGtTTCCAACACTGCATAGAACAGAGGGTCAAACATGCTACCCTCCCAGGGACTCCTCCCTTCAAATGACATAAATTTTGTTGCCCATCTCTGGGGGCAAAACTCAACAATCAATGGCATCTCTAGTACCAAGCAAGGCTCTTCTCATGAAGCAAAACTCTGAAGCCAGATCCATCATGACCCAAGGAAGTAAAGACAGGTGTTACTGGTTGAACTGTATCCTTCAATTCAATATGCTCAATTTCCAACTCCCAGTCCCCGTAAATACAACCCCCTTTGGGAAGAGAGTCCTTGCAGATGTAGCCACGTTAAAAAGAGATTATACAGAAAGGCTAGTGAGGATGCAGTGAAACGGGATCTTTCATACATTGCTGGTGGAAATGTAAAATGCTGCAGGCACTCTAGAAAATAATTTGCCAGTTTTTTGAAAAGCTAAACAAAATAGTTTAGTTGCATTCTGGGTTATTTATCCCCCAGAAATTAAAAATTATGTCCGCACAAAAACGTGTACATAATCATTCATAACAGCCTTGTACGAAAAGCTT | |
Seq ID No.16 | GGATCCTTAACCCACTAATCGAGGATCAAACACGCATCCTCATGGACAATATGTTGGGTTCTTAGCCTGCTGAGACACAACAGGAACTCCCCTGGCACCACTTTAGAGGCCAGAGAAACAGCACAGATAAAATTCCCTGCCCTCATGAAGCTTATAGTCTAGCTGGGGAGATATCATAGGCAAGATAAACACATACAAATACATCATCTTAGGTAATAATATATACTAAGGAGAAAATTACAGGGGAGAAAGAGGACAGGAATTGCTAGGGTAGGATTATAAGTTCAGATAGTTCATCAGGAACACTGTTGCTGAGAAGATAACATTTAGGTAAAGACCGAAGTAGTAAGGAAATGGACCGTGTGCCTAAGTGGGTAAGACCATTCTAGGCAGCAGGAACAGCGATGAAAGCACTGAGGTGGGTGTTCACTGCACAGAGTTGTTCACTGCACAGAGTTGTGTGGGGAGGGGTAGGTCTTGCAGGCTCTTATGGTCACAGGAAGAATTGTTTTACTCCCACCGAGATGAAGGTTGGTGGATTTTGAGCAGAAGAATAATTCTGCCTGGTTTATATATAACAGGATTTCCCTGGGTGCTCTGATGAGAATAATCTGTCAGGGGTGGGATAGGGAGAGATATGGCAATAGGAGCCTTGGCTAGGAGCCCACGACAATAATTCCAAGTGAGAGGTGGTGCTGCA |
TTGAAAGCAGGACTAACAAGACCTGCTGACAGTGTGGATGTAGAAAAAGATAGAGGAGACGAAGGTGCATCTAGGGTTTTCTGCCTGAGGAATTAGAAAGATAAAGCTAAAGCTTATAGAAGATGCAGCGCTCTGGGGAGAAAGACCAGCAGCTCAGTTTTGATCCATCTGGAATTAATTTTGGCATAAAGTATGAGGTATGTGGGTTAACATTATTTGTTTTTTTTTTTTCCATGTAGCTATCCAACTGTCCCAGCATCATTTATTTTAAAAGACTTTCCTTTCCCCTATTGGATTGTTTTGGCACCTTCACTGAAGATCAACTGAGCATAAAATTGGGTCTATTTCTAAGCTCTTGATTCCATTCCATGACCTATTTGTTCATCTTTACCCCAGTAGACACTGCCTTGATGATTAAAGCCCCTGTTACCATGTCTGTTTTGGACATGGTAAATCTGAGATGCCTATTAGCCAACCAAGCAAGCACGGCCCTTAGAGAGCTAGATATGAGAGCCTGGAATTCAGACGAGAAAGGTCAGTCCTAGAGACATACATGTAGTGCCATCACCATGCGGATGGTGTTAAAAGCCATCAGACTGCAACAGACTGTGAGAGGGTACCAAGCTAGAGAGCATGGATAGAGAAACCCAAGCACTGAGCTGGGAGGTGCTCCTACATTAAGAGATTAGTGAGATGAAGGACTGAGAAGATTGATCAGAGAAGAAGGAaAATCAGGAAAATGGTGCTGTCcTGAAAATCCAAGGGAAGAGATGTTCCAAAGAGGAGAaAACTGATCAGTTGTCAGCTAGCGTCAATTGGGATGAAAATGGACCATTGGACAGAGGGATGTAGTGGGTCATGGGTGAATAGATAAGAGCAGCTTCTATAGAATGGCAGGGGCAAAATTCTCATCTGATCGGCATGGGTTcTAAAGAAAACGGGAAGAAAAAATTGAGTGCATGACCAGTCCCTTCAAGTAGAGAGGTgGAAAAGGGAAGGAGGAAAATGAGGCCACGACAACATGAGAGAAATGACAGCATTTTTAAAAATTTTTTATTTTATTTtATTTATTTATTTTTGCTTTTTAGGGCTGCCCCTGCAAcatatggaggttcccaggttaggggtctaatcagagctatagctgccagcctacaccacagccatagcaatgccagatctacatgacctacaccacagctcacagcaacgccggatccttaacccactgagtgaggccagagatcaaacccatatccttatggatactagtcaggttcattaccactgagccaaaatgggaaATCCTGAGTAATGACAGCATTTTTTAATGTGCCAGGAAGCAAAACTTGCCACCCCGAAATGTCTCTCAGGCATGTGGATTATTTTGAGCTGAAAACGATTAAGGCCCAAAAAACACAAGAAGAAATGTGGACCTTCCCCCAACAGCCTAAAAAATTTAGATTGAGGGCCTGTTCCCAGAATAGAGCTATTGCCAGACTTGTCTACAGAGGCTAAGGGCTAGGTGTGGTGGGGAAACCCTCAGAGATCAGAGGGACGTTTATGTACCAAGCATTGACATTTCCATCTCCATGCGAATGGCCTTCTTCCCCTCTGTAGCCCCAAACCACCACCCCCAAAATCTTCTTCTGTCTTTAGCTGAAGATGGTGTTGAAGGTGATAGTTTCAGCCACTTTGGCGAGTTCCTCAGTTGTTCTGGGTCTTTCCTCCGGATCCACATTATTCGACTGTGTTTGATTTTCTCCTGTTTATCTGTCTCATTGGCACCCATTTCATTCTTAGACCAGCCCAAAGAACCTAGAAGAGTGAAGGAAAATTTCTTCCACCCTGACAAATGCTAAATGAGAATCACCgCAGTAGAGGAAAATGATCTGGTgCTGCGGGAGATAGAAGAGAAAATcGCTGGAGAGATGTCACTGAGTAGGTGAGATGGGAAAGGGGGGGCACAGGTGGAGGTGTTGCCCTCAGCTAGGAAGACAGACAGTTcacagaagagaagcgggtgtccgtGGACATCTTGCCTCATGGATGAGGAAACCGAGGCTAAGAAAGACTGCAAAAGAAAGGTAAGGATTGCAGAGAGGTCGATCCATGACTAAAATCACAGTAACCAACCCCAAACCACCATGTTTTCTCCTAGTCTGGCACGTGGCAGGTACTGTGTAGGTTTTCAATATTATTGGTTTGTAACAGTACCTATTAGGCCTCCATCcCCTCCTCTAATACTAACAAAAGTGTGAGACTGGTCAGTGAAAAATGGTCTTCTTTCTCTATGCAATCTTTCTCAAGAAGATACATAACTTTTTATTTTATCATaGGCTTGAAGAGCAAATGAGAAACAgCCTCCAACCTATGACACCGTAACAAAGTGTTTATGATCAGTGAAGGGCAAGAAACAAAACATACACaGTAAAGACCCTCCATAATATTGtGGGCTGGCCCAaCACAGGCCAGGTTGTAAAAGCTTTTTATTCTTTGATAGAGGAATGGATAGTAATGTTTCAACCTGGACAGAGAT*CATGTTCACTGAATCCTTCCAAAAATTCATGGGTAGTTTGAAtTATAAGGAAAATAAGACTTAGGATAAATACTTTgTCCA*GATCCCAGAGTTAATgCCAAAATCAGTTTTCAGACTCCAGGCAGCCTGATCAAGAGCCTAAACTTTAAAGACACAGTCCCTTAATAACTACTATTCACAGTTGCACTTTCAgGGCGCAAAGACTCATTGAATCCTACAATAGAATGAGTTTAGATATCAAATCTCTCAGTAATAGATG |
AGGAGACTAAATAGCGGGCATGACCTGGTCACTTAAAGACAGAATTGAGATTCAAGGCTAGTGTTCTTTCTACCTGTTTTGTTTCTACAAGATGTAGCAATGCGCTAATTACAGACCTCTCAGGGAAGGAATTCACAACCCTCAGCAAAAACCAAAGACAAATCTAAGACAACTAAGAGTGTTGGTTTAATTTGGAAAAATAACTCACTAACCAAACGCCCCTCTTAGCACCCCAATGTCTTCCACCATCACAGTGCTCAGGCCTCAACCATGCCCCAATCACCCCAGCCCCAGACTGGTTATTACCAAGTTTCATGATGACTGGCCTGAGAAGATCAAAAAAGCAATGACATCTTACAGGGGACTACCCCGAGGACCAAGATAGCAACTGTCATAGCAACCGTCACACTGCTTTGGTCA | |
Seq ID No.19 | ggatcaaacacgcatcctcatggacaatatgttgggttcttagcctgctgagacacaacaggaactcccctggcaccactttagaggccagagaaacagcacagataaaattccctgccctcatgaagcttatagtctagctggggagatatcataggcaagataaacacatacaaatacatcatcttaggtaataatatatactaaggagaaaattacaggggagaaagaggacaggaattgctagggtaggattataagttcagatagttcatcaggaacactgttgctgagaagataacatttaggtaaagaccgaagtagtaaggaaatggaccgtgtgcctaagtgggtaagaccattctaggcagcaggaacagcgatgaaagcactgaggtgggtgttcactgcacagagttgttcactgcacagagttgtgtggggaggggtaggtcttgcaggctcttatggtcacaggaagaattgttttactcccaccgagatgaaggttggtggattctgagcagaagaataattctgcctggtttatatataacaggatttccctgggtgctctgatgagaataatctgtcaggggtgggatagggagagatatggcaataggagccttggctaggagcccacgacaataattccaagtgagaggtggtgctgcattgaaagcaggactaacaagacctgctgacagtgtggatgtagaaaaagatagaggagacgaaggtgcatctagggttttctgcctgaggaattagaaagataaagctaaagcttatagaagatgcagcgctctggggagaaagaccagcagctcagttttgatccatctggaattaattttggcataaagtatgaggtatgtgggttaacattatttgttttttttttttccatgtagctatccaactgtcccagcatcatttattttaaaagactttcctttcccctattggattgttttggcaccttcactgaagatcaactgagcataaaattgggtctatttctaagctcttgattccattccatgacctatttgttcatctttaccccagtagacactgccttgatgattaaagcccctgttaccatgtctgttttggacatggtaaatctgagatgcctattagccaaccaagcaagcacggcccttagagagctagatatgagagcctggaattcagacgagaaaggtcagtcctagagacatacatgtagtgccatcaccatgcggatggtgttaaaagccatcagactgcaacagactgtgagagggtaccaagctagagagcatggatagagaaacccaagcactgagctgggaggtgctcctacattaagagattagtgagatgaaggactgagaagattgatcagagaagaaggaaaatcaggaaaatggtgctgtcctgaaaatccaagggaagagatgttccaaagaggagaaaactgatcagttgtcagctagcgtcaattgggatgaaaatggaccattggacagagggatgtagtgggtcatgggtgaatagataagagcagcttctatagaatggcaggggcaaaattctcatctgatcggcatgggttctaaagaaaacgggaagaaaaaattgagtgcatgaccagtcccttcaagtagagaggtggaaaagggaaggaggaaaatgaggccacgacaacatgagagaaatgacagcatttttaaaaattttttattttattttatttatttatttttgctttttagggctgcccctgcaacatatggaggttcccaggttaggggtctaatcagagctatagctgccagcctacaccacagccatagcaatgccagatctacatgacctacaccacagctcacagcaacgccggatccttaacccactgagtgaggccagagatcaaacccatatccttatggatactagtcaggttcattaccactgagccaaaatgggaaatcctgagtaatgacagcattttttaatgtgccaggaagcaaaacttgccaccccgaaatgtctctcaggcatgtggattattttgagctgaaaacgattaaggcccaaaaaacacaagaagaaatgtggaccttcccccaacagcctaaaaaatttagattgagggcctgttcccagaatagagctattgccagacttgtctacagaggctaagggctaggtgtggtggggaaaccctcagagatcagagggacgtttatctaccaa |
gcattgacatttccatctccatgcgaatggccttcttcccctctgtagccccaaaccaccacccccaaaatcttcttctgtctttagctgaagatggtgttgaaggtgatagtttcagccactttggcgagttcctcagttgttctgggtctttcctccTgatccacattattcgactgtgtttgattttctcctgtttatctgtctcattggcacccatttcattcttagaccagcccaaagaacctagaagagtgaaggaaaatttcttccaccctgacaaatgctaaatgagaatcaccgcagtagaggaaaatgatctggtgctgcgggagatagaagagaaaatcgctggagagatgtcactgagtaggtgagatgggaaaggggtgacacaggtggaggtgttgccctcagctaggaagacagacagttcacagaagagaagcgggtgtccgtggacatcttgcctcatggatgaggaaaccgaggctaagaaagactgcaaaagaaaggtaaggattgcagagaggtcgatccatgactaaaatcacagtaaccaaccccaaaccaccatgttttctcctagtctggcacgtggcaggtactgtgtaggttttcaatattattggtttgtaacagtacctattaggcctccatcccctcctctaatactaacaaaagtgtgagactggtcagtgaaaaatggtcttctttctctatgaatctttctcaagaagatacataactttttattttatcataggcttgaagagcaaatgagaaacagcctccaacctatgacaccgtaacaaaatgtttatgatcagtgaagggcaagaaacaaaacatacacagtaaagaccctccataatattgtgggtggcccaacacaggccaggttgtaaaagctttttattctttgatagaggaatggatagtaatgtttcaacctggacagagatcatgttcactgaatccttccaaaaattcatgggtagtttgaattataaggaaaataagacttaggataaatactttgtccaagatcccagagttaatgccaaaatcagttttcagactccaggcagcctgatcaagagcctaaactttaaagacacagtcccttaataactactattcacagttgcactttcagggcgcaaagactcattgaatcctacaatagaatgagtttagatatcaaatctctcagtaatagatgaggagactaaatagcgggcatgacctggtcacttaaagacagaattgagattcaaggctagtgttctttctacctgttttgtttctacaagatgtagcaatgcgctaattacagacctctcagggaaggaattcacaaccctcagcaaaaaccaaagacaaatctaagacaactaagagtgttggtttaatttggaaaaataactcactaaccaaacgcccctcttagcaccccaatgtcttccaccatcacagtgctcaggcctcaaccatgccccaatcacc | |
Seq ID No.25 | GCACATGGTAGGCAAAGGACTTTGCTTCTCCCAGCACATCTTTCTGCAGAGATCCATGGAAACAAGACTCAACTCCAAAGCAGCAAAGAAGCAGCAAGTTCTCAAGTGATCTCCTCTGACTCCCTCCTCCCAGGCTAATGAAGCCATGTTGCCCCTGGGGGATTAAGGGCAGGTGTCCATTGTGGCACCCAGCCCGAAGACAAGCAATTTGATCAGGTTCTGAGCACTCCTGAATGTGGACTCTGGAATTTTCTCCTCACCTTGTGGCATATCAGCTTAAGTCAAGTACAAGTGACAAACAACATAATCCTAAGAAGAGAGGAATCAAGCTGAAGTCAAAGGATCACTGCCTTGGATTCTACTGTGAATGATGACCTGGAAAATATCCTGAACAACAGCTTCAGGGTGATCATCAGAGACAAAAGTTCCAGAGCCAGGTAGGGAAACCCTCAAGCCTTGCAAAGAGCAAAATCATGCCATTGGGTTCTTAACCTGCTGAGTGATTTACTATATGTTACTGTGGGAGGCAAAGCGCTCAAATAGCCTGGGTAAGTATGTCAAATAAAAAGCAAAAGTGGTGTTTCTTGAAATGTTAGACCTGAGGAAGGAATATTGATAACTTACCAATAATTTTCAGAATGATTTATAGATGTGCACTTAGTCAGTGTCTCTCCACCCCGCACCTGACAAGCAGTTTAGAATTTATTCTAAGAATCTAGGTTTGCTGGGGGCTACATGGGAATCAGCTTCAGTGAAGAGTTTGTTGGAATGATTCACTAAATTTTCTATTTCCAGCATAAATCCAAGAACCTCTCAGACTAGTTTATTGACACTGCTTTTCCTCCATAATCCATCTCATCTCCGTCCATCATGGACACTTTGTAGAATGACAGGTCCTGGCAgAGACTCaCAGATGCTTCTGAAACATCCTTTGCCTTCAAAGAATGAACAGCACACATACTAAGGATCTCAGTGATCCACAAATTAGTTTTTGCCACAATGGTTCTTATGATAAAAGTCTTTCATTAACAGCAAATTGTTTTATAATAGTTGTTCTGCTTTATAATAATTGCATGCTTCACTTTCTTTTCTTTTCTTTTTTTTTCTTTTTTTGCTTTTTAGTGCCGCAGGTgcagcatatgaaatttcccaggctaggggtcaaatcagaactacacctactggcctacgccacagccacagcaactcaggatctaagccatgtcggtgacctacactacagctcatgg |
caatgccagatccttaacccaatgagcgaggccagggatcgaacccatgtcctcatggatactagtcaggctcattatccgctgagccataacaggaactcccGAGTTTGCTTTTTATCAAAATTGGTACAGCCTTATTGTTTCTGAAAACCACAAAATGAATGTATTCACATAATTTTAAAAGGTTAAATAATTTATGATATACAAGACAATAGAAAGAGAAAACGTCATTGCCTCTTTCTTCCACGACAACACGCCTCCTTAATTGATTTGAAGAAATAACTACTGAGCATGGTTTAGTGTACTTCTTTCAGCAATTAGCCTGTATTCATAGCCATACATATTCAATTAAAATGAGATCATGATATCACACAATACATACCATACAGCCTATAGGGATTTTTACAATCATCTTCCACATGACTACATAAAAACCTACCTAAAAAAAAAAAAAACCCTACTTCATCCTCCTATTGGCTGCTTTGTGCTCCATTAAAAAGCTCTATCATAATTAGGTTATGATGAGGATTTCCATTTTCTACCTTTCAAGCAACATTTCAATGCACAGTCTTATATACACATTTGAGCCTACTTTTCTTTTTCTTTCTTTTTTTGGTTTTTTTTTTTTTTTTTTTTTTGGTCTTTTTGTCTTTTCTAAGgctgcatatggaggttcccaggctagctgtctaatcagaactatagctgctggcctacgccacatccacagcaatacaagatctgagccatgtctgcaacttacaccacagctcacagcaacggtggatccttaaaccactgagcaaggccagggatcaaacccatAACTTCATGGCTCCTAGTTGGATTTGTTAACCACTGAGCCATGATGGCAACTCCTGAGCCTACTTTTCTAATCATTTCCAACCCTAGGACACTTTTTTAAGTTTCATTTTTCTCCCCCCACCCCCTGTTTTCTGAAGtGTGTTTGCTTCCACTGGGTGACTTCACtCCCAGGATCTCATCTGCAGGATACTGCAGCTAAGTGTATGAGCTCTGAATTTGAATCCCAACTCTGCCACTCAAAGGGATAGGAGTTTCCGATGTGGCCCAATGGGATCAGTGGCATCTCTGCAGTGCCAGGACGCaggttccatccctggcccagcacagtgggttaagaatctggCATTGCTGCAGCTGAGGCATAGATTTCAATTGTGCCTCAgATCTGATCCTTGGCCCAAGGACTGCATATGCCTCAGGGCAACCAAAAAAGAGAAAAGGGGGGTGATAGCATTAGTTTCTAGATTTGGGGGATAATTAAATAAAGTGATCCATGTACAATGTATGGCATTTTGTAAATGCTCAACAAATTTCAACTATTATggagttcccatcatggctcagtggaagggaatctgattagcatccatgaggacacaggtCCAACCCCGACCTTGCTCAGTGGGCATTGCTGTGAGCTGTGGCATGGGTTACAGACGAAGCTCGGATCTGGCATTGCTGTGGCTGTGGTGTAAGCCAgCAActacagctctcattcagcccctagcctgggaacctccatatgccTAAAAGACAAAAAATAAAATTTAAATTAAAAATAAAGAAATGTTAACTATTATGATTGgTACTGCTTGCATTACTGCAAAGAAAGTCACTTTCTATACTCTTTAATATCTTAGTTGACTGTGTGCTCAGTGAACTATTTTGGACACTTAATTTCCACTCTCTTCTATCTCCAACTTGACAACTCTCTTTCCTCTCTTCTGGTGAGATCCACTGCTGACTTTGCTCTTTAAGGCAACTAGAAAAGTGCTCAGTGACAAAATCAAAGAAAGTTACCTTAATCTTCAGAATTACAATCTTAAGTTCTCTTGTAAAGCTTACTATTTCAGTGGTTAGTATTATTCCTTGGTCCCTTACAACTTATCAGCTCTGATCTATTGCTGATTTTCAACTATTTATTGTTGGAGTTTTTTCCTTTTTTCCCTGTTCATTCTGCAAATGTTTGCTGAGCATTTGTCAAGTGAAGATACTGGACTGGGCCTTCCAAATATAAGACAATGAAACATCGGGAGTTCTCATTATGGTGCAGCAGAaacgaatccaactaggaaatgtgaggttgcaggttcgatccctgcccttgctcagtgggttaaggatccagcattaccgtgagctgtggtgtaggttgcagacgtggctcagatcctgcgttgctgtggctgtggcataggatggcagctctagctctgattcgaccgctagcctgggaacctccatGCGCCCCGAGTGCAGCCCTTAAAAAGCAAAAAAAAAAGAAAGAAAGAAAAAGACAATGAAACATCAAACAGCTAACAATCCAGTAGGGTAGAAAGAATCTGGCAACAGATAAGAGCGATTAAATGTTCTAGGTCCAGTGACCTTGCCTCTGTGCTCTACACAGTCGTGCCACTTGCTGAGGGAGAAGGTCTCTCTTGAGTTGAGTCCTGAAAGACATTAGTTGTTCACAAACTAATGCCAGTGAGTGAAGGTGTTTCCAAGCAGAGGGAGAGTTTGGTAAAAAGCTGGAAGTCACAGAAAGACTCTAAAGAGTTTAGGATGGTGGGAGCAACATACGCTGAGATGGGGCTGGAAGGTTAAGAGGGAAACAACTATAGTAAGTGAAGCTGGACTCACAGCAAAGTGAGGACCTCAGCATCCTTGATGGGGTTACCATGGAAACACCAAGGCACACCTTGATTTCCAAAACAGCAGGCACCTGATTCAGCCCAATGTGACATGGTGGGTACCC |
CTCTAGCTCTACCTGTTCTGTGACAACTGACAACCAACGAAGTTAAGTCTGGATTTTCTACTCTGCTGATCCTTGTTTTTGTTTCACACGTCATCTATAGCTTCATGCCAAAATAGAGTTCAAGGTAAGACGCGGGCCTTGGTTTGATATACATGTAGTCTATCTTGTTTGAGACAATATGGTGGCAAGGAAGAGGTTCAAACAGGAAAATACTCTCTAATTATGATTAACTGAGAAAAGCTAAAGAGTCCCATAATGACACTGAATGAAGTTCATCATTTGCAAAAGCCTTCCCCCCCCCCCAGGAGACTATAAAAAAGTGCAATTTTTTAAATGAACTTATTTACAAAACAGAAATAGACTCACAGACATAGGAAACGAACAGATGGTTACCAAGGGTGAAAGGGAGTAGGAGGGATAAATAAGGAGTCTGGGGTTAGCAGATACACCCCAGTGTACACAAAATAAACAACAGGGACCTACTATATAGCACAGGGAACTATATGCAGTAGCTTACAATAACCTATAATGGAAAAGAATGTGAAAAAGAATATATGTATGCGTGTGTGTGTAACTGAATCACTTTGCTGTAACCTGAATCTAACATAACATTGTAAATCAACTACAGTTTTTTTTTTTTTTAAGTGCAGGGTTTTGGTGTTTTTTTTTTTTCATTTTTGTTTTTGTTTTTGTTTTTTGCTTTTTAGGGCCACACCCAGACATATGGGGGTTCCCAGGctAGGGGTcTAaTTAGAGcTACAGtTGCCGGCTTGCAccacagccacagcaacatcagatccgagccgcacttgcgacttacaccacagctcatggcaataccagatccttaacccactgagcaaggcccagggatcgtacccgcaacctcatggttcctagtcagattcattTCTGCTGCGCTACAATGGGAACTCCAAGTGCAGTTTTTTGTAATGTGCTtGTCTTTCTTTGTAATTCATATTCATCCTACTTCCCAATAAATAAATAAATACATAAATAATAAACATACCATTGTAAATCAACTACAATTTTTTTTAAATGCAGGGTTTTTGTTTTTTGTTTTTTGTTTTGTCTTTTTGCCTTTTCTAgggccgctcccatggcatatggaggttcccaggctaggggtcgaatcggagctgtagccaccggcctacgccagagccacagcaacgcgggatccgagccgcgtctgcaacctacaccacagctcacggcaacgccggatcgttaacccactgagcaagggcagggatcgaacctgcaacctcatggttcctagtcagattcgttaactactgagccacaacggaaacTCCTAAAGTGCAGTTTTTAAATGTGCTTGTCTTTCTTTGTAATTTACACTCAACCTACTTCCCAATAAATAAATAAATAAACAAATAAATCATAGACATGGTTGAATTCTAAAGGAAGGGACCATCAGGCCTTAGACAGAAATACGTCATCTTCTAGTATTTTAAAACACACTAAAGAAGACAAACATGCTCTGCCAGAGAAGCCCAGGGCCTCCACAGCTGCTTGCAAAGGGAGTTAGGCTTCAGTAGCTGACCCAAGGCTCTGTTCCTCTTCAGGGAAAAGGGTTTTTGTTCAGTGAGACAGCAGACAGCTGTCACTGTGgtggacgttcggccaaggaaccaagctggaactcaaacGTAAGTCAATCCAAACGTTCCTTCCTTGGCTGTCTGTGTCTTACGGTCTCTGTGGCTCTGAAATGATTCATGTGCTGACTCTCTGAAACCAGACTGACATTCTCCAGGGCAAAACTAAAGCCTGTCATCAAACcGGAAAACTGAGGGCACATTTTCTGGGCAGAACTAAGAGTCAGGCACTGGGTGAGGAAAAACTTGTTAGAATGATAGTTTCAGAAACTTACTGGGAAGCAAAGCCCATGTTCTGAACAGAGCTCTGCTCAAGGGTCAGGAGGGGAACCAGTTTTTGTACAGGAGGGAAGTTGAGACGAACCCCTGTGTAtatggtttcggcgcggggaccaagctggagctcaaacGTAAGTGGCTTTTTCCGACTGATTCTTTGCTGTTTCTAATTGTTGGTTGGCTTTTTGTCCATTTTTCAGTGTTTTCATCGAATTAGTTGTCAGGGACCAAACAAATTGCCTTCCCAGATTAGGTACCAGGGAGGGGACATTGCTGCATGGGAGACCAGAGGGTGGCTAATTTTTAACGTTTCCAAGCCAAAATAACTGGGGAAGGGGGCTTGCTGTCCTGTGAGGGTAGGTTTTTATAGAAGTGGAAGTTAAGGGGAAATCGCTATGGTtcacttttggctcggggaccaaagtggagcccaaaattgaGTACATTTTCCATCAATTATTTGTGAGATTTTTGTCCTGTTGTGTCATTTGTGCAAGTTTTTGACATTTTGGTTGAATGAGCCATTCCCAGGGACCCAAAAGGATGAGACCGAAAAGTAGAAAAGAGCCAACTTTTAAGCTGAGCAGACAGACCGAATTGTTGAGTTTGTGAGGAGAGTAGGGTTTGTAGGGAGAAAGGGGAACAGATCGCTGGCTTTTTCTCTGAATTAGCCTTTCTCATGGGACTGGCTTCAGAGGGGGTTTTTGATGAGGGAAGTGTTCTAGAGCCTTAACTGTGGgttgtgttcggtagcgggaccaagctggaaatcaaaCGTAAGTGCACTTTTCTACTCC |
猪λ轻链
在另一实施方案中,提供了编码有蹄类动物免疫球蛋白的λ轻链基因座的新的基因组序列。本发明提供了有蹄类动物λ轻链区的首次报导的基因组序列。在一个实施方案中,猪λ轻链核苷酸包括J到C单位的多联体。在特定实施方案中,提供了如Seq ID No.28中描绘的分离的猪λ核苷酸序列。
在一个实施方案中,提供了包括猪λ轻链基因组序列的第一个λJ/C区的5’侧翼序列的核苷酸序列,如Seq ID No 32表示。此外,提供了包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列,如λJ/C下游约200个碱基对的核苷酸序列,如Seq ID No 33表示。备选地,提供了包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列的核苷酸序列,如J/C簇下游约11.8kb,接近增强子(如Seq JD No.34表示),λ的下游约12Kb,包括增强子区(如Seq ID No.35表示),λ的下游约17.6Kb(如Seq ID No.36表示,λ的下游约19.1Kb(如Seq ID No.37表示),λ的下游约21.3Kb(如Seq ID No.38表示),和/或λ的下游约27Kb(如Seq ID No.39表示)。
在进一步的实施方案中,提供了如Seq ED Nos 28、31、32、33、34、35、36、37、38或39中所述的分离的核苷酸序列。还提供了与Seq ID Nos 28、31、32、33、34、35、36、37、38或39至少80、85、90、95、98或99%同源的核酸序列。此外,提供了含有Seq ID Nos 28、31、32、33、34、35、36、37、38或39的至少10、15、17、20、25、30、40、50、75、100、150、200、250、500或1,000个连续核苷酸的核苷酸序列。还提供了任选在严格条件下与Seq ID Nos 28、31、32、33、34、35、36、37、38或39杂交的核苷酸序列,以及其同源核苷酸。
Seq ID No.28 | CCTTCCTCCTGCACCTGTCAACTCCCAATAAACCGTCCTCCTTGTCATTCAGAAATCATGCTCTCCGCTCACTTGTGTCTACCCATTTTCGGGCTTGCATGGGGTCATCCTCGAAGGTGGAGAGAGTCCCCCTTGGCCTTGGGGAAGTCGAGGGGGGCGGGGGGAGGCCTGAGGCATGTGCCAGCGAGGGGGGTCACCTCCACGCCCCTGAGGACCTTCTAGAACCAGGGGCGTGGGGCCACCGCCTGAGTGGAAGGCTGTCCACTTTTCCCCCGGGCCCCCAGGCTCCCTCCTCCGTGTGGACCTTGTCCACCTCTGACTGGCCCAGCCACTCATGCATTGTTTCCCCGAAACCCCAGGACGATAGCTCAGCACGCGACAGTGTCCCCCTCTGAGGGCCTCTGTCCATTTCAGGACGACCCGCATGTACAGCGTGACCACTCTGCTCACGCCCACTCACCACGTCCTAGAGCCCCACCCCCAGCCCCATCCTTAGGGGCACAGCCAGcTCCGACCGCCCCGGGGACACCACCCTCTGCCCCTTcCCCAGGCCCTCCCTGTCACACGCACCACAGGGCCCTCCGTCCCGAGACCCTGCTCCCTCATCCCTCGGTCCCCTCAGGTAGCCTTCCACCCGCGTGTGTCCCGAGGTCCCAGATGCAGCAAGGCCCCTGGGACAACGCCAGATCTCTGCTCTcCCCGACCCCTCAGAAGCCAGCCCACGCCTGGCCCCACCACCACTGCCTAACgTCCAAGTGTCCATAGGCCTCGGGACCTCCAAGTCCAGGTTCTGCCTCTGGGATTCCGCCATGGGTCTGCCTGGGAAATGATGCACTTGGAGGAGCTCAGCATGGGATGCGGGACCTTGTCTCTAGGCGCTcCCTCAGGATCCCACAGCTGCCCTGTGAGACACACACACACACACACACACACACACACACACACACACACACACAAACACGCATGCACGCACGCCGGCACACACGCTATTGCAGAGATGGCCACGGTAGCTGTGCCTCGAGGCCGAGTGGAGTGTCTAGAACTCTCGGGGGTCCCCTCTGCAGACGACACTGCTCCATCCCCCCCGTGCCCTGAAGGGCTCCTCACTCTCCCATCAGGATCTCTCCAAGCTGCTGACCTGGAGAGGAAGGGGCCTGGGACAGGCGGGGACACTCAGACCTCCCTGCTGCCCCTCCTCTGCCTGGGCTTGGACGGCTCCCCCCTTCCCACGGGTGAAGGTGCAGGTGGGGAGAGGGCACCCCCCTCAGCCTCCCAGACCCAGACCAGCCCCCGTGGCAGGGGCAGCCTGTGAGCCTCCAGCCAGATGCAGGTGGCCTGGGGTGGGGGGTGGAGGGGGCGGGAGGTTTATGTTTGAGGCTGTATCACTGTGTAATATTTTCGGCGGTGGGACCCATCTGACCGTCCTCGGTGAGTCTCCCCTTTTCTCTCCTCCTTGGGGATCCGAGTGAAATCTGGGTCGATCTTCTCTCCGTTCTCCTCCGACTGGGGCTGAGGTCTGAACCTCGGTGGGGTCCGAAGAGGAGGCCCCTAGGCCAGGCTCCTCAGCCCCTCCAGCCCGACcgGCCCTCTTGACACAGGGTCCAGCTAAGGGCAGACATGGAGGCTGCTAGTCCAGGGCCAGGCTCTGAGACCCAAGGGCGCTGCCCAAGGAACCCTTGCCCCAGGGACCCTGGGAGCAAAGCTCCTCACTCAGAGCCTGCAGCCCTGGGGTCTGAGGACAAGGAGGGACTGAGGACTGGGCGTGGGGAGTTCAGGCGGGGACACCAGGTCCAGGGAGGTGACAAAGGCGCTGGGAGGGGGCGGACGGTGCCGGGGACTCCTCCTGGGCCCTGTGGGCTCGGGGTCCTTGTGAGGACCCTGAGGGACTGAGGGGCCCCTGGGCCTAGGGACTTGCAgTgAGGGAGGCAGGGAGTGTCCCTTGAGAACGTGGCCTCCGCGGGCTGGGTCCCCCTCGTGCTCCCAGCC*GGGAGGACACCCCAGAGCAAGCGCCCCAGGTGGGCGGGGAGGGTCTCCTCACAGGGGCAGCTGACAGATAGAGGCCCCCGCCAGGCAGATGCTTGATCCTGGCAgTTATACTGGGTTC**GCACAACTTTCCCTGAACAAGGGGCCCTCCGAACAGACACAGACGCAACCCAGTCGACCcaggCTCAGCACAgAAAATGCACTGACACCCAAAACCCTCATCTggggGCCTGGCCGGcAtCCCGCCCCAGGACCCAAGGCCCCTGCCCCCTGGCAGCCCTGGACACGGTCCTCTGTGGGCGGTGGGGTCgGGGCTGTGGTGACGGTGGCATCGGGGAGCCTGTGCCCCCTCCCTGAAAGGGCGGAGAGGCTCAAGAGGGGACAGAAATGTCCTCCCCTAGGAAGACCTCGGACGGGGGCGGGGGGGTGGTCTCCGACAGACAGATGCCCGGGACCGACAGACCTGCCGAGGGAAGAGGGCACCTCGGTCGGGTTAGGCTCCAGGCAGCACGAGGGAGCGAGGCTGGGAGGGTGAGGACATGGGAGCCTGAGGAGGAGCTGGAGACTTCAGCAGGCCCCCAGCTCCGGGCTTCGGGCTCTGAGATGCTCGGACGCAAGGTGAGTGACCCCACCTGTGGCTGACCTGACCTCAgGGgGACAAGGC |
TCAGCCTGGGACTCTGTGTCCCCATCGCCTGcACAGGGGATTCCCCTGATGGACACTGAGCCAACGACCTCCCGTCTCTCCCCGACCCCCAGGTCAGCCCAAgGCCaCTCCCACGGTCAACCTCTTCCCGCCCTCCTCTGAGGAGCTCGGCACCAACAAGGCCACCCTGGTGTGTCTAATAAGTGACTTCTACCCGGGCGCCGTGACGGTGACCTGGAAGGCAGGCGGCACCACCGTCACCCAGGGCGTGGAGACCACCAAGCCCTCGAAACAGAGCAACAACAAGTACGCGGCCAGCAGCTACCTGGCCCTGTCCGCCAGTGACTGGAAATCTTCCAGCGGCTTCACCTGCCAGGTCACCCACGAGGGGACCATTGTGGAGAAGACAGTGACGCCCTCCGAGTGCGCCTAGGTCCCTGGGCCCCCACCCTCAGGGGCCTGGAGCCACAGGACCCCCGCGAGGGTCTCCCCGCGACCCTGGTCCAGCCCAGCCCTTCCTCCTGCACCTGTCAACTCCCAATAAACCGTCCTCCTTGTCATTCAGAAATCATGCTCTCCGCTCACTTGTGTCTACCCATTTTCGGGCTTGCATGGGGTCATCCTCGAAGGTGGAGAGAGTCCCCCTTGGCCTTGGGgAAATCGAGGGGGGCGGGGGGAGGCCTGAGGCATGTGCCAGCGAGGGGGGTCACCTCCACGCCCCTGAGGACCTTCTAGAACCAGGGGCGTGGGGCCACCGCCAGAGTGGAAGGCTGTCCACTTTTCCCCCGGGCCCCCAGGCTCCCTCCTCCGTGTGGACCTTGTCCACCTCTGACTGGCCCAGCCACTCATGCATTGTTTCCCCGAAACCCCAGGACGATAGCTCAGCACGCGACAGTGTCCCCCTCTGAGGGCCTCTGTCCATTTCAGGACGACCCGCATGTACAGCGTGACCACTCTGCTCACGCCCACTCACCACGTCCTAGAGCCCCACCCCCAGCCCCATCCTTAGGGGCACAGCCAGCTCCGACCGCCCCGGGGACACCACCCTCTGCCCCTTCCCCAGGCCCTCCCTGTCACACGCACCACAGGGCCCTCCGTCCCGAGACCCTGCTCCCTCATCCCTCGGTCCCCTCAGGTAGCCTTCCACCCGCGTGTGTCCCGAGGTCCCAGATGCAGCAAGGCCCCTGGGACAACGCCAGATCTCTGCTCTCCCCGACCCTCAGAAGCCAGCCCACGCCTGGCCCACCACCACTGCCTAACGTCCAAGTGTCCATAGGCTCGGGAcCTCcAaGTCCAGGTTCTGCCTCTGGGATTCCGCCATGGGTCTGCCTGGAATGATGCACTTGGAGgAgCTCAGcATGGGATGcGGAACTTGTCTAGcGCTCCTCAGATCCAcAGcTGCCTGtGAgAcacacacacacacacacacacaccAAAcaCGcATGCACGCACGCCGGCACACACGCTATTACAGAGATGGCCACGGTAGCTGTGCCTCGAGGCCGAGTGGAGTGTCTAGAACTCTCGGGGGTCCCCTCTGCAGACGACACTGCTCCATCCCCCCCGTGCCCTGAAGGGCTCCTCACTCTCCCATCAGGATCTCTCCAAGCTGCTGACCTGGAGAGGAAGGGGCCTGGGACAGGCGGGGACACTCAGACCTCCCTGCTGCCCCTCCTCTGCCTGGGCTTGGACGGCTCCCCCCTTCCCACGGGTGAAGGTGCAGGTGGGGAGAGGGCACCCCCCTCACCCTCCCAGACCCAGACCAGCCCCCGTGGCAGGGGCAGCCTGTGAGCCTCCAGCCAGATGCAGGTGGCCTGGGGTGGGGGGTGGAGGGGGCGGGAGGTTTATGTTTGAGGCTGTATTCATCTGTGTAATATttTCGGCGGTGGGACCCATCTGACCGTCCTCGGTGAGTCTCCCCTtttctttcctccttggggatccgagtgaaATcTGGGTCGATCTTCTCTCCGTTCTCCTCCGACTGGGGCTGAGGTCTGAACCTCGGTgGGGTCCGAAGAGGAGGCCCCTAGGCC*GGCTCcTCAGCCCCTCCAGCCCGACCCGCCCTCTTGACACAGGGTCCAGCTAAGGGCAGACAT***GGCTGCTAGTCCAGGGCCAGGCTcTGAGACCCAAGGGCGCTGCCCAAGGAACCCTTGCCCCAGGGACCCTGGGAGCAAAGCTCCTCACTCAGAGCCTGCAGCCCTGGgGTCTGAGGACAAGGAGGGACTGAGGACTGGGCGTGGGGAGTTCAGGCgGGGACACCGGGTCCAGGGAGGTGACAAAGGCGCTGGGAGGGGGCGGACGGTGCCGGAGACTCCTCCTGGGCCCTGTGGGCTCGTGGTCCTTGTGAGGACCCTGAGGG*CTGAGGGGCCCCTGGGCCTAGGGACTTGCAGTGAGGGAGGCAGGGAGTGTCCCTTGAGAACGTGGCCTCCGCGGGCTGGGTCCCCCTCGTGCTCCCAGCAGGGAGGACACCCCAGAGCAAGCGCCCCAGGTGGGCGGGGAGGGTCTCCTCACAGGGGCAGCTGACAGATAGAC*GgccCCCGCCAGACAGATGCTTGATCCTGGTCag***TACTGGGTTCGCcACTTCCCTGAACAGGGGCCCTCCGAACAGACACAGACGCAGACCaggCTCAGCACAgAAAATGCACTGACACCCAAAACCCTCATCTGggGGCCTGGCCGGCATCCCGCCCCAGGACCCAAGGCCCCTGCCCCCTGGCAGCCCTGGACACGGTCCTCTGTGGGCGGTGGGGTCgGGGCTGTGGTGACGGTGGCATCGGGGAGCCTGTGCCCCCTCCCTGAAAGGGCGGAG |
AGGCTCAAGAGGGGACAGAAATGTCCTCCCCTAGGAAGACCTCGGACGGGGGCGGGGGGGTGGTCTCCGACAGACAGATGCCCGGGACCGACAGACCTGCCGAGGGAAGAGGGCACCTCGGTCGGGTTAGGCTCCAGGCAGCACGAGGGAGCGAGGCTGGGAGGGTGAGGACATGGGAGCCTGAGGAGGAGCTGGAGACTTCAGCAGGCCCCCAGCTCCGGGCTTCGGGCTCTGAGATGCTCGGACGCAAGGTGAGTGACCCCACCTGTGGCTGACCTGACCTGACCtCAGGGGGACAAGGGTGAGTGACCCCACCTGTGGCTGACCTGACCTGACCtCAGGGGGACAAGGCTCAGCCTGGGACTCTgTGTCCCCATCGCCTGCACAGGGGATTCCCCTGCCAAGGCCACTCCCACGGTCAACCTCTTCCCGCCCTCCTCTGAGGAGCTCGGCACCAACAAGGCCACCCTGGTGTGTCTA |
Secl ID No.32 | |
GCCACGCCCACTCCATCATGCGGGGAGGGGATGGGCAGACCCTCCAGAAAGAAGCTCCCTGGGGTGCAGGTTAACAGCTTTCCCAGACACAGCCAGTACTAGAGTGAGGTGAATAAGACATCCTCCTTGCTTGTGAAATTTAGGAAGTGCCCCCAAACATCAGTCATTAAGATAAATAATATTGAATGCACTTTTTTTTTTTTATTTTTTTTTTTTGCTTTTTAGGGCCTAATCTGCAGCatatggaagttcccaggctacaagtcgaaccagagctgcagctgccagcctacatcacagccacagcaacaccagatccgagccacatctgtgactaacactgcagttcacagcaacgccagatccttaacccattgagtgaggccagggatcaaacccacatcctcatggatactagtctggttcgtaaaccactgagccaCAAGGGGAACTCCTGAATGCAATATTTTTGAAAATTGAAATTAAATCTGTCACTCTTTCACTTAAGAGTCCCCTTAGATTGGGGAAAATTTAAATATCTGTCATCTTAGTGCATCTTTGCTCATATGATGTGAATAAAATCCCAAAATCCATATGAATGAAGCATCAAAATGTACATGAAGTCAGCCTGACCCTGCACTGCCCTCACTTGCCTCATGTACCCCCCACCTCAAAGGAAGATGCAGAAAGGAGTCCAGCCCCTACACCGCCACCTGCCCCCACCACTGGAGCCCCTCAGGTCTCCCACCTCCTTTTCTGAGCTTCAGTCTTCCTGTGGCATTGCCTACCTCTACAGCTGCCCCCTACTAGGCCCTCCCCCTGGGGCTGAGCTCCAGGCACTGGACTGGGAAAGTTAGAGGTTAAAGCATGGAAAATTCCCAAAGCCACCAGTTCCAGGCTGCCCCCCACCCCACCGCCACGTCCAAAAAGGGGCATCTTCCCAGATCTCTGGCTGGTATTGGTAGGACCCAGGACATAGTCTTTATACCAATTCTGCTGTGTGTCTTAGGAAAGAaactctccctctctgtgcttcagtttcctcatcaataaaAGGAGCAGGCCAGGTTGGAGGGTCTGTGACGTCTGCTGAAGCAGCAGGATTCTCTCTCCTTTTGCTGGAGGAGAACTGATCCTTCACCCCCAGGATCAACAGAGAAGCCAAGGTCTTCAGCCTTCCTGGGGACCCCTCAGAGGGAACTCAGGGCCACAGAGCCAGACCCTGATGCCAGAACCTTTGTCATATGCCCAGACGGAGACTTCATCCCCCTCCTCCTCAGACCCTCCAGGCCCCAACAGTGAGATGCTGAAGATATTAAGAGAAGGGCAAGTCAGcTTAAGTTTGGGGGTAGAGGGGAACAGGGAGTGAGGAGATCTGGCCTGAGAGATAGGAGCCCTGGTGGCCACAGGAGGACTCTTTGGGTCCTGTCGGATGGACACAGGGCGGCCCGGGGGCATGTTGGAGCCCGGCTGGTTCTTACCAGAGGCAGGGGGCACCCTCTGACACGGGAGCAGGGCATGTTCCATACATGACACACCCCTCTGCTCCAGGGCAGGTGGGTGGCGGCACAGAGGAGCCAGGGACTCTGAGCAAGGGGTCCACCAGTGGGGCAGTTGGATCCAGACTTCTCTGGGCCAGCGAGAGTCTAGCCCTCAGCCGTTCTCTGTCCAGGAGGGGGGTGGGGCAGGCCTGGGCGGCCAGAGCTCATCCCTCAAGGGTTCCCAGGGTCCTGCCAGACCCAGATTTCCGACCGCAGCCACCACAAGAGGATGTGGTCTGCTGTGGCAGCTGCCAAGACCTTGCAGCAGGTGCAGGGTGGGGGGGTGGGGGCACCTGGGGGCAGCTGGGGTCACTGAGTTCAGGGAAAACCCCTTTTTTCCCCTAAACCTGGGGCCATCCCTAGGGGAAACCACAACTTCTGAGCCCTGGGCAGTGGCTGCTGGGAGGGAAGAGCTTCATCCTGGACCCTGGGGGGGAACCCAGCTCCAAAGGTGCAAGGGGCCCAGGTCCAAGGCTAGAGTGGGCCAAGCACCGCAATGGCCAGGGAGTGGGGGAGGTGGAGCTGGACTGGATCAGGGCCTCCTTGGGACTCCCTACAC |
CCTGTGTGACATGTTAGGGTACCCACACCCCATCACCAGTCAGGGCCTGGCCCATCTCCAGGGCCAGGGATGTGCATGTAAGTGTGTGTGAGTGTGTGTGTGTGGTGTAGTACACCCCTTGGCATCCGGTTCCGAGGCCTTGGGTTCCTCCAAAGTTGCTCTCTGAATTAGGTCAAACTGTGAGGTCCTGATCGCCATCATCAACTTCGTTCTCCCCACCTCCCATCATTATCAAGAGCTGGGGAGGGTCTGGGATTTCTTCCCACCCACAAGCCAAAAGATAAGCCTGCTGGTGATGGCAGAAGACACAGGATCCTGGGTCAGAGACAAAGGCCAGTGTGTCACAGCGAGAGAGGCAGCCGGACTATCAGCTGTCACAGAGAGGCCTTAGTCCGCTGAACTCAGGCCCCAGTGACTCCTGTTCCACTGGGCACTGGCCCCCCTCCACAGCGCCCCCAGGCCCCAGGGAGAGGCGTCACAGCTTAGAGATGGCCCTGCTGAACAGGGAACAAGAACAGGTGTGCCCCATCCAGCGCCCCAGGGGTGGGACAGGTGGGCTGGATTTGGTGTGAAGCCCTTGAGCCCTGgAACCCAAcCACAGCAgGGCAGTTGGTAGATGCCATTTGGGGAGAGGCCCCAGGAGTAAGGGCCATGGGCCCTTGAGGGGGCCAGGAGCTGAGGACAGGGACAGAGACGGCCCAGGCAGAGGACAGGGCCATGAGGGGTGCACTGAGATGGCCACTGCCAGCAGGGGCAGCTGCCAACCCGTCCAGGGAACTTATTCAGCAGTCAGCTGGAGGTGCCATTGACCCTGAGGGCAGATGAAGCCCAGGCCAGGCTAGGTGGGCTGTGAAGACCCCAGGGGACAGAGCTCTGTCCCTGGGCAGCACTGGCCTCTCATTCTGCAGGGCTTGACGGGATCCCAAGGCCTGCTGCCCCTGATGGTAGTGGCAGTACCGCCCAGAGCAGGACCCCAGCATGGAAACCCCAACGGGACGCAGCCTGCGGAGCCCACAAAACCAGTAAGGAGCCGAAGCAGTCATGGCACGGGGAGTGTGGACTTCCCTTTGATGGGGCCCAGGCATGAAGGACAGAATGGGACAGCGGCCATGAGCAGAAAATCAGCCGGAGGGGATGGGCCTAGGCAGACGCTGGCTTTATTTGAAGTGTTGGCATTTTGTCTGGTGTGTATTGTTGGTATTGATTTTATTTTAGTATGTCAGTGACATACTGACATATTATGTAACGACATATTATTATGTGTTTTAAGAAGCACTCCAAGGGAACAGGCTGTCTGTAATGTGTCCAGAGAAGAGAGCAAGAGCTTGGCTCAGTCTCCCCCAAGGAGGTCAGTTCCTCAACAGGGGTCCTAAATGTTTCCTGGAGCCAGGCCTGAATCAAGGGGgTCATATCTACACGTGGGGCAGACCCATGGACCATTTTCGGAGCAATAAGATGGCAGGGAGGATACCAAGCTGGTCTTACAGATCCAGGGCTTTGACCTGTGACGCGGGCGCTCCTCCAGGCAAAGGGAGAAGCCAGCAGGAAGCTTTCAGAACTGGGGAGAACAGGGTGCAGACCTCCAGGGTCTTGTACAACGCACCCTTTATCCTGGGGTCCAGGAGGGGTCACTGAGGGATTTAAGTGGGGGACCATCAGAACCAGGTTTGTGTTTTGGAAAAATGGCTCCAAAGCAGAGACCAGTGTGAGGCCAGATTAGATGATGAAGAAGAGGCAGTGGAAAGTCGATGGGTGGCCAGGTAGCAAGAGGGCCTATGGAGTTGGCAAGTGAATTTAAAGTGGTGGCACCAGAGGGCAGATGGGGAGGAGCAGGCACTGTCATGGACTGTCTATAGAAATCTAAAATGTATACCCTTTTTAGCAATATGCAGTGAGTCATAAAAGAACACATATATATTTAAATTGTGTAATTCCACTTCTAAGGATTCATCCCAAGGGGGGAAAATAATCAAAGATGTAACCAAAGGTTTACAAACAAGAACTCATCATTAATCTTCCTTGTTGTTATTTCAACGATATTATTATTATTACTATTATTATTATTATTATTttgtctttttgcattttctagggccactcccacggcatagagaggttcccaggctaggggtcaaatcggagctacagctgccggcctacgccagagccacagcaacgcaggatctgagccacagcaatgcaggatctacaccacagctcatggtaacgctggatccttaacccaatgagtgaggccagggatcgaacctgtaacttcatggttcctagtcggattcattaaccactgagccacgacaggaactccAACATTATTAATGATGGGAGAAAACTGGAAGTAACCTAAATATCCAGCAGAAAGGGTGTGGCCAAATACAGCATGGAGTAGCCATCATAAGGAATCTTACACAAGCCTCCAAAATTGTGTTTCTGAAATTGGGTTTAAAGTACGTTTGCATTTTAAAAAGCCTGCCAGAAAATACAGAAAAATGTCTGTGATATGTCTCTGGCTGATAGGATTTTGCTTAGTTTTAATTTTGGCTTTATAATTTTCTATAGTTATGAAAATGTTCACAAGAAGATATATTTCATTTTAGCTTCTAAAATAATTATAACACAGAAGTAATTTGTGCTTTAAAAAAATATTCAACACAGAAGTATATAAAGTAAAAATTGaggagttcccatcgtggctcagtgattaacaaacccaactagtatccatgaggatatggatttgatccctggccttgctcagtgggttgaggatccagtgttgctg |
tgagctgtggtgtaggttgcagacacagcactctggcgttgctgtgactctggcgtaggccggcagctacagctccatttggacccttagcctgggaacctccatatgcctgagatacggcccTAAAAAGTCAAAAGCCAAAAAAATAGTAAAAATTGAGTGTTTCTACTTACCACCCCTGCCCACATCTTATGCTAAAACCCGTTCTCCAGAGACAAACATCGTCAGGTGGGTCTATATATTTCCAGCCCTCCTCCTGTGTGTGTATGTCCGTAAAACACACACACACACACACACACGCACACACACACACACGTATCTAATTAGCATTGGTATTAGTTTTTCAAAAGGGAGGTCATGCTCTACCTTTTAGGCGGCAAATAGATTATTTAAACAAATCTGTTGACATTTTCTATATCAACCCATAAGATCTCCCATGTTCTTGGAAAGGCTTTGTAAGACATCAACATCTGGGTAAACCAGCATGGTTTTTAGGGGGTTGTGTGGATTTTTTTCATATTTTTTAGGGCACACCTGCAgcatatggaggttcccaggctaggggttgaatcagagctgtagctgccggcctacaccacagccacagcaacgccagatccttaacccactgagaaaggccagggattgaacctgcatcctcatggATGCTGGTCAGATTTATTTCTGCTGAGCCACAACAGGAACTCCCTGAACCAGAATGCTTTTAACCATTCCACTTTGCATGGACATTTAGATTGTTTCCATTTAAAAATACAAATTACAaggagttcccgtcgtggctcagtggtaacgaattggactaggaaccatgaggtttcgggttcgatccctggccttgctcggtgggttaaggatccagcattgatgtgagatatggtgtaggtcgcagacgtggctcggatcccacgttgctgtggctctggcgtaggccggcaacaacagctccgattcgacccctagccTGggaacctccatgtgccacaggagcagccctaGAAAAGGCAAAAAGACAAAAAAATAAAAAATTAAAATGAAAAAATAAAATAAAAATACAAATTACAAGAGACGGCTACAAGGAAATCCCCAAGTGTGTGCAAATGCCATATATGTATAAAATGTACTAGTGTCTCCTCGCGGGAAAGTTGCCTAAAAGTGGGTTGGCTGGACAGAGAGGACAGGCTTTGACATTCTCATAGGTAGTAGCAATGGGCTTCTCAAAATGCTGTTCCAGTTTACACTCACCATAGCAAATGACAGTGCCTCTTCCTCTCCACCCTTGCCAATAATGTGACAGGTGGATCTTTTTCTATTTTGTGTATCTGACAAGCAAAAAATGAGAACAggagttcctgtcgtggtgcagtggagacaaatctgactaggaaccatgaaatttcgggttcaatccctggcctcactcagtaggtaaaggatccagggttgcagtgagctgtggggtaggtcgcagacacagtgcaaatttggccctgttgtggctgtggtgtaggccggcagctatagctccaattggacccctagcctgggaacctccttatgccgtgggtgaggccctAAAAAAAAGAGTGCAAAAAAAAAAAATAAGAACAAAAATGATCATCGTTTAATTCTTTATTTGATCATTGGTGAAACTTATTTTCCTTTTATATTTTTATTGACTGATTTTATTTCTCCTATGAATTTACCGGTCATAGTTTTGCCTGGGTGTTTTTACTCCGGTTTTAGTTTTGGTTGGTTGTATTTTCTTAGAGAGCTATAGAAACTCTTCATCTATTTGGAATAGTAATTCCTCATTAAGTATTTGTGCTGCAAAAAATTTTCCCTGATCTGTTTTATGCTTTTGTTTGTGGGGTCTTTCACGAGAAAGCCTTTTTAGTTTTTACACCTCAGCTTGGTTGTTTTTCTTGATTGTGTCTGTAATCTGCGGCCAACATAGGAAACACATTTTTACTTTAGTGTTTTTTTCCTATTTTCTTCAAGTACGTCCATTGTTTTGGTGTCTGATTTTACTTTGCCTGGGGTTTGTTTTTGTGTGGCAGGAATATAAACTTATGTATTTTCCAAATGGAGAGCCAATGGTTGTATATTTGTTGAATTCAAATGCAACTTTATCAAACACCAAATCATCGATTTATCACAACTCTTCTCTGGTTTATTGATCTAATGATCAATTCCTGTTCCACGCTGTTTTAATTATTTTAGCTTTGTGGATTTTGGTGCCTGGTAGAGAACAAAGCCTCCATTATTTTCATTCAAAATAGTCCCGTCTATTATCTGCCATTGTTGTAGTATTAGACTTTAAAATCAATTTACTGATTTTCAAAAGTTATTCCTTTGGTGATGTGGAATACTTTATACTTCATAAGGTACATGGATTCATTTGTGGGGAATTGATGTCTTTGCTATTGTGGCCATTTGTCAAGTTGTGTAATATTTTACCCATGCCAACTTTGCATATTGTATGTGAGTTTATTCCCAGGGTTTTTAATAGGATGTTTATTGAAGTTGTCAGTGTTTCCACAATTTCATCGCCTCAGTGCTTACTGTTTGCATAAAAGGAAACCTACTCACTTTTGCCTATTGCTCTTGTATTCAATCATTTTAGTTAACTCTTGTGTTAATTTTGAGAGTTTTTCAGCTGACTGTCTGGGGTTTTCTTTAATAGACTAGCCCTTTGTCTGTAAAGAATAATTTTATCGAATTTTTCTTAACACTCACACTCTCCCCACCCCCACCCCCGCTCATCTCCTTTCATTGGGTC |
AAATCTGTAGAATACAATAAAAGTAAGAGTGGGAACCTTAGCCTTTAAGTCGATTTTGCCTTTAAATGTGAATGTTGCTATGTTTCGGGACATTCTCTTTATCAAGTTGCGGATGTTTCCTTAGATAATTAACTTAATAAAAGACTGGATGTTTGCTTTCTTCAAATCAGAATTGTGTTGAATTTATATTGCTATTCTGTTTAATTTTGTTTCAAAAAATTTACATGCACACCTTAAAGATAACCATGACCAAATAGTCCTCCTGCTGAGAGAAAATGTTGGCCCCAATGCCACAGGTTACCTCCCGACTCAGATAAACTACAATGGGAGATAAAATCAGATTTGGCAAAGCCTGTGGATTCTTGCCATAACTCTCAGAGCATGACTTGGGTGTTTTTTCCTTTTCTAAGTATTTTAATGGTATTTTTGTGTTACAATAGGAAATCTAGGACACAGAGAGTGATTCAATGAGGGGAACGCATTCTGGGATGACTCTAGGCCTCTGGTTTGGGGAGAGCTCTATTGAAGTAAAGACAATGAGAGGAAGCAAGTTTGCAGGGAACTGTGAGGAATTTAGATGGGGAATGTTGGGTTTGAGGTTTCTATAGGGCACGCAAGCAGAGATGCACTCAGGAGGAAGAAGGAGCATAAATCTAGAGGCAAAAAGAGAGGTCAGGACTGGAAATAGAGATGCGAGACACCAGGGTGGCAGTCAGAGAGCACAGTGTGGGTCAGAAGACAGTGGAAGAACACAAGGGACAGAGAGGGATCTCCAACTTCACTGGGATGAGGGCCTTGTTGGCCTTGACCTGAGAGATTTCCAGGAGTTGAGGGTGGGAAGGAGAGGGCTCCTGCACATGTCCTGACATGAAACGGTGCCCAGCATATGGGTGCTTGGAAGACATTGTTGGACAGATGGATGGATGATGGATGATGGATGAATGGATGGATGGAAGATGATGGATAAATGGATGATGGATGGATGGACAGAAGGACAAAGAGATGGACAGAAAGACAGTGATCTGAGAGAGCAGAGAAGGCTTCATGAAAGGACAGGAACTGAACTGTCTCAGTGGGTGGAGACAATGGTGTAGGGGGTTTCCACATGGAGGCACCAGGGGTCAGGAATAATCTAGTGTCCACAGGCCCAGGAAGGAAGCTGTCTGCAGGAAATTGTGGGGAAGAACCTCAGAGTCCTTAAATGAGGTCAGGAGTGGTCAGGAGGGTCTGATCAGGTAAGGACTCATGTCCATCATCACATGGTCACCTAAGGGCATGTAGCTCTCAGCATCTCCATCAGGACAGTCTCAGAATGGGGGCGGGGTCACACACTGGGTGACTCAAGGCGTGGGTCATGCCTGCCTCGGACGTGGGCCTGGGCATGGGGACACCTCCAGACCATGGGCCCGCCCAGGGCTGCACTGGcctctggtgggctagctacccgtccaagcaacacaggacacagccctacctgctgcaaccctgtgcccgaaacgcccatctggttcctgctccagcccggccccagggaacaggactcaggtgctagcccaatggggttttgttcgagcctcagtcagcgtggTATTTCTCCGGCAGCGAGACTCAGTTCACCGCCTTAGGttaagtggttctcatgaatttcctagcagtcctgcactctgctatgccgggaaagtcacttttgtcgctgggggctgtttccccgtgcccttggagaatcaaggattgaccaactttctctgtgggggaggtggctggtcttggggtgaccagcaggaagggccccaaaagcaggagcagctgcctccagAATACAACTGTCGGCTACAGCTCAAACAGGAGGCCTGGACTGGGGTTTAACCACCAGGGCGGCACGAAGGAGCGAGGCTGGGAGGGTGAGGACATGGGAGCCTGAGGAGGAGCTGGAGACTTCAGCAGGCCCCCAGCTCCGGGCTTCGGGCTCTGAGATGCTCGGACGCAAGGTGAGTGACCCCACCTGTGGCTGACCTGACCTCAGGGGGACAAGGCTCAGCCTGAGACTCTGTGTCCCCATCGCCTGCACAGgggattcccctgatggacactgagccaacgacctcccgtctctccccgacccccaggtcagcccaaggccgcccccacggtcaacctcttcccgccctcctctgaggagctcggcaccaacaaggccaccctggtgtgtctaataagtgacttctacccgAAGGGCGAATTCCAGCACACTGGCGGCCGTTACTAGTGGATCCGAGCTCGGTACCAAGCTTGATGCATAGCTTGAGTATCTA |
Seq ID No.33 | agatctttaaaccaccgagcaaggccagggatcgaacccgcatcctcatgaatcctagttgggttcgttaaccgctgaaccacaatgggaactcctGTCTTTCACATTTAATTCACAACCTCTCCAGGATTCTGGGGGTGGGTGGGGAATCCTAGGTACCCACTGGGAAAGTAATCCAAGGGGAGAGGCTCACGGACTcTAGGGATCGGCGGAGGAGGGAAGGTATCTCCCAGGAAACTGGCCAGGACACATTGGTCCTCCGCCCTCCCCTTCCTCCCACTCCTCCTCCAGACAGGACTG |
TGCCCACCCCCTGCCACCTTTCTGGCCAGAACTGTCCATGGCAGGTGACCTTCACATGAGCCCTTCCTCCCTGCCTGCCCTAGTGGGACCCTCCATACCTCCCCCTGGACCCCGTTGTCCTTTCTTTCCAGTGTGGCCCTGAGCATAACTGATGCCATCATGGGCTGCTGACCCACCCGGGACTGTGTTGTGCAGTGAGTCACTTCTCTGTCATCAGGGCTTTGTAATTGATAGATAGTGTTTCATCATCATTAGGACCGGGTGGCCTCTATGCTCTGTTAGTCTCCAAACACTGATGAAAACCTTCGTTGGCATAGTCCCAGCTTCCTGTTGCCCATCCATAAATCTTGACTTAGGGATGCACATCCTGTCTCCAAGCAACCACCCCTCCCCTAGGCTAACTATAAAACTGTCCCAATGGCCCTTGTGTGGTGCAGAGTTCATGCTTCCAGATCATTTCTCTGCTAGATCCATATCTCACCTTGTAAGTCATCCTATAATAAACTGATCCATTGATTATTTGCTTCTGTTTTTTCCATCTCAAAACAGCTTCTCAGTTCAGTTCGAATTTTTTATTCCCTCCATCCACCCATACTTTCCTCAGCCTGGGGAACCCTTGCCCCCAGTCCCATGCCCTTCCTCCCTCTCTGCCCAGCTCAGCACCTGCCCACCCTCACCCTTCCTGTCACTCCCTAGGACTGGACCATCCACTGGGGCCAGGACACTCCAGCAGCCTTGGCTTCATGGGCTCTGAAATCCATGGCCCATCTCTATTCCTCACTGGATGGCAGGTTCAGAGATGTGAAAGGTCTAGGAGGAAGCCAGGAAGGAAACTGTTGCATGAAAGGCCGGCCTGATGGTTCAGTACTTAAATAATATGAGCTCTGAGCTCCCCAGGAACCAAAGCATGGAGGGAGTATGTGCCTCAGAATCTCTCTGAGATTCAGCAAAGCCTTTGCTAGAGGGAAAATAGTGGCTCAACCTTGAGGGCCAGCATCTTGCACCACAGTTAAAAGTGGGTATTTGTTTTACCTGAGGCCTCAGCATTATGGGAACCGGGCTCTGACACAAACACAGGTGCAGCCCGGCAGCCTCAGAACACAGCAACGACCACAAGCTGGGACAGCTGCCCCTGAACGGGGAGTCCACCATGCTTCTGTCTCGGGTACCACCAGGTCACCATCCCTGGGGGAGGTAGTTCCATAGCAGTAGTCCCCTGATTTCGCCCCTCGGGCGTGTAGCCAGGCAAGCTCCTGCCTCTGGACCCAGGGTGGACCCTTGCTCCCCACTACCCTGCACATGCCAGACAGTCAAGACCACTCCCACCTCTGTCTGAGGCCCCCTTGGGTGTCCCAGGGCCCCCGAGCTGTCCTCTACTCATGGTTCTTCCACCTGGGTACAAAAGAGGCGAGGGACACTTTTCTCAGGTTTGCGGCTCAGAAAGGTACCTTCCTAGGGTTTGTCCACTGGGAGTCACCTCCCTTGCATCTCAATGTCAGTGGGGAAAACTGGGTCCCATGGGGGGATTAGTGCCACTGTGAGGCCCCTGAAGTCTGGGGCCTCTAGACACTATGATGATGAGGGATGTGGTGAAAAACCCCACCCCAGCCCTTCTTGCCGGGACCCTGGGCTGTGGCTCCCCCATTGCACTTGGGGTCAGAGGGGTGGATGGTGGCTATGGTCAGGCATGTTTCCCATGAGCTGGGGGCACCCTGGGTGACTTTCTCCTGTGAATCCTGAATTAGCAGCTATAACAAATTGCCCAAACTCTTAGGCTTAAAACAACACACATTTATTCCTCTGGGTCCCAGGGTCAGAAGTCCAAAATGAGTCCTATAGGCTAAATTTGAGGTGTCTCTGGGTTGAGCTCCTCCTGGAAGCCTTTTCCAGCCTCTAGAGTCCCAAGTCCTTGGCTCTGGGCCCCTCCCTCAAGCTTCAAAGCCACAGAAGCTTCTAATCTCTCTCCCTTCCCCTCTGACCTCTGCTCCCATCCTCATACCCTGTCCCCTCACTCTGACCCTCCTGCCTCCCTCTTTCCCTTATAAAGACCCTGCATGGGGCCACGGAGATAATCCAGGGTAATCGCCCCTCTTCCAGCCCTTAACTCCATCCCATCTGCAAAATCCCTGTCACCCCATAATGGACCTACTGATGGTCTGGGGGTTAGGACGTGGACAACTTGGGGCCTTATTCATCTGATCACAACTCCAGTTCCCAGACCCCCAGACCCCCGGGCATTAGGGAAACTTCTCCCAGTTCCTCTCCCTCTGTGTCCTGCCCAGTCTCCAGGATGGGCCACTCCCGAGGGCCCTTCAGCTCAGGCTCCCCCTCCTTTCTCCCTGGCCTCTTGTGGCCCCATCTCCTCCTCCGCTCACAGGGAGAGAACTTTGATTTCAGCTTTGGCTCTGGGGCTTTGCTTCCTTCTGGCCATTGGCTGAAGGGCGGGTTTCTCCAGGTCTTACCTGTCAGTCATCAAACCGCCCTTGGAGGAAGACCCTAATATGATCCTTACCCTACAGATGGAGACTCGAGGCCCAGAGATCCTGAGTGACCTGCTCACATTCACAGCAGGGACTGAACCCCAGTCACCTACCCAACTCCAGGGCTCAGCGCTTTTTTTTTTTTTTTTCTTTTTgccttttcgagggccgctcccgcaacatatggagatttccaggctaggggtctaattggagcagtcgacactggcctaagccaaagccacagcaacaagggcaagccgcttctgcagcctataccacagctcacggcaatgccggatccttaacccactgagcaa |
agccagggattgaacctgcaacctcatgtttcctagtcaaatttgttaaccactgacccatgacgggaactcccAGGGCTCAGCTCTTGACTCCAGGTTCGCAGCTGCCCTCAAAGCAATGCAACCCTGGCTGGCCCCGCCTCATGCATCCGGCCTCCTCCCCAAAGAGCTCTGAGCCCACCTGGGCCTAGGTCCTCCTCCCTGGGACTCATGGCCTAAGGGTACAGAGTTACTGGGGCTGATGAAGGGACCAATGGGGACAGGGGCCTCAAATCAAAGTGGCTGTCTCTCTCATGTCCCTTCCTCTCCTCAGGGTCCAAAATCAGGGTCAGGGCCCCAGGGCAGGGGCTGAGAGGGCCTCTTTCTGAAGGCCCTGTCTCAGTGCAGGTTATGGGGGTCTGGGGGAGGGTCAATGCAGGGCTCACCCTTCAGTGCCCCAAAGCCTAGAGAGTGAGTGCCTGCCAGTGGCTTCCCAGGCCCAATCCCTTGACTGCCTGGGAATGCTCAAATGCAGGAACTGTCACAACACCTTCAGTCAGGGGCTGCTCTGGGAGGAAAAACACTCAGAATTGGGGGTTCAGGGAAGGCCCAGTGCCAAGCATAGCAGGAGCTCAGGTGGCTGCAGATGGTGTGAACCCCAGGAGCAGGATGGCCGGCACTCCCCCCAGACCCTCCAGAGCCCCAGGTTGGCTGCCCTCTTCACTGCCGACACCCCTGGGTCCACTTCTGCCCTTTCCCACCTAAAACCTTTAGGGCTCCCACTTTCTCCCAAATGTGAGACATCACCACGGCTCCCAGGGAGTGTCCAGAAGGGCATCTGGCTGAGAGGTCCTGACATCTGGGAGCCTCAGGCCCCACAATGGACAGACGCCCTGCCAGGATGCTGCTGCAGGGCTGTTAGCTAGGCGGGGTGGAGATGGGGTACTTTGCCTCTCAGAGGCCCCGGCCCCACCATGAAACCTCAGTGACACCCCATTTCCCTGAGTTCACATACCTGTATCCTACTCCAGTCACCTTCCCCACGAACCCCTGGGAGCCCAGGATGATGCTGGGGCTGGAGCCACGACCAGCCCACGAGTGATCCAGCTCTGCCAATCAGCAGTCATTTCCCAAGTGTTCCAGCCCTGCCAGGTCCCACTACAGCAGTAATGGAGGCCCCAGACACCAGTCCAGCAGTTAGAGGGCTGGACTAGCACCAGCTTTCAAGCCTCAGCATCTCAAGGTGAATGGCCAGTGCCCCTCCCCGTGGCCATCACAGGATCGCAGATATGACCCTAGGGGAAGAAATATCCTGGGAGTAAGGAAGTGCCCATACTCAAGGATGGCCCCTCTGTGACCTAACCTGTCCCTGAGGATTGTACTTCCAGGCGTTAAAACAGTAGAACGCCTGCCTGTGAACCCCCGCCAAGGGACTGCTTGGGGAGGCCCCCTAAACCAGAACACAGGCACTCCAGCAGGACCTCTGAACTCTGACCACCCTCAGCAAGTGGCACCCCCCGCAGCTTCCAAGGCAC |
Seq ID No.34 | AACAAGATGCTACCCCACCAACAAAATTCACCGGAGAAGACAAGGACAGGGGGTTCCTGGGGTCCTGACAGGGTCACCAAAGAGGGTTCTGGGGCAGCAGCAACTCCAGCCGCCTCAGAACAGAGCCTGGAAGCTGTACCCTCAGAGCAGAGGCGGAGAGAGAAAGGGCCTCTTGGTGGGTCAGCAGGAGCAGAGGCTCAGAGGTGGGGGTTGCAGCCCCCCCTTCAACAGGCCAACACAGTGAAGCAGCTGACCCCTCCACCTTGGAGACCCCAGACTCCTGTCTCCCACGCCACCTTGGTTTTTAAGGTAATTTTTATTTTATATCAGAGTATGGTTGACTTACAATGTTGTGTTGGTTTCAGGTGTACAGCAGAGTGATTCACTTCTACATAGACTCATATCTATTCTTTCTCAGATTCTTTTCCCATATAGGTTATTACAGAATATTGAGTAGATCCCTGCTGATTACCCATTTTTATAATTGTATATGTTAATCCCAAACTCCTAATTTATCCCTCCCCAGACTATGATTCTTTATATCTCTATCTGTTTCCTAATCTGTCTCCTCTAAGTCACCCTAGGAGAGCAGAGGGGTCACGTCTGTCCTGTCCTGGCCCAGCCACCTCTCTCCACCCAGGAATCCCTTGCATTTGGTGCCAAGGGCCCGGCCCCGCCCTAAAGAGAAAGGAGAACGGGATGTGGACAGGACACCGGGCAGAGAGGGACAAGCAGAGGATGCCAGGGTAGGGAGGTCTCCAGGGTGGATGGTGGTCTGTCCGCAGGCAGGATGAGGCAGGAAGGGTGTGGATGTACTCGGTGAGGCTGGCGCATGGCCTGGAGTGTCCTGAGCCCTGGGAGGCCTCAGCCCTGGATCAGATCTGTGATTCCAAAGGGCCACTGCATCCAGAGACCGTTGAGTGGCCCATTGTCCTGAACCATTTATAGAACACAGGACAAGCGGTACCTGACTAAGCTGCTCACAGATTCCATGAGGCTGATGCCAGGGTTGTCACCCCATCTCACAGGCAGGGAAACTGATGCATATACTGCAGAGCCAGGCAGAGGCCCTCCCAGTGCCCCCTCCCAGCCTGTGGCCC |
CCCTCCAGTGGCTGGACACTGAGGCCACACTGGGGCACCCTGTGGAGATCt |
Seq ID No.35 | AGATCTGGCCAGGCCAGAGAAGCCCATGTGGTGACCTCCCTCCATCACTCCACGCCCTGACCTGCCAGGGAGCAGAAAGTAGGCCCAGGGTGGACCCGGTGGCCACCTGCCACCCCATGGCTGGGAGAAGGGAGGGCCTGGGCAAAGGGCCTGGGAAGCCTGTGGTGGGACCCCAGACCCCAGGGTGGACAGGGAGGGTCCCACACCCACAGCCATTTGCTTCCCTCTGTGGGTTCAGTGTCCTCATCTCATCTGTGGGGAGGGGGCTGATAATGAATCTCCCCCATTGGGGTGGGCTTGGGGATTAAAGGGCCAGTGTCTGTGATATGCCTGGACCATAGTGACCCTCACCCTCCCCAGCCATTGCTGTCACCTTCCGGGCTCTTGCCCAGGCCTGCCTGACATGCTGTGTGACCCTGGGCAAGATGATCCCCCTTTCTGGGCCCCAGCCTTCCTCTCTGCTCCGGAAGTGCTTCCTGGGGAAACCTGTGGGCTGGATCCTATAGGAAACCTGTCCAATTCCTGGATGCACAGAGGGGCAGGGAGGCCCTGGGCCTGGAGGGGCAGGGAGGCTCGAGGTGGGAGCAGGGTAGGGGCCAGTCCAGGGCAAGGAGGTGGGTGGGTAGGGTG |
Seq ID No.36: | GATCTGTGTTCCATCTCAGAGCTATCTTAGCAGAGAGGTGCAGGGGCCTCCAGGGCCACCAAAGTCCAGGCTCAGCCAGAGGCAATGGGGTATCGATGAGCTACAGGACACAGGCGTCAGCCCAGTGTCAGGGAGAATCACCTTGTTTGTTTTCTGAGTTCCTCTTAAAATAGAGTTAATTGGTCTTGGCCTTACGGTTTACAATAACAACTGCACCCTGTAAACAACGTGAAGAGTACAGAACAACAAATGGGGGAAAACATATTTCACCTGAAAGAGCCACCGCTCATATTTTGATGGATTTCCTTCTAGTTTAATCCTGTTTTAATTGTAAACTGTTAAAACAAACATAAATAAAGAAAATGCATCTGTAAAGTTTAAAAGTCATATCTATGGTGATGGTTGCAAAACACTGTGAATGTTCACTTTGAAATCGTGAACTCTACGTGATATGCATGTCCCGTTAATTAACCTCACAGGCTCAGAATGTGGTTCATTATTTCTTTAATTTTCCTTTAATTTTATGTCCTCTGTGTGTGCCCTTAAACCAACTACTTTTCAGCTCTGCCTGTTTTTGACCTTCACATAGATGACATTTGTGAGTGTTTTCTTTCTCAACACTGGGTCTGATACCCACCCACGCTGTCTGCTGTCACTGCGGACGTGGAGGGCCACCACCCAGCTATGGCCCCAGCCAGGCCAACACTGGATGAATCTGCCCCCAGAGCAGGGCCACCAACACTGGAGGTGCAGAGAGGGTTTCTTCAGGGCCATCATTATCCAAGGCATTGTTTCTACTGTAAGCTTTCAAAATGCTTCCCCTGATTATTAAAAGAAATAATAAGATGGGGGGAAAGTACAAGAAGGGAAGTTTCCAGCCCAGCCTGAAGATCGTGCTGGTTGTATCTGGAGCCTGTCTTCCTGACAGGCCTCTATTCCCAGAGTTA |
Seq ID No.37: | GGATCCTAGGGAAGGGAGGGCGGGGGCCTGGACAAAGGGGGCCTAAAGGACATTCTCACCTATCCCACTGGACCcctgctgtgctctgagggagggagcagagagggggtctgaggccttttcccagCTCCTCTGAGTCCCTCCTCCGAGCACCTGGACGGAAGCCCCTCCTCAGGGAGTCCTCAGACCCCTCCCCTCCAGCCAGGTTGGCCTGTGTGGAGTCCCCAGTAAGAATAGAATGCTCAGGGCTTCGAGCTGAGCCCTGGCTACTTGGGGGGGTGCTGGGGATTGGGGGTGCTGGGCGGGGAGCTGGGGTGTCACTAGATGCCAGTAGGCTGTGGGCTCGGGTCTGGGGGGTCTGCACATGTGCAGCTGTGGGAAGGCCCTATTGGTGGTACCCTCAGACACATATGGCCCCTCAATTTCTGAGACCAGAGACCCCAGTCTGGCCTTCCCAGAACAGCTGCCCCTGGTGGGGGAGATGTAGGGGGGCCTTCAGCCCAGGACCCCCAACGGCAGGGCCTGAGGCCCCCATCCCCTTGTCCTGGGCCCAGAGCCTCAGCTATCAGGCCTATCAGAGATCCTGGCTGCCCAGCTCAGGTTCCCCAGGAGCCAGAGGGAGGCCAGGGGTTACTAGGAAATCCGGAAAG |
GGTCTTTGAGGCTGGGCCCCACCCTCTCAGCTTTCACAGGAGAAACAGAGGCCCACAGGGGGCAAAGGACTTGCCAGACTCACAATGAGCCCAGCAGCTGGACTCAAGGCCCAGTGTTCGGCCCCACAACAGCACTCACGTGCCCTTGATCGTGAGGGGCCCCCTCTCAGCCAGGCATTCAGACCTGTGACCTGCATCTAAGATTCAGCATCAGCCATTCTGAGCTGAAGAGCCCTCAGGGTCTGCAGTCAAGGCCACAGGGCCAGACCTCCAACGGCCAGACATCCCAGCCAGATTCCTTTCTGGTCAATGGGCCCCAGTCTGGCTTGGCTCCTGCAGGCCCAGTGCCGCCTTCTTCCCCTGGGCCTGTGGAGTCCAGCCTTTCAGTTTCCCACCCACATCCTCAGCCACAATCCAGGCTCAGAGGCAATGTCCGTGGGCAGCCCCTGTGTGACCCCTCTGTGGGTGATCCTCAGTCCTACCCTTAGCAGACAGCGCATGAGGGGCCCTCTTGAACCTGAGGGATACTCCATGTCGGAGGGGAGAAGCTGGCCTTCCCCACCCCCACTTCCAGGCCTTGGGGAGCAGAGAAAGACCCCAGACCTGGGTCCCTTCTAACAGGCCAGGCCCCAGCCCAGCTCTCCACCAGCCCCAGGGGCCTCGGGTCCACGCCTGGGGACTGGAGGGTGGGCCTGTCAGGCGCTGACCCAGAGGCAGGACAGCCAAGTTCAGGATCCCAGCCAGGTGGTCCCCGTGCACCATGCAGGGGTGTCACCCACACAGGGGTGTTGCCACCCTCACCTGACTGTCCTCATGGGCCACATGGAGGTATCCTGGGTTCATTACTGGTCAACATACCCGTGTCCCTGCAGTGCCCCCTCTGGcgcacgcgtgcacgcgcacacgcacacactcatacaGAGGCTCCAGCCAACAGTGCCCTCTAGTAGGCACTGCTGTCACTTCTCTAAAAGGTCGCAATCATACTTGTAAAGACCCAAGATTGTTCAGAAATCCCAGATGGAGAAGTCTGGAAAGATCtTTTTCTCCTTTCACGGGCTGGGGAAATGTGACCTGGCCAAGGTCACACAGCAAGTGGTGGAACCCTGGCCCCTGATTCCAGCTCATTCCAGTTCCCAAGGCCCTGCCAGAGCCCAGAGGCTGGGCCCTCTGGGGCAGAGGAGCTGGGGTCCTCCCCCCTACACAGAGCACACAGCCCCGCAAGAGAGAAGAGACACCTTGGGGAGAGGAATCTCCAGACCAGAGATCCCAGTATGGGTCTCCTCTATGCTGACGGGATGGGATGTCAAGAGGGGAGGGGGCTGGGCTTTAGGGAAACACACAAAAATCGCTGAGAACACTGACAGGTGCGACACACCCACCCCTAATGCTAACCTGTGGCCCATTACTCAgatct |
Seq ID No.38 | GATCTTCTCCTAAGACCAAGGAAAACTGGTCATACCAGGTCCACTTGTCCCCTGTGGCCATTGTCCCTCCTTCCCCAGAAGAAACAAGCACTTTCCACTCCACAAGTAGCTCCTGATCAGCTTGGAAGCCCGGTGCTGCTCTGGGCCCTGGGGACACGGCAGGGGCATCAGAGACCAAATCCTGGAACAAAGTTCCAGTGGGTGAGGCAGGCCGGACAAGCAACACGTTATACCATAATATGAGGCAAAATATAATGTGAGTTCTTTATGAAAGGAAGGGGTTGCAGGTGCAACTGTTGGCTTAGGTGGATGGTCACCCCTGAATGGAGGAGGGGGTTCCCAGGGCATGTGCCTGGGGAGAAGGGCTCCTGGCAGGAGGGACAGCAAGTGCAAGGGCCCTGTGATCAAATGTGCCTGGCAAGTTGCAGGAACAGCTAGAAGGCCAGCAAGGTTGGAACCAAGGAAGGGGTCAGGGGAGGGGCAGGGCCCTCAGGGCCTTGCCCAGCAGCCTGAGCATCTGGAGATTTGTCCAAAGTTTCAAATGTACCTGGGCAACCTCATGCCCATATACCATTCCTAACTTCTGCACTTAACATCTCTAGGACTGGGACCCAGCCAGTCAAGCGGGGGGACCCAGAGAGCTCCGGTGTGAACACCGAGGTGCTGGTGGGTCTGCGTGTGTGGACATAGGGCAGTCCCGGTCCTTCCTTCACTAACACGGCCCGGGAAGCCCTGTGCCTCCCTGGTGCGCGGGTCGGCGCTTCCGGAGGGTACAGGCCCACCTGGAGCCCGGGCACAGTGCATGCAAGTCGGGTTCACGGCAACCTGAGCTGGCTCTGCAGGGCAGTGGGACTCACAGCCAGGGGTACAGGGCAGACCGGTCCTGCCTCTGCGCCCCTCCCTGGCCTGTGGCCCCTGGACGTGATCCCCAACAGTTAGCATGCCCCGCCGGTGCTGAGAACCTGGACGAGGTCCGCAGGCGTCACTGGGCGGTCACTGAGCCCGCCCCAGGCCCCCTCTGCCCCTTCCTGGGGTGACCGTGGACTCCTGGATGACCCTGGACCCTAGACTTCCCAGGGTGTCTCGCGGAGGTTCCTCAGCCAGGATCTCTGCGTCTCCTCCTTCCATAGAGGGGACGGCGCCCCCTTGTGGCCAAGGAGGGGACGGTGGGTCCCGGAGCTGGGGCGGAGAACACAGGGA |
GCCCCTCCCAGACCCCGCTCTGGGCAGAACCTGGGAAGGGATGTGGCCATCGGGGGATCCCTCCAGGCCATCTCCTCAGATGGGGGCTGGTCGACTAGCTTCTGAGTCCTCCAAGGAACCGGGTCCTTCTAGTCATGACTCTGCCCAGATGAAGAAGGAGAGCACTTCTCTCCATCAGGAGGATCTGAGCTTCTCTTAATTAGAATCAGCTCCTTGGCTTCTACCCCTTAAAAAAAGGTACAGAAACTTTGCACCTTGATCCAGTATCAGGGGAATTTATCAATCAATGTGGGAGAAATTGGCATCTTTACCACACTGAATCTTTCAATCCATGAATATCCTCTCTCTCTTCCATGCATAGGTTTTAATAATTCTCAATGGAGTTTAATGTAAGTTTTCCTCATAGACAATTGCCTTTGGACATCTCTTTAGACTCATCTCTAGTAAACTGATATTCTTAATGCAATTATAAAATGTATCCTGCTTAATGTTATTTTCTATTCATTTGCTGTTATATAGAGATACAATGAGTTTCCACATTTGAAACTGGATCTGGTAAATTGGCTACCCTTTTTTTATAGATTCTATTAATTTTTATACATTCTGTGGGACTTGCTACATACTTAATCATGTCACCTGTGAAGAATGACAATTTGGTTGCTACCCTCCCAATTCTTATATGTCTCATTTCTTTCCCTCTGCTGGTACTCTGGCAGCAGCAGGGAAGATAATGGGCCTCCTTATCTTGTCACAAAAGGATGTTTTTAAAGATTTCGTTATAAAACATAACGCTTTCTGGTTTTCTTTAAAGATTCTCTCACCAGCTTAAGAAAATTTTCTTATACTCTGTATGATAAATGGGTTTTTGACAATCATTTGTTGCATTTTACCTAGTGTTTTCTCTGCATCTTTATATGCTTTTTCTCCTTTAATCCTGAAAATTGTTTCGATTTTTCTAACATTGAACCAATCTTACATTCCTGGAATGGATGGACCAGACTAGTCCACATGTTTATTCTGCCCAATGGCTAGATTTTGTGTTCaatattttgttcagaatgtttgcatctatattcttGAGTGAGACAGAGCTGCCCTTGTTAGGTTTCACAACCGAGGTTGTGTTAGCTTCATAAAAATGAGACGTTTATCTCTAAAAGAATTGTTTCGCTTCTCTGGATGAATTTGTGTAAGGTTAGAATTGCTTACCAGTGAagatctCGGGgCCAGTTCTTCTTTAGGGGAAGATTTTCAACAATTAAGCTCAATGCCTTTAGAAGAACTGAGAGTTTCTATTATTTCTTGAGTTAAATATATGTATTTAATTAGACTTTCTAGGAATAGTCTCATTTCATCTCAAATAATTGACATATGCTATTAAAGCAGATTCTCATGAACCATTGTAGGTATTCCAGGTCTAGAAAAATGTTCCCCTTTGCATCCCTAATGTGTTTAATTTTCACCTTCTTTCTTTTGTTCTTGAGAAATTCACCAAATCATTTTCAATTTCAGTCATATCCCAAAGCAACCAACTCTCTACCTTCTTCTTTTATCATCCCTGCTGGATTTTTGTTATCTACTTCTTCAGTATTTGTTCTTCCCTTTCTTCTATTCCTCATTCCATTTTTCCCTTGTTTTCTAACTTTCTGAGATATATGCTTAGTTCCTTCATTTGAAGCCTTTTTATTTTCTTTTTTTTTTTTTGGTCTTTTTGTCTTTTGTTGTTGTTGTTGTGCTATTtCTTGGGCCGCTCCCGCGGCATATGGAGGTTCCCAGGCTAGGAGTCGAATCGGAGCTGTAGCCACCGGCCTACGCCAGAGCCACAGCAATGCGGGATCCGAGCCGCGTCTGCAACCTACACCACAGCTCATGGCAACGCCGGATCGTTAACCCACTGAGCAAGGGCAGGAACCGAACCCGCAACCTCATGGTTCCTAGTCGGATTCGTAACCACTGTGCCACAACAGGAACTCCGCCTTTTTATTTTCTATAAAAATTTCTATGTACATTTTAAGGTTATAGGTTTCCTTCTATGTACCCCATTGGCTGTATCCTCAGGGTTCTGTGGAGTGATTTCATTATTGTTCAAGTTCAATATGTCTTCTGATTTTCCAATTTGAATACCTCTCTAAATCAGTAGGTGAATATTTCTTTTTCTTTTTCTTTTCTTTTCTTCTTTTTTTTTTTCTTTCAGCCAGGTCCATGGCATGCAGAAATTCCCAGGCCAGGAATCAAACTCTCACCATGGCAGTGACAATGTCGGATCCTTTACCCACTAGGCCACCAGGGAACTCTGGGAGCATATGTTTTTATTTCCCCACATCTGAGGATGCCTAGTATGTCTTCATTATTGATTTCTAGTTTGCCACTGATTTCTAGTATTTTGCTCATAGAGTGTATGCTCAATGGTTTTGGTCATTTGAAATGTATTTAGRCCTGCTTTATGACCCAGTATGTGGTCAGTTTTGTCAATGTTCCTTTTCTGCTTGAAGAGAACCTACATGCTGTAACTCTGGGTGCATGTTCTGTATATAAGTCTATAGGCTGAGCCGGGGGAGCCTTCTAATCTGCCGTTATCTTCTTCGAGTTATTCTAGGTACTATTTCTTAGCCATAAACCTTTAAATTCTGATATCAATATAATGACCCCAGCCCGCTTAGGGTCGGCACTTCATGTTATCTTTTTCCATCCATTTAATCCCTCCCCACTGTTTTGGCCACACCCGTGGGATATGGGAGTTCCTGGGCCAAGGATCaGATCTGAGCCGCAGCTGCCACCTATGCCACAGCAgcagcaatga |
tggatctttaacccactgcaccacactggggattgaacccaagcctcagcagcaacccaagctactgcagagacaacaccagatccttaacctgctgtgccatagcgggaaTTTCCATCCATTTACTTTCAAGCCAGCTGAATAACCTAGCCCACCATGCCTGGACATGGGTGCTCTGCTTCAAATGATTTTGTTCAGTCAGCATCCATCTCTGAAATGTGTGCCAAGCATTTATATGCATGCAAGAGTCATGTTGGCACTTCTATCATTTCCAACAGTTCAGTAGCCTTTGTATCATGACATTTCTTGGCCTTTTCTCTACAATATTTGAGGCTGAGCAGACTGGCCGTGCCCCTGTCCATGCTTCCAGAGCCTGTGTGCAGACTTCTGCTCTAGACAGAGACAGCTAACCATCCTGCAGTGCCCAGAAAACCCAACTCAAAGACCCTCAAGTAAGGAAGGATTTATTGGCTCACGTAATCTGGAATCCAGGCATGGGGTATTCAGGGCCACCTGAACCAGAGGCCCTGGCCCTGTTCTCTAAGCTTCTTCCTGCCCTGCCCTCGTTCTGGAAGTGACCCTGAAGGACAGCAATGAAGGGCAGCTCCCCCAGGGACAGATGACTGAGAGGTCCATTTCAAGTCCAACTTGGCCTAGATTGAGAGGCAGCAAGAAATATGGACCTACAGTGAGTCACAGGATTTACCAGTGGTTTGGCTGGGTTGTCAGTGTTACAGGCTAAACATTTGGGTCCCTCCAAAATTAACATGTTGCCACTCTAACCACCAAAATCatggtatttgggggtggggcccttggaggtaattaggtttagaaAGAATGAAGAGGGGGCCCTTGTGATGGGACTAGTGCCTTTATAGAGAGAGAAGAGAGAGGG |
Seq ID No.39 | CACCTCATCCCCAACCACCTGGATGGTGGCAAGTGGCAGGCTGAGAGGCTGCATATGAGCTCATCAAGAGGGTCCCCACCCCACAGAGGCTGACCCAGCTGCCACTGCCACCTAGTGGCTGATCGGCCAAGAGCAGGAGCCCCAGGGGCAGCTCCATTCCCTGGGGCGGCCAGGGAACCACCTGGTGGTAGGACAATTCCATTGCACCTCATCCATCAGGAAAAGGTTTGCCTTCCCTGGCAGTAATGCATCTTCCCATAACATGGTCCCTGGCCTCTTGGAATGGCTTGGCCACCGTCATGGCCTCACCCACAAAGCCTTGTGTCTCAGCAAGGAACTTATTCCACAGCAAAGGACTTGCAGCCTGGAATGAACTGGTCTGACTACATACCCCATTGCCCAGAAGTAGGTGGTCTATTGCAAAGTGGAGTGGCTTACCCAAGACTCAGTTGTGCCCAAGTTGAGAGATAGCATCCTAAAATATGGGCTTATGTCTCACTGGCTGAGGTTTATTCTTTGAATCAAAGACAATTATATGGTGTGGTCCCCCCAGAGATAGAATACATGAGTCTGGGAATCAAGGGATAGAAGTAAGAAGAGATTTTGTCACCATTAATCCCAATAACTCGCCCAAAGAATATTTGCTTTCTGTCCTGGCAGCTCTGCTGCTTTGGCAATAACTTCCTAGAATATAATGTCTCCACCAGGGGACTCCACAACGGTTCCATTGATTTGAAGCCAATGGGCAGAGGAGGGGCTGCCTTACTGGTCGGACTGGTCAGCCCTGATTACTAAGGAGAAATCAGGCAACTTCAACAAAACTAAGGCAGGGGGGACTTTGTCTAGAACCCAAAGCACTAAGCATCTTAGTACTTTTTAGTTCTCAGAGCCTCCAAGAACAAAGATTTAGCCCCTCAGCACCACCAGGTAAAGAACAGGTAAATCCAGCTGAGGACAAGAGAAATATTGAATGGATAGAGGAAGAAAGAAATTATAGATATCAACTATGGCCTCATGACTAGAGTCTCCAGATTAAGCGGAATAAAAATACAGATGATTaGATCTGAACATCAGGCCAAACAACGAACAACAGTTTAAGTGCGACCTAGGCAATATTTGGGACATACTTATACTAAAATTTTTTCGCTATTTGAGCATCCTGTATTTTATCTGGCAACTTTATTCATCCCTAGCGAAAAAGGAACTGTGGTAACTTAGTGTATTTTTACTTTGCTCATTATTGTGTATATACCTACTTGTATTTATCAATCATATTTACTCTGTTCTCAGTATTACTTTATATAGCAGTTGGTGGTGATGGTTAGCAACATATTCAGTGGAACTGTGACTGAATTTGAGGAGAAATTAACAGAGTTGGCTGTGGCTACAATAACCCTTCGGGACATGTGTCCCCTCATTTTGGGGAGATGGTTagatctCTGGGTAAATGTTAGGGCATCTGAGCCAGAAACCAAGATTTTGCCAGCTGGTGCAATGTCAGATTTTACCAGCAGAGGGTGCCAGAGGAATGCGGCAAAACCCGAGTGCCAGAAAGCACCTCCCTGTTTTCCAGCTTTTCTTCCTTTTTATTTATTTTATTTACGGCCCAGGAGTCCGTAATAGCGCTGAGGATGGCCCAGGCTCTTCTCAGCAGCCCTGACTGACTAGTTCAGCAATGCGCTCAGGCCCCATCTGGCCACCGGGCAGCCTCTTCTGTGGTAGCTCCAGCCTCAGCCAGTGCAAAAGGCTA |
CCCTACACTGGCGCCACTTCTACAATCAGCACTGGCCACACCCTCCACGCCATCCGGCACGGAGCCAGGTGATCTGCCGGCCAGATTGCAGTTCGTGCTGCCTGAGTCCAGGTGATTACACTGGCTGCATCTTTTCTTTCTGGACCAtTCattccattttttt | |
牛λ轻链
在另一实施方案中,提供了编码牛λ轻链基因座的核酸序列,其可以包括至少一个连接区-恒定区对和/或至少一个可变区,如SeqID No.31表示。在Seq ID No.31中,牛λC可以在残基993-1333处找到,J-C对可以在残基33848-35628的互补序列处找到,其中C是33848-34328的互补序列,而J是35599-35628的互补序列,V区可以在残基10676-10728、11092-11446、15088-15381、25239-25528、29784-30228和51718-52357(或者其互补序列)处找到。Seq ID No.31可以见Genbank编号AC117274。还提供了载体和/或寻靶构建体,其含有Seq ID No.31的全部或者部分,如Seq ID No.31的至少100、250、500、1000、2000、5000、10000、20000、500000、75000或100000个连续核苷酸,以及含有被破坏的牛λ基因的ceels和动物。
Seq ID No31 | 1 tgggttctat gccacccagc ttggtctctg atggtcactt gaggccccca tctcatggca61 aagagggaac tggattgcag atgagggacc gtgggcagac atcagaggga cacagaaccc121 tcaaggctgg ggaccagagt cagagggcca ggaagggctg gggaccttgg gtctagggat181 ccgggtcagg gactcggcaa aggtggaggg ctccccaagg cctccatggg gcggacctgc241 agatcctggg ccggccaggg acccagggaa agtgcaaggg gaagacgggg gaggagaagg301 tgctgaactc agaactgggg aaagagatag gaggtcagga tgcaggggac acggactcct361 gagtctgcag gacacactcc tcagaagcag gagtccctga agaagcagag agacaggtac421 cagggcagga aacctccaga cccaagaaga ctcagagagg aacctgagct cagatctgcg481 gatgggggga ccgaggacag gcagacaggc tccccctcga ccagcacaga ggctccaagg541 gacacagact tggagaccaa cggacgcctt cgggcaaagg ctcgaacaca catgtcagct601 caaaatatac ctggactgac tcacaggagg ccagggaggc cacatcatcc actcagggga661 cagactgcca gccccaggca gaccccatca accgtcagac gggcaggcaa ggagagtgag721 ggtcagatgt ctgtgtggga aaccaagaac cagggagtct caggacagcg ctggcagggg781 tccaggctca ggctttccca ggaagatggg gaggtgcctg agaaaacccc acccaccttc841 cctggcacag gccctctggc tcacagtggt gcctggactc ggggtcctgc tgggctctca901 aaggatcctg tgtccccctg tgacacagac tcaggggctc ccatgacggg caccagacct961 ctgattgtgg tcttcttccc ctcgcccact ttgcaggtca gcccaagtcc acaccctcgg1021 tcaccctgtt cccgccctcc aaggaggagc tcagcaccaa caaggccacc ctggtgtgtc1081 tcatcagcga cttctacccg ggtagcgtga ccgtggtcta gaaggcagac ggcagcacca1141 tcacccgcaa cgtggagacc acccgggcct ccaaacagag caacagcaag tacgcggcca1201 gcagctacct gagcctgatg ggcagcgact ggaaatcgaa aggcagttac agctgcgagg1261 tcacgcacga ggggagcacc gtgacgaaga cagtgaagcc tcagagtgtt cttagggccc1321 tgggccccca ccccggaaag ttctaccctc ccaccctggt tccccctagc ccttcctcct |
1381 gcacacaatc agctcttaat aaaatgtcct cattgtcatt cagaaatgaa tgctctctgc1441 tcatttttgt tgatacattt ggtgccctga gctcagttat cttcaaagga aacaaatcct1501 cttagccttt gggaatcagg agagagggtg gaagcttggg ggtttgggga gggatgattt1561 cactgtcatc cagaatcccc cagagaacat tctggaacag gggatggggc cactgcagga1621 gtggaagtct gtccaccctc cccatcagcc gccatgcttc ctcctctgtg tggaccgtgt1681 ccagctctga tggtcacggc aacacactct ggttgccacg ggcccagggc agtatctcgg1741 ctccctccac tgggtgctca gcaatcacat ctggaagctg ctcctgctca agcggccctc1801 tgtccactta gatgatgacc cccctgaagt catgcgtgtt ttggctgaaa ccccaccctg1861 gtgattccca gtcgtcacag ccaagactcc ccccgactcg acctttccaa gggcactacc1921 ctctgcccct cccccagggc tccccctcac agtcttcagg ggaccggcaa gcccccaacc1981 ctggtcactc atctcacagt tcccccaggt cgccctcctc ccacttgcat ggcaggaggg2041 tcccagctga cttcgaggtc tctgaccagc ccagctctgc tctgcgaccc cttaaaactc2101 agcccaccac ggagcccagc accatctcag gtccaagtgg ccgttttggt tgatgggttc2161 cgtgagctca agcccagaat caggttaggg aggtcgtggc gtggtcatct ctgaccttgg2221 gtggtttctt aggagctcag aatgggagct gatacacgga taggctgtgc taggcactcc2281 cacgggacca cacgtgagca ccgttagaca cacacacaca cacacacaca cacacacaca2341 cacacacgag tcactacaaa cacggccatg ttggttggac gcatctctag gaccagaggc2401 gcttccagaa tccgccatgg cctcactctg cggagaccac agctccatcc cctccgggct2461 gaaaaccgtc tcctcaccct cccaccgggg tgacccccaa agctgctcac gaggcgcccc2521 cacctcctcc aggagaagtt ccctgggacc cggtgtgaca cccagccgtc cctcctgccc2581 ctcccccgcc tggagatggc cggcgcccca tttcccaggg gtgaactcac aggaggggag2641 gggtcgctcc cctcacccgc ccggagggtc aaccagcccc tttgaccagg aggggggcgg2701 acctggggct ccgagtgcag ctgcaggcgg gcccccgggg gtggcggggc tggcggcagg2761 gtttatgctg gaggctgtgt cactgtgcgt gtttgctcgg tggagggacc cagctggcca2821 tccggggtga gtctcccctt tccagctttc cggagtcagg agtgacaaat gggtagattc2881 ttgtgttttt cttacccatc tggggctgag gtctccgtca ccctaggcct gtaaccctcc2941 cccttttagc ctgttccctc tgggcttctt cacgtttcct tgagggacag tttcactgtc3001 acccagcaaa gcccagagaa tatccagatg gggcaggcaa tatgggacgg caagctagtc3061 caccctctta ccttgggctc cccgcggcct ccggataatg tctgagctgc ctccctggat3121 gcttcacctt ctgagactgt gaggcaagaa accccctccc caaaagggag gagacccgac3181 cccagtgcag atgaacgtgc tgtgagggga ccctgggagt aagtggggtc tggcggggac3241 cgtgatcatt gcagactgat gccccaggca gggtgagagg tcatggccgc cgacaccagc3301 agctgcaggg agcacaggcc gggggcaagt catgcagaca ggacaggacg tgtgaccctg3361 aagagtcaga gtgacacgcg gggggggggc ccggagctcc cgagattagg gcttgggtcc3421 taacgggatc caggagggtc cacgggccca ccccagccct ctccctgcac ccaatcaact3481 tgcaataaaa cgtcctctat tgtcttacaa aaaccctgct ctctgctcat gtttttcctt3541 gccccgcatt taatcgtcaa cctctccagg attctggaac tggggtgggg nnnnnnnnnn3601 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn3661 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn agcttatgtg gtgggcaggg gggtagtaag3721 atcaaaagtg cttaaattaa taaagccggc atgatatacg agtttggata aaaaatagat3781 ggaaaagtaa gaaaggacag gaggggggtg tggcggaaga aagggggaag aaggaaaaaa3841 aaataagaga gaggaacaaa gaaagggagg ggggccggtg atgggggtgg gatagaatat3901 aataattgga gtaaagagta gcgggtggct gttaattccg ggggggaata gagaaaaaaa3961 aaaaaaaatg tgcgggtggg cggtaagtat ggagatttta taaatattat gtgtggaata4021 atgagcgggg gtggacgggc aaggcgagag taaaaagggg cgagagaaaa aaattaggat4081 ggaatatatg gggtaaattt taaatagagg gtgatatatg ttagattgag caagatataa4141 atatagctgg tgggggaaaa gagacaaggg tgagcgccaa aacgccctcc cgtatcattt4201 gccttccttc ctttaccacc tcgttcaaac tctttttcga gaaccctgaa gcggtcaggc4261 ccggggctgg gggtgggata cccggggagg ggctgcgcct cctcctttgc agagggggtc4321 gaggagtggg agctgaggca ggagactggc aggctggaga gatggctgtt gacttcctgc4381 ctgtttgaac tcacagtcac agtgccagac ccactgaatt gggctaaata ccatattttt4441 ctggggagag agtgtagagc gagcgactga ggcgagctca tgtcatctac agggccgcca4501 gctgcaggga ctttgtgtgt gtcgtgctcg ttgctcagtt gtgtccgact ctttatgact4561 tcatggactg taacctgcca ggctcctctg tccgtggaat tctccaggca agaatactgg4621 agtgggtagc cattctcatc tccgggggat cttcctgacc caagaatcaa acctgagtct4681 cccgcattgc aggcagcttc tttcttgtct gagccaccag ggaagcccct taagtggagg |
4741 atctaaatag agtgtttagg agtataagag aaaggaagga cgtctataca agatccttcg4801 gttcctgtaa ctacgactcg agttaacaag ccctgtgtga gtgagttgcc agtaattatt4861 gctaacctgt ttctttcact cactgagcca ggtatcctgt gagacggcat acttacctcc4921 tcttctgcat tcctcgggat ggagctgtgc ggtggcctct aggactacca catcgaccag4981 gtcagaccca gggacagagg attgctgaga tgcactgaga agtttgtcag cctaggtctt5041 cacccacaca gactgtgctg tcgtctacca cgtaattctt cctgtccaaa gaactggtta5101 aacgctcctg aagcgtattc tggtctgctt caaaaagtgc ctctttcctt tataagttcc5161 gccaatcctg gactttgtcc caggccagtc tactttattt gtgggaaagg tttttttggt5221 cttttttgtt ttaaactctg cagaaattgc ttacactttt ggtgtgcaat ggctcactct5281 tacggttcta gctgtattca aaggggttgc ttttctttgt ttttaaagct ttttgaacgt5341 ggaccatttt taaagtcttt attaaacgtc taacatcgtt tctggtttat tttctggtgg5401 tctggccatg aggcctacgg gtcttagctc ccctaccagg gtccaaccca catcccttgc5461 actggacggc aaggtcttaa cctttgaacc accagagagc ttctgaaagg ggctgctttt5521 ctccaatcct ctttgctccc tgcctgctgg tagggattca gcacccctgc aatagccctg5581 tctgttctta ggggctcagt agcctttctg cctgggtgtg gagctggggt tgtaagagag5641 cttcatggat ttggacacga cctacgactc agaggtaaga ctccatctta gcgctgtaat5701 gacctctttc caacaaccac ccccaccacc ctggaccact gatcaggaga gatgattctc5761 tctcttatca tcaacgtggt cagtcccaaa cttgcacccg gcctgtcata gatgtagcag5821 gtaagcaata aatatttgtt gaatgttaag tgaattgaaa taacataagt gaaaaagaaa5881 acacttaaaa acatgtgttt ttataattac acagtaaaca tataatcatt gtagaaaaaa5941 atcgaaagag tggcgggggc caagtgaaaa ccaccatccc tggtatgtcc acccgcccgg6001 gtagccccag gtaagaggtg cggacacgga tggccctgta gacacagaga cacacgctca6061 tatgctgggt cttgtcttgt gacctcttgg ggatgatgtt attttcacga tgccattcaa6121 accttctacc acaccatttt tagagggtcg ttcatcgtaa atcagttcac tgctttgttt6181 tctgattttg aaagtgtcac attcttcgag aaatgagaag gaacaggcgc gcataaggaa6241 gaaagtaaac acgtggcctt gcttccaggg ggcactcagc gtgttggtgt gcacgctggc6301 agtcttttct ctgtgacagt catggccttt tcccaaaggt gggctcagat aagaccgcct6361 cccatcccct gtccctgtcc ccgtccccta cggtggaacc cacccacggc acgtctccga6421 ggccctttgg ggctgtggac gttaggctgt gtggacatgc tgctggtggg ggcccagggc6481 tgggcagcac gttgtccctg ggtcccgggc cagtgaggag ctcccaagga gcagggctgc6541 tgggccaaag ggcagtgcgt cccgaggcca tggacaaggg gatacatttc ctgctgaagg6601 gctggactgc gtctccctgg ggccccttgg agtcatgggc agtggggagg cctctgctca6661 ccccgttgcc cacccatggc tcagtctgca gccaggagcg cctggggctg ggacgccgag6721 gccggagccc ctccctgctg tgctgacggg ctcggtgacc ctgccgcccc ctccctgggg6781 ccctgctgac cgcgggggcc accccggcca gttctgagat tcccctgggg tccagccctc6841 caggatccca ggacccagga tggcaaggat gttgaggagg cagctagggg gcagcatcag6901 gcccagaccg gggctgggca ggggctgggc gcaggcgggt gggggggtct gcacnccccc6961 acctgcnagc tgcncnnncn tttgntnncg tcctccctgn tcctggtctg tcccgcccgg7021 ggggcccccc ctggtcttgt ttgttccccc tccccgtccc ttcccccctt tttccgtcct7081 cctcccttct tttattcgcc ccttgtggtc gttttttttc cgtccctctt ttgttttttt7141 gtctttttct ttttccccct cttctccctt gctctctttt tcattcgtcg gtttttctgc7201 tcccttccct ctcccccccg ctttttttcc ctgtctgctt tttgtgttct ccctctctac7261 cccccctgca gcctattttt tttatatatc catttccccc tagtatttgg cccccgctta7321 cttctcccta atttttattt tcctttcttt aactaaaatc accgtgtggt tataagtttt7381 aacctttttt gcaccgccca caatgcaatc ttcacgcacg ccccccccgt cagcctcctt7441 aaataccttt gcctactgcc cccctccttg tataataacg cgtcacgtgg tcaaccatta7501 tcacctctcc accaccttac cacattttcc ttcnnnnnnn nnnnnnnnnn nnnnnnnnnn7561 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn7621 nnnnnnnnnn nnntgaaaaa agaaaaggct gggcaggttt taatatgggg gggttggagt7681 ggaatgaaaa tgcattggag tggttgcaac aaatggaaag gtctcaggag cgctcctccc7741 ccatcaggag ctggaaagaa gtggaagcaa agcaaggaat tcgtgtgatg gccagaggtc7801 aggggcaggg agctgcaaag actgccggct gtttgtgact gnccgtctcc gggtgcattt7861 gttagcaggg aggcattaca ctcatgtctt ggtttgctaa ctaattctta ctattgttta7921 gttgcaaggt catgtctgac tctttgcaac ccagggactg cagcccgcca ggctcctctg7981 tccatgggat ttcgcaggca agaatactgg aggtggtagc cattttcttc accatgggat8041 cttcccgagc cagaaatgga acccgagtcg cctcctgtgc atggggtctg ctgcctaaca |
8101 ggcagatatt tgacgtctga gccaacaggg aggacagacg gtaattatac caaccattga8161 aagaggaatt acacactaat ctttatcaaa atctttcaaa cagtagagga gaaaggatac8221 tctctagttt attccataaa gttggaatta cgcttatcaa taaagacatt acaagaaaag8281 aaagtgaagc cccaaatgcc ttataaatat acaagaaaaa atcttttaag atattagcca8341 acttaatcaa caaaaaatgt atcaaaagtc caagtaacat tcaccccagg aatgcaagtg8401 tggttcagcc taagacaatc agtcatgagt ataccacgga aacaaattaa agagaaaaga8461 cattaaatct cacaaatggt gcagaaaaag atttggcaat atcgaacatc ttttcatgac8521 caaaggaaaa aaaagaaaca aaacaccaga aaattctgtg tagaaagaat atatctcaac8581 ccaatgaagg gcatttatga aaaacccaca gcatacatca cactccatga gaaagactga8641 aagctttccc cactgccatt gaactctgtc ctggaaattc tagtcacagc gacagaacaa8701 gagaaagaaa taacggccgt ctaaactggt aggaagaaat caaagcgtct ctattctctg8761 ggcgcataat acaatataga caaatttcta aagtccacaa aaattcctag agctcataat8821 gaatccagaa atgcgtcagg gctcaagatt cagatgcaaa aatcgtctgg gttttgatgc8881 accaacaaac aattccatta acaataatac caaggaatta atttaactta gaagagaaaa8941 gacctgttta cagagagtta taaaacattt ggtgatgaaa ttaaataaga gtaaatcata9001 tagaaacacc gttcgtgttt tggagaccta atgtcataaa cgtggcaaca cagagacgcc9061 tcacggggaa ccctgagcct ccttctccaa acaggcctgc tcatcatttc acaggtaacc9121 tgagacccta aagcttgact ctgaggcact ttgagggcat gaagagagca gtagctcctc9181 ccatgggacc gacagtcaag gcccagggaa tgaccacctg gacagatgac ttcccggcct9241 catcagcagt cggtgcagag tggccaccag ggggcagcag agagtcgctc aacactgcac9301 ctggagatga ggcaacctgg gcatcaggtg cccatgcagg ggctggatac ccacacctca9361 cacctgagga caggggccgg ctttctgtgg tgtcgccctc tcaggatgca cagactccac9421 cctcttcgct tgcattgaca gcctctgtcc ttcctggagg acaagctcca ccttccccat9481 ctctccccag ggggctgggg ccaacagtgt tctctcttgt ccactccagg aacacagagc9541 caagagattt atttgtctta attagaaaaa ctatttgtat tcctgcattt ccccagtaac9601 tgaaggcaac tttaaaaaat gtatttcctg gacttccctg gtgggccagt ggctaggctc9661 tgagctccca gtgcatgggg cctgggttca atccctgctc aggaaactac atcccacagg9721 ctgcaaataa gatcctgcat gccacccgat gcaggcaaag aaacaagtgt tcggtatgca9781 tgtatttcac gtgaggtgtt tctataattt acagccagta ttctgtctta cacttagtca9841 ttcctttgag cacatgatcg gtcgatggcc cagaccacac acaggaatac tgaggcccag9901 cacccaccgg ctgcccagaa cctcatggcc aagggtggac acttacagga cctcagggga9961 cctttaagaa cgccccgtgc tcttggcagc ggagcagtgt taagcatggc tctgtccctc10021 gggagctgtg tctgggctgc gtgcatcacc tgtggtgtgg gcctggtgag ggtcaccgtc10081 caggggccct cgagggtcag aagaaccttc ccttaaaagt tctagaggtg gagctagaac10141 cagacccaca tgtgaactgc acccaaaaac agtgaaggat gagacacttc aaagtcctgg10201 gtgaaattaa gggccttccc ctgaaccagg atggagcaga ggaaggactt ggcttccagg10261 aaaccctgac gtctccaccg tgactctggc cggggtcatg gcagggccca ggatcctttg10321 gtgcaaagga ctcagggttc ctggaaaata cagtctccac ctctgagccc tcagtgagaa10381 gggcttctct cccaggagtg gggcaaggac ccagattggg gtggagctgt ccccccagac10441 cctgagacca gcaggtgcag gagcagcccc gggctgaggg gagtgtgagg gacgttcccc10501 ccgctctcaa ccgctgtagc cctgggctga gcctctccga ccacggctgc aggcagcccc10561 caccccaccc cccgaccctg gctcggactg atttgtatcc ccagcagcaa ggggataaga10621 caggcctggg aggagccctg cccagcctgg gtttggcgag cagactcagg gcgcctccac10681 catggcctgg accccctcct cctcggcctc ctggctcact gcacaggtga gccccagggt10741 ccacccaccc cagcccagat ctcggggaca ggcctggccc tgactctgag ctcagtggga10801 tctgcccgtg agggcaggag gctcctgggg ctgctgcagg gtgggcagct ggaggggctg10861 aaatccccct ctgtgctcac tgctaggtca gccctgaggg ctgtgcctgc cagggaaagg10921 ggggtctcct ttactcagag actccatcca ccaggcacat gagccggggg tgctgagact10981 gacggggagg gtgtccctgg gggccagaga atctttggca cttaatctgc atcaggcagg11041 gggcttctgt tcctaggttc ttcacgtcca gctacctctc ctttcctctc ctgcaggcgc11101 tgtgtcctcc tacgagctga ctcagtcacc cccggcatcg atgtccccag gacagacggc11161 caggatcacg tgttgggggc ccagcgttgg aggtganaat gttgagtggc accagcagaa11221 gccaggccag gcctgtgcgc tggtctccta tggtgacgat aaccgaccca cgggggtccc11281 tgaccagttc tctggcgcca actcagggaa catggccacc ctgcccatca gcggggcccg11341 ggccaaggat gaggccgact attactgtca gctgtgggac agcagcagta acaatcctca11401 cagtgacaca ggcagacggg aagggagatg caaaccccct gcctggcccg cgcggcccag |
11461 cctcctcgga gcagctgcag gtcccgctga ggcccggtgc cctctgtgct cagggcctct11521 gttcatcttg ctgagcagcg gcaagtgggc attggttcca agtcctgggg gcatatcagc11581 acccttgagc cagagggtta ggggttaggg ttagggttag gctgtcctga gtcctaggcc11641 agccgtgtcc cctgtccatg ctcagcttct ctcaggactg gtgggaagat tccagaacca11701 ggcaggaaac cgtcagtcgc ttgtggccgc tgagtcaggc agccattctg gtcagcctac11761 cggatcgtcc agcactgaga cccggggcct ccctggaggg caggaggtgg gactgcagcc11821 cggcccccac accgtcaccc caaaccctcg gagaaccgcg ctccccagga cgcctgcccc11881 tttgcaacct gacatccgaa cattttcatc agaacttctg caaaatattc acaccgctcc11941 tttatgcaca ttcctcagaa gctaaaagtt atcatggctt gctaaccact ctccttaaat12001 attcttctct aacgtccatc ttccctgctc cttagacgcg ttttcattcc acatgtctta12061 ctgcctttgg tctgctcgtg tattttcttt tttttttttt ttttattgga atatatttgc12121 gttacaatgt tgaatttgaa ttggtttctg ttgtacaaca atgtgaatta gttatacatg12181 tcctgaggag gggcggctgc gtgggtgcag gagggccgag aggagctact ccacgttcaa12241 ggtcaggagg ggcggccgtg aggagatacc cctcgtccaa ggtaagagaa acccaagtaa12301 gacggtaggt gttgcgagag ggcatcagag ggcagacaca ctgaaaccat aatcacagaa12361 actagccaat gtgatcacac ggaccacagc ctggtctaac tcagtgaaac taagccatgc12421 ccatggggcc aaccaagatg ggcgggtcat gtgcccatgg ggccaaccaa gatgggcggg12481 tcatggtgaa gaggtctgat ggaatgtggt ccactggaga agggaaaggc aaaccacttc12541 agtattcttg ccttgagagc cccatgaaca gtatgaaaag gcaaaatgat aggatactga12601 aagaggaact ccccaggtca gtaggtgccc aatatgctac tggagatcag tggagaaata12661 actccagaaa gaatgaaggg atggagccaa agcaaaaaca atacccagtt gtggatgtga12721 ctggtgatag aagcaagggc caatgatgta aagagcaata ttgcatagga acctggaatg12781 ttaagtccaa gannnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn12841 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnagaatttt12901 gagcattact ttactagcgt gtgagacgag tgcaattgtg cggtagtttg agcattcttt12961 ggcattgcct ttctttggga ttggaatgaa aactgacctg ttccaggcct gtggccactg13021 ctgagttttc caaatttgct ggcgtattga gtgcatcact ttaacagcat catcttttag13081 gatttgaaat agctcaactg gaattctatc actttagcta attccattca ttagctttgt13141 ttgtagtgat gcttcctaag gcccccctgg ctttatcttc ctggatgtct ggctctggtg13201 agtgatcaca ccgctgtgat tatctgggtc atgaaggtct ttttgtatag ttcttcttag13261 gaacagatat tatgatctcc atccttgcat ctcgttatat ctagagaagc actgactccc13321 ttcatggtga cgtcagatcc tcatgactaa caaatggcct tttgtaagat gagtgcctca13381 tggtattgag ctcccccgtc accaagacct tatgactgac ctcccccact gccccaggtg13441 cctctcgaag cgtctgagat gccgcctccc aggctgcact cctcattttg cccccaataa13501 aacttaactt gcagctctcc agctgtgcat ctgtgtttag ttgacagtac aaatataatg13561 gaaaatttaa attaaatata atctatgggg agaaatccaa acatcttatg agggagagag13621 agggagagaa aggaaagaag aagaagcagg aggaggagga gagtagagaa acagggggag13681 ggcggcaggg agacagaggg gaggacaccg aggggaaagg gaggaaggcg agtgcagtga13741 gagagaggcc agagttcatc agagtctgga ctcgcagccc aatcccacgg gtgtgtcccg13801 aagcagggga gagcctgagc caggcggaga cagagctgtg tctccagtcc tcgtggccgt13861 gacctggagc tgtgtggtca gcccccctga ccccagcctg gccctgctgg tggtcggagg13921 cagtgatcct ggacacagtg tctgagcgtc tgtctgaaat ccctgtggag gcgccactca13981 ggacggacct cgcctggccc cacctggatc tgcaggtcca ggcccgagtg gggcttcctg14041 cctggaactg agcagctgga ggggcgtctg caccccagca gtggagcggc cccaggggcg14101 ctcagagctg ccggggggac acagagcttg tctgagaccc agggctcgtc tccgaggggt14161 cccctaaggt gtcttctggc cagggtcaga gccgggatga gcacaggtct gagtcagact14221 ttcagagctg gtggctgcat ccctggggac agagggctgg gtcctaacct gggggtcaga14281 gggcaggacg ggagcccagc tgaaccctgg ggactggcct cctctgtggt ctcccctggg14341 cagtcacagc ttccccggac gtggactctg aggaggacag ctggggcctg gctgtcagga14401 gggggttcga gaggccacac tcagaggagg agaccctggc ctgcttgggt tgtgactgag14461 tttttggggt cctctaggag actctggccc tgcaggccct gcaaggtcat ctctagtgga14521 gcaggactcc acaagattga tgaactgaat cctctaggag aggtgtggtt gtgagggggc14581 agcattctag aaccaacagc gtgtgcaggt agctggcacc gggtctagtg gcggcgggca14641 gggcactcag ggccgactag gggtctgggg gattcaatgg tgcccacagc actgggtctt14701 ccatcagaat cccagacttc acaaggcagt ttcggggatt aggtcaggac gtgagggcca14761 cagagaggtg gtgatggcct agacaagtcc ttcacagaga gagctccagg ggccatgata |
14821 agatggatgg gtctgtattg tcagtttccc cacatcaaca ccgtggtccc gccagcccat14881 aatgctctgt ggatgcccct gtgcagagcc tacctggagg cccgggaggc ggggccgcct14941 gggggctcag ctccggggta accgggccag gcctgtccct gctgtgtcca cagtcctccc15001 ggggttggag gagagtgtga gcaggacagg agggtttgtg tctcacttcc ctggctgtct15061 gtgtcactgg gaacattgta actgccactg gcccacgaca gacagtaata gtcggcttca15121 tcctcggcac ggaccccact gatggtcaag atggctgttt tgccggagct ggagccagag15181 aactggtcag ggatccctga gcgccgctta ctgtctttat aaatgaccag cttaggggcc15241 tggcccggct tctgctggta ccactgagta tattgttcat ccagcagctc ccccgagcag15301 gtgatcttgg ccgtctgtcc caaggccact gacactgaag tcaactgtgt cagttcatag15361 gagaccacgg agcctggaag agaggaggga gaggggatga gaaggaagga ctccttcccc15421 aagtgagaag ggcgcctccc ctgaggttgt gtctgggctg agctctgggt ttgaggcagg15481 ctcagtcctg agtgctgggg gaccagggcc ggggtgcagt gctggggggc cgcacctgtg15541 cagagagtga ggaggggcag caggagaggg gtccaggcca tggtggacgt gccccgagct15601 ctgcctctga gcccccagca gtgctgggct ctctgagacc ctttattccc tctcagagct15661 ttgcaggggc cagtgagggt ttgggtttat gcaaattcac cccccggggg cccctcactc15721 agaggcgggg tcaccacacc atcagccctg tctgtcccca gcttcctcct cggcttctca15781 cgtctgcaca tcagacttgt cctcagggac tgaggtcact gtcaccttcc ctgtgtctga15841 ccacatgacc actgtcccaa gcccccctgc ctgtggtcct gggctcccca gtggggcggt15901 cagcttggca gcgtcctggc cgtggactgc ggcatggtgt cctggggttc actgtgtatg15961 tgaccctcag aggtggtcac tagttctgag gggatggcct gtccagtcct gacttcctgc16021 caagcgctgc tccctggaca cctgtggacg cacagggctg gttcccctga agccccgctt16081 gggcagccca gcctctgacc tgctgctcct ggccgcgctc tgctgccccc tgctggctac16141 cccatgtgct gcctctagca gagctgtgat ttctcagcat aactgattac tgtctccagt16201 actttcatgt ccctgtgacg ggctgagtta gcatttctca cactagagaa ccacagtcct16261 cctgtgtaaa gtgatcacac tcctctctgt gggacttttg taaaagattc tgcagccagg16321 agtcatgggt ggtcttagct gagaaatgct ggatcagaga gacctgataa ccgatgtgaa16381 gaggggaacc tggaagatct tcagttcagt tcatttcagt cattcagttg tgtccgactg16441 tttgggatcc catggactgc cacacgccag tcctccctgt ccatcaccaa cttctgaagc16501 ttgttcaaac tcatgtccat caagttggag atgcctttca accatctcat cctctgtcat16561 ccccttctcc tcccgccttc aatcttccct agcattaggg tcttttccgt gagtcagttc16621 ttcgcatcag gtggcctagt tttggagttt cagtttcagc atcagtcctt tcaatgaata16681 gtaaggactg atttccttta ggatggactg gtttgatatc cttgcagttc aagggactct16741 caagagtctt ctccaacact gcagttaaaa gccatcaatt cttcggtgct cagctttctt16801 tttggtacaa ctctcacatt catacatgac taccgaaaat acattagtcg tgtagaacca16861 gtttggggct tcccacgtgg ctctagtggt aaagaatatg cctgccaact cagaagatgt16921 aagagatgcg gttcaatctc tgggtcggga agatcccctg gagaagggca tgacaaccca16981 ctccagtatt tttgcctgga gaatcccatg gacagagaag cctggtggac tgcagtccat17041 ggagtctcac agagtcagac acgactgaag caacttagct acttggaaaa gagcatgcac17101 gaagctgtct aaaaaacagg tcaagaagtc ttgtgttttg aaggtttact gagaaagttg17161 atgcactgct ccaacacttc ctctcagttg aaaagatcag aagcgttaga tcaaatggtg17221 gtcaatacct tggatgcgct ccaacaggtt atatctgcag atggaaatga aggcagttta17281 tggggtaact ggaggacaag atgagatcat acacttggaa cactgtctgg catcaaaggc17341 gtgtacagta aacattagct gttattagca aaataaattc agcttgaatc acccaaatca17401 gatggcattc ttaaagccac tgagtggtaa aatcaggggt gtgcagccaa aacgtccatt17461 ttgactcatt atgatttcca tgtcacaaga ctagaaagtc actttctcct cagcagaaga17521 gaaggtagaa cattttaacc tttttttgga gtgtcaaggg aattttgttt acactgtaaa17581 gtcagtgaaa atattgaagc ttttcatttg tggaaaatat taaatatgta aaattgaaat17641 tttaaaattt attcctgggt agttttgttt ttccagtagt catgcatgga tgtgagagtt17701 ggactataaa gaaagctgag cgctgaagaa ttaatgcttt tgaactgtgg cactggagaa17761 gactcttgag agtcccttgg tctgcaagga gatcaaacca gtccatccta aaggaaatca17821 gtcctgaata ttcactggaa ggactgatgc tgaagctgaa actccaatac tttggccacc17881 tgatgtgaag aactgactca tatgaaaaga ctcagatgct gggaaagatt gaaggtggga17941 ggagaagggg acgacagagg atgagatggc tgaatggcat caccgactcg atggacatga18001 gtctgaataa gctctgggag ttgttgatgg acagggaggc cctggagtgc tgcagtccat18061 gggattgcaa agagttggac atgactgagt gactgaactg aactgagttt ggtaacagat18121 atgagaatta tataatttaa atctaaactc ttggtatttc tttctttggc ggttccaaaa |
18181 gagctgtccc ttctgttaac tatataaatc ctttttgaga attactaaat tgataatgtt18241 cacaagttat ccaatttctc attactctta gttgtcagta taagaaatcc catttgattt18301 atcatgttat agtatctgca actctaatag ttcagttctg acaaattttt attttattta18361 aaaatattgg catacagtaa aatttcaaac aatatacaat tctccctttc agtttaaaaa18421 acaaaacaaa acaaaagtaa tattagttaa aaaaatccgg gaagaatcca agcatttaaa18481 attgcatcac atttctatgc tagacaagct gatataaagt tataattaat aaaggattgg18541 actattaaac tctttacata tgaggtaaca tggctctcta gcaaaacatt taaaaatatg18601 ttgtgggtaa attattgttg tccttaaaga aataaaaaga cataagcgta agcaattggn18661 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn18721 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna aaatggataa ggggggagga18781 catgggtagg ggagcgcgat ggaggaagta aggtggtcga gggagttggg gggggaataa18841 gtgggtaaaa gggaagcggg cggaaggagg gggaagcagg agagaggggt gggcgtcaga18901 tcggggggag gggtatgagg gagagggaat ggtagacggg gggtgggaag cataaaggaa18961 aagatagggg ggggaaaagt tagaagaaga atgaggggat aggcggaaag ggaagagaaa19021 tgggagaaga acagaaaaat agggggaggg ggggcgtaaa gagggggggg gagggcaggt19081 gtggagatga cagatacggg gaatgccccg gtataaaaga gtatatggcg tggggcgaga19141 aggctgtcat cctgtgggag gggggacgcg gagaaccctt cgggctatag ggaggattcg19201 gggggatcgt tcgggaaggc agtcagcaca gcacccacca agggtgcagg gatggatctg19261 gggtcccaaa gaagaggccc aatcccgcgt cttggcagca aggagccctg gagactggga19321 agtgtccagg acactgaccc aggggttcga ggaacccaga agtgtgtctg tgaagatgtg19381 ttttgtgggg ggacaggtcc agagctttga gcagaaaagc ggccatggcc tgtggagggc19441 caaccacgct gatctttttt aaaaggtttt tgttttgatg tggaccattt ttaaagtctt19501 cattgaattt gctacaatat tgtttctggt ttatgctctg gtttcttcgg ctgcaaggtt19561 tgtgtgatcg tatctcctca accaggactg aacccacagc ccctgcactg gaaggcgaag19621 tcttaaccca gatcgccagg aacgtccctc ccctcactga tctaatccaa gaccctcatt19681 aaggaaaaac cgagattcaa agctccccca ggaggactcg gtggggagga gagagccaag19741 cactcagcac tcagtccagc acggcgccct ccctgtccag ggcgagggct cggccgaagg19801 accaccggag accctgtcgg attcaccagt aggattgtga ggaatttcaa cttacttttt19861 aaatctgtct ctcaaggctg ttacaagcgg actttaccag taacttaaaa gttgaaaggg19921 acttcccagg cggcacttgc ggtgaagaac ccgccggctg gttttaggag acataagaga19981 tgtgggttag atccctggtt caggaggatt cccctggaga aggaaatggc aacccactcc20041 agtattcttg cctggaaagc ctcacggaca gaggaggctg gcgggctaca gtccacgggg20101 tcgcacacga ctgaatcgac ttagcttcaa gttgagacag gaagaggcag tgactggtgg20161 caaaacaccg cacccatgct cccaggggac ctgcagcgct ctggttcatg agctgtgcta20221 acaaaaatca acccaacgag aggcccagac agagggaagc tgagttcatc aaacacgggc20281 atgatgtgga ggagataatc caggaaggga cctgccaagc ccatgacaga ccggtgtcct20341 gtctgagggc cgtcctggca gagcagtgca gggccctccg agaccgcccg agctccagac20401 ccggctgggg gctacagggt ggggctgagc tgcaaggact ctgctgtgag ccccacgtca20461 gggaggatca ccttgtttgt tttctgagtt tctcttaaaa tagcctttat gggtcctggt20521 ctttggtttt aaaataacaa ctgttctccg taaacaacgt gaaaaaaaac aaacaggagg20581 aaaacaacgc agcccgggca tttcacccgg aagagccgcc tctaacactt tgacgggttg20641 ccttctattt taaccctgtt ttcattgtaa actgtaaaaa ccacatcata aataaattaa20701 aggtctctgt gaagtttaaa aagtaagcat ggcggtggcg atggctgtgc cacaccgtga20761 acgctcgttt caaaacggta aattctaggg accccctggt ggtccagtgg gtgagatttt20821 gcttccattg caggagccgt gggtttgatc cctggttggg gaactaagat cccacatgct20881 gtatggagtg gccaaaaaga attttttgta aatggtgagt tttaggtgac gtgaatttcc20941 cattgatgca cttcacaggc tcagatgcag ccaggccctc aggaagcccg agtccaccgg21001 tcctttactt ttccttagag ttttatggct tctgtttctg cccttaaacc caccatgttt21061 caacctcatc tgattttgga ctttataata aagttaggct gtgtttcagg aaactttgct21121 cagtattctg taataatcta aatggaaaga atttgaaaaa agagcagaca cttgtacatg21181 cataactgaa tcactttggt gtacacctga aactcgagtg cagccgctca gtcgtgtccg21241 accctgcgac cccacggact gcagcacgcg ggcttccctg cccatcacca actcccggag21301 ttcactcaaa cacatgtccg tcgactcggt gatgccgtcc aaccgtctca tcctctgtcg21361 tccccttctc ctcccgcctt caatcttttc cagcatcagg gtcttttcaa atgagtcagt21421 tcttcacgcc aggtggccag agtattggag tttcagcttc agcatcagcc cttccaacga21481 ccccccatac ctgaagctaa cacagtgcta atccactgtg ctgcaacatg aaagaaaaac |
21541 acatttttta agtttaggct gtgtgtgtct tccttctctc aacactgcgt ctgaccccac21601 ccacactgcc cagcactgca ttccccgtgg acaggaggcc ccctgcccca cagctgcgtg21661 ccggccggtc actgccgagc agacctgccc gcccagagtg gggcccctgg cactggggac21721 aaggcagggg cctctccagg gccggtcact gtccactgtt cctactggtt ttgttttcaa21781 aagtggaggc agcgtaatat ttccctgatt ataaaaagaa gtacacaggt tctccacaaa21841 taaaacaggg gaaaagtata aagaatggaa gttcccagca cagcctggag atcacgccgg21901 gtgcacctgg ggtgtccttc caggctggac ctcacatttc acgcagacat cagaaggctg21961 cgagatctac ccagaaggct gggtagatgg gggataggtc agtgacaaac agtagacaga22021 gagatataca gacagatgat ggatagacag acgctaagac accgagcgag gggacagacg22081 gatggaagac accatccttt gtcactgacc acacacccac atgggtgtgg tgagccggct22141 gtcatacttg tgaacctgct gctctcacaa caccagctgg gtccctccag ccccagcgtc22201 ccacacagca gactcccggc tccatcccca ggcaggaatc ccaccaccaa ctggggtgga22261 ccctccccgc aggaaggtcg tgctgtctaa ggccttgaga gcaagttaca gacctacttc22321 tgggaagaca gcgcacaacc gcctaccccg cagagcccag gaggacccct gagtcctagg22381 gaagggacca cgcggcctgg acggggagcg gccccaggac gctgccccca acctgtccca22441 cctcactcct gctctgctct gaggcggggc gcagagaggg gccctgaggc ctcttcccag22501 ttcttgggag cacccactgg gcctgaacca ggccagaagc cccctcctca aggtgtcccc22561 agaccactcc cctccacctc cggttgctct gtctcctggc agcagggagc cccagtgaga22621 agagacagct ccaggctgtg atcttggccc ctggctgctc tggcagtgtg gggggtgggg22681 gtcgctggga ggccatgagt gctgggggtc ggggctgtga aagcacctcg aggtcagtgg22741 gctgttggtc gggctctgcg aggtccgcac gggtagagct gtgccaggac acaggaggcc22801 tggtcagtgg tcccaagagt cagggccaaa ggaaggggtt cgggcccctc tggttcctca22861 gcttctgagg ccggggaccc cagtctggcc ttggtagggg ggcgattgga gggtacaacg22921 atccaaaaga aaacacacat ctacgaggga agagtcctga ggaggagaga gctacacaga22981 gggtctgcac actgcggaca ctgcttggag tctgagagct cgagtgcggg gcacagtgag23041 cgaagggagg acggaacctc caaggacacc ggacgccgat ggccagagac acacgcacgt23101 cccatgaggg ccggctgctc agacgcaggg gagctcctca ttaaggcctc tcgctgaata23161 gtgaggagaa ctggccccgt gtgtggggaa acttagccca gaagaaacgc tgccctggcc23221 ccaaggatca nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn23281 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn tgccctttgc23341 ctccagggag ggaggaagcg tggatcttgg gtttgccttg ggtttaaagg atccacccac23401 tcccttttta gccactccct gtgctggcaa tttcttaaga ctggaggtcg caaagagttg23461 gacacactga gcgagtgaac tgcactgagc ctaagaaaag tctttgaatt cctccaaaca23521 aaacacactt gtcttgggta ctttccttgg ttttgttaca aatgtctggt ccctctgttc23581 tcctggccag ctcctgggtg tcattttgac ctgacgaagt caaagggagc ctggaccctc23641 aaaatctgta ggacccagca cccctccatt acacctctgt tcccccgcga acgggcacgt23701 gtttcgccgt ctggcgtaat gtgtaagcga cggtgtgata ctcgggagtc ttactctgtt23761 tctttttctt ctggggtgac accaccatcc gcacgactct gtctgaatgt gaacatttgg23821 gtgatttgat gtggcccaga ctcccccaac gaatgtacct tcaggttggt tttcttcttt23881 tatattttgc ttttgtgaat agacacagga tcccatcagt tgtatgtagt gagaaagtaa23941 aaacccactc agccttagct ggatggagat ctagtagtaa gatagcacgt tagccggaaa24001 tggaaatttc agccagaatc tgaaaagcgt gtcctggaag gagaagaggg actcaggccc24061 gagcacactg ctccacgctg gagcctcagg ctctgacagc tgtacctgcc ggggtcttca24121 tgggacaggc catgcaggcc acgatcccgt tgagaagttt cttgcctttc catcacattg24181 gcaattgcac gctttgctct tgcttctaca tggagtttta cttttatccc agacagtttg24241 gtttcttctc tgattttcgc caattgtaca gatcgttaca gtatttctta accacataga24301 attcggcagg gggggtgggg ggacagggta gggtggggtg agagtgaggg gagggggctg24361 caccgagcag catctggggt cgtagctccc tgacggggat agacctcgtg cccctgcagt24421 gacagcacag agtcctcctc tctgaactgc cagggacgct cctgcaattg acttaatgaa24481 aggcatctaa ttaggaattt tggggtgaca ttttacattt aagtgtgtga gcagtgatta24541 tagttcatat cattttatag tttcgtgatt ttactagctt aaagggtttt tggggtttct24601 ttttgtttta aaagctaaaa tctgtttttt aattccatgg aatacaaaaa aaaaaagtct24661 gtagaatatt ttaaagagtg aaggctttgt tcggaatgtg agcgctttgc tccactgaac24721 cgaacggtaa taacatttgt agaagagacg cagagtgaaa ggtacctctt tttattgagt24781 gacatgacag cacccatcgc gtgagttatt ggctggagtt tagagacagg ccatgttggg24841 ctaaactcct tattgctgtt ctcagccttt gagtaataat cagaagcttt ctctgaagag |
24901 agtggggtca gctgtcagac tcctaggtgt ctacctgcag cagggctggg attaaatgca24961 gcagccagta gatacgggat ggggcaagag gtcaccttgt ccctttgttg ctgctgggag25021 agaggcttgt cctggtgcca gtggggccaa agctgtgact ttgtgaccac aggatgtctc25081 tgaccctgcc ttgggttccc tgagggtgga gggacagcag ggtctccccg gttccttggc25141 cggagaagga ccccccaccc cttgctctct gacatccccc caggacttgc cccggagtag25201 gttcttcagg atgggcatcc gggccccacc ctgactcctg gagctggccg gctagagctt25261 gctgcagaat gaggccttgg ccattgcggc cctgaaggag ctgcccgtca agctcttccc25321 gaggctgttt acggcggcct ttgccaggag gcacacccat gccgtgaagg cgatggtgca25381 ggcctggccc ttcccctacc tcccgatggg ggccctgatg aaggactacc agcctcatct25441 ggagaccttc caggctgtac ttgatggcct ggacctcctg cttgctgagg aggtccgccg25501 taggtaaggt cgacctggca gactggtggg gcctggggtg tgagcaagat gcagccaggc25561 caggaagatg aggggtcacc tgggaacagg cgttgggtgt acaggactgg ttgaggctca25621 gaggggacaa aaggcacgtg ggcctccccc ccagtgtccc ttaaagtggg aaccaagggg25681 gccccggaag ccggaggagc tgtggtgtgt ggagtgcaga gccctcgcgg ggtcctgatg25741 cccgtcggac tctgcacagc tcagcgtgtg ccccgcggcc cggtaggcgg tggaagctgc25801 aggtgctgga cttgcgccgg aacgcccacc agggacttct ggaccttgtg gtccggcatc25861 aaggccagcg tgtgctcact gctggagccc gagtcagccc agcccatgca gaagaggagc25921 agggtagagg gttccagggg tgggggctga agcctgtgcc gggccctttg gaggtgctgg25981 tcgacctgtg cctcaaggag gacacgctgg acgagaccct ctgctacctg ctgaagaagg26041 ccaagcagag gaggagcctg ctgcacctgc gctgccagaa gctgaggatc ttcgccatgc26101 ccatgcagag catcaggagg atcctgaggc tggtgcagct ggactccatc caggacctgg26161 aggtgaactg cacctggaag ctggctgggc cggatgggca acctgcgcgg ctgctgctgt26221 cgtgcatgcg cctgttgccg cgcaccgccc ccgaccggga ggagcactgc gttggccagc26281 tcaccgccca gttcctgagc ctgccccacc tgcaggagct ctacctggac tccatctcct26341 tcctcaaggg cccgctgcac caggtgctca ggtgaggcgt ggcgccagct ccaaagacca26401 gagcaggcct ctcttgtttc gtgcccgctg gggacattgc cagggtgccc ggccactcgg26461 aagtcctcac gatgccaccg ctctgaccct gggcatcttg tcaggtcact tccctggtta26521 gggtcagagg cgtggcctag gttaaatgct gtcaaagggg actcctttct gggagtccgc26581 atagtggggg cttggtgtga tgcccttggg aattctttcc gagagagtga tgtcttagct26641 gagataatga cagataacta agcgagaagg acggtccatc aggtgtgagg tttgaagtcc26701 aaagctctgt ctctccctcc cacctgcccc ttctgtcctg agctgtttta ggctccaggt26761 gagctgtggg aagtgggtga ttctggagat gacaagaagg gatcaggagg ggaaaattgt26821 ggctcctaag cagtccagag aagagaaaaa gtcaaataag cattattgtt aaagtggctc26881 cagtctcttt aagtccaaat tataattata attttcctct aagacttctg aatacatagg26941 aaatcctcag taacaggtta ttgctctgcc ttgaacacag tgataaaagc tgggaggatg27001 cagcctaatc tgtctgtgtg aatgagttgt attgattccc tttttggcag ctgcaaactc27061 caagcattag gaataaatat gttcactgag aaccccgaag aaagaaagaa agaaaaaaaa27121 aaagaattgt aggtgttgat ggacggtttg tggcccctga atatctgggg gatgttcacc27181 cagggatcac gtgtaactgc tgggaccccc agccccatgt ccactgcatc cagcctgctg27241 ttgaattccg cggatcnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn27301 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnncaat27361 tcgagctcgg taccccaaag gtccgtctag tcaaggctat ggtttttcca gtggtcatgt27421 atggatgtga gagttggact gtgaagaaag ctgagtgcca aagaattatt cttttgtact27481 gggtgttgga gaagactctt gagagtccct tgaactgcaa ggagatccaa ccagtccgtt27541 ctaaaggaga tcagtcctga atgttcattg gaaggactga tgctgaagct gaaactccaa27601 tactttggcc acctgacgtg aagagttggc tcattggaaa agaccatgat gctgagagga27661 attgggggca ggaggagaag gggacgacag aggatgagat ggctggatgg catcaccaac27721 tcgatgngac atgagtttgg ttaaactcca ggagttggtg atggacttgg aggcctggtg27781 tgctgggatt catggggtcg cagagtcgga catgactgag cgactgaact gaactgaact27841 gagctgaaga gctcacctgt accagagctc ctcaggtcct cctgcaggcc tggctgtaat27901 ggcccccagg tcaccgtcct gcctccttca tcccatcctt tcacgacagg ctgggagtgg27961 ggtgaggtga gttgtcttgt atctagaatt tctgcatgcg accctcagag tgcaatttag28021 ctccagagaa ctgagctcca agagttcatt ttttcctttt cttctttatg atactaccct28081 cttctgagca gagacctcat gtcagggaga aggggactct gccttcctca gccttttgtt28141 cctccaagac ccacacgggg agggtcgcct gcttcactga gccggaaggt tcaattgctc28201 atgtcctcca gaaacacccc cccccccaga gacccccaga aataagtgga acagcacctt |
28261 gtttcccaga caagtgggac acacgttatg aaccacctca gtgattaaaa tagtaacctc28321 tgtgtatgtg tatttactgg agaaggaaac ggcaacctac tccactattc ctgcctagaa28381 aattccatgg gagagaagcc aggcaggcta cagtccacgg ggtcacagag actgaacata28441 cacaagcaca tggaagtgta ttttgcagta tttttaaatt tgttcagttc aacatggagt28501 acaagaattc aaatcgtgaa gtcaattgac caagaaacca gaagaaatca ctgtgttgtg28561 atctctgtgg aggtaacatg ggtacctgtg ctctgaccct cacagcctct ggctctctct28621 ctacatgtac atacacatat atttccatgt atgtatgtat tcggaagatt tcacatacgt28681 ctcaccagtc cacagccccc gcgttccctg atgcccagaa catctgtgat agctgtgagt28741 attgtcacca gataagatct tccaggttcc tgcactcaca ttggttatca ggtctctctg28801 atccagcatt tctcagctaa gattccttgt gactcctggc tgcagaatct tctgcaaaag28861 tcccacagag aggagtgtga tcactgtaca caggagggcc gtggttctct agtgtgagaa28921 aagctaactc agcccgtcac agggacgtga atgtacctga gacagtaatc agttatgctg28981 agaaatcaca gctctgctag aggcagcaca tggggtagcc agcagggggc agcagagcac29041 ggccaggagc cgcaggtcag aggctgggct gcccaagcgg ggcttcaggg gaaccagccc29101 tgcgggtcca caggtgtcca gggagcagcg cttggcagga agtcaggacc ggacaggcca29161 tcccctcagg actagtgacc acctctgagg gtcacatcca cagtgaaccc cagagcacca29221 tgcctcagtc cacggccagg acgctgccag gctgaccgcc ccactgggga gtccagggga29281 gaccacaggc cggggggctt gggacagtga tcatgtggtc agacacagag aaggtgacag29341 tgacctcagt ccctgaggac aagtctgatg tgcagacgtg agaagccgag gaggaagctg29401 gggacagaca gggctgatgg tgtggtgacc ccgcctctca gtgaggggcc cccgggggtg29461 aatttgcata aacccaagcc ctcactgccc ccacaaagct ctgagaggga ataaaggggc29521 tcggagagcc cagcactgct gcgggctcag aggcagagct cggggcgcgt ccaccatggc29581 ctgggcccct ctcgtactgc ccctcctcac tctctgcgca ggtgcggccc cccagcctcg29641 gtccccaagt gaccaggcct caggctggcc tgtcagctca gcacaggggc tgctgcaggg29701 aatcggggcc gctgggagga gacgctcttc ccacactccc cttcctctcc tctcttctag29761 gtcacctggc ttcttctcag ctgactcagc cgcctgcggt gtccgtgtcc ttgggacaga29821 cggccagcat cacctgccag ggagacgact tagaaagcta ttatgctcac tggtaccagc29881 agaagccaag ccaggccccc tgtgctggtc atttatgagt ctagtgagag accctcaggg29941 atccctgacc ggttctctgg ctccagctca gggaacacgg ccaccctgac catcagcggg30001 gcccagactg aggacgaggc cgactattac tgtcagtcat atgacagcag cggtgatcct30061 cacagtgaca cagacagacg gggaagtgag acacaaacct tccagtcctg ctcacgctct30121 cctccagccc cgggaggact gtgggcacag cagggacagg cctggcccgg ttcccccgga30181 gctgagcccc caggcggccc cgcctcccgg ccctccaggc aggctctgca caggggcgtt30241 agcagtggac gatgggctgg caggccctgc tgtgtcgggg tctgggctgt ggagtgacct30301 ggagaacgga ggcctggatg aggactaaca gagggacaga gactcagtgc taatggcccc30361 tgggtgtcca tgtgatgctg gctggaccct cagcagccaa aatctcctgg attgacccca30421 gaacttccca gatccagatc cacgtggctt tagaaaggct taggaggtga acaagtgggg30481 tgagggctac catggtgacc tggaccagaa ctcctgagac ccatggcacc ccactccagt30541 actcttccct ggaaaatccc atggacggag gagcctggaa ggcttcagcc catggggtcg30601 ctaagagtca gacacgactg agcgacgtca ctttcccttt tcactttcat gcattggaga30661 aggaaatggc aacccagtcc agtgttcctg cctggaaaat cccagggaca ggggagcctg30721 gtgggctgcc atccatgggg ccacacagag tcagacacga ctgaagcaac ttagcagcag30781 cagcagcagc ccaataaaac tcagcttaag taatggcatc taaatggacc ctattgccaa30841 ataaggtcca ctcgcgtgca ctctgtttag gacttcagtt cctgattgtg gagggttccc30901 acaagacgtg tgtgtatatt ggtgttgccg gaaaacagtg tcaatgtgag catcccagac30961 tcatcaccct cctactccca ctattccatt gtctctgcag gtattaagca taaaggttaa31021 gggtcttatt agatggaaga ggagtgaata ctcgtctgtg cttaacacat accaagtacc31081 atcaaggtcc ttcctattta ttaacgtgtg ttttaatcag aaatatgcta tgtagaagca31141 tccggacgat agcccatgtt acagacgggg aagctgaggc atgaagttct cagcaccttg31201 tttcacgtca gacctgaaac ggggcagagc cggcagcaaa caaggttcct cttcccaagc31261 gcccgctctt cacccgcttc ctatggcttc tcactgtgct tcctaaacta agctctcccc31321 aaccctgtgg agacaggatt agagacttta ggagaaaaga ccaggaacat cccacacccg31381 acccgagtga gccactaaga caaggctttg taaggacaga accagcaggt gtcctcagcg31441 agccagggag agacctcgca ccaaaaacaa tattgtagca tcctgaccct ggacttctga31501 cctccagaaa tgtgaaaaag aaacgtgtgg ggtttaatca actcaccggt gttatttggt31561 tatgactgcc tgagttaaga aggagttggg aacacttgag tgtaggtgtt tatggaacat |
31621 aagtcttgtt tctctgaaat aaattcccaa gggtataatt cctaggttgt agggtaactg31681 ccacaaatct aggcagctta ttaaaaaaca aagatatcac tttgccagca aaggttcata31741 tagtcaaatt atggttttta tagtagtcat gtatggatgt aaaagttgga tcataaagaa31801 ggctgagcac cagagaattg atcccttcaa atcgtggtgc tggagaagac tcttgagagt31861 cccttggaca gcaaggagat ccaaccagtc aatcctaaag gaaatgaact gtgaatattc31921 actggaagga ctgatgctga agctgaagat ccaatacttt ggccacctga tgcgaagagt31981 tgactcattg gaaaagaccc tgatgctgga aagcttgagg gcaggaggag aagagggcgg32041 cagaggatga gacggttgga tggcatcact gactcaatgg acatgagttt gagccaactc32101 tgggagacag tgaaggatag ggaaggctgg cgtggtacag tgcatgcggt cacaaagagt32161 ctgacacatc ttagtgactc aacaacgaca gcaacacagg catcacacgc ttagtgtgat32221 aagcggcaga actgttttcc aggggtccgn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn32281 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn32341 nnnnnnnnng tacgattcga gctcggaccc tgacattgtg agtcacgtca tgagcagctg32401 ttttccggtc ttcagggatt gtggacgatt tctgtttggg tttgctcatg ataatttagt32461 tacagcttag gttctttctt tccaggccac gagcgacatg ttttcaggtg agatgacgtg32521 gtgggggatg ggcggccaag cccccactgg ggggggaggg attctgttgt gggcaggagt32581 tggcagcatc cctgaactga tgacctgcga tccaggtgac aagaaccggg ggatattatt32641 cctctgcctt ctcatgtcat gtcctcggtt cttcatgatg aaaacatatg acaatactgg32701 ggagttagat ttgggcgggc acaactctgg gtgggggacc cggtggcatt gtgcccagca32761 gggccatcaa gatgagggcg acctgggtgg tccccttctc ccctggggtc ttagttttcc32821 cctcatggaa atgggatcag gcagcagcca tggaacaccg cgaccgtggc ttctctcacc32881 tcctcgtctg tgattttggg tcgggatacc aggcatgaag acctggggcg gggggacatc32941 actcctctgc agcagggagg ccgcagagtc ctccgtccat gaggacttcg tccctgggct33001 gaccctgcgg actgctggag gctgaagctg gaggcacagg cgggctgcga ggccagggtc33061 ctgaggacga cagagccagt ggggctgcag ctctgagcag atggcccctc gccccgggcc33121 ctgagcttgt gtgtccagct gcaggttcgc tcaggtgagc cactacgtta tgggggaggc33181 gccctgggca gggatcgggg gtgctgactc ctccgagatt ccgaccttct gggagcactc33241 tggccacact ctaagcctgg caagagctgg gttcatcagt ctaactctcc tcctgaagtc33301 caatggactc tctccatgcg gcagtcactg gatggcctct ttatccccga tggtgtcctt33361 ttccgctgac ctggctctcc tgaccacctc ccagcccccc accatacagg aagatggcac33421 ctggtccctg cagagctaag tccacccctg gcctggcttc agatgcctac agtcctcctg33481 cgggaggccc cgctccccac taggccccaa gcctgccgtg tgagtctcag tctcacctgg33541 aaccctcctc atttctcccc agtcctcagc tcccaacccc agaggtatcc cctgcccctt33601 tcaaggccct tgtcccttcc tggggggatg gggtgtatgg gagggcaagc ctgatccccc33661 gagcctgtgc cgctgacaat gtccgtctct ggatcatcgc tcccctggct ctcagagctc33721 cctggtccct ggggatgggt tgcggtgatg acaagtggat ggactctcag gtcacacctg33781 tcccttccct aaggaactga cccttaaccc cggcactcgg ccagacccag aaagcacttc33841 agacatgtcg gctgataaat gagaaggtct ttattcagga gaaacaggaa cagggaggga33901 ggagaggccc ctggtgtgag gcgacctggg taggggctca ggggtccatg gagaggtggg33961 ggagggggtg tgggccagag ggcccccgag ggtgggggtc cagggcccta agaacacgct34021 gaggtcttca ctgtcttcgt cacggtgctc ccctcgtgcg tgacctcgca gctgtaactg34081 cctttcgatt tccagtcgct gcccgtcagg ctcagtagct gctggccgcg tatttgctgt34141 tgctctgttt ggaggcccgg gtggtctcca cgttgcgggt gatggtgctg ccgtctgcct34201 tccaggccac ggtcacgcta cccgggtaga agtcgctgat gagacacacc agggtggcct34261 tgttggcgct gagctcctcg gtggggggcg ggaacagggt gaccgagggt gcggacttgg34321 gctgacccgt gtggacagag gagagggtgt aagacgccgg ggaggttctg accttgtccc34381 cacggtagcc ctgtttgcct tctctgtgcc ctccgaccct tgccctcagc ccctgggcgg34441 cagacagccc ctcagaagcc attgcaatcc actctccaag tgaccagcca aacgtggcct34501 cagagtcccc ggctgcgacc agggctgctc tcctccgtcc tcctggcccc gggagtctgt34561 gtctgctctt ggcactgacc ccttgagccc tcagcccctg ccagacccct ccgtgacctt34621 ccgctcatgc agcccaggtg cctcctccgt gaacccgggt ccccccgccc acctgccagg34681 acggtcctga tgggagatgt ggggacaagc gtgctagggt catgtgcgga gccgggcccg34741 ggcctccctc tcctcgccca gcccagcctc agctctcctg gccaaagccc ggggctcctc34801 tgaggtcctg cctgtctacc gtccgccctg cctgagtgca gggcccctcg cctcacctgc34861 cttcagggga cggtgccccc acacagcacc tccaaagacc ccgattctgt gggagtcaga34921 gccctgttca tatctcctaa gtccaatgct cgcttcgagg ccagcggagg ccgaccctcg |
34981 gacaggtgtg acccctgggt cccaggggat caggtctccc agactgacga gtttctgccc35041 catgggaccc gctcctttct gaccgctgtc ctgagatcct ctggtcagct tgccccgtct35101 cagctgtgtc cacccggccc ctcagcccag agcgggcgag acccctctct ctctgccctc35161 cagggccttc cctcaggctg ccctctgtgt tcctggggcc tggtcatagc ccccgccgag35221 cccccaagct cctgtctggc ctcccggctg gggcatggag ctcacagcac agagcccggg35281 gcttggagat gcccctagtc agcaccagcc tctggcccgc accccagcgt ctgccctgca35341 agaggggaac aagtccctgc attcctggac caaacaccag ccccggcgcc ccgactggcc35401 ccattggacg gtcggccact ggatgctcct gctggttacc ccaagaccaa cccgcctccc35461 ctcccggccc cacggagaaa ggtggggatc ggcccttaag gccgggggga cagagaggaa35521 gctgccccca gagcaagaga agtgactttc ccgagagagc agagggtgag agaggctggg35581 gtagggtgag agccacttac ccaggacggt gacccaggtc ccgccgccta agacaaaata35641 cagagactaa gtctcggacc aaaacccgcc gggacagcgc ctggggcctg tcccccgggg35701 gggctgggcc gagcgggaac ctgctgggcg tgacgggcgc agggctgcag ccggtggggc35761 tgtgtcctcc gctgaggggt gttgtggagc cagccttcca gaggccaggg gaccttgtgt35821 cctggaggtg ccctgtgccc agccccctgg gcgaggcagc agccacacac gcccttgggg35881 tcacccagtg ccccctcact cggaggctgt cctggccacc actgacgcct tagcgctgag35941 ggagacgtgg agcgccgcgt ctgtgcgggg cggcagagga gtaccggcct ggcttggacc36001 tgcccagccg ctcctggcct cactgtaagg cctatgggtg ttccttcccc acagtcctca36061 cagtccagcc aggcagcttc cttcctgggg ctgtggacac cgggctattc ctcaggcccc36121 aagtggggaa ccctgccctt tttctccacc cacggagatg cagttcagtt tgttctcttc36181 aatgaacatt ctctgctgtc agatcactgt ctttctgtac atctgtttgt ccatccatcg36241 atccaacatc catccatcca tccatcaccc agccatccat ctgtcatcca acatccatcc36301 ttccatccat tgtccatcca tctgtccatc ttgcatctgt ctgtccaaca gtggccatca36361 agcacccgtc tgccaagccc tgtgtcacac gctgggactt ggtgggggga gccctcgccc36421 tcccaccctc ccatctctcc tgaaacttct ggggtcaagt ctaacaaggt cccatcccgt36481 ctagtctgag gtccccccgc agcctcctct tccactctct ctgcttctga cccacactgt36541 gcactcggac gaccacccag ggcccttgca tccctgtttc cttcctgacc tctttttttt36601 ggctctggat ttatacacat tctgcctcct ggaggcgtct cagcttgagt gtcccacaga36661 cgcctcagac tcagcatctt ccatcgaaac tgctcccagg tccttgcaga cctggtcccc36721 cacattgttc tcaattcggt agatttctcc acaagccaga ggcctggact catcccataa36781 tgcctgcccc tcattgagtc agcctctgtg tcctaccata accaaacatc cccttaaaaa36841 tctcagaaga acaaaaaaag cacccagatg gcactgtcag agtttatgat gacaagaatc36901 ctcagttcag ttcagtcact cagtcgtgtc cgactctttg cgaccccatg aatcgcagca36961 cgccaggcct ccctgtccat caccaactcc cggagttcac tcagactcac gtccattgag37021 tcagtgatgc catccagcca tctcatcctc tctcgtcccc ttctcctcct gcccccaatc37081 cctcccagca tcagcgtttt ttccaatgag tcaactcttc gcgtgaggtg accaaagtac37141 tggagtttca gcttcagcat cattccttcc aaagaaatcc cagggctgat ctccttcaga37201 atggactggt tggatctcct tacagtccaa gggactctca agagtcttct ccaacaccac37261 agttcaaaag cctcaattct ttggcgctca gccttcttca cagtccaact ctcacatcca37321 tacatgacca caggaaaaac cataaccttg actagatgga cctttgttgg caaagtaatg37381 tctctgcttt ttaatatgct atctaggttg ctcataactt tccttccaag aagtaagtgt37441 cttttaattt catggctgca atcaacatct gcagtgattt tggagcccca aaaaataaag37501 tctgccactg tttccactgt ttccccatct atttcccatg aagtgatggg accagatgcc37561 atgatctttg ttttctgaat gttgagcttt aagccaactt ttcactctcc actttcactt37621 tcatcaagag gctttttagt tcctcttcac tttctgccat aagggtggtg tcatctgcat37681 atctgaggtt attgatattt ctcctggcaa tcttgattcc agtttgtgtt tcttccagtc37741 cagtgtttct catgatgtac tctgcatata agttaaataa gcagggtgat aatatacagc37801 cttgacgtac tccttttcct atttggaacc agtctgttgt tccatgtcca gttctaactg37861 ttgcttcctg acctgcatac agatttctca agaggcaggt caggtggtct ggtattccca37921 tctctttcag aattttccac agttgattgt gatccacaca gtcaaaggct ttggcatagt37981 caataaagca gaaatagatg tttttctgaa actctcttgc tttttccatg atccagcaga38041 tgttggcaat ttgatctctg gttcctctgc cttttctaaa accagcttga acatcaggaa38101 gttcacggtt catgtattgc tgaagcctgg cttggagaat tttgagcatt cctttgctag38161 cgtgtgagat gagtgcaatt gtgcggcagt ttgagcattc tttggcattg cctttctttg38221 ggattggaat gaaaactgac ctgttccagg cctgtggcca ctgttgagtt ttcccaattt38281 gctggcatat tgagtgcagc actttcacag catcatcttt caggatttga aatcgctcca |
38341 ctggaattcc atcacctcca ctagctttgt ttgtagtgat gctctctaag gcccacttga38401 cttcacattc caggatgtct ggctctagat gagtgatcac accatcgtga ttatctgggt38461 cgtgaagatc ttttttgtac agttcttctg tgtattcttg ccacctcttc ttaatatctt38521 ctgcttctgt taggcccata ccgtttctgt cctcgcctat cgagccctcg cctccctacg38581 tagagactct aagcaggaag gtgacccgtg ctgcactggg tccagcatgc ttttaattca38641 gcagtggaac ttctgggtca tgattgtgtt taagggatgc gcatacgatt tttgaagcaa38701 aatttaacag gacagcagtg taaagtcagt acttatttct gattaaagaa agcaaatatc38761 cagcctgtta ctaagttaat taactaaaga aacatcttca acttaataaa cagtatctcc38821 tgaaacttac agcatgcttc acatttaaag gcaaaaccat tttagaggcc agggttccca38881 cgcttacgtt tattatttaa tatatgctac agattcaagc ccatgacaca aaatgggggg38941 aagagtgtga gtgttaggaa aaatgagata aaattggttt ttgcaggtga tgggctagtt39001 tactttaaaa aaaaaaacaa aacaagctca agatgaactg aaggactatt agaactggta39061 caagagttaa cctgtgatcg aatacaagca ggctgggcaa aactcagcag gttttcttct39121 atacaggcag taatgattga gaatacgaaa cggcggaagc gcttacaacc tcgataacag39181 ttctattaaa agccctagga atgaacttaa cacgannnnn nnnnnnnnnn nnnnnnnnnn39241 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn39301 nnnnnnnnnn nnnnngctcc ccccaccctc ccctcctccc cccccaccac cagtgcccca39361 ggtctcgtgc ccagagagct gaagatgcca gcaggcccgc tgcctgcctc gctcgcgtgg39421 cccgggctcg ctgccggtct gcctgcccag cacacagatg cagccccagc tctcgctgcc39481 acccgcctcc cccaggcagg actctcccac aacaccaagg gcgtctctgg gatcaggatg39541 gccctcgttg aggtgtaaag tgcttcccgg ggctgagacg aatgggccgg agatccaaac39601 gaggccaagg ccgccacggc gcctggcgca gggcacccat ggtgcagagc ggcccagctc39661 cctccctccc tccctccctc cctgcttctt tatgctcccg gctatgtcta tttttactct39721 gcaatttaga aatgataccg aaggacaaac accgttcccc ctgtgtgtct gctctaaacc39781 ctttatctac ttatctatta gcgtgtccaa gttttgctgc taagtgaatg aaggaacact39841 acccacaagc agcaacgtcc ccacgaccct cgcctgttca actgggaatg taaatgtgct39901 ttcaaaggac ctaagtttct atgttcaaaa ccgttgtgtg tttcttttgg gagtgaacct39961 aggccactcg ttgttctgcc tttcaaagca ttcttaacaa ctctccagaa cccagggctt40021 ggcttacgtt tccagaaatt ccaaagacag acacttggaa acctgatgaa gaaggcctgt40081 gagcacagca ggggccgggg tacctgaggt aggtgggggg ctcggtgctg atggacacgg40141 ccttgtactt ctcatcgttg ccgtccagga tctcctccac ctcggaggct ttcagcaggg40201 tcacgctggt ggccagggtc gtgtatccat gatctgcaac cagagacggg gctgcggtca40261 gcccgcgggc gggcagcagg caggagcagc caggagacgc agcacaccga ggtcctcaca40321 tgcaggaggt gggggaagcg gctgtggacc tcacgactgc ccgatgtggg cctcttccaa40381 agggccggcc tggaccctgg ctttctccag aggccctgct gggccgtccg cacaggctcc40441 agccacaggg cctcttggga caggagggct ccagagtgag ccggccggcg ggaagaggtc40501 tgacaccgct gcagtccaca acacgaagcg aggtggagat gggatgaggg atgagaaaca40561 cttttctttt aaaacaagag cccagagagt tggaaagagc tgctgcacac gcaacatgaa40621 ctcctggccc cggtgccagc ggcgctggga gcccgagttc tcggcaatcc gaccacagct40681 tgcctaggga gccgggtgga gacggagggt taggggaagg cggctcccca gggagcgcga40741 ggcccggggt cgccaaggct cgccaggggc aagcgcagct aggggcgcag ggttagtggc40801 cggcactgca cccggcgcag gagggccagg gaggggctga aaggtcacag cagtgtgtgg40861 acaagaggct ccggctcctg cgttaaaaga acgcggtgga cagaccacga cagcgccacg40921 gacacactca taccggacgg actgcggagt gcacgcgcgc gcacacacgc acacacacca40981 cacacacaca cacacggccc gggacacact cataccggac ggactgcgga gtgcacgcgc41041 acacacacac ccaccacaca cacacccacc acacacacac ccaccacaca cacacacaca41101 cacacacacc cccacacaca cccgcacaca cccacacaca cccacacaca cacacccaca41161 cacacacaca cacacacact cacacacacg gcccggtggc cccaggcgca cacagcacgg41221 agcaaacatg cacagagcac agagcgagcg ctagcggacc ggctgccaga ccaggcgcca41281 cgcgatggat tgggggcggg gacggggagg ggcgggagca aacggnnnnn nnnnnnnnnn41341 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn41401 nnnnnnnnnn nnnnnnnnnn nnnnngtatt aaagaagccg ggagcgagaa tatgacggca41461 agaggatgta ggtgggggcg gggcaagagt aaagagagcg gacggtagag gggatgcgat41521 tgtgatgcgg aagcgagacg aggagtgatg ccgtattaga ttgatagcaa gaggaacagt41581 aggagggggg ggggagagga gggggaggtg gggggtggtg ggtgggaagg gaactttaaa41641 aaaaagaggg gagagttgga ggggggaata aacgggcggt aaaaaagaac aatttgaaat |
41701 taccagggtg gggcggccag gggggtgatt cattcttgga gggggcaaca tatggggggt41761 ggctgtcgcg gattaggaga aaataaatat caggggtgat taagtgtttg gcgttgggga41821 ataatgaagt aagaatcaaa tatgaatcgc gttggcatcg ttagccatcg ggggaaacat41881 ttcccatgca aggaacaagg atgtgagaat gcgtccgtct gaaccaccgt cccggggtcc41941 cagtaggact cgccgagctg atagttgccg gagcaacagt taagggagca gaagctgcta42001 caaaaccacc acctgccaaa gtagggtctc caattacgga gtgcgcctcc tgggtgtcgg42061 tccaaacctt tggaaaggac ctggaaataa gtgctaccca ccagatatta atataaaccc42121 acctggccag gagaggcagg cgctgctggc acaggaagtg tccccagact cagtcatcaa42181 ggtaaataat attttgggac ctccctggaa atccagtggt taggactctg cggttcaatc42241 cctggtcggg gaactaagat cccacaagtc acaagacatg gccaaattta aaaaagaaaa42301 aaagagagag aaatatttag tgcaataggt tttagaattg aaattaagct cctgcccacc42361 cccacccccc aatctggatg aataaagcat tgaaatagta agtgaagtca ggctctgaca42421 tgcactgatg tgactcacct taagcaaccc ccaccctagg actggtcggg gttccaggag42481 tttcaggggt gccaggaaga tggagtccag cccctgccct ctccccccac cacgtcctcc42541 actggagccg cctaccccac ctcccacccc tccgcaccct gctacccccc acccctgccc42601 ccaggtctcc cctgtcctgt gtctgagctc cacactttct gggcagtgtc tccctctaca42661 gctggtttct gctgcccgct accgggcccg tcccctctgt tcagttcagt tcagtcgctc42721 agtcatgtct gactctttgt gaccccatgg actgcagcac accaggcctc cctggccatc42781 accaaccccc agaacttact caaactcatg tccatcgagc cagtgatgcc atccaaccat42841 ctcatcctct gtcgacccct tctcctggcc tcaatctttc ccagcatcag ggtcttttcc42901 aatgagtcag ttctttgcat caggtagcca aagtattgga gtttcagctt cagcatcatt42961 tcttccaatg aatattcagg actcatttcc tttgggatga actggttgga tctccttgca43021 gtccaaggga ctctcaagag tcttctccaa caccacagtt caaaagcatc aattcttcag43081 tgctcagctc tctttatagt ccaactctca catccatacg tgaccactgg aaaaaccata43141 gcctcgacta gatggaactt tgtgggcaaa gtaatgtctc tgcttttgaa tatgctgtct43201 aggttggtca taacttttct tccaaggagc aagcgtcttt taatttcatg gctgcagtca43261 ccatctgcag tgatttttgg agcccaagaa aataaagtct gtcactgttt ccactgtttc43321 cccgtctatt taacggaggg aaatttccca gagcccccag gttccaggct gggccccacc43381 ccactcccat gtcccagaga gcctggtcct cccaggctcc cggctggcgc tggtaagtcc43441 caggatatag tctttacatc aagttgctgt gtgtcttagg aaagaaactc tccctctctg43501 tgcctctgtt ccctcatccg cagaagtgac tgccaggtcg gggagtctgt gacgtctcca43561 gaagccggag gattttctcc ccatttgctg aaagagagct cggggtgggg gaagcttctg43621 cacccctagg atcaccagag gagccagggt cttcagggtt cccggggacc cctcagtggg43681 ggctcaggaa ccacagagcc agaccctgat tccaaaaacc tggtcacacc tccagatgac43741 cctttgtccc ttggctccgc ctcaaatgct ccaagcccca acagtgaagc gcttaagaga43801 aggatccacc aggcttgagt ttggggagga gggaagtggg gagctggggg agggcctggg43861 cctgggagac aggaatccac catggcttca ggcagggtct ctggggcctg cggggtggag43921 agcgggcagg agcagacaga ggtgactgga cacgacacac ccctccactc caagggaggt43981 gggcaggggc ggggcacaga ggaacaagag accctgagaa ggggtccacc gagcagactg44041 ctggacccag acatctctga gccagctgga atccagctct aagccatgct cagcccaggc44101 agggtatagg gcaggactga gtggagtggc cagagctgca gctgcatggg ctgggaaggc44161 cctgcccgtc ccctgagggt cccccagggt ctagccagac tccaatttcc gaccgcagca44221 cacacaggag gaagtggtcg gggtggagtt ggcccagagg tctgggcagg tgcagggtgg44281 gggaaggggg gcagctggag tcacccgctg aattcaggga cagtcccttt ttctccctga44341 aacctggggc tgtcccgggg gccaccgcag cctccaggca gcggggggac ccagccccca44401 atatgtgaga agagcaggtc ccaggctgga gagagcgaag caccatggtg gggagaagtt44461 agactggatc ggggccccta ggggctcccc cggacctgca cggcagccgt cagggcaccc44521 gcaccccatt gctgttcagt gctggccagt gtccaaggcc agggatgtgt gtgtgtgtgt44581 gtgcgtgcgt gcgtgcgtgt gtgtgtgcgt gtgtgcgcgt gcgtgcgtgt gtgtgtgtgt44641 gcgtgcgtgt gcgtgcgtag acgtgtgcgt gcgtgcgtgc gtgcgtgcgt gtgtgtgcgc44701 acgcgcgcag cccagcctca gcactggacc aggcagcctg ggattcctcc aaaactgcct44761 tgtgagtttg gtcaaaccgt gaggctctga tcaccgccat ccattcgccc cctcctgccc44821 ccctcatcac cgtggttgtt gtcattatcg agagctgtgg agggtctggg aggtcatccc44881 acctgccagc taaaccgtga ggctgccgca atcgcactga tgcgggcaga cccgagacgc44941 tgtgccggag acgaaggcca gcttgtcacc ccgccagagc ggcagtcggg ccacaagcat45001 catccaagca gtggttctct gagcccgacg gggtgatgca aaggagccag gagacacctg |
45061 cgcgtccaag ctgggggacc ccaggtctgt tatgccggac agtaaacacg ttcagctccg45121 gagggagagg gttcccctac cttccagggt ttctcattcc acaaacatcc aaagacaatc45181 cataccgaag gcgatccgtg cctttgctcc tgagacgtgc ggaagcacag agatccacag45241 acactgtctc ccaggatcct atgtatgtaa aggaaccgaa gtcccaggct gtgtgtctgg45301 taccacatcc cacggaacag gctggactga ttttcaccaa atgtagcaga aacgttaagg45361 agtatcagct tcaaaatatg agggccagac atgtctgaga agtcccttcc agaaaagtcc45421 ctttggggtc cttccccaga gttgctgaaa cagagaaccg gaagggctgc agagctgaac45481 ttaaacaact ggatcgcaaa ggtccgtctc atcagagcga tggtttttcc agtggtcatg45541 tatggatgag agagttggac cataaagaaa gctgagcgcc gaagaatcga tgcttttgaa45601 ctctggtgtt ggagaagact cttgagagtc ccttggactg caaggagatc caaccagtca45661 atcctaaagg aaatcaatcc tgaatattca tgggaaggac tgatgctgaa gctgaaactc45721 caatactttg gccacttgat gcaaagaact gactcactgg aaaaaccctg atgctgggaa45781 aggttgaagg caggaggaga aggggtcgac agaggatgag atggttgggt ggcatcaccc45841 acccatggac tcaatggaca tgggtttgag taaactctgg gagttggtga tggacagaga45901 atcctggcat gctgcggtcc atggggtcat agagagtcag acacaactga gcgactgaca45961 gaactgaagc aactggcaag ccggagggta ggtgccggct gcgatgagcg ggaacgtgaa46021 acctgccacg tggagctctt cctacaccca gagtcctgac ggcactggga ccctagccct46081 ccacggcctc tccagggcca cgagacaccc tcacagagca gagaagcgga acagagctgg46141 tgtgcagaac caggccccgg gggtggggcg gggctggtgg gcaggcttta gtgagaagcc46201 cttgagccct ggaaccagag cagagcagaa cagttggcag aggcccccct gggagaggcc46261 ccccgcccag agtaccggcc ctgggccctg ggggagaggg cggtgctggg ggcagggaca46321 gaaggcccag gcagaggatg ggccccgtgg gacggggcgc accaaaacag cccctgccag46381 caaggggaag ctggggcact ttcgaccccc tccaaggagg agcccacacc agcgcatctg46441 cccaaggtgc ccttggccct gggggcacat gaggcccagg ccaggccagg gggcccatga46501 ggcccccagg ggtcagtgca gtgtccccag gcagccctgg cctctcatcc tgctgggcct46561 ggcctcttat cccgtgggcg cccacggcct gctgcccccg acagcggcgc ctcagagcac46621 agccccccgc atggaagccc cgtcaggaaa gagcccttgg agcctgcagg acaggtaagg46681 gccgagggag tcatggtgca gggaagtggg gcttcccttc gatgggaccc aggggtgaat46741 gaccgcaggg gcggggaacg agaagggaaa ccagctggag agaaggcgcc tgggcagacg46801 tggctgcacg cacagcgctg accctgggcc cagtgtgcct ttgtgttggg ttttattttt46861 aattttgtat tgagatgcta tttatctcgt ggagcttttg ccgccctgag attttgtacc46921 cgtggctggt gtccctcttg cctcaccccg gcctctgtag cagggcagac acggcgcaac46981 ggggcagggc gtgcccagga ggcactgtca ttttgggggc agcggcccca caaggcaggt47041 ctgccttcct cccctcttac aggcagcgac agaggtccag agaggtgagg caagctgccc47101 aatgtcacac agcacacggg cgcagtccca ggactgtaga aatcccggga ctagacaggc47161 accagagtgt cctgtgtttt taaaaaaacg gcccaagaga agaggcaagt ctgcaaggcg47221 tcccgggaag gcagcagggg cttggctcgg tctcccccaa ggaggccagc tcctcagcga47281 ggttcctaag tgtctaacgg agccaagcct gaaccaaggg ggtcacgtgc agctatggga47341 cactgacctg ggatggggga gctccaggca aagggagtag ggaggccaag gaggagagag47401 gggtgcacag gcctgcaggg agcttccaga gctggggaaa acggggttca gaccacgggg47461 tcatgtccac ccctccttta tcctgggatc cggggcaggt attgagggat ttatgtgcgg47521 ggctgtcagg gtccagttcg tgctgtggaa aaattgtttc agatcagaga ccagcgtgag47581 gtcaggttag aggatggaga agaagctgtg aaaaggtgat ggagagcggg gggacggtcc47641 tcggtgatca ggcaccgaga tcgcccatgg aatccgcagg cgaatttaca gtgacgtcgt47701 cagagggctg tcggggagga acaggcactg tcatgaactg gctacaaaaa tctaaaatgt47761 gcaccctttt cggcaatatg cagcaagtca taaaagaaaa cgcatttctt taaaattgcg47821 taattccgct tttaggaatt catctggggg cgggggaaca atcaaaaaga tgtgaccaaa47881 ggtttacaag ccaggaagtc aactcgttaa tgatgggaga aaaccggaaa taacctgaat47941 atccaacaga aagggtgtga tgaagcgcag catggcacat ccaccgcaag gaatcctaac48001 acaaacttcc aaaacaatat ttctgacgtt gggtttttaa agcatgcgtg cactttcaaa48061 agcttgtcag aaaacataga aatatgccaa taatgtgtct ctagccaaat tttttaattt48121 ttgctttata attttataaa gttataattg tatgaaatat aatgataaaa ttataaacta48181 taaaaaagtt atgaaaatgt tcacaagaag atatacatgt aattttatct tctacaatac48241 tttttaatac cagaataacg tgcttttaag aaagattgag cacagaagcg tataaagtaa48301 aaattgagag tttctgctca ccaaccacac gtcttacctt aaaacccatt ctccagcgag48361 agacagtgtc atgtgggtct gtacacttct ggcctttctc ctaggcatgt atgtccctga |
48421 aaactcacac acacggctaa tggtgctggg attttagttt tcaaaacgga ctcatactct48481 gcctatgagc ctgcaactat ttattcagtc tgttgagatt ttctatatca gcccacatgg48541 atcccgcatg ttctctgaat ggctctgtat gaattcaaag tttggaagaa gcagcgtgtc48601 tttaatcatt cgcctattaa tggacgtttg gggtgtttcc actacaaaan nnnnnnnnnn48661 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn48721 nnnnnnnnnn nnnnnnnnnn nnnnnnnnng atacaattcg agctcggtac cctggcttga48781 actatatgaa cagagaacga tgagaacagt ttctcaaact tggaacagtt aacattttgg48841 gctaaatgat tcttttttgt gtggagttgg cctatgaata gaggatatta gcagcatcat48901 ttaaccttta ctcactacat acctgtagca actacatcct ctccatttgt gtcaatcaaa48961 actgtctccg gacatggaca agtgtgcccc tgggatgggt ggaatgacct tttgttaaga49021 accactgggt cagagattca tagatttttg tcttgttgac tttttaaaaa tacatcttgg49081 tttttatttt attggtttct gctcttatct ttatgattac cttcctttta cttggggctt49141 ccctgataga ttttcccttc tggctcagct ggtaaagaat ctgcctgcaa tgcaggagac49201 ctgggttcag tccctgggtt gggaggatcc cctggagagg agaagggcta cccaccccag49261 tattctggcc tggaggattc catggagtgt atagtccatg gggtcgcaga gtcggacatg49321 actgagtgac tttcacacac acatatgtcc ctggtagctc agctagtaaa gaatcccacc49381 cgcaatgcag gagaccccgg tccaattcct gggtccggaa gattcccttt tgtttactcc49441 ataagatctt atctggggac aaaactaaca gctatgccag accttctgga catcagggaa49501 cgtgaggggt gtggactgga cagatgtgtg tgttctccca aacacaaaca tacatctgta49561 tacatgtaca tggagagagg gggagggagg ctgtgagtct ccaggggacc gtgcaaccat49621 gtgacattca tggaggcgtt tgcgggtgat cactacacag tttcttcttc tggtttcttg49681 gtcaattgac ttcacaattc caattcctat acttcatttt agactgaggg aattttacac49741 tattgtaaga catatgtata catgagttat gttcagcgcc atgagggctc attttgtgtg49801 tccactttgc ctggaaacaa agttggactg atttacttct aggggtgcct gggggtgttt49861 ctggaggaca ggagcatttg aacccaaggg ctcggtgaag catgagcctc tctgcaggtg49921 gacccaggag gaacgcaagg ccgaggaagg cagactctcc tcctccctaa cccgaggtct49981 ctgctcagaa aagggacaat ataatgacta gaagaaaaga aagaacatca gctgtgggag50041 gtttgttctc tggagcagat tcacacgttg aggctcatgt gcaggaattc taggtgaaac50101 agagcagtca cccatgtgtg ttggaaaatt ttaaattaca tttgcagtta cgactttgtt50161 taagccagac agggtagcac agcaaagtca ccatgtggtc acctgtgttt tgtaaaggag50221 agagaacttg ctggcacatt caggaaaggc cgtgtctcag ctttggaggc acactgagag50281 gccacaagca gatggtgagg accagggtct cgggcagagg gatcaattca ctgctcttca50341 cttttgccac atctgtgtgc tgtccatcct ggccagagta gttcagtctt cagatgctgg50401 agttcccatt ggtagaaatc caatctgggt catttttaaa cctctcttgg ttctacttaa50461 tggttttaaa atctctttgg ctcaagaaaa aaaataaaca taattttaaa gggtggtttg50521 gggccttgac tataaagtac attatctggg ccatttcaga gcatggttga attaatacat50581 ttcgtgctta ctatagctcc tattttcttg attctttaca ggtaattttt gttaggaatc50641 gggtactgtg aatattttct tgttgaatac gggatctttg tattttttcc taattttttt50701 ttttttttca tttttggttt taccttcagg aaagtcacta ggactcagga aagtcctttg50761 tccgcctgtt atttcagtct cttacctggg gccagggcag cgtttcctct gggctaagtt50821 tccccacaac cggggccagt tctcctcact cttcaccctg aggccttaat gaggagctcc50881 cctgcgtctg agcagccggc cctcctgtga cgtgcgtgtg tctctggcca tcggcgtccg50941 gtgtccttgg aggttccgtc ctcccttcgc tcactgtgcc ccgcactcga gctctcaggc51001 tccaagcagt gtccgcagtg tgcagaccct ctgtgtagct ctctcctcct caggactctt51061 ccctctagat gtgtgttttc ttttggctcc ttggacctcc gctctgaacg caggcctggt51121 gctgagtgtg atctctggag ggaagcctgg gaggctggac gggtccgccc tgcggtgtgg51181 tgacaggtgt gggctcgggg cggggcctgc acgtcgtcct gacccgagcc gggactgggc51241 tccgggcctc aggcatcact gactgaatct ccctcacaga ggggtcaggg cctgggcggg51301 ggaaccgtct ctgcaatgac agcccctccc agggagggca cagcggggag ctgccgaggc51361 tccagcccta gtgggaggtc ggggagccca ggggagcggc ctgacggccc cacaccggcc51421 cagggctggt tcgttctgtt tctcgagctc aacagaagct ccgaggagct gggcagttct51481 ctgaattcgt cccggagttt tggctgctga gtgtcctgtc agcaccgtat ggacatccag51541 agtccattag cagtggtctc tgtccctctg tctgtccttc atcaggctct ttgtccaggt51601 caccacacgg ccaacaccag gacagtctgg tcccgccagc ccatcgtccc tgcggacgcc51661 cctgtgcagc ctgccgaagg gccgggaggc cgggggaacc gggccaggcc tgtccctgct51721 gtgtccacag tcctcccggg gctggaggag agcgtgagca ggacgggagg gtttgtgtct |
51781 cacttccccg tctgtctgtg tcactgtgag gattatcact gctgtcagct gactgacagt51841 aatagtcggc ctcgtcctcg gtctgggccc cgctgatggt cagcgtggct gttttgcctg51901 agctggagcc agagaaccgg tcagagatcc ctgagggccg ctcactatct ttataaatga51961 ccctcacagg gccctggccc ggcttctgct ggtaccactg agtatattgt tcatccagca52021 ggtcccccga gcaggtgatc ttggccgtct gtcccaaggc cactgacact gaagtcggct52081 gggtcagttc ataggagacc acggagccgg aagagaggag ggagagggga tgagaaagaa52141 ggaccccttc cccgggcatc ccaccctgag gcggtgcctg gagtgcactc tgggttcggg52201 gcaggcccca gcccagggtc ctgtgtggcc ggagcctgcg ggcagggccg gggggccgca52261 cctgtgcaga gagtgaggag gggcagcagg agaggggtcc aggccatggt ggatgcgccc52321 cgagctctgc ctctgagccc gcagcagcac tgggctctct gagacccttt attccctctc52381 agagctttgc aggggccagt gagggtttgg gtttatgcaa attcaccccc gggggcccct52441 cactgagagg cggggtcacc acaccatcag ccctgtctgt ccccagcttc ctcctcggct52501 tctcacgtct gcacatcaga cttgtcctca gggactgagg tcactgtcac cttccccgtc52561 tctgaccaca tgaccactgt cccaagcccc ccggcctgtg gtctcccctg gactccccag52621 tggggcggtc agcctggcag catcctggcc gtggactgag gcatggtgct ctggggttca52681 ctgtggatgt gaccctcaga ggtggtcact agtcctgagg ggatggcctg tccagtcctg52741 acttcctgcc aagcgctgct ccttggacag ctgtggaccc gcagggctgc ttcccctgaa52801 gctccccttg ggcagcccag cctctgacct gctgctcctg gccacgctct gctgccccct52861 gctggtggag gacgatcagg gcagcggctc ccctcccgca ggtcacccca aggcccctgt52921 cagcagagag ggtgtggacc tgggagtcca gccctgcctg gcccagcact agaggccgcc52981 tgcaccggga agttgctgtg ctgtgaccct gtctcagggc ggagatgacc gcgccgtccc53041 tttggtttgt tagtggagtg gagggtccgg gatgactcta gccgtaaact gccaggctcc53101 gtagcaacct gtgcgatgcc cccggggacc cagggctcct tgtgctggtg taccaaggtt53161 ggcactagtc ccaccccagg agggcacttc gctgatggtg ttcctggcag ttgagtgcat53221 ttgagaactt acatcatttt catcatcaca tcttcatcac cagtatcatc accaccatca53281 ccattccatc atctcttctc tctttttctt ttatgtcatc tcacaatctc acacccctca53341 agagtttgca ttggtagcat atttacttta gcacagtgtg cctcttttta ggaaactggg53401 ggtctcctgc tgatacccct gggaacccat ccagaaattg tactgatggc tgaacccctg53461 cgtttggatt cttgccgagg agaccctagg gcctcaaagt tctctgaatc actcccatag53521 ttaacaacac tcattgggcc tttttatact ttaatttgga aaaatatcct tgaagttagt53581 acctacctcc acattttaca gcaggtaaag ctgcttcgca tttgagagca agtccccaga53641 tcaataaaga gaatgggatg aacccaggat ggggcccagg ggtcctggat tcagactcca53701 gccgtttagg acagaacttg actaggtacg aagtgagcgg ggtggggggg caatctgggg53761 ggaactgtgg cacccccagg gctcggggcc atccccacca catcctggct ttcatcagta53821 gccccctcag cctgcgtgtg gaggaggcca gggaagctat ggtccaggtc atgctggagga53881 atatgtgggg ctggggtgct gctgggtcct aggggtctgg ccaggtcctg ctgcctctgc53941 tgggcagtga taattggtcc tcatcctcct gagaagtcac gagtgacagg tgtctcatgg54001 ccaagctatt ggaggaggca gtgagcactc ccacccctgc agacatctct ggaggcatca54061 gtggtcctgt aggtggtcct ggggcttggg ccgggggacc tgagattcag ccattgactc54121 tcagaggggc cagctgtggg tgcagcggca gggctgggcg gtggaggata cctcaccaga54181 gccaaaataa gagatcaccc aacggataga aattgactca caccctttgg tctggcacat54241 tctgtcttga aatttcttgt ggacaggaca cagtccctgg ataaagggat ttctatcttg54301 cgtgtgcaat agagctgtcg acacgcttgg ctgggacatg taatcctttg aacatggtat54361 taaattctgt tcactaacat ctgaaaggat ttttgcatca ataaacctaa ggtatattgc54421 cctgtcattt ccttgtcttg tagtgtctct gagtaggctg gaaggggtaa ccagcttcac54481 aaatcgagtt aggaaattcc cttattcttc cactgtctaa tagactttca taagattagt54541 gttaattcct ctttaaatcg ctgctataat catcactgtg gccaccggta ctgaattttt54601 tgttaggatg atttttaaac aagcatttta atgatttttc cttttatttt cggctgtgct54661 gggtctcgtt gctgtgtgcc ggcgttctct cgctgtggcc agtgggggcg ctgctctcgc54721 gttgcgaagc tcgggcttct gactgcagtg gcttctctcg ttgcagagcg cgggctccag54781 ggcgctcagg ctcgcgtggc tgcggcacgt gggctc4gta gtcctggggc acaggtgcag54841 cagcctctca ggacgttttg ttcccagatg gtgggtcggt cgaaccggtg tcccctgcgt54901 tgcaaggtgg attcttcacc gctggaccac cagcgacgtt ccctggaggt ttttaattat54961 ggatttaagc tctcattaga tgtctcctca catttcctat ttctttttga gtcagtttga55021 tactttgttt gtgtctgtaa gtttgtccat tttatccaag tcatctaatg tgttgataga55081 caattattgg ttagtcatct aattgttggt ttacaatttt gagagcattg tcctgcaatt |
55141 ccttctatct gcaagattgg taataatatc tcccaagagg agtcacaaac tgaaatgaga55201 ttanatacag gctttttttt taaaagaatg aacttatgtt gttgcctttc tcatagatct55261 tacttcttag catgactgta cttactgact ggggcgtttt catgtctgtg tggagagcta55321 ccattagtac ttcttatcgc ccaaagacat cgggctcctg ggcacagtga aaacactcct55381 ttctgtggct attttgcaaa atatggccta gcctagcgtc ataagggatc acagctgaca55441 actgctggaa cagagggaca tgcgaagcaa cgtgagggct ggaacctgga gggtcctctc55501 tggggacagt ttaaccagct ataatggaca ttccagcatc tgggacatgg agctgtgaac55561 tggaccaatg actgtcattt ttggaagaga aatcccagga gagaagggtc caggggaatc55621 tgaggccgca tgcagtgcct caggacaggg gacaccttct ccagcagagc aggggggccc55681 gcccaggccg cctgcagtga ttccaccagg aggagatgca tccctgcaga cctctgacag55741 cacggccctc tcctgagaca cagggtcaca cccggggccc tggaaccctt tgagacccta55801 aacctttcct ttcctgacca ccctgacagc agtctagctc agaacagaca tcttcatttt55861 cagcaggaaa atccttttcc tcgtttgagg gagcgactgg caccggagga gctgagtctt55921 ttaaacacag gctgcctgaa cctcagggat gacctgcagc tgctcagagg aggctggagt55981 gtgatagctc actctaatgt tactaaaagg aacatattgg acaccccctc tctgaaaaat56041 ttccctcctg cctctcatct cttagtccac tttatcgccg ttttactgct tttctattta56101 ctactcttaa cgccaaccta tcttatttcc cctcccagtt taacacggtt ttccctccac56161 ccgctctctt taatctcaga agattctgcc tattcctcta ttatcacacg cccctacttt56221 ttattttttt tcttacccgc cttttattcc ctcccctcct cactctctat ttaattacat56281 cttaactaca ccgcctgcgc tatcttcgaa tgtatccaaa tatttttccc ttatataaca56341 ctccaggccg agcggctaac ttattataat ttctttatag cgcctaccta atttcccttt56401 atttctaatt atctatatat acccatgcaa tttcgnnnnn nnnnnnnnnn nnnnnnnnnn56461 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn56521 nnnnnnnnnn nnnnntgggt gtacgttata gagtaaacgc gcatgaagaa gtgggtcaat56581 ctatggctgt gagaggcaga aaataatatt atcatatata atttatgtta taacacactg56641 aggtggtggg ctcgtagaat agtgcggacg gggagaaagg tgggaaggag aagacacaag56701 agagagatgt tcgcctcgcg ggatggatgg gcggagggat agaagaataa aaagaggaga56761 ggtatagagg ggggcggggg gcataacgtg tggtggggta aatagtaggc ggtaattatg56821 aaaaaaagaa agacgggggg ggcggtaaca tagaatacgc aaaaaagtca tatactgaac56881 ggggattagg gagaagaggt ggggggcgtg gggtgcgggg gaaagaggtg tgtgtataat56941 tggtatggag tgttatttga atatatatta atgtaatagg gagtgtaatt agtgaaattg57001 tgggagtatt atattggggt gtgggggaca tggcaaagtg atgatcggga taaaaaaagt57061 aaagcaagag gggaggggaa aataaggggg gggagaaggt cgaagaaaat aagaggaaga57121 agaaagaacg ggggtggcgg gcgggggggg cgccgctctt gtatctggct tttttgttgt57181 gtcggtggtt gttcgcgtct tgttgggtcc ggggcgggtg tgcggaaaaa aaaaaaggcg57241 ggaggcccgg ggcccggtca cgcggcaccc ccgcgggtcc ctggcttctc cttcggcagc57301 tccgggggtc ggtgagcctg cgccctccgg gccgccggcc cgagctgtgt gcgccctgga57361 gaatcggagc cgctgtggca gcacgcggag ggcgcgcgca agggccacgg gacggacctt57421 caaaggccgc ggcggagcgc ggcaagccga accgagggcg gtctggcgat cggccgagcc57481 ctgctccccc ctcccgcgtg gccccagggt cgcgggtgga ctggggcggg tacaaagcac57541 tcacccccgt cccgccccca gaaagcctcc caggactctc acagagcacc cgccaggagg57601 catccggttc ccccctcggc tcagttcagc tgctcagtcg tgtccaactc tttgcgaccc57661 catggactgc agcaccccaa gcttccctgt ccatcaccaa ctcccggagt ttactcaaac57721 tcatctattg agtcagtgat gccatccaac cgtctcatcc tctgttgtcc ccttctcctc57781 ccactttcaa tctttcccag catcagggtc ttttcttatg agccagttct tcacatcagg57841 tggtcagagt attggagttt cagcttcagc atcagtcctt ccaatgaaca ctcaggactg57901 atttccttta ggatggactg gctggatgca gcgccagaca ccgaccgcgt ttaccccgtg57961 tgtcctttcc aatggctgtc ccctgcgggc ctaggggcat tggtgcgggt ttgaatcctg58021 tggccttgaa ttttacgcct tagttccagg tccagggcag ggccatccgg attcaggatg58081 cttcccagcc cttcaggaat ggcaggtttt catggtcctt tctgagtgag ttctgagtgg58141 tcatattggt gcccttggca gggagggctc ctgactttcc tatcttcaca tcactgtccc58201 caacccccaa gagaggcctc ttggcccagg gactgcaggg aggatgaagt caggagcaga58261 agcatggggt agggggctca ggtgggcaga ggaggcccct ctgtgaggag gaacggcaag58321 cgaggaggga acaggggcac cggcagtgcc tggcaagctg ggtgatgtca cgactacgtc58381 ccgaccacac agtcctctca gccagcccga gaagcagggc cctcccctga cccccatctg58441 ggcctgggct tcagttttct cctccctgca atggggtgac tgtttgcctc caggagaggg |
58501 gagcatgtaa aggtggccac tctcttctgg cagacatgcc aggcctgggc cagcctccac58561 ccctttgctc ctgcagcccc tgctgacctg ctcctgtttg ccacaccggc ccctcctggg58621 ctgatcaggg cccccctcct gcaggaagcc ctctgggaca agcccagctt gctgtaactg58681 tggctttcca ctgtgacctg caacgtggga ggctgttact taaaactccc atgactggtg58741 gattgccggt ccccagaaca aggccacgca tccctggagg ccctcgagac catttaaggt58801 agttaaacat ttttacttta tgcattttca tgtgtatcag aaagaaaaaa aatgtatcat58861 cagttcatca aatccatgat ttcttgacca ttattgctaa gatgaggctg aaataggcat58921 ttccattttt aaaaaactga atcactctga agaaacagat ggcaggcttc cctggtggtc58981 cggtggttaa cagtccatgc ttccagtgct gggggcatgg gttcgatccc tgaaaatttt59041 aaaaaggaag aaaaagatgg ctcccccgtc cctgggattc tccaggcaag aacactggag59101 tgggttgcca tttccttctc cagtgcatga aagggaaaag ggaaagtgaa gtcgctcagt59161 cgtgtgcgac tcttagcaac cccatggact gcagcctacc agactcctcc gtccatggga59221 ttttccaggc aagagtactg gagtggggtg ccattgcctt ctccaggcaa acggcctgct59281 actgctactg ctgctaaatc gcttcagtcg tgtccaactc tgtgcgaccc catagacggc59341 agcccaccag gctcccccgt ccctgggatt ctccaggcaa gaacactgga gtggggtgcc59401 attgccttca gcctgctgct gctgctgcta agtcgcttca gtcgtgtccg actctgtgtg59461 accgcataga cggcagccca ccaggctccc ccgtccctgg gattctccag gcaagaacac59521 tggagtgggt tgccatttcc ttctccaatg catgaaagtg aaaagttaaa gtgaaattgc59581 tcagtcgtgt ccgactctta gtgacccaat ggactgcagc ctaccagggt cctccatcca59641 tgggattttc caggcaagag tactggagtg gggtgccatt cggcctaggg agtgagaaat59701 cacggctgtc ttccctcttc tcgccctcta ggggtctctg tggagcctcc ctggagaggc59761 cgcggcggct ccggggactg gagggggagg gggggttgag tcagccggtg gccctcccct59821 cgctgcccgt ctcctccctt tttaggcaca agctgggcgc cctttttagg cgcagcctca59881 ccctgcgggc cactgcccgt gtttcggctc cccggagata aaacagattg cctgcacccc59941 gggtcatcac aaggattgta tgaccgtttc ccagtgtgct caccaccctc cctctgattc60001 tcagagacgc gccctcgcct caggaggctg ctcatcccag gccaaggggc ggcatggggt60061 ccccagcgcc ccgcacagac actgccttct gaccacctcc tcccaacagc ttacctgcca60121 agaaggcctc ctgacccctc atcctgcccg gtggtttgga gaaagcctca tctggcccct60181 ccttctcggg gcctcagttt ccccctctgt gaactggcgg attctgccaa gctgacgtcc60241 tggccagccg cctccccgtg gccagtgtcc cccggggcac agctgaatgt ccctgctcgg60301 gatgcacctt cccaagttgg cctgtcagga ggcgggggcg agcagggaaa cccgactcct60361 ctcagacggc ccatcgcatt ggggacgctg aggcccggag cagcggcacc ctcctggcca60421 gggtcattct cccgccccgc cccgtccctc cgggcctccg agaccgcagc ccggcccgcc60481 ccgggaagga ccggatccgc gggccgggcc accccccttc cctggccgcg ggcgcggggc60541 gagtgcagaa caaaagcggg gggcggggcc ggggcggggg cggggcggag gatataaggg60601 gcggcggccg gcggcacccc agcaggccct gcacccccgg gggggatggc tcgggccgcc60661 ggcctccgcg gggcggcctc gcgcgccttt ttgtttttgg tgagggtgat gggggcggtc60721 gcggggtact attttttctt ttataattgg gtattagcta gcgagtggaa ccacaccctt60781 attccactat agccaatttt tgcgggggca tcttacatta cagactcgcc cgcctcttat60841 ttcggtacag catatcagat cgtctcttta ctcagacact agtgattatt gtctatagta60901 cacaaaaaga acggttgtgt cggcgtaatg gttgcatttt ccctcctcgt ttctcctggc60961 cacctcaatt acaccaacac tctactattt aaatcacgta ttgtacgcca ccctccgccc61021 gcgaactaaa agaatgtgca gatattctga agataaaatc gttcattgtt acgccccgcg61081 cgcttcgcgt atattactct tagaacttct tattcgcccg agcagttatt caccccccgc61141 aactagatgt cgccttaata tttgttctaa ccgttttgga ttctaacgat aggcgggaaa61201 ggtagacatt cgaccgctac gacaactaaa atcgacgagc acaggctatt tatatcgcga61261 ccacacgcgc gcggtataca naccgtaaaa ttatctaaca tcgagagtaa gggcacagag61321 cgaaatacaa gcggcgtggt gggaggtgtg tctgtagtga attcgcacct cgcgccgccg61381 cctctgtgcg tcgnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn61441 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn61501 tattaataaa cagcggatag atgtgtgtaa gggaggaggt gcataagaga ttaaagagag61561 gcgggcggag agaaatagag tagaggagga tgagagaaaa aagaaagcaa gcgtaggtac61621 aacggcgggt gggtagtatg ataaagtgag tgtatatatt tgagtaaagg aagggtagat61681 ggagtataaa gaagtaagga gaggagaggg cggcggagag agagagtgca aagaaaataa61741 gtgggcaaag gcggggtggg tgagaagcag tagaagagaa gatagagaag ggggaaaaag61801 aggaaaatga ggattagaac aagtaggaca ggatagatgt gaaaaatgag atcaggtcaa |
61861 ggtggagaaa aagtagaaac tggggcgtga ttgtaaaaaa gggaggccgc gatggggcag61921 caccataagc gaagagatga attaatgaaa gcaaggcagg gagaatcaaa tgagttgggt61981 ggaggaagga ggctgtgact tccttcgctg ccggaaagag aactagaata gcctcgggct62041 gtggggggag gtaaagataa agtgacttct gggccctggg ggaggcccag gagtttctac62101 cgagctgagc tgggtgcctc tcccaaatgc ccaaccccct gagagtcgac gggagagcac62161 agcctggcca aacctgggca gggcacacgt gtccttcacc ccacagtggt cacgagccca62221 gcgtggtccc tgcgtctggc gggaaacaca gaccctcaca ccccacacaa gggtccggcc62281 gctttcaaat aacagcagcc gtgccctctg ggccggtgac ccggacacag agagatgaag62341 tccgcatctc tcagagtgcg ctgtcctccg cccggtcagg cccgggtccc ctgcttctct62401 gaggtcacca ggagggattg catgtgggtc tcagggacac aggttcagtg atgtgacaga62461 gggtagtggg tcccagcagg gccggtcttt ggacccgttt ttctgaaaag ccagttggcg62521 acctggggtc acagcaaagc tgatcctgtt tggccaggag tctcccagtg acggcctccc62581 ccagaacatc gggcccagtg ggggctccag ggggtagact tgcctcccag ctcacgcccg62641 tgtcttgaca agtccatgat ttggtaaaat taatttgtgt tggatggagt tgatttagtg62701 gtgtgtgagt ttctgtggcg cagcaaagtc aatcagttac gcatacacat gtatccagct62761 cttcctacga ttctgttccc atataggtca ttatggggtg tcaggtagag cttcctgtgc62821 tacgcagtac ggccttattc agttcagctc agtcgtgtcc gactccttgt gaccccatgg62881 actgcagcac gccaggctcc cctgtccatc accaactcct ggagcttatt caaactcatg62941 tccatcgagc cggtgatgcc atccaaccat ctcatcctct gtcgttccct ctcctcctgc63001 cttcagtctt tcccagcacc ccctagagaa gggaatggca aaccacttcg gtattcttgc63061 cctgagaacc ccatgaacag tacggaaagt ccttattagt tttctatttt atatatagca63121 gtgcacacgt gtcagcccca atctcgcaat ttatcacccc cctccgccgc cgattggtag63181 tcatgtttgt tttctacatc tgcgactcta tttctgtttt gtaaacaagt tcatttacac63241 cactttttta gattctgcac atacgtggca agcccacagc aaacatgctc aatggtgaaa63301 gactgaaagc atttcctcta agatcaaaaa caagacgagg atgtccactc actccgtttt63361 tactcaacac agccctgaac gtcctagcca tggcaatcag agaagagaaa gaaattaagg63421 aatccaaatt ggaaaagaag aagtaaaact cactctttgc aaatgacatg acacttatac63481 ccagaaaatc ctagagatgc taccagataa ctattagagc tcatcagtga atttgttgca63541 ggatacaaaa ttaatacaca gaaatctcct gcattcctat agactgacaa caaaagatct63601 gagagagaaa ttaaggaaaa catcccacgg catgaaaaag agtaaaatac ctaggaataa63661 agctacctaa agaggcaaaa gacctgtact cagaaaacta taaaatactg acaaaggcaa63721 tcagacgaca cagagagaga gagctaccac gctcttggat gagaagaatc gatagtgtga63781 caatgactat actacccaga gaaacataca gattcagtac aacccctatc aaattcccaa63841 tggcattttt cacagaatca gaattagaac aaaaagtttt acaagtttca gggaaacaag63901 aaagatccta aagagccaga gcaatcttga gaaagaaaaa tggagctgga agagtcaggc63961 tccctgagtt ctgactgtgt atacaaagct ggcatgattt ttaacagcag gggtgtaaat64021 gaacttgttc acaaaacaga tggtggggtg ggcttccctg gtggctcagc tggtaaagaa64081 tcctcctgca acgcaggaga cctgggttcg atccctaggc tgggaagatc ccctggagaa64141 gggaaaggct acccactcca gtattctggc ctggaaaatt ccaaggacca tatagtccat64201 gggtttgcaa agagtcggac acgactgagc gacttccaat cctggaaacg tcccattgtg64261 gacggtgaac tggggttgtc caagctcagg gtaaccgttt gctgagtgac tgacactcct64321 tctcatgggt taaaatgtgg ggcccaaggc caggaccaga ccccgcagtc agccaggcag64381 accctgtgca gccccagcga gtgtgtggcc gccgtggagt tcctggcccc catgggcctc64441 gactggagcc cctggagtga gcccattccc tcccagcccg tgagaggctg ggtgcagccc64501 taaccatttc ccacccagtg acagatccgc ctgtgtggaa acctgctctt gtccccaggg64561 aacctggcag gactcaggga gaatgtctca gggcggccgc agatcagggg ctgggggggc64621 agggctgggt ccagcagagg ccctgtgccc actccccgga aagagcagct gatggtcagc64681 atgacccacc agggcaccga cgcgtgcttg cacacaggcc gccccctcat ggtgacgctc64741 ttttcctgtg gccacatctc gccccctcag gtccctcctg ctccccagct cctggcctgg64801 gaacctcttc cccgccccgg ggacgtcagg gctggtgtcc actgagcatc ccatgcccgg64861 gactgtgctg atcaccagca cctgcacccc ctctcgggtc tcaccaggat gggcaactcc64921 tgcccatcca gcacccagcc tcctgggtac acatcggggg aggagggaga agcctgggcc64981 agacccccag tgggctccct aaggaggaca gaaaggctgc cgtgggccag ccgagagcag65041 ctctctgaga gacgtgggac cccagaccac ctgtgagcca cccgcagtgt ctctgctcac65101 acgggccacc agcccagcac tagtgtggac gagggtgagt gggtgaggcc caggtgcacc65161 agggcaagtg ggtgaggccc gagtggacag ggtgagtggg tgaggcccag gtagaccagg |
65221 gcccatgtgg gtgaggcccg ggtggaccag agtgagcggg tgaggcccag gtggacaggg65281 cgagcgggtg aggcccaggt ggacagggcg agcgggtgag gcccgggtgg acagggcgag65341 cgggtgaggc ccgggtggac agggcgagcg ggtgaggccc gggtggacag ggcgagtggg65401 tgaggcccgg gtggaccagg gcgagtgggt gaggcccggg tggacagggc gagtgggtga65461 ggcccgggtg gaccagggcg agtgggtgag gcccaggtgg acagggtgag tgggtgaggc65521 ccaggtagac cagggcccag agcaaagccc cggctcagca gtgatttcct gagcgcccac65581 tgcttgcagg gacctcagcg atggtaaggc agccctgttg ggggctcccg actggggaca65641 gcatgcagag agcgagtggt cccctggaga aacagccagg gcatggccgg gcgccctgcc65701 aggctgcccc aggggccaca gctgagcccc gaggcggcca ggggccggga cagccctgat65761 tctgggttgg gggctggggg ccagagtgcc ctctgtgcag ctgggccggt gacagtggcg65821 cctcgctccc tgggggcccg ggagggacgg tcaggtggaa aatggacgtt tgcgggtctc65881 tggggttgac agttgtcgcc attggcactg ggctgttggg gcccagcagc ctcaggccag65941 cacccccggg gctccccacg ggccccgcac cctcacccca cgcagctggc ctggcgaaac66001 caagaggccc tgacgcccga aatagccagg aaaccccgac cgaccgccca gccctggcag66061 caggtgcctc cctctccccg gggtgggggg aggggttgct ccagttctgg aagcttccac66121 cagcccagct ggagaaaggc ccacatccca gcacccaggc cgcccaggcc cctgtgtcca66181 ggcctggccg cctgagacca cgtccgtcag aagcggcatc tcttatccca cgatcctgtg66241 tctgggatcc tggaggtcat ggcccctctc ggggccccag gagcccatct aagtgccagg66301 ctcagagctg aggctgccgc gggacacaga ggagctgggg ctggcctagg gcaccgcggt66361 cacacttccc ctgccgcccc tcacttggga ctctttgcgg ggagggactg agccaagtat66421 ggggatgggg agaaaaatgg ggaccctcac gatcactgcc ctgggagccc tggtgcgtct66481 ggagtaacaa tgcggtgact cgaagcacag ctgttcccca cgaggcctca cagggtcctt66541 ctccagggga cgggacctca gatggccagt cactcatcca ttccccacga ggcctcacag66601 ggtccttctc caggggacgg gacctcagat ggccagtcac tcatccattc cccatgaggt66661 ctcacagggt ccttctccag gggacgggac ctcagatggc cagtcactca tccattcccc66721 acgaggcctc acagggtcct tctccagggg acgggacccc agatgggcca gtcactcatc66781 catccgtctg tgcacccatc cgtccaacca tcacccttcc ctccatccat ctgaaagctt66841 ccctgaggcc tccccgggga cccagcctgc atgcggccct cagctgctca tcccaggcca66901 gtcaggcccg gcacagtcaa ggccaaagtc agacctggaa ggtgcctgct tcaccacggg66961 aggagggggg ctgtggacac agggcgcccc atgccctgcc cagcctgccc cccgtgctcg67021 gccgagatgc tgagggcaac gggggggcag gaggtgggac agacaggcca gcgtgggggg67081 ccagctgccg cctggctgcg ggtgagcaga ctgcccccct caccccaggt acaggtctcc67141 ctgatgtccc ctgccctccc tgcctccctg tccggctcca atcagagagg tcccggcatt67201 ccagggctcc gtggtcctca tgggaataaa aggtggggaa caagtacccg gcacgctctc67261 ctgagcccac ccccaaacac acacaaaaaa atccctccac cggtgggact tcaccagctc67321 gttctcaggg gagctgccag ggggtccccc agccccagga agccaggggc caggcctgca67381 agtccacagc cataacacca tgtcagctga cacagagaga cagtgtctgg tggacaggtg67441 cccccacctg cgagcctgga gagtgtggcc ctcgcctgcc ccagccgcgg tcagtcggct67501 cagcaaccgc tgtccactcc cagcgccctg gcctcccctg tgggcccagg tcaagtcctg67561 ggggtgaagc taagtcaggg agcctcatcc atgcccagcc cggagcccac agcgccatca67621 agaaatgctt cttccctcca tcaggaaaca ttagtgggaa agacaagagc tggggggttc67681 tggggtcctg ggggatcaga tgaaggggtc tgggagcagc agcagcctca ggcaccccaa67741 aacaaggccc aggagctgga ctcccagggc tgaggggcag agggaaggaa ggcctcctgg67801 ggggttggca tgagcaaagg cacccaggtg ggggctgagc acccctcggc tggcacacac67861 aggcccccac tgcagtacct tccccctcgg agaccctggg ctcccgtctc ccgcctggcc67921 tgccatcctg ctcaccaccc agaaatccct gagtgcggtg ccatgtgact gggccctgcc67981 ctggggagga aggagattca gacagacagg atgccagggc agagaggggc gagcagagga68041 tgctgggagg gggcccgggg aggcctgggg ggcagggggg caggagttct ccagggtgga68101 cggcgctgtg ctatgctcgg tgagcacaga ggccccgggt gtcccaggcc tgggaaccca68161 gcagaggggc agggacgggg ctcaaaggac ccaaaggccg agccctgacc agacctgtgg68221 gtccagaagg cagctgcgcc ctgaggccac tgagtggccc cgtgtcccga accaccgctg68281 aaacatgggc cacacgttcc caggcggagc cactcctgcc ttccgggagg ctcccagcgg68341 gctcatcgct ccatcccaca gggagggaaa ccgaggccca gatgacgaac atcccggcga68401 gcaggtcaaa gccagcccct ggggtcccct ctcccggcct ggggcctccc ctctgcaggg68461 tgggaaaccg aggccacaca ggggctccat ggggctgccc tctgccaggc cctggacacc68521 ccgcgggtga cccccgcctc tatcatccca gccctgccag gccctggaca ccccgtggat |
68581 gacccccgcc tctatcatcc cagccctggg ggacagatgg gaggcccaag cgtggacccc68641 ctggccaccc cctaccccac agccgggagg agccgggagc tggtggccaa gggcctagag68701 gagccagann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn68761 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnca atatagaggg68821 ggtgggataa agggtaatat gatgtttagg tagttagagt taaattagaa gggtttggat68881 aaagattaat aaaattacaa gcgtacatat cgtgtgagtg tgggtgataa tatttgtgta68941 tgtggggaat agaagtgagt gtgagtagta ttcaagatgt aagtgtgcga atacaggtct69001 gagcgatttg aatggaagtg aaaaaaagcg tgtgtgtgga ggaggcggga gaggaagata69061 gtgtggggga agaaaagaag gctagtgggt aaagaaatat cagtaggcgg ttgacgaaag69121 aagaactagg aagaattaat ataaaaataa agggaggatt aaaaaataaa gagggaggag69181 gtaacggaaa tagttagtta agaaaagaat ggagagtgga ggtaagataa ataagggagt69241 aatgggagtg aggaggaata aataaaaaaa tggtgaggga aaatagagta gaatgagaac69301 aagaatgaaa aagggagtga agggggtgaa aaaaagtgaa gttgaaaaaa gaggaaaaaa69361 aaggagaaga taaaaaaata aaataaaaaa aggaaaaaaa agaaaaaaag aaagaagggt69421 taaaggacga aaagaaggga agagaaaaaa aatagtttaa gtgggggagg gtaaaaaaga69481 attaataaag taaatatggt tgtggtcgaa aaaaaaaaaa aaattgttgt gttgatgaga69541 agaaaagaaa aaagaagaaa gggataagca aaaagaaagg agagaaaaag acaaccccac69601 cgcccgggcg catggagggt gaggatggcg cacgcccgcg gatggcacag catcacagca69661 atcctaaaac gttttcagac cggtgcatct tcaccgcgcg cgcgccccgc ccggccctcc69721 tcccgccctg accgcggacc cccacccgca ccggggagcc tacccccacc ccggggacgc69781 tccgccacgc taaggtcagg actgccgtga agacgcgccg gggtgaaaac gttttatctt69841 catgacataa gcgagtggtt ttgaaacagg tttacaaacc ctcgtgaaga cgcaccctta69901 gcgttaggtt ttgttttttt accatgtgac gatgcaacta ttttcttcct ctcttccaca69961 gtggctagtc gcctccagag cgaggggtat ctcttgtaca gagaccctcg gaacatccgg70021 aggtagtttc ccacctaggg gtaaagcgag aaggctcatt acgagggccg gggctcctcg70081 gggaagggca gggccctggc gcagaggctc tgccacctca gtgacacgca gaccacgcgc70141 ggcctgcagg cgccgggctc tgaaagcagg caaagcccga tctgctgaca tcaggggttc70201 cgcagcagcg aaggtctggc ccgcacctgg cccactggca gggggtaagc tctgcctccc70261 gacgacagca ccaagttcag gaagggccac gcagacactg gtgagacacg gcccccccgg70321 agctgcccga gaagctctga ctttgcacta aagatctctg gcgcggtcca aaaatgtaag70381 gcctctcttc cttttatctt aagactttga tatttttacg atgtaataaa taccaagaag70441 ggcttttaat ttcagacaga tgtaggataa tttcccccgt agcccttgct gctttgttta70501 gtaacgaaac tcaaaccaga aataccaaag gaattttcca aagagtttca aaagcgctta70561 tcagcaatca ctagactgct gcatacatca tcactgcccc aaacaatagc ctgcctgtgc70621 cagttactca aagtactact tacttgacga aaacaaatct agtcctaacg tttttacaaa70681 gaaactccac tcttccgcca acttttcaga aacaaccact cgatcacgtg gcaggggacc70741 gtggctggac tgggtgctgg ctccttctgt gaccaggcaa cactgccccc ttctcggcct70801 ccctacgcct cttgacaaat gttcatcagc tgtaaagttc accccacgag ggacccactt70861 ctgctatttc ccacgtacct tccccattat aggagttttc tttgtgacag tttctgcatt70921 tttcatggat ttagaggttt acataatcag ggctgctgaa cagcatgaga gacgtggcca70981 caaggtccct cctgcacctt gccgcagggg cagggcgagt tatctggctt gagcgtggtt71041 accatcaggg ggtaaacaca gtttccagga cgtttttgac aagacactga cccggatgcc71101 cccactacca ccgtgcaggt cctgcaggcc tcccagcctc ccaggccctt cccgaggtcc71161 cttcggaact taggggactc ggtctgcccc cctgggtttt ccctgcacca gcttttgccc71221 cctctggacc caggtttccc aaatggaaaa cgaaggtgtg ggtatggaag ctccctgggc71281 tcctctcagc tgtgcctctg catggtgatg acggctgccc atcggggggg gcaggactgg71341 ggcagctgcg gacaccctcc caaggctgct acccccgagt ggtgtggggc gctgtgggca71401 cgctctgctc agcgcacctc ctggaaacca gcgcctgccg tctgcccggg gcaaccggcc71461 cgggagccaa gcaccactgc cgtcagagga gctgctggct gtgagtggac gccagtctag71521 ctctgaaccc tgcccaggcc tcctgaggtc tgaacattgt aaaatcaggc cccggacggc71581 aactgcctct ccctcctgcc gtctggtctc cataaactgc atctcaggac aaatcttctc71641 actcaccagg gctgaaacag aagactgcag ctatctttct caaatctaag gtgtgctaca71701 gggcaagtcg cagaaactgt ctggcctaag catctcatca gatgcctgag acaagagctg71761 tggacgccaa gctggagcca gagctcctcg cgttctgccc acctggcacc gcgttccacc71821 cagtaaacgc aggcttgatt ttcaaaagta ccaccgactc agagccaatg ctaaaccgac71881 cacttttcct gcccattaga ttgggtgaag gtttctttaa tcaatctgcc agtcaccaca |
71941 tgccgcctct gtgcccacag gctggcgaag acctttctga gctacggcat gtggcaggca72001 gcggcacctc tcttcagtac ggccagctgt caaggggagc gtttctgtga tgatgtgaaa72061 atacattgca tccggccccg tgtttcatga acacgggtga ggaaaggaaa cacacaaagt72121 tctgatgcga ctgacagcac gggtctcata actcaataca agtcagacaa accacaggga72181 gtcacaggga atcccaatag cctcatctag tgtgaccatc atgaggctta atttattcag72241 tgtattcaat cataaagagg gggaaaaatt gtaaaaaaaa aaaaaaagaa agagtgaaat72301 gtgtaatact gaaaactgtt gctaggagaa gcaagcattg gcgtttgtaa ctgctttgac72361 tccccaagac ccacactcgc ctcgctacaa aagggaggca ctgctgctca gtacttgcac72421 acccgaactg cggatttgta atttaaaaat gtgtgtgtgg acacagcaca agccagagac72481 tgccaaaggt tgagggacac tggaagaact taatatactt ggtgcatgct gccagtgaca72541 gtcagtcacc agctgattca atagagtgcc gaaaggtcac cttttaggta aggatgaagg72601 ggttctgggc tcgtttactt gcactaactc agagttagtc cgagatatcc gaagtgccag72661 gtgcctccca tttgctgatg gatctagctc agggacggct gggccctagc catccaaaaa72721 tcaagcattg ttctcccaac ctgtcttctc gctgataatg gaaggtcaga acgcccaccc72781 gcccacctca aagtcaaaga acaccaagcg ggtgagtccc cactaagctc ggtgtttcca72841 atcagcggtt tcaggattcc agctggggca atgagggagg gagcgtgcga gggatccaac72901 acctcgcccc gtgcgcagca agggataacc caacaccccg tttctgtacg tccggctgga72961 gttgtggaac tcagcgcgga cccggggcca ccgcgacccc cgggaccctg gccgcgcggc73021 gcatccccgc tgccgggaca cgggtaagcg tccccaaact gccggacgcg gggcggggcc73081 ttctccgcca cgccccgata ggccacgccc aaggacaagg atggtcgtgc ccagacggcc73141 ggggcgggnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn73201 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnncg gagggggggg73261 ggcggggcgg gggctgccgc cgcgcgtata ggacggtggt cgcccggcct ggggtccggc73321 cgggaatgac cccgcctctc cccgcatccc gcagccgccc cgccgcgccc tctgccgcgc73381 acccgcctgc gcacccgccg ccctcggccg cggccccggc ccccgccccg tcgggccagc73441 ccggcctgat ggcgcagatg gcgaccaccg ccgccggagt ggccgtgggc tcggctgtgg73501 gccacgtcgt gggcagcgct ctgaccggag ccttcagtgg ggggagctca gagcccgccc73561 agcctgcggc ccagcaggtg agcaagggct caggggaaac tgaggcccga cacagagccg73621 cagcaagaag gatcctactg gtcactcggc tgttggcctg gggtcatcac aggcgggctc73681 tcccaaccca tcccctgagg ccaaggtccc tagaaccccg tgggcagaca ccaaccagcc73741 ctttaaatat ggggaaacca aggtgcttag gggtcagaga tagccctagg tcgcccaacc73801 ctagtagaag ggagggctgt tggagttcct gagtgcccgc tctcccaccc cccgggaggc73861 cccttcctga gcccaagggt gactggtagt cagtgacttt gggcctgccg acctgtaccc73921 cactgggcac cccaccagtc ctgagccaca tttgggctta gtgacggggt cagggatcat73981 gaggatcaat gtggctgagc caggaaggtg ttagaacctg tcggcctgga gttcatacca74041 gcactgccct gggcttttct agacccatgt cccgcctcct gccccacctg cccctgttcc74101 cgcaccccac cagcagcggc aggggcttcg agagggctgt gggctctccc tatttcaggg74161 atggagccgc taagacctgg ggcacactgc ccgctaggga cccctgaggc accagggccg74221 ggggctctgc ggaggggcag ccgccacccc cagctttgga gtcctctccc gggtgcccag74281 cccgagctga tccggctgcc tcccacgctg tgccccaggg cccggagcgc gccgccccgc74341 agcccctgca gatggggccc tgtgcctatg agatcaggca gttcctggac tgctccacca74401 cccagagcga cctgaccctg tgtgagggct tcagcgaggc cctgaagcag tgcaagtaca74461 accacggtga gcggctgctg cccgactggc gccagggtgg gaagggcggt ccacggctcc74521 cactccttcg gggtgctccc gctattccca ggtgctcctg cacttcccat gtgctcccga74581 ttctccctgg tgctccctct cctcctggct gctcctttgc ctcccaggtg ctcccacttc74641 tccctggtgc tcctgctcct cccggcggct cctgtacctt cggcctgacc tcctccctct74701 acaggtctga gctccctgcc ctaagagacc agagcagatt gggtggccag ccctgcaccc74761 acctgcaccc ccctcccacc gacagccgga ccatgacgtc agattgtacc caccgagctg74821 ggacccagag tgaggagggg gtccctcacc ccacagatga cctgagatga aaacgtgcaa74881 ttaaaagcct ttattttagc cgaacctgct gtgtctcctc ttgttggact gtctgcgggg74941 ggcggggggg agggagatgg aagtcccact gcggggtggg gtgccacccc ttcagctgct75001 gccccctgtg gggagggtga ccttgtcatc ctgcgtaatc cgacgggcag cgcagaccgg75061 atggtgaggc actaactgct gacctcaagc ctcaagggcg tccgactccg gccagctgga75121 gaccctggag gagcgtgccg cctccttctc gtctctgggg gcccctcggt ggcctcacgc75181 tctgtcggtc accttgcccc tcttgctgat gcaatttccc cgtaattgca gattcagcag75241 gaggaatgct tcgggccttt gcacctgacc gcatgagcag aggtcacggc cagccccctt |
75301 ggatctcagt ccagctcggc cgcttggccg tgacgttcca ggtcacaggg cctgccggca75361 cagaggagca ggcccttcag tgccgtcgag cactcggagc tgctgcctcc gctgagttca75421 ctcagtgtct acgcacagag cgcccactgt gtaccaggcc ctattccacg ttccccagtc75481 accgagcccc cagggctggt ggggacctgc cctcgggtac actgtgtccc gtcacgtggc75541 tttacgtgtg tctctgaggg aggctggcat tgcggtccac ctctcagcac aaacatctgt75601 cccctgggaa gggggtccca tttctgggtg cgagcagccc cctggggtcc gtgtctcctc75661 cttacctggc tcaaggcccc ggctcctggg tcctggacag cagggagccc acccctcggg75721 gctgtggagg gggaccttgc ttctggaggc cacgccgagg gcccaggcgc cgcctccggc75781 cgtcgccctg agggagcagg cccgacgcca gcgcggctcc tctgtgaggc ccgggaaacc75841 ctgcctgagg gtgcgggtgg gcaggtgccc ctgcccccag gctctcctgt gtgagtgaca75901 ctcaccagcc agctctggat gccacccatc cgggttctcc aggaggcact catagcgggt75961 ggggtcccct ccctcccccc tctgtggagg gagggagtct gatcactggg aggctggtgg76021 tccgtacccg cccccccgac tctggacgtg tttactaccc ccgcctgggc tcaggacagg76081 gcattggatg ggaaggacag ggctgggtcc tggccaggct gggggctctg cagggcatgg76141 gtgcccctgt ctcttcttat attccaacgt cactgcaggg gggcgcaaat cttggacccc76201 acttactgat gatctgcatc aggacatagg tcccccctcc tgcagcgggg ggctggccac76261 ggagggcgct ggggaaggcc cctcctccag cccctcggcg aggctcacca ggtgcccatc76321 ctcagccagc agggcgacgc tcgctgggag ggcggagagg gaggcagggc agggctggta76381 cgacccccgc tggggcgggg gggccctcag ccggtcctcc agcacccttg ctgccccccc76441 tcaccgtcag ggggcacctg gccgctctgc ctcaggtggg cggtgagggt cccaaggcca76501 caccaggtgt tcaccagctc ccagcagctg gctgtgggag aggggcagag gtgggcgcat76561 ggcacccgcc ttccccccag accaggatgc tctgccttcc tcccgcccat ctccccagac76621 atctgaagga ctcttgcctc caccatgcag ccccgcctcc accagaagct caggttcccc76681 gccccccctc cccgaagctg caggacccct gaccagcgaa gagatgggac agttggaaca76741 cacgctcccc cagcagcggc acagcagctg tgtggcccag aagagcccgc ctgtttccct76801 caagcaactc cccatggatg tcatcccatg gacaccccct tccccacacc gcctcctcgt76861 tctccccctc caaggcagag ggaacgcacc cccacctgtc tgctaggaca ggggacccca76921 cttacctccg aacatcacct tgataaacat ggccgtggtg gggacagatc cctccgaccc76981 ccaacttccg acctggggaa ggagctgggg tggagctcga ctgcagggtg gggccctgtg77041 ggaggtgtac gggtggagag ggtgatgggt gggtgggctc aagcggagct ccttgctcag77101 tccaggcggt ccctgcagct agtccaggat cctcagcctt ctccccctca ctggatcagg77161 gaagactgag gttccctccc ctgccccccc acccagcttc caagctggtc tctgtggcag77221 tgggagctgc caagaggtct gagcggccag taccgggtaa cggggttttg tggagggtcc77281 gggcattccc ggtgcagggc tctagtgggg gctggagcct cgggcccaga gctgtccaga77341 gaccagtgcc ctcccaccgc cgccgcccgc aaggagagac agagctccca ggcggggagt77401 cggaggttcc tggaggggga gcatcctcaa ctctgcaggc ccccttccca ggcgcactcc77461 cggcctcccc gtcttctgtc ccctgctctt gttgaagtat gattggcata cagttcacag77521 ccactcttcg gagtgttctc cacactaagg atacagaaca tgtccctcgt ccccccaaac77581 tcccagccag gctgtcacga agagggaggc ggccgacggg gcagggcctt gcactcctgc77641 gtgtggggtc cacaggggtc gtccccgtgt cggtggcccc ttcctctcac gccaggaggg77701 tccccttgcc tggaggtgcc gtggatccgc tcgctgcctg ctctttgggt tgtttcccgc77761 atggggtgat gatgaagagg ccagtacaga cactcgccag caggtctctg ggtgaacagg77821 catttatttc tctttcctga gggcagatcc tgggagtggg gtgccggacc gtccggggag77881 agtatgcttc tgtttctaag aagctgccgt gttctccagt gtgctgcacc atgtcacggc77941 ccctctgtgc gtctggactc aggagacctc cttctcagcg gccctccccc ccaggtggtc78001 aggccatctg tgcccttctg ggggcagagc tcagcgccgg aggcgggagg aggcccagat78061 cccagcgcag cccaccagcg ttgctctgct tccctcggca ttcatagctg gagaaagggc78121 aaggagcacc ggctgaagcc ccacctggag gacgcacttc gatggcagca ggtgctcaga78181 ggtggccccg ggcagcattc cccagacgca caggccagtg ctttcttccc aggacaccac78241 tgtgtctggg gacccgagtc ctgcagcacg gtcgggagcg gctgtgccca gattccggcc78301 tgcacccttg gctccagcca ccacccctgt ttgtcaaggg gtttttgtct ttcgagccgc78361 cgaggagggt gtcttttgtc tgcagtgtca cagaagtgcc ataaagaggg gcccacagtg78421 ggagctttat aacattggtg cggagggctg taacaggtca gggaggcact tgagggagcc78481 ttctagggcg atggagatgt tctaaaattt ggtctgggta caggctacag agatgtgtgg78541 gtgtgtgtgt gtgtgtgtgt aaaaccctcg agccacacgt gtgaggtctg tgcatgtgac78601 cgtacacagg agacctcggt ggaaagcagc cacctgctct gactgcacct gtggatttcc |
78661 agctcctgcc ctcaggcggc cctgcggggc ccactggctg acggggagac ggcaccgccc78721 tcccccgctg tcagggtggg ggggctgacg atttgcatgt cgtgtcaggg tccagcggcc78781 tcccttgcgt ggaggtcccg aagcacctgg agcgccgccc gcagaacagc ggactcctgc78841 ctgcctccct gcctctggcc atggcctgcc cgcctctggc cctctttctg ctcggggccc78901 tcctggcagg tgagccctcc caaggcctgg ctcacctagg ggtgtgtaag acagcacggg78961 gctctagaag taaatcgcgg ggaagtaaat cgtagtgggc aggggggatg gtttccgaag79021 gggccctgag ggggacagga gacctggcct cagtttcccc actggtgagt gaccagatag79081 ccagggtacc tttggactct gactctgggg ggctctcaga gactggtctc ctactcagtt79141 tttcagaggg gaagctggtg tggccttgtc actgccctgc agggcctcag ggacaagcta79201 tccctgagga ggtctccagc agtcagtggc cggaggctga gccgatggat atagtaacag79261 cccaggcggc ctcttggggg tggtcagcct gtagccaggt tttggacgag ccgaagtgac79321 ctaagtgatg ggggtctgca gagcaaggga tgagggtggg cagcaggagg acccagagcc79381 caccagccca ccctctgaat tctggaccct tagctgcatg tggctccttg ggaagacggg79441 gcttaagggt tgcccgctct gtggcccaca cagtgctgat tccacagcac tggctgtgag79501 cttttgggag cagattctcc cggggagtct gacccaggct ttgtggggca ggggctggag79561 ggaaggggcc caggccagac ctgagtgtgt gtctctcagc ctcccagcca gccctggcca79621 agccagaagc actgctggtc ttcccaggac aagtggccca actgtcctgc acgatcagcc79681 cccattacgc catcgtcggg gacctcggcg tgtcctggta tcagcagcga gcaggcagcg79741 ccccccgcct gctcctctac taccgctcag tggagcacca acaccgggcc cccggcattc79801 cggaccgctt ctctgcagct gcggatgcag cccacaacac ctgcatcctg accatcagcc79861 ccgtgcagcc cgaagatgac gccgattatt actgctttgt gggtgactta ttctaggggt79921 gtgggatgag tgtcttccgt ctgcctgcca cttctactcc tgaccttggg accctctctc79981 tgagcctcag ttttcctcct ctgtgaaatg ggttaatagc actcaccatg tcaacaataa80041 ctgctctgag ggttatgaga tccctgtggc tcggggtgtg ggggtaggga tggtcctggg80101 gattactgca gaagaggaag cacctgagac ccttggcgtg gggcccagcc tccccaccag80161 cccccagggg cccagactgg tggctcttgc cttcctgtga cgggaggagc tggagtgaga80221 gaaaaaggaa ccagcctttg ctggtcccgg ctctgcatgg ctggttgggt tccaacactc80281 aacgagggga ctggaccggg tcttcgggag cccctgccta ctcctgggtg gggcaagggg80341 gcaggtgtga gtgtgtgtgt ggggtgcaga cactcagagg cacctgaagg caggtgggca80401 gagggcaggg gaggcatggg cagcagccct cctggggtag agaggcaggc ttgccaccag80461 aagcagaact tagccctggg aggggggtgg gggggttgaa gaacacagct ctcttctctc80521 ccggttcctc taagaggcgc cacatgaaca gggggacacc catcagatgn nnnnnnnnnn80581 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn80641 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn agagggtggg tgggtggaat ttaatatagt80701 ggtgcgcgtg gagcgtgggc ggcgcattta aggcggtcat ctaaaatagt ggataggggg80761 tggtgtgaca ataacgggtg gtggatgtgg tttacggggg gtgcaatagt tctgagtttg80821 ttagtgtctt cttgatgggg ttgcggcgtg tggacctacg ccttgagtat gtgggggggg80881 aaaagcagtg agggtagtag ggatgggaaa tattggtgga ggttctttgt tggtgtattt80941 tttggtatta tgttgggtgg tggagtggtg ggttgggtgt aatttcgctt gcgttatgtg81001 ttttttttct ttttcgtgtc gtgggttggg ttggttggtg ctttgtggtg gtggtgggtt81061 gtggtataaa aaaaaatgtg tggttgtgct cagcttagcc ctataacggt cggctttgtt81121 tcttgtttgt tctgtgggcg tgagcggatg gctcgggcct ccgtgctccg cggcgcggcc81181 tcgcgcgccc tcctgctccc gctgctgctg ctgctgctgc tcccgccgcc gccgctgctg81241 ctggcccggg ccccgcggcc gccggtgagt gcccgccgtc ctccagcccc cccgccccgc81301 cccgccctcc acgccgaggg gcgccggctc gcagagctgg atccaagggg gtgcccggga81361 gtggcccggc gcggcccgtt accccgaaac gctgtctggg tgccccgggg gtgtggtgga81421 tagtgagctt cccgtccctg gaagtatgca agtgaagccg gcgccgggat cgctcgggct81481 ggctggtgag cgggcgggac tcggtcgggc gctagacgca cgccgccagc cccccagctc81541 ccagacctgc ccactccgcg cccgcccggc cgcgatcccg ggtgtgtgtg tgtgttgcag81601 gggagggaca gcgggagtgg ctacagggct cccgactcac cgcagggaca aagacccgcg81661 ggtccccagc tggcgtcagc cgccaggtgt gtggcctcgg tgagcacacc tccaggcggg81721 agggttgagg gaagcgctgt ggggagggca tgcggggtct gagcctggaa gagacggatg81781 ctaccgcctg ggacctgtga gtggcgggat tgggaggcta tggaatcagg aggcagccta81841 agcgtgagag ctccggtgtg gcctggcggg ggtggtaggg gggggacgcc cctgtgtgtg81901 ccagcctgcg tgtgccctaa aggctgcgcc ctcccccact gctggggctt cgggggacca81961 gtcacagcct aggctactgc aggcgcacag ctccccggga gcccggccca cgcgggtgtg |
82021 ccgctgagcc tccagcctgt cggggcaggg gtggggggca gggatggggt cgttagcggg82081 gttgggggca gacgcccagg cagactctct gggcacagct ccggtgacaa gggaggtctg82141 gcaagcctgg gccccttctg tccagccacg ccagctctgc cctggccagt cttgccccct82201 ggcagtgctg gggatggaag ggggagcggg tacctcagtc tgggggccct gcctcctccc82261 cagccccgcc cggcccccta ggcctagggg cagagtctag gggtcaccct ggggagctgc82321 tgaatccgcg ggtttaggaa ccggagggac ctgggctttt gaaccacgtg gccctaggtg82381 agccctccgg cgcctcggta gccctcaccc ccagccttgt ccaggtgggc gggtgggagg82441 cgacagtgcc cactgctggg ctgaacagcg tctgcaggga ggccaggaga gctgggcaca82501 cggacacgtt ccatcacctg gagctgccac tgtgccactt gtgcggggtc aggcggggtc82561 tgagccgggc tgtcatctgt cacgccacag atatgcaggg ggcactcggg gtcgcctcgg82621 acatgcttat ccctggacgg ctgttggcag ggccgggaag gctctgtaaa tatttatcca82681 tcccagctca cagctttcag ggttgatgaa agccccgccg cccgcccact gtgggggacc82741 ccgccttccc ttctggagcc agcggggtga gggggtgggg gagatggacc tgcctgccca82801 ggagcaggcg gtgtgactct ggcaggtcac ttgacctctc tgagcctcag ggagggcccg82861 ggatggtgtg cggatgctct ctgccttcct cccagcctga ccagtgtcct cccctcgggg82921 tcgcctcctg cccaccgcag agggggtggc tatggggacc tgggccgatg gcaggcaggc82981 cggagagggc atgcccggct cagccgtgcc cagcacttcc cagtccaggg gcccccgcca83011 ctcccagccg ctggctgcct cccattttcc cgattgcagg ttggccccga ggctgaccgg83101 agcctctggc tcagctggga gactgaattc cccaagcaat tcctcaagga tgtgtgaggc83161 tgtggtgtgg tgcctatccg ggagaggtgg ggtgagcgga ctgggcacct ccgcccaggg83221 caggcccagg gagacgctgg ctgacgagca ggcaggcctg caaggaggac gagcagccat83281 ctcaggaatg tgggttttgg agacaagcca cagctggggg ggtggggggg ccatgggtgg83341 ggaggcctga tccccaggtc taggtccagc tctgggctcc ctcgccgtgt gaccctgggc83401 caagacctgg acctctctgg gccccgtctc ttcccctggg aggtggggcg atgcctgctc83461 cccaatcccc cagggctgtg gatgaggcag acgaggtgtg tgctcatccc cacctcactg83521 ccttccagca gccccgggcg gggggggtgg tggggactgg cgcacccagg tgaggatcag83581 gccttggagc tagggagggc cccccagccc caggccagaa aggacacggg gagacagaat83641 gcaggagggc ggcagagcag gggccagcgg tggggaaact gaggccaaga gcctgtggac83701 gctgtgctcc aggaaaggac ctcgctgcct ggggcctgga tcctagagcc tccaggagcg83761 gtgaccatga cgtgggcagg gaaccggagg ccccggcttg caggtggacc cggcgcgagt83821 cactcttcct ctctggccct gagagcttcc ttccagctgc cgctcctgtg ttctaatgtc83881 aagtctggag gcctgggggg caggtggggg ctgactgcca ggtgggggag ggcaggaatt83941 tggcagagca gcgtcccaga gtgggagaag ccagcccatg gaggggactc tctccatgcc84001 tgctgcccca aagggcgtta tagagagagg tcggttaccc cttcgccatg gccccgttcc84061 cattgaacag atgggaaagt ggaggctgag agaaggctgt gacttgccca gggtctccgt84121 ggcatggaac tgggcctgct gagtctcagg ccggggatct cgctgctgca ctgagcacgc84181 caggatgcag gggtctgggc ctggacctag cgcctcgtgg gggcaagaga ggaaggcacg84241 ctgggcctgc ctgtcaccct ccaccccacc gtggcttgtt gctcaggcct tcctgggggc84301 agaggagagg ggagatttca ctcgctggca ggctaggccc tgggctctct ggggctccgg84361 gggaacaatg cagccctggt ctttctgagg agggtccttg gacctccacc agggttgagg84421 aaaggatttc tgttcctcct ggaggtcacg gagccgacat ggggaggagc aggggcaggc84481 ccggggccca catcctcagt gtgagacctg gacgtgtgtc ctcccacctg acgctggggg84541 tggggggtgg gggccggggg ggatccagtg aaccctgccc ccaaattgtc tggaagacag84601 cgggtacttg gtcatttccc cttcctcctc ttcgtttgcc ctggtgggga cagtccctcc84661 cctggggaag ggggacccca gcctgaagaa cagagcagag ctggggtcag gggtgtgctg84721 ggagcgcaga gagcctcctg ctctgcctgc tggtcattcc tggtggctct ggagtcggca84781 gctggtgggg agcggctggg gtgctcgtct gagctctggg gtgcccaggg cctgggagag84841 ttgccagagg ctgaggccga gggtggggcc ctggcggccc ggctcctgcc ccaaatatgg84901 ctcgggaagg ccacagcggc actgagcaga caggccgggc cagacgggcg ctgaggctcc84961 cggcctctcc cccagctccg ctgtgaccct cacctgcggc ccggggtgcc agggcccccg85021 cttggttctg ccgtgtcttt gcaggctgat cccacgggct ctccctgcct ctctgagctt85081 ccgccttttc caggcagggg aaccgcgacc tccaggctgg gacgcgggga gggtgtatgc85141 gccaggtcag aatcacccct ccaccgggag agcgtggtcc aggggccctg gcagggtggg85201 gaccgagcat ctgggaactg ccagccaccc ccacccatgc agaggggaca tacagaccac85261 acggaggctg tgcctccgct gcagcaactg gagaacaccc agccgcggcc aaacataaat85321 aactaaataa taaaagtttt aaagatcgtt acttaaaaaa acaagtgtgc cccagtgatc |
85381 ggaccccagt tcccggtgcc ctgagtggtg ccggccctgt gctgagcatg gcctggttgg85441 ttcaccccca gatccacact aaagggtggg atcaccccta ctagtcaggt gagcagatgc85501 agggggggag ggcggcagcc cctccatgct ggtgggtggc cgtggtgggt gtcctgggca85561 ggagccagct cacggagctg gagaggacag acctgggggg ttgggggcgc ccaggaagaa85621 acgcaggggg agaggtgtct gccgggggtg ggggtccctt cgaggctgtg cgtgaagagg85681 gcaggcgggc ctgcagcccc acctacccgt ccccggccca aacggcggga gtaagtgacc85741 ctgggcacct ggggccctcc aggagggggc gggaggcctt gggatcagca tctggacgcc85801 agtcagcccg cgccagagcg ccatgctccc cgacggcctc cgctggagtg aggctgcgct85861 gacacccaca ccgctgaccc gggcctctct cccgctcagg atgccccccg ccgccacccc85921 gtgagcagag ggccacagcc ctggcccgac gcccctcccg acagtgacgc ccccgccctg85981 gccacccagg aggccctccc gcttgctggc cgccccagac ctccccgctg cggcgtgcct86041 gacctgcccg atgggccgag tgcccgcaac cgacagaagc ggttcgtgct gtcgggcggg86101 cgctgggaga agacggacct cacctacagg tagggccagt ggccacgagc tggcctttga86161 tctccacctg ctgtctgaga cacgctggag ctggggggag ggcagatccc tatggccaac86221 aggctggagt gtcccccaac tcccgtgccc actgctcaac accccaaacc cacacttaga86281 tgcactccca tgccctccct tgggagcacg gtctccacac ccacctggcc accccacaca86341 cccgtggggc acggccgtta gtcacccacg caacctctgc gggcaccgtg ctgcgggcca86401 ggccctggga ctctcagtga gggaggcaga cacggcccct cctccggggg agcgaggtgc86461 tccccacgcc cggttcagct ctagcaccgc actcgggacc ctcacaggga gggacccact86521 ggggcaggcc aggtgacggc tcgggtgacc tcggcccctg gcgctgagac tacacttcct86581 gcagtgggcg gcgaagatgg gtgtggtgtc ccacgtcgtt gcagcgggga ctcctggggc86641 ctcggaagtg tcctgggcgg ggagcctggg gagcaggaag ggcaggtctt ggggtccaag86701 gcctccccac ggtcaggtct gggagggggc ctcggggctc ttgggtcctt tccgcccagt86761 gcagaccctc gcggccacct aagggcacac agaccacaca aagctgtgcc catgcagtgt86821 ggggagtggt gcgcaccctc agagcacact gggcccacat cacgcacgcc tgccccctca86881 ctgtgcatcc ggggaaactc ctggccccga cagccagcgg ggctgacgct accccgtgag86941 ccagacccag gcccccctca ccgcccctgt cctccccagg atcctccggt tcccatggca87001 gctgctgcgg gaacaggtgc ggcagacggt ggcggaggcc ctccaggtgt ggagcgatgt87061 cacaccgctc accttcaccg aggtgcacga gggccgcgcc gacatcgtga tcgacttcac87121 caggtgagcg ggggcctgag ggcaccccca ccctgggaag gaaacccatc tgccggctgc87181 cactgactct gcccctaccc accccccgac aggtactggc acggggacaa tctgcccttt87241 gatggacctg ggggcatcct ggcccacgcc ttcttcccca agacccaccg agaaggggat87301 gtccacttcg actatgatga gacctggacc atcggggaca accagggtag gggctggggc87361 cccactttcc ggaggggccc tgtcgaggcc ccggagccgg gcccgggctc tgcgtccgct87421 ggggagctcg cgcattgccg ggctgtctcc ctcttccagg cacggatctc ctgcaggtcg87481 cggcacacga gtttggccac gtgctcgggc tgcagcacac gacagctgcg aaggccctga87541 tgtccccctt ctacaccttc cgctacccgc tgagcctcag cccagacgac cgcaggggca87601 tccagcagct gtacggccgg cctcagctag ctcccacgtc caggcctccg gacctgggcc87661 ctggcaccgg ggcggacacc aacgagatcg cgccgctgga ggtgaggccc tgctccccct87721 gcccacggct gcctctgcag ctccaacatg ggctcctcct aacccttcgc tctcacccca87781 gccggacgcc ccaccggatg cctgccaggt ctcctttgac gcagccgcca ccatccgtgg87841 cgagctcttc ttcttcaagg caggctttgt gtggcggctg cgcgggggcc ggctgcagcc87901 tggctaccct gcgctggcct ctcgccactg gcaggggctg cccagccctg tggatgcagc87961 cttcgaggac gcccagggcc acatctggtt cttccaaggt gagtgggagc cgggtcacac88021 tcaggagact gcagggagcc aggaacgtca tggccaaggg tagggacaga cagacgtgat88081 gagcagatgg acagacggag ggggtcccgg agttttgggg cccaggaaga gcgtgactca88141 ctcctctggg cacagctggg aggcttcctg gaggaggcgg ttctcgaagc gggagtagga88201 taaaaggtat tgcaccccat gaagcacgtg tgatccttgc ccctagagac aaggctctgg88261 ggctcagagg tggtgaagtg acccacatga gggcacagct tggagaatgt cgggagggat88321 gtgagctcag tgtgccagag atgggagcct ggagcatgcc aaggggcagg gcctgctgcc88381 tgagagctgg cactggggtg ggcagccaag tgcagggatg gagcgggcgc ccaggtggcc88441 tctttgctgc tcagaacgac ctttcccatg tatacctccc agcgccgctg gcattgccca88501 gtgtccttct tgggggcagg agtaccaagc aggcattatt actggccttt tgtgttttat88561 ggacaacgaa actgaggctg ggaaggtccg aggtggtgtt ggtggcggaa ggtggccgct88621 gggcagccct gttgcagcac acacccccca cccaccgttt ctccaacagg agctcagtac88681 tgggtgtatg acggtgagaa gccggtcctg ggccccgcgc ccctctccga gctgggcctg |
88741 caggggtccc cgatccatgc cgccctggtg tggggctccg agaagaacaa gatctacttc88801 ttccgaagtg gggactactg gcgcttccag cccagcgccc gccgcgtgga cagccctgtg88861 ccgcgccggg tcaccgactg gcgaggggtg ccctcggaga tcgacgcggc cttccaggat88921 gctgaaggtg tgcagggggc aggccctctg cccagccccc tcccattccg cccctcctcc88981 tgccaaggac tgtgctaact ccctgtgctc catctttgtg gctgtgggca ccaggcacgg89041 catggagact gaggcccgtg cccaggtccc ttggatgtgg ctagtgaaat cagtccgagg89101 ctccagcctc tgtcaggctg ggtggcagct cagaccagac cctgagggca ggcagaaggg89161 ctcgcccaag ggtagaaaga ccctggggct tccttggtgg ctcagacagt aaagcgtctg89221 cctgcaatgc gggagacctg gattcgatcc ctgggtcagg gagatcccct ggagaaggaa89281 atggcaatgc cctccggtac tgttgcctgg aaaattccat ggacagagca gcctggaagc89341 tccatggggt cgcgaagagt cagacacaat ggagcgactt cactgtctta agggccacct89401 gaggtcctca ggtttcaagg aacccagcag tggccaaggc ctgtgcccat ccctctgtcc89461 acttaccagg ccctgaccct cctgtctcct caggcttcgc ctacttcctg cgtggccgcc89521 tctactggaa gtttgacccc gtgaaggtga aagccctgga gggcttcccc cggctcgtgg89581 gccccgactt cttcagctgt actgaggctg ccaacacttt ccgctgatca ccgcctggct89641 gtcctcaggc cctgacacct ccacacagga gaccgtggcc gtgcctgtgg ctgtaggtac89701 caggcagggc gcggagtcgc ggctgctatg ggggcaaggc agggcgctgc caccaggact89761 gcagggaggg ccacgcgggt cgtggccact gccagcgact gtctgagact gggcaggggg89821 gctctggcat ggaggctgag ggtggtcttg ggctggctcc acgcagcctg tgcaggtcac89881 atggaaccca gctgcccatg gtctccatcc acacccctca gggtcgggcc tcagcagggc89941 tgggggagct ggagccctca ccgtcctcgc tgtggggtcc catagggggc tggcacgtgg90001 gtgtcagggt cctgcgcctc ctgcctccca caggggttgg ctctgcgtag gtgctgcctt90061 ccagtttggt ggttctggag acctattccc caagatcctg gccaaaaggc caggtcagct90121 ggtgggggtg cttcctgcca gagaccctgc accctggggg ccccagcata cctcagtcct90181 atcacgggtc agatcctcca aagccatgta aatgtgtaca gtgtgtataa agctgttttg90241 tttttcattt tttaaccgac tgtcattaaa cacggtcgtt ttctacctgc ctgctggggt90301 gtctctgtga gtgcaaggcc agtatagggt ggaactggac cagggagttg ggaggcttgg90361 ctggggaccc gctcagtccc ctggtcctca gggctgggtg ttggttcagg gctccccctg90421 ctccatctca tcctgcttga atgcctacag tggcttcaca gtctgctccc catctcccca90481 gcggcctctc agaccgtcgt ccaccaagtg ctgctcacgt tttccgatcc agccactgtc90541 aggacacaga accgaactca aggttactgt ggctgactcc tcactctctg gggtctactt90601 gcctgccacc ctcagagagc caaggatccg cctgtgatgc aggagtgagt gaagtcgctc90661 agccgagtcc gactctttgc aaccccatag gactgtagcc taccaggctc ctctgtctat90721 gggatttttc aggcaagagt gctggagtgg gttgccattt ccttctccag gggatcttcc90781 caaccctggt ctcccgcata gcaggcagac tctttactgt ctgagccacc aggcaatgca90841 ggagacctag gttcagtctc tgggtgggga agatcccctg gagaagggaa tgacaacctg90901 cttcagtatt cttgattggg gaatcccatg gacaaaggag cctggaggcc tacagcccat90961 agggtgcaaa gagacacgac tgagcaagtc acacacacag agccctacgt ggatgctcat91021 agcggcacct catagctgcc atgtatcagg tgttggcatg ggcagccatc agcagggggc91081 catttctgac ccactgcctt gttccaccgg atacacgggt gccttcctgt gtgtcgggcc91141 cactcggctg tcagcgccca agggcagggc tgtcgggagg cacagggcac agagttaagg91201 aggggatggg gacgttagct cctccccagc tctcagcgga tgcagcaggc aaaacaaacg91261 ctaggaatcc tgccaaaccc ggtagtctct gcccatgctc gccccatccc cagagccaca91321 agaacgggag ctggggggtg gcccggagct gggatactgg tccctgggcc cgcccatgtg91381 ctcggccgca cagcgtcctc cgggcgggga aactgaggca cgggcgcctc cggcttcctc91441 cccgccttcc gggcctcgcc tcgttcctcc tcaccagggc agtattccag ccccggctgt91501 gagacggaga agggcgccgt tcgagtcagg gccgcggctg ttatttctgc cggtgagcgg91561 ccttccctgg tacctccact tgagaggcgg ccgggaaggc cgagaaacgg gccgaggctc91621 ctttaagggg cccgtggggg cgcgcccggc ccttttgtcc gggtggcggc ggcggcgacg91681 cgcgcgtcag cgtcaacgcc cgcgcctgcg cactgagggc ggcctgcttg tcgtctgcgg91741 cggcggcggc ggcggcggcg gaggaggcga accccatctg gcttggcaag agactgagnn91801 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn91861 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnct gcaggtgccg gcggtgacgc91921 ggacgtacac cgcggcctgc gtcctcacca ccgccgccgt ggtaaccgcc cccgggggtt91981 gccaaggtta cgattggacc ctccccgccc cgaccctgct cccctagggt gggtgggtcg92041 gggggcagtt tctaagatct cctggttccg cagcagctgg aactcctcag tcccttccag |
92101 ctctacttca acccgcacct cgtgttccgg aagttccagg tgaggccgcc ccgccccttg92161 cacttgctgg cccaacccct cccgcccagc gctggcctga ccgcccccca ccccgcccac92221 cccacgcagg tttggaggct catcaccagc ttcctcttct tcgggcccct gggattcagc92281 ttcttcttca acatgctctt cgtgtatcct gcgccgtggt ggaagcggga ggagggcggg92341 gcgggggacc gggcgggagg cagcgggccc cgggaagctg agaccctcca aggggcacgc92401 ttcctatacc aaagccgcag gttccgctac tgccgcatgc tggaggaggg ctccttccgc92461 ggccgcacgg ccgacttcgt cttcatgttt ctcttcgggg gcgtcctgat gactgtatcc92521 ttcccgggct cggggaccta tgggtccggg cctctgctgg ccctgaggcc ctgcttgagc92581 gcatgccaca gagggagagt tgcgaccccg agctgagggt gtttttgagc gtacatcacg92641 tgctcagctg caggtgcccc tgtcgaactc cagggctaca cccaaaatac cacagggcag92701 ggtgcccagg ggctgagtcc tgaatgcagg tagccaggag gatctagggc tgggcccggg92761 ggctggggtg aagtggagag gcagggccga tcagggggcc cctggaggcc accgtttggt92821 cttagagtgg gaagcgaaac caacctgctt gagggtttca ggggtttagg aagtcagagg92881 ggccctgggc agggcacaag accttgactc tggcccagct actggggctc ctgggtagcc92941 tcttcttcct gggccaggcc ctcacggcca tgctggtgta cgtgtggagc cgccgcagcc93001 ctggggtgag ggtcaacttc tttggcctcc tcaccttcca ggcgccgttc ctgccctggg93061 cgctcatggg cttttcaatg ctgctgggca actccatcct ggtggacctg ctgggtgagc93121 ctgctgtcca gggagcctgc cccaagctgg gtgtgctggg ccagagccct ggtcctctcc93181 ccgcccccac ccctcttccc cactcctggc gcccccatcc ttccagcccc tccaacaagt93241 cagcctatag gttttactta ttcgagcctg acccatttgc tgacgcttgt gtggggcccg93301 acccggtagg gatgggtggc tcagggtgcc tgctcacagc tccacttctt ctgacgtcct93361 caggcctgac ctcctcccag gttctgccta ctctgggcca agcctggccc cacgctgggc93421 tggctggccg tgcagggcat cagaccccca tgctttgggg gcttcagggc tgtggagggt93481 ggcctcggca ttggcgcctc tcccacaggg attgcggtgg gccacgtcta ctacttcctg93541 gaggacgtct tccccaacca gcctggaggc aagaggctgc tgctgacccc cagcttcctg93601 tgagtgctga cagccttccc cacccccttc cccagatggc tctctacccc atgagggggg93661 gggaccctgc cagctgccgc tcagcgtggg ctcctcccca caggaaactg ctactggatg93721 ccccagagga ggaccccaat tacctgcccc tccccgagga gcagccagga cccctgcagc93781 agtgaggacg acctcaccca gagccgggtc ccccaccccc acccctggcc tgcaacgcag93841 ctccctgtcc tggaggccgg gcctgggccc agggcccccg ccctgaataa acaagtgacc93901 tgcagcctgt tcgccacagc actggctctc ctgccgcggc cagcctctcc acgcggggca93961 ggtgctgctg gccgagagcc agggccacca agcctgacgt gctctccgac ccagaacatt94021 ggcacagctg gaggcccaga gagggtccag aacctgccca ctcgccagca gaactctgag94081 cacagagggc agccctgctg gggttctcat ccctgccctg cctgtgccgt aattcagctt94141 ccactgatgg ggctcacatc tcaggggcgg ggctgggact gggatgctgg gttgtgctga94201 gctttggccg tgggggccct cctgtcccga actagcaacc cccaagggga cctctgcttc94261 atttcccagc caggccactg aaggacgggc caggtgcaga agagggccag gccctttctg94321 tgactccgaa gcctcaagtg tcagtgtttg cagagtccag tggctgaggc agaggcctct94381 gggaagctct gcccctgccg tttgcagctg aggccggcag gagcctcacc tggtccccag94441 ctcacgggca ttggaggacc agtccgcgcg gtggtttact cctgggtcgg caccagccgc94501 cgccggctgt ccctttcaca gaggataaaa gtactcgctc tggagttggt ctttaatgtt94561 gtcatgaaac ctctggccca gcagcgggct ccgcagtggg tggcaggtga aggcccctcc94621 ccgggcctct ccaggcaggt gccgcctggc cagcagggaa ggcaggcagt gtcatccccc94681 actggctctg gggctcaggc tacctcctgc tgtggccgga acatctcccc cagtggtgga94741 gcccagtgtc cgtgaggcca gctgggcctg aaaccttcct ctctgaagcc ccgctgtccc94801 cttgccctgt atggagggca gaggctggag cgcaagttcc taggatgtgc ttgcgagacc94861 cccgagccca ggggcgaggc ccatctcagc ccacccccga actggaaacc cttggagctc94921 tgcccctcgt ggtgtgaggc ccctgctatg cgaccctcag ccctgccagc aacggaaggt94981 gcagggcccg ggcccacggg cttaacgcaa ctgggcctgg gtcacctgcg gggcctggtc95041 ccaggaggaa gacccaggtg ccaccctcct gggtgccacg tccaggtcac gtggggaccc95101 gtccatgtca cagaagatgc agggtcaccc ggtgagctgg cgccgggccc tgccagagca95161 ccagccgcgg gtggaggtgg gccccagctc tcctgtcagg cacgtggtgc tgggaggtgc95221 ggccggagca gtgcccacca gctgcagcag gacaggtggg cacaggccca ccagcagtgc95281 ccgcacggga tgggcccctg caagggccag agaagccacg ctcctggctg ggggctgggc95341 tgggactgac aggtggccct gccctctgcg ccccactact tcccagccac ccgggactcc |
95461 ggaggggcgg tccacagggc tgagccctga gctgaaccct ggccctgctc gtggttgtgg95521 gggtgggggg gtccagtggc gccctagccc tgctgaggcc cagctgggac gtgcgcgccg95581 gagggcgagg ggccagccca tgccatgctg tcccccgttc tcagctccat gctaccactt95641 tgaagaaaca gaacctgttg cctttttatt tagaaagtgt tgcttgccct gcctggggct95701 tctatacaaa aaacaaacac agctcaacgt ggcctctcct gaccagagac gggcggtggg95761 gactggggct cagcagacgg aatgtgtccc cggcggcggg agaccaggag gcccctggcc95821 cgctcctcag gacggctggg ctgtccccac ctggtcccct ccgagccaga agatggagga95881 gaggtgggct gatctccaga tgctccctgg gagccaagcg ccacggggtg gtcaccaggc95941 cggggccgtg ttggccagac gcctcatccg cctgtgggag ggggagggca gcaacccccg96001 gatctctcag gcaaccgagt gaggaggcag gagcccccag cccctccctc ggccgctctg96061 ctgcgtgggg ccctgaagtc gtcctctgtc tcgcccccct ccccagggag agtgagcctg96121 ttctgggctg tggtcagacc tgcccgaggg ccagcctcgc ccggggccct gtcctgcctg96181 gaaggggctg gggcagcacc ttgtgttccg gtcctggtcc cggatcttct tctccatctc96241 tgcatccgtc agggtctcca gcagcgggca ccactggtca gcgtcgcctg tgttccggat96301 ggcaatctcc accgtgggca gggggttctc actgtggagg acgagagagg tagacggctc96361 acagagcagc tgcaggagag gcccctagaa ggcagtgtcc accccgctgc gggcagacag96421 gacatggagc ctggtttctg cacccggctc ccgacacagg gcggccgggc acgctgccaa96481 catggcatct ccgggtctgc atgtggggag gggtccacag gacagtgctg caggtccagc96541 cattcccagt ggacttgctg ggaggaggag ggccgtccgc cccgctcagt gtccaggaga96601 aaggagagca aaggagtcca tccacccagg agtggagtcc cagggcccct gccctgacca96661 gcctgcaggg ggcccctcgg cccacatcac aggggcccag aatccataag ccctgactgc96721 tccaccccgg ggcccctcaa agacgcgcct agactccgtc cgagggccac ctgcacaccc96781 tctggcgaag tggactcagg gctgggggtc agcctcggtg aggccgcaaa ggctggggac96841 tcctggccga gctgctgcct ctgccaggag ccaggcccag cctgccggcg agcctcagcc96901 acgccctcac ccaccctgcc cgcggcgcca cgctggcctc cgggtcctct cctctggcct96961 cctgctgggc cactggtgct cagccccagc agtcggcctg ccaggagccc tgcagagtca97021 gcccccagag ggaggagggg gcccggggga acagcacagg aacaaacaga cccctggcct97081 tagttttagc tcctcatctg gaaaatgggg acagtgtcct tgctgcgagg ggtttcagag97141 gaccactgcc atgcaacacc cagcacacac ccactgcgtg ggggctcggg cccgagccgg97201 tgcccccgag tcccaggctg gtggctgggc cgccccagcc accctgccga cagctgcttc97261 ccagccgggc ggtgctgcgg cagtccagaa gccagcactg cagacccaaa tgtcactcct97321 cacgttgcgg gctcccagct gccttccttg ggggcagcag acacgaaagt caccaagccc97381 acgccgacgg gagcaaacac gtcttcctct taaacaagtg cgggtcccgg aggccctgtg97441 tttacctccc tgtggctccg ggaagattgc atcccagggg gttgttctaa accaagggct97501 gctcgggcca ggcctggaag gaggggcctg gagccaggag cccaccctta cgggcattcg97561 gcttcctggg tctcaaggcc ggctgggacc ctgcattccc accacccgcc aggtgcaagc97621 agggaggccg tgtcggagga ggcagagggc ctggagggtc gtcttcgacg tgacctcact97681 tttacaacct cacaggtgcg gcaggccagc tgggaggcat ggctgtgccc tcctggtaga97741 tgagaacaag actgcaggga gtgatccccc tgaacttccc caaccaggag gagacaaaac97801 tcggtgtcgc cctcctgctt aagatcaact gactctggac aaggggccca gcccacccga97861 tggggaaagg gcagtccttc caacaagcgg tgctgggacg ggacccggca ggccatggtt97921 tctcagctat gacaccagca gcacaagcac cccgagaaaa acagctaagc tgggcactgt97981 cacacaagtg aactccaaac ccaagaaaac cacaaaaagt ctgcggatct tcagatatgt98041 gggaagggac ctgtatctgg aatgtataac gaactcctga aaagtgaaag tgttagtcac98101 tcagtctgtt cagctctttg caaccccatg gacggtagcc tgccaggctc ctctgcccat98161 gggattctct aggcaagaat actggagtgg gttgccatgc cttcctccag gggatcttcc98221 caacccaggg attgaacctg tgtctctctt gcactggcag gcgggttctt taccagtagc98281 gccacctgag tagaaacact ccaggtgccc tgagtgtcag agcaggaggg actcggccca98341 ggcctgtgag gggaccctct ccgagtcccc tgctgcacag cagtgagagg tgcgttctga98401 gtcagcctcc agggatgagg gacttggtgt cgacatcact cccaggacct caggatctgc98461 tctgggaagc gaggctcccc aggctggccc caggcccgct ggcctcagct cgtgagccgt98521 gcgtggacag gtgccatgag caggcctccc acgggactcg gggcgcggcc tggaccccgg98581 ggctgccagt ggtcgcgggg ggccccgtgt ggcggctgtt ccctctcttg ctccgagtcc98641 taggaacatg gtgggcgctg cctcctgggg tttctggaga agcagctgag atgcaaacag98701 ccccacgcgc tccctcagct gttccctgtc acgggtggcc ccttggtggc ggcctccatg98761 cagggacggt gacagctcga gcagccgcgt aaaaccacac ggggacggtg gcagctcgag |
98821 cagccgcgta aagcctgaca tccaatttgg aagcctcccg cagtggaaga ggggcccggg98881 gacggggctg cccggggcga gctccaccgg gtcgggggtc acgaggagcc cacccgcgtc98941 cccgccacca gcacctggga ccagataccc tccccgctct gagggcggcc tgaacgccgc99001 cccctcccac gggggcgccc accgcctgct cgtggactga acaagaggcg gcagtggcct99061 ccagaccccc tcgggggagg gcagacctgt ccgagactga gcacaagtcc agggaatgag99121 caagggtctc agtaatgtcc ccaccgggac gggacgggag gaggcgacag aggccgctga99181 ggtgcggggc agccctcagt agctggcatc aaggccccag gcagtcccgg ggcatccccg99241 cagggggcgg gggcgaccac cggcccgagc ccaggcagtc ccggggcatc cctgcagcgg99301 gcgggggcga ccaccggccc gagccctacc tgaaggcgta ggtcttctga tgccagctca99361 gctgtccccg gatgctgtag gcgatggtgg tgacgaactc cccgcccagc cccagctcgg99421 agcacagctt cagagcgaac ttctcgggcg agttctcctt ctccgacatg tcccactcga99481 actggtccac caaggagatg ttccccacgt ggatgttcag ctggcccggg agcacagaca99541 tgagccagag cggccccctc tggggccagg ccgcaccctc accacccctt ctccccggaa99601 catccccgcc tcgttcttgg ccgcgcccct gtgctgctac ttggggtaag gaaaacaacc99661 cccatctctc tgaaaagggt taactagcga ggaagatgcg ctggtaactg gaaaactccc99721 tacaaagaaa gcttggatct gatggcttca ctggtgaatt ccaccaaaca tttcaagcac99781 taacaccaat ccttatcaaa tcctgccaaa aaactgaaaa ggaaggaaca catcataact99841 ccctgccttg ataccaaagc cagacaaaga tactacgaga aaggaaaggt gcagaccggc99901 acttactgtg gacattgatg tgaaacctca gcagacacga gcaaaactac attcaccagc99961 acgtcagaag aatcacacac cgttataaat gatgggatga tgacacaacc acattataaa100021 cggtggggct tactctggtg atgtaaggac ggctcagtaa gaaaaccggt caatgccatg100081 aaccacttga acagagtgaa ggacaaaaac cacacagtca tcttgataat tggaggaaaa100141 tcattagaca aacttcaacg tgctttcacg ataaaagcac tcagtaaact aagatcagat100201 ggaaaccaca tcaacaagat taattcagtc aaaaaattca ctgcaagtat cacccacaat100261 ggcagaagac tggtaacttt tcctctaaga tcaggaacga gccaaagata cccagtcttg100321 ccacttttgt tcaatatagc gttggaattt ctactcagtg cagtgcagtc gctcagtcgt100381 gtccgactct tttcgacccc atggatcaca gcacgccagg cctccctgtc catcaccaac100441 tcccggagtt cacccaaact catgtgcact gagtcagtga tgccatccag ccatctcatc100501 ctctgtcgtc cccttctcct cctgcctcca atcccttcca gcagttaggc aagaaaaata100561 aatcaaaggt atccacctgg aatggaagaa gtaaaactat ctctggtccg agatgttaca100621 atcttatatg cagagtttaa gatgctaaca aaatactatt agaactaatg aatgaattca100681 gcaaggtacc aggatacaaa gtcaacgtgc aaaaatcagc cgcatttcta catgctaaca100741 ctgcacaatc tgaagaagaa aggatgaaca aattacaata acataaaaaa gaataaaatc100801 cttagaaatt aacttgatca aagagatgta caatgaacaa tataaaacat actgaaagaa100861 attgaagata taaataaatg gaaaaacatc ctatgtccat ggattggaag acttaaaatt100921 attaagctgt caaggctatg gtttttccag tggtcatgta tggatgtgag agttggacta100981 taaagaaagc tgagcaccga agaagtgatg cttttgaact gtggtgttgg agaagactct101041 tgagaggtcc ttggactgca aggagatcca accagtccat cctaaaggag atcagtcctg101101 ggtgttcatt ggaaggactg atgttaaagc tgaaactcca atactttggc cacctgatgc101161 gaagagctga ctcatttgaa aagaccctga tgctgggtaa gattgagggc gggaggggaa101221 ggggacaaca gaggatgaga tggttggatg gcatcaccga ctcaatggac atgggtttgg101281 gtggactctg gaagttggtg atggacaggg aggcctggcg tgctgcggtt catggggttg101341 tgaggagtcg gacacgactg agcgactgaa ctgaactgaa catgaatacc caaagcaatc101401 tacaaagcca aatgtaatcc ctatcaaaat cccaatagca tttctgcaga aacaggaaaa101461 aaaatcttaa aattcatatg gaatctaagg aaaagcaatg gatgtctggt caaaacaatg101521 acgaaaagaa caacaaagct ggaagactca cacttcctga tttcagaact tactgcaaag101581 atacaataat gaaaacactg tgggactaac gtaaaagcag acacgtgggc caacgggaca101641 gcccagaaat aaactctcaa ataagcagtc aaatgatttt caacagagat gccaagacca101701 ctcagtgaag gaaagtgttt gcaaccaacg gttttgggaa aaaagaaccc acatgcgaaa101761 gaatgaagtg ggacccttac ccagccccat ctacagaaat caactcaaaa cagacagaac101821 atatggctca agccataaaa cgctcagaaa aacagagcaa agctttatga tgttggattt101881 ggcggtgatt tctcagatat gacgtcaaag gcataggtga taagcgaaaa aataaactgg101941 acttcaccaa aatacaacac ttctatgcat ccaaggacac taccgacagc ataacaaggc102001 agcccaggga aaggaggaaa catccgcaaa tcacagcatc tgggaacaga ccgctgcctg102061 tgagatacag ggaaccgata aaaacaagaa aacagcaaaa cccggactca aaaatgggaa102121 ggactccagc agacacagga gacagacaag ccgccagcag gtcactaatc agcaagcaag |
102181 gcccgcaaag gcccgtatcc aaggctgtgg tttttccagt ggtcatgtag gaaagagagc102241 tggatcgtaa gaaagctgag cgctgaagaa ttgattgaac tgtggtgttg gagaagactc102301 ttgagagtcc cttggactgc aagatcaaac cagtccattc tgaaggagat cagtcccgaa102361 tagtcactga aggactgatg ctgtagctcc aatactttgg ccacctgatt cgaagaactg102421 actcattggc aaagaccctg atgctgggaa agattgaagg caggaggaga aggggacgac102481 agaggatgag atggttggat ggcatcactg actccatgga catgagcttg ggcaagctcc102541 gggagagagt gaaggacagg gaagcctggc gtgctgcagc ccgtgggtcc caaatctttg102601 gaccaagcga ctgaacaata acaaatcaac agggaaatgc aaatcaaaac cacagtgaga102661 tactgtccac caccaggcag gcgttcttca gcggggttcg gggcaggtgg tgccctcttc102721 tctcgtaacg cccccaggac cgcgggggct gctgagacag catggggtgt gcttggccta102781 gcctgcccat gacaagagtg gcagtgtgct cgcctcactg cgcccttccc tgctctgccc102841 accagctggg ccacccctgg gaccacccag cttccgctcc gtggacggca aggccgcagc102901 agcgcccgga cacgcccaga acgtggtgcc ctcctcagaa gtcggcctgt gcccttcctg102961 ggacaagccg cccaagagac agtcttccag agccctgccc cacaacacgg accccagaca103021 ggctcctgtg gaggcctcca cgcacctccg cacctcgcaa gccccgagga caaggcaggc103081 ccgctgcggg tgaggagccg cctaccttga taatgacgcg ctggtctgac tggtcttcca103141 ggatgctgtc cgtggggtag gactcgatct gctgtctgat ggcagaggca atggctggca103201 cgaatgtcag tgggttcaga tccaggtcgt cacagagaat ctctgagaac atctccgggg103261 tcatcagctt ctctgaaacg atgacggagc gggggaaccc ccagtggacc acagggccta103321 cggtcagcgt gctcagcccc ggcctccccc agccttgcct cctctgccac cgcccccccg103381 ggtgacgaca ggaccccctg gcagcacgca gacagagctg agtgcacgcc agccagggcg103441 gcggacggac cattcatgtt ccaggtaaag gcatcccgca gcttctgccc gtcaatctcc103501 atgtccagtc ggatggggac cagcacctcg ggctgggacg cgttctcgtg gatcacggct103561 gggtcgtggt cgtcgaagct ggaaggggag cggccgcgtg ctcagcaaag cgggctgggc103621 ccctgtgccc agggcctccc tctctgcacc actggtcgct gagacctgcc cagagaggac103681 ctgtccacta cgggccgggc cggcagaaac agggctggcg ggggtccacg cggggcggga103741 ggggagctgc cgactcggca gcgggacaag ctcagaggtt ccctgcagga agagaggttt103801 aagccccaga gcaggcagga ttctcccagc agctgtgggg aagaaagggt atgtccagaa103861 gaagaaaccc tggaacaaag gccgaggggc aggagggttg aggagctgct tggagagcag103921 tgaagggggg ctgggcggct ggggggtgct ggggagcctc ggtggccaag cacccagggc103981 tccccacctg cagcctggac cccgagggag ccccagagga cggagagcaa ggcagctccg104041 cactcacacc tgccctttag gatggggaag agggaagaga cgggggctgc ggggggcaag104101 gaaaccaggc acgccccgct tagacccggg ggcgagaacc actttccaag aacgcagggg104161 cgccaatgat gaacaatggg tagcagcccg caggcgggag gcccggtggc cgaggcccct104221 caccagagcg ggaaggtccg cttcttgtcg cggcccatgc ggttcctgtt gatggtggtg104281 gagcagggca cggcgtccag gtggtgcgag ctgttgggca gggtgggcac ccactggctg104341 ttcctcttgg ccttctgttc cctgggagac acagacgccc gtccgctcag cctatgggcc104401 aaaagccgcc ccccagccgc caggttgtgg ccagtggacg cccgccatgc ccctctgggc104461 ccaggccccc atggggacct ctgtgcgccc agctccgcgg tggttattcc ccaggctcca104521 agcggcacct gctcggggtc accagtttta ggggaggagg agagggcagg ggccccagcc104581 cagtctgtga gctgtcaccc ccaggctcca agcggcacct gctcggggtc accagtttta104641 ggggaggagg agagggcagg ggccccagcc cagtctgtga gctgtcaccc ccaggctcca104701 agcggcacct gctcggggtc accagtttta ggggaggagg agagggcagg ggccccagcc104761 cagtctgtga gctgtcaccc ccaggctcca agcggcacct gctcggggtc accagtttta104821 ggggaggagg agagggcagg ggccccagcc cagtctgtga gctgtcaccc gtgctatgtg104881 ctggctgggc actcaggaaa gagggtcagg gttcacgggg gggtggcgcg cagattttcc104941 aggagagccc cgagggcagc agagaggagg ctcaggtcaa tggttgggca gggggccagg105001 gctggagaca cagagagggt cccgattcgg gggggtgccc tcagcaggtg gctgggagtc105061 cctgggggtt tgcacacttt cgatcaggct gttatttcag acgcttggtc cagcctgaga105121 caggtaatgc ctctggcctc cgggccttca gggatggaaa gatactctag aaagcgggac105181 tcaaagtaac tcaaggaact cgcgtcccac agtggggagc ccttctctcc aatttacatg105241 gggcgtttac tacgaggaaa ataccgaagg ccgttttgag ctgaggctcc cgggccgggc105301 tgtccgtttg tgagactgct cgtcacccct gggccacatc cctggtggcc aagggggcaa105361 tcagtgcggt gactgcacga cacacctctg cagccctgcc ccacagctgt caccatcggt105421 gacgtccacc ccctggagaa cctgaccact gcccggtttc ccgctaaaac agcgcccttc105481 caggatgggg ggcagaggga gaggccttgg ccttttcact cctcttctgc agcgggggcc |
105541 cctcgcaccc cagtgcccgg gcccaggagc gccccttggg gtggggcagg gagggatcca105601 cacaccaagg ggagccagga cccccccaaa tctgctgccc tgccctgata cccgagacct105661 ggggaaacgg gggactgggg ctgatgcggg caggaccaag aactgaggcg gtgagacggg105721 gtccccacca caggccatct ggctggcagt ttctactccg ggcctgcagg ccaagaggga105781 aaaggtgccc cactcagatc aggcgcctcc cgtccccagg gagggcctac aaggtcagat105841 cctttgtaac ttccacgggc aaaactggct tgctgggcct gtgcgggccg catgggcgtg105901 gaccaccaca cctttcccca ctgagtctcc agccggagct gtcacccagg tccccccagg105961 ccagccccac cccgccacct tgcagtagcc tctcgtatcc aggccgaggc tgcccggtcg106021 acccctcctg cctgatggcc tcaagtggac aatgcgagtc acgttgcagc acgtgagtgg106081 gacgggcagc gccacgcggg gtccgggcat ccgagtccca ccactcagcc tcccttccgc106141 tgcagagagg tctgtccaag agccctgggg gccatccagc ccctgtccga cctggccggt106201 gtggaagagg gggtgtgcca cccctcctgg ggggctggct gggcgctggg caggcccctc106261 ctaagagtgg agcccactgg tggttttcct gcagccccac ctccacacag cagttctcac106321 tgcccagtaa caggaggcta ctggcctagc tctctccctc gtgtgatgga ctcaaccagg106381 agcgttcacg gccccacaca gggttctcgg ctgctgcatg aggatctcaa agccccatcc106441 acgtgcatgt aatctcctcc ggtaacttct ctagggaagc ccggctatcc tgccatcctc106501 accgcaccac cagggcgaga aaagccatct ccagcgctca catccacaat gggccaggcc106561 gtgagcacac caccttcttc gggaggttgt gggggcgggn nnnnnnnnnn nnnnnnnnnn106621 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn106681 nnnnnnnnnn nnnnnnnnng cgcgcccccc ccccccgcgg cgccggcacc ccgggcggcg106741 gcccccggcg ctgggagcag gtgcggggcc gcggccgctc gtgagcctcc agcccggagg106801 acgggccccg ggggccggcc cggtgcccag gccctgggag ccccggaggc cagagtgcca106861 gagggccgga ggacccggga aggcccgaga gaggtgggaa gcacggggtt ccagccctag106921 gccatttcag ccccaaagcc atcggtgaaa ccattgctgg ccccagataa aagcgtcgcc106981 aactttttca ccccggcgga gactttagcg ggtagctgcc ccctaggggg aatggaaaaa107041 ccaggattta ccaggtgggt ggaggtcaca actgcccaga tcctgagaaa gaggggtcag107101 tggggcggga agattagtgg ggagaggagc tttcagaacc caagggaatg aaacgaggct107161 tgaggttggt tatccagcag ccgccccctg ccccgtgagt gagcgaaggc tgggcccctt107221 attgtcacat cttccagctc ttcgctagaa aacctagagt tttaaatact gtggcagctg107281 agtcaaacaa taaggaaaag cccgactctt tgagagccag gcacaaggcg tctgtgacag107341 ggtctccagg ctgcccattt gcagtctctg aaacggaggg tttttcgaga aggaggtctt107401 ggggtgcctg cctgaattgg aggggggggc gcgggaagtg aggacccaga agagagggct107461 tggcccgctg caaggaggtc actggacact ggagctgaag cgccagccga aactggaaac107521 tcgaaatctg tctccgtgcc agccacaagg cctatgattt tccttggcga cgttcagcat107581 cttaggagga gctggcgggg gaggcgggta gttcgtgggc ggttgcagca gggcaggaag107641 gtgaggaacc tgaggctggt cagagagctg gttggagtga tgcccatcgg tggacccgct107701 ggagaaggcc tgagtagaga aggtctaagc ttaacgggga aggggtgggc cagggtggaa107761 atggggtggg aagtttgagg agggggagca gtggagatgg gggttgtgag gaatgggagt107821 gagcttagac gtcttgagga tactgcagtt ctgtgctttt tttcacacct ggctgaaaat107881 tcactgaaaa caaaacaacc cttgctctgt gacagcctag aggggtggga gggaggctta107941 agagggaggg gacgtgcgtg tgcctatggg cgattcatgt gggtgtacgg cagaaagcaa108001 cacagtatgt aattaccctc caattaaaga tcaagtacaa cttaaaaacc ccaaacacaa108061 cattgtaagt cagctagact ccagtaaaca tttcagtaag aagattcaac tgggaatgag108121 ttccgccgtg actatcctga tgaatttccc gtgtcttctt gaggccattc ctctttgaac108181 ttccgtgttt ggggaagcgt gcctttgtat ggagtcctga ggagtaaatg agacgggctt108241 gtagaaggcc tagtagtgcc ttgcacgcgg cagatgctca ataacctcga gttgtcacca108301 ttatggtacc tcaagagtct ccttggagct tgcacggttt ctgaatgggg tcctgcgggg108361 ctcccttggg gctcccacat ggggttgggg ggctgagtgg ggtgtccccg ctccttgctt108421 gtcccctgtg gaacaccccc ttccacccga gcagctctgc ttttgtctct tgtgtttgtt108481 tatatctcct agattgttgt tcagtcgctc agtcgtgtcc aactctccga ccccatggac108541 tgcagcacac caggccttct gccttcacca tctcccggag cttgctcaaa ctcctgtcca108601 ttgagttgct gatgccgtcc aaccatctcg tcctctgtcg tccccttctc cttttgacct108661 cagtctttcc cagcatcagg gtcttttcca atgagtcagc tctttgactc aggtggccaa108721 gtattggagc ttcagcttca ttatcagtcc ttccaatgaa tattcagggt tgatttcttt108781 taggattgag tgacttgatc tccttgcagt ccaagggact ctcaagagtc ttcaacacca108841 cagttcaaaa gcatcagttc ttcggcactc agccttcttt atgatccaac gcccacatcg |
108901 gtacatgact actggaaaaa ctttggctca gagataattg acttgattga atacaaagtt108961 ctttggcaaa aaataaaagt gtggcaagca gtactgacac aaaagcaagt ggcttttcct109021 ccgttgagtc atttatttat tcagtgggtg tgtgcgtgta gagacggagc ggctgtgctg109081 ggagctgggg cttccacttc agaggagccc cggacctgcc ctcggggagt tcacaggcag109141 tgctgcgggg ggtcctgcca ggacgcctgc cctgcgagtg cccagtgctg tgatggatgc109201 gtgtcccgca tctgcggcca ctggggccac gtgcccgaga ttgtccgggt ctgagggtgc109261 agagaagagg aggcatttgg actgagtctg gaaaaatgag catgtggcca cgtgagaagc109321 cagtggtgag gggaccagtc aggcggagga aagagcggct catacgagtt gtggagctgg109381 aagcatgagg gtgtgtggaa gcagaggccg gggacagggc cgcagggccg gccatggagg109441 gcgtgggctg ctgcaggctc ctgagaaggg ggacgctgcc atcatgaccg ggtttaggtg109501 tttgaccctg gtgtccacgt agaggacaga tgtgtggggg gggagctgga gatgggcatc109561 catcgggagt cagcctggag agaggcagag accccgtcag tgggccctca ggacgtggat109621 ggggcggatg ttgggaagat ctgactcctg ggttccggct ggggctccgg gctggagggg109681 tgccgcccac cgagcacagg aggcaaacag atgccctctc ccagcaaggc cccagcccca109741 gcaccctccg gggccggact ccgcccctct tccagaatgg ctcccttgct gtcctcgccc109801 atctttccgg tgccctgagc ctctagagtc tggacaccag cgtccgcctt gcgcttgttt109861 ctgggaagtc tctggcttgt ctctgactca cccaggaccg tcttcgaggg caaggttgtg109921 tccttggttc catctgcttt ggggtccggc tcctcgctgc ttgacctgct gatgtgacag109981 tgtctcttgt tttcttttca gaatccgaga gcagctgtgt gtgtcccaga cagacccagc110041 cgctgggatg acgggcccct ctgtggagat ccccccggcc gccaagctgg gtgaggcttt110101 cgtgtttgcc ggcgggctgg acatgcaggc agacctgttc gcggaggagg acctgggggc110161 cccctttctt caggggaggg ctctggagca gatggccgtc atctacaagg agatccctct110221 cggggagcaa ggcagggagc aggacgatta ccggggggac ttcgatctgt gctccagccc110281 tgttccgcct cagagcgtcc ccccgggaga cagggcccag gacgatgagc tgttcggccc110341 gaccttcctc cagaaaccag acccgactgc gtaccggatc acgggcagcg gggaagccgc110401 cgatccgcct gccagggagg cggtgggcag gggtgacttg gggctgcagg ggccgcccag110461 gaccgcgcag cccgccaagc cctacgcgtg tcgggagtgc ggcaaggcct tcagccagag110521 ctcgcacctg ctccggcacc tggtgattca caccggggag aagccgtatg agtgcggcga110581 gtgcggcaag gccttcagcc agagctcgca cctgctccgg caccaggcca tccacaccgg110641 ggagaagccg tacgagtgcg gcgagtgcgg caaggccttc cggcagagct cggccctggc110701 gcagcacgcg aagacgcaca gcgggaggcg gccgtacgtc tgccacgagt gcggcaagga110761 cttcagccgc agctccagcc tgcgcaagca cgagcgcatc cacaccgggg agaagcccta110821 cgcgtgccag gagtgcggca aggccttcaa ccagagctcg ggcctgagcc agcaccgcaa110881 gatccactcg ctgcagaggc cgcacgcctg cgagctgtgc gggaaggcct tctgccaccg110941 ctcgcacctg ctgcggcacc agcgcgtcca cacgggcaag aagccgtacg cctgcgcgga111001 ctgcggcaag gccttcagcc agagctccaa cctcatcgag caccgcaaga cgcacacggg111061 cgagaggccc taccggtgcc acaagtgcgg caaggccttc agccagagct cggcgctcat111121 cgagcaccag cgcacccaca cgggcgagag gccttacgag tgcggccagt gcggcaaggc111181 cttccgccac agctcggcgc tcatccagca ccagcgcacg cacacgggcc gcaagcccta111241 cgtgtgcaac gagtgcggca aggccttccg ccaccgctcg gcgctcatcg agcactacaa111301 gacgcacacg cgcgagcggc cctacgagtg caaccgctgc ggcaaggcct tccggggcag111361 ctcgcacctc ctccgccacc agaaggtcca cgcggcggac aagctctagg gtccgcccgg111421 ggcgagggca cgccggccct ggcgcccccg gcccagcggg tggacctggg gggccagccg111481 gacggcggaa tcccggccgg ctcttctctg ccgtgacccc ggggggttgg ttttgccctc111541 cattcgcttt ttctaaagtg cagacgaata cacgtcagag ggacgaagtg gggttaagcc111601 cccgggagac gtccggcgag ctctaacgtc agacacttga agaagtgaag cggactcgca111661 gcccgtacag cccggggaag atgagtccaa agtcgagggt caccttggcc actgcagggt111721 cgctcggcgg tggggcggag cgggtgcagg agggctcctc ctgggcttgg ggtggcaggc111781 gaggaccccg cgcctctcag ccctcggcct gggttggctg agggcgggcc tggctgtagg111841 ccctccagcg gaggtggagg cgctgcccgg ctcagccagg cacaggaccc tgccacgagg111901 agtagccctc cgccagaccc ggcgtccagg ctggggcgcc tgcggggcct ccgttctgtg111961 gctgggcagc ctgcgccctg tccagggatg aaggggttcc ggtctgaagg gctgggttca112021 gggtccagct ctggcccctc ctgccttggt gtcctggagg aagccccaag gctccgtttc112081 cctctccagg aggtggggac gttgggaatg ccacattccc ctggggggtg tgtgtgtgtg112141 ttcaaggctc ccattcagac tgggactggg cactcacgag ctttggcaac tggcaactga112201 ggacggagac ccagggtgac accccacctc ctgctgcggc ccccccggca ggggagacac |
112261 aggcccgtct ggttcccaag atggcagggc ccctccccct ccagcttgtg ccctgggtgt112321 ggtgcctggg gctacagcga ccctttccgg ttccccgggc cagttcagct gggcatcctc112381 agggcggggc tctgagggtg ccatgtttcc agagctcctc ctcctcccac cagtagcagg112441 cgggcggcca gctcccaggc agccccctgg catcgcctag gtgcacacct gcccgctgtg112501 acccagcaag gcttgaaggt ggccatccca gttaagtccc ctgcccctgg cccaggaatg112561 ggctcgggca gggccgcatc tggctgcccc agaagcgtct gtccctggcc tctgggagtt112621 ggcggtggtc tctggtactg tccctcgcag ggccccttag cactgctcgg ggaggaggtg112681 ggctgaactg attttgaagt tttacatgtc tgcggccgca gtcctacgag cccgtcaggg112741 tcatgctggt tatttcagca gatggggctt ggctcggcag ctaggatggt cctgaataaa112801 aatgggaagg ccagagctgt tcctccatca gcaggcttgg cagctgggga cgttgaaagg112861 acaggtctgc tggtctgggg agaccagctc tgtgcagccc ctgctgtccg tgggggtact112921 aaaccagccc ctgtgtgcgc ccatctgagt ggcagcccgc ctggaggatc gcccatcact112981 tgtgagaatt gagagaatgc tgacaccccc gcttggtgca gggggacagg gccccctaag113041 atctacctcc ttgccccacc cccgggaccc cctcagcctt ggccaggact gtccttactg113101 ggcagggcag tcatccactt ccaacctttg ccgtctcctc cgcgcgctgt gctcccagcc113161 aaattgtttt atttttttcc aagcatcact ttgcacacgt caccactctc cttaaaacca113221 cccttccgga gtctcctgct cgtaaatcgc cggtttcagc caacctgggt cgccccccaa113281 gcccagcaag cctgctgagc cccgcgcctc ccagctactt cacgctcgcc tcaagcttct113341 aaacgcggac cttctccccc ccacccccat ccctttcttt tctgatttat gtaacacggc113401 aggtaagact cctctcctga agggttgaca gactcacaca aaaccgtggt cagaccaggc113461 aagtgctttt tttcagaagt gtgagcggaa cctagtcttc agctcatgct ctttccttgt113521 tttcttatgt gttctaagtc ctttgacttg ggctcccaga cagcgacgtt gtaagaggcc113581 gtcctggtag catttgaatt gtcctcgagt ttcgttgtcg gattttgttt tattgtctta113641 gttttccctt cttttagcag acgttgttga ctgtcgtaaa gctccagttc ttggttctgt113701 ttactaatca aattgttttg tcaaagtaca tgtattctgc tcttttcttt atcttttttg113761 ttgcttaata ttaacacttt acatttctaa gattaattat ttaggtaatt aataattttt113821 aacatttcta gtaaacgtgg gtacttgggt ctgtgtttgt tttcttgtag ttacagcttt113881 ttctgctcta tactgttgac gtctgggttt ttttttgctc ttaggaattt ccctttgacc113941 ccattattat tattttaatt agtatttttt aataattaaa aattagtgtt tttaaattaa114001 ccctaatcct aaccccagtg atgactgctt cagtcattgc tgttacttat tatgtgctgg114061 tgtcaggatt tttaagtgtc catagacatt ctctgagcct gaatatatta tcagttttat114121 acagcatttg tgtactctca agaaacgtgt tttcactctg tcagttcggt ttgttacctc114181 agtctttatg ttattttgct ccagtccgca cttgctctaa cttgtcttcc cttcgaggtg114241 tgaggacgcc tggcagccgg tgagcatgcc ggggtccggg gtcgtgggcc caggcgccca114301 gcaaagccct gtgggtgtgt gcacggctgg gctgctccgg gaggaagcct gtggccccac114361 ggtagttagg agcgctggtt tacctggtca caccacggtc tggttttgtg tgcttttccc114421 tgacgtgttt ctgttttgcc ttggtttcta ttctgtttta tgagtgccgt ttacgctttg114481 ttagtcatgc cgttatctcg atagacaggg tgtacgtgat caagtgatta ccgtatttgg114541 agcagatgtc tatttaacag agatgaactg agaacctgtg cctttgcatg ccctctttgc114601 ctcttttaat gcttctagct tcaacttctc ttttccaaac attataatgg aaaccccttg114661 cttttttttt tttaatttgc atttgcatga gagtttattt agctcggcat tttattttta114721 aaatttgtgt atatattttt gctatatatc tgtaacttat aaacagcaaa ttattggatt114781 ttgctttctg attctttctg taattcttct tacataagaa gttctcctat gagtaacatt114841 gctgtttaga gtgaggcatg atttatttcc agcttagtat gtattgggtc ggttaacccc114901 caaaggtcat gctcatcccc gccccatctc tgtgagttat tgtccgagtg tggagcgccc114961 tgtctaggcc gacgagagac ccaccatcgg gcacacctgc ccctcctggt ctggtcagtg115021 ccgggctctg tcctgagtcc actcctgatg tcacaggctg gtgcttcagc gacctcggct115081 gtgacacgga gggtgtgatg gcactgccca gccccatggg gcttggagga ctaaaggatg115141 cacacctgcc tggctgactg agggcacagg tgtttctcac actgtcagcg ttttgaaata115201 ttcctttgat tttctaccct aactcccaaa ggccgttcaa cataagctag aatgctacgt115261 ggtgcttgat tacattttag aaaagtttca gcaaatacca cgagatgcag caaagaacta115321 gacctcacag atcaggccgc ctgcataagg gagcccacac agtcgtggga gacggggacc115381 ctctcccacg tcctgtctgt cccaggatgg tcccctcacc cgccccctct ctcccctcgc115441 cctcctgtgg tgggggccgg ccaccatcac agctgcagag cctcaagaag ggggtcgccc115501 tggccactcc cgtggcagga gggacacgag ggcaggagct taccgcgggt gcagtggtct115561 cggatcagct cagctggccg ctgcggggtc ggggggacag ttcagtggga ggcaggagcc |
115621 cccactacag ctgccaggac ttctcagagg tgacaagggg gttcagtcac ctcagcccag115681 gtggaaacca aatggcctct tgcgcggctc ctggggccac gcggaggttc gctgggatca115741 caggtatctg gatgtgtgcg ccatggacat gcaccacctt cggggggtaa ggggtgggga115801 aaggcagccc ctttcttttg ggggaccccc tcttcagtgt ctgataacca ggaaaccaaa115861 tcagaaggtg gtctgggggt gctgagcagg gtgtctccta caccacaggc cacacactca115921 cacagcctcc aggactccag tggggctgag cgctggagac tcacccacgt ttgctacccc115981 cccacccaag gccatcccag aacagctgcc tgcgtcctca cggctggccc ctcccctctg116041 gtctaaccca gtgtgggtgg gccggcctgg ggtctccacc tgcctcctgc tgttccctgg116101 gctgctggct gtctgcagat gcggggccct ggcccggaga agccccatca gagcccagag116161 gacgggagtg gagcggggag gtgagccccg gagtctcgag gggccagagg caaaatactg116221 ggctgtgtcc ctggaaggca gtttcccatg aaaccttcaa tataggccgc cccagacgat116281 cagcctcatc tgctacgtgg attcctcccc gtagcgaatg gtgattgggt tctacatgga116341 cccgggactt ctgtttgaat tataatcttt cccccactgc ccctccaggg atctggaaaa116401 tggaggcctg ggctagacgg aagcttcctc caagattctt tattgaaggg attcgaagag116461 aaacaggtgg tcagtaatct gtgggggatg gaggggtgag cgctacgtgt aacggtttta116521 ctgttgctac gggaccagtt ttgatgtctt tccccttcaa gaagcagacc caaacaccga116581 gatgctgagg ttagcagcac agagcgggtt catccacaag gcaaccaggc agggagacca116641 gagacgctct ggaatctgcc tccctatggg cacgggctgg gtgctcacgg atgaagacca116701 agcagcaggt ggcgtggggc gtggggagcc tgcggaaagc gatggacaag gtgcgggacc116761 gcggtccgcg cggtggaccc aagctccgcc tctgcgctgc agcgcgagct gggggcggag116821 cttccaggga cccgcgaccg cgcccagtgg gagggtccgc ggtccaccca gtcctaacag116881 ctcagctcca gctagacgcc gctgagtccg gctttctaga gagcaacccc ggcgggtatt116941 ttatggttct ggcttcctga ttggaggaca cgcgagtctt agaacaccct tgattagtgc117001 gggcaggcgg aatggatttg actgatcacg atctgcagtt tcaccatctc aggggccgcc117061 ctcaccccca cctatcctgc caaagggggg gcctcggtgc tgagatcggg gccacacgtg117121 cactagacgg tcggtcagcg ctgctgctga gcggacccgg ggccatcctc acaccgccac117181 tggcccctgt gctcaataaa aggaaggaaa gcgggaaaag cgctttctgg ccgcggtggc117241 ctcgcgcgtt cctccatcgc catctgctgg cagagcccgg catggcaccc gctgcacaga117301 aacctcggtg tccgtttggg tgcaccatcc ttgaccccga gagagcaccc tccgtccaaa117361 atgaaaaaca gctgctccca agagtcatta taatcacagc caattgtgtt aattcgtcct117421 cggatccact cacagttcca cggaacattc tgctaacctc tgacaactcc tacataaagc117481 aatactgaga agaaaagaac gtggttgata aatacaaagg catacaacaa taaggagcaa117541 agaaaaaaga cagtcctcgc agttctgttt tgttcatctc tcatgagtag gatggcagat117601 aaaacacaga atgcccagtg aataatttta gtctaagtat gtccccaata ctgcctaatc117661 ttcaaatcta accttatttt taaaatatat attttttgct ggtcactcat cagttcatgc117721 accaaagcct ttgtttcttg actcctaact ttttgacccc tctggggtga ggagcacccc117781 taacctcgag agcccatcac acagtcccct tgggactaga cccttctttg cccatcacag117841 ctgaccggaa gggccagccc atggccagcg ctcgcgcccc ctggcggaca gactctgcgc117901 ggcagccccg ggagcccagg tgcgaccccg cggtctctgg cgccctctag tgtggaaaga117961 tctcctcctg gtgttcccag tcattgggct gtattttatt atagaagatg ctcgcgtgac118021 gatgatgatg gtcctttacc gggaggcacg tttggggcgc gtcggctcag gggccgagct118081 attagcctgc atcgcgccca caggcatcgc gtccccctga gccgggtcag ctgtgggctg118141 tcctgacacg ggtttccccc agtctctggc ccgctgtccc tcccaggtca gtgtccagcg118201 ttgcccttct ggttgtggac ttgtgcagcg gtctcagcag atggaggggc gaccctaaag118261 gatgtattga ggcatctcag cactgtcctc cgcccaggtt tgctggtcag cagtgaagtg118321 accgggaaaa ggggctgtct tggggtcctt tcagaggcct gggttagacc aaagttttct118381 agaagattca ccattgcagg gagtcaaaga caaaactagg gtggtcagca atctgtgggg118441 gattcggcgg tgagggaatt ctgaatgcta catgtatggt ttttactatt gttagggaac118501 atttttcccc cctacaaaca gcaggccaaa atactgagat gtcaggtttg catcaaagag118561 cgggttcatc cacaaggcaa ccagagaacg ctctggaatc tgcctccctg cgggcacagg118621 ctgggtgctc acggatgaag accaagcagc aggtggcgtg gggagtgggg agcctgggga118681 aagcgatgga caaggtgcga ggacctccgg cgcgagctgg aggcggagct tccagggaca118741 cgcggccacg cccagtggga gggtcagcgg tccatccagt cctaacagct cagctccaac118801 tagacgctgc tgagtctggc tttctagaga acactccggg cgggtatttt attgttttgg118861 cttcgtgact ggaggacgtt caagtcttaa aacacccttg attagtgcgg ggaggcggaa118921 tggatttgac tgatcacgac ccgcagtttc accatctcag gggccgccct caccccctcc |
118981 taccctacca aaggtggggg catcggtgct gagatctggg gtgacacata aaatcaggtg119041 aagtcttagga cagggggcc gattccaggt cctagggtgc agaaaaaacc tacctggccc119101 cgggctagac agcgtggagg gcgtggcccg ggctggtgca cagaagtggc ccccaactgg119161 tcagaaggtg tgggagccca gggctggtct actgcagaag gggtcgcctg gtggacagag119221 tggggcctga gtgcctgctg aagtggtccg tcagggctgc tgagcagaca cgggccatca119281 tcactggctc ctgtgctcga tagaagggag ggaaaccagg aaagcaaagg cgctttatgg119341 ccgcttttgt gtttcgcgtt cctctagcac cgtctgccgg cagaacgcgg cattacatcc119401 gctggccaaa cctcggggtc cggcttggat gtccccatcc ttgtctcgga gatctcacct119461 ctcagcagtt cccctgggga caatgtcgag aagatgcgac cttgacccgg agctcggtgg119521 agagggtgcc ctgggttctt tccgcagttg cttggagtgg aggtgcctca tgttgggctg119581 ggaacgggag gaaggaaaca ggtcatgatt gagatgctct agacagactg tccctgctct119641 tgccaaattt cagaagattg tctttaataa atattccatt ttttgtatgc ccttaggtct119701 atttccagac actttaaata tattgaaaga ctttaaatat ttatataaaa atattattta119761 tagactgtat aaaaggaaca gttagaactg gacttggaac aacagactgg ttccaaatag119821 gaaaaggagt acgtcaaggc tgtatattgt caccctgctt atttaactta tatgcagagt119881 acatcatgag aaacgctggg ctggaagaaa cacaagctgg aatcaagatt gccgggagaa119941 atatcaataa cctcagatat gcagatgaca ccacccttat ggcagaaagt gaagaggaac120001 tcaaaagcct cttgatgaag gtgaaagagg agagcgaaaa agttggctta aagctcaaca120061 tttagaaaac gaagatcatg gcatctggtc ccatcacttc atggaaatag atggggaaac120121 agttgagaca gtgtcagact ttatttttgg gggctccaat gaaattaaaa gacgcttact120181 tcttggaagg aaagttatga ccaacctaga cagcatatta aaaagcagag acactacttt120241 gccagcaaag gtccgtctag tcaaggctat ggtttttcca gtggtcatgt atggatgtga120301 gagttggact gtgaagaagg ctgagcaccg aagaagtgat gcttttgaac tgtggtgttg120361 gagaagactc ttgagaggcc cttggactgc aaggagatcc aaccagtcca tcgtaaagga120421 gatcaccccc tgggtggtca ttggaaggac tgatgttgaa gctgaaactc cagtactttg120481 gctacctaat gcgaagagct gactcattgg aaaagaccct gatgctggga aagattgaag120541 gtgggaggag aaggggacaa cagaggatga gatggttgga ttgcatcact gactcgatgg120601 acgtgagtct gagtgaagtc tgggagttgg tgatggccag ggaggccctg gcgtgctggc120661 ggttcatggg gtcgcaaaga gtcggccatg actgagtgac tgaactgaac tgatccagaa120721 atttaaaatt aatatataaa ccaaatccat gcagacaatt ataagcatat attataaatg120781 cataattata agcaagtata tgttatattt ataatagttt ataatgtatt tataagcaag120841 tatatattat tataagcata attgtaagta gaagtaactt tgggctttcc tggtggctca120901 gacagtaaag aatctgcctg cagtacagga gaccgggttc gatccctggt ttggggaaat120961 tccctggaga agggaatggc aaccaactcc aacatgtttg cctggagaat tccatggaca121021 gaggagcccg gaaggttgca gtccatgggg ttgcaaagag ctggatacaa cagagtgact121081 aacacatgta tataaataaa tttacctata tattgtatat atatttataa acatattcag121141 atattataaa taattagaaa catattatac atgtatttaa atactgttat aaacataaat121201 ttaaaaaata attttcagcc ctttggcttg ggggtgtgtt tgtggacgtc tttgtgctac121261 tgttcctgaa gtggagctct cccctcccaa accagctttt gaaatgactg ggaaagcaat121321 ggaatacata agcatcagga agatagcaac agagctgtca ttcttcacag agggtgtgct121381 tgagtgtgta gcaagtcccg cagaatgtag acagattata tagtctatta aaaaatagtg121441 tagcaaattt acgaggtgcg atttcaagta taaagactta ctgggtctct cagttcagtt121501 cagtcgcttg gttgtgtccg actctttttg accccatgga ccgcagcacg ccaggcctcc121561 ctgtccatca ccaactcctg gagttcactc aaactcatgt ccatcgagtc ggtgatgcca121621 tccaaccatc tcatcctctg gcgtcccctt ctcctcccac cttcaatctt tcccagcatc121681 agggtctttc ccagtgagtc agttctttgc atcaggtggc cagagtagtg gagtttcagc121741 ttcagcatcg gtccttccaa tgaatattct ggactgattt cctttaggat tgactggttg121801 gatctccttg cagttcaagg gactctcaag agtcttctcc aacagcacag tctatgaata121861 gaatagcaaa tgaatagaga ataacattta cgaggatata ttttaccatt gcataaaata121921 tatcagcttg tagagaacag acttgttccc aggggagagg gtgggtaggg atggagtggg121981 agtttgngat cancagaagc gagctgttat atagaagatg gataaaaagg atacacaaca122041 atgtcctact gtgtggcacc gggacctata ttcagtagct tgtgagaaac cataatcgac122101 aagactgagg aaaagtatat atatatgtat gtacttgagt tgctttgctg tacagaagaa122161 attaacacaa cattgtaaat cgatatttca atagaatcca cccccccaaa tatataagtt122221 tcctggagat ggagacggca acccactcca tttcttgcac ccaatattct tgcctggagg122281 atcccatgga tagaggatcg caaagactcg gacataaccc agcgactaac actttccctt |
122341 tcaaatgtgt aggtttacta gcgtgaatct acagagatgc ccaagacatt cgtttatgag122401 gaaaactcca cacgcagctt cactgagaat tattaaacct attaaaggga gagagcgcca122461 ggatattcat ggattgaaag attcgatgtg gtcaagttgc cagttttccc caaactgatt122521 ggtaaattcc ccaggagctg gctcaaggcg caaaattccc tttacctttt tttaagagac122581 gaagccaagg agccgattct ggttgagaga cgctcaggtc ctcctgcggg agagcagccc122641 tcttcctccc ggtcgcctgg gcagtttcga ggccacgacc agaaggactt ggctccctgt122701 gtcgcgcact cagaagtctc cctctccgtc ccaaggactc agaagctggg cgtcctgccc122761 gcagcagagg aggcagcctg gaggggcccc gcgggcacag cggtccgggt ttcagccgag122821 ttgcccgccc cgcccctcta cctgggcgct gccgcccggc tccggggccg gccgtgccct122881 ccgtggccgc aaggcgtcgc tgtccccccg ctggaagtgc tgacccggag gaaggggccc122941 agacggaggg actcggagcc tccgagtgac accctgggac tccgagcgct ggagcctggc123001 gtcaccccag gcaggggcag tgggggcccg gggcggggtc aggggcctcc cccggttctc123061 atttgacacc gcgggggtgc gctgggcaca gtgtccaggg gccacgttcc gagcaggggc123121 gcgatgcagg cccgggcgcg gcctgtcccg ggcgcgagtc cagctgcttt gcagaggtgg123181 cggcaggtcg cagtgaccct cacagagacg ccccactctg cggctccagg tgggcctgtg123241 ccccccagaa gtgctgacct gtgcaccggg aaggcacagg gccccccagc catgtctgcg123301 atggaagagc cggaaccgcg ccatgcccgt cctcgctgac cggcaggcac ccgccgtgtg123361 tccacacgct gagccatctg gctccccttg cttgacatac acccaggacc tgagtgtgca123421 ggaagttaga aggggcaggt gtggtgacac gatgccctcc agcatcacct gagaacctgg123481 acaaacctca ggggcccagc ctgctctgtg aggccccgag ggccggcccc tccccggacc123541 cctgccttga atccggccac actgcccgcc ttcctgctcc tgcggcttgt cagacacgcc123601 tgagcccagg gcctgtgcac tcgctgtccc ttctgccagg actgctcctc cccaggctct123661 tgctggggct ccccttcttc attcgggggt ggcctctctt gttcagtggc tcagctgtgc123721 ccagtctttg caaccccatg gactgcagca cgccaggctt ccctgtcctt cactagctcc123781 tggagtttgc tcaaactcat gtccattgag tcagtgatgc tatccaacca tctcatcctt123841 tgctgcccac ttcttctcct gctctcaatc tttcccagca tcagggtctt ttccaatgag123901 ttagctctct gcatcaggag gccaaagtat tggagcttca gcatcagtcc ttccagtgaa123961 tatgcgaggt tgatttccct tagaattgac tggttggatc tccttcctgt ccagagaact124021 ctcaagagtc ttctccagca ccacagtcgg agagcatcag ttcttcagtg atcaggtttc124081 tttatagccc agctctcaca tcggtacatg actattggaa aacccatagc tttgattaga124141 tggaccttca ttggcaaagt gatgggcctt cattggccct gctttttaat acaccatcta124201 ggtttgtcgt agctttcctt ccaaagagca aacatctttt aatttcctgg ctgcagtaac124261 catccatagt gattttggag cccaagaaaa taaaatctgc cactgtttcc actttttccc124321 cttctatttg ctatgaagtg aggggactgg atgccatgat cttagtttaa accagcagtt124381 gtcaccccga ccgcttcctt tcctaaagag ctcatcacac ctcccactgg aatgcaatgt124441 gttgcctgtc cgcctgcttc acctcctggg actttgctgc aggtcttggt ctctgaggcc124501 cctgccgtat ccccagggcc cagagcagtg ctgggcttcg agtccgatca gggactatgt124561 gtgtggactg gatggtgctt gcttcttctg gggaacgaga gacctgggcc tggggaacga124621 ggggacctgg tgtgaccgga tctcctccct cgggagagga gccaagcgag tggacacagg124681 tcagtgtgtc ttgctcctgt gtggcaggtg tcccgtctgt gtctgtcatc ttggcatttc124741 ggtgtttctg tgaacccagc ccctcccctc ctgatacccc atcccatcag cacagaggag124801 actgggcttg gggactctct ggtcctgaga ttcctctccg catgtgactc ccccctcctg124861 gggggagcag gcaccgtgtg tgaggagggt ggaagctttt caagaccccc agcttttctg124921 tcccaggggg ctctggcagg gccttgggag ctggaatgag ctggaatctg ggccagtggg124981 ggtttccctg gtggtaaaga acccgcctgc ccatgcacga ggcataagag acgcgggttc125041 gatcactggg tcgggaagat cccctacagg agggcatggc aacccactcc agtattcttt125101 cctgaagaat cccttggaca gaggagcctg gtgggctaca gtctctgggg tggcaaggag125161 tcggacacga ctgaagcgac ttaccatgca cgcacgcggg gtcaggggtc agggccgcgc125221 tgcttacctg ctgtgtgacc ttagccaggt cacacccccc aggctgtgaa agagaacagt125281 cttcccagac tcgggcatcc aggtctttac agacgtgcct gtgagctttg tgactctggc125341 tctgtggccg ctagagggcg ctgtccgccg ggccctatgt gcgtgcacgc atgtgagcat125401 gttcgcatac gtgtgtgcat ctgtcggggg cgcacggtgc ggggacacgg gcacgcggtc125461 aggaacgcag cccggacacc tccacgtggc ccgcgagtac cgtcaggtgg gggctgtggc125521 tccgctgtgt gggtgacccg ccctcccccc gcgaacgtgg tgcatagtga ccgcctggct125581 gggctcctga gctcagccat cctgcccccc gggtcagctc ccgacaggcc cagctctagg125641 ccccaggcgt ggaccgaggc ccccaggccc cggcctgtga gatgggacct ccgtctgggg |
125701 ggctcattct gctcccggag gcctggcagg cccctcctct ttggcattgc ataccctcgc125761 attggggtgg gtaagcacag taccccatgc ctgtggcccc gtgggagcgg cctgctcagg125821 gaggccggag cctcagctac agggctgtca caccgggctg cagaggaaga agacgggagc125881 gaggcctaca ggaacctagc caggccctgg cccactgagc cgacaggagc ctggccagag125941 gcctgcacag gacggggtgg cggggggggt ggggtggggt gctgggcctc gtggccttga126001 ctgcagaccc cgagggctcc tcagcttaga acggccaagc ctgagtcttg ggggtgcagg126061 tcaggggg | |
引物
在另一实施方案中,提供了用于产生寻靶载体的3’和5’序列的引物。寡核苷酸引物能够与猪免疫球蛋白基因组序列,如上述Seq IDNos.1、4、29、30、12、25、15、16、19、28或31杂交。在具体实施方案中,引物在严格条件下与如上述的Seq ID Nos.1、4、29、30、12、25、15、16、19、28或31杂交。另一实施方案提供了能够与猪重链、κ轻链或λ轻链核酸序列,如上述Seq ID Nos.1、4、29、30、12、25、15、16、19、28或31杂交的寡核苷酸探针。多核苷酸引物或者探针可以具有与本发明的多核苷酸杂交的至少14个碱基、20个碱基、30个碱基或者50个碱基。探针或引物可以长为至少14个核苷酸,且在具体实施方案中,长为至少15、20、25、28或30个核苷酸。
在一个实施方案中,提供了扩增猪Ig重链的包括功能连接区(J6区)的片段的引物。在一个非限制性实施方案中,所扩增的重链片段可由Seq ID No 4表示并且用于扩增该片段的引物可以与J区的部分,如但不限于Seq ID No 2互补,以产生5’重组臂,并且与Ig重链μ恒定区的部分,如但不限于Seq ID No 3互补,以产生3’重组臂。在另一实施方案中,可以将猪Ig重链的区域(如但不限于Seq ID No4)亚克隆并装配到寻靶载体中。
在其他实施方案中,提供了扩增猪Igκ轻链的包括恒定区的片段的引物。在另一实施方案中,提供了扩增猪Igκ轻链的包括J区的片段的引物。在一个非限制性实施方案中,用于扩增该片段的引物可以与J区的部分,如但不限于Seq ID No 21或10互补,以产生5’重组臂,并且与恒定区3’的基因组序列,如但不限于Seq ID No 14、24或18互补,以产生3’重组臂。在另一实施方案中,可以将猪Ig重链的区域(如但不限于Seq ID No 20)亚克隆并装配到寻靶载体中。
II.免疫球蛋白基因的遗传寻靶
本发明提供了被基因修饰而灭活免疫球蛋白基因,如上述免疫球蛋白基因的细胞。可以被基因修饰的动物细胞可以从多种不同器官和组织得到,所述器官和组织如但不限于,皮肤、间充质、肺、胰、心脏、肠、胃、膀胱、血管、肾、尿道、生殖器官,和胚胎、胎儿或成年动物的完整或者部分的解聚制剂。在本发明的一个实施方案中,细胞可以选自,但不限于,上皮细胞、成纤维细胞、神经细胞、角质形成细胞、造血细胞、黑素细胞、软骨细胞、淋巴细胞(B和T)、巨噬细胞、单核细胞、单核的细胞、心肌细胞、其他肌细胞、卵泡细胞、卵丘细胞、表皮细胞、内皮细胞、胰岛细胞、血细胞、血前体细胞、骨细胞、骨前体细胞、神经元干细胞、原始干细胞、肝细胞、角质形成细胞、脐静脉内皮细胞、主动脉内皮细胞、微血管内皮细胞、成纤维细胞、肝星状细胞、主动脉平滑肌细胞、心肌细胞、神经元、Kupffer细胞、平滑肌细胞、施旺细胞、和上皮细胞、红细胞、血小板、嗜中性粒细胞、淋巴细胞、单核细胞、嗜酸性粒细胞、嗜碱性粒细胞、脂肪细胞、软骨细胞、胰岛细胞、甲状腺细胞、甲状旁腺细胞、腮腺细胞、肿瘤细胞、神经胶质细胞、星形胶质细胞、红细胞、白细胞、巨噬细胞、上皮细胞、体细胞、垂体细胞、肾上腺细胞、毛细胞、膀胱状细胞、肾细胞、视网膜细胞、杆细胞、视锥细胞、心细胞、起博细胞、脾细胞、抗原呈递细胞、记忆细胞、T细胞、B细胞、浆细胞、肌细胞、卵巢细胞、子宫细胞、前列腺细胞、阴道上皮细胞、精细胞、睾丸细胞、生殖细胞、卵细胞、间质细胞、管周细胞、支持细胞、黄体细胞、颈细胞、子宫内膜细胞、乳房细胞、滤泡细胞、粘液细胞、纤毛细胞、非角化上皮细胞、角化上皮细胞、肺细胞、杯形细胞、柱状上皮细胞、鳞状上皮细胞、骨细胞、成骨细胞和破骨细胞。在一个备选实施方案中,可以使用胚胎干细胞。可以使用胚胎干细胞系或者可以从宿主如牛动物新鲜得到胚胎干细胞。细胞可以在合适的成纤维细胞-饲养层上生长或者在白血病抑制因子(LIF)存在下生长。
在具体实施方案中,细胞可以是成纤维细胞;在一个具体实施方案中,细胞可以是胎儿成纤维细胞。成纤维细胞是合适的体细胞类型,因为它们可以从发育中的胎儿和成年动物大量得到。这些细胞可以在体外容易地增殖,具有快的倍增时间,并且可以克隆繁殖以用于基因寻靶程序中。
寻靶构建体
同源重组
在一个实施方案中,免疫球蛋白基因可以通过同源重组遗传靶定在细胞中。同源重组允许内源基因的位点特异性修饰,且从而可以向基因组中工程改造新的改变。在同源重组中,引入的DNA与基因组中含有基本同源的DNA序列的位点相互作用并整合到该位点中。在非同源(“随机”或者“不法”)整合中,引入的DNA在基因组中的同源序列中没有发现但是整合到别处的许多可能的位置之一。通常,用高等真核生物细胞进行的研究已经揭示同源重组的频率远小于随机整合的频率。这些频率的比率对于“基因寻靶”具有直接的含义,所述基因寻靶取决于通过同源重组(即,外源“寻靶DNA”与基因组中对应的“靶DNA”之间的重组)的整合。
许多文献描述了同源重组在哺乳动物细胞中的用途。这些文献示例为Kucherlapati等人,Proc.Natl.Acad.Sci.USA 81:3153-3157,1984;Kucherlapati等人,Mol.Cell.Bio.5:714-720,1985;Smithies等人,Nature 317:230-234,1985;Wake等人,Mol.Cell.Bio.8:2080-2089,1985;Ayares等人,Genetics 111:375-388,1985;Ayares等人,Mol.Cell.Bio.7:1656-1662,1986;Song等人,Proc.Natl.Acad.Sci.USA 84:6820-6824,1987;Thomas等人,Cell 44:419-428,1986;Thomas和Capecchi,Cell 51:503-512,1987;Nandi等人,Proc.Natl.Acad.Sci.USA 85:3845-3849,1988;和Mansour等人,Nature336:348-352,1988.Evans和Kaufman,Nature 294:146-154,1981;Doetschman等人,Nature 330:576-578,1987;Thoma和Capecchi,Cell 51:503-512,4987;Thompson等人,Cell 56:316-321,1989。
本发明可以使用同源重组以灭活细胞、如上述细胞中的免疫球蛋白基因。DNA可以包含特定基因座上基因的至少部分,其中在天然基因的至少一个拷贝、任选两个拷贝中引入改变,从而防止功能性免疫球蛋白的表达。所述改变可以是插入、缺失、替换或者其组合。当向被灭活的基因的仅一个拷贝中引入改变时,将具有靶基因的单个未突变的拷贝的细胞扩增并进行第二次寻靶步骤,其中该改变可以与第一次改变相同或不同,通常不同,并且当涉及缺失或者替换时,第二次改变可以与最初引入的改变的至少部分重叠。在该第二次寻靶步骤中,可以使用具有相同的同源性臂但是含有不同的哺乳动物选择标记的寻靶载体。对所得转化体筛选功能性靶抗原的不存在并且可以进一步筛选细胞的DNA以确保不存在野生型靶基因。备选地,通过将对突变杂合的宿主育种实现表型的纯合性。
寻靶载体
在另一实施方案中,还提供了核酸寻靶载体构建体。可以设计寻靶载体来完成细胞中的同源重组。可以将这些寻靶载体转化到哺乳动物细胞中以通过同源重组靶定有蹄类动物重链、κ轻链或者λ轻链基因。在一个实施方案中,寻靶载体可以含有3’重组臂和5’重组臂(即,侧翼序列),其与有蹄类动物重链、κ轻链或者λ轻链基因组序列,例如,如上述的Seq ID Nos.1、4、29、30、12、25、15、16、19、28或31表示的序列同源。同源DNA序列可以包括与基因组序列同源的序列、尤其是连续序列的至少15bp、20bp、25bp、50bp、100bp、500bp、1kbp、2kbp、4kbp、5kbp、10kbp、15kbp、20kbp或50kbp。可以设计3’和5’重组臂从而使得它们在基因组序列的至少一个功能性可变区、连接区、多样性区和/或恒定区的3’和5’末端的侧翼。功能区的寻靶使得它失活,其导致细胞不能产生功能性免疫球蛋白分子。在另一实施方案中,同源DNA序列可以包括一个或多个内含子和/或外显子序列。除了核酸序列外,表达载体可以含有选择标记序列,如增强的绿色荧光蛋白(eGFP)基因序列,起始和/或增强子序列,聚腺苷酸尾序列,和/或提供构建体在原核和/或真核宿主细胞中表达的核酸序列。选择标记可以位于5’和3’重组臂序列之间。
通过向细胞中导入DNA可以产生细胞的靶定基因座的修饰,其中所述DNA与靶基因座具有同源性并且包括标记基因,从而允许选择包含整合的构建体的细胞。靶载体中的同源DNA将与染色体DNA在靶基因座重组。标记基因的两边侧翼可以是同源DNA序列、3’重组臂和5’重组臂。构建寻靶载体的方法已经在本领域中描述,参见例如,Dai等人,Nature Biotechnology 20:251-255,2002;WO00/51424。
可以制备各种构建体用于在靶基因座发生同源重组。构建体可以包括与靶基因座同源的序列的至少50bp、100bp、500bp、1kbp、2kbp、4kbp、5kbp、10kbp、15kbp、20kbp或50kbp。该序列可以包括免疫球蛋白基因的任何连续序列。
各种考虑可以涉及确定靶DNA序列的同源性程度,如靶基因座的大小、序列的可用性、在靶基因座上双交换事件的相对效率和靶序列与其他序列的相似性。
寻靶DNA可以包括这样的序列,其中基本上等基因的DNA将所需序列修饰置于基因组中将修饰的对应的靶序列两侧。基本上等基因的序列与对应的靶序列可具有至少约95%、97-98%、99.0-99.5%、99.6-99.9%或100%同一性(除了所需序列修饰外)。在具体实施方案中,寻靶DNA和靶DNA可以共有一段100%相同的至少约75、150或者500个碱基对的DNA序列。因此,寻靶DNA可以来自与将靶定的细胞系密切相关的细胞;或者寻靶DNA可以来自与被靶定的细胞相同的细胞系或者动物的细胞。
猪重链寻靶
在本发明的具体实施方案中,提供了用来靶定猪重链基因座的寻靶载体。在一个具体实施方案中,寻靶载体可以含有5’和3’重组臂,该重组臂含有与猪免疫球蛋白重链基因座的J6区的3’和5’侧翼序列同源的序列。因为J6区是猪免疫球蛋白重链基因座的唯一的功能性连接区,所以这将阻止功能性猪重链免疫球蛋白的表达。在特定实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与J6区5’的基因组序列,任选包括J1-4同源的序列,所述3’重组臂含有与J6区3’的基因组序列,包括μ恒定区同源的序列(“J6寻靶构建体”),见例如图1。此外,该J6寻靶载体还可以含有位于5’和3’重组臂之间的选择标记基因,见例如,Seq ID No 5和图1。在其他实施方案中,5’寻靶臂可以含有J1 5’的序列,如Seq ID No.1和/或Seq ID No 4中描绘。在另一实施方案中,5’寻靶臂可以含有J1、J2和/或J3 5’的序列,如Seq ID No 4的约残基1-300、1-500、1-750、1-1000和/或1-1500所示。在进一步的实施方案中,5’寻靶臂可以含有恒定区5’的序列,如Seq ID No 4的约残基1-300、1-500、1-750、1-1000、1-1500和/或1-2000或Seq ID No 4的任一片段和/或Seq ID No4的任何连续序列或者其片段所示。在另一实施方案中,3’寻靶臂可以含有恒定区3’的序列和/或包括恒定区的序列,如Seq ID No 4的残基7000-8000和/或8000-9000或其片段。在其他实施方案中,寻靶载体可以含有Seq ID No 4的任何连续序列或者其片段。在其他实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与猪重链基因座多样性区5’的基因组序列同源的序列,所述3’重组臂含有与猪重链基因座多样性区3’的基因组序列同源的序列。在进一步的实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与猪重链基因座μ恒定区5’的基因组序列同源的序列,所述3’重组臂含有与猪重链基因座μ恒定区3’的基因组序列同源的序列。
在进一步的实施方案中,寻靶载体可以包括,但不限于下面序列的任一种:重链的多样性区如通过Seq ID No 29的残基1089-1099(D(pseudo))表示的,重链的连接区例如通过Seq ID No 29的残基1887-3352(例如:J(psuedo):Seq ID No 29的1887-1931,J(psuedo):Seq ID No 29的2364-2411,J(psuedo):Seq ID No 29的2756-2804,J(功能性J):Seq ID No 29的3296-3352)表示,重组信号例如通过SeqID No 29的残基3001-3261(九碱基顺序),Seq ID No 29的3292-3298(七碱基序列)表示,恒定区通过下面的残基表示:Seq ID No 29的3353-9070(J到Cμ内含子)、Seq ID No 29的5522-8700(转换区)、Seq ID No 29的9071-9388(μ外显子1)、Seq ID No 29的9389-9469(μ内含子A)、Seq ID No 29的9470-9802(μ外显子2)、Seq ID No 29的9830-10069(μ内含子B)、Seq ID No 29的10070-10387(μ外显子3)、Seq ID No 29的10388-10517(μ内含子C)、Seq ID No 29的10815-11052(μ外显子4)、Seq ID No 29的11034-11039(聚腺苷酸信号),或者其任意片段或者组合。此外,Seq ID No 29的至少约17、20、30、40、50、100、150、200或300个核苷酸的任意连续序列或者其片段和/或组合可以用作重链寻靶载体的寻靶序列。可以理解通常当设计寻靶构建体时,一个寻靶臂将在另一个寻靶臂的5’。
在其他实施方案中,设计用来破坏猪重链基因的表达的寻靶载体可以含有重组臂,如3’或者5’重组臂,其靶定重链的恒定区。在一个实施方案中,重组臂可以靶定μ恒定区,如上述或者Sun & ButlerImmunogenetics(1997)46:452-460中描述的Cμ序列。在另一实施方案中,重组臂可以靶定δ恒定区,如Zhao等人(2003)J Imunol 171:1312-1318中公开的序列,或者靶定α恒定区,如Brown & Butler(1994)Molec Immunol 31:633-642中公开的序列。
Seq ID No.5 | GGCCAGACTTCCTCGGAACAGCTCAAAGAGCTCTGTCAAAGCCAGATCCCATCACACGTGGGCACCAATAGGCCATGCCAGCCTCCAAGGGCCGAACTGGGTTCTCCACGGCGCACATGAAGCCTGCAGCCTGGCTTATCCTCTTCCGTGGTGAAGAGGCAGGCCCGGGACTGGACGAGGGGCTAGCAGGGTGTGGTAGGCACCTTGCGCCCCCCACCCCGGCAGGAACCAGAGACCCTGGGGCTGAGAGTGAGCCTCCAAACAGGATGCCCCACCCTTCAGGCCACCTTTCAATCCAGCTACACTCCACCTGCCATTCTCCTCTGGGCACAGGGCCCAGCCCCTGGATCTTGGCCTTGGCTCGACTTGCACCCACGCGCACACACACACTTCCTAACGTGCTGTCCGCTCACCCCTCCCCAGCGTGGTCCATGGGCAGCACGGCAGTGCGCGTCCGGCGGTAGTGAGTGCAGAGGTCCCTTCCCCTCCCCCAGGAGCCCCAGGGGTGTGTGCAGATCTGGGGGCTCCTGTCCCTTACACCTTCATGCCCCTCCCCTCATACCCACCCTCCAGGCGGGAGGCAGCGAGACCTTTGCCCAGGGACTCAGCCAACGGGCACACGGGAGGCCAGCCCTCAGCAGCTGGCTCCCAAAGAGGAGGTGGGAGGTAGGTCCACAGCTGCCACAGAGAGAAACCCTGACGGACCCCACAGGGGCCACGCCAGCCGGAACCAGCTCCCTCGTGGGTGAGCAATGGCCAGGGCCCCGCCGGCCACCACGGCTGGCCTTGCGCCAGCTGAGAACTCACGTCCAGTGCAGGGAGACTCAAGACAGCCTGTGCACACAGCCTCGGATCTGCTCCCATTTCAAGCAGAAAAAGGAAACCGTGCAGGCAGCCCTCAGCATTTCAAGGATTGTAGCAGCGGCCAACTATTCGTCGGCAGTGGCCGATTAGAATGACCGTGGAGAAGGGCGGAAGGGTCTCTCGTGGGCTCTGCGGCCAACAGGCCCTGGCTCCACCTGCCCGCTGCCAGCCCGAGGGGCTTGGGCCGAGCCAGGAACCACAGTGCTCACCGGGACCACAGTGACTGACCAAACTCCCGGCCAGAGCAGCCCCAGGCCAGCCGGGCTCTCGCCCTGGAGGACTCACCATCAGATGCACAAGGGGGCGAGTGTGGAAGAGACGTGTCGCCCGGGCCATTTGGGAAGGCGAAGGGACCTTCCAGGTGGACAGGAGGTGGGACGCACTCCAGGCAAGGGACTGGGTCCCCAAGGCCTGGGGAAGGGGTACTGGCTTGGGGGTTAGCCTGGCCAGGGAACGGGGAGCGGGGCGGGGGGCTGAGCAGGGAGGACCTGACCTCGTGGGAGCGAGGCAAGTCAGGCTTCAGGCAGCAGCCGCACATCCCAGACCAGGAGGCTGAGGCAGGAGGGGCTTGCAGCGGGGCGGGGGCCTGCCTGGCTCCGGGGGCTCCTGGGGGACGCTGGCTCTTGTTTCCGTGTCCCGCAGCACAGGGCCAGCTCGCTGGGCCTATGCTTACCTTGATGTCTGGGGCCGGGGCGTCAGGGTCGTCGTCTCCTCAGGGGAGAGTCCCCTGAGGCTACGCTGGGG*GGGGACTATGGCAGCTCCACCAGGGGCCTGGGGACCAGGGGCCTGGACCAGGCTGCAGCCCGGAGGACGGGCAGGGCTCTGGCTCTCCAGCATCTGGCCCTCGGAAATGGCAGAACCCCTGGCGGGTGAGCGAGCTGAGAGCGGGTCAGACAGACAGGGGCCGGCCGGAAAGGAGAAGTTGGGGGCAGAGCCCGCCAGGGGCCAGGCCCAAGGTTCTGTGTGCCAGGGCCTGGGTGGGCACATTGGTGTGGCCATGGCTACTTAGACGCGTGATCAAGGGCGAATTCCAGCACACTGGCGGCCGTTACTAGTggatcccggcgcgccctaccgggtaggggaggcgcttttcccaaggcagtctggagcatgcgctttagcagccccgctgggcacttggcgctacacaagtggcctctggcctcgcacacattccacatccaccggtaggcgccaaccggctccgttctttggtggccccttcgcgccaccttctactcctcccctagtcaggaagttcccccccgccccgcagctcgcgtcgtgcaggacgtgacaaatggaagtagcacgtctcgctagtctcgtgcagatggacagcaccgctgagcaatggaagcgggtaggcctttggggcagcggccaatagcagctttggctccttcgctttctgggctcagaggctgggaaggggtgggtccgggggcgggctcaggggcgggctcaggggcggggcgggcgcccgaaggtcctccggaagcccggcattctgcacgcttcaaaagcgcacgtctgccgcgctgttctcctcttcctcatctccgggcctttcgacctgcagccaatatgggatcggccattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcaatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgcgcatgcc |
cgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggatcgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgaggggatcaattcTCTAGATGCATGCTCGAGCGGCCGCCAGTGTGATGGATATCTGCAGAATTCGCCCTtCCAGGCGTTGAAGTCGTCGTGTCCTCAGGTAAGAACGGCCCTCCAGGGCCTTTAATTTCTGCTCTCGTCTGTGGGCTTTTCTGACTCTGATCCTCGGGAGGCGTCTGTGCCCCCCCCGGGGATGAGGCCGGCTTGCCAGGAGGGGTCAGGGACCAGGAGCCTGTGGGAAGTTCTGACGGGGGCTGCAGGCGGGAAGGGCCCCACCGGGGGGCGAGCCCCAGGCCGCTGGGCGGCAGGAGACCCGTGAGAGTGCGCCTTGAGGAGGGTGTCTGCGGAACCACGAACGCCCGCCGGGAAGGGCTTGCTGCAATGCGGTCTTCAGACGGGAGGCGTCTTCTGCCCTCACCGTCTTTCAAGCCCTTGTGGGTCTGAAAGAGCCATGTCGGAGAGAGAAGGGACAGGCCTGTCCCGACCTGGCCGAGAGCGGGCAGCCCCGGGGGAGAGCGGGGCGATCGGCCTGGGCTCTGTGAGGCCAGGTCCAAGGGAGGACGTGTGGTCCTCGTGACAGGTGCACTTGCGAAACCTTAGAAGACGGGGTATGTTGGAAGCGGCTCCTGATGTTTAAGAAAAGGGAGACTGTAAAGTGAGCAGAGTCCTCAAGTGTGTTAAGGTTTTAAAGGTCAAAGTGTTTTAAACCTTTGTGACTGCAGTTAGCAAGCGTGCGGGGAGTGAATGGGGTGCCAGGGTGGCCGAGAGGCAGTACGAGGGCCGTGCCGTCCTCTAATTCAGGGCTTAGTTTTGCAGAATAAAGTCGGCCTGTTTTCTAAAAGCATTGGTGGTGCTGAGCTGGTGGAGGAGGCCGCGGGCAGCCCTGGCCACCTGCAGCAGGTGGCAGGAAGCAGGTCGGCCAAGAGGCTATTTTAGGAAGCCAGAAAACACGGTCGATGAATTTATAGCTTCTGGTTTCCAGGAGGTGGTTGGGCATGGCTTTGCGCAGCGCCACAGAACCGAAAGTGCCCACTGAGAAAAAACAACTCCTGCTTAATTTGCATTTTTCTAAAAGAAGAAACAGAGGCTGACGGAAACTGGAAAGTTCCTGTTTTAACTACTCGAATTGAGTTTTCGGTCTTAGCTTATCAACTGCTCACTTAGATTCATTTTCAAAGTAAACGTTTAAGAGCCGAGGCATTCCTATCCTCTTCTAAGGCGTTATTCCTGGAGGCTCATTCACCGCCAGCACCTCCGCTGCCTGCAGGCATTGCTGTCACCGTCACCGTGACGGCGCGCACGATTTTCAGTTGGCCCGCTTCCCCTCGTGATTAGGACAGACGCGGGCACTCTGGCCCAGCCGTCTTGGCTCAGTATCTGCAGGCGTCCGTCTCGGGACGGAGCTCAGGGGAAGAGCGTGACTCCAGTTGAACGTGATAGTCGGTGCGTTGAGAGGAGACCCAGTCGGGTGTCGAGTCAGAAGGGGCCCGGGGCCCGAGGCCCTGGGCAGGACGGCCCGTGCCCTGCATCACGGGCCCAGCGTCCTAGAGGCAGGACTCTGGTGGAGAGTGTGAGGGTGCCTGGGGCCCCTCCGGAGCTGGGGCCGTGCGGTGCAGGTTGGGCTCTCGGCGCGGTGTTGGCTGTTTCTGCGGGATTTGGAGGAATTCTTCCAGTGATGGGAGTCGCCAGTGACCGGGCACCAGGCTGGTAAGAGGGAGGCCGCCGTCGTGGCCAGAGCAGCTGGGAGGGTTCGGTAAAAGGCTCGCCCGTTTCCTTTAATGAGGACTTTTCCTGGAGGGCATTTAGTCTAGTCGGGACCGTTTTCGACTCGGGAAGAGGGATGCGGAGGAGGGCATGTGCCCAGGAGCCGAAGGCGCCGCGGGGAGAAGCCCAGGGCTCTCCTGTCCCCACAGAGGCGACGCCACTGCCGCAGACAGACAGGGCCTTTCCCTCTGATGACGGCAAAGGCGCCTCGGCTCTTGCGGGGTGCTGGGGGGGAGTCGCCCCGAAGCCGCTCACCCAGAGGCCTGAGGGGTGAGACTGACCGATGCCTCTTGGCCGGGCCTGGGGCCGGACCGAGGGGGACTCCGTGGAGGCAGGGCGATGGTGGCTGCGGGAGGGAACCGACCCTGGGCCGAGCCCGGCTTGGCGATTCCCGGGCGAGGGCCCTCAGCCGAGGCGAGTGGGTCCGGCGGAACCACCCTTTCTGGCCAGCGCCACAGGGCTCTCGGGACTGTCCGGGGCGACGCTGGGCTGCCCGTGGCAGGCCTGGGCTGACCTGGACTTCACCAGACAGAACAGGGCTTTCAGGGCTGAGCTGAGCCAGGTTTAGCGAGGCCAAGTGGGGCTGAACCAGGCTCAACTGGCCTGAGCTGGGTTGAGCTGGGCTGACCTGGGCTGAGCTGAGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGGCTGGACTGGCTGAGCTGAGCTGGGTTGAGCTGAGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGTTGAGCTGGGTTG |
ATCTGAGCTGAGCTGGGCTGAGCTGAGCTAGGCTGGGGTGAGCTGGGCTGAGCTGGTTTGAGTTGGGTTGAGCTGAGCTGAGCTGGGCTGTGCTGGCTGAGCTAGGCTGAGCTAGGCTAGGTTGAGCTGGGCTGGGCTGAGCTGAGCyAGGCTGGGCTGATTTGGGCTGAGCTGAGCTGAGCTAGGCTGCGTTGAGCTGGCTGGGCTGGATTGAGCTGGCTGAGCTGGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGAGCTGGACTGGTTTGAGCTGGGTCGATCTGGGTTGAGCTGTCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCAGCAGAGCTGGGTTGGGCTGAGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGAGCTGAGCTGGGCTGAGCTGGCCTGTGTTGAGCTGGGCTGGGTTGAGCTGGGCTGAGCTGGATTGAGCTGGGTTGAGCTGAGCTGGGCTGGGCTGTGCTGACTGAGCTGGGCTGAGCTAGGCTGGGGTGAGCTGGGCTGAGCTGATCCGAGCTAGGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGGATTGATCTGGCTGAGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGTCTGAGCTGGCCTGGGTCGAGCTGAGCTGGACTGGTTTGAGCTGGGTCGATCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTGAGCTGAGGGCTGGGGTGAGCTGGGCTGAACTAGCCTAGCTAGGTTGGGCTGAGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCAGGCCTGGGGTGAGCTGGGCTAGGTGGAGCTGAGCTGGGTCGAGCTGAGTTGGGCTGAGCTGGCCTGGGTTGAGGTAGGCTGAGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGTTGAGCTGGGCTCGGTTGAGCTGGGCTGAGCTGAGCCGACCTAGGCTGGGATGAGCTGGGCTGATTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCCTGGAGCCTGGCCTGGGGTGAGCTGGGCTGAGCTGCGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGATGAGCTGGGCCGGTTTGGGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCTGGCCTGGGGTGAGCTGGGCTGAGCTAAGCTGAGCTGGGCTGGTTTGGGCTGAGCTGGCTGAGCTGGGTCCTGCTGAGCTGGGCTGAGCTGACCAGGGGTGAGCTGGGCTGAGTTAGGCTGGGCTCAGCTAGGCTGGGTTGATCTGGCAGGGCTGGTTTGCGCTGGGTCAAGCTCCCGGGAGATGGCCTGGGATGAGCTGGGCTGGTTTGGGCTGAGCTGAGCTGAGCTGAGCTAGGCTGCATTGAGCAGGCTGAGCTGGGCTGAGCTGGCCTGGGGTGAGCTGGGCTGGGTGGAGCTGAGCTGGGCTGAACTGGGCTAAGCTGGCTGAGCTGGATCGAGCTGAGCTGGGCTGAGCTGGCCTGGGGTTAGCTGGGCTGAGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGCTGGGCTGGTTTGCGCTGGGTCAAGCTGGGCCGAGCTGGCCTGGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGGGTTGAGCTGGGCTGGGCTGAGCTGAGCTAGGCTGCATTGAGCTGGCTGGGATGGATTGAGCTGGCTGAGCTGGCTGAGCTGGCTGAGCTGGGCTGAGCTGGCCTGGGTTGAGCTGGGCTGGGTTGAGCTGAGCTGGGCTGAGCTGGGCTCAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGGTGAGCTGGGCTGAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCGAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTCAGCAGAGCTGGGTTGAGCTGAGCTGGGTTGAGCTGGGCTGAGCTAGCTGGGCTCAGCTAGGCTGGGTTGAGCTGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAGCTGGGCTGAGCAGAGCTGGGCTGAGCAGAGCTGGGTTGGTCTGAGCTGGGTTGAGCTGGGCTGAGCTGGGCTGAGCAGAGTTGGGTTGAGCTGAGCTGGGTTCAGCTGGGCTGAGCTAGGCTGGGTTGAGCTGGGTTGAGTTGGGCTGAGCTGGGCTGGGTTGAGCGGAGCTGGGCTGAACTGGGCTGAGCTGGGCTGAGCGGAACTGGGTTGATCTGAATTGAGCTGGGCTGAGCCGGGCTGAGCCGGGCTGAGCTGGGCTAGGTTGAGCTTGGGTGAGCTTGCCTCAGCTGGTCTGAGCTAGGTTGGGTGGAGCTAGGCTGGATTGAGCTGGGCTGAGCTGAGCTGATCTGGCCTCAGCTGGGCTGAGGTAGGCTGAACTGGGCTGTGCTGGGCTGAGCTGAGCTGAGCCAGTTTGAGCTGGGTTGAGCTGGGCTGAGCTGGGCTGTGTTGATCTTTCCTGAACTGGGCTGAGCTGGGCTGAGCTGGCCTAGCTGGATTGAACGGGGGTAAGCTGGGCCAGGCTGGACTGGGCTGAGCTGAGCTAGGCTGAGCTGAGTTGAA |
TTGGGTTAAGCTGGGCTGAGATGGGCTGAGCTGGGCTGAGCTGGGTTGAGCCAGGTCGGACTGGGTTACCCTGGGCCACACTGGGCTGAGCTGGGCGGAGCTCGATTAACCTGGTCAGGCTGAGTCGGGTCCAGCAGACATGCGCTGGCCAGGCTGGCTTGACCTGGACACGTTCGATGAGCTGCCTTGGGATGGTTCACCTCAGCTGAGCCAGGTGGCTCCAGCTGGGCTGAGCTGGTGACCCTGGGTGACCTCGGTGACCAGGTTGTCCTGAGTCCGGGCCAAGCCGAGGCTGCATCAGACTCGCCAGACCCAAGGCCTGGGCCCCGGCTGGCAAGCCAGGGGCGGTGAAGGCTGGGCTGGCAGGACTGTCCCGGAAGGAGGTGCACGTGGAGCCGCCCGGACCCCGACCGGCAGGACCTGGAAAGACGCCTCTCACTCCCCTTTCTCTTCTGTCCCCTCTCGGGTCCTCAGAGAGCCAGTCTGCCCCGAATCTCTACCCCCTCGTCTCCTGCGTCAGCCCCCCGTCCGATGAGAGCCTGGTGGCCCTGGGCTGCCTGGCCCGGGACTTCCTGCCCAGCTCCGTCACCTTCTCCTGGAA |
猪κ链寻靶
在本发明的具体实施方案中,提供了靶定猪κ链基因座的寻靶载体。在一个具体实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,它们含有猪免疫球蛋白κ链基因座的恒定区的3’和5’侧翼序列的同源序列。因为本发明发现猪免疫球蛋白κ轻链基因座仅有一个恒定区,所以这将阻止功能性猪κ轻链免疫球蛋白的表达。在具体实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与恒定区5’的基因组序列,任选包括连接区同源的序列,所述3’重组臂含有与恒定区3’的基因组序列,任选包括增强子区的至少部分同源的序列(“κ恒定寻靶构建体”),见例如图2。此外,该κ恒定寻靶构建体还可以含有位于5’和3’重组臂之间的选择标记基因,见例如Seq ID No 20和图2。在其他实施方案中,寻靶载体可以含有5’重组臂和3’重组臂,所述5’重组臂含有与猪κ轻链基因座的连接区5’的基因组序列同源的序列,所述3’重组臂含有与猪κ轻链基因座的连接区3’的基因组序列同源的序列。在其他实施方案中,寻靶载体的5’臂可以包括Seq ID No 12和/或Seq ID No 25或者其任何连续序列或者片段。在另一实施方案中,寻靶载体的3’臂可以包括Seq ID No 15、16和/或19或者其任何连续序列或者片段。
在进一步的实施方案中,寻靶载体可以包括,但不限于下面序列的任一种:κ轻链的编码区例如通过Seq ID No 30的残基1-549和SeqID No 30的10026-10549表示,而内含子序列由例如Seq ID No 30的残基550-10025表示,κ轻链的连接区例如由Seq ID No 30的残基5822-7207(例如,J1:Seq ID No 30的5822-5859,J2:Seq ID No 30的6180-6218,J3:Seq ID No 30的6486-6523,J4:Seq ID No 30的6826-6863,J5:Seq ID No 30的7170-7207)表示,恒定区由下面的残基表示:Seq ID No 30的10026-10549(C外显子)和Seq ID No 30的10026-10354(C编码),Seq ID No 30的10524-10529(聚腺苷酸信号)和Seq ID No 30的11160-11264(SINE元件)或者其任意片段或者组合。此外,Seq ID No 30的至少约17、20、30、40、50、100、150、200或300个核苷酸的任何连续序列或者其片段和/或组合可以用作重链寻靶载体的寻靶序列。可以理解通常当设计寻靶构建体时,一个寻靶臂将在另一个寻靶臂的5’。
Seq ID No.20 | ctcaaacgtaagtggctttttccgactgattctttgctgtttctaattgttggttggctttttgtccatttttcagtgttttcatcgaattagttgtcagggaccaaacaaattgccttcccagattaggtaccagggaggggacattgctgcatgggagaccagagggtggctaatttttaacgtttccaagccaaaataactggggaagggggcttgctgtcctgtgagggtaggtttttatagaagtggaagttaaggggaaatcgctatggttcacttttggctcggggaccaaagtggagcccaaaattgagtacattttccatcaattatttgtgagatttttgtcctgttgtgtcatttgtgcaagtttttgacattttggttgaatgagccattcccagggacccaaaaggatgagaccgaaaagtagaaaagagccaacttttaagctgagcagacagaccgaattgttgagtttgtgaggagagtagggtttgtagggagaaaggggaacagatcgctggctttttctctgaattagcctttctcatgggactggcttcagagggggtttttgatgagggaagtgttctagagccttaactgtgggttgtgttcggtagcgggaccaagctggaaatcaaacgtaagtgcacttttctactcctttttctttcttatacgggtgtgaaattggggacttttcatgtttggagtatgagttgaggtcagttctgaagagagtgggactcatccaaaaatctgaggagtaagggtcagaacagagttgtctcatggaagaacaaagacctagttagttgatgaggcagctaaatgagtcagttgacttgggatccaaatggccagacttcgtctgtaaccaacaatctaatgagatgtagcagcaaaaagagatttccattgaggggaaagtaaaattgttaatattgtggatcacctttggtgaagggacatccgtggagattgaacgtaagtattttttctctactaccttctgaaatttgtctaaatgccagtgttgacttttagaggcttaagtgtcagttttgtgaaaaatgggtaaacaagagcatttcatatttattatcagtttcaaaagttaaactcagctccaaaaatgaatttgtagacaaaaagattaatttaagccaaattgaatgattcaaaggaaaaaataattagtgtagatgaaaaaggaattcttacagctccaaagagcaaaagcgaattaattttctttgaactttgccaaatcttgtaaatgatttttgttctttacaatttaaaaaggttagagaaatgtatttcttagtctgttttctctcttctgtctgataaattattatatgagataaaaatgaaaattaataggatgtgctaaaaaatcagtaagaagttagaaaaatatatgtttatgttaaag |
ttgccacttaattgagaatcagaagcaatgttatttttaaagtctaaaatgagagataaactgtcaatacttaaattctgcagagattctatatcttgacagatatctcctttttcaaaaatccaatttctatggtagactaaatttgaaatgatcttcctcataatggagggaaaagatggactgaccccaaaagctcagattt*aagaaaacctgtttaag*gaaagaaaataaaagaactgcattttttaaaggcccatgaatttgtagaaaaataggaaatattttaataagtgtattcttttattttcctgttattacttgatggtgtttttataccgccaaggaggccgtggcaccgtcagtgtgatctgtagaccccatggcggccttttttcgcgattgaatgaccttggcggtgggtccccagggctctggtggcagcgcaccagccgctaaaagccgctaaaaactgccgctaaaggccacagcaaccccgcgaccgcccgttcaactgtgctgacacagtgatacagataatgtcgctaacagaggagaatagaaatatgacgggcacacgctaatgtggggaaaagagggagaagcctgatttttattttttagagattctagagataaaattcccagtattatatccttttaataaaaaatttctattaggagattataaagaatttaaagctatttttttaagtggggtgtaattctttcagtagtctcttgtcaaatggatttaagtaatagaggcttaatccaaatgagagaaatagacgcataaccctttcaaggcaaaagctacaagagcaaaaattgaacacagcagccagccatctagccactcagattttgatcagttttactgagtttgaagtaaatatcatgaaggtataattgctgataaaaaaataagatacaggtgtgacacatctttaagtttcagaaatttaatggcttcagtaggattatatttcacgtatacaaagtatctaagcagataaaaatgccattaatggaaacttaatagaaatatatttttaaattccttcattctgtgacagaaattttctaatctgggtcttttaatcacctaccctttgaaagagtttagtaatttgctatttgccatcgctgtttactccagctaatttcaaaagtgatacttgagaaagattatttttggtttgcaaccacctggcaggactattttagggccattttaaaactcttttcaaactaagtattttaaactgttctaaaccatttagggccttttaaaaatcttttcatgaatttcaaacttcgttaaaagttattaaggtgtctggcaagaacttccttatcaaatatgctaatagtttaatctgttaatgcaggatataaaattaaagtgatcaaggcttgacccaaacaggagtatcttcatagcatatttcccctcctttttttctagaattcatatgattttgctgccaaggctattttatataatctctggaaaaaaaatagtaatgaaggttaaaagagaagaaaatatcagaacattaagaattcggtattttactaactgcttggttaacatgaaggtttttattttattaaggtttctatctttataaaaatctgttcccttttctgctgatttctccaagcaaaagattcttgatttgttttttaactcttactctcccacccaagggcctgaatgcccacaaaggggacttccaggaggccatctggcagctgctcaccgtcagaagtgaagccagccagttcctcctgggcaggtggccaaaattacagttgacccctcctggtctggctgaaccttgccccatatggtgacagccatctggccagggcccaggtctccctctgaagcctttgggaggagagggagagtggctggcccgatcacagatgcggaaggggctgactcctcaaccggggtgcagactctgcagggtgggtctgggcccagcacacccaaagcacgcccaggaaggaaaggcagcttggtatcactgcccagagctaggagaggcaccgggaaaatgatctgtccaagacccgttcttgcttctaaactccgagggggtcagatgaagtggttttgtttcttggcctgaagcatcgtgttccctgcaagaagcggggaacacagaggaaggagagaaaagatgaactgaacaaagcatgcaaggcaaaaaaggGGGTCTAGCCGCGGTCTAGGAAGCTTTCTAGGGTACCTCTAGGGATCCCGGCGCGCCCTACCGGGTAGGGGAGGCGCTTTTCCCAAGGCAGTCTGGAGCATGCGCTTTAGCAGCCCCGCTGGGCACTTGGCGCTACACAAGTGGCCTCTGGCCTCGCACACATTCCACATCCACCGGTAGGCGCCAACCGGCTCCGTTCTTTGGTGGCCCCTTCGCGCCACCTTCTACTCCTCCCCTAGTCAGGAAGTTCCCCCCCGCCCCGCAGCTCGCGTCGTGCAGGACGTGACAAATGGAAGTAGCACGTCTCACTAGTCTCGTGCAGATGGACAGCACCGCTGAGCAATGGAAGCGGGTAGGCCTTTGGGGCAGCGGCCAATAGCAGCTTTGGCTCCTTCGCTTTCTGGGCTCAGAGGCTGGGAAGGGGTGGGTCCGGGGGCGGGCTCAGGGGCGGGCTCAGGGGCGGGGCGGGCGCCCGAAGGTCCTCCGGAAGCCCGGCATTCTGCACGCTTCAAAAGCGCACGTCTGCCGCGCTGTTCTCCTCTTCCTCATCTCCGGGCCTTTCGACCT |
GCAGCCAATATGGGATCGGCCATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAGGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCAATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGCGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAGGGGATCAATTCTCTAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGGCGCGCCCctcgagcggccgccagtgtgatggatatctgcagaattcgcccttggatcaaacacgcatcctcatggacaatatgttgggttcttagcctgctgagacacaacaggaactcccctggcaccactttagaggccagagaaacagcacagataaaattccctgccctcatgaagcttatagtctagctggggagatatcataggcaagataaacacatacaaatacatcatcttaggtaataatatatactaaggagaaaattacaggggagaaagaggacaggaattgctagggtaggattataagttcagatagttcatcaggaacactgttgctgagaagataacatttaggtaaagaccgaagtagtaaggaaatggaccgtgtgcctaagtgggtaagaccattctaggcagcaggaacagcgatgaaagcactgaggtgggtgttcactgcacagagttgttcactgcacagagttgtgtggggaggggtaggtcttgcaggctcttatggtcacaggaagaattgttttactcccaccgagatgaaggttggtggattttgagcagaagaataattctgcctggtttatatataacaggatttccctgggtgctctgatgagaataatctgtcaggggtgggatagggagagatatggcaataggagccttggctaggagcccacgacaataattccaagtgagaggtggtgctgcattgtaagcaggactaacaagacctgctgacagtgtggatgtagaaaaagatagaggagacgaaggtgcatctagggttttctgcctgaggaattagaaagataaagctatagcttatagaagatgcagcgctctggggagaaagaccagcagctcagttttgatccatctggaattaattttggcataaagtatgaggtatgtgggttaacattatttgttttttttttttccatgtagctatccaactgtcccagcatcatttattttaaaagactttcctttcccctattggattgttttggcaccttcactgaagatcaactgagcataaaattgggtctatttctaagctcttgattccattccatgacctatttgttcatctttaccccagtagacactgccttgatgattaaagcccctgttaccatgtctgttttggacatggtaaatctgagatgcctattagccaaccaagcaagcacggcccttagagagctagatatgagagcctggaattcagacgagaaaggtcagtcctagagacatacatgtagtgccatcaccatgcggatggtgttaaaagccatcagactgcaacagactgtgagagggtaccaagctagagagcatggatagagaaacccaagcactgagctgggaggtgctcctacattaagagattagtgagatgaaggactgagaagattgatcagagaagaaggcaaatcaggaaaatggtgctgtcctgaaaatccaagggaagagatgttccaaagaggagaaaactgatcagttgtcagctagcgtcaattgggatgaaaatggaccattggacagagggatgtagtgggtcatgggtgaatagataagagcagcttctatagaatggcaggggcaaaattctcatctgatcggcatgggttctaaagaaaacgggaagaaaaaattgagtgcatgacca |
gtcccttcaagtagagaggtggaaaagggaaggaggaaaatgaggccacgacaacatgagagaaatgacagcatttttaaaaattttttattttattttatttatttatttttgctttttagggctgcccctgcaacatatggaggttcccaggttaggggtctaatcagagctatagctgccagcctacaccacagccatagcaatgccagatctacatgacctacaccacagctcacagcaacgccggatccttaacccactgagtgaggccagagatcaaacccatatccttatggatactagtcaggttcattaccactgagccaaaatgggaaatcctgagtaatgacagcattttttaatgtgccaggaagcaaaacttgccaccccgaaatgtctctcaggcatgtggattattttgagctgaaaacgattaaggcccaaaaaacacaagaagaaatgtggaccttcccccaacagcctaaaaaatttagattgagggcctgttcccagaatagagctattgccagacttgtctacagaggctaagggctaggtgtggtggggaaaccctcagagatcagagggacgtttatgtaccaagcattgacatttccatctccatgcgaatggccttcttcccctctgtagccccaaaccaccacccccaaaatcttcttctgtctttagctgaagatggtgttgaaggtgatagtttcagccactttggcgagttcctcagttgttctgggtctttcctccTgatccacattattcgactgtgtttgattttctcctgtttatctgtctcattggcacccatttcattcttagaccagcccaaagaacctagaagagtgaaggaaaatttcttccaccctgacaaatgctaaatgagaatcaccgcagtagaggaaaatgatctggtgctgcgggagatagaagagaaaatcgctggagagatgtcactgagtaggtgagatgggaaaggggtgacacaggtggaggtgttgccctcagctaggaagacagacagttcacagaagagaagcgggtgtccgtggacatcttgcctcatggatgaggaaaccgaggctaagaaagactgcaaaagaaaggtaaggattgcagagaggtcgatccatgactaaaatcacagtaaccaaccccaaaccaccatgttttctcctagtctggcacgtggcaggtactgtgtaggttttcaatattattggtttgtaacagtacctattaggcctccatcccctcctctaatactaacaaaagtgtgagactggtcagtgaaaaatggtcttctttctctatgaatctttctcaagaagatacataactttttattttatcataggcttgaagagcaaatgagaaacagcctccaacctatgacaccgtaacaaaatgtttatgatcagtgaagggcaagaaacaaaacatacacagtaaagaccctccataatattgtgggtggcccaacacaggccaggttgtaaaagctttttattctttgatagaggaatggatagtaatgtttcaacctggacagagatcatgttcactgaatccttccaaaaattcatgggtagtttgaattataaggaaaataagacttaggataaatactttgtccaagatcccagagttaatgccaaaatcagttttcagactccaggcagcctgatcaagagcctaaactttaaagacacagtcccttaataactactattcacagttgcactttcagggcgcaaagactcattgaatcctacaatagaatgagtttagatatcaaatctctcagtaatagatgaggagactaaatagcgggcatgacctggtcacttaaagacagaattgagattcaaggctagtgttctttctacctgttttgtttctacaagatgtagcaatgcgctaattacagacctctcagggaaggaa |
猪λ链寻靶
在本发明的具体实施方案中,提供了靶定猪重链基因座的寻靶载体。在一个实施方案中,通过设计寻靶构建体可以靶定λ,该构建体含有位于第一个JC簇5’的序列的5’臂和含有最后一个JC簇3’的序列的3’臂,从而防止λ基因座的功能性表达(见图3-4)。在一个实施方案中,寻靶载体可以含有Seq ID No 28的任意连续序列(如约17、20、30、40、50、75、100、200、300或5000个核苷酸的连续序列)或者其片段。在一个实施方案中,5’寻靶臂可以含有Seq ID No32,其包括猪λ轻链基因组序列的第一个λJ/C区的5’侧翼序列或者其任何连续序列(如约17、20、30、40、50、75、100、200、300或5000个核苷酸的连续序列)或者其片段(也见例如图5)。在另一实施方案中,3’寻靶臂可以含有但不限于一个或多个下面的:Seq ID No.33,其包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列,从λJ/C下游约200个碱基对起;Seq ID No.34,其包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列,J/C簇下游约11.8Kb,接近增强子;SeqID No.35,其包括λ下游约12Kb,包括增强子区;Seq ID No 36,其包括λ下游约17.6Kb;Seq ID No 37,其包括λ下游约19.1Kb;Seq IDNo 38,其包括λ下游约21.3Kb;和Seq ID No 39,其包括λ下游约27Kb,或者Seq ID Nos 32-39的任意连续序列(如约17、20、30、40、50、75、100、200、300或5000个核苷酸的连续序列)或者其片段(也见例如图6)。可以理解通常当设计寻靶构建体时,一个寻靶臂将在另一个寻靶臂的5’。
在额外实施方案中,λ基因座的寻靶构建体可以含有位点特异性重组酶位点,如lox。在一个实施方案中,寻靶臂可以将位点特异性重组酶位点插入到靶定的区域中。然后,位点特异性重组酶可以被激活和/或应用于细胞,从而两个位点特异性重组酶位点之间的间插核苷酸序列可以被切除(见,例如,图6)。
选择标记基因
可以设计DNA构建体来修饰内源的靶免疫球蛋白基因。用于靶定构建体的同源序列可以具有一个或多个缺失、插入、替代或其组合。改变可以是插入与靶基因的上游序列在阅读框融合的选择标记基因。
合适的选择标记基因包括,但不限于:赋予在某些培养基底物上生长的能力的基因,如tk基因(胸苷激酶)或者hprt基因(次黄嘌呤磷酸核糖基转移酶),其赋予在HAT培养基(次黄嘌呤、氨基蝶呤和胸苷)上生长的能力;细菌gpt基因(鸟嘌呤/黄嘌呤磷酸核糖基转移酶),其允许在MAX培养基(霉酚酸、腺嘌呤和黄嘌呤)上生长。见,例如,Song,K-Y.,等人Proc.Nattl Acad.Sci.U.S.A.84:6820-6824(1987);Sambrook,J.,等人,Molecular Cloning-ALaboratory Manual,Cold Spring Harbor Laboratory,Cold SpringHarbor,N.Y.(1989),第16章。选择标记的其他实例包括:赋予对化合物如抗生素的抗性的基因,赋予在所选的底物上生长能力的基因,编码产生可检测信号如发光的蛋白质(如绿色荧光蛋白、增强的绿色荧光蛋白(eGFP))的基因。多种此类标记是已知的和可得到的,包括例如,抗生素抗性基因,如新霉素抗性基因(neo)(Southern,P.,和P.Berg,J.Mol.Appl.Genet.1:327-341(1982));和潮霉素抗性基因(hyg)(Nucleic Acids Research 11:6895-6911(1983),和Te Riele,H.,等人,Nature 348:649-651(1990))。其他选择标记基因包括:乙酰羟酸合酶(AHAS)、碱性磷酸酶(AP)、β半乳糖苷酶(LacZ)、β葡糖醛酸糖苷酶(GUS)、氯霉素乙酰转移酶(CAT)、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、辣根过氧化物氧化酶(HRP)、萤光素酶(Luc)、胭脂碱合酶(NOS)、章鱼碱合酶(OCS)、和其衍生物。可以得到多种选择标记,它们赋予对氨苄青霉素、博来霉素、氯霉素、庆大霉素、潮霉素、卡那霉素、林可霉素、氨甲蝶呤、膦丝菌素、嘌呤霉素和四环素的抗性。
掺入抗生素抗性基因和阴性选择因子的方法是本领域技术人员熟悉的(见,例如,WO 99/15650;美国专利号6,080,576;美国专利号6,136,566;Niwa等人,J.Biochem.113:343-349(1993);和Yoshida等人,Transgenic Research 4:277-287(1995))。
还可以使用选择标记的组合。例如,为了靶定免疫球蛋白基因,可以将neo基因(有或者没有其自身启动子,如上文讨论)克隆到与该免疫球蛋白基因同源的DNA序列中。为了使用标记的组合,可以克隆HSV-tk基因从而使得它在寻靶DNA的外面(如果需要,可以在相反侧翼放置另一种选择标记)。向将要靶定的细胞导入DNA构建体后,可以在合适的抗生素上选择细胞。在该具体实例中,通过同源重组最可能产生抗G418和更昔洛韦的那些细胞,在同源重组中,neo基因已经重组到免疫球蛋白基因中,但是tk基因已经失去,因为它位于双交换区的外面。
缺失可以为约50bp,更通常至少约100bp,且通常不超过约20kbp,其中缺失可以通常包括编码区的至少部分,包括一个或多个外显子的部分、一个或多个内含子的部分,并且可以包括或不包括侧翼非编码区、尤其5’非编码区(转录调节区)的部分。从而,同源区可以延伸到编码区外进入5’非编码区或者备选地进入3’非编码区。插入可以通常不超过10kbp,通常不超过5kbp,通常至少50bp,更通常至少200bp。
同源区可以包括突变,其中突变可以还灭活靶基因,以提供移码,或者改变关键氨基酸,或者突变可以校正功能异常的等位基因等等。突变可以是轻微改变,不超过同源侧翼序列的约5%。当需要基因的突变时,可以向内含子或外显子中插入标记基因。
可以根据本领域已知的方法制备构建体,可以将各个片段聚集在一起,导入合适的载体,克隆,分析然后进一步操作,直到已得到了所希望的构建体。可以对序列进行各种修饰,以允许限制酶切分析、切除、探针的鉴定,等等。如需要,可以导入沉默突变。在各个阶段,可以使用限制酶切分析、测序、用聚合酶链反应扩增、引物修复、体外诱变等等。
构建体可以用细菌载体制备,所述细菌载体包括原核生物复制系统,例如,大肠杆菌可识别的起点,可以在每个阶段克隆并分析构建体。可以使用标记,其与将用于插入的标记相同或不同,并且可以在导入靶细胞前除去。一旦含有该构建体的载体已经完成,它就可以被进一步操作,如通过缺失细菌序列、线性化、在同源序列中引入短缺失。最后操作后,可以将构建体导入细胞。
本发明还包括含有免疫球蛋白基因的序列的重组构建体。构建体包含载体,如质粒或者病毒载体,已经向其中以正向或者反向插入了本发明的序列。构建体还可以包括调节序列,包括例如,与该序列可操作地连接的启动子。许多合适的载体和启动子是本领域技术人员已知的,并且可以商购得到。提供下面的载体作为实例。细菌的:pBs、pQE-9(Qiagen)、phagescript、PsiX174、pBluescript SK、pBsKS、pNH8a、pNH16a、pNH18a、pNH46a(Stratagene);pTrc99A、pKK223-3、pKK233-3、pDR540、pRIT5(Pharmacia)。真核生物的:pWLneo、pSv2cat、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPv、pMSG、pSVL(Pharmiacia),病毒来源的载体(M13载体、噬菌体1载体、腺病毒载体和逆转录病毒载体)、高、低和可调节拷贝数载体、对于组合用于单个宿主中具有相容复制子的载体(pACYC184和pBR322)和真核附加型复制载体(pCDM8)。其他载体包括原核表达载体,如pcDNA II、pSL301、pSE280、pSE380、pSE420、pTrcHisA、B和C、pRSET A、B和C(Invitrogen,Corp.)、pGEMEX-1、和pGEMEX-2(Promega,Inc.)、pET载体(Novagen,Inc.)、pTrc99A、pKK223-3、pGEX载体、pEZZ18、pRIT2T、和pMC1871(Pharmacia,Inc.)、pKK233-2和pKK388-1(Clontech,Inc.)、和pProEx-HT(Invitrogen、Corp.)和其变体和衍生物。其他载体包括真核生物表达载体,如pFastBac、pFastBacHT、pFastBacDUAL、pSFV、和pTet-Splice(Invitrogen)、pEUK-Cl、pPUR、pMAM、pMAMneo、pBI101、pBI121、pDR2、pCMVEBNA、和pYACneo(Clontech)、pSVK3、pSVL、pMSG、pCH110、和pKK232-8(Pharmacia,Inc.)、p3′SS、pXT1、pSG5、pPbac、pMbac、pMC1neo、和pOG44(Stratagene、Inc.)、和pYES2、pAC360、pBlueBacHis A、B、和C、pVL1392、pBlueBacIII、pCDM8、pcDNA1、pZeoSV、pcDNA3pREP4、pCEP4、和pEBVHis(Invitrogen,Corp.)和其变体和衍生物。可以使用的额外的载体包括:pUC18、pUC19、pBlueScript、pSPORT、粘粒、噬菌粒、YAC’s(酵母人工染色体)、BAC’s(细菌人工染色体)、P1(大肠杆菌噬菌体)、pQE70、pQE60、pQE9(quagan)、pBS载体、PhageScript载体、BlueScript载体、pNH8A、pNH16A、pNH18A、pNH46A(Stratagene)、pcDNA3(Invitrogen)、pGEX、pTrsfus、pTrc99A、pET-5、pET-9、pKK223-3、pKK233-3、pDR540、pRIT5(Pharmacia)、pSPORT1、pSPORT2、pCMVSPORT2.0和pSV-SPORT1(Invitrogen)、pTrxFus、pThioHis、pLEX、pTrcHis、pTrcHis2、pRSET、pBlueBacHis2、pcDNA3.1/His、pcDNA3.1(-)/Myc-His、pSecTag、pEBVHis、pPIC9K、pPIC3.5K、pAO815、pPICZ、pPICZ、pGAPZ、pGAPZ、pBlueBac4.5、pBlueBacHis2、pMelBac、pSinRep5、pSinHis、pIND、pIND(SP1)、pVgRXR、pcDNA2.1、pYES2、pZErO1.1、pZErO-2.1、pCR-Blunt、pSE280、pSE380、pSE420、pVL1392、pVL1393、pCDM8、pcDNA1.1、pcDNA1.1/Amp、pcDNA3.1、pcDNA3.1/Zeo、pSe、SV2、pRc/CMV2、pRc/RSV、pREP4、pREP7、pREP8、pREP9、pREP10、pCEP4、pEBVHis、pCR3.1、pCR2.1、pCR3.1-Uni、和pCRBac(来自 Invitrogen);ExCell、gt11、pTrc99A、pKK223-3、pGEX-1T、pGEX-2T、pGEX-2TK、pGEX-4T-1、pGEX-4T-2、pGEX-4T-3、pGEX-3X、pGEX-5X-1、pGEX-5X-2、pGEX-5X-3、pEZZ18、pRIT2T、pMC1871、pSVK3、pSVL、pMSG、pCH110、pKK232-8、pSL1180、pNEO、和pUC4K(Pharmacia);pSCREEN-1b(+)、pT7Blue(R)、pT7Blue-2、pCITE-4abc(+)、pOCUS-2、pTAg、pET-32LIC、pET-30LIC、pBAC-2cp LIC、pBACgus-2cp LIC、pT7Blue-2 LIC、pT7Blue-2、SCREEN-1、BlueSTAR、pET-3abcd、pET-7abc、pET9abcd、pET11abcd、pET12abc、pET-14b、pET-15b、pET-16b、pET-17b-pET-17xb、pET-19b、pET-20b(+)、pET-21abcd(+)、pET-22b(+)、pET-23abcd(+)、pET-24abcd(+)、pET-25b(+)、pET-26b(+)、pET-27b(+)、pET-28abc(+)、pET-29abc(+)、pET-30abc(+)、pET-31b(+)、pET-32abc(+)、pET-33b(+)、pBAC-1、pBACgus-1、pBAC4x-1、pBACgus4x-1、pBAC-3cp、pBACgus-2cp、pBACsurf-1、plg、Signalplg、pYX、Selecta Vecta-Neo、Selecta Vecta-Hyg、和SelectaVecta-Gpt(来自Novagen);pLexA、pB42AD、pGBT9、pAS2-l、pGAD424、pACT2、pGAD GL、pGAD GH、pGAD10、pGilda、pEZM3、pEGFP、pEGFP-1、pEGFP-N、pEGFP-C、pEBFP、pGFPuv、pGFP、p6xHis-GFP、pSEAP2-Basic、pSEAP2-Contral、pSEAP2-启动子、pSEAP2-增强子、pgal-基本、pgal-对照、pgal-启动子、pgal-增强子、pCMV、pTet-Off、pTet-On、pTK-Hyg、pRetro-Off、pRetro-On、pIRES1neo、pIRES1hyg、pLXSN、pLNCX、pLAPSN、pMAMneo、pMAMneo-CAT、pMAMneo-LUC、pPUR、pSV2neo、pYEX4T-l/2/3、pYEX-S1、pBacPAK-His、pBacPAK8/9、pAcUW31、BacPAK6、pTriplEx、gt10、gt11、pWE15、和TriplEx(来自Clontech);Lambda ZAP II、pBK-CMV、pBK-RSV、pBluescript II KS+/-、pBluescript II SK+/-、pAD-GAL4、pBD-GAL4Cam、pSurfscript、Lambda FIX II、Lambda DASH、LambdaEMBL3、Lambda EMBL4、SuperCos、pCR-Scrigt Amp、pCR-ScriptCam、pCR-Script Direct、pBS +/-、pBC KS +/-、pBC SK +/-、Phagescript、pCAL-n-EK、pCAL-n、pCAL-c、pCAL-kc、pET-3abcd、pET-11abcd、pSPUTK、pESP-1、pCMVLacI、pOPRSVI/MCS、pOPI3CAT、pXT1、pSG5、pPbac、pMbac、pMC1neo、pMC1neo Poly A、pOG44、pOG45、pFRTGAL、pNEOGAL、pRS403、pRS404、pRS405、pRS406、pRS413、pRS414、pRS415、和pRS416来自(Stratagene)和其变体或衍生物。还可以使用双杂交和反向双杂交载体,例如,pPC86、pDBLeu、pDBTrp、pPC97、p2.5、pGAD1-3、pGAD10、pACt、pACT2、pGADGL、pGADGH、pAS2-1、pGAD424、pGBT8、pGBT9、pGAD-GAL4、pLexA、pBD-GAL4、pHISi、pHISi-1、placZi、pB42AD、pDG202、pJK202、pJG4-5、pNLexA、pYESTrp和其变体或衍生物。可以使用任何其他质粒和载体,只要它们在宿主中可复制和存活。
可以用于允许DNA构建体进入宿主细胞的技术包括,例如,磷酸钙/DNA共沉淀、DNA向细胞核中的显微注射、电穿孔、细菌与完整细胞的原生质体融合、转染或者本领域技术人员已知的任意其他技术。DNA可以是单链或者双链的、线性或环状的、松弛或者超螺旋DNA。对于用于转染哺乳动物细胞的各种技术,见例如,Keown等人,Methods in Enzymology Vol.185,pp.527-537(1990)。
在一个具体实施方案中,通过用含有从等基因DNA分离的免疫球蛋白基因序列的敲除载体转染原代胎儿成纤维细胞,可以产生杂合或纯合的敲除细胞。在另一实施方案中,载体可以结合启动子捕获策略,其中使用例如IRES(内部核糖体进入位点)来启动Neor基因的翻译。
位点特异性重组酶
在额外实施方案中,寻靶构建体可以含有位点特异性重组酶位点,如lox。在一个实施方案中,寻靶臂可以将位点特异性重组酶靶位点插入到靶定的区域中,从而使得一个位点特异性重组酶靶位点位于第二个位点特异性重组酶靶位点的5’。然后,该位点特异性重组酶被激活和/或应用于细胞,从而使得切除两个位点特异性重组酶位点之间的间插核苷酸序列。
位点特异性重组酶包括识别并结合短核苷酸位点或者序列特异性重组酶靶位点,即,重组酶识别位点,并催化与这些位点有关的核酸重组的酶或者重组酶。这些酶包括重组酶、转座酶和整合酶。序列特异性重组酶靶位点的实例包括,但不限于,lox位点、att位点、dif位点和frt位点。位点特异性重组酶的非限制性实例包括,但不限于,噬菌体P1 Cre重组酶、酵母FLP重组酶、Inti整合酶、λ噬菌体、phi 80、P22、P2、186和P4重组酶、Tn3解离酶、Hin重组酶和Cin重组酶、大肠杆菌xerC和xerD重组酶、苏云金芽孢杆菌(Bacillusthuringiensis)重组酶、TpnI和β-内酰胺酶转座子,和免疫球蛋白重组酶。
在一个实施方案中,重组位点可以是噬菌体P1的Cre重组酶识别的lox位点。Lox位点指噬菌体P1的cre基因产物Cre重组酶可以催化位点特异性重组事件所处的核苷酸序列。多种lox位点是本领域已知的,包括天然存在的loxP、loxB、loxL和loxR,以及许多突变体或者变体lox位点,如loxP511、loxP514、lox.DELTA.86、lox.DELTA.117、loxC2、loxP2、loxP3和lox P23。Lox位点的额外实例包括,但不限于loxB、loxL、loxR、loxP、loxP3、loxP23、loxΔ86、loxΔ117、loxP511和loxC2。
在另一实施方案中,重组位点是非Cre的重组酶识别的重组位点。在一个实施方案中,重组酶位点可以是啤酒糖酵母(Saccharomyces cerevisiae)的2pi质粒的FLP重组酶识别的FRT位点。FRT位点指酵母2μ质粒的FLP基因产物FLP重组酶催化位点特异性重组所处的核苷酸序列。非-Cre重组酶的额外实例包括,但不限于位点特异性重组酶,包括:λ噬菌体的Int重组酶识别的att位点(例如,att1、att2、att3、attP、attB、attL和attR)、解离酶家族识别的重组位点和苏云金芽孢杆菌的转座酶识别的重组位点。
在本发明的具体实施方案中,寻靶构建体可以含有:与本文描述的猪免疫球蛋白基因同源的序列、选择标记基因和/或位点特异性重组酶靶位点。
同源重组的细胞的选择
然后可以在合适选择的培养基上培养细胞以鉴定提供合适的整合的细胞。插入免疫球蛋白基因的选择标记基因的存在确立了靶构建体向宿主基因组中的整合。这些显示出所需表型的细胞可以通过限制酶切分析、电泳、DNA印迹分析、聚合酶链反应等等进一步分析DNA,以确定发生了同源还是非同源重组。这可以通过下述方法确定:使用插入片段的探针,然后对插入片段侧翼的5’和3’区测序以确定延伸到构建体的侧翼区之外的免疫球蛋白基因的存在或者当导入缺失时,鉴定该缺失的存在。还可以使用与构建体内的序列互补和与构建体外面的序列互补和在靶基因座的引物。这样,如果已经发生了同源重组,那么人们仅可以得到在互补链中存在两个引物的DNA双链体。通过阐明引物序列或者预期大小的序列的存在,来支持同源重组的发生。
用于筛选同源重组事件的聚合酶链反应是本领域已知的,见例如,Kim和Smithies,Nucleic Acids Res.16:8887-8903,1988;和Joyner等人,Nature 338:153-156,1989。Thomas和Capecchi,同上,1987;Nicholas和Berg(1983)在Teratocarcinoma Stem Cell,eds.Siver,Martin和Strikland(Cold Spring Harbor Lab.,Cold SpringHarbor,N.Y.(pp.469-497);和Linney和Donerly,Cell 35:693-699,1983已经显示,驱动新霉素基因的突变的多瘤增强子和胸苷激酶启动子的特定组合在胚胎干细胞和EC细胞中是有效的。
从第一轮寻靶得到的细胞系对于靶定的等位基因可能是杂合的。可以以多种方式实现纯合性,其中两个等位基因都被修饰。一种方法是生长许多其中一个拷贝已经被修饰的细胞,然后将这些细胞使用不同选择标记进行另一轮的寻靶。备选地,根据传统孟德尔遗传学,通过将对修饰的等位基因杂合的动物育种得到纯合子。在一些情况下,需要具有两个不同修饰的等位基因。这可以通过连续轮的基因寻靶或者通过育种杂合子(每个杂合子携带一个所需的经修饰等位基因)来实现。
已经经历同源重组的细胞的鉴定
在一个实施方案中,选择方法可以直接检测免疫球蛋白基因的缺失,该缺失是由于通过同源重组对该免疫球蛋白基因的定向敲除,或者基因中的导致无功能或者不表达的免疫球蛋白的突变。通过抗生素抗性选择已经最常用于筛选(见上文)。该方法可以检测寻靶载体上抗性基因的存在,但是不直接指出整合是定向的重组事件还是随机整合。某些技术,如聚腺苷酸和启动子捕获技术,增加了定向事件的概率,但是仍然不给出所需表型的直接证据,已经得到了免疫球蛋白基因表达缺陷的细胞。此外,负选择形式可以用于选择定向整合;在这些情况中,细胞致死因子的基因以这样的方式插入,从而使得仅定向事件允许细胞避免死亡。通过这些方法选择的细胞然后可以测定其基因破坏、载体整合和最终测定免疫球蛋白基因缺失。在这些情况中,因为选择是基于检测寻靶载体整合并且不是基于改变的表型,所以仅仅可以检测定向敲除,而检测不到点突变、基因重排或者截短或者其他此类修饰。
可以进一步表征被认为缺少功能性免疫球蛋白基因表达的动物细胞。此类表征可以通过下面的技术实现,包括,但不限于:PCR分析、DNA印迹分析、RNA印迹分析、特异凝集素结合测定法,和/或测序分析。
如技术中描述的PCR分析可以用于确定寻靶载体的整合。在一个实施方案中,扩增引物可以在抗生素抗性基因中产生并且延伸到载体序列外的区域中。可以用DNA印迹分析表征基因座中的总体修饰,如寻靶载体向免疫球蛋白基因座中的整合。然而,RNA印迹分析可以用于表征从每个等位基因产生的转录物。
此外,从RNA转录物产生的cDNA的测序分析地可以用于确定免疫球蛋白等位基因中任何突变的精确位置。
在本发明的另一方面,提供了根据本文描述的方法、序列和/或构建体产生的缺少有蹄类动物重链、κ轻链和/或λ轻链基因座的功能区的至少一个等位基因的有蹄类动物细胞。这些细胞可以由于同源重组得到。具体地,通过灭活有蹄类动物重链、κ轻链或λ轻链基因的至少一个等位基因,可以产生表达猪抗体的能力降低的细胞。在其他实施方案中,可以根据本文描述的方法、序列和/或构建体产生缺少有蹄类动物重链、κ轻链和/或λ轻链基因的两个等位基因的哺乳动物细胞。在进一步的实施方案中,提供了猪动物,其中通过根据本文描述的方法、序列和/或构建体产生的遗传寻靶事件灭活有蹄类动物重链、κ轻链和/或λ轻链基因的至少一个等位基因。在本发明的另一方面,提供了猪动物,其中通过遗传寻靶事件灭活了有蹄类动物重链、κ轻链和/或λ轻链基因的两个等位基因。基因可以通过同源重组靶定。在其他实施方案中,可以破坏基因,即,可以改变遗传密码的部分,从而影响基因的该区段的转录和/或翻译。例如,可以通过替代、缺失(“敲除”)或者插入(“敲入”)技术发生基因的破坏。可以插入所需蛋白质的额外基因或者调节现有序列转录的调节序列。
在本发明的实施方案中,根据本文描述的方法、序列和/或构建体使得有蹄类动物重链、κ轻链或者λ轻链基因的等位基因失活,从而不再能产生功能性有蹄类动物免疫球蛋白。在一个实施方案中,可以将靶定的免疫球蛋白基因转录成RNA,但是不翻译成蛋白质。在另一实施方案中,可以将靶定的免疫球蛋白基因以失活的截短形式转录。这种截短的RNA可以不被翻译或者可以翻译成无功能的蛋白质。在备选实施方案中,可以将靶定的免疫球蛋白基因以这样的方式灭活,从而使得不发生基因的转录。在另一实施方案中,可以转录靶定的免疫球蛋白基因,然后翻译成无功能的蛋白质。
III.含有人免疫球蛋白基因的人工染色体的插入
人工染色体
本发明的一方面提供了根据本文描述的方法、序列和/或构建体产生的有蹄类动物和有蹄类动物细胞,它们缺少有蹄类动物重链、κ轻链和/或λ轻链基因座的功能区的至少一个等位基因,所述有蹄类动物和有蹄类动物细胞进一步修饰以表达人抗体(即,免疫球蛋白(Ig))基因座的至少部分。该人基因座可以经历重排并在有蹄类动物中表达人抗体分子的不同群体。这些克隆的转基因有蹄类动物提供了人抗体(如多克隆抗体)的可补充的、理论上无限的供应,所述抗体可以用于治疗、诊断、纯化和其他临床上相关的目的。
在一个具体实施方案中,人工染色体(AC)可以用于实现向有蹄类动物细胞和动物中转移人免疫球蛋白基因。AC允许含有单个或多个基因的兆碱基大小的DNA片段的定向整合。因此,AC可以将同源DNA导入所选细胞中以用于产生通过异源DNA编码的基因产物。在一个实施方案中,具有整合的人免疫球蛋白DNA的一个或多个AC可以用作将人Ig基因导入有蹄类动物(如猪)的载体。
AC首先在1983年在酵母中构建,是人造的线性DNA分子,其从负责天然染色体的正确复制和分配的基本顺式作用DNA序列元件构建(Murray等人(1983),Nature 301:189-193)。染色体需要至少三个元件来发挥功能。具体地,人工染色体的元件包括至少:(1)自主复制序列(ARS)(具有复制起点的性质,其是用于启动DNA复制的位点),(2)着丝粒(动粒装配的位点,其负责有丝分裂和减数分裂时复制的染色体的正确分配),和(3)端粒(在线性染色体末端的特化结构,其功能为稳定末端并且促进DNA分子的最末端的完全复制)。
在一个实施方案中,人Ig可以维持为与有蹄类动物染色体DNA分离的独立的单位(附加体)。例如,附加体载体含有细胞内DNA复制和载体维持所需的必需DNA序列元件。附加体载体可以通过商业途径获得(见,例如,Maniatis,T.等人,Molecular Cloning,ALaboratory Manual(1982)pp.368-369)。AC可以稳定复制并且与内源染色体一起分离。在备选实施方案中,人IgG DNA序列可以整合到有蹄类动物细胞的染色体中,从而允许新信息复制和分配到细胞的子代作为天然染色体的部分(见,例如,Wigler等人(1977),Cell11:223)。可以将AC易位或者插入到有蹄类细胞的内源染色体中。两个或更多个AC可以同时或者顺序地导入宿主细胞中。
此外,AC可以提供基因组外基因座,用于含有单个或多个基因,包括可操作地连接一个启动子的单个基因的多个拷贝或者连接到单独的启动子的每个拷贝或者几个拷贝的兆碱基大小的DNA片段的定向整合。AC可以允许含有单个或多个人免疫球蛋白基因的兆碱基大小的DNA片段的定向整合。通过在本领域技术人员已知的条件下培养具有双着丝粒染色体(即,具有两个着丝粒的染色体)的细胞,从而染色体分裂形成微型染色体和以前的双着丝粒染色体,可以产生AC。
AC可以从人(人人工染色体:“HAC”)、酵母(酵母人工染色体:“YAC”)、细菌(细菌人工染色体:“BAC”)、噬菌体P1衍生的人工染色体:“PAC”)和其他哺乳动物(哺乳动物人工染色体:“MAC”)构建。AC基于着丝粒的来源命名(例如,YAC、BAC、PAC、MAC、HAC)。例如,YAC可以从啤酒糖酵母得到着丝粒。另一方面,MAC包括活性哺乳动物着丝粒,而HAC指包括人着丝粒的染色体。此外,还可以构建植物人工染色体(“PLAC”)和昆虫人工染色体。AC可以包括来自染色体的负责复制和维持的元件。因此,AC能够稳定维持大的基因组DNA片段,如人Ig DNA。
在一个实施方案中,提供了含有YAC的有蹄类动物。YAC是基因工程改造的环形染色体,其含有来自酵母如啤酒糖酵母染色体的元件,和外来DNA的区段,该区段比常规克隆载体(例如,质粒、粘粒)接受的区段大得多。YAC允许外源DNA的极大区段(Schlessinger,D.(1990),Trends in Genetics 6:248-253)在哺乳动物细胞和动物中增殖(Choi等人(1993),Nature Gen 4:117-123)。YAC转基因方法非常有效并且通过有效操作克隆的DNA的能力得到极大的增强。酵母的主要技术优点是通过DNA介导的转化和同源重组可以进行的特定基因组修饰的容易性(Ramsay,M.(1994),Mol Biotech 1:181-201)。在一个实施方案中,具有整合的人Ig DNA的一个或多个YAC可以用作将人Ig基因导入有蹄类动物(如猪)的载体。
YAC载体含有用于在酵母中复制的特定结构元件,包括:着丝粒、端粒、自主复制序列(ARS)、酵母选择标记(例如,TRP1、URA3和SUP4),和用于插入外源DNA的大于50kb的大区段的克隆位点。标记基因可以允许选择携带YAC的细胞并作为特定限制性内切核酸酶合成的位点。例如,TRP1和URA3基因可以用作双重选择标记来确保仅维持完整的人工染色体。可以在着丝粒的两边携带酵母选择标记,并且协助体内端粒形成的两个序列是分离的。然而,酵母细胞的总DNA的仅1%的部分是复制所必需的,包括染色体的中心(着丝粒,其作为姐妹染色单体之间的附着位点和有丝分裂期间纺锤丝附着的位点)、染色体的末端(端粒,其作为维持真核生物染色体末端必需的序列),和DNA的另一个短序列,其称作ARS,作为DNA区段,其中双螺旋可以解旋并且开始自己复制。
在一个实施方案中,YAC可以用于克隆最高达约1、2或者3Mb免疫球蛋白DNA。在另一实施方案中,至少25、30、40、50、60、70、75、80、85、90或95kb。
酵母整合质粒、复制载体(其是YAC的片段)也可以用于表达人Ig。酵母整合质粒可以含有提供复制起点和用于在细菌(例如,大肠杆菌)中生长的药物抗性基因的细菌质粒序列、用于选择酵母中的转化体的酵母标记基因,和用于插入Ig序列的限制位点。宿主细胞可以通过将该质粒直接整合在染色体中而稳定获得该质粒。酵母复制载体也可以用于表达人Ig作为酵母中的游离质粒环。通过加入着丝粒序列可以稳定酵母或者含有ARS的载体。YAC具有着丝粒和端粒区,并且可以用于克隆DNA的非常大的片段,因为重组体基本上作为酵母染色体维持。
YAC如在美国专利号6,692,954、6,495,318、6,391,642、6,287,853、6,221,588、6,166,288、6,096,878、6,015,708、5,981,175、5,939,255、5,843,671、5,783,385、5,776,745、5,578,461和4,889,806;欧洲专利号1356062和0648265;PCT公开号WO 03/025222、WO02/057437、WO 02/101044、WO 02/057437、WO 98/36082、WO98/12335、WO 98/01573、WO 96/01276、WO 95/14769、WO 95/05847、WO 94/23049和WO 94/00569中公开的提供。
在另一实施方案中,提供了含有BAC的有蹄类动物。BAC是在细菌如大肠杆菌中发现的基于F的质粒,其可以向宿主细胞中转移约300kb的外来DNA。一旦Ig DNA已经克隆到宿主细胞中,新插入的区段就可以随着质粒的剩余部分一起复制。结果,可以在非常短的时间内产生外来DNA的数十亿拷贝。在具体实施方案中,具有整合的人Ig DNA的一个或多个BAC用作向有蹄类动物(例如猪)中导入人Ig基因的载体。
BAC克隆系统基于大肠杆菌F因子,其复制受到严格控制并且从而确保大构建体的稳定维持(Willets,N.,和R.Skurray(1987),Structure and function of the F-factor and mechanism of conj ugation.In Escherichia coli and Salmonella Typhimurium:Cellular andMolecular Biology(F.C.Neidhardt,Ed)Vol.2 pp 1110-1133,Am.Soc.Microbiol.,Washington,D.C.)。BAC已经广泛用于从各种真核生物物种克隆DNA(Cai等人(1995),Genomics 29:413-425;Kim等人(1996),Genomics 34:213-218;Misumi等人(1997),Genomics40:147-150;Woo等人(1994),Nucleic Acids Res 22:4922-4931;Zimmer,R.和Gibbins,A.M.V.(1997),Genomics 42:217-226)。F质粒的低发生率可以减小DNA片段之间的重组潜力并且可以避免克隆的细菌基因的致命超表达。BAC可以将单个拷贝载体中的人免疫球蛋白基因稳定维持在宿主细胞中,甚至在连续生长100或更多世代之后。
BAC(或者pBAC)载体可以容纳约30到300kb对范围的插入片段。一种特定类型的BAC载体pBeloBac11使用lacZ基因的互补,通过颜色区分含有插入片段的重组分子与携带BAC载体的菌落。当将DNA片段克隆到pBeloBac11的lacZ基因中时,插入激活导致转化后在X-Gal/IPTG板上形成白色菌落(Kim等人(1996),Genomics34:213-218)以容易鉴定阳性克隆。
例如,BAC可以如美国专利号6,713,281、6,703,198、6,649,347、6,638,722、6,586,184、6,573,090、6,548,256、6,534,262、6,492,577、6,492,506、6,485,912、6,472,177、6,455,254、6,383,756、6,277,621、6,183,957、6,156,574、6,127,171、5,874,259、5,707,811和5,597,694;欧洲专利号0 805 851;PCT公开号WO 03/087330、WO 02/00916、WO 01/39797、WO 01/04302、WO 00/79001、WO 99/54487、WO99/27118和WO 96/21725中公开的提供。
在另一实施方案中,提供了含有噬菌体PAC的有蹄类动物。在具体实施方案中,具有整合的人Ig DNA的一种或多种噬菌体PAC用作向有蹄类动物(例如猪)中导入人Ig基因的载体。例如,PAC可以如美国专利号6,743,906、6,730,500、6,689,606、6,673,909、6,642,207、6,632,934、6,573,090、6,544,768、6,489,458、6,485,912、6,469,144、6,462,176、6,413,776、6,399,312、6,340,595、6,287,854、6,284,882、6,277,621、6,271,008、6,187,533、6,156,574、6,153,740、6,143,949、6,017,755和5,973,133;欧洲专利号0 814 156;PCT公开号WO 03/091426、WO 03/076573、WO 03/020898、WO 02/101022、WO 02/070696、WO 02/061073、WO 02/31202、WO 01/44486、WO01/07478、WO 01/05962和WO 99/63103中公开的提供。
在另一实施方案中,提供了含有MAC的有蹄类动物。MAC具有高有丝分裂稳定性、一致和受调节的基因表达、高克隆能力和非免疫原性。哺乳动物染色体可以包含约50到250Mb大小的DNA的连续线性链。DNA构建体可以还含有DNA构建体在酵母细胞中增殖必需的一种或多种序列。DNA构建体还含有编码选择标记基因的序列。DNA构建体可以能够在用该DNA构建体转化的细胞中作为染色体进行维持。MAC提供基因组外特异整合位点用于导入编码目的蛋白质的基因和允许兆碱基大小的DNA整合,从而例如,编码整个代谢途径的基因、非常大的基因[例如,囊性纤维化(CF)基因(~600kb)]或者几种基因[例如,用于制备多价疫苗的一系列抗原]可以稳定导入细胞中。
提供了哺乳动物人工染色体[MAC]。还提供了其他高等真核生物物种,如昆虫和鱼的人工染色体,它们使用本文提供的MACS产生。用于产生和分离此类染色体的方法。还提供了使用MAC从其他物种如昆虫和鱼物种构建人工染色体的方法。人工染色体是完全功能性的稳定染色体。提供了两种类型的人工染色体。一种类型在本文中称作SATAC[随体人工染色体]是稳定的异染色质染色体,且另一类型是基于常染色质的扩增的微型染色体。如本文使用的,前面的双着丝粒染色体是当双着丝粒染色体断裂并且获得新的端粒时产生的染色体,从而产生两个染色体,每个染色体具有一个着丝粒。每个片段都可以是可复制的染色体。
还提供了其他高等真核生物物种,如昆虫和鱼的人工染色体,它们使用本文提供的MACS产生。在一个实施方案中,提供了SATAC[随体人工染色体]。SATAC是稳定的异染色质染色体。在另一实施方案中,提供了微型染色体,其中微型染色体基于常染色质的扩增。
在一个实施方案中,通过将细胞与双着丝粒染色体在染色体断裂以形成微型染色体和以前的双着丝粒染色体的条件下培养,产生了人工染色体。在一个实施方案中,SATAC可以从微型染色体片段产生,见例如,美国专利号5,288,625。在另一实施方案中,SATAC可以从以前的双着丝粒染色体的片段产生。SATAC可以由短卫星DNA的重复单位组成并且可是完全异染色质的。在一个实施方案中,不存在异源或者外来DNA的插入,SATAC不含有遗传信息。在其他实施方案中,提供了各种大小的SATAC,它们通过在选择条件下反复培养并亚克隆含有从以前的双着丝粒染色体产生的染色体的细胞来提供。这些染色体可以基于大小为7.5到10Mb的重复单位,或者兆复制子(megareplicon)。这些兆复制子可以是卫星DNA的串联块,其侧翼为异源的非卫星DNA。扩增可以产生相同的染色体区段(每个称作扩增子)的串联排列,所述区段含有边界为异源[“外来”]DNA的两个倒置的兆复制子。反复细胞融合,在选择培养基上生长和/或BrdU[5-溴脱氧尿苷]处理,或者其他基因组去稳定剂或者试剂,如电离辐射,包括X射线处理,以及亚克隆导致得到这样的细胞系,其携带稳定的异染色质或者部分异染色质的染色体,包括150-200Mb“腊肠(sausage)”染色体、500-1000Mb千兆染色体(gigachromosome)、稳定的250-400Mb兆染色体(megachromosome)和多种从其得到的较小的稳定染色体。这些染色体基于这些重复单位并且可以包括所表达的人免疫球蛋白DNA(也见美国专利号6,743,967)。
在其他实施方案中,MAC可以如美国专利号6,743,967、6,682,729、6,569,643、6,558,902、6,548,287、6,410,722、6,348,353、6,297,029、6,265,211、6,207,648、6,150,170、6,150,160、6,133,503、6,077,697、6,025,155、5,997,881、5,985,846、5,981,225、5,877,159、5,851,760和5,721,118;PCT公开号WO 04/066945、WO 04/044129、WO 04/035729、WO 04/033668、WO 04/027075、WO 04/016791、WO 04/009788、WO 04/007750、WO 03/083054、WO 03/068910、WO 03/068909、WO 03/064613、WO 03/052050、WO 03/027315、WO 03/023029、WO 03/012126、WO 03/006610、WO 03/000921、WO 02/103032、WO 02/097059、WO 02/096923、WO 02/095003、WO 02/092615、WO 02/081710、WO 02/059330、WO 02/059296、WO 00/18941、WO 97/16533和WO 96/40965中公开的提供。
在本发明的另一方面,提供了含有HAC的有蹄类动物和有蹄类动物细胞。在具体实施方案中,具有整合的人Ig DNA的一种或多种HAC用作向有蹄类动物(如猪)中导入人Ig基因的载体。在具体实施方案中,具有整合的人Ig DNA的一种或多种HAC用于通过核转移产生有蹄类动物(如猪),其应答免疫而表达人Ig并且经历亲和力成熟。
各种方法可以用于产生表达人抗体(“人Ig”)的有蹄类动物。这些方法包括例如,在其胚胎阶段或者在其出生后向有蹄类动物中插入含有重链和轻链Ig基因的HAC或者向有蹄类动物插入人B细胞或者B细胞前体(例如,免疫缺陷的或者免疫抑制的有蹄类动物)(见,例如,2000年11月17日提交的WO 01/35735,2002年3月20日提交的US 02/08645)。在任一情况下,在有蹄类动物中可以同时存在产生人抗体的细胞和产生有蹄类动物抗体的B细胞。在含有HAC的有蹄类动物中,单个B细胞可以产生含有有蹄类动物和人重链和轻链蛋白质的组合的抗体。在其他实施方案中,HAC的总大小为至少约1、2、3、4、5、6、7、8、9或10Mb。
例如,HAC可以如美国专利号6,642,207、6,590,089、6,566,066、6,524,799、6,500,642、6,485,910、6,475,752、6,458,561、6,455,026、6,448,041、6,410,722、6,358,523、6,277,621、6,265,211、6,146,827、6,143,566、6,077,697、6,025,155、6,020,142和5,972,649;美国专利申请号2003/0037347;PCT公开号WO 04/050704、WO 04/044156、WO 04/031385、WO 04/016791、WO 03/101396、WO 03/097812、WO 03/093469、WO 03/091426、WO 03/057923、WO 03/057849、WO 03/027638、WO 03/020898、WO 02/092812、和WO 98/27200中公开的提供。
可以插入人免疫球蛋白序列以用于本发明的AC的额外实例包括例如,BACs(例如,pBeloBAC11或pBAC108L;见,例如,Shizuya等人(1992),Proc Natl Acad Sci USA 89(18):8794-8797;Wang等人(1997),Biotechniques 23(6):992-994)、噬菌体PACs、YACs(见,例如,Burke(1990),Genet Anal Tech Appl 7(5):94-99),和MACs(见,例如,Vos(1997),Nat.Biotechnol.15(12):1257-1259;Ascenzioni等人(1997),Cancer Lett 118(2):135-142),如HACs,也见,美国专利号6,743,967、6,716,608、6,692,954、6,670,154、6,642,207、6,638,722、6,573,090、6,492,506、6,348,353、6,287,853、6,277,621、6,183,957、6,156,953、6,133,503、6,090,584、6,077,697、6,025,155、6,015,708、5,981,175、5,874,259、5,721,118和5,270,201;欧洲专利号1 437 400、1 234 024、1 356 062、0 959 134、1 056 878、0 986 648、0 648 265和0 338 266;PCT公开号WO 04/013299、WO 01/07478、WO00/06715、WO 99/43842、WO 99/27118、WO 98/55637、WO 94/00569和WO 89/09219。额外的实例包括例如在PCT公开号WO02/076508、WO 03/093469、WO 02/097059;WO 02/096923;US公开号US 2003/0113917和US 2003/003435;和美国专利号6,025,155中提供的那些AC。
在本发明的其他实施方案中,AC通过在每世代中的雄性配子发生传递。AC可以是整合的或非整合的。在一个实施方案中,AC可以通过基本上所有分裂的细胞中的有丝分裂传递。在另一实施方案中,AC可以提供人免疫球蛋白核酸序列的不依赖于位置的表达。在具体实施方案中,AC可以通过每个雄性和雌性配子发生而具有至少10%的传递效率。在一个具体实施方案中,AC可以是环状的。在另一具体实施方案中,非整合AC可以是2000年3月27日以保藏号LMBP 5473 CB保藏在比利时微生物协调保藏中心——BCCM的非整合AC。在额外实施方案中,提供了产生AC的方法,其中鉴定含有通过雄性配子发生传递的外源核酸的有丝分裂稳定的单位;并且有丝分裂稳定的单位中的进入位点允许人免疫球蛋白基因整合到该单位中。
在其他实施方案中,提供了AC,其包括:功能性着丝粒、选择标记和/或独特克隆位点。在其他实施方案中,AC可以显示出一种或多种下面的性质:它可以作为独立的染色体稳定分离,免疫球蛋白序列可以以受控的方式插入并且可以从AC表达,它可以通过雄性和雌性种系有效传递和/或转基因动物可以在大于约30、40、50、60、70、80或90%的它的细胞中具有该染色体。
在具体的实施方案中,AC可以从成纤维细胞(如任何哺乳动物或者人成纤维细胞)分离,其中它是有丝分裂稳定的。将AC转移到仓鼠细胞中后,可以插入lox(如loxP)位点和选择标记位点。在其他实施方案中,AC可以维持有丝分裂稳定性,例如,不存在选择时,每次有丝分裂的损失小于约百分之5、2、1、0.5或0.25。也见US2003/0064509和WO 01/77357。
异种免疫球蛋白基因
在本发明的另一方面,提供了表达异种免疫球蛋白基因座或者其片段的转基因有蹄类动物,其中该免疫球蛋白可以从整合在内源有蹄类动物染色体的免疫球蛋白基因座表达。在一个实施方案中,提供了从转基因动物得到的有蹄类动物细胞。在一个实施方案中,该异种免疫球蛋白基因座被后代遗传。在另一实施方案中,该异种免疫球蛋白基因座可以通过雄性种系由后代遗传。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在进一步的实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
在其他实施方案中,缺少功能性内源免疫球蛋白的任何表达的转基因有蹄类动物可以进一步基因修饰以表达异种免疫球蛋白基因座。在备选实施方案中,提供了含有异种免疫球蛋白基因座的猪动物。在一个实施方案中,异种免疫球蛋白基因座可以是重链和/或轻链免疫球蛋白或者其片段。在另一个实施方案中,异种免疫球蛋白基因座可以是κ链基因座或者其片段和/或λ链基因座或者其片段。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在另一实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或者其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
在其他实施方案中,缺少功能性内源免疫球蛋白的任何表达的转基因有蹄类动物可以进一步基因修饰以表达异种免疫球蛋白基因座。在备选实施方案中,提供了含有异种免疫球蛋白基因座的猪动物。在一个实施方案中,异种免疫球蛋白基因座可以是重链和/或轻链免疫球蛋白或者其片段。在另一个实施方案中,异种免疫球蛋白基因座可以是κ链基因座或者其片段和/或λ链基因座或者其片段。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在另一实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或者其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
在另一实施方案中,提供了含有异种免疫球蛋白基因座的猪动物。在一个实施方案中,异种免疫球蛋白基因座可以是重链和/或轻链免疫球蛋白或者其片段。在另一个实施方案中,异种免疫球蛋白基因座可以是κ链基因座或者其片段和/或λ链基因座或者其片段。在其他实施方案中,人工染色体(AC)可以含有异种免疫球蛋白。在一个实施方案中,AC可以是酵母AC或者哺乳动物AC。在另一实施方案中,异种基因座可以是人免疫球蛋白基因座或者其片段。在一个实施方案中,人免疫球蛋白基因座可以是人14号染色体、人2号染色体和人22号染色体或者其片段。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白的任意片段,该片段可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括人免疫球蛋白重链和人免疫球蛋白轻链的任意片段,其可以经历重排。在另一实施方案中,人免疫球蛋白基因座可以包括任意人免疫球蛋白基因座或者其片段,其在暴露于抗原后可以产生抗体。在具体实施方案中,应答对一种或多种抗原的暴露,所述外源人免疫球蛋白可以在B细胞中表达以产生异种免疫球蛋白。
可以将人免疫球蛋白基因,如Ig重链基因(人414号染色体)、Igκ链基因(人2号染色体)和/或Igλ链基因(22号染色体)插入到Ac中,如上述。在具体实施方案中,人重链、κ和/或λIg基因的任意部分可以插入到AC中。在一个实施方案中,核酸可以与来自人的天然存在的核酸的对应区域至少70、80、90、95或99%相同。在其他实施方案中,有蹄类动物产生超过一类的人抗体。在各种实施方案中,有蹄类动物产生超过一种不同的人Ig或者抗体。在一个实施方案中,可以导入含有人Ig重链基因和Ig轻链基因两者的AC,如自主人人工染色体(“AHAC”,在体内通过内源表达的限制性内切核酸酶转化成线性人染色体的环状重组核酸分子)。在一个实施方案中,人重链基因座和轻链基因座在不同的染色体臂(即,在着丝粒的不同侧)上。在一个实施方案中,重链可以包括μ重链,且轻链可以是λ或κ轻链。Ig基因可以在一个或超过一个的AC中同时或顺序导入。
在具体实施方案中,有蹄类动物或者有蹄类动物细胞表达编码人Ig基因的全部或者部分的一种或多种核酸,所述人Ig基因经历重排并且表达超过一种的人Ig分子,如人抗体蛋白质。从而,编码人Ig链或者抗体的核酸为其未重排的形式(即,该核酸没有经历V(D)J重组)。在具体实施方案中,编码抗体轻链的V基因区段的所有核酸区段可以与编码J基因区段的所有核酸区段通过一个或多个核苷酸隔开。在具体实施方案中,编码抗体重链的V基因区段的所有核酸区段可以与编码D基因区段的所有核酸区段通过一个或多个核苷酸隔开,和/或编码抗体重链的D基因区段的所有核酸区段可以与编码J基因区段的所有核酸区段通过一个或多个核苷酸隔开。向含有未重排的人Ig基因的转基因有蹄类动物施用抗原后,接着在人Ig基因座中核酸区段重排并产生与抗原反应的人抗体。
在一个实施方案中,AC可以表达人染色体的部分或者片段,其含有免疫球蛋白基因。在一个实施方案中,AC可以表达人轻链基因座的至少300或者1300kb,如Davies等人1993 Biotechnology 11:911-914中所述。
在另一实施方案中,AC可以表达人22号染色体的部分,其含有至少λ轻链基因座,包括Vλ基因区段、Jλ基因区段和单个Cλ基因。在另一实施方案中,AC可以表达至少一个Vλ基因区段、至少一个Jλ基因区段和Cλ基因。在其他实施方案中,AC可以含有λ基因座的部分,如Popov等人J Exp Med.1999 May 17;189(10):1611-20中描述。
在另一实施方案中,AC可以表达人2号染色体的部分,其含有至少κ轻链基因座,包括Vκ基因区段、Jκ基因区段和单个Cκ基因。在另一实施方案中,AC可以表达至少一个Vκ基因区段、至少一个Jκ基因区段和Cκ基因。在其他实施方案中,含有κ轻链基因座的部分的AC可以是例如Li等人2000 J Immunol 164:812-824和Li SProc Natl Acad Sci U S A.1987 Jun;84(12):4229-33中描述的那些。在另一实施方案中,提供了含有约1.3Mb人κ基因座的AC,如Zou等人FASEB J.1996 Aug;10(10):1227-32中所述。
在其他实施方案中,AC可以表达人14号染色体的部分,其含有至少人重链基因座,包括VH、DH、JH和CH基因区段。在另一实施方案中,AC可以表达至少一个VH基因区段、至少一个DH基因区段、至少一个JH基因区段和至少一个CH基因区段。在其他实施方案中,AC可以表达人重链基因座的至少85kb,如Choi等人1993 Nat Gen4:117-123和/或Zou等人1996 PNAS 96:14100-14105中所述。
在其他实施方案中,AC可以表达重链和轻链基因座的部分,如至少220、170、800或1020kb,如Green等人1994 Nat Gen 7:13-22;Mendez等人,1995 Genomics 26:294-307;Mendez等人1997Nat Gen 15:146-156;Green等人1998 J Exp Med 188:483-495和/或Fishwild等人1996 Nat Biotech 14:845-851中公开的。在另一实施方案中,AC可以表达兆碱基量的人免疫球蛋白,如Nicholson JImmunol.1999 Dec 15;163(12):6898-906和Popov Gene.1996 Oct24;177(l-2):195-201中所述。此外,在一个具体实施方案中,来自人14号染色体(包含Ig重链基因)、人2号染色体(包含Igκ链基因)和人22号染色体(包含Igλ链基因)的MAC可以同时或者连续导入,如Robl等人的美国专利公开号2004/0068760中所述。在另一实施方案中,MAC的总大小小于或者等于约10、9、8或者7兆碱基。
在具体实施方案中,可以将种系构型的人免疫球蛋白的人Vh、人Dh、人Jh区段和人μ区段插入AC,如YAC,从而使得Vh、Dh、Jh和μDNA区段形成免疫球蛋白谱,其含有对应于人DNA区段的部分,例如,如Babraham Insttitute的美国专利号5,545,807所述。此类AC在插入有蹄类动物细胞和产生有蹄类动物后可以产生重链免疫球蛋白。在一个实施方案中,这些免疫球蛋白可以形成功能性重链-轻链免疫球蛋白。在另一实施方案中,这些免疫球蛋白可以以允许从有蹄类动物的合适的细胞或者体液回收的量表达。此类免疫球蛋白可以插入酵母人工染色体载体,如Burke,D T,Carle,G F和Olson,MV(1987)"Cloning of large segments of exogenous DNA into yeast bymeans of artificial chromosome vectors"Science,236,806-812所述,或者通过导入染色体片段(如Richer,J和Lo,C W(1989)"Introduction of human DNA into mouse eggs by injection ofdissected human chromosome fragments"Science 245,175-177所述)。
关于含有人免疫球蛋白基因的特定AC的额外信息可以见例如Giraldo & Montoliu(2001)Transgenic Research 10:83-103和Peterson(2003)Expert Reviews in Molecular Medicine 5:1-25的最近综述。
AC转移方法
可以首先将人免疫球蛋白基因插入AC中然后可以将含有人免疫球蛋白的AC插入有蹄类动物细胞中。备选地,可以将AC转移到中间哺乳动物细胞,如CHO细胞,之后插入到有蹄类动物细胞中。在一个实施方案中,中间哺乳动物细胞也含有AC并且第一种AC可以插入到哺乳动物细胞的该AC中。具体地,可以将酵母细胞中含有人免疫球蛋白基因或者其片段的YAC转移到含有MAC的哺乳动物细胞。YAC可以插入到MAC中。然后MAC转移到有蹄类动物细胞。可以通过同源重组将人Ig基因插入AC中。所得的含有人Ig基因的AC可以接着导入有蹄类动物细胞中。可以通过本文描述的或者本领域已知的技术选择一种或多种有蹄类动物细胞,其含有包含人Ig的AC。
本文提供了用于导入AC的合适宿主,其包括但不限于任何动物或植物、其细胞或组织,包括但不限于:哺乳动物、鸟类、爬行动物、两栖类、昆虫、鱼、蜘蛛、烟草、番茄、小麦、单子叶植物、双子叶植物和藻类。在一个实施方案中,可以通过本领域已知的任意试剂浓缩AC(Marschall等人,Gene Ther.1999 Sep;6(9):1634-7),所述试剂包括但不限于,精胺、亚精胺、聚氮丙啶,和/或聚赖氨酸,之后导入细胞中。通过细胞融合或者微细胞融合或者分离后通过本领域技术人员已知的任意方法可以导入AC,所述方法包括但不限于:直接DNA转移、电穿孔、核转移、微细胞融合、细胞融合、原生质球融合、脂质介导的转移、脂转染、脂质体、微粒轰击、显微注射、磷酸钙沉淀和/或任意其他合适的方法。用于将DNA导入细胞的其他方法包括核显微注射、电穿孔、细菌与完整细胞的原生质体融合。也可以使用聚阳离子,如1,5-二甲基-1,5-二氮十一亚甲基聚甲溴化物和聚鸟氨酸。关于用于转化哺乳动物细胞的各种技术,见例如,Keown等人Methods in Enzymology(1990)Vol.185,pp.527-537;和Mansour等人(1988)Nature 336:348-352。
通过直接DNA转化、在细胞或者胚胎中显微注射、植物的原生质体再生、电穿孔、微粒枪和本领域技术人员已知的其他此类方法可以导入AC(见例如,Weissbach等人(1988)Methods for PlantMolecular Biology,Academic Press,N.Y.,Section VIII,pp.421-463;Grierson等人(1988)Plant Molecular Biology,2d Ed.,Blackie,London,Ch.7-9;还见例如,美国专利号5,491,075;5,482,928;和5,424,409;还见例如,美国专利号5,470,708,)。
在具体实施方案中,可以使用含有人Ig基因的一种或多种分离的YAC。可以通过本领域已知的任意试剂浓缩分离的YAC(Marschall等人,Gene Ther.1999 Sep;6(9):1634-7),所述试剂包括但不限于,精胺、亚精胺、聚氮丙啶,和/或聚赖氨酸。然后通过本领域中已知的任意方法(例如,显微注射、电穿孔、脂质介导的转染等等)将浓缩的YAC转移到猪细胞。备选地,可以通过精子介导的基因转移或者胞质内精子注射技术(ICSI)介导的基因转移将浓缩的YAC转移到卵母细胞。在一个实施方案中,可以用原生质球融合将含有人Ig基因的YAC转移到猪细胞。
在本发明的其他实施方案中,含有人Ig的AC可以插入到成年、胎儿或者胚胎有蹄类动物细胞中。有蹄类动物细胞的额外实例包括未分化的细胞,如胚胎细胞(如胚胎干细胞)、分化的或者体细胞,如上皮细胞、神经细胞、表皮细胞、角质形成细胞、造血细胞、黑素细胞、软骨细胞、B淋巴细胞、T淋巴细胞、红细胞、巨噬细胞、单核细胞、成纤维细胞、肌细胞、来自雌性生殖系统的细胞,如乳腺、卵丘、卵泡或者输卵管细胞、生殖细胞、胎盘细胞,或者来自任何器官,如膀胱、脑、食管、输卵管、心脏、肠、胆囊、肾、肝、肺、卵巢、胰、前列腺、脊髓、脾、胃、睾丸、胸腺、甲状腺、气管、输尿管、尿道、和子宫的细胞或者本文中描述的任何其他细胞类型。
位点特异性重组酶介导的转移
在本发明的具体实施方案中,含有人免疫球蛋白基因的AC向猪细胞,如本文描述的或者本领域已知的那些细胞的转移可以通过位点特异性重组酶介导的转移来完成。在一个具体实施方案中,可以将AC转移到猪成纤维细胞。在另一具体实施方案中,AC可以是YAC。
在本发明的其他实施方案中,含有位点特异性重组酶靶位点的环化DNA,如AC可以转移到在其基因组中具有位点特异性重组酶靶位点的细胞系中。在一个实施方案中,细胞的位点特异性重组酶靶位点可以位于外源染色体内。外源染色体可以是不整合在宿主的内源基因组中的人工染色体。在一个实施方案中,AC可以通过种系传递转移到后代。在一个具体实施方案中,含有人免疫球蛋白基因或者其片段的YAC可以通过位点特异性重组酶环化,且然后转移到含有MAC的宿主细胞中,其中MAC含有位点特异性重组酶位点。然后现在含有人免疫球蛋白基因座或者其片段的该MAC可以与猪细胞,如但不限于,成纤维细胞融合。然后该猪细胞可以用于核转移。
在本发明的一些实施方案中,在插入有蹄类动物细胞中前,含有人免疫球蛋白基因或者其片段的AC可以转移到哺乳动物细胞,如CHO细胞。在一个实施方案中,中间哺乳动物细胞也含有AC并且第一种AC可以插入到哺乳动物细胞的该AC中。具体地,可以将酵母细胞中含有人免疫球蛋白基因或者其片段的YAC转移到含有MAC的哺乳动物细胞。YAC可以插入到MAC。然后MAC可转移到有蹄类动物细胞。在具体实施方案中,含有人Ig基因或者其片段的YAC可以含有位点特异性重组酶靶基因。YAC可以首先通过应用合适的位点特异性重组酶环化,然后插入到含有其自身的位点特异性重组酶靶位点的哺乳动物细胞中。然后,可以应用位点特异性重组酶以将YAC整合到中间哺乳动物细胞中的MAC中。位点特异性重组酶可以顺式或者反式应用。具体地,位点特异性重组酶可以反式应用。在一个实施方案中,位点特异性重组酶可以通过位点特异性重组酶表达质粒,如Cre表达质粒的转染来表达。此外,YAC的一个端粒区也可以用选择标记,如本文描述的或者本领域已知的选择标记改进(retrofit)。然后可以将中间哺乳动物细胞的MAC内的人Ig基因或者其片段转移到有蹄类动物细胞,如成纤维细胞中。
备选地,含有人Ig基因或者其片段的AC,如YAC可以含有任选位于每个端粒附近的位点特异性重组酶靶位点。YAC可以首先通过应用合适的位点特异性重组酶环化,然后插入到在其基因组内含有其自身位点特异性重组酶靶位点的有蹄类动物细胞中。备选地,有蹄类动物细胞可以含有其自身的MAC,该MAC含有位点特异性重组酶靶位点。在该实施方案中,YAC可以直接插入有蹄类动物细胞的内源基因组中。在具体实施方案中,有蹄类动物细胞可以是成纤维细胞或者可以用于核转移的任何其他合适的细胞。见例如,图7;Call等人,Hum Mol Genet.2000 JuI 22;9(12):1745-51。
在其他实施方案中,提供了环化至少100kb DNA的方法,其中DNA然后通过位点特异性重组酶整合到宿主基因组中。在一个实施方案中,可以环化至少100、200、300、400、500、1000、2000、5000、10,000kb的DNA。在另一实施方案中,可以环化至少1000、2000、5000、10,000或20,000兆碱基的DNA。在一个实施方案中,通过将位点特异性重组酶靶位点附着在DNA序列的每个末端,然后应用位点特异性重组酶以导致DNA的环化可以完成DNA的环化。在一个实施方案中,位点特异性重组酶靶位点可以是lox。在另一实施方案中,位点特异性重组酶靶位点可以是Flt。在一些实施方案中,DNA可以是人工染色体,如YAC或者本文描述的或者本领域已知的任何AC。在另一实施方案中,AC可以含有人免疫球蛋白基因座或者其片段。
在另一优选的实施方案中,YAC可以转化成或者整合在人工哺乳动物染色体内。哺乳动物人工染色体可以转移到或者包含在猪细胞内。可以通过本领域已知的任意方法将人工染色体导入猪基因组内,所述方法包括但不限于直接注射中期染色体、脂质介导的基因转移或者微细胞融合。
位点特异性重组酶包括识别并结合短核酸位点或者序列特异性重组酶靶位点,即,重组酶识别位点,并催化与这些位点有关的核酸重组的酶或者重组酶。这些酶包括重组酶、转座酶和整合酶。序列特异性重组酶靶位点的实例包括,但不限于,lox位点、att位点、dif位点和frt位点。位点特异性重组酶的非限制性实例包括,但不限于,噬菌体P1 Cre重组酶、酵母FLP重组酶、Inti整合酶、λ噬菌体、phi 80、P22、P2、186和P4重组酶、Tn3解离酶、Hin重组酶和Cin重组酶、大肠杆菌xerC和xerD重组酶、苏云金芽孢杆菌重组酶、TpnI和β-内酰胺酶转座子,和免疫球蛋白重组酶。
在一个实施方案中,重组位点可以是噬菌体P1的Cre重组酶识别的lox位点。Lox位点指噬菌体P1的cre基因产物Cre重组酶可以催化位点特异性重组事件所处的核苷酸序列。多种lox位点是本领域已知的,包括天然存在的loxP、loxB、loxL和loxR,以及许多突变体或者变体lox位点,如loxP511、loxP514、lox.DELTA.86、lox.DELTA.117、loxC2、loxP2、loxP3和lox P23。Lox位点的额外实例包括,但不限于loxB、loxL、loxR、loxP、loxP3、loxP23、loxΔ86、loxΔ117、loxP511和loxC2。
在另一实施方案中,重组位点是非Cre的重组酶识别的重组位点。在一个实施方案中,重组酶位点可以是啤酒糖酵母的2pi质粒的FLP重组酶识别的FRT位点。FRT位点指酵母2μ质粒的FLP基因产物FLP重组酶催化位点特异性重组所处的核苷酸序列。非-Cre重组酶的额外实例包括,但不限于位点特异性重组酶,包括:λ噬菌体的Int重组酶识别的att位点(例如,att1、att2、att3、attP、attB、attL和attR)、解离酶家族识别的重组位点和苏云金芽孢杆菌的转座酶识别的重组位点。
IV.产生基因修饰动物
在本发明的额外方面,通过本领域技术人员已知的任意方法可以产生含有本文描述的基因修饰的有蹄类动物。此类方法包括,但不限于:核转移、胞质内精子注射技术、合子直接修饰和精子介导的基因转移。
在另一实施方案中,克隆此类动物如猪的方法包括:将卵母细胞去核、将卵母细胞与来自细胞的供体核融合,所述细胞中至少一种免疫球蛋白基因的至少一个等位基因已经被灭活,和将核转移得到的胚胎植入替代母亲中。
备选地,通过灭活胚胎干细胞中免疫球蛋白基因的两个等位基因,提供了产生缺少功能性免疫球蛋白的任何表达的活动物的方法,所述细胞然后可以用于产生后代。
在另一方面,本发明还提供了产生活动物,如猪的方法,其中已经使得免疫球蛋白基因的两个等位基因都失活。在一个实施方案中,通过使用来自细胞的供体细胞核克隆产生了动物,所述细胞中免疫球蛋白基因的两个等位基因都被灭活。在一个实施方案中,通过遗传寻靶事件灭活免疫球蛋白基因的两个等位基因。
通过直接修饰合子可以产生基因改造动物。对于哺乳动物,可以将经修饰的合子导入能够怀有该动物至足月的假孕雌性的子宫中。例如,如果需要缺少免疫球蛋白基因的完整动物,那么来自该动物的胚胎干细胞可以被寻靶并且以后导入胚泡中以使修饰的细胞生长成嵌合动物。对于胚胎干细胞,可以使用胚胎干细胞系或者新鲜得到的干细胞。
在本发明的合适的实施方案中,全能细胞是胚胎干(ES)细胞。从胚泡分离ES细胞、确立ES细胞系和它们的随后培养可通过常规方法进行,如Doetchmann等人,J.Embryol.Exp.Morph.87:27-45(1985);Li等人,Cell 69:915-926 (1992);Robertson,E.J."Tetracarcinomas and Embryonic Stem Cells:A PracticalApproach,"ed.E.J.Robertson,IRL Press,Oxford,England(1987);Wurst和Joyner,"Gene Targeting:A Practical Approach,"ed.A.L.Joyner,IRLPress,Oxford,England(1993);Hogen等人,"Manipulating the Mouse Embryo:A Laboratory Manual,"eds.Hogan,Beddington,Costantini and Lacy,Cold Spring HarborLaboratory Press,New York(1994);and Wang等人,Nature336:741-744(1992)所述。在本发明的另一合适的实施方案中,全能细胞是胚胎生殖干(EG)细胞。胚胎生殖干细胞是与ES细胞在功能上等价的未分化的细胞,即,它们可以在体外培养和转染,然后有助于嵌合体的体细胞和生殖细胞谱系(Stewart等人,Dev.Biol.161:626-628(1994))。通过培养原生殖细胞——配子的祖先与生长因子:白血病抑制因子、青灰因子和碱性成纤维细胞生长因子的组合得到EG细胞(Matsui等人,Cell 70:841-847(1992);Resnick等人,Nature359:550-551(1992))。可以使用Donovan等人,"Transgenic Animals,Generation and Use,"Ed.L.M.Houdebine,Harwood AcademicPublishers(1997)和其中引用的原始文献中描述的方法进行EG细胞的培养。
用于本发明的四倍体胚泡可以通过天然合子产生和发育得到,或者通过已知的二细胞胚胎的电融合和随后的培养得到,如James等人,Genet.Res.Camb.60:185-194(1992);Nagy和Rossant,"GeneTargeting:A Practical Approach,"ed.A.L.Joyner,IRL Press,Oxford,England(1993);或Kubiak和Tarkowski,Exp.Cell Res.157:561-566(1985)所述。
可以通过本领域已知的任意方法进行ES细胞或者EG细胞向胚泡中的导入。用于本发明目的的合适的方法是如Wang等人,EMBOJ.10:2437-2450(1991)所述的显微注射方法。
备选地,通过修饰的胚胎干细胞可以产生转基因动物。可以根据常规技术将基因修饰胚胎干细胞注射到胚泡然后在雌性宿主哺乳动物中使其足月。然后可以使用诸如PCR或者DNA印迹的技术,对杂合后代筛选靶基因座位点上所述改变的存在。与相同物种的野生型宿主交配后,可以将所得嵌合子代杂交以得到纯合宿主。
用寻靶载体转化胚胎干细胞以改变免疫球蛋白基因后,可以将细胞铺平板在合适的培养基,如胎牛血清增强的DMEM中的饲养层上。使用选择培养基可以检测含有构建体的细胞,并且菌落生长足够的时间后,可以挑取菌落并分析同源重组的发生。可以使用聚合酶链反应,引物在构建体序列内和外,但是在靶基因座上。然后显示出同源重组的那些菌落可以用于胚胎操作和胚泡注射。可以从超排卵的雌性得到胚泡。然后可以将胚胎干细胞胰蛋白酶消化并将经修饰的细胞加入含有胚泡的小滴。可以将至少一个经修饰的胚胎干细胞注射到胚泡的囊胚腔中。注射后,至少一个胚泡可以返回到假孕雌性的每个子宫角。然后允许雌性足月并对所得的胎仔(litter)筛选具有所述构建体的突变细胞。从转化的ES细胞选择胚泡的不同家系。通过提供不同表型的胚泡和ES细胞,可以容易地检测嵌合后代,且然后进行基因型分型以探测经修饰的免疫球蛋白基因的存在。
在其他实施方案中,精子介导的基因转移可以用于产生本文描述的基因修饰有蹄类动物。本文描述的用于消除内源免疫球蛋白的表达或者插入异种免疫球蛋白基因的方法和组合物可以用于通过本文描述或者本领域已知的任意技术基因修饰精细胞。基因修饰精子然后可以通过人工受精、胞质内精子注射技术或者任何其他已知的技术用于使雌性受体怀孕。在一个实施方案中,精子和/或精子头可以与外源核酸温育足够的时间段。足够的时间段包括例如,约30秒到约5分钟,通常约45秒到约3分钟,更一般约1分钟到约2分钟。在具体实施方案中,异种的,如人免疫球蛋白基因在如本文描述的有蹄类动物中的表达可以通过胞质内精子注射技术完成。
精细胞作为基因转移的载体的潜在用途首次由Brackett等人,Proc.Natl.Acad.Sci.USA 68:353-357(1971)提出。接着报导了卵母细胞与已经通过裸DNA温育的精子的体外受精后产生转基因小鼠和猪(见,例如,Lavitrano等人,Cell 57:717-723(1989)和Gandolfi等人Journal of Reproduction and Fertility Abstract Series 4,10(1989)),尽管其他实验室不能重复这些实验(见例如,Brinster等人Cell 59:239-241(1989)和Gavora等人,Canadian Journal of AnimalScience 71:287-291(1991))。从这以后,几个报导描绘了鸡(见,例如,Nakanishi和Iritani,Mol.Reprod.Dev.36:258-261(1993));小鼠(见,例如,Maione,Mol.Reprod.Dev.59:406(1998));和猪(见,例如,Lavitrano等人Transplant.Proc.29:3508-3509(1997);Lavitrano等人,Proc.Natl.Acad.Sci.USA 99:14230-5(2002);Lavitrano等人,Mol.Reprod.Dev.64-284-91(2003))的成功的精子介导的基因转移。类似的技术也在2002年4月23日授权的美国专利号6,376,743、2001年11月22日公开的美国专利公开号20010044937和2002年8月8日公开的20020108132中描述。
在其他实施方案中,胞质内精子注射可以用于产生本文描述的基因修饰有蹄类动物。这可以如下完成:将外源核酸和精子共同插入(coinserting)未受精的卵母细胞的细胞质中以形成转基因的受精的卵母细胞,并允许转基因的受精的卵母细胞发育成转基因胚胎,且如果需要,发育成活的后代。精子可以是膜破坏的精子头或者去膜(demembraned)的精子头。共同插入步骤可以包括将精子与外源核酸预温育足够的时间段的子步骤,如约30秒到约5分钟,通常约45秒到约3分钟,更通常约1分钟到约2分钟。通过显微注射可以将精子和外源核酸共同插入卵母细胞中。与精子混合的外源核酸可以含有超过一种的转基因,以产生对本文描述的超过一种的转基因为转基因的胚胎。胞质内精子注射可以通过本领域已知的任一种技术完成,见,例如,美国专利号6,376,743。在具体实施方案中,异种的,如人免疫球蛋白基因在如本文描述的有蹄类动物中的表达可以通过胞质内精子注射完成。
本领域已知的任何额外的技术都可以用于向动物中导入转基因。此类技术包括,但不限于前核显微注射(见,例如,Hoppe,P.C.和Wagner,T.E.,1989,美国专利号4,873,191);向种系的逆转录病毒介导的基因转移(见,例如,Van der Putten等人,1985,Proc.Natl.Acad.Sci.,USA 82:6148-6152);胚胎干细胞中的基因寻靶(见,例如,Thompson等人,1989,Cell 56:313-321;Wheeler,M.B.,1994,WO 94/26884);胚胎的电穿孔(见,例如,Lo,1983,Mol Cell.Biol.3:1803-1814);细胞枪(cell gum);转染;转导;逆转录病毒感染;腺病毒感染;腺伴随病毒感染;脂质体介导的基因转移;裸DNA转移;和精子介导的基因转移(见,例如,Lavitrano等人,1989,Cell57:717-723)等等。关于这种技术的综述,见例如,Gordon,1989,Transgenic Animals,Intl.Rev.Cytol.115:171-229。在具体实施方案中,通过这些技术可以完成异种的如人免疫球蛋白基因在如本文描述的有蹄类动物中的表达。
体细胞核转移以产生克隆的转基因后代
在本发明的另一方面,缺少有蹄类动物重链、κ轻链和/或λ轻链基因的一个等位基因、任选地两个等位基因的有蹄类动物,如猪或者牛细胞可以用作供体细胞以核转移到受体细胞中而产生克隆的转基因动物。备选地,可以在胚胎干细胞中产生有蹄类动物重链、κ轻链和/或λ轻链基因敲除体,其然后用于产生后代。根据本文描述的方法、序列和/或构建体产生的缺少功能性有蹄类动物重链、κ轻链和/或λ轻链基因的单个等位基因的后代可以育种以进一步通过孟德尔型遗传产生在两个等位基因中缺少功能性的后代。
在另一实施方案中,本发明提供了产生缺少功能性α-1,3-GT的任何表达的活猪的方法,其通过将对α-1,3-GT基因杂合的公猪与对α-1,3-GT基因杂合的母猪育种实现。在一个实施方案中,由于α-1,3-GT基因的一个等位基因的基因修饰以防止该等位基因表达,所以猪是杂合的。在另一实施方案中,由于α-1,3-GT基因的一个等位基因中存在点突变,所以猪是杂合的。在另一实施方案中,点突变可以是在α-1,3-GT基因的外显子9的第二个碱基处T到G的点突变。在一个具体实施方案中,提供了产生缺少功能性α-1,3-GT的任何表达的猪动物的方法,其中将在α-1,3-GT基因的外显子9的第二个碱基处含有T到G的点突变的公猪与在α-1,3-GT基因的外显子9的第二个碱基处含有T到G的点突变的母猪育种,或反过来也一样。
本发明提供了通过体细胞核转移克隆缺少功能性免疫球蛋白基因的动物如猪的方法。通常,通过核转移方法可以产生动物,所述方法包括下面的步骤:得到将用作供体核来源的所需的分化细胞;从动物得到卵母细胞;将所述卵母细胞去核;将所需的分化细胞或者细胞核转移到去核的卵母细胞中,例如,通过融合或者注射,以形成NT单位;激活所得的NT单位;并将所述培养的NT单位转移到宿主动物,从而NT单位发育成胎儿。
核转移技术或者核移植技术是本领域已知的(Dai等人NatureBiotechnology 20:251-255;Polejaeva等人,Nature 407:86-90(2000);Campbell等人,Theriogenology,43:181(1995);Collas等人,Mol.Report Dev.,38:264-267(1994);Keefer等人,Biol.Reprod.,50:935-939(1994);Sims等人,Proc.Natl.Acad.Sci.,USA,90:6143-6147(1993);WO 94/26884;WO 94/24274,和WO 90/03432,美国专利号4,944,384和5,057,420)。
将已经修饰以改变免疫球蛋白基因的供体细胞核转移到受体卵母细胞。该方法的用途不限于具体供体细胞类型。供体细胞可以如本文描述,也见例如,Wilmut等人,Nature 385 810(1997);Campbell等人,Nature 380 64-66(1996);Dai等人,Nature Biotechnology20:251-255,2002或Cibelli等人,Science 280 1256-1258(1998)。可以使用可成功地用于核转移的正常核型的所有细胞,包括胚胎、胎儿和成年体细胞。胎儿成纤维细胞是尤其有用的一类供体细胞。通常,用于核转移的合适的方法在Campbell等人,Theriogenology 43 181(1995),Dai等人Nature Biotechnology 20:251-255,Polejaeva等人,Nature 407:86-90(2000),Collas等人,Mol.Reprod.Dev.38264-267(1994),Keefer等人,Biol.Reprod.50 935-939(1994),Sims等人,Proc.Nat′l.Acad.Sci.USA 90 6143-6147(1993),WO-A-9426884、WO-A-9424274、WO-A-9807841、WO-A-9003432、美国专利号4,994,384和美国专利号5,057,420中描述。还可以使用分化或者至少部分分化的供体细胞。供体细胞还可以但不必须是培养的并且可以是休眠的。休眠的核供体细胞是可以被诱导以进入休眠或者在体内以休眠状态存在的细胞。现有技术方法也已经在克隆程序中使用胚胎细胞类型(Campbell等人,(Nature,380:64-68,1996)和Stice等人,(Biol.Reprod.,20 54:100-110,1996)。
可以从多种不同的器官和组织得到体细胞核供体细胞,所述器官和组织如,但不限于,皮肤、间充质、肺、胰、心脏、肠、胃、膀胱、血管、肾、尿道、生殖器官,和胚胎、胎儿或成年动物的完整或者部分的解聚制剂。在本发明的合适的实施方案中,核供体细胞选自上皮细胞、成纤维细胞、神经细胞、角质形成细胞、造血细胞、黑素细胞、软骨细胞、淋巴细胞(B和T)、巨噬细胞、单核细胞、单核的细胞、心肌细胞、其他肌细胞、xtended细胞、卵丘细胞、表皮细胞或内皮细胞。在另一实施方案中,核供体细胞是胚胎干细胞。在具体实施方案中,成纤维细胞可以用作供体细胞。
在本发明的另一实施方案中,本发明的核供体细胞是动物的生殖细胞。动物物种的处于胚胎、胎儿或者成年阶段的任何生殖细胞都可以用作核供体细胞。在合适的实施方案中,核供体细胞是胚胎生殖细胞。
核供体细胞可以停滞在细胞周期的任意阶段(G0、G1、G2、S、M)以便确保与受体细胞协调。本领域已知的任意方法都可以用于操作细胞周期阶段。控制细胞周期阶段的方法包括,但不限于通过培养的细胞的接触抑制诱导的G0休眠、通过除去血清或者其他必需营养物诱导的G0休眠、通过衰老诱导的G0休眠、通过加入特定生长因子诱导的G0休眠;通过物理或者化学手段如热激、高压或者用化学制剂、激素、生长因子或者其他物质处理诱导的G0或者G1休眠;通过用干扰复制过程的任意点的化学试剂处理进行S期控制;通过用荧光激活细胞分选、有丝分裂抖落、用微管破坏剂或破坏有丝分裂进展的任何化学制剂处理进行M期控制(也见Freshney,R.I,."Cultureof Animal Cells:A Manual of Basic Technique,"Alan R.Liss,Inc,New York(1983)。
分离卵母细胞的方法是本领域公知的。基本上,这可以包括从动物的卵巢或者生殖道分离卵母细胞。卵母细胞的容易获得的来源是屠宰场材料。对于如基因工程、核转移和克隆的技术的组合,卵母细胞必须通常在体内成熟,之后这些细胞才可以用作核转移的受体细胞,并且之后它们通过由精细胞受精以发育成胚胎。该方法通常需要从哺乳动物卵巢,如在屠宰场得到的牛卵巢收集不成熟(前期I)卵母细胞,并在受精或者去核前在成熟培养基中成熟,直到卵母细胞达到中期II阶段,其对于牛卵母细胞通常在抽吸后约18-24小时发生。该时间段称作“成熟时间段”。在一些实施方案中,从育肥小母猪(gilt)得到卵母细胞。“育肥小母猪”是从未有过后代的母猪。在其他实施方案中,从母猪得到卵母细胞。“母猪”是以前产生后代的母猪。
中期II阶段卵母细胞可以是受体卵母细胞,在该阶段认为卵母细胞可以被或者被足够“激活”以与处理受精精子一样处理导入的细胞核。已经在体内成熟的中期II阶段卵母细胞已经成功地用于核转移技术。基本上,可以在动情期开始后或者人绒毛膜促性腺激素(hCG)或者类似的激素注射后35到48、或者39到41小时从非超排卵的或者超排卵的动物通过外科手术收集成熟的中期II卵母细胞。可以将卵母细胞置于合适的培养基,如透明质酸酶(hyalurodase)溶液中。
固定时间的成熟时间段(其为约10到40小时,约16-18小时,约40-42小时或约39-41小时)后,可以对卵母细胞去核。在去核前,可以取出卵母细胞并将其放置在合适的培养基,如含有1mg/ml透明质酸酶的HECM中,之后取出卵丘细胞。可以对带状卵母细胞筛选极体,并且然后将如通过极体的存在选择的中期II卵母细胞用于核转移。如下所述去核。
通过已知的方法,如美国专利号4,994,384中所述的进行去核。例如,可以将中期II卵母细胞置于HECM中,任选含有7.5微克/微升松胞菌素B,用于立即去核,或者可以置于合适的培养基,如胚胎培养基如CR1aa加10%动情期奶牛血清中,且然后去核,如不超过24小时后,或者不超过16-18小时后。
可以通过显微外科手术完成去核,其中使用微量移液管以取出极体和相邻的细胞质。然后可以筛选卵母细胞以鉴定已经成功去核的细胞。一种筛选卵母细胞的方法是用溶于HECM中的1微克/毫升33342Hoechst染料对卵母细胞染色,并然后在紫外线照射下观察卵母细胞小于10秒。然后可以将成功去核的卵母细胞置于合适的培养基,如CR1aa加10%血清中。
然后可以将与去核的卵母细胞相同物种的单个哺乳动物细胞转移到用于产生NT单位的去核卵母细胞的卵周隙。哺乳动物细胞和去核的卵母细胞可以用于根据本领域已知的方法产生NT单位。例如,可以通过电融合融合细胞。通过提供足够导致质膜的瞬时破裂的电脉冲完成电融合。该质膜的破裂非常短,因为膜快速重新形成。从而,如果诱导两个相邻的膜破裂并且在重新形成后,脂质双层混合,那么两个细胞之间可以打开小的通道。由于这种小开口的热力学不稳定性,它变大,直到两个细胞变成一个。见例如,Prather等人的美国专利号4,997,384。可以使用多种电融合介质,包括例如,蔗糖、甘露糖醇、山梨糖醇和磷酸缓冲溶液。使用仙台病毒作为融合剂也可以完成融合(Graham,Wister Inot.Symp.Monogr.,9,19,1969)。同样,不使用电穿孔融合,可以将细胞核直接注射到卵母细胞中。见,例如,Collas和Barnes,Mol.Reprod.Dev.,38:264-267(1994)。融合后,将所得融合的NT单位置于合适的培养基中直到活化,例如,CR1aa培养基。通常融合之后很短时间内,如融合后小于24小时后,或者约4-9小时后,或者最佳地融合后1-2小时实现活化。在具体实施方案中,在融合后至少1小时和成熟后40-41小时发生活化。
通过已知方法可以活化NT单位。此类方法包括例如,在亚生理学(sub-physiological)温度,大体上通过对NT单位应用冷,或者实际上凉的温度休克来培养NT单位。这可以最方便地通过在室温下培养NT来进行,所述室温相对于胚胎通常暴露的生理学温度条件是冷的。备选地,通过应用已知的活化剂可以实现活化。例如,已经表明在受精期间通过精子穿透卵母细胞可以活化预融合卵母细胞以在核转移后产生更大数目的活的妊娠和多个遗传上相同的小牛。同样,处理如电和化学休克可以用于在融合后活化NT胚胎。见例如,Susko-Parrish等人的美国专利号5,496,720。通过使用ECM2001Electrocell Manipulator(BTX Inc.,San Diego,CA)应用5V的AC脉冲5秒接着1.5kV/cm的两次每次60微秒的DC脉冲,可以诱导融合和活化。此外,通过升高卵母细胞中二价阳离子的水平,并减小卵母细胞中细胞蛋白质的磷酸化,可以同时或者顺序实现活化。这可以通常通过将二价阳离子导入卵母细胞细胞质来实现,所述二价阳离子为例如镁、锶、钡或者钙,例如,以离子载体的形式。提高二价阳离子水平的其他方法包括使用电休克、用乙醇处理和用笼状(caged)螯合剂处理。通过已知方法可以减小磷酸化,例如,通过加入激酶抑制剂,如丝氨酸-苏氨酸激酶抑制剂,如6-甲基-氨基嘌呤、星形孢菌素、2-氨基嘌呤和鞘氨醇。备选地,通过向卵母细胞中导入磷酸酶,如磷酸酶2A和磷酸酶2B可以抑制细胞蛋白质的磷酸化。
活化的NT单位,或者“融合的胚胎”然后可以在合适的体外培养基中培养直到产生细胞集落。适于胚胎的培养和成熟的培养基是本领域公知的。可以用于胚胎培养和维持的已知培养基的实例包括Ham′s F-10+10%胎牛血清(FCS)、组织培养基-199(TCM-199)+10%胎牛血清、Tyrodes-清蛋白-乳酸-丙酮酸(TALP)、Dulbecco氏磷酸缓冲盐水(PBS)、Eagle氏和Whitten氏培养基,和在一个具体实例中,活化的NT单位可以在NCSU-23培养基中于约38.6℃在5%CO2的湿润气氛中培养约1-4小时。
之后,可以洗涤培养的一个或多个NT单位,然后将其置于有孔板中所含的合适的培养基中,所述有孔板可以含有合适的汇合饲养层。合适的饲养层包括例如成纤维细胞和上皮细胞。将NT单位在饲养层上培养直到NT单位达到适于转移到受体雌性,或者适于得到可以用于产生细胞集落的细胞的大小。可以培养这些NT单位直到至少约2到400个细胞、约4到128个细胞或者至少约50个细胞。
然后可以将活化的NT单位转移(胚胎转移)到母猪的输卵管中。在一个实施方案中,母猪可以是动情期同步化的受体育肥小母猪。可以使用杂种育肥小母猪(大白/Duroc/Landrace)(280-400lbs)。通过经口施用混合到饲料中的18-20mg Regu-Mate(Altrenogest,Hoechst,Warren,NJ)可以将育肥小母猪同步化为受体动物。Regu-Mate可以喂饲14个连续日。最后的Regu-Mate处理后约105小时,可以肌内(i.m.)施用1000单位的人绒毛膜促性腺激素(hCG,Intervet America,Millsboro,DE)。hCG注射后约22-26小时可以进行胚胎转移。在一个实施方案中,可以使妊娠达到足月,并导致生出活的后代。在另一实施方案中,妊娠可以早期结束并且收获胚胎细胞。
育种得到所需纯合敲除动物
在另一方面,本发明提供了产生缺少功能免疫球蛋白基因的任何表达的活的动物的方法,其通过将对该免疫球蛋白基因杂合的雄性与对该免疫球蛋白基因杂合的雌性育种而实现。在一个实施方案中,由于免疫球蛋白基因的一个等位基因的基因修饰以防止该等位基因的表达,所以动物是杂合的。在另一实施方案中,由于在α-免疫球蛋白基因的一个等位基因中的点突变的存在,所以动物是杂合的。在其他实施方案中,此类杂合敲除体可以与表达异种免疫球蛋白如人免疫球蛋白的有蹄类动物育种。在一个实施方案中,通过将缺少内源免疫球蛋白的至少一个等位基因的表达的转基因有蹄类动物与表达异种免疫球蛋白的有蹄类动物育种可以得到动物,其中该内源免疫球蛋白选自重链、κ轻链和λ轻链或者其任意组合。在另一实施方案中,通过将缺少重链、κ轻链和λ轻链的一个等位基因的表达的转基因有蹄类动物与表达异种如人免疫球蛋白的有蹄类动物育种可以得到动物。在进一步的实施方案中,通过将缺少重链、κ轻链和λ轻链的一个等位基因的表达并且表达异种如人免疫球蛋白的转基因有蹄类动物与缺少重链、κ轻链和λ轻链的一个等位基因的表达并表达异种如人免疫球蛋白的另一个转基因有蹄类动物育种,以产生缺少重链、κ轻链和λ轻链的两个等位基因的表达并表达异种如人免疫球蛋白的纯合的转基因有蹄类动物,可得到动物。还提供了产生此类动物的方法。
在一个实施方案中,从携带免疫球蛋白基因双敲除的供体细胞的核转移产生的性成熟的动物可以育种并且测试它们后代的纯合敲除。然后这些纯合敲除动物可以育种以产生更多动物。
在另一个实施方案中,来自性成熟的双敲除动物的卵母细胞可以使用来自两个遗传上不同的猪品系的野生型精子在体外受精,并将胚胎植入合适的替代动物中。可以对来自这些交配的后代测试敲除的存在,例如,通过cDNA测序,和/或PCR可以测试它们。然后,在性成熟时,来自这些胎仔每一只的动物可以交配。在根据本发明的该方面的一些方法中,妊娠可以早期结束从而可以分离胎儿成纤维细胞并进一步在表型和/或基因型上表征。缺少免疫球蛋白基因的表达的成纤维细胞可以用于根据本文描述的方法进行核转移以产生携带所需双敲除的多个妊娠和后代。
额外的基因修饰
在其他实施方案中,根据本文描述的方法、序列和/或构建体产生的缺少功能性免疫球蛋白的表达的动物或细胞可以含有额外的基因修饰以消除异种抗原的表达。通过进一步基因修饰从本文描述的转基因细胞和动物得到的细胞或者通过将本文描述的动物与已经进一步基因修饰的动物育种,可以进行额外的基因修饰。可以修饰此类动物以消除α-1,3-半乳糖基转移酶基因、CMP-Neu5Ac羟化酶基因(见例如,USSN 10/863,116)、iGb3合酶基因(见,例如,美国专利申请60/517,524),和/或福斯曼合酶基因(见例如,美国专利申请60/568,922)的至少一个等位基因的表达。在额外实施方案中,本文公开的动物还可以含有基因修饰以表达岩藻糖基转移酶、唾液酸转移酶和/或葡糖基转移酶家族的任意成员。为了实现这些额外的基因修饰,在一个实施方案中,可以修饰细胞以含有多个基因修饰。在其他实施方案中,动物可以一起育种以实现多个基因修饰。在一个具体实施方案中,根据本文描述的方法、序列和/或构建体产生的缺少功能性免疫球蛋白表达的动物,如猪可以与缺少α-1,3-半乳糖基转移酶表达的动物如猪育种(如WO 04/028243中所述)。
在另一个实施方案中,可以消除或者减少负责异种移植物排斥的额外基因的表达。此类基因包括,但不限于CMP-NEUAc羟化酶基因、异红细胞糖苷脂(isoGloboside)3合酶基因,和福斯曼合酶基因。此外,负责补体介导的裂解的抑制的编码补体相关蛋白质的基因或者cDNA还可以在本发明的动物和组织中表达。此类基因包括,但不限于CD59、DAF、MCP和CD46(见,例如WO 99/53042;Chen等人Xenotransplantation,Volume 6 Issue 3 Page 194-August 1999,其描述了表达CD59/DAF转基因的猪;Costa C等人,Xenotransplantation.2002 Jan;9(1):45-57,其描述了表达人CD59和H转移酶的转基因猪;Zhao等人;Diamond LE等人Transplantation.2001 Jan 15;71(1):132-42,其描述人CD46转基因猪。
额外的修饰可以包括表达组织因子途径抑制剂(TFPI)、肝素、抗凝血酶、蛭素、TFPI、壁虱抗凝肽,或者蛇毒液因子,如WO 98/42850和美国专利号6,423,316,标题"Anticoagulant fusion proteinanchored to cell membrane"中所述;或者下调细胞的细胞粘着分子表达的化合物,如抗体,如WO 00/31126,标题为“Suppression ofxenograft rejection by down regulation of a celladhesion molecules”所述,和其中阻止信号2的共刺激的化合物,如通过对器官受体使用来自异种供体生物的CTLA-4的可溶形式的,如WO 99/57266,标题"Immunosuppression by blocking T cell co-stimulation signal 2(B7/CD28 interaction)"所述。
在下面的非限制性实施例中更详细地描述本发明的一些方面。
实施例
实施例1:猪重链寻靶和缺少重链表达的猪动物的产生
从3X冗余猪BAC文库分离猪Ig重链基因座的部分。通常,通过断裂猪总基因组DNA,其然后可以用于得到代表完整动物的基因组的至少三倍的BAC文库,可以产生BAC文库。然后通过对本文描述的猪重链免疫球蛋白有选择性的探针杂交,选择含有猪重链免疫球蛋白的BAC。
来自克隆的序列(Seq ID 1)用于产生与J区的部分互补的引物(该引物由Seq ID No.2表示)。单独地,设计与Ig重链μ恒定区的部分互补的引物(该引物由Seq ID No.3表示)。这些引物用于扩增猪Ig重链的片段(由Seq ID No.4表示),其使功能性连接区(J区)和足够的侧翼区用以设计和构建寻靶载体。为了维持该片段和该片段的亚克隆处于天然状态,将含有这些片段的大肠杆菌(Stable 2,Invitrogen cat #1026-019)维持在30℃。亚克隆Seq ID No.4的区域并将其用于装配如Seq ID No.5所示的寻靶载体。将该载体转染到猪胎儿成纤维细胞中,随后将其用G418选择。通过PCR筛选所得集落以检测可能的寻靶事件(Seq ID No.6和Seq ID No.7,5′筛选引物;Seq ID No.8和Seq ID No.9,3′筛选引物)。关于寻靶的示例性图解见图1。通过DNA印迹验证寻靶。使用靶定的胎儿成纤维细胞作为核供体通过核转移产生小猪。
核转移
将靶定的胎儿成纤维细胞用作核供体细胞。通过本领域公知的方法进行核转移(见,例如,Dai等人,Nature Biotechnology 20:251-255,2002;和Polejaeva等人,Nature 407:86-90,2000)。
hCG注射后46-54小时用含有牛血清清蛋白(BSA;4gl-1)的预热的Dulbecco氏磷酸缓冲盐水(PBS)通过输卵管的反向冲洗收集卵母细胞(如Polejaeva,I.A.,等人(Nature 407,86-90(2000)中所述)。如Polejaeva,I.A.,等人(Nature 407,86-90(2000))所述,在成熟后40到42小时开始体外成熟的卵母细胞(BioMed,Madison,WI)的去核。将回收的卵母细胞在含有4gl1 BSA的PBS中于38℃洗涤,并转移到38℃的无钙的磷酸缓冲的NCSU-23培养基中用于转运到实验室。为了去核,我们将卵母细胞在含有5μg ml-1松胞菌素B(Sigma)和7.5μgml-1 Hoechst 33342(Sigma)的无钙的磷酸缓冲的NCSU-23培养基中在38℃温育20分钟。然后使用18μM玻璃移液管(Humagen,Charlottesville,Virginia)直接在第一个极体下抽吸少量的细胞质。我们将抽吸的核体暴露于紫外线以证实存在赤道板。
为了核转移,将单个成纤维细胞置于透明带下与每个去核的卵母细胞接触。使用ECM2001 Electrocell Manipulator(BTX Inc.,SanDiego,CA),通过应用5V的AC脉冲5秒,接着1.5kV/cm的两次每次60微秒的DC脉冲诱导融合和活化。融合的胚胎在NCSU-23培养基中于38.6℃在5%CO2的湿润气氛中培养1-4小时,然后转移到动情期同步化的受体育肥小母猪的输卵管中。通过经口施用混合到其饲料中的18-20mg Regu-Mate(Altrenogest,Hoechst,Warren,NJ)将杂种育肥小母猪(大白/Duroc/landrace)(280-400lbs)同步化为受体。Regu-Mate喂饲14个连续日。最后的Regu-Mate处理后105小时,肌内施用人绒毛膜促性腺激素(hCG,1000单位;Intervet America,Millsboro,DE)。hCG注射后22-26小时进行胚胎转移。
核转移从四胎仔产下18个健康小猪。这些动物具有一个功能性野生型Ig重链基因座和一个破坏的Ig重链基因座。
Seq ID 2:来自Butler亚克隆用 | ggccagacttcctcggaacagctca |
于扩增J到C重链的引物(637Xba5’) | |
Seq ID 3:用于扩增J到C重链的C的引物(JM1L) | ttccaggagaaggtgacggagct |
Seq ID 6:用于5’筛选的重链5’引物(HCKOXba5’2) | tctagaagacgctggagagaggccag |
Seq ID 7:用于5’筛选的重链3’引物(5’arm5’) | taaagcgcatgctccagactgcctt |
Seq ID 8:用于3’筛选的重链5’引物(NEO4425) | catcgccttctatcgccttctt |
Seq ID 9:用于3’筛选的重链3’引物(650+CA) | Aagtacttgccgcctctcagga |
细胞和猪组织样品的DNA印迹分析。将细胞或者组织样品在裂解缓冲液(10mM Tris,pH 7.5,10mM EDTA,10mM NaCl,0.5%(w/v)十二烷基肌氨酸钠,1mg/ml蛋白酶K)中于60℃过夜裂解并用乙醇沉淀DNA。然后将DNA用NcoI或XbaI消化,这取决于所用的探针,并在1%琼脂糖凝胶上分离。电泳后,将DNA转移到尼龙膜上并用洋地黄毒苷标记的探针(SEQ ID No 41用于NcoI消化,SEQ ID No 40用于XbaI消化)探测。使用化学发光底物系统(Roche MolecularBiochemicals)检测条带。
用于重链DNA印迹的探针:
HC J探针(用于XbaI消化):
CTCTGCACTCACTACCGCCGGACGCGCACTGCCGTGCTGCCCATGGACCA
CGCTGGGGAGGGGTGAGCGGACAGCACGTTAGGAAGTGTGTGTGTGCGCG
TGGGTGCAAGTCGAGCCAAGGCCAAGATCCAGGGGCTGGGCCCTGTGCCC
AGAGGAGAATGGCAGGTGGAGTGTAGCTGGATTGAAAGGTGGCCTGAAGG
GTGGGGCATCCTGTTTGGAGGCTCACTCTCAGCCCCAGGGTCTCTGGTTC
CTGCCGGGGTGGGGGGCGCAAGGTGCCTACCACACCCTGCTAGCCCCTCG
TCCAGTCCCGGGCCTGCCTCTTCACCACGGAAGAGGATAAGCCAGGCTGC
AGGCTTCATGTGCGCCGTGGAGAACCCAGTTCGGCCCTTGGAGG(Scq ID No 40)
HCμ探针(用于NcoI消化):
GGCTGAAGTCTGAGGCCTGGCAGATGAGCTTGGACGTGCGCTGGGGAGTA
CTGGAGAAGGACTCCCGGGTGGGGACGAAGATGTTCAAGACGGGGGGCTG
CTCCTCTACGACTGCAGGCAGGAACGGGGCGTCACTGTGCCGGCGGCACC
CGGCCCCGCCCCCGCCACAGCCACAGGGGGAGCCCAGCTCACCTGGCCCA
GAGATGGACACGGACTTGGTGCCACTGGGGTGCTGGACCTCGCACACCAG
GAAGGCCTCTGGGTCCTGGGGGATGCTCACAGAGGGTAGGAGCACCCGGG
AGGAGGCCAAGTACTTGCCGCCTCTCAGGACGG(Seq ID No 41)
实施例2:猪κ轻链寻靶和产生缺少κ轻链表达的猪
从3X冗余的猪BAC文库分离猪Igκ链基因座的部分。通常,通过断裂猪总基因组DNA,其然后可以用于得到代表完整动物的基因组的至少三倍的BAC文库,可以产生BAC文库。然后通过对如本文描述的猪κ轻链免疫球蛋白选择性的探针杂交,可以选择含有猪κ轻链免疫球蛋白的BAC。
使用与J区的部分互补的引物(该引物通过Seq ID No.10表示)和与κC区的部分互补的引物(该引物通过Seq ID No.11表示)扩增猪Ig轻链κ的片段。将所得的扩增引物克隆到质粒载体中并在Stable2细胞中于30℃维持(Seq ID No.12)。示意性说明见图2。
单独地,使用与C区的部分互补的引物(Seq ID No.13)和与κ增强子区的区域互补的引物(Seq ID No.14)扩增猪Ig轻链κ的片段。将所得的扩增引物通过限制酶断裂并将产生的DNA片段克隆,在Stable2细胞中于30℃维持并测序。作为测序的结果,装配了两个非重叠的重叠群(Seq ID No.15,扩增引物的5’部分;和Seq ID No.16,扩增引物的3’部分)。来自下游重叠群的序列(Seq ID No.16)用于设计一组引物(Seq ID No.17和Seq ID No.18),它们用于扩增增强子附近的连续片段(Seq ID No.19)。Seq ID No.12和Seq ID No.19中每一个的亚克隆用于构建寻靶载体(Seq ID No.20)。将该载体转染到猪胎儿成纤维细胞中,其随后用G418进行选择。通过PCR筛选所得集落以检测潜在的寻靶事件(Seq ID No.21和Seq ID No.22,5’筛选引物;和Seq ID No.23和Seq Id No 43,3′筛选引物,和Seq ID No.24和Seq Id No 24,内源筛选引物)。通过DNA印迹证实寻靶。通过克隆额外的κ序列促进DNA印迹策略设计,所述序列对应于种系κ转录物的模板(Seq ID No.25)。通过核转移产生胎儿猪。
核转移
将靶定的胎儿成纤维细胞用作核供体细胞。通过本领域公知的方法进行核转移(见例如,Dai等人,Nature Biotechnology 20:251-255,2002;和Polejaeva等人,Nature 407:86-90,2000)。
hCG注射后46-54小时用含有牛血清清蛋白(BSA;4gl-1)的预热的Dulbecco氏磷酸缓冲盐水(PBS)通过输卵管的反向冲洗收集卵母细胞(如Polejaeva,I.A.,等人(Nature 407,86-90(2000)中所述)。如Polejaeva,I.A.,等人(Nature 407,86-90(2000))所述,在成熟后40到42小时开始体外成熟的卵母细胞(BioMed,Madison,WI)的去核。将回收的卵母细胞在含有4gl-1 BSA的PBS中于38℃洗涤,并转移到38℃的无钙的磷酸缓冲的NCSU-23培养基中用于转运到实验室。为了去核,我们将卵母细胞在含有5μg ml-1松胞菌素B(Sigma)和7.5μgml-1 Hoechst 33342(Sigma)的无钙的磷酸缓冲的NCSU-23培养基中在38℃温育20分钟。然后使用18μM玻璃移液管(Humagen,Charlottesville,Virginia)直接在第一个极体下抽吸少量的细胞质。我们将抽吸的核体暴露于紫外线以证实存在赤道板。
为了核转移,将单个成纤维细胞置于透明带下与每个去核的卵母细胞接触。使用ECM2001 Electrocell Manipulator(BTX Inc.,SanDiego,CA),通过应用5V的AC脉冲5秒,接着1.5kV/cm的两次每次60微秒的DC脉冲诱导融合和活化。融合的胚胎在NCSU-23培养基中于38.6℃在5%CO2的湿润气氛中培养1-4小时,然后转移到动情期同步化的受体育肥小母猪的输卵管中。通过经口施用混合到其饲料中的18-20mg Regu-Mate(Altrenogest,Hoechst,Warren,NJ)将杂种育肥小母猪(大白/Duroc/landrace)(280-400lbs)同步化为受体。Regu-Mate喂饲14个连续日。最后的Regu-Mate处理后105小时,肌内施用人绒毛膜促性腺激素(hCG,1000单位;Intervet America,Millsboro,DE)。hCG注射后22-26小时进行胚胎转移。
使用κ靶定的核转移从5胎仔产下33个健康猪。这些猪具有一个功能性野生型猪Ig轻链κ等位基因和一个破坏的Ig轻链κ等位基因。
Seq ID 10:κ J到C 5’引物(kjc5’1) | caaggaqaccaagctggaactc |
Seq ID 11:κ J到C 3’引物 | tgatcaagcacaccacagagacag |
(kjc3’2) | |
Seq ID 13:κ C到E 5’引物(porKCS1) | gatgccaagccatccgtcttcatc |
Seq ID 14:κ C到E 3’引物(porKCA1) | tgaccaaagcagtgtgacggttgc |
Seq ID 17:用于扩增增强子区的κ 5’引物(K3’arm1S) | ggatcaaacacgcatcctcatggac |
Seq ID 18:用于扩增增强子区的κ 3’引物(K3’arm1A) | ggtgattggggcatggttgagg |
Seq ID 21:κ筛选,5’引物,5’(kappa5armS) | cgaacccctgtgtatatagtt |
Seq ID 22:κ筛选,3’引物,5’(kappaNeoA) | gagatgaggaagaggagaaca |
Seq ID 23:κ筛选,5’引物,3’(kappaNeoS) | gcattgtctgagtaggtgtcatt |
Seq ID 24:κ筛选,3’引物,5’(kappa5armProbe3’) | cgcttcttgcagggaacacgat |
Seq ID 43:κ筛选,3’引物(kappa3armA2) | GTCTTTGGTTTTTGCTGAGGGTT |
细胞和猪组织样品的DNA印迹分析。将细胞或者组织样品在裂解缓冲液(10mM Tris,pH 7.5,10mM EDTA,10mM NaCl,0.5%(w/v)十二烷基肌氨酸钠,1mg/ml蛋白酶K)中于60℃过夜裂解并用乙醇沉淀DNA。然后将DNA用SacI消化,并在1%琼脂糖凝胶上分离。电泳后,将DNA转移到尼龙膜上并用洋地黄毒苷标记的探针(SEQ IDNo 42)探测。使用化学发光底物系统(Roche Molecular Biochemicals)检测条带。
用于κDNA印迹的探针:
Kappa5ArmProbe 5’/3’
gaagtgaagccagccagttcctcctgggcaggtggccaaaattacagttg
acccctcctggtctggctgaaccttgccccatatggtgacagccatctgg
ccagggcccaggtctccctctgaagcctttgggaggagagggagagtggc
tggcccgatcacagatgcggaaggggctgactcctcaaccggggtgcaga
ctctgcagggtgggtctgggcccaacacacccaaagcacgcccaggaagg
aaaggcagcttggtatcactgcccagagctaggagaggcaccgggaaaat
gatctgtccaagacccgttcttgcttctaaactccgagggggtcagatga
agtggttttgtttcttggcctgaagcatcgtgttccctgcaagaagcgg(SEQ ID No 42)
实施例3猪λ基因座的表征
为了破坏或者使猪λ丧失功能,已经设计了寻靶策略,其允许除去或者破坏λ基因座的区域,包括J到C表达盒的多联体。可以产生含有猪基因组的部分的BAC克隆。从3X冗余的猪BAC文库分离猪Igλ链基因座的部分。通常,通过断裂猪的总基因组DNA,其然后用于得到代表完整动物的基因组的至少三倍的BAC文库,可以产生BAC文库。然后通过对如本文描述的猪λ链免疫球蛋白选择性的探针杂交,可以选择含有猪λ链免疫球蛋白的BAC。
含有λJ-C侧翼区的BAC克隆(见图3)可以独立地断裂并亚克隆到质粒载体中。通过PCR已经筛选了个体亚克隆中J到C内含子的部分的存在。我们已通过从一个C区到下一个C区扩增克隆了这些表达盒的几个。通过使用方向允许在任何一个C区内背驰延伸的引物(Seq ID 26和Seq ID 27)完成了该扩增。为了得到成功的扩增,延伸的产物与来自相邻C区(与相同的C区相对)的延伸产物会聚。该策略主要产生了从一个C延伸到相邻C的扩增引物。然而,一些扩增引物是越过相邻C到位置远离该相邻C的下一个C扩增的结果。这些多基因扩增引物含有部分C、下一个J-C单位的J和C区、第三个J-C单位的J区,和第三个J-C单位的C区的部分。SeqID28是一个这样的扩增引物并且代表必须除去或者破坏的序列。
已经克隆的其他猪λ序列包括:Seq ID No.32,其包括猪λ轻链基因组序列的第一个λJ/C区的5’侧翼序列;Seq ID No.33,其包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列,从λJ/C下游约200个碱基对开始;Seq ID No.34,其包括猪λ轻链基因组序列的J/C簇区的3’侧翼序列,J/C簇下游约11.8Kb,接近增强子;Seq ID No.35,其包括λ下游约12Kb,包括增强子区;Seq ID No 36,其包括λ下游约17.6Kb;Seq ID No 37,其包括λ下游约19.1Kb;Seq ID No 38,其包括λ下游约21.3Kb;和Seq ID No 39,其包括λ下游约27Kb。
Seq ID 26:λC到C扩增引物的5’引物(lam C5’) | ccttcctcctgcacctgtcaac |
Seq ID 26:λC到C扩增引物的3’引物(lam C3’) | tagacacaccagggtggccttg |
实施例4产生λ基因的寻靶载体
在一个实施方案中,已经设计并构建了一种载体,其中一个寻靶臂与J1的上游区同源,而另一个臂与最后一个C下游的区域同源(见图4)。一个寻靶载体设计成靶定J1的上游。该寻靶载体利用选择标记,可以选择所述选择标记的存在或不存在。可以使用本文描述的和本领域已知的阳性和阴性选择标记的任何组合。使用由单纯疱疹胸苷激酶(TK)的编码区和Tn5氨基糖苷磷酸转移酶(Neo抗性)基因组成的融合基因。该融合基因侧翼是本文描述的或者本领域已知的任何位点特异性重组酶(SSRRS)的识别位点,如lox位点。在通过使用G418选择分离靶定的细胞后,以反式提供Cre以缺失标记基因(见图5)。通过加入本领域已知的可以被TK代谢成毒性产物的任何药物,如更昔洛韦来选择已缺失所述标记基因的细胞。然后将所得基因型用第二种载体靶定。第二种寻靶载体(图6)设计成靶定最后一个C的下游并且使用阳性/阴性选择系统,其仅一侧是特异性重组位点(lox)。该重组位点与第一个寻靶事件距离很远。在分离靶定的基因型后,Cre再次以反式提供以介导从第一个寻靶事件中提供的重组位点到第二个寻靶事件中递送的重组位点的缺失。将除去整个J到C簇。通过施用更昔洛韦再次选择合适的基因型。
在另一实例中,用插入寻靶载体独立地破坏每个C区。将设计并装配插入寻靶载体以破坏单独的C区基因。在J-C簇中有至少3个J到C区。我们将通过设计靶定第一个和最后一个C区的载体开始该过程并且将在寻靶载体中包括位点特异性重组位点。一旦产生了两个插入,就将用位点特异性重组酶缺失间插区。
实施例5:重链单敲除猪与κ单敲除体猪的杂交
为了产生具有一个破坏的Ig重链基因座与一个破坏的Ig轻链κ等位基因两者的猪,将单敲除动物杂交。第一次妊娠产生了四个胎儿,其中两个通过PCR和DNA印迹对重链和κ寻靶事件筛选都是阳性的(引物见实施例1和2)。将胎儿成纤维细胞分离、增殖并冷冻。κ单敲除体与重链单敲除体交配导致的第二次妊娠产生了四头健康的小猪。
含有重链单敲除和κ链单敲除的胎儿成纤维细胞将用于进一步寻靶。此类细胞将用于通过本文描述的方法和组合物来靶定λ基因座。所得后代将对于重链、κ链和λ链将是杂合的敲除体。这些动物将与含有如本文描述的人Ig基因的动物进一步杂交,且然后与其他单Ig敲除动物杂交,以产生具有人Ig置换基因的猪Ig双敲除动物。
本发明已经参考其优选实施方案进行了描述。根据前面本发明的详细描述,本发明的变形和修饰将对本领域技术人员是显而易见的。
Claims (115)
1.转基因有蹄类动物,其缺少功能性内源免疫球蛋白的任何表达。
2.权利要求1的转基因有蹄类动物,其中该有蹄类动物缺少内源重链免疫球蛋白的任何表达。
3.权利要求1的转基因有蹄类动物,其中该有蹄类动物缺少内源轻链免疫球蛋白的任何表达。
4.权利要求3的转基因有蹄类动物,其中该有蹄类动物缺少内源κ链免疫球蛋白的任何表达。
5.权利要求3的转基因有蹄类动物,其中该有蹄类动物缺少内源λ链免疫球蛋白的任何表达。
6.权利要求1的转基因有蹄类动物,其中该有蹄类动物选自猪、牛、绵羊和山羊。
7.权利要求6的转基因有蹄类动物,其中该有蹄类动物是猪。
8.权利要求1的转基因有蹄类动物,其中通过核转移产生该有蹄类动物。
9.权利要求1的转基因有蹄类动物,其中该有蹄类动物表达外源免疫球蛋白基因座。
10.权利要求9的转基因有蹄类动物,其中所述外源免疫球蛋白基因座是重链免疫球蛋白或其片段。
11.权利要求9的转基因有蹄类动物,其中所述外源免疫球蛋白基因座是轻链免疫球蛋白或其片段。
12.权利要求11的转基因有蹄类动物,其中所述轻链基因座是κ链基因座或者其片段。
13.权利要求11的转基因有蹄类动物,其中所述轻链基因座是λ链基因座或者其片段。
14.权利要求9的转基因有蹄类动物,其中所述异种基因座是人免疫球蛋白基因座或者其片段。
15.权利要求9的转基因有蹄类动物,其中人工染色体含有所述异种免疫球蛋白。
15.权利要求15的转基因有蹄类动物,其中人工染色体包含哺乳动物人工染色体。
16.权利要求15的转基因有蹄类动物,其中所述哺乳动物人工染色体包含人14号染色体、人2号染色体和人22号染色体的一个或多个或者其片段。
17.转基因哺乳动物,其缺少内源λ链免疫球蛋白的任何表达。
18.表达异种免疫球蛋白基因座或者其片段的转基因有蹄类动物,其中从整合在内源有蹄类动物染色体中的免疫球蛋白基因座表达该免疫球蛋白。
19.权利要求18的转基因有蹄类动物,其中所述异种免疫球蛋白是人免疫球蛋白或者其片段。
20.权利要求18的转基因有蹄类动物,其中所述异种免疫球蛋白基因座被后代遗传。
21.权利要求18的转基因有蹄类动物,其中所述异种免疫球蛋白基因座通过雄性种系被后代遗传。
22.权利要求18的转基因有蹄类动物,其中所述有蹄类动物是猪、绵羊、山羊或者奶牛。
23.权利要求22的转基因有蹄类动物,其中所述有蹄类动物是猪。
24.权利要求18的转基因有蹄类动物,其中通过核转移产生所述有蹄类动物。
25.权利要求18的转基因有蹄类动物,其中应答对一种或多种抗原的暴露,所述免疫球蛋白基因座在B细胞中表达以产生异种免疫球蛋白。
26.权利要求18的转基因有蹄类动物,其中人工染色体包含所述异种免疫球蛋白。
27.权利要求18的转基因有蹄类动物,其中人工染色体包含哺乳动物人工染色体。
28.权利要求27的转基因有蹄类动物,其中所述人工染色体包含酵母人工染色体。
29.权利要求26的转基因有蹄类动物,其中所述人工染色体包含人14号染色体、人2号染色体和人22号染色体的一个或多个或者其片段。
30.来自权利要求1的转基因有蹄类动物的转基因有蹄类动物细胞、组织或者器官。
31.来自权利要求18的转基因有蹄类动物的转基因有蹄类动物细胞、组织或者器官。
32.权利要求30或者31的细胞,其中该细胞是体细胞、繁殖细胞或生殖细胞。
33.权利要求32的细胞,其中所述细胞是B细胞。
34.权利要求33的细胞,其中所述细胞是成纤维细胞。
35.包含异种免疫球蛋白基因座的猪动物。
36.权利要求35的猪,其中人工染色体含有所述异种基因座。
37.权利要求36的猪,其中所述人工染色体包含一个或多个异种免疫球蛋白基因座,其经历重排并且应答对一种或多种抗原的暴露可以产生异种免疫球蛋白。
38.衍生自权利要求35的动物的猪细胞。
39.权利要求36的猪细胞,其中该细胞是体细胞、B细胞或者成纤维细胞。
40.权利要求35的猪,其中所述异种免疫球蛋白是人免疫球蛋白。
41.权利要求36的猪,其中所述一个或多个人工染色体包含哺乳动物人工染色体。
42.权利要求41的猪,其中所述哺乳动物人工染色体包含人14号染色体、人2号染色体和人22号染色体的一个或多个或者其片段。
43.产生异种抗体的方法,该方法包括步骤:(a)对有蹄类动物施用一种或多种目的抗原,所述有蹄类动物的细胞包含一个或多个人工染色体并且缺少功能性内源免疫球蛋白的任何表达,每个人工染色体包含经历重排的一个或多个异种免疫球蛋白基因座,从而导致产生针对所述一种或多种抗原的异种抗体;和(b)从该有蹄类动物回收所述异种抗体。
44.权利要求43的方法,其中所述免疫球蛋白基因座在B细胞中经历重排。
45.权利要求43的方法,其中所述异种免疫球蛋白基因座是重链免疫球蛋白或者其片段。
46.权利要求43的方法,其中所述异种免疫球蛋白基因座是轻链免疫球蛋白或者其片段。
47.权利要求43的方法,其中所述异种基因座是人免疫球蛋白基因座或者其片段。
48.权利要求43的方法,其中人工染色体含有所述异种免疫球蛋白。
49.权利要求48的方法,其中所述人工染色体包含哺乳动物人工染色体。
50.权利要求49的方法,其中所述哺乳动物人工染色体包含人14号染色体、人2号染色体和人22号染色体的一个或多个或者其片段。
51.分离的核苷酸序列,其包含猪重链免疫球蛋白或者其片段,其中该重链免疫球蛋白包括至少一个连接区和至少一个恒定免疫球蛋白区。
52.权利要求51的核苷酸序列,其中所述重链免疫球蛋白包含至少一个可变区、至少两个多样性区、至少四个连接区和至少一个恒定区。
53.权利要求52的核苷酸序列,其中所述重链免疫球蛋白包含Seq ID No.29。
54.权利要求51的核苷酸序列,其中所述重链免疫球蛋白包含Seq ID No.4。
55.权利要求53或54的核苷酸序列,其中所述序列与Seq IDNos4或29至少80、85、90、95、98或99%同源。
56.权利要求53或54的核苷酸序列,其中所述序列含有Seq IDNo.4的至少17、20、25或者30个连续核苷酸或者Seq ID No.29的残基1-9,070。
57.权利要求53或54的核苷酸序列,其中所述序列包含Seq IDNo.29的残基9,070-11039。
58.分离的核苷酸序列,其与Seq ID No.4或29杂交。
59.寻靶载体,其包含:
(a)第一个核苷酸序列,其包含与SEQ ID No29同源的至少17个连续核酸;
(b)选择标记基因;和
(c)第二个核苷酸序列,其包含与SEQ ID No 29同源的至少17个连续核酸,其不与第一个核苷酸序列重叠。
60.权利要求59的寻靶载体,其中所述选择标记包含抗生素抗性基因。
61.权利要求59的寻靶载体,其中所述第一个核苷酸序列代表5’重组臂。
62.权利要求59的寻靶载体,其中所述第二个核苷酸序列代表3’重组臂。
63.用权利要求59的寻靶载体转染的细胞。
64.权利要求63的细胞,其中使得猪重链免疫球蛋白基因座的至少一个等位基因失活。
65.包含权利要求64的细胞的猪动物。
66.分离的核苷酸序列,其包含有蹄类动物κ轻链免疫球蛋白基因座或者其片段。
67.权利要求66的核苷酸序列,其中所述有蹄类动物是猪。
68.权利要求66的核苷酸序列,其中所述有蹄类动物κ轻链免疫球蛋白基因座包含至少一个连接区、一个恒定区和/或一个增强子区。
69.权利要求66的核苷酸序列,其中所述核苷酸序列包含至少五个连接区、一个恒定区和一个增强子区。
70.权利要求69的核苷酸序列,其包含Seq ID No.30。
71.权利要求69的核苷酸序列,其包含Seq ID No.12。
72.权利要求70或71的核苷酸序列,其中所述序列含有Seq IDNo 12或30的至少17、20、25或者30个连续核苷酸。
73.分离的核苷酸序列,其与Seq ID No 12或30杂交。
74.寻靶载体,其包含:
(a)第一个核苷酸序列,其包含与SEQ ID No 30同源的至少17个连续核酸;
(b)选择标记基因;和
(c)第二个核苷酸序列,其包含与SEQ ID No 30同源的至少17个连续核酸,其不与第一个核苷酸序列重叠。
75.权利要求74的寻靶载体,其中所述选择标记包含抗生素抗性基因。
76.权利要求74的寻靶载体,其中所述第一个核苷酸序列代表5’重组臂。
77.权利要求74的寻靶载体,其中所述第二个核苷酸序列代表3’重组臂。
78.用权利要求74的寻靶载体转染的细胞。
79.权利要求78的细胞,其中使得κ链免疫球蛋白基因座的至少一个等位基因失活。
80.包含权利要求79的细胞的猪动物。
81.分离的核苷酸序列,其包含有蹄类动物λ轻链免疫球蛋白基因座。
82.权利要求81的核苷酸序列,其中所述有蹄类动物是猪。
83.权利要求81的核苷酸序列,其中所述有蹄类动物是牛。
84.权利要求81的核苷酸序列,其中所述有蹄类动物λ轻链免疫球蛋白基因座包含J到C单位的多联体。
85.权利要求81的核苷酸序列,其中所述有蹄类动物λ轻链免疫球蛋白基因座包含至少一个连接区-恒定区对和/或至少一个可变区,如通过Seq ID No.31表示的。
86.权利要求82的核苷酸序列,其包含Seq ID No.28。
87.权利要求83的核苷酸序列,其包含Seq ID No.31。
88.权利要求86或87的核苷酸序列,其中所述序列含有Seq IDNo 28或31的至少17、20、25或者30个连续核苷酸。
89.分离的核苷酸序列,其与Seq ID No28或31杂交。
90.寻靶载体,其包含:
(a)第一个核苷酸序列,其包含与SEQ ID No 28或31同源的至少17个连续核酸;
(b)选择标记基因;和
(c)第二个核苷酸序列,其包含与SEQ ID No 28或31同源的至少17个连续核酸,其不与第一个核苷酸序列重叠。
91.权利要求90的寻靶载体,其中所述选择标记包含抗生素抗性基因。
92.权利要求90的寻靶载体,其中所述第一个核苷酸序列代表5’重组臂。
93.权利要求90的寻靶载体,其中所述第二个核苷酸序列代表3’重组臂。
94.用权利要求90的寻靶载体转染的细胞。
95.权利要求94的细胞,其中使得λ链免疫球蛋白基因座的至少一个等位基因失活。
96.包含权利要求95的细胞的猪动物。
97.环化至少100kb DNA的方法,其中该DNA然后通过位点特异性重组酶整合到宿主基因组中。
98.权利要求97的方法,其中可以环化至少100、200、300、400、500、1000、2000、5000、10,000kb的DNA。
99.权利要求97的方法,其中通过在DNA序列的每个末端附着位点特异性重组酶靶位点然后对该DNA序列应用位点特异性重组酶,可以实现DNA的环化。
100.权利要求97的方法,其中所述位点特异性重组酶靶位点是Lox。
权利要求97的方法,其中人工染色体含有所述DNA序列。
权利要求101的方法,其中所述人工染色体是酵母菌人工染色体或者哺乳动物人工染色体。
权利要求101的方法,其中所述人工染色体包含编码人免疫球蛋白基因座或者其片段的DNA序列。
权利要求103的方法,其中所述人免疫球蛋白基因座或者其片段包含人14号染色体、人2号染色体、和/或人22号染色体。
缺少内源免疫球蛋白的至少一个等位基因的表达的转基因有蹄类动物,其中该免疫球蛋白选自重链、κ轻链和λ轻链或者其任意组合。
权利要求105的转基因有蹄类动物,其中表达异种免疫球蛋白。
产生权利要求106的转基因有蹄类动物的方法,其中将所述缺少内源免疫球蛋白的至少一个等位基因的表达的转基因有蹄类动物与表达异种免疫球蛋白的有蹄类动物育种,其中所述内源免疫球蛋白选自重链、κ轻链和λ轻链或者其任意组合。
权利要求105-107任一项的转基因有蹄类动物,其中该有蹄类动物是猪。
权利要求106或107的转基因有蹄类动物,其中所述异种免疫球蛋白是人免疫球蛋白基因座或者其片段。
110.权利要求109的转基因有蹄类动物,其中人工染色体含有所述人免疫球蛋白基因座或者其片段。
111.来自权利要求105的有蹄类动物的细胞。
112.权利要求1、18、105或106的转基因有蹄类动物,其还包含额外的基因修饰以消除异种抗原的表达。
113.权利要求112的转基因有蹄类动物,其中该有蹄类动物缺少α-1,3-半乳糖基转移酶基因的至少一个等位基因的表达。
114.权利要求112的转基因有蹄类动物,其中该有蹄类动物是猪。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62143304P | 2004-10-22 | 2004-10-22 | |
US60/621,433 | 2004-10-22 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101389214A true CN101389214A (zh) | 2009-03-18 |
Family
ID=36228428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800441766A Pending CN101389214A (zh) | 2004-10-22 | 2005-10-24 | 具有基因修饰免疫系统的有蹄类动物 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20060130157A1 (zh) |
EP (2) | EP2527456B1 (zh) |
JP (5) | JP2008517608A (zh) |
KR (1) | KR20070072608A (zh) |
CN (1) | CN101389214A (zh) |
AU (1) | AU2005299413A1 (zh) |
CA (3) | CA3079874C (zh) |
ES (1) | ES2679282T3 (zh) |
NZ (1) | NZ554824A (zh) |
WO (1) | WO2006047603A2 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104994729A (zh) * | 2012-12-14 | 2015-10-21 | Omt公司 | 编码具有人独特型的啮齿动物抗体的多核苷酸以及包含所述多核苷酸的动物 |
CN107001449A (zh) * | 2014-10-15 | 2017-08-01 | 芝诺锡拉公司 | 具有降低的免疫原性的组合物 |
CN107090470A (zh) * | 2011-02-25 | 2017-08-25 | 重组股份有限公司 | 经遗传修饰的动物及其生成方法 |
CN109843047A (zh) * | 2016-08-11 | 2019-06-04 | 杰克逊实验室 | 涉及经遗传修饰的免疫缺陷型非人类动物中改善的人类红血细胞存活的方法和组合物 |
CN109906272A (zh) * | 2016-10-31 | 2019-06-18 | 国立大学法人鸟取大学 | 产生人抗体的非人动物和使用该非人动物的人抗体制作方法 |
CN111154889A (zh) * | 2020-01-16 | 2020-05-15 | 广西扬翔股份有限公司 | 一种与猪体重相关的snp分子标记及其应用和获取方法 |
CN111647627A (zh) * | 2014-04-28 | 2020-09-11 | 重组股份有限公司 | 多重基因编辑 |
US10893667B2 (en) | 2011-02-25 | 2021-01-19 | Recombinetics, Inc. | Non-meiotic allele introgression |
CN112852826A (zh) * | 2019-06-04 | 2021-05-28 | 中国农业科学院兰州兽医研究所 | 猪α环形转录本αCT基因及应用 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001035735A1 (en) * | 1999-11-19 | 2001-05-25 | Hematech, Llc | Production of ungulates, preferably bovines that produce human immunoglobulins |
US7074983B2 (en) * | 1999-11-19 | 2006-07-11 | Kirin Beer Kabushiki Kaisha | Transgenic bovine comprising human immunoglobulin loci and producing human immunoglobulin |
US7414170B2 (en) * | 1999-11-19 | 2008-08-19 | Kirin Beer Kabushiki Kaisha | Transgenic bovines capable of human antibody production |
JP2006505291A (ja) * | 2002-11-08 | 2006-02-16 | ヘマテック,エルエルシー | プリオンタンパク質活性が低減されたトランスジェニック有蹄動物及びその用途 |
AU2005237494B2 (en) * | 2004-04-22 | 2010-06-10 | Kyowa Hakko Kirin Co., Ltd | Transgenic animals and uses thereof |
US20080026457A1 (en) * | 2004-10-22 | 2008-01-31 | Kevin Wells | Ungulates with genetically modified immune systems |
US20090186097A1 (en) | 2005-08-09 | 2009-07-23 | David Lee Ayares | Transgenic Ungulates Expressing CTLA4-IG and Uses Thereof |
LT2602323T (lt) * | 2007-06-01 | 2018-04-10 | Open Monoclonal Technology, Inc. | Kompozicijos ir būdai endogeninių imunoglobulinų genams slopinti ir transgeniniams žmogaus idiotipo antikūnams gaminti |
JP5511144B2 (ja) * | 2008-02-12 | 2014-06-04 | 学校法人福岡大学 | てんかんモデル非ヒト哺乳動物 |
EP2348827B1 (en) * | 2008-10-27 | 2015-07-01 | Revivicor, Inc. | Immunocompromised ungulates |
US9420770B2 (en) | 2009-12-01 | 2016-08-23 | Indiana University Research & Technology Corporation | Methods of modulating thrombocytopenia and modified transgenic pigs |
US10883084B2 (en) | 2018-10-05 | 2021-01-05 | Xenotherapeutics, Inc. | Personalized cells, tissues, and organs for transplantation from a humanized, bespoke, designated-pathogen free, (non-human) donor and methods and products relating to same |
AU2019356014A1 (en) | 2018-10-05 | 2021-05-20 | Alexis Bio, Inc. | Xenotransplantation products and methods |
CN115918611A (zh) * | 2021-10-25 | 2023-04-07 | 百奥赛图(北京)医药科技股份有限公司 | Tgfbr2基因人源化非人动物及其构建方法和应用 |
CN116076438B (zh) * | 2023-03-21 | 2024-01-30 | 湖南中医药大学 | 类风湿关节炎合并间质性肺病动物模型及其构建方法和应用 |
Family Cites Families (215)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US615374A (en) | 1898-12-06 | Ditch in g atxac h m e nt fo r p lows | ||
US4873191A (en) | 1981-06-12 | 1989-10-10 | Ohio University | Genetic transformation of zygotes |
US4994384A (en) | 1986-12-31 | 1991-02-19 | W. R. Grace & Co.-Conn. | Multiplying bovine embryos |
US4889806A (en) | 1987-04-15 | 1989-12-26 | Washington University | Large DNA cloning system based on yeast artificial chromosomes |
US5057420A (en) | 1987-06-05 | 1991-10-15 | Granada Biosciences, Inc. | Bovine nuclear transplantation |
US5270201A (en) | 1988-03-24 | 1993-12-14 | The General Hospital Corporation | Artificial chromosome vector |
JPH03503599A (ja) | 1988-03-24 | 1991-08-15 | ザ・ジェネラル・ホスピタル・コーポレーション | 人工染色体ベクター |
BR8907666A (pt) | 1988-09-21 | 1991-07-30 | Cambridge Animal Biotech | Derivacao de linhas de celulas embrionarias pluripotenciais de animais domesticos |
GB8823068D0 (en) | 1988-09-30 | 1988-11-09 | Ici Plc | Recombinant dna |
GB8823869D0 (en) | 1988-10-12 | 1988-11-16 | Medical Res Council | Production of antibodies |
US5175384A (en) | 1988-12-05 | 1992-12-29 | Genpharm International | Transgenic mice depleted in mature t-cells and methods for making transgenic mice |
US4944384A (en) | 1989-01-30 | 1990-07-31 | Hay & Forage Industries | Trash discharge apparatus for crop transferring conveyor mechanism |
US4997384A (en) | 1989-04-17 | 1991-03-05 | Otis Engineering Corporation | Wet connector |
GB8920211D0 (en) | 1989-09-07 | 1989-10-18 | Ici Plc | Diagnostic method |
SG88714A1 (en) | 1989-11-06 | 2002-05-21 | Cell Genesys Inc | Production of proteins using homologous recombination |
ATE139258T1 (de) | 1990-01-12 | 1996-06-15 | Cell Genesys Inc | Erzeugung xenogener antikörper |
DE69114500T2 (de) | 1990-07-13 | 1996-06-13 | Transkaryotic Therapies Inc | Verfahren zum absuchen einer bibliothek. |
US5789650A (en) | 1990-08-29 | 1998-08-04 | Genpharm International, Inc. | Transgenic non-human animals for producing heterologous antibodies |
US5625126A (en) | 1990-08-29 | 1997-04-29 | Genpharm International, Inc. | Transgenic non-human animals for producing heterologous antibodies |
DE69127627T2 (de) | 1990-08-29 | 1998-02-19 | Genpharm Int | Produktion und Nützung nicht-menschliche transgentiere zur Produktion heterologe Antikörper |
US6300129B1 (en) | 1990-08-29 | 2001-10-09 | Genpharm International | Transgenic non-human animals for producing heterologous antibodies |
AU664976B2 (en) * | 1990-08-29 | 1995-12-14 | Gene Pharming Europe Bv | Homologous recombination in mammalian cells |
US5661016A (en) | 1990-08-29 | 1997-08-26 | Genpharm International Inc. | Transgenic non-human animals capable of producing heterologous antibodies of various isotypes |
WO1994025585A1 (en) | 1993-04-26 | 1994-11-10 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
US5633425A (en) | 1990-08-29 | 1997-05-27 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
US5545806A (en) | 1990-08-29 | 1996-08-13 | Genpharm International, Inc. | Ransgenic non-human animals for producing heterologous antibodies |
US5814318A (en) * | 1990-08-29 | 1998-09-29 | Genpharm International Inc. | Transgenic non-human animals for producing heterologous antibodies |
US5770429A (en) * | 1990-08-29 | 1998-06-23 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
US5382524A (en) | 1990-10-24 | 1995-01-17 | The Mount Sinai School Of Medicine Of The City University Of New York | Cloning and expression of biologically active α-n-acetylgalactosaminidase |
JP3410734B2 (ja) | 1991-03-11 | 2003-05-26 | ゼネカ・リミテッド | 殺生物性蛋白質 |
WO1992022670A1 (en) | 1991-06-12 | 1992-12-23 | Genpharm International, Inc. | Early detection of transgenic embryos |
AU2235992A (en) | 1991-06-14 | 1993-01-12 | Genpharm International, Inc. | Transgenic immunodeficient non-human animals |
WO1993004169A1 (en) * | 1991-08-20 | 1993-03-04 | Genpharm International, Inc. | Gene targeting in animal cells using isogenic dna constructs |
US5288625A (en) | 1991-09-13 | 1994-02-22 | Biologic Research Center Of The Hungarian Academy Of Sciences | Mammalian artificial chromosomes |
WO1993008270A1 (en) | 1991-10-15 | 1993-04-29 | Agracetus, Inc. | Particle-mediated transformation of mammalian unattached cells |
EP0746609A4 (en) | 1991-12-17 | 1997-12-17 | Genpharm Int | NON-HUMAN TRANSGENIC ANIMALS CAPABLE OF PRODUCING HETEROLOGOUS ANTIBODIES |
NZ253943A (en) | 1992-06-18 | 1997-01-29 | Genpharm Int | Transfering polynucleotides into eukaryotic cells using co-lipofection complexes of a cationic lipid and the polynucleotide |
ES2301158T3 (es) | 1992-07-24 | 2008-06-16 | Amgen Fremont Inc. | Produccion de anticuerpos xenogenicos. |
US5981175A (en) | 1993-01-07 | 1999-11-09 | Genpharm Internation, Inc. | Methods for producing recombinant mammalian cells harboring a yeast artificial chromosome |
US5496720A (en) | 1993-02-10 | 1996-03-05 | Susko-Parrish; Joan L. | Parthenogenic oocyte activation |
WO1994023049A2 (en) | 1993-04-02 | 1994-10-13 | The Johns Hopkins University | The introduction and expression of large genomic sequences in transgenic animals |
GB9308271D0 (en) | 1993-04-21 | 1993-06-02 | Univ Edinburgh | Method of isolating and/or enriching and/or selectively propagating pluripotential animal cells and animals for use in said method |
US6096878A (en) | 1993-05-10 | 2000-08-01 | Japan Tobacco Inc. | Human immunoglobulin VH gene segments and DNA fragments containing the same |
US5523226A (en) | 1993-05-14 | 1996-06-04 | Biotechnology Research And Development Corp. | Transgenic swine compositions and methods |
US5851760A (en) | 1993-06-15 | 1998-12-22 | The Salk Institute For Biological Studies | Method for generation of sequence sampled maps of complex genomes |
WO1995003400A1 (en) | 1993-07-23 | 1995-02-02 | Johns Hopkins University School Of Medicine | Recombinationally targeted cloning in yeast artificial chromosomes |
EP0804222A4 (en) | 1993-08-20 | 1998-08-12 | Univ New Jersey Med | FUNCTION OF THE ACCESSORY FACTOR OF THE INTERFERON GAMMA AND ITS RECEIVER |
US5597694A (en) | 1993-10-07 | 1997-01-28 | Massachusetts Institute Of Technology | Interspersed repetitive element-bubble amplification of nucleic acids |
US5625825A (en) * | 1993-10-21 | 1997-04-29 | Lsi Logic Corporation | Random number generating apparatus for an interface unit of a carrier sense with multiple access and collision detect (CSMA/CD) ethernet data network |
JPH09509046A (ja) | 1993-11-29 | 1997-09-16 | ユニヴァーシティ オブ サウス フロリダ | トランスジェニックマウス |
WO1996001276A1 (en) | 1994-07-06 | 1996-01-18 | University Of Medicine & Dentistry Of New Jersey | Expression of a functional human type i interferon receptor |
US5643763A (en) * | 1994-11-04 | 1997-07-01 | Genpharm International, Inc. | Method for making recombinant yeast artificial chromosomes by minimizing diploid doubling during mating |
US5733744A (en) | 1995-01-13 | 1998-03-31 | Cornell Research Foundation, Inc. | Binary BAC vector |
EP0823941A4 (en) | 1995-04-28 | 2001-09-19 | Abgenix Inc | HUMAN ANTIBODIES DERIVED FROM IMMUNIZED XENO MOUSES |
US6682729B1 (en) | 1995-05-03 | 2004-01-27 | University Of Maryland, Baltimore | Method for introducing and expressing genes in animal cells, and live invasive bacterial vectors for use in the same |
US5877159A (en) | 1995-05-03 | 1999-03-02 | University Of Maryland At Baltimore | Method for introducing and expressing genes in animal cells and live invasive bacterial vectors for use in the same |
US6150170A (en) | 1998-05-03 | 2000-11-21 | University Of Maryland At Baltimore | Method for introducing and expressing genes in animal cells, and live invasive bacterial vectors for use in the same |
US6348353B1 (en) | 1995-06-07 | 2002-02-19 | Case Western Reserve University | Artificial mammalian chromosome |
US5985846A (en) | 1995-06-07 | 1999-11-16 | Baylor College Of Medicine | Gene therapy for muscular dystrophy |
US5973133A (en) | 1995-07-18 | 1999-10-26 | Washington University | Mutant S182 genes |
US6455254B1 (en) | 1995-07-18 | 2002-09-24 | Diversa Corporation | Sequence based screening |
CA2227413A1 (en) | 1995-07-21 | 1997-02-06 | The Government Of The United States, Represented By The Secretary, Depar Tment Of Health And Human Services | Reca-assisted cloning of dna |
DK0843961T3 (da) | 1995-08-29 | 2007-05-21 | Kirin Brewery | Kimærisk mus og fremgangsmåde til at producere samme |
US6166288A (en) | 1995-09-27 | 2000-12-26 | Nextran Inc. | Method of producing transgenic animals for xenotransplantation expressing both an enzyme masking or reducing the level of the gal epitope and a complement inhibitor |
WO1997016533A1 (en) | 1995-10-31 | 1997-05-09 | The Regents Of The University Of California | Mammalian artificial chromosomes and methods of using same |
US6133503A (en) | 1995-10-31 | 2000-10-17 | The Regents Of The University Of California | Mammalian artificial chromosomes and methods of using same |
US6150160A (en) | 1995-11-16 | 2000-11-21 | The John Hopkins University | Compositions and methods of use of mammalian retrotransposons |
US5997881A (en) | 1995-11-22 | 1999-12-07 | University Of Maryland, Baltimore | Method of making non-pyrogenic lipopolysaccharide or A |
US5866404A (en) | 1995-12-06 | 1999-02-02 | Yale University | Yeast-bacteria shuttle vector |
US5830696A (en) | 1996-12-05 | 1998-11-03 | Diversa Corporation | Directed evolution of thermophilic enzymes |
US20020132295A1 (en) | 1996-02-09 | 2002-09-19 | Short Jay M. | Enzymes having transaminase and aminotransferase activity and methods of use thereof |
US7288400B2 (en) | 1996-02-16 | 2007-10-30 | Verenium Corporation | Nucleic acids encoding esterases and methods of making and using them |
US6987016B2 (en) | 1996-03-08 | 2006-01-17 | Diversa Corporation | α-galactosidases and methods for making and using them |
EP1500702A1 (en) | 1996-04-01 | 2005-01-26 | Genentech, Inc. | APO-2LI and APO-3 apoptosis polypeptides from the TNFR1 familiy |
US6025155A (en) | 1996-04-10 | 2000-02-15 | Chromos Molecular Systems, Inc. | Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes |
US6077697A (en) | 1996-04-10 | 2000-06-20 | Chromos Molecular Systems, Inc. | Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes |
US20020137185A1 (en) | 1996-06-17 | 2002-09-26 | Jay Short | Enzymes having amidase activity and methods of use thereof |
US6495318B2 (en) | 1996-06-17 | 2002-12-17 | Vectorobjects, Llc | Method and kits for preparing multicomponent nucleic acid constructs |
EP0814156B1 (en) | 1996-06-18 | 2003-03-05 | The Institute Of Physical & Chemical Research | Method for the purification of DNA |
US20020102680A1 (en) | 1996-07-03 | 2002-08-01 | Robertson Dan E. | Catalases |
AU6487196A (en) | 1996-07-09 | 1998-02-02 | Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The | Transformation-associated recombination cloning |
CN1230989A (zh) | 1996-08-19 | 1999-10-06 | 马萨诸塞大学 | 通过种间核移植制备胚胎细胞或干细胞样细胞系 |
US6017755A (en) | 1996-08-22 | 2000-01-25 | Hsc Research & Development Limited | MADR2 tumour suppressor gene |
JP4022835B2 (ja) | 1996-08-26 | 2007-12-19 | 株式会社クロモリサーチ | 哺乳類人工染色体 |
US6187533B1 (en) | 1996-09-10 | 2001-02-13 | Arch Development Corporation | Mutations in the diabetes susceptibility genes hepatocyte nuclear factor (HNF) 1 alpha (α), HNF1β and HNF4α |
CA2265939A1 (en) | 1996-09-18 | 1998-03-26 | Dnavec Research Inc. | Artificial chromosome |
EP0927262A1 (de) | 1996-09-18 | 1999-07-07 | Christian Jung | Nematodenresistenzgen |
US6462176B1 (en) | 1996-09-23 | 2002-10-08 | Genentech, Inc. | Apo-3 polypeptide |
US6136566A (en) | 1996-10-04 | 2000-10-24 | Lexicon Graphics Incorporated | Indexed library of cells containing genomic modifications and methods of making and utilizing the same |
US6020142A (en) | 1996-10-04 | 2000-02-01 | Millennium Pharmaceuticals, Inc. | Rath genes and polypeptides and methods for the treatment and diagnosis of immune disorders |
US6287854B1 (en) | 1996-10-22 | 2001-09-11 | Imperial Cancer Research Technology Limited | Diagnosis of susceptibility to cancer and treatment thereof |
ATE549918T1 (de) | 1996-12-03 | 2012-04-15 | Amgen Fremont Inc | Menschliche antikörper, die ausdrücklich menschliches tnf alpha binden |
US6358523B1 (en) | 1996-12-06 | 2002-03-19 | The Regents Of The University Of California | Macromolecule-lipid complexes and methods for making and regulating |
US7279316B2 (en) | 1996-12-06 | 2007-10-09 | Verenium Corporation | Enzymes having glycosidase activity and methods of use thereof |
AU734189B2 (en) | 1996-12-16 | 2001-06-07 | Mcgill University | Human and mammalian DNA replication origin consensus sequences |
GB9702802D0 (en) | 1997-02-12 | 1997-04-02 | Babraham The Inst | Yeast artificial chromosomes |
ATE466948T1 (de) | 1997-03-11 | 2010-05-15 | Univ Minnesota | Dns-basiertes transposon-system für die einführung von nucleinsäure in die dns einer zelle |
JP3151657B2 (ja) | 1997-03-26 | 2001-04-03 | 農林水産省農業生物資源研究所長 | 遺伝子導入法 |
CN1192109C (zh) | 1997-03-26 | 2005-03-09 | 帝国学院创新有限公司 | 锚定于细胞膜的抗凝血融合蛋白 |
US5843671A (en) | 1997-04-01 | 1998-12-01 | Princeton University | Methods for measuring trinucleotide repeat expansion in Saccharomyces cerevisiae |
ATE302851T1 (de) | 1997-05-07 | 2005-09-15 | Genomics One Corp | Verbesserter klonierungsvektor mit markerinaktivierungssystem |
WO1998051790A1 (en) | 1997-05-13 | 1998-11-19 | Amrad Operations Pty. Ltd. | A novel nucleic acid molecule |
US5972649A (en) | 1997-05-29 | 1999-10-26 | Incyte Pharmaceuticals, Inc. | Polynucleotide sequence encoding human multiple endocrine neoplasia type 1 protein |
CA2292893C (en) | 1997-06-03 | 2012-01-17 | Arch Development Corporation | Plant artificial chromosome (plac) compositions and methods |
US6143566A (en) | 1997-06-23 | 2000-11-07 | The Rockfeller University | Methods of performing homologous recombination based modification of nucleic acids in recombination deficient cells and use of the modified nucleic acid products thereof |
US6156574A (en) | 1997-06-23 | 2000-12-05 | The Rockefeller University | Methods of performing gene trapping in bacterial and bacteriophage-derived artificial chromosomes and use thereof |
US6136952A (en) | 1997-06-25 | 2000-10-24 | University Of Washington | Human jagged polypeptide, encoding nucleic acids and methods of use |
US6207648B1 (en) | 1997-07-24 | 2001-03-27 | Trustees Of Boston University | Methods of using cytochrome P450 reductase for the enhancement of P450-based anti-cancer gene therapy |
US7056703B2 (en) | 1997-08-06 | 2006-06-06 | Diversa Corporation | Polypeptides having polymerase activity and methods of use thereof |
US6855365B2 (en) | 1997-08-13 | 2005-02-15 | Diversa Corporation | Recombinant bacterial phytases and uses thereof |
US6090584A (en) | 1997-08-21 | 2000-07-18 | University Technologies International Inc. | Baculovirus artificial chromosomes and methods of use |
BR9812540A (pt) | 1997-09-26 | 2001-12-26 | Athersys Inc | Expressão de genes endógenos por recombinaçãonão homóloga de uma construção de vetor comdna celular |
US5874259A (en) | 1997-11-21 | 1999-02-23 | Wisconsin Alumni Research Foundation | Conditionally amplifiable BAC vector |
US6485910B1 (en) | 1998-02-09 | 2002-11-26 | Incyte Genomics, Inc. | Ras association domain containing protein |
US6277621B1 (en) | 1998-02-26 | 2001-08-21 | Medigene, Inc. | Artificial chromosome constructs containing foreign nucleic acid sequences |
US6080576A (en) | 1998-03-27 | 2000-06-27 | Lexicon Genetics Incorporated | Vectors for gene trapping and gene activation |
GB9807520D0 (en) | 1998-04-09 | 1998-06-10 | Univ Wales Medicine | Modified biological material |
US6183957B1 (en) | 1998-04-16 | 2001-02-06 | Institut Pasteur | Method for isolating a polynucleotide of interest from the genome of a mycobacterium using a BAC-based DNA library application to the detection of mycobacteria |
US5981225A (en) | 1998-04-16 | 1999-11-09 | Baylor College Of Medicine | Gene transfer vector, recombinant adenovirus particles containing the same, method for producing the same and method of use of the same |
GB9809280D0 (en) | 1998-04-30 | 1998-07-01 | Rpms Technology Ltd | Immunosupression |
AU4255899A (en) | 1998-05-06 | 1999-11-23 | Genprofile Ag | Method for non-radioactive detection of membrane-bonded nucleic acids and test kit |
US6723564B2 (en) | 1998-05-07 | 2004-04-20 | Sequenom, Inc. | IR MALDI mass spectrometry of nucleic acids using liquid matrices |
US6004804A (en) | 1998-05-12 | 1999-12-21 | Kimeragen, Inc. | Non-chimeric mutational vectors |
WO1999058664A1 (en) | 1998-05-14 | 1999-11-18 | Whitehead Institute For Biomedical Research | Solid phase technique for selectively isolating nucleic acids |
AUPP388298A0 (en) | 1998-06-03 | 1998-06-25 | Polychip Pharmaceuticals Pty Ltd | Precursers of pharmaceutical compounds |
US6413776B1 (en) | 1998-06-12 | 2002-07-02 | Galapagos Geonomics N.V. | High throughput screening of gene function using adenoviral libraries for functional genomics applications |
EP1092023A2 (en) | 1998-06-29 | 2001-04-18 | Incyte Pharmaceuticals, Inc. | Molecules associated with apoptosis |
ATE539161T1 (de) | 1998-07-21 | 2012-01-15 | Millipore Corp | Ein ein allgegenwärtiges chromatin-öffnendes element (ucoe) enthaltendes polynucleotid |
WO2000006715A1 (en) | 1998-07-27 | 2000-02-10 | Genotypes Inc. | Automatic eukaryotic artificial chromosome vector |
NZ509634A (en) | 1998-08-11 | 2003-10-31 | Univ Hawaii | A method of transgenic embryo production comprising the coinsertion of an exogenous nucleic acid and a membrane- disrupted sperm head into the cytoplasm of an unfertilised metaphase II oocyte |
US6673909B1 (en) | 1998-08-25 | 2004-01-06 | The General Hospital Corporation | Oligonucleotides for dysferlin, a gene mutated in distal myopathy and limb girdle muscular dystrophy |
US6632934B1 (en) | 1998-09-30 | 2003-10-14 | Board Of Regents, The University Of Texas System | MORC gene compositions and methods of use |
GB9821193D0 (en) | 1998-09-30 | 1998-11-25 | Medical Res Council | Mammalian artificial chromosomes and uses thereof |
US6743906B1 (en) | 1998-10-02 | 2004-06-01 | Board Of Regents, The University Of Texas | PPP2R1B is a tumor suppressor |
GB9825555D0 (en) | 1998-11-20 | 1999-01-13 | Imp College Innovations Ltd | Suppression of xenotransplant rejection |
US6573090B1 (en) | 1998-12-09 | 2003-06-03 | The General Hospital Corporation | Enhanced packaging of herpes virus amplicons and generation of recombinant virus vectors |
CA2357677A1 (en) | 1999-01-07 | 2000-07-13 | Incyte Pharmaceuticals, Inc. | Insulin-synthesis genes |
US20020015950A1 (en) | 1999-07-07 | 2002-02-07 | Karen Anne Jones | Atherosclerosis-associated genes |
ES2338631T3 (es) | 1999-03-04 | 2010-05-11 | Revivicor, Inc. | Modificacion genetica de celulas somaticas y usos de las mismas. |
GB9909446D0 (en) | 1999-04-23 | 1999-06-23 | Medical Res Council | Vector |
US6544768B1 (en) | 1999-05-11 | 2003-04-08 | Cornell Research Foundation, Inc. | Mammalian soluble adenylyl cyclase |
US6284882B1 (en) | 1999-06-10 | 2001-09-04 | Abbott Laboratories | Myostatin gene promoter and inhibition of activation thereof |
FR2795093B1 (fr) | 1999-06-21 | 2003-08-22 | Inst Rech Developpement Ird | Moyens pour l'identification du locus d'un gene majeur de la resistance au virus de la panachure jaune du riz et leurs applications |
JP2003180356A (ja) | 1999-07-09 | 2003-07-02 | Mitsubishi Chemicals Corp | アトピー遺伝子 |
AU6229800A (en) | 1999-07-20 | 2001-02-05 | Rockefeller University, The | Conditional homologous recombination of large genomic vector inserts |
US6475752B1 (en) | 1999-07-30 | 2002-11-05 | Incyte Genomics, Inc. | Mammalian imidazoline receptor |
US7074983B2 (en) | 1999-11-19 | 2006-07-11 | Kirin Beer Kabushiki Kaisha | Transgenic bovine comprising human immunoglobulin loci and producing human immunoglobulin |
US7414170B2 (en) * | 1999-11-19 | 2008-08-19 | Kirin Beer Kabushiki Kaisha | Transgenic bovines capable of human antibody production |
WO2001035735A1 (en) * | 1999-11-19 | 2001-05-25 | Hematech, Llc | Production of ungulates, preferably bovines that produce human immunoglobulins |
ES2170622B1 (es) | 1999-12-03 | 2004-05-16 | Consejo Superior De Investigaciones Cientificas | Clones y vectores infectivos derivados de coronavirus y sus aplicaciones. |
AUPQ462599A0 (en) | 1999-12-13 | 2000-01-13 | Polychip Pharmaceuticals Pty Ltd | Yeast-based process for production of l-pac |
JP2003533973A (ja) | 1999-12-17 | 2003-11-18 | オレゴン ヘルス アンド サイエンス ユニバーシティ | トランスジェニック動物の作製方法 |
US6458561B1 (en) | 2000-03-13 | 2002-10-01 | Incyte Genomics, Inc. | Human NIM1 kinase |
US6492577B1 (en) | 2000-03-16 | 2002-12-10 | The Regents Of The University Of California | Leafy cotyledon2 genes and their uses |
JP2003530113A (ja) | 2000-04-07 | 2003-10-14 | フラームス・インテルウニフェルシタイル・インステイチュート・フォール・ビオテヒノロヒー・ヴェーゼットウェー | 新規な染色体性ベクターおよびその用途 |
CA2412609C (en) | 2000-06-23 | 2010-09-07 | The University Of Chicago | Methods for isolating centromere dna |
US6991900B2 (en) | 2000-06-28 | 2006-01-31 | California Institute Of Technology | Methods for identifying an essential gene in a prokaryotic microorganism |
US6548256B2 (en) | 2000-07-14 | 2003-04-15 | Eppendorf 5 Prime, Inc. | DNA isolation method and kit |
US6610006B1 (en) | 2000-07-25 | 2003-08-26 | C. R. Bard, Inc. | Implantable prosthesis |
US6730500B1 (en) | 2000-08-30 | 2004-05-04 | Zymogenetics, Inc. | Methods for generating a continuous nucleotide sequence from noncontiguous nucleotide sequences |
WO2002031202A2 (en) | 2000-10-10 | 2002-04-18 | Thomas Jefferson University | High throughput genetic screening of lipid and cholesterol processing using fluorescent compounds |
US6692954B1 (en) | 2000-11-03 | 2004-02-17 | The Scripps Research Institute | Generation of human cytomegalovirus yeast artificial chromosome recombinants |
CN1486365B (zh) * | 2000-11-17 | 2010-05-12 | 协和发酵麒麟株式会社 | 异种(人类)免疫球蛋白在克隆转基因有蹄类动物中的表达 |
US6448041B1 (en) | 2000-12-18 | 2002-09-10 | Incyte Genomics, Inc. | Colon cancer marker |
AU2002226307A1 (en) | 2001-01-25 | 2002-08-06 | Evolva Biotech A/S | Artificial chromosomes comprising concatemers of expressible nucleotide sequences |
DE60222857T2 (de) | 2001-01-25 | 2008-07-17 | Evolva Ltd. | Concatemere unterschiedlich exprimierter multipler gene |
WO2002061073A2 (en) | 2001-01-30 | 2002-08-08 | Thomas Jefferson University | Mutwnt fish for genetic screebibg of lipid and cholesterol metabolism |
US20020108132A1 (en) | 2001-02-02 | 2002-08-08 | Avigenics Inc. | Production of a monoclonal antibody by a transgenic chicken |
US7323336B2 (en) | 2001-02-21 | 2008-01-29 | Verenium Corporation | Enzymes having alpha amylase activity and methods of use thereof |
US7700316B2 (en) | 2001-03-07 | 2010-04-20 | Andre Schuh | CD109 nucleic acid molecules, polypeptides and methods of use |
US20030186390A1 (en) | 2001-03-22 | 2003-10-02 | De Jong Gary | Methods for delivering nucleic acid molecules into cells and assessment thereof |
US6936469B2 (en) | 2001-03-22 | 2005-08-30 | Chromos Molecular Systems Inc. | Methods for delivering nucleic acid molecules into cells and assessment thereof |
JP2004532205A (ja) | 2001-03-22 | 2004-10-21 | クロモス・モレキユラー・システムズ・インコーポレーテツド | 細胞への核酸分子の送達およびその評価方法 |
US6455026B1 (en) | 2001-03-23 | 2002-09-24 | Agy Therapeutics, Inc. | Use of protein tyrosine phosphatase zeta as a biomolecular target in the treatment and visualization of brain tumors |
AU2002303277A1 (en) | 2001-04-06 | 2002-10-21 | Vladimir Larionov | Artificial chromosomes that can shuttle between bacteria, yeast, and mammalian cells |
US6472177B1 (en) | 2001-04-23 | 2002-10-29 | Wisconsin Alumni Research Foundation | Expression vector with dual control of replication and transcription |
CA2446050A1 (en) | 2001-05-10 | 2002-11-21 | Baylor College Of Medicine | Compositions and methods for array-based genomic nucleic acid analysis of biological molecules |
EP1391511B1 (en) | 2001-05-11 | 2008-06-11 | Kirin Pharma Kabushiki Kaisha | Artificial human chromosome containing human antibody lambda light chain gene |
EP1390384A4 (en) | 2001-05-30 | 2005-08-17 | Chromos Molecular Systems Inc | PLATFORMS ON CHROMOSOME BASIS |
SG182847A1 (en) | 2001-05-30 | 2012-08-30 | Agrisoma Inc | Plant artificial chromosomes, uses thereof and methods of preparing plant artificial chromosomes |
US20050118581A1 (en) | 2001-06-11 | 2005-06-02 | Peter Lode Del-Favero Jurgen | Novel brain expressed gene and protein associated with bipolar disorder |
US6638722B2 (en) | 2001-06-13 | 2003-10-28 | Invitrogen Corporation | Method for rapid amplification of DNA |
WO2003006610A2 (en) | 2001-07-09 | 2003-01-23 | Diversa Corporation | Thermostable phosphatases and methods of making and using them |
JP2005508619A (ja) | 2001-08-03 | 2005-04-07 | ディヴァーサ コーポレイション | エポキシドヒドロラーゼ、それらをコードした核酸及びそれらの作製法と利用法 |
WO2003052050A2 (en) | 2001-08-03 | 2003-06-26 | Diversa Corporation | P450 enzymes, nucleic acids encoding them and methods of making and using them |
WO2003020898A2 (en) | 2001-08-30 | 2003-03-13 | Spectral Genomics, Inc. | Arrays comprising pre-labeled biological molecules and methods for making and using these arrays |
EP1430151A1 (en) | 2001-09-17 | 2004-06-23 | Janssen Pharmaceutica N.V. | Brain expressed cap-2 gene and protein associated with bipolar disorder |
WO2003027638A2 (en) | 2001-09-27 | 2003-04-03 | Spectral Genomics, Inc. | Methods for detecting genetic mosaicisms using arrays |
AU2002367886B8 (en) | 2001-10-12 | 2008-08-14 | Perkinelmer Las, Inc. | Compilations of nucleic acids and arrays and methods of using them |
US7435871B2 (en) * | 2001-11-30 | 2008-10-14 | Amgen Fremont Inc. | Transgenic animals bearing human Igλ light chain genes |
US20030124542A1 (en) | 2001-12-28 | 2003-07-03 | Spectral Genomics, Inc. | Methods for mapping the chromosomal loci of genes expressed by a cell |
AU2002217606A1 (en) * | 2001-12-29 | 2003-11-03 | Woo Suk Hwang | Gfp-transfected clon pig, gt knock-out clon pig and methods for production thereof |
EP1470147A4 (en) | 2002-01-04 | 2005-11-23 | Univ Stanford | SYNTHETIC DNA NANO CIRCLES FOR TELOMERE AND THEIR USE TO EXTEND TELOMER REPEATS |
WO2003064613A2 (en) | 2002-01-28 | 2003-08-07 | Diversa Corporation | Amidases, nucleic acids encoding them and methods for making and using them |
AU2003219994B2 (en) | 2002-03-04 | 2009-04-09 | The Texas A & M University System | Quantitative trait loci and somatostatin |
EP1495125B1 (en) | 2002-04-10 | 2010-06-16 | THE GOVERNMENT OF THE UNITED STATES OF AMERICA, as represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES | Vac-bac shuttle vector system |
CA2495787A1 (en) | 2002-05-01 | 2003-11-13 | Chromos Molecular Systems, Inc. | Methods for delivering nucleic acid molecules into cells and assessment thereof |
WO2003097812A2 (en) * | 2002-05-17 | 2003-11-27 | Hematech, Llc | Transgenic ungulates capable of human antibody production |
WO2003101396A2 (en) | 2002-05-31 | 2003-12-11 | University Of Rochester | Helper virus-free herpesvirus amplicon particles and uses thereof |
AU2003267993A1 (en) | 2002-07-11 | 2004-02-02 | Diversa Corporation | Monooxygenases, nucleic acids encoding them and methods for making and using them |
US20040180378A1 (en) | 2002-07-19 | 2004-09-16 | Eileen Tozer | Fluorescent proteins, nucleic acids encoding them and methods for making and using them |
US20060252156A1 (en) | 2002-08-01 | 2006-11-09 | Evolva Ltd. C/O Dr. Iur. Martin Eisenring | Methods of mixing large numbers of heterologous genes |
US7518033B2 (en) | 2002-08-02 | 2009-04-14 | The General Hospital Corporation | Methods for the production of cells and mammals with desired genetic modifications |
US7795493B2 (en) | 2002-08-21 | 2010-09-14 | Revivicor, Inc. | Porcine animals lacking any expression of functional alpha 1, 3 galactosyltransferase |
AU2003263031A1 (en) | 2002-09-20 | 2004-04-08 | Diversa Corporation | Chemoenzymatic methods for the synthesis of statins and stain intermediates |
KR20050048666A (ko) | 2002-10-04 | 2005-05-24 | 기린 비루 가부시키가이샤 | 인간 인공 염색체(hac) 벡터 |
WO2004033668A2 (en) | 2002-10-10 | 2004-04-22 | Diversa Corporation | Proteases, nucleic acids encoding them and methods for making and using them |
EP1578937A4 (en) | 2002-11-06 | 2008-07-02 | Verenium Corp | XYLOSE ISOMERASES, NUCLEIC ACIDS ENCODING THEM AND METHODS OF MAKING AND USING THEM |
JP2006505291A (ja) | 2002-11-08 | 2006-02-16 | ヘマテック,エルエルシー | プリオンタンパク質活性が低減されたトランスジェニック有蹄動物及びその用途 |
AU2002952993A0 (en) | 2002-11-29 | 2002-12-12 | The Corporation Of The Trustees Of The Order Of The Sisters Of Mercy In Queensland | Therapeutic and diagnostic agents |
WO2004066945A2 (en) | 2003-01-24 | 2004-08-12 | Diversa Corporation | Enzymes and the nucleic acids encoding them and methods for making and using them |
US7368284B2 (en) * | 2003-06-06 | 2008-05-06 | University Of Pittsburgh | Porcine CMP-N-Acetylneuraminic acid hydroxylase gene |
WO2005047469A2 (en) * | 2003-11-05 | 2005-05-26 | University Of Pittsburgh | PORCINE ISOGLOBOSIDE 3 SYNTHASE PROTEIN, cDNA, GENOMIC ORGANIZATION, AND REGULATORY REGION |
EP1745128A2 (en) * | 2004-05-07 | 2007-01-24 | University of Pittsburgh of the Commonwealth System of Higher Education | PORCINE FORSSMAN SYNTHETASE PROTEIN, cDNA, GENOMIC ORGANIZATION, AND REGULATORY REGION |
EP2348827B1 (en) * | 2008-10-27 | 2015-07-01 | Revivicor, Inc. | Immunocompromised ungulates |
-
2005
- 2005-10-24 CN CNA2005800441766A patent/CN101389214A/zh active Pending
- 2005-10-24 EP EP12161321.0A patent/EP2527456B1/en active Active
- 2005-10-24 WO PCT/US2005/038582 patent/WO2006047603A2/en active Application Filing
- 2005-10-24 CA CA3079874A patent/CA3079874C/en active Active
- 2005-10-24 ES ES12161321.0T patent/ES2679282T3/es active Active
- 2005-10-24 US US11/257,817 patent/US20060130157A1/en not_active Abandoned
- 2005-10-24 JP JP2007538187A patent/JP2008517608A/ja not_active Withdrawn
- 2005-10-24 NZ NZ554824A patent/NZ554824A/en unknown
- 2005-10-24 CA CA2958259A patent/CA2958259C/en active Active
- 2005-10-24 CA CA2585098A patent/CA2585098C/en active Active
- 2005-10-24 EP EP05818708A patent/EP1811832A4/en not_active Withdrawn
- 2005-10-24 KR KR1020077011667A patent/KR20070072608A/ko not_active Application Discontinuation
- 2005-10-24 AU AU2005299413A patent/AU2005299413A1/en not_active Abandoned
-
2012
- 2012-07-20 JP JP2012161653A patent/JP2012196234A/ja not_active Withdrawn
-
2015
- 2015-05-29 JP JP2015109486A patent/JP2015154786A/ja not_active Withdrawn
-
2018
- 2018-03-06 JP JP2018039628A patent/JP7058522B2/ja active Active
-
2021
- 2021-10-01 JP JP2021162704A patent/JP7308243B2/ja active Active
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107090470B (zh) * | 2011-02-25 | 2021-09-07 | 重组股份有限公司 | 经遗传修饰的动物及其生成方法 |
CN107090470A (zh) * | 2011-02-25 | 2017-08-25 | 重组股份有限公司 | 经遗传修饰的动物及其生成方法 |
US10893667B2 (en) | 2011-02-25 | 2021-01-19 | Recombinetics, Inc. | Non-meiotic allele introgression |
CN104994729B (zh) * | 2012-12-14 | 2019-01-11 | Omt公司 | 编码具有人独特型的啮齿动物抗体的多核苷酸以及包含所述多核苷酸的动物 |
CN104994729A (zh) * | 2012-12-14 | 2015-10-21 | Omt公司 | 编码具有人独特型的啮齿动物抗体的多核苷酸以及包含所述多核苷酸的动物 |
CN111647627A (zh) * | 2014-04-28 | 2020-09-11 | 重组股份有限公司 | 多重基因编辑 |
CN107001449A (zh) * | 2014-10-15 | 2017-08-01 | 芝诺锡拉公司 | 具有降低的免疫原性的组合物 |
CN109843047A (zh) * | 2016-08-11 | 2019-06-04 | 杰克逊实验室 | 涉及经遗传修饰的免疫缺陷型非人类动物中改善的人类红血细胞存活的方法和组合物 |
CN109906272A (zh) * | 2016-10-31 | 2019-06-18 | 国立大学法人鸟取大学 | 产生人抗体的非人动物和使用该非人动物的人抗体制作方法 |
US12063913B2 (en) | 2016-10-31 | 2024-08-20 | National University Corporation Tottori University | Human antibody-producing non-human animal and method for preparing human antibodies using same |
CN112852826A (zh) * | 2019-06-04 | 2021-05-28 | 中国农业科学院兰州兽医研究所 | 猪α环形转录本αCT基因及应用 |
CN112961863A (zh) * | 2019-06-04 | 2021-06-15 | 中国农业科学院兰州兽医研究所 | 猪IgA类别转换后转录本α长、短序列 |
CN111154889B (zh) * | 2020-01-16 | 2021-08-03 | 广西扬翔股份有限公司 | 一种与猪体重相关的snp分子标记及其应用和获取方法 |
CN111154889A (zh) * | 2020-01-16 | 2020-05-15 | 广西扬翔股份有限公司 | 一种与猪体重相关的snp分子标记及其应用和获取方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2527456A1 (en) | 2012-11-28 |
ES2679282T3 (es) | 2018-08-23 |
EP1811832A4 (en) | 2009-12-30 |
CA3079874A1 (en) | 2006-05-04 |
JP2008517608A (ja) | 2008-05-29 |
NZ554824A (en) | 2010-10-29 |
WO2006047603A3 (en) | 2007-05-18 |
WO2006047603A2 (en) | 2006-05-04 |
JP7308243B2 (ja) | 2023-07-13 |
US20060130157A1 (en) | 2006-06-15 |
CA2958259C (en) | 2020-06-30 |
JP7058522B2 (ja) | 2022-04-22 |
JP2018086031A (ja) | 2018-06-07 |
CA2585098A1 (en) | 2006-05-04 |
JP2015154786A (ja) | 2015-08-27 |
EP2527456B1 (en) | 2018-05-16 |
CA3079874C (en) | 2023-01-03 |
CA2958259A1 (en) | 2006-05-04 |
JP2012196234A (ja) | 2012-10-18 |
JP2021192647A (ja) | 2021-12-23 |
AU2005299413A1 (en) | 2006-05-04 |
CA2585098C (en) | 2018-12-18 |
EP1811832A2 (en) | 2007-08-01 |
KR20070072608A (ko) | 2007-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA3079874C (en) | Ungulates with genetically modified immune systems | |
US11085054B2 (en) | Ungulates with genetically modified immune systems | |
ES2645698T3 (es) | Animales transgénicos que portan genes de cadena ligera de Ig humana | |
KR101924805B1 (ko) | 인간화 경쇄 마우스 | |
US8124406B2 (en) | Method for modifying chromosomes | |
AU2014271342B2 (en) | Ungulates with genetically modified immune systems | |
US10149461B2 (en) | Immunocompromised ungulates | |
Corcos et al. | Allelic exclusion in transgenic mice expressing a heavy chain disease‐like human μ protein | |
Chi et al. | Expression of Nkx2‐5‐GFP bacterial artificial chromosome transgenic mice closely resembles endogenous Nkx2‐5 gene activity | |
US20040265806A1 (en) | Position-independent and tissue specific expression of a transgene in milk of transgenic animals | |
KR101832485B1 (ko) | 목적유전자를 조건적으로 발현하는 복제된 개과동물의 생산방법 | |
WO2003037081A1 (fr) | Animal transgenique a gene hcv |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090318 |