Nothing Special   »   [go: up one dir, main page]

KR102110725B1 - Tal 이펙터-매개된 dna 변형 - Google Patents

Tal 이펙터-매개된 dna 변형 Download PDF

Info

Publication number
KR102110725B1
KR102110725B1 KR1020197002716A KR20197002716A KR102110725B1 KR 102110725 B1 KR102110725 B1 KR 102110725B1 KR 1020197002716 A KR1020197002716 A KR 1020197002716A KR 20197002716 A KR20197002716 A KR 20197002716A KR 102110725 B1 KR102110725 B1 KR 102110725B1
Authority
KR
South Korea
Prior art keywords
ala
leu
val
gln
pro
Prior art date
Application number
KR1020197002716A
Other languages
English (en)
Other versions
KR20190012274A (ko
Inventor
다니엘 에프. 보이타스
아담 보그다노브
펭 장
미쉘 크리스티안
토마스 서막
클래리스 라우어 슈미트
에린 도일
리 왕
Original Assignee
리전츠 오브 더 유니버스티 오브 미네소타
아이오와 스테이트 유니버시티 리서치 파운데이션, 인코퍼레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=43825298&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR102110725(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 리전츠 오브 더 유니버스티 오브 미네소타, 아이오와 스테이트 유니버시티 리서치 파운데이션, 인코퍼레이티드 filed Critical 리전츠 오브 더 유니버스티 오브 미네소타
Publication of KR20190012274A publication Critical patent/KR20190012274A/ko
Application granted granted Critical
Publication of KR102110725B1 publication Critical patent/KR102110725B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/01Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0014Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
    • C12N9/0022Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with oxygen as acceptor (1.4.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/50Vectors comprising as targeting moiety peptide derived from defined protein
    • C12N2810/80Vectors comprising as targeting moiety peptide derived from defined protein from vertebrates
    • C12N2810/85Vectors comprising as targeting moiety peptide derived from defined protein from vertebrates mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Communicable Diseases (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Oncology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은, 유전자 표적화 (예를 들어, 전사 활성화제-유사 이펙터 뉴클레아제 ("TALENS")를 이용한 유전자 표적화)와 관련된 물질 및 방법이 제공된다.

Description

TAL 이펙터-매개된 DNA 변형 {TAL EFFECTOR-MEDIATED DNA MODIFICATION}
관련 출원에 대한 상호-참조
본 출원은 2009년 12월 10일 출원된 미국 가출원 일련 번호 61/285,324, 2010년 6월 7일 출원된 미국 가출원 일련 번호 61/352,108, 및 2010년 7월 22일 출원된 미국 가출원 일련 번호 61/366,685로부터의 우선권의 이득을 주장하며, 이들 모두는 그 전문이 본원에 참조로 포함된다.
연방 정부가 후원하는 연구에 대한 성명
본 발명은 국립 과학 재단 (National Science Foundation)에 의해 지급된 연구비 번호 0820831 및 0504304 하에 정부 지지로 수행되었다. 정부는 본 발명에 특정 권리를 갖는다.
기술 분야
본 발명은 유전자 표적화를 위한 방법, 및 특히 전사 활성화제-유사 (TAL) 이펙터 서열의 사용을 포함하는 방법에 관한 것이다.
상동성 재조합 (유전자 표적화)을 통해 염색체를 변형하는 능력은 생물학자들이 오랫동안 추구해온 목표이다. 식물에서, 예를 들어, 유전자 표적화는 식물 유전자의 기능을 식별하는데 도움이 될 수 있으며, 작물 개선을 위한 새로운 가능성을 연다. 예를 들어, 유전자 표적화로 변경된 오일 또는 탄수화물 프로파일을 갖는 종자, 향상된 영양 질을 갖는 음식, 또는 질환 및 스트레스에 대해 증가된 내성을 갖는 식물을 포함하는 고가의 작물을 생산하기 위한 대사적 경로를 재조정하기 위해 요구되는 유전적 수술을 수행하는 것이 가능하다. 동물 (예를 들어, 포유동물)에서, 유전자 표적화는 질환의 치료를 위해 사용될 수 있다. 예를 들어, 유전자 표적화는 다양한 유형의 돌연변이로 인해 결손이 있는 유전자에서 교정을 조작하기 위해 사용될 수 있다. 상기 유전자 표적화를 위한 효율적인 방법은 달성하기 어려웠다.
속 산토모나스 (Xanthomonas)에서의 식물 병원성 세균의 TAL 이펙터는 질환에서 중요한 역할을 하거나, 또는 숙주 DNA에 결합하고, 이펙터-특이적 숙주 유전자를 활성화시킴으로써 방어를 촉발시킨다 (예를 들어, 문헌 [Gu et al. (2005) Nature 435:1122]; [Yang et al. (2006) Proc. Natl. Acad. Sci. USA 103:10503]; [Kay et al. (2007) Science 318:648]; [Sugio et al. (2007) Proc. Natl. Acad. Sci. USA 104:10720]; 및 [Romer et al. (2007) Science 318:645]를 참조함). 특이성은 불완전한, 전형적으로 34개 아미노산 반복물의 이펙터-가변 수에 의존한다 (문헌 [Schornack et al. (2006) J. Plant Physiol. 163:256]). 다형태는 주로 본원에 반복 가변-이중잔기 (RVD)로서 지칭된 반복 위치 12 및 13에 존재한다.
본 발명은 TAL 이펙터의 RVD는 1개 RVD 대 1개 뉴클레오티드의 직접적인, 선형 방식으로 일부 동의성을 갖고, 명백한 맥락 의존 없이 그들의 표적 부위의 뉴클레오티드에 상응한다는 사실을 부분적으로 기반으로한다. 이 놀라운 발견은 새로운 표적 특이적 TAL 이펙터에 대한 표적 부위 예측을 가능하게 하는 단백질-DNA 인식을 위한 신규한 기전을 나타낸다. 본원에 기재된 바와 같이, 이들 단백질은 게놈 조작에서 상동성 재조합을 용이하게 할 수 있는 표적화된 키메라 뉴클레아제로서 연구 및 생명공학에 유용할 수 있다 (예를 들어, 식물에서 바이오연료 또는 바이오재생품 (biorenewables)에 대해 유용한 특성을 첨가하거나 또는 증대시키기 위함). 이들 단백질은 또한 예를 들어, 전사 인자로서, 그리고 특히 매우 높은 수준의 특이성을 요구하는 치료적 적용, 예를 들어 비제한적인 예로서 병원체 (예를 들어, 바이러스)에 대한 치료제로서 유용할 수 있다.
하나의 측면에서, 본 발명은 (a) 표적 DNA 서열을 함유하는 세포를 제공하는 단계; 및 (b) (i) 이중 가닥 DNA를 변형시킬 수 있는 DNA 변형 효소 도메인, 및 (ii) 표적 DNA 서열에서 특정 뉴클레오티드 서열에 조합으로 결합하는 다수의 전사 활성화제-유사 (TAL) 이펙터 반복 서열을 포함하는 TAL 이펙터 도메인을 포함하는 TAL 이펙터-DNA 변형 효소를 세포 내로 도입시켜 TAL 이펙터-DNA 변형 효소가 세포 또는 그의 자손에서 특정 뉴클레오티드 서열 내 또는 그에 인접한 표적 DNA를 변형시키는 단계를 포함하는, 세포의 유전 물질을 변형시키는 방법을 특징으로 한다. 방법은 표적 DNA 서열의 적어도 일부분에 상동성인 서열을 포함하는 핵산을 세포에 제공하여 상동성 재조합이 표적 DNA 서열과 핵산 사이에 일어나도록 하는 단계를 추가로 포함할 수 있다. 세포는 진핵생물 세포, 포유동물 세포, 식물 세포, 또는 원핵생물 세포일 수 있다. 표적 DNA는 염색체 DNA일 수 있다. 도입은 TAL 이펙터-DNA 변형 효소를 코딩하는 벡터로 세포를 형질감염시킴, 단백질로서 TAL 이펙터-DNA 변형 효소를 세포 내로 기계적으로 주입함, 박테리아 유형 III 분비 시스템에 의해 단백질로서 TAL 이펙터-DNA 변형 효소를 세포 내로 전달함, 또는 전기천공에 의해 단백질로서 TAL 이펙터-DNA 변형 효소를 세포 내로 도입함을 포함할 수 있다. DNA 변형 효소는 엔도뉴클레아제 (예를 들어, 유형 II 제한 엔도뉴클레아제, 예를 들어 FokI)일 수 있다.
표적 DNA 내의 특정 뉴클레오티드 서열에 결합하는 TAL 이펙터 도메인이 10개 이상의 DNA 결합 반복물, 및 바람직하게는 15개 이상의 DNA 결합 반복물을 포함할 수 있다. 각각의 DNA 결합 반복물은 표적 DNA 서열에서 염기쌍의 인식을 결정하는 반복 가변-이중잔기 (RVD)를 포함하며 표적 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 RVD는 C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N* (여기서, *는 RVD의 제2 위치에서의 갭을 나타냄); T를 인식하기 위한 HG; T를 인식하기 위한 H* (여기서, *는 RVD의 제2 위치에서의 갭을 나타냄); T를 인식하기 위한 IG; G를 인식하기 위한 NK; C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; 및 T를 인식하기 위한 YG 중 하나 이상을 포함할 수 있다. 각각의 DNA 결합 반복물은 표적 DNA 서열에서 염기쌍의 인식을 결정하는 RVD를 포함하며 표적 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 RVD는 C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; T를 인식하기 위한 YG; 및 G를 인식하기 위한 NK 중 하나 이상을 포함하고, C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N* (여기서, *는 RVD의 제2 위치에서의 갭을 나타냄); T를 인식하기 위한 HG; T를 인식하기 위한 H* (여기서, *는 RVD의 제2 위치에서의 갭을 나타냄); 및 T를 인식하기 위한 IG 중 하나 이상을 포함할 수 있다.
또다른 측면에서, 본 발명은 (1) 선택된 뉴클레오티드 서열의 제1 뉴클레오티드에 특이적인 반복 가변-이중잔기 (RVD)를 갖는 제1 TAL 이펙터 DNA 결합 반복 도메인을 코딩하는 뉴클레오티드 서열을 포함하는 스타터 플라스미드를 PspXI로 선형화하며, 상기 제1 TAL 이펙터 DNA 결합 반복 도메인은 그의 3' 말단에서 고유 PspXI 부위를 갖는 것인 단계; (2) 선택된 뉴클레오티드 서열의 다음 뉴클레오티드(들)에 특이적인 RVD를 갖는 하나 이상의 TAL 이펙터 DNA 결합 반복 도메인을 코딩하는 DNA 모듈을 스타터 플라스미드 PspXI 부위에 라이게이션하며, 상기 DNA 모듈은 XhoI 점성 말단을 갖는 것인 단계; 및 (3) 핵산이 선택된 뉴클레오티드 서열에 결합할 수 있는 TAL 이펙터를 코딩할 때까지 단계 (1) 및 (2)를 반복하는 단계를 포함하는, 선택된 뉴클레오티드 서열에 특이적인 TAL 이펙터를 코딩하는 핵산을 생성시키는 방법을 특징으로 한다. 방법은 라이게이션 후 PspXI 부위에서 DNA 모듈의 배향을 결정하는 단계를 추가로 포함할 수 있다. 방법은 단계 (1) 및 (2)를 1회 내지 30회 반복하는 단계를 추가로 포함할 수 있다.
또다른 측면에서, 본 발명은 (a) 세포의 게놈에서 제1 뉴클레오티드 서열을 확인하는 단계; 및 (b) (i) 제1 고유 뉴클레오티드 서열에 조합으로 결합하는 다수의 DNA 결합 반복물, 및 (ii) 제1 뉴클레오티드 서열 내 또는 그에 인접한 위치에서 이중 가닥 절단을 생성시키는 엔도뉴클레아제를 포함하는 전사 활성화제-유사 이펙터 엔도뉴클레아제 (TALEN)를 코딩하는 핵산을 합성하는 단계를 포함하며, 상기 각각의 DNA 결합 반복물은 표적 DNA에서 염기쌍의 인식을 결정하는 RVD를 포함하며 표적 DNA에서 1개의 염기쌍의 인식을 담당하고, 상기 TALEN은 하기 RVD: C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N*; T를 인식하기 위한 HG; T를 인식하기 위한 H*; T를 인식하기 위한 IG; G를 인식하기 위한 NK; C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; 및 T를 인식하기 위한 YG 중 하나 이상을 포함하는, TALEN을 코딩하는 핵산을 생성시키는 방법을 특징으로 한다.
TALEN은 하기 RVD: C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; T를 인식하기 위한 YG; 및 G를 인식하기 위한 NK 중 하나 이상을 포함하고, C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N*; T를 인식하기 위한 HG; T를 인식하기 위한 H*; 및 T를 인식하기 위한 IG 중 하나 이상을 포함할 수 있다.
제1 뉴클레오티드 서열은 하기 기준 중 적어도 하나를 충족할 수 있다: i) 최소 15개의 염기 길이이고, 5'에서 3'로 배향되며, 이때 T는 5' 말단에서의 부위 바로 앞에 존재함; ii) 제1 (5') 위치에 T를 갖지 않거나 제2 위치에 A를 갖지 않음; iii) 최종 (3') 위치에서 T로 끝나고 최종 위치 옆에 G를 갖지 않음; 및 iv) 0 내지 63% A, 11 내지 63% C, 0 내지 25% G, 및 2 내지 42% T의 염기 조성을 가짐.
방법은 세포의 게놈에서 제1 뉴클레오티드 서열 및 제2 뉴클레오티드 서열을 확인하는 단계를 포함하며, 상기 제1 및 제2 뉴클레오티드 서열은 상기 기재된 기준 중 적어도 하나를 충족하고 15 내지 18개의 염기쌍에 의해 분리되는 것을 포함할 수 있다. 엔도뉴클레아제는 제1 및 제2 뉴클레오티드 서열 사이의 이중 가닥 절단을 생성시킬 수 있다.
또다른 실시양태에서, 본 발명은 엔도뉴클레아제 도메인 및 표적 DNA에 특이적인 TAL 이펙터 DNA 결합 도메인을 포함하고, 하기 RVD: C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N*; T를 인식하기 위한 HG; T를 인식하기 위한 H*; T를 인식하기 위한 IG; G를 인식하기 위한 NK; C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; 및 T를 인식하기 위한 YG 중 하나 이상을 포함하며, 상기 DNA 결합 도메인은 다수의 DNA 결합 반복물을 포함하고, 각각의 DNA 결합 반복물은 표적 DNA에서 염기쌍의 인식을 결정하는 RVD를 포함하며 표적 DNA에서 1개의 염기쌍의 인식을 담당하는 것인 TALEN을 특징으로 한다. TALEN은 하기 RVD: C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; T를 인식하기 위한 YG; 및 G를 인식하기 위한 NK 중 하나 이상을 포함할 수 있고, C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N*; T를 인식하기 위한 HG; T를 인식하기 위한 H*; 및 T를 인식하기 위한 IG 중 하나 이상을 포함할 수 있다. 엔도뉴클레아제 도메인은 유형 II 제한 엔도뉴클레아제 (예를 들어, FokI)로부터 유래된 것일 수 있다.
또다른 측면에서, 본 발명은 엔도뉴클레아제 도메인 및 TAL 이펙터 도메인을 포함하며, 아미노산 서열이 서열 33 내지 서열 55, 서열 72 및 서열 73으로 이루어진 군으로부터 선택된 것인 TALEN을 특징으로 한다.
본 발명은 또한 유전자 변형의 도입이 필요한 표적 DNA 서열을 포함하는 진핵생물 세포를 제공하는 단계; 엔도뉴클레아제 도메인 및 표적 DNA 서열에 결합하는 TAL 이펙터 도메인을 포함하는 TALEN으로 표적 DNA 서열 내의 이중 가닥 전단을 생성시키는 단계; 및 이중 가닥 절단이 일어난 세포 또는 그의 자손으로부터 동물을 생성시키는 단계를 포함하는, 동물을 생성시키는 방법을 특징으로 한다. 방법은 표적 DNA의 적어도 일부분에 상동성인 서열을 포함하는 외인성 핵산을 세포 내로 도입하며, 이때 도입은 세포 또는 그의 자손에서 외인성 핵산과 표적 DNA 서열 사이에 상동성 재조합이 일어나도록 하는 조건 하에서 이루어지는 것인 단계; 및 상동성 재조합이 일어난 세포 또는 그의 자손으로부터 동물을 생성시키는 단계를 추가로 포함할 수 있다. 동물은 포유동물일 수 있다. 유전적 변형은 치환, 삽입, 또는 결실을 포함할 수 있다.
또다른 측면에서, 본 발명은 예비선택된 유전자 변형의 도입이 필요한 표적 DNA 서열을 포함하는 식물 세포를 제공하는 단계; 엔도뉴클레아제 도메인 및 표적 DNA 서열에 결합하는 TAL 이펙터 도메인을 포함하는 TALEN으로 표적 DNA 서열 내의 이중 가닥 절단을 생성시키는 단계; 및 이중 가닥 절단이 일어난 세포 또는 그의 자손으로부터 식물을 생성시키는 단계를 포함하는, 식물을 생성시키는 방법을 특징으로 한다. 방법은 표적 DNA 서열의 적어도 일부분에 상동성인 서열을 포함하는 외인성 핵산을 식물 세포 내로 도입하며, 이때 도입은 세포 또는 그의 자손에서 외인성 핵산과 표적 DNA 서열 사이에 상동성 재조합이 일어나도록 하는 조건 하에서 이루어지는 것인 단계; 및 상동성 재조합이 일어난 세포 또는 그의 자손으로부터 식물을 생성시키는 단계를 추가로 포함할 수 있다.
또다른 측면에서, 본 발명은 선택된 DNA 표적 서열을 표적으로 하는 TAL 이펙터 엔도뉴클레아제를 코딩하는 핵산을 세포 내로 도입하는 단계; 세포 내에서 TAL 이펙터 엔도뉴클레아제의 발현을 유도하는 단계; 및 선택된 DNA 표적 서열이 돌연변이를 나타내는 세포를 확인하는 단계를 포함하는, 세포에서의 표적화된 유전자 재조합 방법을 특징으로 한다. 돌연변이는 유전 물질의 결실, 유전 물질의 삽입, 및 유전 물질의 결실 및 삽입 둘 다로 이루어진 군으로부터 선택될 수 있다. 방법은 세포 내로 공여자 DNA를 도입하는 단계를 추가로 포함할 수 있다. 세포는 곤충 세포, 식물 세포, 어류 세포, 또는 포유동물 세포일 수 있다.
또다른 측면에서, 본 발명은 다수의 DNA 결합 반복물을 갖는 DNA 결합 도메인을 포함하는 TAL 이펙터를 코딩하는 핵산을 생성시키는 단계를 포함하며, 상기 각각의 DNA 결합 반복물은 표적 DNA에서 염기쌍의 인식을 결정하는 RVD를 포함하며 표적 DNA에서 1개의 염기쌍의 인식을 담당하고, 상기 생성은 A, C 또는 G에 대한 특이성을 갖는 변이 0번째 DNA 결합 반복 서열을 코딩하는 핵산을 혼입시켜 결합 부위의 -1 위치에서 T에 대한 요구를 제거하는 것인, 표적 DNA에 대한 향상된 표적화 능력을 갖는 TAL 이펙터를 생성시키는 방법을 특징으로 한다.
또다른 측면에서, 본 발명은 다수의 DNA 결합 반복물을 갖는 DNA 결합 도메인을 포함하는 TAL 이펙터를 코딩하는 핵산을 생성시키는 단계를 포함하며, 상기 각각의 DNA 결합 반복물은 표적 DNA에서 염기쌍의 인식을 결정하는 RVD를 포함하며 표적 DNA에서 1개의 염기쌍의 인식을 담당하고, 상기 생성은 G에 대한 향상된 특이성을 갖는, RN, R*, NG, NH, KN, K*, NA, NT, DN, D*, NL, NM, EN, E*, NV, NC, QN, Q*, NR, NP, HN, H*, NK, NY, SN, S*, ND, NW, TN, T*, NE, NF, YN, Y*, 및 NQ (여기서, *은 RVD의 제2 위치에서의 갭을 나타냄)로 이루어진 군으로부터 선택된 RVD를 함유하는 TAL 이펙터 DNA 결합 도메인을 코딩하는 하나 이상의 핵산을 혼입시킴을 포함하는 것인, 표적 DNA에 대한 향상된 표적화 능력을 갖는 TAL 이펙터를 생성시키는 방법을 특징으로 한다.
본 발명은 또한 전사 활성화제-유사 (TAL) 이펙터로부터 유래된 1개 이상의 반복 단위를 포함하는 반복 도메인을 포함하는 폴리펩티드를 합성하는 단계를 포함하며, 상기 반복 단위는 표적 DNA 서열에서 염기쌍의 인식을 결정하는 초가변 영역을 포함하며 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 초가변 영역은 (a) C/G의 인식을 위한 HD; (b) A/T의 인식을 위한 NI; (c) T/A의 인식을 위한 NG; (d) C/G 또는 A/T 또는 T/A 또는 G/C의 인식을 위한 NS; (e) G/C 또는 A/T의 인식을 위한 NN; (f) T/A의 인식을 위한 IG; (g) C/G의 인식을 위한 N; (h) C/G 또는 T/A의 인식을 위한 HG; (i) T/A의 인식을 위한 H; 및 (j) G/C의 인식을 위한 NK로 이루어진 군으로부터 선택된 구성원을 포함하는 것인, 표적 DNA 서열에서 1개 이상의 염기쌍을 선택적으로 인식하는 폴리펩티드를 제조하는 방법을 특징으로 한다. 또한, 본 발명은 상기 방법에 의해 제조된 폴리펩티드, 및 상기 방법에 의해 제조된 폴리펩티드에 대한 코딩 서열을 포함하는 DNA를 특징으로 한다. 또한 상기-언급된 DNA에 작동가능하게 연결된 프로모터를 포함하는 발현 카세트, 및 발현 카세트를 포함하는 비-인간 숙주 세포를 특징으로 한다. 또다른 측면에서, 본 발명은 발현 카세트를 포함하는, 형질전환된 비-인간 유기체를 특징으로 한다.
또다른 측면에서, 본 발명은 TAL 이펙터로부터 유래된 1개 이상의 반복 단위를 포함하는 반복 도메인을 포함하는 폴리펩티드를 제작하는 단계를 포함하며, 상기 반복 단위는 DNA 서열에서 염기쌍의 인식을 결정하는 초가변 영역을 포함하며 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 초가변 영역은 (a) C/G의 인식을 위한 HD; (b) A/T의 인식을 위한 NI; (c) T/A의 인식을 위한 NG; (d) C/G 또는 A/T 또는 T/A 또는 G/C의 인식을 위한 NS; (e) G/C 또는 A/T의 인식을 위한 NN; (f) T/A의 인식을 위한 IG; (g) C/G의 인식을 위한 N; (h) C/G 또는 T/A의 인식을 위한 HG; (i) T/A의 인식을 위한 H; 및 (j) G/C의 인식을 위한 NK로 이루어진 군으로부터 선택된 구성원을 포함하는 것인, 폴리펩티드에 의해 DNA 서열에서 염기쌍을 선택적으로 인식하는 방법을 특징으로 한다.
본 발명은 또한 TAL 이펙터로부터 유래된 1개 이상의 반복 단위를 포함하는 반복 도메인을 포함하는 폴리펩티드를 함유하는 세포를 제공하며, 상기 반복 단위는 DNA 서열에서 염기쌍의 인식을 결정하는 초가변 영역을 포함하며 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 초가변 영역은 (a) C/G의 인식을 위한 HD; (b) A/T의 인식을 위한 NI; (c) T/A의 인식을 위한 NG; (d) C/G 또는 A/T 또는 T/A 또는 G/C의 인식을 위한 NS; (e) G/C 또는 A/T의 인식을 위한 NN; (f) T/A의 인식을 위한 IG; (g) C/G의 인식을 위한 N; (h) C/G 또는 T/A의 인식을 위한 HG; (i) T/A의 인식을 위한 H; 및 (j) G/C의 인식을 위한 NK로 이루어진 군으로부터 선택된 구성원을 포함하는 것인, 세포에서 표적 유전자의 발현을 조절하는 방법을 특징으로 한다.
또다른 측면에서, 본 발명은 TAL 이펙터로부터 유래된 1개 이상의 반복 단위를 포함하는 반복 도메인을 포함하며, 상기 반복 단위는 DNA 서열에서 염기쌍의 인식을 결정하는 초가변 영역을 포함하며 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 초가변 영역은 (a) C/G의 인식을 위한 HD; (b) A/T의 인식을 위한 NI; (c) T/A의 인식을 위한 NG; (d) C/G 또는 A/T 또는 T/A 또는 G/C의 인식을 위한 NS; (e) G/C 또는 A/T의 인식을 위한 NN; (f) T/A의 인식을 위한 IG; (g) C/G의 인식을 위한 N; (h) C/G 또는 T/A의 인식을 위한 HG; (i) T/A의 인식을 위한 H; 및 (j) G/C의 인식을 위한 NK로 이루어진 군으로부터 선택된 구성원을 포함하는 것인, 폴리펩티드를 특징으로 한다. 본 발명은 또한 상기-언급된 폴리펩티드에 대한 코딩 서열을 포함하는 DNA를 특징으로 한다.
또다른 측면에서, 본 발명은 TAL 이펙터로부터 유래된 1개 이상의 반복 단위를 포함하는 반복 도메인을 포함하는 폴리펩티드에 의해 염기쌍이 특이적으로 인식될 수 있게 표적 DNA 서열에 위치한 염기쌍을 포함하도록 변형되며, 상기 반복 단위는 DNA 서열에서 염기쌍의 인식을 결정하는 초가변 영역을 포함하며 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 초가변 영역에 의한 선택적 및 결정적 인식을 받기 위해 염기쌍은 (a) HD에 의해 인식되는 C/G; (b) NI에 의해 인식되는 A/T; (c) NG에 의해 인식되는 T/A; (d) NS에 의해 인식되는 CT 또는 A/T 또는 T/A 또는 G/C; (e) NN에 의해 인식되는 G/C 또는 A/T; (f) IG에 의해 인식되는 T/A; (g) N에 의해 인식되는 C/G 또는 T/A; (h) HG에 의해 인식되는 T/A; (i) H에 의해 인식되는 T/A; 및 (j) NK에 의해 인식되는 G/C로 이루어진 군으로부터 선택된 것인, DNA를 특징으로 한다. 또한 상기-언급된 DNA를 포함하는 벡터, DNA를 포함하는 비-인간 숙주 세포, 및 DNA를 포함하는, 형질전환된 비-인간 유기체를 특징으로 한다.
또다른 측면에서, 본 발명은 TAL 이펙터로부터 유래된 1개 이상의 반복 단위를 포함하는 반복 도메인을 포함하는 폴리펩티드에 의해 선택적으로 인식되는 표적 DNA 서열을 포함하는 DNA를 제조하는 방법이며, 상기 반복 단위는 표적 DNA 서열에서 염기쌍의 인식을 결정하는 초가변 영역을 포함하며 표적 DNA 서열에서 1개의 염기쌍의 인식을 담당하고, 상기 방법은 (a) HD에 의해 인식되는 C/G; (b) NI에 의해 인식되는 A/T; (c) NG에 의해 인식되는 T/A; (d) NS에 의해 인식되는 CT 또는 A/T 또는 T/A 또는 G/C; (e) NN에 의해 인식되는 G/C 또는 A/T; (f) IG에 의해 인식되는 T/A; (g) N에 의해 인식되는 C/G 또는 T/A; (h) HG에 의해 인식되는 T/A; (i) H에 의해 인식되는 T/A; 및 (j) NK에 의해 인식되는 G/C로 이루어진 군으로부터 선택된, 반복 단위에 의해 인식될 수 있는 염기쌍을 포함하는 DNA를 합성하는 단계를 포함하는 것인, 제조 방법을 특징으로 한다.
또다른 측면에서, 본 발명은 식물 세포의 유전 물질을 변형시키기 위한 방법을 특징으로 한다. 방법은 (a) 식물 세포에 (i) 식물 세포에 존재하는 상응하는 표적 뉴클레오티드 서열에 대한 뉴클레오티드 서열의 하나 이상의 변형을 포함하는 변형된 표적 뉴클레오티드 서열을 포함하는 제1 재조합 핵산을 도입시키는 단계 (여기서 표적 뉴클레오티드 서열은 서열-특이적 TAL 이펙터 엔도뉴클레아제 (TALEN)에 대한 인식 부위를 추가로 포함함); (ii) 서열-특이적 전사 활성화제-유사 (TAL) 이펙터 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 제2 재조합 핵산을 도입시키는 단계; (b) 식물 세포를 함유하는 식물을 생성하는 단계; (c) 표적 뉴클레오티드 서열에서의 재조합에 대해 식물, 또는 그의 자손으로부터 수득된 세포, 종자, 또는 조직을 분석하는 단계를 포함할 수 있다. 방법은 식물 세포에 (iii) 선별 마커를 코딩하는 뉴클레오티드 서열을 포함하는 제3 재조합 핵산을 도입하는 단계; 및 식물 또는 그의 자손이 선별 마커를 발현하는지 결정하는 단계를 추가로 포함할 수 있다. 방법은 선별 마커의 부재에 대해 식물 또는 그의 자손을 스크리닝하는 단계를 추가로 포함할 수 있다. 선별 마커를 코딩하는 뉴클레오티드 서열은 식물 세포에 대해 내인성인 서열에 유사하거나 또는 동일한 서열의 한 측면 또는 두 측면 모두에 위치하거나 또는 위치하지 않을 수 있다 (예를 들어, 제2 서열-특이적 뉴클레아제에 대한 절단 부위의 서열). 선별 마커를 코딩하는 뉴클레오티드 서열은 서열-특이적 재조합효소에 대한 인식 부위의 두 측면 모두에 위치할 수 있다. 방법은 선별 마커의 부재에 대해 이종 교배의 자손을 스크리닝하는 단계를 포함하거나 또는 포함하지않고 식물을 이종 교배시키는 단계를 추가로 포함할 수 있다. 제1 및 제2 재조합 핵산은 식물 세포에 동시에 도입될 수 있다. 하나 또는 두 개 모두의 재조합 핵산은 도입 단계 전에 선형화될 수 있다. 제1 및 제2 재조합 핵산은 동일 구조체 내에 존재할 수 있다.
또다른 측면에서, 본 발명은 세포의 유전 물질을 변형하기 위한 또다른 방법을 특징으로 한다. 상기 방법은 상동성 재조합 발생을 목적으로 하는 염색체 표적 DNA 서열을 함유하는 1차 세포를 제공하는 것, 이중 가닥 DNA를 절단할 수 있는 엔도뉴클레아제 도메인을 포함하는 TALEN, 및 세포에서 표적 DNA 내의 특정 뉴클레오티드 서열에 조합으로 결합하는 다수의 TAL 이펙터 반복 서열을 포함하는 TAL 이펙터 도메인을 제공하는 것; 및 TALEN이 세포에서 표적 DNA 서열 내부 또는 표적 DNA 서열에 인접한 뉴클레오티드 서열의 가닥 모두를 절단하도록 세포에서 TALEN과 표적 DNA 서열을 접촉시키는 것을 포함할 수 있다. 상기 방법은 또한 상동성 재조합이 표적 DNA 서열 및 핵산 사이에서 발현하도록 적어도 표적 DNA의 일부와 상동성인 서열을 포함하는 핵산을 제공하는 것을 포함할 수 있다. 상기 표적 DNA 서열은 세포에 대해서 내인성일 수 있다. 세포는 식물 세포, 포유동물 세포, 생선 세포, 곤충 세포 또는 시험관내 배양을 위해 이들 유기체로부터 유래된 세포주 또는 살아있는 조직으로부터 직접 흡수된 1차 세포 및 시험관내 배양을 위해 수립된 세포일 수 있다. 접촉은 TALEN 코딩 서열을 포함하는 벡터로 세포를 형질감염시키는 것, 및 세포에서 TALEN 단백질을 발현시키는 것, 세포로 TALEN 단백질을 기계적으로 주입하는 것, 박테리아 유형 III 분비 시스템을 사용하여 세포로 TAL 이펙터 엔도뉴클레아제 단백질을 전달하는 것, 또는 전기천공에 의해서 세포로 TALEN 단백질을 도입하는 것을 포함할 수 있다. 엔도뉴클레아제 도메인은 유형 II 제한 엔도뉴클레아제 (예를 들어, FokI)로부터 유래할 수 있다. 표적 DNA 내에서 특정 뉴클레오티드 서열에 결합하는 TAL 이펙터 도메인은 10 이상의 DNA 결합 반복물, 보다 바람직하게는 15 이상의 DNA 결합 반복물을 포함할 수 있다. 세포는 임의의 원핵 또는 진핵 유기체로부터 유래할 수 있다.
또다른 측면에서, 본 발명은 특이적 위치에서 DNA를 절단할 수 있는 서열 특이적 TALEN를 고안하기 위한 방법을 특징으로 한다. 상기 방법은 이중 가닥 절단을 도입하는 것을 목적으로 하는 제2 뉴클레오티드 서열에 인접한 제1 고유 내인성 염색체 뉴클레오티드 서열을 확인하는 것; 및 (a) 제1 고유 내인성 염색체 뉴클레오티드 서열에 조합으로 결합하는 다수의 DNA 결합 반복 도메인, 및 (b) 제2 뉴클레오티드 서열에서 이중 가닥 절단을 생성하는 엔도뉴클레아제를 포함하는 서열 특이적 TALEN을 고안하는 것을 포함할 수 있다.
본 발명은 또한 특정한 DNA 서열에 대해서 특이적인 TAL 이펙터 DNA 결합 도메인 및 엔도뉴클레아제 도메인을 포함하는 TALEN을 특징으로 한다. TALEN은 또한 정제 태그를 포함할 수 있다. 엔도뉴클레아제 도메인은 유형 II 제한 엔도뉴클레아제 (예를 들어, FokI)로부터 유래할 수 있다.
또다른 측면에서, 본 발명은 목적한 핵산이 도입되는, 유전적으로 변형된 동물을 생성하기 위한 방법을 특징으로 한다. 상기 방법은 핵산 도입을 목적으로 하는 내인성 염색체 표적 DNA 서열을 포함하는 1차 세포를 제공하는 것; 내인성 염색체 표적 DNA 서열에 결합하는 TAL 이펙터 도메인 및 엔도뉴클레아제 도메인을 포함하는 TALEN을 갖는 내인성 염색체 표적 DNA 서열 내에서 이중 가닥 절단을 생성하는 것; 상동성 재조합이 외인성 핵산 및 내인성 염색체 표적 DNA 사이에서 발생하는 것을 허용하는 조건 하에서 적어도 내인성 염색체 표적 DNA의 일부와 상동성인 서열을 포함하는 외인성 핵산을 1차 세포로 도입하는 것; 및 상동성 재조합이 발생하는 1차 세포로부터 동물을 생성하는 것을 포함할 수 있다. 동물은 포유동물일 수 있다. 동종 서열은 상동성 재조합 후 유전자를 방해하는 뉴클레오티드 서열, 상동성 재조합 후 유전자를 대체하는 뉴클레오티드 서열, 상동성 재조합 후 점 돌연변이를 유전자로 도입하는 뉴클레오티드 서열 및 상동성 재조합 후 조절 부위를 도입하는 뉴클레오티드 서열로 이루어진 군으로부터 선택된 뉴클레오티드 서열일 수 있다.
또다른 측면에서, 본 발명은 목적한 핵산이 도입되는, 유전적으로 변형된 식물을 생성하기 위한 방법을 특징으로 한다. 상기 방법은 핵산 도입을 목적으로 하는 내인성 표적 DNA 서열을 포함하는 식물 세포를 제공하는 것; 내인성 표적 뉴클레오티드 서열에 결합하는 TAL 이펙터 도메인 및 엔도뉴클레아제 도메인을 포함하는 TALEN을 갖는 내인성 표적 DNA 서열 내에서 이중 가닥 절단을 생성하는 것; 상동성 재조합이 외인성 핵산 및 내인성 표적 DNA 사이에서 발생하는 것을 허용하는 조건 하에서 적어도 내인성 표적 DNA의 일부와 상동성인 서열을 포함하는 외인성 핵산을 식물 세포로 도입하는 것; 및 상동성 재조합이 발생하는 식물 세포로부터 식물을 생성하는 것을 포함할 수 있다.
또다른 측면에서, 본 발명은 세포에서 표적화된 유전자 재조합에 대한 방법을 특징으로 한다. 상기 방법은 선택된 DNA 표적 서열에 표적화된 TALEN을 코딩하는 핵산 분자를 세포로 도입하는 것; 세포 내에서의 TALEN의 발현을 유도하는 것; 및 선택된 DNA 표적 서열이 돌연변이를 나타내는 세포를 확인하는 것을 포함할 수 있다. 돌연변이는 유전 물질의 결실, 유전 물질의 삽입, 및 유전 물질의 결실 및 삽입 둘 다로 이루어진 군으로부터 선택될 수 있다. 상기 방법은 또한 공여자 DNA를 세포로 도입하는 것을 포함할 수 있다. 세포는 곤충 세포, 식물 세포, 생선 세포, 또는 포유동물 세포일 수 있다.
또다른 측면에서, 본 발명은 (1) 선택된 뉴클레오티드 서열의 제1 뉴클레오티드에 대해 특이적인 RVD를 갖는 제1 TAL 이펙터 DNA 결합 반복 도메인 (여기서 제1 TAL 이펙터 DNA 결합 반복 도메인은 그의 3' 말단에서 고유 PspXI 부위를 갖음)을 코딩하는 뉴클레오티드 서열을 포함하는 스타터 플라스미드를 선택하는 단계; (2) PspXI로 스타터 플라스미드를 선형화하는 단계; (3) 선택된 뉴클레오티드 서열의 다음 뉴클레오티드(들)에 대해 특이적인 RVD를 갖는 하나 이상의 TAL 이펙터 DNA 결합 반복 도메인을 코딩하는 DNA 모듈 (여기서 DNA 모듈은 XhoI 점착성 말단을 가짐)을 PspXI 부위로 라이게이션하는 단계; 및 (4) 핵산이 선택된 뉴클레오티드 서열에 결합할 수 있는 TALEN을 코딩할 때까지 단계 (2) 및 (3)을 반복하는 단계를 포함하는 서열 특이적 TALEN을 코딩하는 핵산을 생성하기 위한 방법을 특징으로 한다. 일부 경우에서, 상기 방법은 또한 단계 (3)에서 라이게이션한 다음, PspXI 부위에서 DNA 모듈의 배향을 검사하는 단계를 포함할 수 있다.
달리 정의되지 않는다면, 본원에 사용된 모든 기술 및 과학 용어는 본 발명과 관련되는 당업자에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기재된 것들과 유사하거나 또는 등가의 물질 및 방법이 본 발명을 수행하기 위해 사용될 수 있지만, 적합한 방법 및 물질이 하기에 기재되어 있다. 본원에 언급된 모든 공보, 특허 출원, 특허, 및 다른 참고문헌은 그의 전문이 참고로 포함되어 있다. 충돌하는 경우에, 정의를 비롯한 본 명세서에 의해 조절될 것이다. 또한 물질, 방법 및 예가 예시로만 되어 있고, 제한하기 위함은 아니다.
본 발명의 하나 이상의 실시양태의 세부사항은 하기 첨부되어 있는 도 및 기술에 나타나 있다. 본 발명의 다른 특징, 목적 및 이점은 기술 및 도로부터, 및 청구항으로부터 명백할 것이다.
도 1a 내지 1d는 TAL 이펙터-DNA 인식 암호를 도시한다. 도 1a는 반복 영역 (오픈 박스), 및 RVD를 밑줄친 대표적 반복 서열 (서열 1)을 나타낸 총칭적 TAL 이펙터의 다이아그램이다. 도 1b는 다양한 TAL 이펙터 RVD 및 표적 유전자 프로모터 서열 (서열 2 내지 11)에 대한 최상의 패턴 매치 (낮은 엔트로피 정렬)를 보여주는 다이아그램이다. 별표 (*)는 잔기 13에서의 결실을 나타낸다. 도 1c는 B의 정렬, 및 모든 벼 프로모터를 40 개의 추가의 산토모나스 오리자에(X. oryzae) TAL 이펙터로 스캐닝하여 얻어진 추가 10 개 정렬에서, 각각의 이펙터에 대해 감염 동안 하류 유전자가 활성화되는 최상의 정렬을 유지하는 RVD-뉴클레오티드 연합을 보여주는 다이아그램이다. 도 1d는 20 개의 TAL 이펙터 표적 부위에 대한 플랭킹 뉴클레오티드 빈도를 보여주는 다이아그램이다. 위치는 표적 부위의 5' 말단에 대한 것이고, N은 표적 부위의 길이이다. 로고(Logo)는 웹로고(WebLogo)를 사용하여 얻었다.
도 2a 및 2b는 OsHen1이 산토모나스 오리자에 속 오리지콜라(oryzicola) 균주 BLS256의 Tal1c에 의해 활성화되는 증거를 제공한다. 도 2a는 BLS256 마커 교환 돌연변이체 M51, 공란의 코스미드 벡터 (ev)를 보유하는 M51, tal1a, tal1b 및 tal1c를 함유하는 코스미드 pIJF92를 보유하는 M51, 및 야생형 (WT) 균주와 함께 접종한지 24시간 후, 벼 잎에서 참고용 액틴 유전자와 비교하여 OsHen1의 전사체 과다를 보여주는 반-정량 RT-PCR 결과의 영상이다. 도 2b는 마커-함유 XmaI 단편의 구조 및 말단 서열결정에 의해 M51에서의 단일 마커 교환 돌연변이의 맵핑(mapping)을 기재로 한 개략도이다. 코스미드 pIJF92에 함유된 게놈 영역, 구조된 단편의 배위 및 BLS256 게놈 단편의 배위를 제시한다.
도 3은 참고용 AvrBs3 아미노산 서열 (서열 12)이다.
도 4는 참고용 AvrBs3 핵산 서열 (서열 13)이다.
도 5는 TAL 뉴클레아제 발현 벡터의 맵(map)이다.
도 6은 표적 리포터 플라스미드의 맵이다.
도 7은 TAL 뉴클레아제의 구성양식의 개략도이다. TAL DNA 결합 도메인의 인식 부위는 대문자로 나타내어지고, 스페이서 서열은 소문자로 나타낸다.
도 8은 AvrBs3 인식 도메인의 17개 및 반쪽의 탠덤(tandem) 반복물의 아미노산 서열 (서열 31)이다. 위치 12 및 13에서의 초가변 아미노산을 네모 칸으로 표시하였다.
도 9는 TAL 효과를 시험하기 위한 효모 검정에 대한 반응식을 나타낸 다이아그램이다.
도 10은 AvrBs3 TAL 뉴클레아제의 효모 검정 결과를 나타낸 도표이다.
도 11은 단일, 이중 또는 삼중 AsvBs3 반복 모듈 및 클로닝 벡터의 개략적인 대표도를 보여주는 다이아그램이다.
도 12a 및 12b는 대표적인 단일 TAL 이펙터 반복물 (도 12a), 및 대부분의 TAL 이펙터에서 반복 영역의 말단에 존재하는 대표적인 절단형(truncated) 반복물 (도 12b)을 도시한다. 뉴클레오티드 및 코딩된 아미노산 서열은 제시된 바와 같다. N은 RVD를 코딩하는 뉴클레오티드를 나타내며, 이는 "XX"로 제시된다. 숫자는 아미노산 위치에 대해 부여된다. 서열은 tal1c로부터 취해진다.
도 13은 tal1c 유전자, 및 반복 영역이 단일의 절단형 반복물로 감소되어 M, MscI 부위; S, SphI 부위도 또한 제시한 pCS487을 야기하는 프로세스를 도시하는 개략도이다.
도 14는 pCS487의 최초의 절단형 반복물의 말단에 번역에 의해 침묵 돌연변이를 도입하여 PspXI 및 XhoI 부위를 생성하여 pCS489를 얻는 것을 도시하는 개략도이다. 최초 반복물 (서열 21) 및 돌연변이된 반복물 (서열 23)에서의 코돈 18-21의 서열을 나타내었다. 코딩된 아미노산 서열 (서열 22)은 돌연변이에 의해 변화되지 않는다. 돌연변이된 뉴클레오티드를 이탤릭체로 표기하였다.
도 15는 관문 진입 벡터 pENTR-D (인비트로젠(Invitrogen), 캘리포니아주 칼스배드 소재)에서 반복 영역을 가지지 않는 tal1c의 N- 및 C-말단부만을 코딩하는 카나마이신 내성 플라스미드인 pCS488의 맵이다.
도 16은 RVD NI를 가진 반복물을 코딩하는 pCS493으로 지칭되는 단일 반복 스타터 플라스미드의 맵이다. pCS494, pCS495 및 pCS496으로 지정된 3 개의 다른 플라스미드는, 그들이 코딩하는 RVD (우측에 제시됨)를 제외하고는 동일하였다.
도 17a는 RVD NI를 가진 단일 반복 모듈에 대한 뉴클레오티드 및 코딩된 아미노산 서열을 도시한다. 5' XhoI 상용성 응집 말단, MscI 부위, 및 3' PspXI/XhoI 상용성 응집 말단에 밑줄을 쳤다. RVD 및 이를 코딩하는 뉴클레오티드는 볼드체로 표기하였다. 각각 HD, NI 및 NG를 코딩하는 RVD 코딩 서열을 제외하고 제시된 것과 동일한 3 개의 다른 반복 모듈을 제작하였다. 도 17b는 도 17a에 제시된 반복 코딩 서열을 함유하는, pCS502로 지칭되는 단일 반복 모듈 플라스미드의 맵이다. pCS503, pCS504 및 pCS505로 지정된 플라스미드를 또한 생성하였고, 이들은 그들이 코딩하는 RVD (우측에 제시됨)를 제외하고는 pCS502와 동일하였다.
도 18a는 RVD NI를 가진 단일 반복 모듈에 대한 뉴클레오티드 및 코딩된 아미노산 서열을 도시하며, 여기서, 뉴클레오티드 치환 (이탤릭체)은 PspXI/XhoI 부위로의 라이게이션 후 5' 말단에서 XhoI 부위의 재구성을 방지하고, 내부의 MscI 부위를 파괴한다. RVD 및 이를 코딩하는 뉴클레오티드는 볼드체로 표기하였다. 각각 HD, NI 및 NG를 코딩하는 RVD 코딩 서열을 제외하고 제시된 것과 동일한 3 개의 추가적 반복 모듈을 제작하였다. 도 18b는 추가 반복 모듈의 단일 반복 모듈 플라스미드로의 순차적 라이게이션에 의해 조립된 3 개의 반복 모듈의 개략도이다. 제1 반복물의 MscI 부위 및 3' 말단에서의 PspXI 부위가 유일하게 남아있고, 전체 모듈은 2 개의 XhoI 부위에 의해 플랭킹된다.
도 19는 완전한 세트의 1-, 2- 및 3-반복 모듈 플라스미드 목록이다.
도 20은 반복물의 임의의 서열을 tal1c "주쇄"로 조립하여 맞춤형(custom) TAL 이펙터 유전자를 생성하는데 사용될 수 있는 방법의 단계를 도시하는 순서도이다.
도 21a 및 21b는 제시된 뉴클레오티드 서열을 표적화하는 TAL 엔도뉴클레아제의 제작에서 반복 모듈의 조립체를 도시하는 개략도이다. 도 21a에서, pCS519, pCS524, pCS537, pCS551, pCS583 및 pCS529로 지정된 플라스미드로부터의 반복 모듈이 pCS493으로 지정된 스타터 플라스미드의 서열에 순차적으로 부가되어, pMAT55, pMAT56, pMAT57, pMAT58, pMAT59 및 pMAT60으로 지정된 플라스미드를 야기한다. 도 21b에서는, pCS530, pCS533, pCS522 및 pCS541로 지정된 플라스미드로부터의 반복 모듈이 pMAT1로 지정된 플라스미드의 서열에 순차적으로 부가되어 pMAT61, pMAT62, pMAT63 및 pMAT64로 지정된 플라스미드를 야기한다.
도 22a는 TAL 이펙터 단백질의 개략도이다. BamHI 단편 (B로 표기함)은 FokI 엔도뉴클레아제의 촉매 도메인에 융합하여 TALEN을 생성한다. N, N-말단부; NLS, 핵 위치 신호; B, BamHI 부위; AD, 산성 활성화 도메인. 도 22b는 TAL 이펙터 AvrBs3 및 PthXo1과 함께 제작된 TALEN의 활성을 나타낸 도표이다. Avr-FokI, AvrBs3 TALEN; Pth-FokI, PthXo1 TALEN; 촉매적으로 불활성 형태의 FokI에의 Avr-FokI 및 Pth-FokI, AvrBs3 및 PthXo1 융합 (문헌 [Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95:10570-10575]); ZFN, Zif268 DNA 결합 도메인을 함유하는 아연 핑거(zinc finger) 뉴클레아제 (문헌 [Porteus and Baltimore (2003) Science 300:763]).
도 23은 참고용 PthXo1 아미노산 서열 (서열 31)이다.
도 24는 참고용 PthXo1 핵산 서열 (서열 32)이다.
도 25는 pFZ85 벡터의 다이아그램이다.
도 26은 avrBs3_TALEN의 아미노산 서열 (서열 33)을 나타낸다.
도 27은 pthXo1_TALEN의 아미노산 서열 (서열 34)을 나타낸다.
도 28a는 스페이서 길이가 상이한 표적에 대한 AvrBs3 및 PthXo1 TALEN의 활성을 나타내는 도표이다. ZFN, Zif268-유래된 아연 핑거 뉴클레아제. 도 28b는 이종이량체성 TALEN의 활성을 나타내는 도표이다. PthXo1-FokI 및 AvrBs3-FokI 발현 벡터, 및 머리-꼬리 방향에서 15 bp 분리한 각각에 대한 인식 부위로 이루어진 표적을 갖는 플라스미드를 함유하는 효모에서의 활성을 나타내었다 (Avr-FokI, Pth-FokI). 또한, 개별적 표적에 대한 AvrBs3 (Avr-FokI) 및 PthXo1 (Pth-FokI) TALEN 각각 및 Zif268 (ZFN)의 활성이 참고용으로 제시되었다. 음성 대조군으로서, Avr-FokI, Pth-FokI에 대한 표적 부위 플라스미드만을 함유하는 효모 배양액을 LacZ 활성에 대해 검정하였다 ((-)로 표기함).
도 29a는 개체의 맞춤형 TALEN의 RVD 서열 및 이들의 각각의 DNA 인식 서열을 나타낸 표이다. 도 29b는 맞춤형 TALEN의 활성을 나타낸 도표이다. (-), 표적 부위 플라스미드만을 가지는 음성 대조군; ZFN, 아연 핑거 뉴클레아제 양성 대조군.
도 30은 20 개 표적 및 TAL 이펙터 쌍의 말단부에서의 뉴클레오티드 및 RVD 빈도를 묘사한 것이다.
도 31은 골든 게이트(Golden Gate) 클로닝 시스템의 개략도이다 (문헌 [Engler et al. (2008) PLoS One 3:e3647]; 및 [Engler et al. (2009) PLoS One 4:e5553]).
도 32a 및 32b는 본원에 기재된 바와 같은 골든 게이트 클로닝 접근을 사용하여 맞춤형 TAL 이펙터 반복 코딩 어레이의 조립 및 클로닝을 위한 일련의 58 개 플라스미드를 도시한다. tet, 플라스미드 선별을 위한 마커인 테트라시클린 내성 유전자; spec, 플라스미드 선별을 위한 마커인 스펙티노마이신 내성 유전자; amp, 플라스미드 선별을 위한 마커인 암피실린 내성 유전자.
도 33은 도 32에 제시된 플라스미드 세트를 사용하여 골든 게이트 접근에 의해 맞춤형 TAL 이펙터 반복 코딩 어레이를 조립하고 클로닝하는 방법에 대한 개략도이다. 예시 목적상, 임의의 반복 어레이의 조립체를 나타내었다. spec, 플라스미드 선별을 위한 마커인 스펙티노마이신 내성 유전자; amp, 플라스미드 선별을 위한 마커인 암피실린 내성 유전자.
도 34a 내지 34u는 본원 실시예 9에 기재된 바와 같이 생성된 TALEN의 아미노산 서열을 나타낸다. 도 34a, 텔로머라제-TALEN124; 도 34b, 그리드락(gridlock)-TALEN105; 도 34c, adh1-TALEN58; 도 34d, adh1-TALEN63; 도 34e, adh1-TALEN68; 도 34f, adh1-TALEN73; 도 34g, adh1-TALEN89; 도 34h, 그리드락-TALEN106; 도 34i, adh1-TALEN64; 도 34j, adh1-TALEN69; 도 34k, adh1-TALEN74; 도 34l, tt4-TALEN90; 도 34m, 텔로머라제-TALEN121; 도 34n, 텔로머라제-TALEN126; 도 34o, 그리드락-TALEN107; 도 34p, 그리드락-TALEN117; 도 34q, 텔로머라제-TALEN131; 도 34r, 텔로머라제-TALEN136; 도 34s, adh1-TALEN60; 도 34t, tt4-TALEN85; 도 34u, 그리드락-TALEN102.
도 35는 증가하는 길이 (9-, 10-, 12-, 13-, 15-, 16-, 17-, 또는 18 mer)의 맞춤형 TALEN 단량체를 사용한 효모 검정에 의해 측정된 TALEN 활성을 나타내는 도표이다. TALEN은 제시된 바와 같이, 아라비돕시스(Arabidopsis) 및 제브라피쉬(zebrafish) 유전자에 대해 표적화되었다.
도 36a는 두 쌍의 TALEN에 의해 표적화된, 아라비돕시스 ADH1 유전자와 상이한 2 개의 DNA 표적 서열을 보여주는 다이아그램이다. 도 36b는 아라비돕시스 ADH1 유전자를 표적화하는 기능적 TALEN 쌍에 대한 효모 검정 데이타를 나타낸 도표이다.
도 37a는 아라비돕시스 원형질체에서 TALEN-유도되는 돌연변이를 탐지하기 위해 사용되는 제한 엔도뉴클레아제 검정의 개략도이다. 도 37b는 제한 엔도뉴클레아제 검정에서 소화되지 않은 DNA로부터의 9 개의 클론 서열을 나타낸다. 클론들 중 6 개는 비-상동성 말단-결합 (NHEJ)에 의해 도입된 돌연변이체를 갖는다.
도 38a는 다수의 계통발생학적으로 구별되는 TAL 이펙터, 산토모나스 가르드네리(Xanthomonas gardneri)로부터의 AvrHah1, 산토모나스 캄페스트리스(X. campestris) 속 베시카토리아(vesicatoria)로부터의 AvrBs3, 산토모나스 오리자에 속 오리자에로부터의 PthXo1, 산토모나스 시트리(X. citri)로부터의 PthA, 및 산토모나스 오리자에 속 오리지콜라로부터의 Tal1c의 제0 반복 서열을 보여준다. 다형성 위치를 네모 칸으로 표시하였다. 도 38b는 PthXo1의 제0 및 제1 반복물을 보여주는 개략도이다. "제0" 반복물은 제1 반복물 바로 앞에 위치하고, 35% 동일성을 나타내며, 유사한 예측되는 2차 구조를 갖는다. 제1 반복물의 RVD 및 제0 반복물의 유사한 후보 잔기에 밑줄을 쳤다. *, 간격; H, 나선; E, 연장됨. 구조는 JPred를 사용하여 예측하였다 (문헌 [Cole et al. (2008) Nucl. Acids Res. 36:W197-W201]).
도 39는 제시된 바와 같이 V5-태깅된 TAL 이펙터 단백질 AvrBs3, PthXo1 및 Tal1c를 코딩하는 플라스미드로 형질감염된 인간 배아 신장 293T 세포로부터 단리한 다음 마우스-항V5 항체를 사용하여 면역검출한 총 단백질의 웨스턴 블럿을 나타낸다. 면역표지된 액틴이 각 레인에서 동등한 로딩에 대해 대조군으로서 제시된다.
도 40a는 TALEN HPRT-3254-17의 아미노산 서열을 나타내고, 도 40b는 TALEN HPRT-3286-20r의 아미노산 서열을 나타낸다.
도 41a는 인간 염색체 HPRT 유전자에서 TALEN-표적화된 부위를 보여주는 개략도이다. HPRT-3254-17 및 HPRT-3286-20r TALEN에 대한 결합 부위, 상기 부위들 사이의 스페이서 내 Bpu10I 부위, 및 영역의 증폭에 대한 프라이머 부위를 나타내었다. 하단의 배위는 코딩 서열의 제1 뉴클레오티드로부터의 염기쌍들의 거리를 제공한다. 도 41b는 템플레이트로서 TALEN-처리된 세포 및 미처리된 세포로부터 단리된 게놈 DNA를 사용한, 도 41a에 제시된 영역의 PCR 증폭에 대한 생성물의 Bpu10I 소화 결과를 나타낸다. 게놈 DNA는 증폭 전에 Bpu10I와 함께 소화된다. DNA 단편은 아가로스 겔 전기영동법에 의해 분리되고, 에티디움 브로마이드를 사용하여 가시화된다.
본 특허 출원은 TAL 이펙터에 의해 매개된 서열 특이적 DNA 인식과 관련한 물질 및 방법을 제공한다. 본원에 기재된 바와 같이, TAL 이펙터의 1차 아미노산 서열은 이들이 결합하는 뉴클레오티드 서열에 영향을 미친다. 본 발명자들은 TAL 이펙터 아미노산 서열과 그의 DNA 표적 서열 간의 관계가 지정적임에 따라, TAL 이펙터에 대한 표적 부위를 예측할 수 있고, 또한 TAL 이펙터의 맞춤화(customization)가 특정 뉴클레오티드 서열에의 결합을 가능케 한다는 것을 발견하였다. 이러한 예측 및 맞춤화는 다수 목적상 이용될 수 있다. 일례에서, 특정 TAL 이펙터 서열은 엔도뉴클레아제 서열에 융합될 수 있어, 특이적 DNA 서열에의 엔도뉴클레아제의 표적화, 및 표적화된 서열에서 또는 그 근처에서 DNA의 후속적 절단을 가능케 한다. DNA의 절단 (즉, 이중 가닥 파쇄)은 상동성 재조합의 빈도를 급격하게 증가시킬 수 있다. 따라서, TALEN을, 특정 표적 DNA 서열과의 서열 유사성 정도가 높은 서열을 갖는 DNA 구조체와 조합하여 사용하여 복합체 게놈에서 부위 지정 돌연변이생성을 용이하게 할 수 있으며, 즉, 유전자 기능을 녹아웃(knock out) 또는 변경시킬 수 있거나, 또는 다른 서열에 유전자를 매우 정확하게 그리고 고효율로 부가할 수 있다.
따라서, 본원에서 제공되는 대상 물질에는, 특히, 유전적으로 변형된 유기체 (식물, 진균, 초파리류, 선충류, 제브라피쉬, 마우스, 다른 포유동물 및 인간을 포함하나 이들로 제한되지는 않음)를 제조하기 위한 물질 및 방법이 포함된다. 상기 방법은 예를 들어, 세포를 다수의 재조합 핵산으로 형질감염시키는 것을 포함할 수 있다. 예를 들어, 세포 (예를 들어, 진핵생물 세포)는, 세포 내에서 발견되는 상응하는 표적 뉴클레오티드 서열에 대한 변경을 포함하는 공여자 뉴클레오티드 서열을 함유하는 제1 재조합 핵산 구조체, 및 TAL-뉴클레아제를 코딩하는 제2 재조합 핵산 구조체로 형질전환될 수 있다. 일부 실시양태에서, 세포는 또한 선별 마커를 코딩하는 제3 재조합 핵산 구조체로 형질전환될 수 있다. 공여자 핵산 구조체로부터의 핵산 서열은 본원에 기재된 바와 같이, 형질전환된 세포의 게놈 내로 혼입될 수 있다. 예를 들어, 본원에 기재된 방법을 사용하여 생성된 식물 세포는 성장하여 그의 게놈 내로 혼입된 변경된 공여자 뉴클레오티드 서열을 가진 식물을 생성할 수 있다. 상기 식물로부터의 종자를 사용하여, 예를 들어 변형되지 않은 식물에 대해 변경된 성장 특성 (예를 들어, 다양한 생물 및 비-생물 스트레스에 대해 증가된 내성 또는 저항성), 변경된 외관 (예를 들어, 변경된 색 또는 높이), 또는 변경된 조성 (예를 들어, 증가 또는 감소된 수준의 탄소, 질소, 오일, 단백질, 탄수화물 (예를 들어, 당 또는 전분), 아미노산, 지방산 또는 2차 대사산물)과 같은 표현형을 가진 식물을 생성할 수 있다.
폴리뉴클레오티드 및 폴리펩티드
단리된 핵산 및 폴리펩티드가 본원에 제공된다. 용어 "핵산" 및 "폴리뉴클레오티드"는 상호교환되어 사용되고, 핵산 유사체를 함유하는 cDNA, 게놈 DNA, 합성 (예를 들어, 화학적으로 합성됨) DNA, 및 DNA (또는 RNA)를 포함하는, RNA 및 DNA 둘 다를 지칭한다. 폴리뉴클레오티드는 임의의 3차원적 구조를 가질 수 있다. 핵산은 이중 가닥 또는 단일 가닥일 수 있다 (즉, 센스 가닥 또는 안티센스 단일 가닥). 폴리뉴클레오티드의 비제한적인 예에는 유전자, 유전자 단편, 엑손, 인트론, 메신저 RNA (mRNA), 운반 RNA, 리보솜 RNA, 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지화된 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머 뿐만 아니라 핵산 유사체가 포함된다.
본 발명의 폴리펩티드 (예를 들어, 비제한적인 예로서의 TAL 이펙터-DNA 변형 효소)는, 예를 들어 상기 폴리펩티드를 코딩한 벡터를 사용하거나, 소노포레이션 또는 전기 천공 또는 이들의 파생 기술과 같은 임의의 세포 투과 기술과 관련되거나 조합된 전달 벡터를 사용하여 폴리펩티드 그 자체로서 세포 내로 도입될 수 있다.
본원에 사용된 것으로서, "단리된"은, 핵산에 관련된 경우, 게놈에서의 핵산의 한쪽면 또는 양쪽면을 일반적으로 플랭크한 핵산을 포함하는, 게놈, 예를 들어 식물 게놈에 존재하는 다른 핵산으로부터 분리된 핵산을 지칭한다. 또한, 비천연 발생 서열이 자연에서 발견되지 않고 천연 발생 게놈에 바로 인접하는 서열을 갖지 않기 때문에, 핵산에 대해 본원에 사용된 것으로서의 용어 "단리된"은 임의의 비천연 발생 서열을 포함한다.
일반적으로, 하나의 핵산 서열에서 천연-발생 게놈에서의 DNA 분자가 제거되거나 존재하지 않는 직접적인 플랭킹이 발견되는 경우, 단리된 핵산은, 예를 들어 DNA 분자일 수 있다. 따라서, 단리된 핵산은 다른 서열뿐만 아니라 벡터, 자체적으로 복제되는 플라스미드, 바이러스 (예를 들어, 파라레트로바이러스, 레트로바이러스, 렌티바이러스, 아데노바이러스, 또는 헤르페스 바이러스), 또는 원핵생물 또는 진핵생물의 게놈 DNA로 혼입되는 DNA와는 별도로, 분리된 분자 (예를 들어, 화학적으로 합성된 핵산, 또는 PCR 또는 제한 엔도뉴클레아제 처치에 의해 제조된 cDNA 또는 게놈 DNA 단편)로서 존재하는 DNA 분자를 비제한적으로 포함한다. 또한, 단리된 핵산은 혼성 또는 융합 핵산의 일부인 DNA 분자와 같은 재조합 핵산을 포함할 수 있다. 예를 들어, cDNA 모음 또는 게놈 모음, 또는 게놈 DNA 제한 소화를 함유하는 겔 슬라이스 내의, 수백 내지 수백만개의 다른 핵산이 존재하는 핵산은 단리된 핵산으로 고려되지 않아야 한다.
핵산은, 예를 들어 화학적 합성 또는 중합효소 연쇄 반응 (PCR)에 의해 제조될 수 있다. PCR은 표적 핵산이 증폭되는 절차 또는 기술을 지칭한다. PCR은 전체 게놈 DNA 또는 전체 세포 RNA로부터의 서열을 포함하는, DNA 및 RNA로부터의 특이적 서열을 증폭시키는데에 사용될 수 있다. 다양한 PCR 방법이, 예를 들어 문헌 [PCR Primer: A Laboratory Manual, Dieffenbach and Dveksler, eds., Cold Spring Harbor Laboratory Press, 1995]에 기재되어 있다. 일반적으로, 증폭되어야 하는 템플레이트의 반대 가닥에 대한 서열과 동일하거나 유사한 올리고뉴클레오티드 프라이머를 디자인하기 위해 관심이 있거나 그렇지 않은 영역의 말단으로부터의 서열 정보가 이용된다. 또한, 부위-특정 뉴클레오티드 서열 변형이 템플레이트 핵산으로 도입될 수 있음으로써 다양한 PCR 전략이 가능하다.
또한, 단리된 핵산은 돌연변이생성에 의해 수득될 수 있다. 예를 들어, 공여자 핵산 서열은 PCR을 통한 올리고뉴클레오티드-지정된 돌연변이생성 및 부위-지정된 돌연변이생성을 비롯한 표준 기술을 이용하여 돌연변이가 될 수 있다. 문헌 [Short Protocols in Molecular Biology, Chapter 8, Green Publishing Associates and John Wiley & Sons, edited by Ausubel et al., 1992]을 참조한다.
본원에 사용된 것으로서의 용어 "폴리펩티드"는 번역후 변형 (예를 들어, 인산화반응 또는 글리코실화반응)에 상관없이 2개 이상의 서브유닛 아미노산의 화합물을 지칭한다. 서브유닛은, 펩티드 결합 또는 다른 결합, 예를 들어 에스테르 또는 에테르 결합에 의해 연결될 수 있다. 용어 "아미노산"은 D/L 광학 이성질체를 포함하는, 천연 및/또는 비천연 또는 합성 아미노산을 지칭한다.
폴리펩티드에 대한 "단리된" 또는 "정제된" 것으로서, 이것은 일반적으로 자연에서 함께 발견되는 세포 성분 (예를 들어, 다른 폴리펩티드, 지질, 탄수화물, 및 핵산)으로부터 어느 정도까지 분리되는 것을 의미한다. 정제된 폴리펩티드는 비환원 폴리아크릴아미드 겔을 기재로 한 단일 주요 밴드를 생성할 수 있다. 정제된 폴리펩티드는 약 75% 이상 순수할 수 있다 (예를 들어, 80%, 85%, 90%, 95%, 97%, 98%, 99% 이상, 또는 100% 순수할 수 있음). 정제된 폴리펩티드는, 예를 들어 화학적 합성에 의해 또는 숙주 세포 또는 트랜스제닉 식물에서의 제조합 생성물에 의해, 천연 공급원으로부터의 추출에 의해 수득될 수 있고, 예를 들어 친화성 크로마토그래피, 면역침강법, 크기 배제 크로마토그래피, 및 이온 교환 크로마토그래피를 이용하여 정제될 수 있다. 정제의 정도는 컬럼 크로마토그래피, 폴리아크릴아미드 겔 전기영동, 또는 고성능 액체 크로마토그래피를 포함하나, 이에 제한되지 않는 임의의 적절한 방법을 이용하여 측정될 수 있다.
재조합 구조체
또한, 재조합 핵산 구조체 (예를 들어, 벡터)가 본원에서 제공된다. "벡터"는 삽입된 절편의 복제를 발생시키기 위한, 또다른 DNA 절편이 도입될 수 있는 레플리콘, 예를 들어 플라스미드, 파지, 또는 코스미드이다. 일반적으로, 벡터는 적절한 제어 요소와 관련되어 있을 때 복제될 수 있다. 적합한 벡터 주쇄에는, 예를 들어 플라스미드, 바이러스, 인공 염색체, BAC, YAC, 또는 PAC와 같은, 당업계에서 일반적으로 사용되는 것들이 포함된다. 용어 "벡터"는 클로닝 및 발현 벡터 뿐만 아니라 바이러스 벡터 및 통합 벡터를 포함한다. "발현 벡터"는 하나 이상의 발현 제어 서열을 포함하는 벡터이고, "발현 제어 서열"은 또다른 DNA 서열의 전사 및/또는 번역을 제어 및 조절하는 DNA 서열이다. 적합한 발현 벡터는, 예를 들어 박테리오파지, 바큘로바이러스, 담배 모자이크 바이러스, 헤르페스 바이러스, 거대세포바이러스, 레트로바이러스, 우두 바이러스, 아데노바이러스, 및 아데노-부속 바이러스로부터 유래된 플라스미드 및 바이러스 벡터를 비제한적으로 포함한다. 수많은 벡터 및 발현 시스템은 노바젠(Novagen) (미국 위스콘신주 매디슨 소재), 클론텍(Clontech) (미국 캘리포니아주 팔로 알토 소재), 스트라테이진(Stratagene) (미국 캘리포니아주 라 졸라 소재), 및 인비트로젠/라이프 테크놀로지 (미국 캘리포니아주 칼즈배드 소재)와 같은 기업으로부터 상업적으로 입수가능하다.
용어 "조절 영역", "제어 요소", 및 "발현 제어 서열"은 전사 또는 번역 개시 및 속도, 및 전사체 또는 폴리펩티드 생성물의 안정성 및/또는 이동성에 영향을 주는 뉴클레오티드 서열을 지칭한다. 조절 영역에는 코딩 서열, 예를 들어 분비 신호, 핵 위치 서열 (NLS) 및 프로테아제 절단 부위 내에 잔류할 수 있는, 프로모터 서열, 인핸서 서열, 반응 요소, 단백질 인식 부위, 유도성 요소, 프로모터 제어 요소, 단백질 결합 서열, 5' 및 3' 비번역 영역 (UTR), 전하 출발 부위, 종결 서열, 아데닐산중합반응 서열, 인트론, 및 다른 조절 영역이 포함되나, 이에 제한되지는 않는다.
본원에 사용된 것으로서, "작동가능하게 연결된"은, 유전 구조체로 혼입되어 발현 제어 서열이 관심이 있는 코딩 서열의 발현을 효과적으로 제어하는 것을 의미한다. RNA 중합효소가 RNA (mRNA이더라도)로 코딩 서열을 전사할 수 있고, 이어서 코딩 서열에 의해 코딩된 단백질로 번역될 수 있는 경우, 코딩 서열은 "작동가능하게 연결되고", 세포 내의 발현 제어 서열의 "조절 하에" 있게 된다. 따라서, 조절 영역은 변형된 표적 핵산을 발현하도록 요망되는 식물 세포, 식물, 또는 식물 조직에서의 전사를 조정하거나, 예를 들어 조절하거나, 용이하게 하거나, 또는 진행시킬 수 있다.
프로모터는, 일반적으로 전사가 출발하는 지점 (일반적으로, RNA 중합효소 II에 대한 개시 부위에 인접함)에서의 100개의 뉴클레오티드 상류 내에서 DNA 분자의 영역으로 이루어지는 발현 제어 서열이다. 프로모터는 전사를 개시하고 조정하는 RNA 중합효소 및 다른 단백질의 인식 및 결합과 연관되어 있다. 코딩 서열을 프로모터의 제어 하에 두기 위해, 일반적으로 프로모터의 1 내지 약 50 개의 뉴클레오티드 하류 사이에 폴리펩티드의 번역 리딩 프레임의 번역 개시 부위를 위치시키는 것이 필요하다. 그러나, 프로모터는 번역 출발 부위의 약 5,000개 정도로 많은 뉴클레오티드 상류, 또는 전사 출발 부위의 약 2,000개 정도로 많은 뉴클레오티드 상류에 위치할 수 있다. 프로모터는, 일반적으로 적어도 코어 (기본) 프로모터를 포함한다. 프로모터는, 또한 상류 요소와 같은 하나 이상의 제어 요소를 포함할 수 있다. 상기 요소는 상류 활성화 영역 (UAR) 및, 임의로, 합성 상류 요소와 같은 폴리뉴클레오티드의 전사에 영향을 주는 다른 DNA 서열을 포함한다.
포함되어야 하는 프로모터의 선택은 효능, 선택성, 유도성, 원하는 발현 수준, 및 세포 또는 조직 특이성을 포함하나, 이에 제한되지 않는 다양한 인자에 따라 달라진다. 예를 들어, 특정 조직, 기관, 및 세포 유형에서 단독적으로 또는 주로 전사를 부여하는 조직-, 기관- 및 세포-특이적 프로모터가 각각 사용될 수 있다. 일부 실시양태에서, 영양 조직, 예를 들어 줄기, 유조직, 기본분열조직, 관다발, 형성층, 체관부, 피층, 경정분열조직, 측면 생장점, 근단분열조직, 측면 뿌리 생장점, 잎원기, 잎살, 또는 잎 표피에 특이적인 프로모터가 적합한 조절 영역일 수 있다. 일부 실시양태에서, 근본적으로 종자에 특이적인 프로모터 ("종자-선호 프로모터")가 유용할 수 있다. 종자-특이적 프로모터는 종자가 발달하는 동안 내배유 및 떡잎 조직에서 작동가능하게 연결된 핵산의 전사를 촉진시킬 수 있다. 별법으로, 구성 프로모터는 식물 발달을 통틀어 식물의 대부분 또는 모든 조직에서 작동가능하게 연결된 핵산의 전사를 촉진시킬 수 있다. 프로모터의 다른 군에는, 유도성 프로모터, 예를 들어 화학 작용제, 발달 자극, 또는 환경 자극과 같은 외부 자극에 반응하는 전사를 부여하는 프로모터가 포함되나, 이에 제한되지는 않는다.
기본 프로모터는 전사 개시에서 요구되는 전사 복합체의 조립에 필요한 최소 서열이다. 기본 프로모터는, 종종 전사 개시의 부위로부터의 약 15 내지 약 35개의 뉴클레오티드에 위치할 수 있는 "TATA 박스(TATA box)" 요소를 포함한다. 기본 프로모터는, 또한 "CCAAT 박스(CCAAT box)" 요소 (일반적으로, 서열 CCAAT) 및/또는 GGGCG 서열을 포함할 수 있고, 이것은 전사 출발 부위로부터의, 약 40 내지 약 200개의 뉴클레오티드, 일반적으로 약 60 내지 약 120개의 뉴클레오티드 상류에 위치할 수 있다.
본원에 제공된 핵산 구조체에 포함될 수 있는 프로모터의 비제한적인 예로는 꽃양배추 모자이크 바이러스 (CaMV) 35S 전사 개시 영역, 아그로박테리움 튜미펙션즈(Agrobacterium tumefaciens)의 T-DNA로부터 유래된 1' 또는 2' 프로모터, 문헌 [Busk ((1997) Plant J. 11:1285-1295)]에 기재된 옥수수 잎-특이적 유전자로부터의 프로모터, 옥수수 및 다른 종으로부터의 kn1-관련 유전자, 및 옥수수 유비퀴틴-1 프로모터와 같은 다양한 식물 유전자로부터의 전사 개시 영역이 포함된다.
5' 비번역 영역 (UTR)이 전사되지만, 번역되지 않고 전사체의 출발 부위와 번역 개시 코돈 사이에 놓이며, +1 뉴클레오티드를 포함할 수 있다. 3' UTR은 번역 종결 코돈과 전사체의 말단 사이에 위치할 수 있다. UTR은 mRNA 메세지 안정성 또는 번역 감쇠의 증가와 같은 특정 기능을 가질 수 있다. 3' UTR의 예로는 아데닐산중합반응 신호 및 전사 종결 서열이 포함되나, 이에 제한되지는 않는다. 코딩 영역의 3'-말단에서의 아데닐산중합반응 영역은, 또한 코딩 서열에 작동가능하게 연결될 수 있다. 아데닐산중합반응 영역은 천연 유전자, 다양한 다른 식물 유전자, 또는 아그로박테리움 T-DNA로부터 유래될 수 있다.
또한, 본원에 제공된 벡터는, 예를 들어 복제의 개시점 및/또는 스캐폴드 부착 영역 (SAR)을 포함할 수 있다. 또한, 발현 벡터는 발현된 폴리펩티드의 조작 또는 검출 (예를 들어, 정제 또는 편재화)을 용이하게 하기 위해 고안된 태그 서열을 포함할 수 있다. 태그 서열, 예를 들어 녹색 형광 단백질 (GFP), 글루타티온 S-전달효소 (GST), 폴리히스티딘, c-myc, 혈구응집소, 또는 플래그(Flag)™ 태그 (코닥(Kodak), 미국 코네티컷주 뉴헤이븐 소재) 서열은, 일반적으로 코딩된 폴리펩티드와 함께 융합된 것으로서 발현된다. 상기 태그는 카르복실 또는 아미노 말단부를 포함하는 폴리펩티드 내의 임의의 곳에 도입될 수 있다.
"전달 벡터" 또는 "전달 벡터들"로서, 이것은 세포를 접촉시키거나 본 발명에 필요한 세포 또는 세포 이하의 구획 제제/화학물질 및 분자 (단백질 또는 핵산)를 내부로 전달하는, 본 발명에서 사용될 수 있는 임의의 전달 벡터를 의도하고자 하는 것이다. 이것은 리포솜 전달 벡터, 바이러스 전달 벡터, 약물 전달 벡터, 화학물질 운반체, 중합체 운반체, 리포플렉스, 폴리플렉스, 덴드리머, 마이크로버블 (초음파 조영제), 나노입자, 에멀젼 또는 다른 적절한 이동 벡터를 포함하나, 이에 제한되지는 않는다. 이러한 전달 벡터는 분자, 화학물질, 거대분자 (유전자, 단백질), 또는 다이아토스(Diatos)에 의해 개발된 플라스미드, 펩티드와 같은 다른 벡터가 전달되도록 한다. 이러한 경우, 전달 벡터는 분자 운반체이다. "전달 벡터" 또는 "전달 벡터들"로서, 이것은 또한 형질감염을 수행하는 전달 방법을 의도하고자 하는 것이다.
용어 "벡터" 또는 "벡터들"은 연결된 또다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 본 발명에서의 "벡터"에는 바이러스 벡터, 플라스미드, 염색체, 비염색체, 반-합성 또는 합성 핵산으로 이루어질 수 있는 RNA 벡터 또는 선형 또는 환형 DNA 또는 RNA 분자가 포함되지만, 이에 제한되지는 않는다. 바람직한 벡터는, 이들과 연결된 핵산을 자율 증식 (에피솜 벡터)하고/거나 발현할 수 있는 것들이다 (발현 벡터). 대다수의 적합한 벡터는 당업자에게 공지되어 있고, 상업적으로 이용가능하다.
바이러스 벡터에는 레트로바이러스, 아데노바이러스, 파르보바이러스 (예를 들어, 아데노의존성 바이러스), 코로나바이러스, 음성 가닥 RNA 바이러스, 예를 들어 오르토믹소바이러스 (예를 들어, 인플루엔자 바이러스), 랍도바이러스 (예를 들어, 광견병 및 수포성 구내염 바이러스), 파라믹소바이러스 (예를 들어, 홍역 및 센다이(Sendai)), 양성 가닥 RNA 바이러스, 예를 들어 피코르나바이러스 및 알파바이러스, 및 아데노바이러스, 헤르페스바이러스를 포함하는 이중-가닥 DNA 바이러스 (예를 들어, 단순헤르페스바이러스 유형 1 및 2, 에프스타인-바 바이러스, 거대세포바이러스), 및 폭스바이러스 (예를 들어, 백시니아, 계두 및 카나리폭스)가 포함된다. 다른 바이러스에는, 예를 들어 노워크 바이러스, 토가바이러스, 플라비바이러스, 레오바이러스, 파포바바이러스, 헤파드나바이러스, 및 간염 바이러스가 포함된다. 레트로바이러스의 예에는 조류 백혈병 육종, 포유동물 C-유형, B-유형 바이러스, D 유형 바이러스, HTLV-BLV 군, 렌티바이러스, 스푸마바이러스가 포함된다 (문헌 [Coffin, J. M., Retroviridae: The viruses and their replication, In Fundamental Virology, Third Edition, B. N. Fields, et al., Eds., Lippincott-Raven Publishers, Philadelphia, 1996]).
"렌티바이러스 벡터"로서, 이것은 HIV-기반 렌티바이러스 벡터를 의미하고, 이들의 상대적으로 큰 포장 능력, 감소된 면역원성, 및 고효율로 넓은 범위의 상이한 세포 유형에 대해 안정하게 형질도입을 하는 이들의 능력 때문에, 이들은 유전자 전달에 매우 유망하다. 렌티바이러스 벡터는, 일반적으로 3개 (포장, 외피 및 운반)를 초과하는 플라스미드를 생산자 세포로 후속적으로 일시적 형질감염시켜 생성한다. HIV와 마찬가지로, 렌티 바이러스는 세포 표면 상의 수용체와 함께 바이러스 표면 당단백질의 상호작용을 통해 표적 세포로 들어간다. 입구에서, 바이러스 RNA의 역전사가 일어나고, 이것은 바이러스 역전사효소 복합체에 의해 매개된다. 역전사의 생성물은 이중 가닥 선형 바이러스 DNA이고, 이것은 감염된 세포의 DNA에서의 바이러스 통합을 위한 기질이다. 상기 렌티바이러스 벡터는 "비-통합" 또는 "통합"일 수 있다.
"통합 렌티바이러스 벡터 (또는 LV)"로서, 이것은 비제한적인 예로서 표적 세포의 게놈을 통합할 수 있는 상기 벡터를 의미한다.
이와 반대로 "비-통합 렌티바이러스 벡터 (또는 NILV)"로서, 이것은 바이러스 인터그라제의 작용을 통해 표적 세포의 게놈을 통합하지 않는 효율적인 유전자 전달 벡터를 의미한다.
바람직한 벡터의 하나의 유형은, 에피솜, 즉 과잉-염색체 복제를 할 수 있는 핵산이다. 바람직한 벡터는, 이들과 연결된 핵산을 자율 증식 (에피솜 벡터)하고/거나 발현할 수 있는 것들이다. 작동가능하게 연결된 유전자의 발현을 지정할 수 있는 벡터는 본원에서 "발현 벡터"로서 지칭된다. 본 발명에 따른 벡터에는 YAC (효모 인공 염색체), BAC (인조 박테리아), 바큘로바이러스 벡터, 파지, 파지미드, 코스미드, 바이러스 벡터, 플라스미드, 염색체, 비염색체, 반-합성 또는 합성 DNA로 이루어질 수 있는 RNA 벡터 또는 선형 또는 환형 DNA 또는 RNA 분자가 포함되나, 이에 제한되지는 않는다. 일반적으로, 이들의 벡터 형태가 염색체에 결합하지 않는 경우, 흔히 재조합 DNA 기술에 유용한 발현 벡터는, 일반적으로 환형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"의 형태이다. 대다수의 적합한 벡터가 당업자에게 공지되어 있다. 벡터에는 선택적인 마커, 예를 들어 네오마이신 인산전달효소, 히스티디놀 탈수소효소, 디히드로엽산 환원효소, 히그로마이신 인산전달효소, 단순헤르페스 바이러스 티미딘 키나아제, 아데노신 디아미나제, 글루타민 신시타제, 및 진핵생물 세포 배양을 위한 하이포산틴-구아닌 포스포리보실 전달효소; 에스. 세레비시아를 위한 TRP1; 테트라사이클린, 이. 콜리에서의 리팜피신 또는 암피실린 내성이 포함된다. 바람직하게, 상기 벡터는 발현 벡터이고, 여기서 관심이 있는 폴리펩티드를 코딩하는 서열은 적절한 전하 및 번역 제어 요소 하에 위치하여 상기 폴리펩티드의 제조 또는 합성을 가능하게 한다. 따라서, 상기 폴리뉴클레오티드는 발현 카세트로 구성된다. 보다 특히, 본 벡터는 복제 기점, 상기 코딩 폴리뉴클레오티드와 작동가능하게 연결된 프로모터, 리보솜 결합 부위, RNA-스플라이싱 부위 (게놈 DNA를 사용하는 경우), 폴리아데닐화 부위 및 전사 종결 부위를 포함한다. 또한, 인핸서 또는 사일렌서 요소를 포함할 수 있다. 프로모터의 선택은 폴리펩티드가 발현하는 세포에 따라 달라질 것이다. 적합한 프로모터에는 조직 특이적 및/또는 유도성 프로모터가 포함된다. 유도성 프로모터의 예로는 중금속 수준 증가에 의해 유도되는 진핵생물 금속티오닌 프로모터, 이소프로필-β-D-티오갈락토-피라노시드 (IPTG)에 반응하여 유도되는 원핵생물 lacZ 프로모터, 및 온도 증가에 의해 유도되는 진핵생물 열 충격 프로모터가 있다. 조직 특이적 프로모터의 예로는 골격근 크레아틴 키나제, 전립선-특이적 항원 (PSA), α-항트립신 프로테아제, 인간 표면활성제 (SP) A 및 B 단백질, β-카제인 및 산성 유청 단백질 유전자가 있다.
유도성 프로모터는 병원균 또는 스트레스, 보다 바람직하게는 저온, 열, UV 광 또는 높은 이온 농도와 같은 스트레스에 의해 유도될 수 있다 (문헌 [Potenza et al. (2004) In vitro Cell Dev Biol 40:1-22]에서 검토됨). 유도성 프로모터는 화학물질에 의해 유도될 수 있다 (문헌 [Moore et al. (2006)]; [Padidam (2003)]; [Wang et al. (2003)]; 및 [Zuo and Chua (2000)]에서 검토됨).
전달 벡터 및 벡터는 임의의 세포 투과 기술, 예컨대 소노포레이션 또는 전기천공, 또는 이러한 기술로부터 유도된 기술과 관련되거나 조합될 수 있다.
하나 초과의 조절 영역, 예를 들어 인트론, 인핸서, 상류 활성화 영역 및 유도성 요소가 재조합 폴리뉴클레오티드에 존재할 수 있다는 것을 알 것이다.
재조합 핵산 구조체는 세포 (예를 들어, 식물 세포 또는 동물 세포)의 형질전환에 적합한 벡터로 삽입되는 폴리뉴클레오티드 서열을 포함할 수 있다. 재조합 벡터는, 예를 들어 표준 재조합 DNA 기술을 이용하여 만들어질 수 있다 (예를 들어, 문헌 [Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor, NY] 참조).
본원에 기재된 재조합 핵산 서열은 비정통 (즉, 무작위, 비-상동성, 비 부위-특이적) 재조합을 통해 세포의 게놈에 통합될 수 있거나, 또는 본원에 기재된 재조합 핵산 서열은 상동성 재조합을 통해 세포의 게놈에 통합되도록 개조될 수 있다. 상동성 재조합을 통한 통합을 위해 개조된 핵산 서열은 양쪽 측면에서 내인성 표적 뉴클레오티드와 유사하거나 동일한 서열로 플랭킹되어, 내인성 표적 뉴클레오티드 서열을 함유하는 게놈 내 특정 부위에서의 재조합 핵산의 통합을 용이하게 한다. 상동성 재조합을 통한 통합을 위해 개조된 핵산 서열은 또한 서열-특이적 뉴클레아제에 대한 인식 부위를 포함할 수 있다. 다르게는, 서열-특이적 뉴클레아제에 대한 인식 부위가 형질전환될 세포의 게놈에 위치할 수 있다. 하기에 기재된 공여자 핵산 서열이 통상 상동성 재조합을 통한 통합을 위해 개조된다.
몇몇 실시양태에서, 선별 마커를 코딩하는 핵산이 또한 상동성 재조합을 통해 통합되도록 개조되어, 양쪽 측면에서 식물 게놈 내 내인성 서열 (예를 들어, 서열-특이적 뉴클레아제에 대한 절단 부위에서의 내인성 서열)과 유사하거나 동일한 서열로 플랭킹될 수 있다. 몇몇 경우에, 선별 마커에 대한 코딩 서열을 함유하는 핵산은 또한 서열-특이적 뉴클레아제에 대한 인식 부위를 포함할 수 있다. 이러한 실시양태에서, 서열-특이적 뉴클레아제에 대한 인식 부위는 공여자 핵산 서열 내에 함유된 것과 동일하거나 상이할 수 있다 (즉, 공여자 핵산 서열과 동일한 뉴클레아제에 의해 인식되거나 또는 공여자 핵산 서열과 상이한 뉴클레아제에 의해 인식될 수 있다).
몇몇 경우에, 재조합 핵산 서열은 부위-특이적 재조합을 통해 세포의 게놈에 통합되도록 개조될 수 있다. 본원에서 사용된 "부위-특이적" 재조합은, 핵산 서열이 재조합 핵산 서열과 게놈 서열 사이의 상동성에 의해서가 아니라, 특이적 핵산 서열을 인식하고 이들 부위 사이에서 DNA 가닥의 상호 교환을 촉매하는 재조합 효소의 작용에 의해서 게놈 내 특정 부위(들)에 대해 표적화된 경우에 일어나는 재조합을 지칭한다. 따라서, 부위-특이적 재조합은 2개의 규정된 뉴클레오티드 서열의 효소-매개된 절단 및 라이게이션을 지칭한다. 임의의 적합한 부위-특이적 재조합 시스템 (예를 들어, Cre-lox 시스템 또는 FLP-FRT 시스템 포함)을 이용할 수 있다. 이러한 실시양태에서, 공여자 뉴클레오티드 서열 및 뉴클레아제-코딩 서열, 및 몇몇 경우에 선별 마커 서열 뿐만 아니라 재조합 효소를 코딩하는 핵산을 세포에 도입할 수 있다. 예를 들어, 미국 특허 제4,959,317호를 참조한다.
서열-특이적 엔도뉴클레아제
서열-특이적 뉴클레아제 및 서열-특이적 엔도뉴클레아제를 코딩하는 재조합 핵산이 본원에서 제공된다. 서열-특이적 엔도뉴클레아제는 TAL 이펙터 DNA 결합 도메인 및 엔도뉴클레아제 도메인을 포함할 수 있다. 따라서, 이러한 서열-특이적 엔도뉴클레아제를 코딩하는 핵산은 뉴클레아제로부터의 뉴클레오티드 서열과 연결된 서열-특이적 TAL 이펙터로부터의 뉴클레오티드 서열을 포함할 수 있다.
TAL 이펙터는 병원균에 의해 식물 세포로 주입된 식물 병원성 박테리아의 단백질이며, 이들은 핵으로 이동해 전사 인자로서 기능하여 특정 식물 유전자를 작동시킨다. TAL 이펙터의 주요 아미노산 서열은 이들이 결합하는 뉴클레오티드 서열을 명시한다. 따라서, 표적 부위는 TAL 이펙터에 대해 예상될 수 있고, TAL 이펙터는 또한 본원에 기재된 바와 같이 특정 뉴클레오티드 서열과의 결합 목적을 위해 조작 및 생성될 수 있다.
뉴클레아제 또는 뉴클레아제의 일부, 통상 유형 II 제한 엔도뉴클레아제, 예컨대 FokI로부터의 비특이적 절단 도메인을 코딩하는 서열이 TAL 이펙터-코딩 핵산 서열과 융합된다 (문헌 [Kim et al. (1996) Proc. Natl. Acad. Sci. USA 93:1156-1160]). 다른 유용한 엔도뉴클레아제에는, 예를 들어 HhaI, HindIII, NotI, BbvCI, EcoRI, BglI 및 AlwI이 포함될 수 있다. 몇몇 엔도뉴클레아제 (예를 들어, FokI)는 이량체로서만 기능한다는 사실이 TAL 이펙터의 표적 특이성을 향상시키는 데 이용될 수 있다. 예를 들어, 각각의 FokI 단량체가 상이한 DNA 표적 서열을 인식하는 TAL 이펙터 서열과 융합될 수 있는 몇몇 경우에, 2개의 인식 부위가 근접한 경우에만 불활성 단량체가 함께 기능 효소를 생성한다. 뉴클레아제를 활성화하는 데 DNA 결합이 필요함에 따라 고도로 부위-특이적인 제한 효소가 생성될 수 있다.
본원에서 제공되는 서열-특이적 TALEN은 세포에 존재하는 미리 선택된 표적 뉴클레오티드 서열 내 특정 서열을 인식할 수 있다. 따라서, 몇몇 실시양태에서, 표적 뉴클레오티드 서열을 뉴클레아제 인식 부위에 대해 스캐닝할 수 있고, 특정 뉴클레아제를 표적 서열에 기초하여 선택할 수 있다. 다른 경우에, TALEN을 특정 세포 서열을 표적화하도록 조작할 수 있다. 목적하는 TALEN을 코딩하는 뉴클레오티드 서열을 임의의 적합한 발현 벡터에 삽입할 수 있고, 하나 이상의 발현 제어 서열과 연결할 수 있다. 예를 들어, 뉴클레아제 코딩 서열을 형질전환될 식물의 종에서 엔도뉴클레아제의 구성적 발현을 유도할 포로모터 서열과 작동가능하게 연결할 수 있다. 다르게는, 엔도뉴클레아제 코딩 서열을 조건식 발현 (예를 들어, 특정 영양 조건 하에서의 발현)을 유도할 프로모터 서열과 작동가능하게 연결할 수 있다. 예를 들어, 콜리플라워 모자이크 바이러스 35S 프로모터가 구성적 발현에 사용될 수 있다. 다른 구성적 프로모터에는, 제한 없이, 노팔린 신타제 프로모터, 유비퀴틴 프로모터 및 액틴 프로모터가 포함된다. 몇몇 실시양태에서, 인공 에스트로겐-유도된 프로모터가 조건식 발현에 사용될 수 있고, 식물이 에스트로겐에 노출될 때 높은 수준의 전사가 이루어질 수 있다. 사용될 수 있는 다른 조건식 프로모터에는, 예를 들어 열-유도성 열 충격 유전자 프로모터 및 광-조절된 프로모터, 예컨대 리불로스 비스포스페이트 카르복실라제의 대형 서브유닛을 코딩하는 유전자로부터의 프로모터가 포함된다.
치료 목적을 위해, 본 발명의 TAL 이펙터-DNA 변형 효소 및 제약상 허용되는 부형제를 치료 유효량으로 투여한다. 투여되는 양이 생리학상 유의한 경우에 이러한 조합물은 "치료 유효량"으로 투여된다고 칭해진다. 작용제의 존재가 수용자의 생리를 검출가능하게 변화시키는 경우에 작용제는 생리학상 유의하다. 본 맥락에서, 작용제의 존재가 표적 질환의 하나 이상의 증상의 중증도를 감소시키고 병변 또는 이상의 게놈 교정을 감소시키는 경우에 작용제는 생리학상 유의하다. 표적화 DNA 및/또는 TAL 이펙터-DNA 변형 효소를 코딩하는 핵산을 포함하는 벡터를 다양한 방법 (예를 들어, 주입, 직접 흡수, 발사체 충격, 리포솜, 전기천공)에 의해 세포 내로 도입할 수 있다. TAL 이펙터-DNA 변형 효소는 발현 벡터를 이용하여 세포에서 안정하게 또는 일시적으로 발현될 수 있다. 진핵생물 세포 내 발현 기술은 당업계에 널리 공지되어 있다 (문헌 [Current Protocols in Human Genetics: Chapter 12 "Vectors For Gene Therapy"and Chapter 13 "Delivery Systems for Gene Therapy"] 참조).
본 발명의 한 추가 측면에서, TAL 이펙터-DNA 변형 효소는 실질적으로 비-면역원성이고, 즉, 유해 면역 반응을 거의 또는 전혀 일으키지 않는다. 이러한 종류의 유해한 면역 반응을 완화시키거나 없애는 다양한 방법이 본 발명에 따라 이용될 수 있다. 바람직한 실시양태에서, TAL 이펙터-DNA 변형 효소는 N-포르밀 메티오닌을 실질적으로 함유하지 않는다. 원치 않는 면역 반응을 피하는 또다른 방식은 TAL 이펙터-DNA 변형 효소를 폴리에틸렌 글리콜 ("PEG") 또는 폴리프로필렌 글리콜 ("PPG") (바람직하게는, 평균 분자량 (MW)이 500 내지 20,000 달톤인 것)과 접합시키는 것이다. 문헌 [Davis et al (US 4,179,337)]에 기재된 바와 같이, PEG 또는 PPG와의 접합은, 예를 들어 항-바이러스 활성을 갖는 비-면역원성, 생리학상 활성, 수용성 TAL 이펙터-DNA 변형 효소 접합체를 제공할 수 있다. 또한, 폴리에틸렌-폴리프로필렌 글리콜 공중합체를 이용하는 유사한 방법이 문헌 [Saifer et al. (US 5,006,333)]에 기재되어 있다.
공여자 벡터
공여자 뉴클레오티드 서열을 포함하는 재조합 핵산이 또한 본원에서 제공된다. 공여자 뉴클레오티드 서열은 형질전환될 세포의 게놈 내에서 내인성으로 발견되는 미리 선택된 표적 뉴클레오티드 서열과 관련하여 하나 이상의 변형 (즉, 치환, 결실 또는 삽입)을 갖는 변이체 서열을 포함할 수 있다 (본원에서 "변형된 표적 뉴클레오티드 서열"로도 지칭됨). 공여자 핵산 내 변이체 서열은 통상 양쪽 측면에서 세포 내 내인성 표적 뉴클레오티드 서열과 유사하거나 동일한 서열로 플랭킹된다. 플랭킹 서열은 임의의 적합한 길이를 가질 수 있고, 통상 50개 이상의 뉴클레오티드 길이 (예를 들어, 50개 이상의 뉴클레오티드, 75개 이상의 뉴클레오티드, 100개 이상의 뉴클레오티드, 200개 이상의 뉴클레오티드, 250개 이상의 뉴클레오티드, 300개 이상의 뉴클레오티드, 500개 이상의 뉴클레오티드, 750개 이상의 뉴클레오티드, 1000개 이상의 뉴클레오티드, 약 50개 내지 약 5000개의 뉴클레오티드, 약 100개 내지 2500개의 뉴클레오티드, 약 100개 내지 약 1000개의 뉴클레오티드, 약 100개 내지 500개의 뉴클레오티드, 약 200개 내지 약 500개의 뉴클레오티드, 또는 약 250개 내지 400개의 뉴클레오티드)이다. 따라서, 변이체 서열의 양쪽 측면의 재조합 공여자 핵산 구조체와 내인성 표적 사이에서 상동성 재조합이 일어날 수 있고, 그 결과 생성된 세포 게놈은 예를 들어 동일한 유전자로부터의 내인성 서열의 환경 내에서 변이체 서열을 함유한다. 공여자 뉴클레오티드 서열은 게놈 내 임의의 적합한 서열을 표적화하도록 생성될 수 있다. 예를 들어, 식물에서 공여자 뉴클레오티드 서열은 지질 생합성 유전자, 탄수화물 생합성 유전자, 종자 저장 단백질 유전자, 질환 또는 해충 내성 유전자, 스트레스 허용성 유전자, 내건성 유전자 또는 항-영양 생성 유전자에 대해 표적화될 수 있다. 또한, 공여자 뉴클레오티드 서열은 본원에 기재된 바와 같이 서열-특이적 뉴클레아제에 대한 인식 부위를 함유한다.
선별 마커
본원에서 제공되는 방법 중 몇몇은 선별가능한 또는 스크리닝가능한 마커를 코딩하는 제3 재조합 핵산의 사용을 포함한다. 선별가능한 형질을 유발하는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 하나 이상의 발현 제어 서열을 함유하는 발현 벡터에 혼입할 수 있다. 예를 들어, 발현 벡터는 형질전환될 식물 세포에서 구성적 발현을 유도할 포로모터 서열과 작동가능하게 연결된 선별 마커를 코딩하는 서열을 포함할 수 있다. 적합한 선별 마커에는, 제한 없이, 항생제, 예컨대 카나마이신, G418, 블레오마이신, 암피실린 또는 히그로마이신, 또는 제초제, 예컨대 글루포시네이트, 클로로술푸론 또는 포스피노트리신에 대한 내성을 부여하는 폴리펩티드가 포함될 수 있다.
식물에서의 사용에 대한 실시양태에서, 예를 들어 선별 마커는 성장점 또는 분열조직을 억제하는 제초제, 예컨대 이미다졸리논 또는 술포닐우레아에 대한 내성을 부여할 수 있다. 상기 범주에서 예시적인 폴리펩티드는, 예를 들어 미국 특허 제5,767,366호 및 동 제5,928,937호에 기재된 바와 같은 돌연변이체 ALS 및 AHAS 효소를 코딩한다. 미국 특허 제4,761,373호 및 동 제5,013,659호는 다양한 이미다졸리논 또는 술폰아미드 제초제에 내성이 있는 식물에 관한 것이다. 미국 특허 제4,975,374호는 글루타민 신세타제 (GS)를 억제하는 것으로 공지된 제초제, 예를 들어 포스피노트리신 및 메티오닌 술폭시민에 의한 억제에 내성이 있는 돌연변이체 GS를 코딩하는 유전자를 함유하는 식물 세포 및 식물에 관한 것이다. 미국 특허 제5,162,602호는 시클로헥산디온 및 아릴옥시페녹시프로판산 제초제에 의한 억제에 내성이 있는 식물을 개시한다. 상기 내성은 변경된 아세틸 보조효소 A 카르복실라제 (ACCase)에 의해 부여된다.
또한, 글리포세이트 (상품명 라운드업(Roundup)(등록상표)으로 판매됨)에 대한 내성을 위한 폴리펩티드는 식물에서의 사용에 적합하다. 예를 들어, 미국 특허 제4,940,835호 및 제4,769,061호를 참조한다. 미국 특허 제5,554,798호는 트랜스제닉 글리포세이트 내성 옥수수 식물을 개시하며, 여기서 내성은 변형된 5-에놀피루빌-3-포스포시키메이트 (EPSP) 신타제에 의해 부여된다. 이러한 폴리펩티드는 글리포세이트 염, 예컨대 트리메틸술포늄 염, 이소프로필아민 염, 나트륨 염, 칼륨 염 및 암모늄 염을 제한 없이 포함하는 글리포세이트 제초제 조성물에 대한 내성을 부여할 수 있다. 예를 들어, 미국 특허 제6,451,735호 및 제6,451,732호를 참조한다.
또한, 포스포노 화합물, 예컨대 글루포시네이트 암모늄 또는 포스피노트리신, 및 피리디녹시 또는 페녹시 프로피온산 및 시클로헥손에 대한 내성을 위한 폴리펩티드가 적합하다. 예를 들어, 유럽 공보 제0 242 246호, 및 또한 미국 특허 제5,879,903호, 제5,276,268호 및 제5,561,236호를 참조한다.
다른 제초제에는 광합성을 억제하는 것들, 예컨대 트리아진 및 벤조니트릴 (니트릴라제)이 포함된다. 예를 들어, 미국 특허 제4,810,648호를 참조한다. 다른 제초제에는 2,2-디클로로프로피온산, 세톡시딤, 할록시포프, 이미다졸리논 제초제, 술포닐우레아 제초제, 트리아졸로피리미딘 제초제, s-트리아진 제초제 및 브로목시닐이 포함된다. 또한, 프로톡스 효소(protox enzyme)에 대한 내성을 부여하는 제초제가 적합하다. 예를 들어, 미국 특허 공보 제20010016956호 및 미국 특허 제6,084,155호를 참조한다.
몇몇 실시양태에서, 선별 마커를 코딩하는 재조합 핵산을 적합화시켜 부위-특이적 재조합에 의해 세포 (예를 들어, 식물 세포 또는 동물 세포)의 게놈으로 통합시킬 수 있다. 예를 들어, 선별 마커를 코딩하는 서열을 예를 들어 Cre 또는 FLP와 같은 재조합효소에 대한 인식 서열에 의해 플랭킹할 수 있다. 다른 실시양태에서, 선별 마커를 코딩하는 재조합 핵산을 동종 재조합에 의한 식물 게놈으로의 통합을 위해 적합화시킬 수 있다. 이러한 핵산에서, 선별 마커를 코딩하는 서열을, 재조합 핵산이 도입되는 식물 세포의 게놈 내에서 발견되는 내인성 뉴클레오티드 서열과 유사하거나 또는 동일한 서열에 의해 플랭킹할 수 있다. 내인성 서열 중 적어도 하나는 서열-특이적 뉴클레아제에 대한 절단 부위일 수 있다. 또한, 선별 마커를 코딩하는 핵산은 서열-특이적 뉴클레아제에 대한 인식 부위를 함유할 수 있다. 뉴클레아제는 공여자 뉴클레오티드 서열에 표적화되는 것과 동일한 서열-특이적 뉴클레아제, 또는 공여자 뉴클레오티드 서열에 표적화되는 것과 상이한 서열-특이적 뉴클레아제일 수 있다. 또 다른 실시양태에서, 선별 마커를 코딩하는 재조합 핵산은 비적합 재조합에 의한 식물 세포의 게놈으로의 통합을 위해 적합화될 수 있다. 통상적으로, 이러한 핵산은 본원에서 기재된 것과 같은 동종 또는 부위-특이적 재조합에 적합화된 핵산 내에 함유되어 있는 플랭킹 서열 및 뉴클레아제 인식 부위가 없다.
방법
하나 이상의 본원에서 제공되는 구조체를 사용하여 세포를 형질전환시키고/거나 DNA 변형 효소를 세포에 도입하여, 유전자 변형 유기체 (예를 들어, 식물 또는 동물)이 생성되도록 할 수 있다. 따라서, 본원에서 기재된 핵산 및/또는 폴리펩티드를 함유하는 유전자 변형 유기체 및 세포 또한 제공된다. 몇몇 실시양태에서, 형질전환된 세포는 그의 게놈으로 통합된 재조합 핵산 구조체를 가지며, 즉 안정적으로 형질전환될 수 있다. 통상적으로, 안정적으로 형질전환된 세포는 각 세포 분열에 대한 도입된 핵산 서열을 보유한다. 구조체는 상동성 방식으로 통합되어 형질전환된 세포에 내인성인 뉴클레오티드 서열이 구조체로 대체되도록 할 수 있으며, 여기서 구조체는 내인성 서열에 대응하는 서열을 함유하지만, 내인성 서열에 대하여 하나 이상의 변형을 함유한다. 이러한 변형된 내인성 서열을 함유하는 식물 또는 동물을 본원에서 "유전자 변형 유기체" (GMO)로 지칭할 수 있지만, 변형된 내인성 서열은 트랜스진으로 여겨지지 않는다는 것을 주목해야 한다. 또한, 구조체는 부적합 방식으로 통합되어 형질전환된 세포의 게놈으로 무작위로 통합되도록 할 수 있다.
별법으로, 세포는 일시적으로 형질전환되어 구조체가 그의 게놈으로 통합되지 않도록 할 수 있다. 예를 들어, TALEN 코딩 서열을 함유하는 플라스미드 벡터를 세포로 도입하여, TALEN 코딩 서열이 발현되지만 벡터는 게놈에 안정적으로 통합되지 않도록 할 수 있다. 통상적으로, 일시적으로 형질전환된 세포는 각 세포 분열에 대한 도입된 핵산 구조체 중 일부 또는 전부를 손실하여, 도입된 핵산이 충분한 수의 세포 분열 후의 딸 세포에서 검출될 수 없도록 할 수 있다. 그럼에도 불구하고, TALEN 코딩 서열의 발현은 공여자 서열 및 내인성 표적 서열 사이의 동종 재조합을 달성하는데 충분하다. 일시적으로 형질전환되고 안정적으로 형질전환된 세포 둘 다 본원에서 기재된 방법에 유용할 수 있다.
특히 유전자 변형 식물 세포에 대하여, 본원에서 기재된 방법에서 사용되는 세포는 전체 식물의 부분 또는 전부를 구성할 수 있다. 이러한 식물은 성장 챔버, 온실 또는 야외 중 하나에서 고려 중인 종에 적합한 방식으로 성장시킬 수 있다. 유전자 변형 식물을 특정 목적을 위해 요구되는 것과 같이 교배시켜, 예를 들어 재조합 핵산을 다른 계통으로 도입하거나, 재조합 핵산을 다른 종에 전달하거나, 또는 다른 원하는 형질을 추가로 선별할 수 있다. 별법으로, 유전자 변형 식물을 이러한 기법이 가능한 종에 대해 영양 번식시킬 수 있다. 자손에는 특정 식물 또는 식물 계통의 후손이 포함된다. 식물의 자손에는 F1, F2, F3, F4, F5, F6 및 후속 세대 식물에서 형성된 종자, 또는 BC1, BC2, BC3 및 후속 세대 식물에서 형성된 종자, 또는 F1BC1, F1BC2, F1BC3 및 후속 세대 식물에서 형성된 종자가 포함된다. 유전자 변형 식물에 의해 생성된 종자를 성장시키고, 이후 자가교배 (또는 이종교배 및 자가교배)시켜 핵산 구조체에 동종접합인 종자를 얻을 수 있다.
유전자 변형 세포 (예를 들어, 식물 세포 또는 동물 세포)는 필요하다면 현탁 배양물 또는 조직 또는 기관 배양물에서 성장시킬 수 있다. 본원에서 제공되는 방법의 목적상, 고체 및/또는 액체 조직 배양 기법을 사용할 수 있다. 고체 배지를 사용하는 경우에, 세포를 배지에 바로 위치시키거나, 또는 필터 필름 상에 위치시키고 이후 배지와 접촉하도록 위치시킬 수 있다. 액체 배지를 사용하는 경우에, 세포를 액체 배지와 접촉하는 부유 장치, 예를 들어 다공성 막에 위치시킬 수 있다. 통상적으로, 고체 배지는 액체 배지에 한천을 첨가하여 제조된다. 예를 들어, 고체 배지는 한천, 및 적합한 농도의 옥신, 예를 들어 2,4-디클로로페녹시아세트산 (2,4-D) 및 적합한 농도의 시토키닌, 예를 들어 키네틴을 함유하는 무라시게 및 스쿡(Murashige and Skoog; MS) 배지일 수 있다.
세포는 하나의 재조합 핵산 구조체 또는 복수개 (예를 들어, 2, 3, 4 또는 5개)의 재조합 핵산 구조체로 형질전환될 수 있다. 복수개의 구조체가 이용되는 경우에, 이들은 동시에 또는 순차적으로 형질전환될 수 있다. 광범위한 종의 형질전환을 위한 기법은 당업계에 알려져 있다. 본원에서 기재된 폴리뉴클레오티드 및/또는 재조합 백터는 전기천공, 미세주입 및 유전자총(biolistic) 방법을 비롯한 여러 알려진 방법 중 어느 하나를 사용하여 숙주의 게놈으로 도입할 수 있다. 별법으로, 폴리뉴클레오티드 또는 벡터를 적합한 T-DNA 플랭킹 영역과 조합하고, 이를 통상적인 아그로박테리움 투메파키엔스(Agrobacterium tumefaciens) 숙주 벡터에 도입할 수 있다. 바이너리 벡터(binary vector)의 무력화(disarming) 및 사용을 포함한 이러한 아그로박테리움 투메파키엔스-매개된 형질전환 기법은 당업계에 잘 알려져 있다. 다른 유전자 전달 및 형질전환 기법에는 칼슘 또는 PEG를 통한 원형질체 형질전환, 노출된 DNA의 전기천공-매개된 흡수, 리포솜-매개된 형질감염, 전기천공, 바이러스 벡터-매개된 형질전환, 및 미세사 충격(microprojectile bombardment)이 포함된다 (예를 들어, 미국 특허 제5,538,880호, 제5,204,253호, 제5,591,616호 및 제6,329,571호 참조). 식물 세포 또는 조직 배양물을 형질전환을 위한 수용자 조직으로서 사용하는 경우에, 식물은 당업자들에게 알려진 기법을 사용하여 형질전환된 배양물로부터 재생될 수 있다.
몇몇 실시양태에서, DNA 변형 효소 (예를 들어, TALEN)를 세포로 직접 도입할 수 있다. 예를 들어, 기계적 주입, 박테리아 유형 III 분비 시스템을 통한 전달, 전기천공, 또는 아그로박테리움 매개된 전달에 의해 폴리펩티드를 세포로 도입할 수 있다. 아그로박테리움 VirB/D4 수송 시스템, 및 핵단백질 T 복합체의 식물 세포에의 전달을 매개하기 위한 그의 용도의 논의에 대하여, 예를 들어 문헌 [Vergunst et al. (2000) Science 290:979-982]을 참조한다.
추가적으로 식물에 대하여, 본원에서 기재된 폴리뉴클레오티드, 벡터 및 폴리펩티드를 홍화, 자주개자리, 대두, 커피, 아마란스, 평지씨 (고 에루크산 및 캐놀라), 땅콩 또는 해바라기와 같은 쌍떡잎식물, 및 또한 기름 야자, 사탕수수, 바나나, 수단그라스(sudangrass), 옥수수, 밀, 호밀, 보리, 귀리, 벼, 기장 또는 수수와 같은 외떡잎식물을 비롯한 여러 외떡잎식물 및 쌍떡잎식물 및 식물 세포 시스템으로 도입할 수 있다. 겉씨식물, 예컨대 전나무 및 소나무 또한 적합하다.
따라서, 본원에서 기재된 방법은 예를 들어 마그니오랄레스(Magniolales), 일리시알레스(Illiciales), 라우랄레스(Laurales), 피페랄레스(Piperales), 아리스토치알레스(Aristochiales), 님파에알레스(Nymphaeales), 라눈쿠랄레스(Ranunculales), 파페베랄레스(Papeverales), 사라세니아케아이(Sarraceniaceae), 트로코덴드랄레스(Trochodendrales), 하마멜리달레스(Hamamelidales), 유코미알레스(Eucomiales), 레이트네리알레스(Leitneriales), 미리칼레스(Myricales), 파갈레스(Fagales), 카수아리날레스(Casuarinales), 카리오필랄레스(Caryophyllales), 바탈레스(Batales), 폴리고날레스(Polygonales), 플룸바지날레스(Plumbaginales), 딜레니알레스(Dilleniales), 테알레스(Theales), 말발레스(Malvales), 우르티칼레스(Urticales), 레시티달레스(Lecythidales), 비올랄레스(Violales), 살리칼레스(Salicales), 카파랄레스(Capparales), 에리칼레스(Ericales), 디아펜살레스(Diapensales), 에베날레스(Ebenales), 프리무랄레스(Primulales), 로살레스(Rosales), 파발레스(Fabales), 포도스테말레스(Podostemales), 할로라갈레스(Haloragales), 미르탈레스(Myrtales), 코르날레스(Cornales), 프로테알레스(Proteales), 산탈레스(Santales), 라플레시알레스(Rafflesiales), 셀라스트랄레스(Celastrales), 유포르비알레스(Euphorbiales), 람날레스(Rhamnales), 사핀달레스(Sapindales), 유글란달레스(Juglandales), 게라니알레스(Geraniales), 폴리갈랄레스(Polygalales), 움벨랄레스(Umbellales), 겐티아날레스(Gentianales), 폴레모니알레스(Polemoniales), 라미알레스(Lamiales), 플란타지날레스(Plantaginales), 스크로풀라리알레스(Scrophulariales), 캄파누랄레스(Campanulales), 루비알레스(Rubiales), 딥사칼레스(Dipsacales) 및 아스테랄레스(Asterales) 목에 속하는 쌍떡잎식물에 이용할 수 있다. 또한, 본원에서 기재된 방법은 알리스마탈레스(Alismatales), 히드로차리탈레스(Hydrocharitales), 나자달레스(Najadales), 트리우리달레스(Triuridales), 콤멜리날레스(Commelinales), 에리오카우랄레스(Eriocaulales), 레스티오날레스(Restionales), 포알레스(Poales), 준칼레스(Juncales), 시페랄레스(Cyperales), 티팔레스(Typhales), 브로멜리알레스(Bromeliales), 진기베랄레스(Zingiberales), 아레칼레스(Arecales), 시클란탈레스(Cyclanthales), 판다날레스(Pandanales), 아랄레스(Arales), 릴리알레스(Lilliales) 및 오르치달레스(Orchidales) 목에 속하는 것과 같은 외떡잎식물, 또는 겉씨식물문, 예를 들어 피날레스(Pinales), 징코알레스(Ginkgoales), 시카달레스(Cycadales) 및 네탈레스(Gnetales)에 속하는 식물에 이용할 수 있다.
방법은 아트로파(Atropa), 알세오다프네(Alseodaphne), 아나카르디움(Anacardium), 아라치스(Arachis), 벨리쉬미에디아(Beilschmiedia), 브라시카(Brassica), 카르타무스(Carthamus), 코쿠루스(Cocculus), 크로톤(Croton), 쿠쿠미스(Cucumis), 시트러스(Citrus), 시트룰루스(Citrullus), 캅시쿰(Capsicum), 카타란투스(Catharanthus), 코코스(Cocos), 코페아(Coffea), 쿠쿠르비타(Cucurbita), 다우쿠스(Daucus), 두구에티아(Duguetia), 에스크스콜지아(Eschscholzia), 피쿠스(Ficus), 프라가리아(Fragaria), 글라우시움(Glaucium), 글리신(Glycine), 고시피움(Gossypium), 헬리안투스(Helianthus), 히비어(Hevea), 히오시아무스(Hyoscyamus), 락투카(Lactuca), 란돌피아(Landolphia), 리눔(Linum), 리트세아(Litsea), 리코페르시콘(Lycopersicon), 루피누스(Lupinus), 마니호트(Manihot), 마조라나(Majorana), 말루스(Malus), 메디카고(Medicago), 니코티아나(Nicotiana), 올레아(Olea), 파르테니움(Parthenium), 파파베르(Papaver), 페르세아(Persea), 파세올루스(Phaseolus), 피스타치아(Pistacia), 피숨(Pisum), 피루스(Pyrus), 프루누스(Prunus), 라파누스(Raphanus), 리치누스(Ricinus), 세네치오(Senecio), 시노메니움(Sinomenium), 스테파니아(Stephania), 시나피스(Sinapis), 솔라눔(Solanum), 테오브로마(Theobroma), 트리폴리움(Trifolium), 트리고넬라(Trigonella), 비치아(Vicia), 빈카(Vinca), 비티스(Vitis) 및 비그나(Vigna) 속 쌍떡잎식물; 알리움(Allium), 안드로포곤(Andropogon), 아라그로스티스(Aragrostis), 아스파라거스(Asparagus), 아베나(Avena), 시노돈(Cynodon), 엘라에리스(Elaeis), 페스투카(Festuca), 페스투로리움(Festulolium), 헤테로칼리스(Heterocallis), 호르데움(Hordeum), 렘나(Lemna), 롤리움(Lolium), 무사(Musa), 오리자(Oryza), 파니쿰(Panicum), 판네세툼(Pannesetum), 플레움(Phleum), 포아(Poa), 세칼레(Secale), 소르굼(Sorghum), 트리티쿰(Triticum) 및 제아(Zea) 속 외떡잎식물; 또는 아비에스(Abies), 쿤닝하미아(Cunninghamia), 피세아(Picea), 피누스(Pinus) 및 프세우도추가(Pseudotsuga) 속 겉씨식물로부터의 종을 비롯하여 광범위한 식물 종에 걸쳐 사용될 수 있다.
형질전환된 세포, 캘러스, 조직 또는 식물은 특정 형질 또는 활성에 대한 유전자조작된 세포, 예를 들어 마커 유전자 또는 항생제 내성 유전자에 의해 코딩된 세포의 선별 또는 스크리닝에 의해 확인 및 단리될 수 있다. 이러한 스크리닝 및 선별 방법은 당업자들에게 잘 알려져 있다. 추가적으로, 물리적 및 생화학적 방법을 사용하여 형질전환체를 확인할 수 있다. 이에는 폴리뉴클레오티드의 검출을 위한 써던(Southern) 분석 또는 PCR 증폭; RNA 전사체의 검출을 위한 노던 블럿(Northern blot), S1 RNase 보호, 프라이머-신장 또는 RT-PCR 증폭; 폴리펩티드 및 폴리뉴클레오티드의 효소 또는 리보자임 활성의 검출을 위한 효소 검정; 및 폴리펩티드의 검출을 위한 단백질 겔 전기영동, 웨스턴 블럿(Western blot), 면역침강 및 효소-결합 면역검정이 포함된다. 또한, 제자리 하이브리드화(in situ hybridization), 효소 염색 및 면역염색과 같은 다른 기법을 사용하여 폴리펩티드 및/또는 폴리뉴클레오티드의 존재 또는 발현을 검출할 수 있다. 모든 언급된 기법을 수행하기 위한 방법은 잘 알려져 있다. 식물 세포로 안정적으로 도입되는 폴리뉴클레오티드는 예를 들어 표준 육종 기법을 사용하여 다른 식물로 도입할 수 있다.
본 발명의 문맥상, "진핵생물 세포"는 하기 열거된 유기체로부터 유래되고 시험관내 배양을 위해 수립된 진균, 효모, 식물 또는 동물 세포 또는 세포주를 의미한다. 보다 바람직하게는, 진균은 아스페르길루스(Aspergillus), 페니실리움(Penicillium), 아크레모니움(Acremonium), 트리코데르마(Trichoderma), 크리소스포리움(Chrysosporium), 모르티에렐라(Mortierella), 클루이베로미세스(Kluyveromyces) 또는 피치아(Pichia) 속의 진균일 수 있다. 보다 바람직하게는, 진균은 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 테레누스(Aspergillus terreus), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 키트리눔(Penicillium citrinum), 아크레모니움 크리소게눔(Acremonium chrysogenum), 트리코데르마 레세이(Trichoderma reesei), 모르티에렐라 알피네(Mortierella alpine), 크리소스포리움 루크노웬세(Chrysosporium lucknowense), 클루이베로미세스 락티스(Kluyveromyces lactis), 피치아 파스토리스(Pichia pastoris) 또는 피치아 키페르리(Pichia ciferrii) 종의 진균일 수 있다.
본 발명에서, 식물은 아라비도스피스(Arabidospis), 니코티아나, 솔라눔, 락투카, 브라시카, 오리자, 아스파라거스, 피숨, 메디카고, 제아, 호르데움, 세칼레, 트리티쿰, 캅시쿰, 쿠쿠미스, 쿠쿠르비타, 시트룰루스, 시트러스 또는 소르굼 속의 식물일 수 있다. 보다 바람직하게는, 식물은 아라비도스피스 탈리아나(Arabidospis thaliana), 니코티아나 타바쿰(Nicotiana tabaccum), 솔라눔 리코페르시쿰(Solanum lycopersicum), 솔라눔 투베로숨(Solanum tuberosum), 솔라눔 멜론게나(Solanum melongena), 솔라눔 에스쿨렌툼(Solanum esculentum), 락투카 살리바(Lactuca saliva), 브라시카 나푸스(Brassica napus), 브라시카 올레라세아(Brassica oleracea), 브라시카 라파(Brassica rapa), 오리자 글라베르리마(Oryza glaberrima), 오리자 사티바(Oryza sativa), 아스파라거스 오피시날리스(Asparagus officinalis), 피숨 사티붐(Pisum sativum), 메디카고 사티바(Medicago sativa), 제아 마이스(Zea mays), 호르데움 불가레(Hordeum vulgare), 세칼레 세레알(Secale cereal), 트리티쿰 아에스티붐(Triticum aestivum), 트리티쿰 두룸(Triticum durum), 캅시쿰 사티부스(Capsicum sativus), 쿠쿠르비타 페포(Cucurbita pepo), 시트룰루스 라나투스(Citrullus lanatus), 쿠쿠미스 멜로(Cucumis melo), 시트러스 아우란티폴리아(Citrus aurantifolia), 시트러스 막시마(Citrus maxima), 시트러스 메디카(Citrus medica) 또는 시트러스 레티쿨라타(Citrus reticulata) 종의 식물일 수 있다.
본 발명에서, 동물 세포는 호모(Homo), 라투스(Rattus), 무스(Mus), 수스(Sus), 보스(Bos), 다니오(Danio), 카니스(Canis), 펠리스(Felis), 에쿠스(Equus), 살모(Salmo), 온코린쿠스(Oncorhynchus), 갈루스(Gallus), 멜레아그리스(Meleagris), 드로소필라(Drosophila) 또는 카에노라브디티스(Caenorhabditis) 속의 세포일 수 있으며; 보다 바람직하게는, 동물 세포는 호모 사피엔스(Homo sapiens), 라투스 노르베기쿠스(Rattus norvegicus), 무스 무스쿨루스(Mus musculus), 수스 스크로파(Sus scrofa), 보스 타우루스(Bos taurus), 다니오 레리오(Danio rerio), 카니스 루푸스(Canis lupus), 펠리스 카투스(Felis catus), 에쿠스 카발루스(Equus caballus), 온코린쿠스 미키스(Oncorhynchus mykiss), 갈루스 갈루스(Gallus gallus) 또는 멜레아그리스 갈로파보(Meleagris gallopavo) 종의 세포일 수 있으며; 동물 세포는 비-제한적인 예로서 살모 살라르(Salmo salar), 경골 어류 또는 제브라피시 종으로부터의 어류 세포일 수 있다. 본 발명에서의 동물 세포는 또한 비-제한적인 예로서 드로소필라 멜라노가스테르(Drosophila melanogaster)로부터의 곤충 세포일 수 있으며; 동물 세포는 또한 비-제한적인 예로서 카에노라브디티스 엘레간스(Caenorhabditis elegans)로부터의 벌레 세포일 수 있다.
본 발명에서, 세포는 식물 세포, 포유동물 세포, 어류 세포, 곤충 세포, 또는 시험관내 배양을 위해 상기 유기체들로부터 유래된 세포주 또는 생 조직으로부터 바로 얻고 시험관내 배양용으로 확립된 1차 세포일 수 있다. 비제한적인 예로서, 세포주는 CHO-K1 세포; HEK293 세포; Caco2 세포; U2-OS 세포; NIH 3T3 세포; NSO 세포; SP2 세포; CHO-S 세포; DG44 세포; K-562 세포, U-937 세포; MRC5 세포; IMR90 세포; Jurkat 세포; HepG2 세포; HeLa 세포; HT-1080 세포; HCT-116 세포; Hu-h7 세포; Huvec 세포; Molt 4 세포로 이루어진 군으로부터 선택될 수 있다.
이러한 모든 세포주는, 흥미있는 유전자 또는 단백질의 생성, 발현, 정량화, 검출 및 연구를 위한 세포주 모델을 제공하도록 본 발명의 방법에 의해 변형될 수 있으며, 이러한 모델은 또한 다양한 분야, 예컨대 비제한적인 예로서 화학, 바이오연료, 치료학 및 농경학에서의 연구 및 제조에서 흥미로운 생물학적으로 활성인 분자를 스크리닝하는 데 사용될 수 있다.
본 발명은 또한 예를 들어 항-바이러스 치료에서, 예를 들어 세포 내 유전 물질을 변경하기 위해, 유전자 발현을 조절하기 위해, 그리고 병원성 서열을 표적화하기 위해 TAL 이펙터 내의 서열-특이적 DNA 결합 도메인을 이용하는 방법을 제공한다. 예를 들어, 일부 실시양태에서, 본 발명은 세포 유전 물질을 변형시키는 방법을 제공한다. 일부 실시양태에서, 상기 방법은 TAL 이펙터 DNA 결합 도메인을 함유하는 폴리펩티드, 또는 이러한 폴리펩티드를 코딩하는 핵산을 세포 내로 도입하는 것을 포함한다. TAL 이펙터 DNA 결합 도메인은 DNA 변형 효소 (예를 들어, 엔도뉴클레아제)의 일부분 또는 모든 부분에 융합될 수 있다. 일부 실시양태에서, 상기 방법은 2종 이상의 재조합 핵산을 세포 내로 도입하는 것을 포함한다. 제1 재조합 핵산은, 세포에서 발견되는 예비선별된 해당 표적 뉴클레오티드 서열에 대한 하나 이상의 변형 (즉, 치환, 결실 또는 삽입)을 포함하는 공여자 뉴클레오티드 서열을 함유한다. 공여자 뉴클레오티드 서열은 내인성 표적 뉴클레오티드 서열로 상동성 재조합되어, 내인성 서열 또는 그의 일부분이 공여자 서열 또는 그의 일부분으로 대체되도록 할 수 있다. 표적 뉴클레오티드 서열은 전형적으로 서열-특이적 TALEN을 위한 인식 부위를 포함한다. 일부 경우에, 표적 뉴클레오티드 서열은 2종 이상의 별개의 TALEN을 위한 인식 부위 (예를 들어, 별개의 DNA 서열 결합 특이성을 갖는 TALEN이 사용될 수 있도록, 별개인 2종의 대향 표적 서열)를 포함할 수 있다. 이러한 경우에, DNA 절단의 특이성은 오직 하나의 표적 서열 (또는 동일한 표적 서열의 다수의 복사물)이 사용되는 경우에 비해 증가할 수 있다.
제2 재조합 핵산은 표적 뉴클레오티드 서열 내 인식 부위에 결합하는 서열 특이적 TALEN을 코딩하는 뉴클레오티드 서열을 함유한다. 일부 경우에, 공여자 뉴클레오티드 서열, 및 서열-특이적 뉴클레아제를 코딩하는 뉴클레오티드 서열은 동일한 핵산 구조체에 함유될 수 있다. 별법으로, 공여자 뉴클레오티드 서열 및 TALEN 코딩 서열은 별개의 구조체에 함유될 수 있거나, 또는 TALEN 폴리펩티드는 생성되어 세포 내로 바로 도입될 수 있다.
일부 실시양태에서, 선별 마커를 코딩하는 뉴클레오티드 서열을 함유하는 제3 재조합 핵산이 또한 사용될 수 있다. 제2 및 제3 재조합 핵산은 내인성 서열로 재조합되어 세포의 게놈 내로 통합될 수 있다. 이러한 재조합 사건은 변칙적 (즉, 무작위적)일 수 있거나, 또는 이들은 상동성 재조합을 통해 또는 부위-특이적 재조합을 통해 발생할 수 있다. 재조합 핵산들은 동시에 또는 순차적으로 세포 내로 형질전환될 수 있고, 형질전환 전에 선형화될 수 있다.
세포가 식물 세포인 경우, 본원에 제공된 방법은 소정의 단계들, 예컨대 형질전환된 세포를 함유하는 식물을 생성시키는 단계, 상기 식물의 자손을 생성시키는 단계, 선별 마커 (포함되는 경우)를 발현시키는 식물을 선별 또는 스크리닝하는 단계, 선별된 식물의 자손을 생성시키는 단계, 및 식물 (예를 들어, 조직, 종자, 전구 세포 또는 식물 전체) 또는 식물의 자손을 표적 뉴클레오티드 서열에서의 재조합에 대해 시험하는 단계를 추가로 포함할 수 있다. 일부 경우에, 상기 방법은 선별된 식물체를 이종교배시켜 선별 마커를 제거하는 단계, 및/또는 선별되거나 이종교배된 식물을 서열-특이적 뉴클레아제의 부재에 대해 스크리닝하는 단계를 포함할 수 있다.
일부 실시양태에서, 본 발명은 세포, 예를 들어 원핵생물 세포, 동물 세포 또는 식물 세포의 유전 물질을 변형시키는 방법을 제공한다. 상기 방법은, 세포 내 존재하는 해당 표적 뉴클레오티드 서열에 대한 하나 이상의 뉴클레오티드 서열 내 변형을 포함하는 변형된 표적 뉴클레오티드 서열, 뿐만 아니라 서열-특이적 TALEN을 위한 인식 부위를 함유하는 제1 재조합 핵산, 및 서열-특이적 TALEN을 코딩하는 뉴클레오티드 서열을 함유하는 제2 재조합 핵산을 세포 내로 도입시키는 것을 포함할 수 있다. 세포가 식물 세포인 경우, 상기 세포를 함유하는 식물이 생성될 수 있고, 상기 식물 (또는 그의 자손)로부터 얻은 세포, 종자 또는 조직은 표적 뉴클레오티드 서열에서의 재조합에 대해 분석될 수 있다. 제1 및 제2 재조합 핵산은 동시에 또는 연속적으로 세포 내로 형질전환될 수 있고, 하나 또는 둘 모두는 형질전환 전에 선형화될 수 있다. 일부 경우에, 제1 및 제2 재조합 핵산은 동일한 구조체에 존재할 수 있다.
일부 경우에, 상기 방법은 또한 선별 마커를 코딩하는 뉴클레오티드 서열을 함유하는 제3 재조합 핵산을 세포 내로 도입시키고, 세포, 세포로부터 생성된 유기체 또는 이들의 자손이 선별 마커를 발현시키는지의 여부를 결정하는 것을 포함할 수 있다. 상기 방법은 세포, 유기체 또는 이들의 자손을 선별 마커의 부재에 대해 스크리닝하는 것을 포함할 수 있다. 선별 마커를 코딩하는 뉴클레오티드 서열은, 제2 서열-특이적 뉴클레아제에 대한 절단 부위에서의 세포에 내인성인 뉴클레오티드 서열과 유사하거나 동일한 뉴클레오티드 서열, 또는 서열-특이적 재조합효소를 위한 인식 부위의 양 측면에 위치하거나 또는 측면에 위치하지 않을 수 있다. 일부 경우에, 상기 방법은 또한 유기체를 이종교배시키는 단계를 포함할 수 있다. 이종교배된 자손은 선별 마커의 부재에 대해 스크리닝될 수 있다.
본 발명은 또한, 표적 DNA 서열, 예를 들어 염색체, 미토콘드리아 또는 엽록체 서열 (상동성 재조합이 발생하는 것이 요구됨)을 함유하는 세포를 제공하는 것, 표적 DNA 서열 내 특정 뉴클레오티드 서열에 조합으로 결합하는 복수의 TAL 이펙터 반복물을 갖는 TAL 이펙터 도메인 및 DNA 변형 효소 도메인 (예를 들어, 엔도뉴클레아제 도메인)을 함유하는 TALEN을 제공하는 것, 표적 DNA의 적어도 일부분에 상동성인 서열을 함유하는 핵산을 제공하는 것, 및 세포 내 표적 DNA 서열을 TAL 엔도뉴클레아제와 접촉시켜 세포 내 표적 DNA 서열 내 또는 그에 인접한 뉴클레오티드 서열의 이중 가닥이 절단되도록 하는 것을 포함하는, 세포 (예를 들어, 식물 세포 또는 동물 세포)의 유전 물질을 변형시키는 방법을 제공한다. 이러한 절단은 표적 DNA 서열에서의 상동성 재조합의 빈도를 향상시킬 수 있다. 표적 DNA 서열은 세포에 내인성일 수 있다. 상기 방법은 TAL 엔도뉴클레아제를 코딩하는 cDNA를 함유하는 벡터를 세포 내로 도입시키는 것 및 세포 내 TAL 엔도뉴클레아제 단백질을 발현시키는 것을 포함할 수 있다. 일부 경우에, TAL 엔도뉴클레아제 단백질 그 자체가, 예를 들어 기계적 주입에 의해, 박테리아 유형 III 분비 시스템을 통한 전달에 의해, 전기천공에 의해 또는 아그로박테리움(Agrobacterium) 매개된 전달을 통해 세포 내로 도입될 수 있다.
본원에 기재된 방법은 다양한 상황에서 사용될 수 있다. 농업분야에서, 예를 들어 본원에 기재된 방법은 표적 부위에서의 상동성 재조합을 촉진시켜, 이전에 통합된 형질전이 유전자 (예를 들어, 제초제 내성 형질전이 유전자)를 식물 계통, 종 또는 잡종으로부터 제거하는 데 유용하다. 본원에 기재된 방법은 또한 내인성 유전자를 변형시켜 상기 유전자에 의해 코딩된 효소가 제초제 내성을 수여하도록, 예를 들어 내인성 5-에놀피루빌 시키메이트-3-포스페이트 (EPSP) 신타제 유전자를 변형시켜 변형된 효소가 글리포세이트 제초제에 대한 내성을 수여하도록 사용될 수 있다. 또 다른 예로서, 본원에 기재된 방법은 식물 또는 포유동물의 대사 경로 (예를 들어, 지방산 생합성)에서 1종 이상의 내인성 유전자에 대한 조절 영역에서의 상동성 재조합을 촉진시켜, 이러한 유전자의 발현이 목적하는 방식으로 변형되도록 하는 데 유용하다. 본원에 기재된 방법은 동물 (예를 들어, 래트 또는 마우스)에서, 대사 경로 및 내부 신호전달 경로 (비제한적인 예임)에 관여하는 흥미있는 1종 이상의 내인성 유전자, 예컨대 세포-표면 마커를 코딩하는 유전자, 특정 질환에 연결되는 것으로 확인된 유전자, 및 동물 세포의 특정 표현형을 담당하는 것으로 공지되어 있는 임의의 유전자에서의 상동성 재조합을 촉진시키는 데 유용하다.
본 발명은 또한 특정 DNA 서열과 상호작용할 수 있는 서열-특이적 TAL 이펙터 (예를 들어, 특이적 위치에서 DNA를 절단시킬 수 있는 TALEN)를 고안하는 방법을 제공한다. 상기 방법은, TAL 이펙터 결합 (예를 들어, 이중 가닥 절단의 도입이 요구되는 제2 뉴클레오티드 서열에 인접한 서열)을 갖는 것이 요구되는 표적 뉴클레오티드 서열 (예를 들어, 내인성 염색체 서열, 미토콘드리아 DNA 서열 또는 엽록체 DNA 서열)을 확인하는 것, 및 표적 서열에 조합으로 결합하는 복수의 DNA 결합 반복물을 함유하는 서열 특이적 TAL 이펙터를 고안하는 것을 포함할 수 있다. 본원에 기재된 바와 같이, TAL 이펙터는 이들이 DNA와 상호작용하는 특이성을 결정하는 다수의 불완전한 반복물을 포함한다. 각각의 반복물은 반복물의 잔기 12 및 13에서의 특정 디-아미노산 서열에 따라, 단일 염기에 결합한다. 따라서, TAL 이펙터 내 반복물을 (예를 들어, 표준 기술 또는 본원에 기재된 기술을 이용하여) 조작함으로써, 특정 DNA 부위가 표적화될 수 있다. 이러한 조작된 TAL 이펙터는 예를 들어, 특정 DNA 서열에 표적화된 전사 인자로서 사용될 수 있다. 포괄적인 TAL 이펙터의 다이어그램은 도 1a (반복 영역은 개방된 박스형태(open box)로 나타내고, 대표적인 반복 서열 (서열 1) 내의 RVD는 밑줄로 나타냄)에 나타내었다.
RVD 및 이들의 상응하는 표적 뉴클레오티드의 예는 하기 표 1A에 나타내었다 (PCT 공보번호 WO2010/079430호를 또한 참조함).
<표 1A>
Figure 112019009675393-pat00001
*은 RVD의 제2 위치에서의 아미노산 잔기의 결핍에 상응하는, 반복 서열 내의 갭을 나타냄.
다른 RVD 및 이들의 상응하는 표적 뉴클레오티드는 하기 표 1B에 나타내었다.
<표 1B>
Figure 112019009675393-pat00002
서열-특이적 DNA 절단을 갖는 것이 요구되는 경우, 예를 들어 서열-특이적 TALEN은, (a) 내인성 염색체 뉴클레오티드 서열에 조합으로 결합하는 복수의 DNA 결합 반복 도메인 및 (b) 제2 뉴클레오티드 서열에서 이중 가닥 절단을 생성시키는 엔도뉴클레아제를 함유하도록 고안될 수 있다. 이러한 서열-특이적 DNA 절단은 본원에 기재된 바와 같이 상동성 재조합을 향상시키는 데 유용할 수 있다. TALEN에 대한 다른 용도에는, 예를 들어 바이러스에 대한 치료제로서의 용도가 포함된다. TALEN은 특정 바이러스 서열을 표적화하여 바이러스 DNA를 절단하고 독성을 감소시키거나 없애도록 조작될 수 있다.
본원에 제공된 물질 및 방법은, 표적화된 방식으로 특정 유전자의 서열을 변형시키는 데 사용될 수 있다. 하나의 유전자는, 조작된 TAL 이펙터가 표적화될 수 있는 복수의 서열을 함유할 수 있다. 그러나, 본원에 기재된 바와 같이, 특정 표적 서열은 보다 효과적으로 표적화될 수 있다. 예를 들어, 실시예 9에 제시된 바와 같이, 특정한 특징을 갖는 서열은 TAL 이펙터에 의해 보다 효과적으로 표적화될 수 있다. 따라서, 본원에 제공된 방법은 특정 기준을 충족하는 표적 서열을 확인하는 것을 포함할 수 있다. 이들은, i) 15개 염기의 최소 길이 및 5'에서 3'로의 방향 (5' 말단의 바로 앞 부위에 T)을 갖고; ii) 제1 (5') 위치에 T를 갖지 않거나 또는 제2 위치에 A를 갖지 않고; iii) 마지막 (3') 위치에서 T로 종결되고 마지막 위치 옆에 G를 갖지 않고; iv) 0 내지 63% A, 11 내지 63% C, 0 내지 25% G 및 2 내지 42% T의 염기 조성물을 갖는 서열을 포함한다.
본원에 기재된 TALEN은 일반적으로 이량체로서 작용하기 때문에, 본원에 제공된 방법의 특정 실시양태는 세포에서 제1 게놈 뉴클레오티드 서열 및 제2 게놈 뉴클레오티드 서열을 확인하는 것을 포함할 수 있으며, 여기서 제1 및 제2 뉴클레오티드 서열은 상기 기재된 기준 중 하나 이상을 충족시키고 15-18 bp로 분리된다. 특정 경우에서, 하나의 TALEN 폴리펩티드는 각각의 뉴클레오티드 서열에 결합할 수 있고, TALEN에 함유된 엔도뉴클레아제는 15-18 bp 스페이서 내에서 절단될 수 있다.
본 발명은 목적하는 핵산이 도입된 유전적으로 변형된 동물의 발생 방법을 또한 제공한다. 이러한 방법은 핵산을 도입하는 것이 바람직한 내인성 염색체 표적 DNA 서열을 함유하는 세포를 수득하고, 세포를 TALEN으로 도입하여 내인성 염색체 표적 DNA 서열 내에 이중 가닥 절단을 발생시키고, 내인성 염색체 표적 DNA의 적어도 일부와 상동성인 서열을 함유하는 외인성 핵산을 세포로 도입하고 (여기서, 도입은 외인성 핵산과 내인성 염색체 표적 DNA 사이에서 발생하는 상동성 재조합을 가능하게 하는 조건하에 수행함), 상동성 재조합이 발생한 1차 세포로부터 동물을 발생시키는 것을 포함할 수 있다. 상동성 핵산은, 예를 들어 상동성 재조합 후 유전자에 지장을 주는 뉴클레오티드 서열, 상동성 재조합 후 유전자를 대체하는 뉴클레오티드 서열, 상동성 재조합 후 점 돌연변이를 유전자로 도입시키는 뉴클레오티드 서열, 또는 상동성 재조합 후 조절 부위를 도입하는 뉴클레오티드 서열을 포함할 수 있다.
본원에 제공된 방법은 또한 목적하는 핵산이 도입된 유전적으로 변형된 식물을 발생시키기 위해 사용될 수 있다. 이러한 방법은 핵산을 도입하는 것이 바람직한 내인성 표적 DNA 서열을 함유하는 식물 세포를 수득하고, 내인성 표적 DNA 서열 내에 이중 가닥 절단을 발생시키는 TALEN을 도입하고, 내인성 표적 DNA의 적어도 일부와 상동성인 서열을 함유하는 외인성 핵산을 식물 세포로 도입하고 (여기서, 도입은 외인성 핵산과 내인성 염색체 표적 DNA 사이에서 발생하는 상동성 재조합을 가능하게 하는 조건하에 수행함), 상동성 재조합이 발생한 식물 세포로부터 식물을 발생시키는 것을 포함할 수 있다.
본원에서 제공된 TALEN-촉진 상동성 재조합 방법에 의해 발생된 세포 중의 DNA는 이러한 방법을 겪지 않은 세포와 비교해서 변형되고, 변형된 DNA를 함유하는 세포는 "유전적으로 변형된"으로 지칭한다. 그러나, 이러한 변형이 상동성 재조합을 포함하고 트랜스진의 불규칙 통합을 포함하지 않기 때문에, 이러한 세포를 함유하는 유기체는 조절 목적에 고려되는 GMO가 아님을 유념하길 바란다. 따라서, 본원에 기재된 TALEN-촉진 방법을 사용하여 유전적 변형을 발생시키는 것은, 예를 들어 이들과 연관된 시간 및 비용을 회피할 수 있음과 함께 표준 조절 절차라는 점에서 유리할 것이다.
본원에 제공된 바와 같이, 표적화된 유전자 재조합의 다른 방법은 선택된 DNA 표적 서열로 표적화된 TALEN을 코딩하는 핵산 분자를 세포 (예를 들어, 식물 세포, 곤충 세포, 경골 어류 세포, 또는 동물 세포)로 도입하고, 세포 내에서 TALEN의 발현을 유도하고, 돌연변이 (예를 들어, 유전 물질의 결실, 유전 물질의 삽입, 유전 물질의 결실 및 삽입 모두)를 나타내는 선택된 DNA 표적 서열의 재조합 세포를 확인하는 것을 포함할 수 있다. 공여자 DNA를 또한 세포로 도입할 수 있다.
특정 실시양태에서, 단량체 TALEN을 사용할 수 있다. 본원에 기재된 TALEN은 전형적으로 두 TAL 이펙터 도메인이 각각 FokI 제한 효소의 촉매 도메인에 융합되도록 스페이서를 사용하여 이연 (bipartite) 인식 부위에 걸쳐 이량체로서 기능하고, 각각의 생성된 TALEN을 위한 DNA 인식 부위는 스페이서 서열로 분리되고, 각각의 TALEN 단량체가 인식 부위로 결합되는 것은 FokI의 이량체화를 가능하게 하고 스페이서 내에 이중 가닥 파괴를 생성한다 (예를 들어, 문헌 [Moscou and Bogdanove (2009) Science 326:1501] 참조). 그러나, 단일 TAL 이펙터가 이량체화가 기능하는 것을 요구하지 않는 뉴클레아제에 융합되도록 단량체 TALEN이 또한 제작될 수 있다. 예를 들어, 하나의 이러한 뉴클레아제는 두 단량체가 단일 폴리펩티드로서 발현되는 FokI의 단일-사슬 변이체이다 (문헌 [Minczuk et al. (2008) Nucleic Acids Res. 36:3926-3938]). 다른 자연 발생 또는 조작된 단량체 뉴클레아제가 또한 이러한 역할로서 작용할 수 있다. 단량체 TALEN을 위해 사용되는 DNA 인식 도메인은 자연 발생 TAL 이펙터로부터 유래될 수 있다. 별법으로, DNA 인식 도메인은 특이적 DNA 표적을 인식하기 위해 조작될 수 있다. 조작된 단일-사슬 TALEN은 이들이 단지 하나의 조작된 DNA 인식 도메인을 필요로 하기 때문에 구조체에 용이할 수 있으며 알맞게 사용될 수 있다.
특정 실시양태에서, 이량체 DNA 서열-특이적 뉴클레아제는 상이한 두 DNA 결합 도메인 (예를 들어, 하나의 TAL 이펙터 결합 도메인 및 분자의 또다른 유형으로부터의 하나의 결합 도메인)을 사용하여 발생할 수 있다. 상기 기재된 바와 같이, 본원에 기재된 TALEN은 전형적으로 스페이서를 사용하여 이연 인식 부위에 걸쳐 이량체로서 작용한다. 이러한 뉴클레아제 구조는 또한 예를 들어 하나의 TALEN 단량체 및 하나의 징크 핑거 뉴클레아제 단량체로부터 발생된 표적-특이적 뉴클레아제를 위해 사용될 수 있다. 이러한 경우에, TALEN 및 징크 핑거 뉴클레아제 단량체를 위한 DNA 인식 부위는 적절한 길이의 스페이서로 분리될 수 있다. 두 단량체의 결합은 FokI의 이량체화를 가능하게 하고 스페이서 서열 내에 이중 가닥 파괴를 생성할 수 있다. 징크 핑거 이외의 DNA 결합 도메인, 예컨대 호메오도메인, myb 반복물 또는 류신 지퍼가 또한 FokI에 융합되고 TALEN 단량체와의 파트너로 작용하여 기능적 뉴클레아제를 생성할 수 있다.
특정 실시양태에서, TAL 이펙터는 다른 단백질 도메인 (예를 들어, 비-뉴클레아제 단백질 도메인)을 특정 뉴클레오티드 서열로 표적화하는데 사용될 수 있다. 예를 들어, TAL 이펙터는 제한 없이 DNA 상호작용 효소 (예를 들어, 메틸라제, 토포이소머라제, 인터그라제, 트랜스포사제, 또는 리가제), 전사 활성화제 또는 리프레서로부터의 단백질 도메인, 또는 다른 단백질, 예컨대 히스톤과 상호작용하거나 이를 변형시키는 단백질에 연결될 수 있다. 이러한 TAL 이펙터 융합의 적용에는, 예를 들어 후생적 조절 요소의 생성 또는 변형, DNA에서의 부위-특이적 삽입, 결실, 또는 회복의 생성, 유전자 발현 제어, 및 염색질 구조의 변형이 포함된다.
특정 실시양태에서, 표적 서열의 스페이서는 TALEN 특이성 및 활성을 조정하도록 변화시키거나 선택할 수 있다. 스페이서를 사용하여 이연 인식 부위에 걸쳐 이량체로서 작용하는 TALEN에 대해 본원에 나타낸 결과는 TALEN이 스페이서 길이의 범위에 걸쳐 작용할 수 있고, TALEN의 활성이 스페이서 길이에 따라 다양함을 나타낸다. 예를 들어, 하기 실시예 6을 참조하기 바란다. 스페이서 길이의 융통성은 스페이서 길이가 높은 특이성으로 특정 서열 (예를 들어, 게놈에서)을 표적화하기위해 선택될 수 있음을 나타낸다. 또한, 여러 스페이서 길이에서 관찰되는 활성의 변화는 스페이서 길이가 목적하는 수준의 TALEN 활성을 달성하도록 선택될 수 있음을 나타낸다.
특정 실시양태에서, TALEN 활성은 DNA 결합 도메인(들) 내의 반복물의 수 및 조성을 변화시킴으로써 조정할 수 있다. 본원의 실시예 7에 기재된 바와 같이, 예를 들어 PthXoI-기초 TALEN은 AvrBs3-기초 TALEN 보다 큰 활성을 나타낸다. PthXoI는 이의 반복물의 수 및 RVD 조성 모두에서 AvrBs3와 상이하다. 또한, 이들 단백질을 위한 자연 발생 DNA 인식 부위는 문헌 [Moscou and Bogdanove] (상기)에 의해 기재된 TAL 이펙터 DNA 암호를 기초로 예시된 각각의 인식 서열로부터의 이들의 일탈과 상이하다. 또한, 길이가 동일하나 (12 RVD) 이들의 활성이 상이한 여러 RVD 조성의 몇몇 맞춤형 TALEN, 및 13 RVD 맞춤형 TALEN은 12 RVD 맞춤형 TALEN 보다 높은 활성을 갖는다. 따라서, TALEN은 중요한 DNA 서열을 인식하도록 조작될 수 있을 뿐만 아니라, (1) 반복물의 수는 활성을 조정하기 위해 변화시킬 수 있고, (2) 여러 결합 부위는 활성의 여러 수준을 달성하도록 선택될 수 있으며, (3) RVD의 조성 및 (암호에 따른) 표적 부위에 대한 이들의 적합도를 TALEN 활성을 조정하기 위해 변화시킬 수 있다.
TALEN이 이종이량체 형태로 존재하는 경우, 예를 들어 TAL 이펙터 도메인 및 FokI 뉴클레아제 촉매 도메인 각각을 포함하는 상이한 두 단량체와 함께, RVD는 두 TAL 이펙터 도메인 각각에서 등수로 발견될 수 있거나, 또는 각각의 도메인은 여러 많은 RVD를 나타낼 수 있다. 예를 들어, 22 RVD 전체가 특정 이종이량체 TALEN에서 DNA를 결합시키기 위해 사용되는 경우, 11 반복물은 두 TAL 이펙터 도메인 각각에서 발견될 수 있으며; 별법으로, 10 반복물은 두 TAL 이펙터 도메인 중 하나에서 발견될 수 있고 12는 나머지에서 발견될 수 있다. 본 발명은 또한 단량체로서 작용하는 DNA 변형 효소 도메인이 있는 TALEN을 포함한다. 이러한 경우에, 모든 RVD는 단량체 효소에 융합하는 단일 TAL 이펙터 도메인에서 발견될 수 있다. 이러한 경우, 효과적인 결합을 가지기 위해, RVD의 수는 상응하는 이량체 TALEN에서 발견될 RVD의 총 수에 상응해야 한다. 예를 들어, 상이한 두 TAL 이펙터 도메인 (이량체 TALEN의 경우)상에 10 반복물을 갖는 대신에, 하나는 단일 TAL 이펙터 도메인 (단량체 TALEN의 경우)에서 20 반복물을 가질 것이다.
본 발명의 추가의 측면에서, 이량체 또는 단량체 TALEN 내의 반복물의 총 수는 14 이상이다. 본 발명의 또다른 추가의 측면에서, 이량체 또는 단량체 TALEN 내의 반복물의 총 수는 20 이상이다. 본 발명의 또다른 추가의 측면에서, 이량체 또는 단량체 TALEN 내의 반복물의 총 수는 24 이상이다. 본 발명의 또다른 추가의 측면에서, 이량체 또는 단량체 TALEN 내의 반복물의 총 수는 30 이상이다.
본 특허 출원은 또한 표적 DNA를 위한 향상된 표적화 능력을 갖는 TAL 이펙터 단백질의 발생 방법을 제공한다. 방법은, 예를 들어 각각의 반복물이 표적 DNA에서 염기쌍의 인식을 결정하는 RVD를 함유하는 다수의 DNA 결합 반복물이 있는 DNA 결합 도메인을 갖는 TAL 이펙터를 코딩하는 핵산을 발생시키는 것을 포함할 수 있으며, 여기서 각각의 DNA 결합 반복물은 표적 DNA에서 하나의 염기쌍의 인식을 담당한다. 하기 실시예 12에 기재된 바와 같이, 결합 부위의 위치 -1에서 T에 대한 요건의 완화는 조작된 TAL 이펙터 단백질의 표적화 능력을 증진시킬 수 있다. 따라서, TAL 이펙터를 코딩하는 핵산의 발생은 A, C, 또는 G에 대해 특이성을 갖는 변이체 제0 DNA 결합 반복 서열을 코딩하는 핵산을 도입하는 것을 포함하여 결합 부위의 위치 -1에서 T에 대한 요건을 제거할 수 있다.
또한, 본원에서 방법은 표적 DNA에 대한 향상된 표적화 능력을 갖는 TAL 이펙터의 발생을 제공한다. 이러한 방법은 각각의 반복물이 표적 DNA에서 염기쌍의 인식을 결정하는 RVD를 함유하는 다수의 DNA 결합 반복물을 갖는 DNA 결합 도메인을 포함하는 TAL 이펙터를 코딩하는 핵산의 발생을 포함할 수 있다. 하기 실시예 12에 기재된 바와 같이, NN (G를 인식하는 가장 일반적인 RVD)의 특이성은 일반적으로 약한 것으로 나타나고 문맥에서 다양할 수 있으나, 특정 RVD는 G에 대해 향상된 특이성을 가질 수 있다. 따라서, 본원에 제공된 방법은 G에 대해 보다 확고한 특이성을 가질 수 있는 교호 RVD를 사용하는 것을 포함할 수 있다. 예를 들어, RN, R*, NG, NH, KN, K*, NA, NT, DN, D*, NL, NM, EN, E*, NV, NC, QN, Q*, NR, NP, HN, H*, NK, NY, SN, S*, ND, NW, TN, T*, NE, NF, YN, Y*, 및 NQ로 이루어진 군으로부터 선택된 1종 이상의 RVD를 사용할 수 있으며, 여기서 별표 (*)는 RVD의 제2 위치에서의 간극을 나타낸다.
제조품
본 발명은, 예를 들어 TALEN을 코딩하는 핵산 분자, TALEN 폴리펩티드, 이러한 핵산 분자 또는 폴리펩티드를 함유하는 조성물, 또는 TAL 엔도뉴클레아제 조작된 세포주를 함유하는 제조품을 또한 제공한다. 이러한 물품은, 예를 들어 연구 도구로서, 또는 치료상으로 사용될 수 있다.
특정 실시양태에서, 제조품은 본원에 제공된 방법을 사용하여 발생된 식물로부터의 종자를 포함할 수 있다. 종자는 당업계에 공지된 수단을 사용하여 컨디셔닝될 수 있고 당업계에 널리 공지된 포장재를 사용하여 포장되어 제조품을 제조할 수 있다. 종자의 포장은 라벨, 예를 들어 포장재를 안전하게 하는 택 또는 라벨, 포장재상에 인쇄된 라벨 또는 포장재 내에 삽입된 라벨을 가질 수 있다. 라벨은 포장 내에 함유된 종자가 유전적으로 변형된 식물의 작물을 생성할 수 있음을 나타낼 수 있고, 변형되지 않은 식물에 비해 유전적 변형에 의해 변경된 특징을 기재할 수 있다.
다른 정의
- 폴리펩티드 서열 중 아미노산 잔기 또는 서브유닛은 하나의 문자 코드에 따라 본원에 명시되는데, 예를 들어 Q는 Gln 또는 글루타민 잔기를 의미하고, R은 Arg 또는 아르기닌 잔기를 의미하고 D는 Asp 또는 아스파르트산 잔기를 의미한다.
- 아미노산 치환은 하나의 아미노산 잔기를 또다른 것으로 대체하는 것을 의미하며, 예를 들어 펩티드 서열에서 아르기닌 잔기를 글루타민 잔기로 대체하는 것이 아미노산 치환이다.
- 뉴클레오티드는 다음과 같이 명시된다: 하나의 문자 코드가 뉴클레오시드의 염기를 명시하는데 사용된다: a는 아데닌이고, t는 티민이고, c는 시토신이고, g는 구아닌이다. 변성된 뉴클레오티드에 대해, r은 g 또는 a (퓨린 뉴클레오티드)를 나타내고, k는 g 또는 t를 나타내고, s는 g 또는 c를 나타내고, w는 a 또는 t를 나타내고, m은 a 또는 c를 나타내고, y는 t 또는 c (피리미딘 뉴클레오티드)를 나타내고, d는 g, a, 또는 t를 나타내고, v는 g, a 또는 c를 나타내고, b는 g, t 또는 c를 나타내고, h는 a, t 또는 c를 나타내고, n은 g, a, t 또는 c를 나타낸다.
- 용어 "DNA 변형 효소"는 DNA 변형 (절단, 공유 상호작용, 수-매개 상호작용...)의 수준이 어떻든지 세포의 유전 물질을 변형시킬 수 있는 임의의 단백질을 지칭한다. DNA-상호작용 단백질 (예를 들어, 메틸라제, 토포이소머라제, 인터그라제, 트랜스포사제, 또는 리가제), 전사 활성화제 또는 리프레서, 다른 단백질, 예컨대 히스톤, 및 뉴클레아제는 "DNA 변형 효소"의 의미에 포함되도록 의도된다. TAL 이펙터-DNA 변형 효소에 포함되는 경우, DNA 변형 효소는 DNA 변형 효소 도메인으로서 지칭된다.
- 용어 "뉴클레아제"는 엑소뉴클레아제 및 엔도뉴클레아제를 포함하도록 의도된다.
- 용어 "엔도뉴클레아제"는 DNA 또는 RNA 분자, 바람직하게는 DNA 분자 내의 핵산 사이의 결합의 가수분해 (절단)를 촉매화할 수 있는 임의의 야생형 또는 변이체 효소를 지칭한다. 엔도뉴클레아제의 비제한적인 예에는 유형 II 제한 엔도뉴클레아제, 예컨대 FokI, HhaI, HindIII, NotI, BbvCI, EcoRI, BglI, 및 AlwI가 포함된다. 전형적으로 약 12-45 염기쌍 (bp), 보다 바람직하게는 14-45 bp 길이의 폴리뉴클레오티드 인식 부위를 갖는 경우 엔도뉴클레아제는 거의 절단되지 않은 엔도뉴클레아제를 또한 포함한다. 거의 절단되지 않은 엔도뉴클레아제는 규정된 좌위에서 DNA 이중 가닥 파괴 (DSB)를 유도함으로써 HR을 유의하게 증가시킨다 (문헌 [Rouet, Smih et al. 1994; Rouet, Smih et al. 1994; Choulika, Perrin et al. 1995; Pingoud and Silva 2007]). 거의 절단되지 않은 엔도뉴클레아제는 예를 들어 자동 유도 엔도뉴클레아제 (문헌 [Paques and Duchateau 2007]), 제한 효소, 예컨대 FokI의 촉매 도메인을 사용하여 조작된 징크-핑거 도메인의 융합으로부터 생성된 상상의 징크-핑거 뉴클레아제 (ZFN) (문헌 [Porteus and Carroll 2005]) 또는 화학적 엔도뉴클레아제 (문헌 [Eisenschmidt, Lanio et al. 2005; Arimondo, Thomas et al. 2006; Simon, Cannata et al. 2008])일 수 있다. 화학적 엔도뉴클레아제에서, 화학적 또는 펩티드 절단기는 핵산의 중합체 또는 특이적 표적 서열을 인식하는 또다른 DNA와 접합하여, 이에 따라 특이적 서열에 절단 활성을 표적화한다. 화학적 엔도뉴클레아제는 특이적 DNA 서열에 결합하는 것으로 공지된 오르토페난트롤린, DNA 절단 분자, 및 삼중나선-형성 올리고뉴클레오티드 (TFO)의 접합과 유사한 합성 뉴클레아제를 또한 포함한다 (문헌 [Kalish and Glazer 2005]). 이러한 화학적 엔도뉴클레아제는 본 발명에 따른 용어 "엔도뉴클레아제"에 포함된다. 이러한 엔도뉴클레아제의 예에는 I- Sce I, I- Chu I, I- Cre I, I- Csm I, PI- Sce I, PI-Tli I, PI- Mtu I, I- Ceu I, I- Sce II, I- Sce III, HO, PI- Civ I, PI- Ctr I, PI-Aae I, PI- Bsu I, PI- Dha I, PI- Dra I, PI- Mav I, PI- Mch I, PI- Mfu I, PI- Mfl I, PI-Mga I, PI- Mgo I, PI-Min I, PI- Mka I, PI- Mle I, PI- Mma I, PI- Msh I, PI- Msm I, PI- Mth I, PI- Mtu I, PI- Mxe I, PI- Npu I, PI- Pfu I, PI- Rma I, PI- Spb I, PI-Ssp I, PI- Fac I, PI- Mja I, PI- Pho I, PI-Tag I, PI-Thy I, PI- Tko I, PI- Tsp I, I-MsoI이 포함된다.
본 발명에 따른 엔도뉴클레아제는 전사 활성화제-유사 (TAL) 이펙터 엔도뉴클레아제 (TALEN)의 부분일 수 있다.
- "TALEN"은 전사 활성화제-유사 (TAL) 이펙터 결합 도메인 및 엔도뉴클레아제 도메인을 포함하는 단백질을 의도하며, 여기서 두 도메인의 융합은 "단량체 TALEN"을 초래한다. 특정 단량체 TALEN은 그 자체로 기능적일 수 있고 다른 것들은 또다른 단량체 TALEN과의 이량체화를 필요로 한다. 두 단량체 TALEN이 동일한 경우 이량체화는 동종이량체 TALEN을 초래하거나, 또는 단량체 TALEN이 상이한 경우 이종이량체 TALEN을 초래할 수 있다. 예를 들어 두 단량체 TALEN의 RVD 수가 상이한 경우 및/또는 1종 이상의 RVD의 함량 (즉, 아미노산 서열)이 상이한 경우 이들은 상이하다. "TAL 이펙터-DNA 변형 효소"는 전사 활성화제-유사 이펙터 결합 도메인 및 DNA-변형 효소 도메인을 포함하는 단백질을 의도한다.
"변이체"는 "변이체" 단백질, 즉 자연에서 자연적으로 존재하지 않고 유전자 조작 또는 불규칙 돌연변이생성에 의해 수득되는 단백질, 즉 조작된 단백질을 의도한다. 이러한 변이체 단백질은 예를 들어 야생형의 자연적으로 발생하는 단백질의 아미노산 서열 중 1종 이상의 잔기를 상이한 아미노산으로 치환함으로써 수득될 수 있다. 상기 치환(들)은 예를 들어 부위-지정된 돌연변이생성 및/또는 불규칙 돌연변이생성에 의해 도입될 수 있다.
"세포" 또는 "세포들"은 임의의 살아있는 원핵생물 또는 진핵생물 세포, 시험관내 배양을 위한 이들 유기체로부터 유래된 세포주, 동물 또는 식물 기원 1차 세포를 의도한다.
"1차 세포" 또는 "1차 세포들"은 살아있는 조직 (즉, 생검 물질)으로부터 직접 취한 세포 및 매우 적은 개체수 배가 (doubling)를 겪은 시험관내 성장을 위해 설정된 세포를 의도하고, 따라서 연속 발암성 또는 인공적으로 불멸하게 한 세포주에 비해 이들로부터 유래된 조직의 주요 기능적 성분 및 특징이 보다 대표적이다. 따라서 이들 세포는 이들이 지칭하는 생체내 상태에 대해 보다 가치있는 모델을 나타낸다.
- "상동성"은 또다른 것과 충분한 동일성을 가져서 서열 사이에 상동성 재조합을 초래하는 서열, 보다 바람직하게는 95% 이상, 바람직하게는 97%, 보다 바람직하게는 99%의 동일성을 갖는 서열을 의도한다.
- "동일성"은 2개의 핵산 분자 또는 폴리펩티드 사이의 서열 동일성을 가리킨다. 비교 목적으로 배열할 수 있는 각 서열에서의 위치를 비교하여 동일성을 결정할 수 있다. 비교된 서열 중 한 위치가 동일한 염기로 점유되는 경우, 그 분자는 그 위치에서 동일하다. 핵산 또는 아미노산 서열 사이의 유사성 또는 동일성의 정도는 핵산 서열에 의해 공유되는 위치에서의 동일하거나 또는 매칭되는 뉴클레오티드의 수의 함수이다. 2개의 서열 사이의 동일성을 계산하기 위해서 다양한 정렬 알고리즘 및/또는 프로그램 (GCG 서열 분석 패키지의 일부로서 이용가능한 FASTA 또는 BLAST (위스콘신 대학, 미국 와이오밍주 매디슨 소재)를 포함함)을 사용할 수 있고, 예를 들어 디폴트 설정으로 사용할 수 있다.
- "돌연변이"는 폴리뉴클레오티드 (cDNA, 유전자) 또는 폴리펩티드 서열 중 하나 이상의 뉴클레오티드/아미노산의 치환, 결실, 삽입을 의미한다. 상기 돌연변이는 유전자의 코딩 서열 또는 그의 조절 서열에 영향을 미칠 수 있다. 또한, 게놈 서열의 구조 또는 코딩된 mRNA의 구조/안정성에 영향을 미칠 수 있다.
- "유전자"는 특이적 단백질 또는 단백질의 절편을 코딩하는 염색체를 따라 선형 방식으로 배열된 DNA의 절편으로 구성되는 유전의 기본 단위를 의미한다. 유전자는 전형적으로 프로모터, 5' 비번역 영역, 하나 이상의 코딩 서열 (엑손), 임의로는 인트론, 3' 비번역 영역을 포함한다. 유전자는 종결자, 개선제 및/또는 사일렌서 (silencer)를 추가로 포함할 수 있다.
- 용어 "관심 유전자"는 공지되거나 또는 추정되는 유전자 생성물을 코딩하는 임의의 뉴클레오티드 서열을 가리킨다.
- 본원에 사용된 용어 "좌위"는 염색체 상 DNA 서열 (예를 들어, 유전자)의 특이적 물리적 위치이다. 용어 "좌위"는 보통 염색체 상 표적 서열의 특이적 물리적 위치를 가리킨다.
- "융합 단백질"은 별개 단백질을 고유하게 코딩하는 2개 이상의 유전자를 연결하는 것에 있는 당업계에 잘 공지된 과정의 결과를 의미하고, 상기 "융합 유전자"의 번역은 고유 단백질 각각으로부터 유래된 기능적 특성을 갖는 단일 폴리펩티드로 귀결된다.
- "촉매 도메인"은 상기 효소의 활성 부위를 함유하는 효소의 단백질 도메인 또는 모듈을 의미하고; 활성 부위는 기재의 촉매 작용이 일어나는 상기 효소의 일부를 의미한다. 효소뿐만 아니라 그의 촉매 도메인은 이들이 촉매하는 반응에 따라 분류되고 명명된다. 효소 위원회 번호 (EC 번호)는 이들이 촉매하는 화학 반응에 기초한, 효소에 대한 수적 분류 제도이다 (월드 와이드 웹; chem.qmul.ac.uk/iubmb/enzyme/). 본 발명의 범위에서, 임의의 촉매 도메인은 파트너로서 사용될 수 있고, TAL 이펙터 도메인에 융합되어 TAL 이펙터-DNA 변형 효소로 귀결되는 키메라 융합 단백질을 발생시킬 수 있다. 이러한 촉매 도메인의 비제한적 예는 MmeI, EsaSSII, CstMI, NucA, EndA 에쉐리히아 콜라이 (Escherichia coli), NucM, EndA 스트렙토코커스 뉴모니아 (Streptococcus pneumonia), SNase 스타필로코커스 아우레우스 (Staphylococcus aureus), SNase 스타필로코서스 하이쿠스 (Staphylococcus hyicus), SNase 시겔라 플렉스네리 (shigella flexneri), 바실러스 수브틸리스 (Bacillus subtilis) yncB, 엔도데옥시리보뉴클레아제I 장내박테리아 파지 T7 (EndodeoxyribonucleaseI Enterobacteria phage T7), EndoG 보빈 (bovine), ttSmr DNA 미스매치 수선 단백질 mutS, 메트나제 (Metnase)의 절단 도메인일 수 있다.
본 발명의 프랙티스는, 다르게 명시되지 않는 한, 당업계의 범위에 포함되는 세포생물학, 세포 배양, 분자생물학, 트랜스제닉 생물학, 미생물학, 재조합 DNA 및 면역학의 통상의 기술을 이용할 것이다. 이러한 기술들은 문헌에 자세하게 설명되어 있다. 예를 들어, 문헌 [Current Protocols in Molecular Biology (Ausubel, 2000, Wiley and son Inc, Library of Congress, USA)]; [Molecular Cloning: A Laboratory Manual, Third Edition, (Sambrook et al, 2001, Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press)]; [Oligonucleotide Synthesis (M. J. Gait ed., 1984)]; 미국 특허 제4,683,195호; [Nucleic Acid Hybridization (Harries and Higgins eds. 1984)]; [Transcription and Translation (Hames and Higgins eds. 1984)]; [Culture of Animal Cells (Freshney, Alan R. Liss, Inc., 1987)]; [Immobilized Cells and Enzymes (IRL Press, 1986); [Perbal, A Practical Guide to Molecular Cloning (1984)]; [the series, Methods in Enzymology (Abelson and Simon, eds.-in-chief, Academic Press, Inc., New York), 구체적으로 Vols.154 및 155 (Wu et al. eds.) and Vol. 185, "Gene Expression Technolog" (Goeddel, ed.)]; [Gene Transfer Vectors For Mammalian Cells (Miller and Calos eds., 1987, Cold Spring Harbor Laboratory)]; [Immunochemical Methods in Cell and Molecular Biology (Mayer and Walker, eds., Academic Press, London, 1987)]; [Handbook of Experimental Immunology, Vols. I-IV (Weir and Blackwell, eds., 1986)]; 및 [Manipulating the Mouse Embryo, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1986)]을 참조한다.
본 발명의 상기 적힌 기재는 임의의 당업자가 동일한 것을 제조하고 사용할 수 있도록 하는 제조 및 사용의 방식 및 과정을 제공하고, 이것은 특히 원래의 기재의 일부를 구성하는 부가된 청구범위의 주제를 위해서 제공된다.
상기 사용된 어구 "~로 이루어진 군으로부터 선택된", "~로부터 선택된" 등은 명시된 재료의 혼합물도 포함한다.
수치 한정 또는 범위가 본원에 언급된 경우, 단점 (endpoint)이 포함된다. 또한, 수치 한정 및 범위 내의 모든 값 및 하위범위는 명시적으로 기재된 것과 같이 구체적으로 포함된다.
상기 기재는 당업자가 본 발명을 제조하고 사용할 수 있도록 제시되고, 특정 적용 및 그의 요건의 맥락에서 제공된다. 바람직한 실시양태에 대한 다양한 변형은 당업자들에게 용이하게 명백할 것이고 본원에 정의된 일반적인 원칙은 본 발명의 취지 및 범위에서 벗어나지 않고 기타 실시양태 및 적용범위에 적용될 수 있다. 따라서, 본 발명은 제시된 실시양태에 제한되는 것이 아니라 본원에 개시된 원칙 및 특징과 일치하는 가장 넓은 범위에 부합될 것이다.
본 발명을 일반적으로 기재하였고, 설명의 목적으로만 본원에 제공된 일부 특이적 실시예를 참조하여 추가로 해석될 수 있으며, 본 발명은 다르게 명시되지 않는 한 청구범위에 기재된 본 발명의 범위를 제한하지 않는 하기 실시예에 추가로 기재되어 있다.
실시예
실시예 1 - 암호는 TAL 이펙터-DNA 인식을 지배한다
TAL 표적 부위 중 RVD와 인접 뉴클레오티드 사이에 1 대 1 선형 상관관계가 존재하는지 여부를 결정하기 위해서, 10개의 TAL 이펙터 각각에 대해 공지된 표적 유전자의 예상된 프로모터 영역 (즉, 주석이 있는 번역 개시 부위 바로 직전 1,000 bp)을 RVD-뉴클레오티드 회합 중 엔트로피 (무질서도)를 최소화하는 정렬에 대한 TAL 이펙터 RVD 서열로 스캔하였다. 엔트로피를 정량화하기 위해서 하기 식을 사용하였고, 여기서 R은 이펙터에 대한 RVD 세트이고, D는 4개의 뉴클레오티드 (A, C, G, T)의 세트이고, fij는 i번째 RVD가 j번째 뉴클레오티드와 회합하는 관찰된 주기를 나타낸다.
Figure 112019009675393-pat00003
다중 저 엔트로피 부위가 각각의 프로모터에 존재하였다. 그러나, 이펙터 AvrBs3에 대해, 단지 하나만 활성화에 충분하고 필요한 것으로 앞서 확인된 54 bp upa20 프로모터 단편으로 매핑하였고, 이것은 AvrBs3에 의해 직접적으로 활성화되는 유전자에 공통적인 UPA 박스와 일치하였다 ([Kay et al.(상기 문헌)]). 또한, 이펙터 PthXo1 및 AvrXa27에 대해, 단지 하나의 부위만 그의 각각의 표적의 활성화된 대립유전자 및 비-활성화된 대립유전자인 Os8N3Xa27 사이의 다형성과 각각 중첩되었다. 상기 3개 부위에서의 정렬을 가로질러, RVD-뉴클레오티드 회합은 일관되어 있었고, 따라서 나머지 정렬을 이들 회합을 기준으로 선택하여 TAL 이펙터-표적 쌍 당 정확히 한 부위로 귀결되었다 (도 1b 및 표 2). 각각의 부위는 T로 시작하였다 (도 1d).
RVD-뉴클레오티드 회합에 의해 부여되는 특이성을 평가하기 위해서, 10개의 최소 엔트로피 TAL 이펙터-표적 부위 정렬을 가로질러 관찰된 모든 RVD-뉴클레오티드 회합의 빈도에 기초하여 가중 행렬을 우선 생성하였다 (도 1b). 이후, 가중 행렬을 사용하여 벼에서 각각 불필요하지 않은 유전자 모델, 벼 병원체 산토모나스 오리자에 (Xanthomonas oryzae)의 5개의 TAL 이펙터 (AvrXa27, PthXo1, PthXo6, PthXo7 및 Tal1c)에 대한 최고의 매치를 위해서 오리자 사티바 속 자포니카 cv. 니폰베어 (Oryza sativa spp. japonica cv. Nipponbare; Osa1, Release 6.0, rice.plantbiology.msu.edu)의 프로모터 영역, 번역 개시에 선행하는 1,000 bp를 스캔하였다. AvrXa27의 경우, Xa27의 서열 상류 (GenBank 접근 번호 AY986492)가 포함되었다. 상기 상류 서열은 니폰베어 중 존재하지 않았다. 관찰된 회합 빈도는 90%에 편중되었고, 나머지 10%는 모든 가능한 회합의 빈도에 동등하게 분배되었다. 도 1b에서 RVD-뉴클레오티드 회합 빈도로부터 유래된 빈도 스코어의 음의 log로 취해진 가중 행렬 스코어 (y 축)를 사용하여 정렬의 순위를 매겼다. 따라서, 스코어가 낮을수록, 매치는 더 양호하였다. PthXo1, PthXo6, PthXo7 및 Tal1c의 경우, 실험적으로 식별된 표적 유전자는 최고 또는 거의 최고의 매치였다. 더 양호한 매치는 T에 의해 선행되지 않았거나, 표적을 식별하기 위해서 사용된 마이크로검정 상에 나타나지 않았거나, 또는 인트론 및 EST 증거가 없었다. 역 상보체 프로모터 서열을 스캔하여 공지된 표적에 대해 전방향 부위보다 양호하지 않은 스코어링 (scoring) 정렬을 산출하였다. 상기 결과는 TAL 이펙터가 양성 가닥에 결합하는 것을 시사하지 않았으나, 이들이 양성 가닥에 대해 전방향에서 기능하는 것을 나타냈다. 5번째 이펙터, AvrXa27의 공지된 표적은 질환 내성 유전자 Xa27 ([Gu et al. (상기 문헌)])이었다. 상기 매치에 대한 더욱 좋지 못한 등급 (5,368)은 보정되거나, 또는 최근의 차선의 숙주 적응을 반영한 것일 수 있다. 더 양호한 스코어링 부위는 발병에 대한 AvrXa27에 의해 표적화된 유전자를 포함하는 것으로 예상되었다.
가중 행렬을 다시 사용하여, 40개의 추가의 X. 오리자에 TAL 이펙터가 있는 모든 벼 프로모터를 스캔하고 공공 마이크로검정 데이타 (PLEXdb.org, 접근 번호 OS3)에 기초하여 감염 중 하류 유전자가 활성화되는 최고의 정렬을 유지함으로써 10개의 추가 정렬을 수득하였다 (표 3). 초기 설정과 함께, T는 각 부위에 선행하였고, 역-가닥 부위는 더 양호하게 스코어링되지 않았다. 총 20개 정렬의 RVD-뉴클레오티드 회합 빈도를 도 1c에 제시하였다. 이들은 놀랍게도 단순한 암호를 구성하였다.
20개의 TAL 이펙터 뉴클레오티드 정렬의 확장된 세트 중 RVD-뉴클레오티드 빈도를 사용하여 새로운 가중 행렬을 생성하였고, 컴퓨터 스크립트를 파이톤 (Python) v2.5 (www.python.org)로 기재하였다. 상기 스크립트를 사용하여 관찰된 RVD-뉴클레오티드 회합 대 비관찰된 RVD-뉴클레오티드 회합에 대한 사용자-정의가능한 가중 인자가 있는 특정 TAL 이펙터에 매치하기 위한 임의의 컬렉션의 DNA 서열을 스캔할 수 있었다. 문헌 [Moscou and Bogdanove (상기 문헌)]을 참조한다.
암호에 일부 동의성이 존재하였다. 강한 회합은 대부분의 결합 친화성의 이유가 되는 앵커 (anchor)를 나타낼 수 있고, 약한 회합은 유연성의 척도를 제공한다. 그 대신에, 이웃 효과 (neighbor effect)가 연관될 수 있다. RVD 상에 양 측면에 조건화된 모든 RVD의 뉴클레오티드 회합 빈도를 측정하고 이들을 총 관찰된 빈도와 비교함으로써, 즉 이웃 RVD에 따라 RVD-뉴클레오티드 쌍형성을 좌측 또는 우측으로 구분하고, 구분된 각 쌍의 상대적인 빈도를 해당 쌍에 대한 전체 빈도와 비교함으로써 후자의 가능성을 조사하였다. 이웃에 의해 구분된 RVD-뉴클레오티드 회합의 빈도는 총 관찰된 빈도로부터 유의하게 벗어나지 않았으며, 이는 회합이 전후 관계와 무관하다는 것을 시사하였다.
20개의 표적 부위를 플랭킹하는 서열은 -1에서 T를 제외하고 보호된 뉴클레오티드를 드러내지 않았으나, 이들은 상기 부위에 이어서 C가 풍부하였고, 전체적으로 G가 부족하였다 (도 1d). 거의 예외 없이, 부위는 주석이 있는 전사 개시의 60 bp 상류 내에서 시작하였고, 번역 개시에 87 bp보다 더 가까이 존재하지 않았다 (표 2 및 표 3). RVD/뉴클레오티드 회합을 지배하는 추가의 규칙을 실시예 4 및 5에 기재하였다.
상기 결과로, 게놈 중 TAL 이펙터 표적의 예측 및 표적의 제작이 이제 가능해졌다. 부위를 예측하는 능력은 질환에서 중요한 숙주 유전자를 식별하는 것을 촉진시킬 것이다. 표적을 제작하는 능력은 보호된 또는 다중 TAL 이펙터에 반응성인 오래가는 내성 유전자를 설계하기 위한 장래성을 갖는다. 본원에 기재된 것과 같이, 임의적인 유전자 활성화에 대한 TAL 이펙터의 맞춤화 또는 DNA 변형에 대한 융합된 단백질의 표적화도 또한 가능하다.
<표 2>
Figure 112019009675393-pat00004
<표 3>
Figure 112019009675393-pat00005
실시예 2 - TALEN은 효모에서 기능할 수 있다
플라스미드 제작: BamHI를 갖는 플라스미드로부터 소화시켜 TAL 이펙터의 단백질 코딩 서열, AvrBs3을 수득하였다. 반복 도메인을 주로 코딩하는 DNA 단편을 SphI로 절단하였다. AvrBs3의 아미노산 서열을 GENBANK 접근 번호 P14727 및 서열 12 (도 3), 및 접근 번호 X16130 및 서열 13 하의 핵산 서열 (도 4) 하에 발견할 수 있었다. 도 4에서, BamHI 및 SphI 부위는 굵게 밑줄로 표시하였다. AvrBs3 BamHI 및 SphI 단편을 FokI 뉴클레아제 도메인을 코딩하는 서열에 인접한 뉴클레아제 발현 벡터 pDW1789_TAL로 클로닝하였다 (도 5). AvrBs3 표적 부위를 표적 리포터 플라스미드로 클로닝하기 위해서, 그 사이에 18 bp 스페이서 서열이 있는, 반전된 방향으로 배열된 2개의 AvrBs3 인식 부위를 함유하고, 5' 및 3' 말단에 각각 BglII 및 SpeI 돌출부 (overhang)가 있는 2개의 상보적 DNA 올리고 (oligo)를 합성하였다. 6, 9, 12 및 15 bp 스페이서 길이가 있는 인식 부위를 갖는 기타 리포터 플라스미드를 제조하였다. 어닐링된 DNA 올리고를 BglII 및 SpeI와 소화되는 리포터 플라스미드, pCP5로 클로닝하였다 (도 6).
효모 검정: 표적 리포터 플라스미드를 효모 균주 YPH499 (MAT a 균주)로 형질전환하고, 형질전환주를 트립토판이 결여된 완전 합성 배지 (SC-W)에 대해 선택하였다. TALEN 발현 플라스미드를 YPH500 (MAT α 균주)으로 형질전환하고; 형질전환주를 히스티딘이 결여된 SC 배지 (SC-H) 상에 평판 배양하였다. 표적 리포터 플라스미드를 갖는 효모 집락 및 TALEN 발현 플라스미드를 갖는 집락을 각각 액체 SC-W 및 SC-H 배지 중에서 30℃에서 밤새 배양하였다. 배양균을 동일한 OD600으로 조정하고, 각각의 200 ㎕를 200 ㎕ YPD 배지에 혼합 첨가하였다. 혼합물을 30℃에서 4시간 동안 인큐베이션하여 효모 균주 중 2종을 교배시켰다. 혼합된 배양균을 스핀다운(spin down)시키고 5 ml SC-W-H 매질 중에서 30℃에서 밤새 또는 OD600이 0.5 내지 1의 범위에 도달할 때까지 재현탁시켰다. 세포를 수확하고 양적 β-갈락토시다아제 검정을 기재된 바와 같이 실행하였다 (문헌 [Townsend et al. (2009) Nature 459:442-445]).
결과: TAL-FokI 융합은 TAL DNA 인식 도메인 및 비특이적 FokI DNA 절단 도메인으로 이루어진 부위-특이적 뉴클레아제이다. TAL DNA 인식 도메인은 상이한 DNA 서열을 결합시키도록 조작할 수 있다. 본원의 실시예 1에 기재된 바와 같이, DNA 결합 도메인의 신규한 부류인 TAL 이펙터에 대한 DNA 인식 특이성이 해독되었다. 특히, TAL 이펙터의 DNA 결합 도메인은 특이적 DNA 서열을 인식하고 결합할 수 있는 다양한 수의 34개 아미노산의 탠덤(tandem) 반복물을 함유한다. 반복물의 아미노산 서열은 반복물의 12 및 13 위치에서 2개의 인접한 고도의 가변 잔기를 제외하고는 보존된다. 상기 위치는 함께 하나의 반복물에서 하나의 뉴클레오티드까지, DNA 결합 부위에서의 개별 뉴클레오티드를 명시한다. TALEN의 구조는 도 7에 도시되어 있다. TALEN은 각 단량체가, FokI 엔도뉴클레아제로부터의 비특이적 절단 도메인에 융합되는 조작된 TAL DNA 인식 반복물로 구성되는 이량체로 작용한다. DNA 인식 반복물은 관심 게놈 내의 표적 DNA 서열을 결합시키도록 조작할 수 있다. TAL 뉴클레아제 단량체는 스페이서 서열에 의해 분리되는 2개의 DNA 반쪽 부위 중 하나에 결합한다. 이러한 스페이싱은 FokI 단량체가 이량체화되고 반쪽 부위 사이의 스페이서 서열 내에 이중 가닥 DNA 파손 (DSB)을 생성하는 것을 가능케 한다.
TAL 이펙터 DNA 인식 도메인의 잠재성을 탐구하기 위해, FokI 뉴클레아제 도메인과 융합될 때 천연 TAL 이펙터가 뉴클레아제로서 작용할 수 있는지를 결정하기 위한 실험을 수행하였다. TAL 뉴클레아제 발현 구조체 및 표적 리포터 구조체를 사용하여 효모 기재 검정을 수행하였다. 도 5에 도시된 바와 같이, 뉴클레아제 발현 구조체의 주쇄는 효모 TEF1 프로모터의 제어하에 N-말단 핵 위치 신호 (NLS) 및 FokI 뉴클레아제 도메인을 함유한다. 몇몇의 제한 부위는 FokI 뉴클레아제 도메인 및 NLS 모티프 사이에 위치하여 다양한 TAL 이펙터의 클로닝을 용이하게 한다. 표적 리포터 구조체는 도 6에 도시된 바와 같이 코딩 서열이 125 bp 복제된 분열된 lacZ 리포터 유전자를 갖는다. 복제는 TAL DNA 결합 도메인에 의해 인식되는 (2개의 반쪽 부위 및 스페이서 서열로 구성되는) 표적 서열 및 URA3 유전자를 플랭킹한다. TALEN이 표적 부위에서 DNA 이중 가닥 파손 (DSB)을 결합시키고 생성하는 경우, 효모 내의 이러한 파손은 주로 단일 가닥 어닐링을 통해 복제된 lacZ 서열 사이의 상동성 재조합에 의해 복구된다 (문헌 [Haber (1995) Bioessays 17:609]). 재조합은 작용성 lacZ 유전자의 재구성 및 URA3의 손실 (5-플루오로오로트산 내성을 부여함)을 일으킨다. lacZ 효소 활성을 측정하여 TALEN의 상대적인 절단 활성을 측정하였다.
본 연구에서, 서열 31 (도 8)에 나열된 중심 뉴클레아제 반복 영역을 갖는, 천연 TAL 이펙터인 AvrBs3을 뉴클레아제 발현 벡터로 클로닝하고, 18 bp 스페이서 서열을 갖는 AvrBs3 표적 부위 (역 배향으로 배열된 2개의 결합 부위)를 표적 리포터 벡터로 클로닝하였다. 도 9에 도시되고 상기 기재된 계획을 사용하여 효모 검정을 실행하였다. 결과는 AvrBs3 뉴클레아제 플라스미드 및 표적 리포터 플라스미드 둘 다를 이용하여 형질전환된 효모 세포로부터의 lacZ 활성이 표적 리포터 플라스미드만을 함유하는 효모 세포 대조군보다 유의하게 더 높음 (15.8배 더 높음)을 나타내었다 (도 10). 주로 반복 도메인을 코딩하는 SphI 단편만으로 제조된 뉴클레아제 융합물에 대한 활성이 관측되지 않았다. 이는 TALEN 활성에 있어 DNA 결합 도메인 이외의 서열이 요구됨을 나타내었다. 스페이서 길이가 6 및 9 bp인 리포터 플라스미드도 또한 활성을 나타내는데 실패하였으며, 이는 2개의 결합 부위 사이의 공간이 FokI를 이량체화시키는데 결정적임을 나타낸다. 이러한 데이터는 AvrBs3 TAL 뉴클레아제가 효모 내의 그의 동족 표적 서열을 절단하는 부위-특이적 뉴클레아제로서 작용할 수 있음을 나타낸다.
실시예 3 - 맞춤화된 TALEN을 위한 TAL 이펙터 반복물의 모듈식 조립
4개의 개별 TAL 이펙터 반복물 각각의 102개의 염기쌍에 상응하고, 각각 상이한 뉴클레오티드를 명시하는 상보적 올리고뉴클레오티드를, 개별적으로 또는 모든 순열 내의 2개 및 3개 반복물의 조합으로, 합성하고, 어닐링하고, 고카피(high copy) 박테리아 클로닝 벡터로 클로닝하여 표준 제한 소화 및 라이게이션 기법을 사용하여 4개의 단일, 16개의 이중 및 64개의 삼중 반복 모듈을 수득한다 (예를 들어, 도 11에 도시됨). 원하는 TAL 이펙터 코딩 서열을 특징적인 마지막 반쪽 반복물을 제외한 중심 반복 영역이 결여된 tal1c 유전자의 절단형을 함유하는 게이트웨이-레디 고카피 박테리아 클로닝 벡터(Gateway-ready high copy bacterial cloning vector)에 적절한 모듈을 순차적으로 도입함으로써 조립한다. 예를 들어, 18개의 반복 TAL 이펙터 코딩 서열은 5개의 삼중 모듈 및 1개의 이중 모듈을 절단형 tal1c 벡터에 순차적으로 도입함으로써 조립할 수 있다.
실시예 4 - TAL 이펙터 반복물의 모듈식 조립을 위한 시스템
맞춤형 TAL 이펙터 코딩 유전자를 생성하기 위한 플라스미드 및 방법을 개발하였다. TAL 이펙터의 기능적 특이성은 본원에 기재된 바와 같이 반복물 내의 RVD에 의해 결정되었고; 반복물 및 다른 경우에 단백질 내의 다른 다형체는 드물고 기능적 특이성에 있어 중요하지 않다. 따라서, 임의의 TAL 이펙터 유전자의 반복 영역을 원하는 RVD를 함유하는 반복물로 대체하여 맞춤형 TAL 이펙터 유전자를 생성할 수 있다. RVD 외부의 반복 서열은 컨센서스(consensus) 서열에 매치된다 (하기 참조). DNA 단편 코딩 TAL 이펙터 반복물은 1개, 2개 또는 3개의 반복물을 코딩하는 모듈로 순차적으로 조립되고, 모듈은 TAL 이펙터 유전자로 클로닝되며, 이로부터 원래의 반복물이 제거된다. 각 코딩된 반복물은, 마지막 (반쪽) 반복물을 제외하곤, 서열 LTPAQVVAIASXXGGKQALETVQRLLPVLCQDHG (서열 18; 도 12a)를 갖는다. 마지막 (반쪽) 반복물은 서열 LTPAQVVAIASXXGGKQALES (서열 20; 도 12b)를 갖는다. 두 서열 모두에서, "XX"는 RVD의 위치를 나타낸다. 모듈식 반복물에서 사용되는 RVD는 NI, HD, NN 및 NG였으며, 이는 각각 A, C, G 및 T에의 결합을 명시한다. 하기 기재된 실험에서, 그의 반복물이 제거된 산토모나스 오리자에 병원형 오리지콜라(Xanthomonas oryzae pv. oryzicola) 균주 BLS256의 tal1c 유전자를 맞춤형 TAL 이펙터 유전자 제작용 "주쇄"로 사용하였다.
본원에 기재된 방법은 5가지 성분을 포함하였다: (1) 단일 반복 스타터 플라스미드의 생성; (2) 단일 반복 모듈 플라스미드의 생성; (3) 다중 반복 모듈의 생성; (4) 완전한 일련의 1개, 2개 및 3개의 반복 모듈 플라스미드의 생성; 및 (5) 맞춤형 TAL 이펙터 코딩 서열의 조립.
단일 반복 스타터 플라스미드를 생성하기 위해, tal1c 유전자를 MscI로 소화시키고 다시 라이게이션하여 제1 반복물의 제1 부분 및 마지막 절단형 반복물의 마지막 부분을 제외한 전체 반복 영역을 제거하여, pCS487로 지정된 플라스미드를 얻었다 (도 13). 생성된 유전자는 RVD NI를 코딩하였고, 대부분의 TAL 이펙터 유전자와 마찬가지로, 반복 영역을 플랭킹하는 2개의 SphI 부위를 함유하였다. 상기 유전자는 XhoI 부위를 함유하지 않았다.
이어서, 번역 잠재성 돌연변이를 pCS487에 도입하여 특유의 PspXI 부위를 생성하였으며, 이는 코돈 19 및 20에 집중된 특유의 XhoI 부위를 포함한다. 상기 돌연변이는 도 14에 묘사하였으며, 이는 코돈 18 내지 21에 대한 고유 및 변경된 뉴클레오티드 서열을 나타내고 (각각 서열 21 및 서열 23), 이들 둘 다는 아미노산 서열 ALES (서열 22)를 코딩한다. 생성된 플라스미드는 pCS489로 지정하였다.
추가 돌연변이생성에 의해, RVD HD, NN 및 NG의 3개의 추가 구조체를 생성하여 각각 pCS490, pCS491 및 pCS492로 지정된 플라스미드를 생성하였다. 변형된 반복 영역을 포함하는 SphI 단편은 pCS489, pCS490, pCS491 및 pCS492에서 pCS488로 지정된 카나마이신 내성 플라스미드로 전달하였으며 (도 15), 이는 게이트웨이 진입 벡터 pENTR-D (인비트로젠, 미국 캘리포니아주 칼스배드 소재) 내의 반복 영역이 없는 tal1c의 N- 및 C-말단 부분만을 코딩한다. 상기 전달은 각각 pCS493 (도 16), pCS494, pCS495 및 pCS496으로 지정된 단일 반복 스타터 플라스미드를 생성하였다. 절단형 반복물 내의 PspXI/XhoI 부위는 상기 플라스미드 내에 특유하게 남아있었다. pCS488 내의 TAL 이펙터 유전자 및 이들의 유도체 각각에 앞서 각각 원핵생물 및 진핵생물 내에서의 효율적인 번역을 위한 샤인-달가르노(Shine-Dalgarno) 및 코작(Kozak) 서열이 선행되었다.
이어서, 단일 반복 모듈 플라스미드를 제작하였다. 4개의 선택된 RVD (NI, HD, NN 및 NG) 각각에 대하여 1개의 플라스미드를 생성하였다. 각 플라스미드는 PspXI 부위에 라이게이션되는 경우 XhoI 부위를 재구성하지만 PspXI 부위는 재구성하지 않는 5' 상용성 점착 말단 및 XhoI 및 PspXI 부위를 둘 다 재구성하는 3' 상용성 점착 말단을 갖는다. 플라스미드는 돌출부가 있는 어닐링된 합성 상보적 올리고뉴클레오티드 (도 17a)를 각각 p청스크립트 SK-의 PspXI/XhoI 부위로 클로닝하여 생성하였으며, 이는 각각 pCS502 (도 17b), pCS503, pCS504 및 pCS505로 지정된 플라스미드를 생성하였다. 각 플라스미드는 특유의 재구성된 PspXI 부위에서 단일 반복 모듈의 3' 말단에서의 추가 반복물의 도입, 또는 재구성된 XhoI 부위를 사용한 반복 모듈의 절제가 가능하였다.
NI, HD, NN 및 NG 각각에 대한 추가의 단일 반복 모듈을 생성하였다. 각각은 PspXI 부위에 라이게이션되는 경우 PspXI 또는 XhoI 부위를 재구성하지 않는 5' 상용성 점착 말단, XhoI 및 PspXI 부위를 둘 다 재구성하는 3' 상용성 점착 말단, 및 내부 MscI 부위를 파괴하는 번역 잠재성 뉴클레오티드 치환체를 갖는다 (도 18a). 상기 모듈은 돌출부가 있는 합성 상보적 올리고뉴클레오티드를 어닐링하여 생성하였다. 상기 추가 단일 반복 모듈 중 임의의 것의 단일 반복 모듈 플라스미드의 특유의 PspXI/XhoI 부위 (pCS502, pCS503, pCS504 또는 pCS505)로의 라이게이트는 5' 접합부에서 신규한 XhoI 부위를 생성하지는 않았으나, 특유의 3' PspXI/XhoI 부위를 복구하여, PspXI로의 절단에 의한 더 많은 추가의 반복물의 도입을 위해 생성된 플라스미드를 선형화할 수 있었다. 상기 과정의 반복은 다중 반복물을 함유하는 모듈을 생성하였다 (도 18b). 또한, 각 전체 다중 반복 모듈을 XhoI를 사용하여 절제할 수 있었다. MscI 부위가 추가 단일 반복 모듈 내에서 파괴되었기 때문에, 초기 반복물 내의 MscI 부위는 특유하게 남아있었고, 다중 반복 모듈의 후속 서브클로닝 시 배향을 점검하기에 유용하였다.
추가의 단일 반복 모듈을 단일 반복 모듈 플라스미드로 반복적으로 클로닝하여, 단일 반복 모듈 플라스미드와 함께, pCS502 내지 pCS585로 지정된 총 84개의 플라스미드에 대해 완전한 일련의 모든 가능한 1개, 2개 및 3개의 반복 모듈을 생성하였다 (도 19). 3개 초과의 반복물 (예를 들어, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 10개 초과의 반복물)을 함유하는 모듈을 동일한 방식으로 생성하였다.
이어서, 반복물의 임의의 서열을 tal1c "주쇄"로 조립하여 맞춤형 TAL 이펙터 유전자를 생성하기 위한 방법을 고안하였다. 상기 방법은
(1) 원하는 제1 반복물을 갖는 단일 반복 스타터 플라스미드 (각각 RVD NI, HD, NN 또는 NG를 코딩하는 pCS493, pCS494, pCS495 또는 pCS495)를 선택하는 단계;
(2) 플라스미드를 PspXI로 선형화하는 단계;
(3) XhoI를 사용하여 적절한 모듈 플라스미드 (pCS502 내지 pCS585)로부터 다음 반복물(들)을 위한 모듈을 단리하는 단계;
(4) 라이게이션하는 단계;
(5) MscI로의 소화에 의해 배향을 점검하고 벡터 기재 프라이머를 사용하여 3' 말단에서부터 서열을 확인하는 단계; 및
(6) 모든 반복물이 조립될 때까지 단계 2 내지 5를 반복하는 단계
를 포함하였으며, 이는 또한 도 20에 묘사되어 있다.
실시예 5 - TALEN의 모듈식 조립을 위한 플라스미드의 라이브러리
본원에 기재된 (예를 들어, 도 20에 묘사된 단계를 사용한) TALEN 반복물의 조립은 증가하는 수의 반복물을 함유하는 무수한 중간 플라스미드를 생성한다. 상기 플라스미드의 각각은 TALEN의 모듈식 조립을 위한 플라스미드 (pMAT)의 라이브러리가 생성되도록 저장한다. 예를 들어, 도 21a 및 21b는 도시된 뉴클레오티드 서열을 표적으로 할 것인 TAL 엔도뉴클레아제의 제작 시 반복 모듈의 조립을 묘사한다. 도 21a에서, pCS519, pCS524, pCS537, pCS551, pCS583 및 pCS529로 지정된 플라스미드로부터의 반복 모듈을 pCS493으로 지정된 스타터 플라스미드 내의 서열에 순차적으로 첨가하여, pMAT55, pMAT56, pMAT57, pMAT58, pMAT59 및 pMAT60으로 지정된 플라스미드를 생성하였다. 도 21b에서, pCS530, pCS533, pCS522 및 pCS541로 지정된 플라스미드로부터의 반복 모듈을 pMAT1로 지정된 플라스미드의 서열 내에 순차적으로 첨가하여, pMAT61, pMAT62, pMAT63 및 pMAT64로 지정된 플라스미드를 생성하였다.
실시예 6 - 맞춤화된 TALEN의 생성 및 시험
실시예 4 및 5에 기재된 시스템을 사용하여, TAL DNA 인식 도메인을 사용하여 특정 DNA 표적을 인식하고 절단하는 TALEN을 생성하였다 (도 22a). TALEN 작용을 평가하기 위해, LacZ 활성이 DNA 절단의 지표로 기능하는 효모 검정을 적합하게 하였다 (상기 타운센드 등의 문헌). 상기 검정에서, 표적 플라스미드 및 TALEN 발현 플라스미드를 교배에 의해 동일한 세포 내에서 함께 결합시켰다. 표적 플라스미드는 코딩 서열의 125-bp 복제된 lacZ 리포터 유전자를 가진다. 복제는 주어진 TALEN에 의해 인식되는 표적 부위를 플랭킹한다. 이중 가닥 DNA 파손이 표적 부위에서 일어날 때, 이는 작용성 lacZ 유전자를 생성하는 복제된 서열 사이의 단일 가닥 어닐링을 통해 복구되며, 작용성 lacZ 유전자의 발현은 수량화할 수 있는 판독을 제공하는 표준 β-갈락토시다아제 검정을 사용하여 측정할 수 있다 (도 22a). 상기 검정은 NHEJ에 의해 염색체 돌연변이를 생성하거나 또는 고등 진핵생물에서의 유전자 편집을 위한 상동성 재조합을 자극하기 위한 ZFN의 능력의 양호한 예측 변수인 것으로 증명되었다 (상기 타운센드 등의 문헌; 및 문헌 [Zhang et al. (2010) Proc. Natl. Acad. Sci. USA 107:12028-12033]).
2개의 잘 특성화된 TAL 이펙터 - 후추 병원균 산토모나스 캄페스트리스 병원형 베시카토리아(Xanthomonas campestris pv. vesicatoria)로부터의 AvrBs3 및 쌀 병원균 엑스. 오리자에 병원형 오리자에(X. oryzae pv. oryzae)로부터의 PthXo1을 사용하였다 (문헌 [Bonas et al. (1989) Mol. Gen. Genet. 218:127-136]; 및 [Yang et al. (2006) Proc. Natl. Acad. Sci. USA 103:10503-10508]). AvrBs3의 아미노산 서열은 젠뱅크 수탁 번호 P14727 및 서열 12 하에서 (도 3), 및 핵산 서열은 수탁 번호 X16130 및 서열 13 하에서 (도 4) 찾을 수 있다. PthXo1의 아미노산 서열은 젠뱅크 수탁 번호 ACD58243 및 서열 31 (도 23) 하에서, 핵산 서열은 수탁 번호 CP000967, 유전자 ID 6305128, 및 서열 32 (도 24) 하에서 찾을 수 있다. 젠뱅크 수탁 번호 ACD58243 하의 PthXo1의 아미노산 서열은 출발 코돈의 주석오류로 인해 N-말단에서 절단된다. 완전한 서열은 도 23에 나타내었다.
AvrBs3 및 PthXo1 둘 다의 반복 도메인은 보존된 SphI 단편 내에 완전히 코딩된다 (도 4 및 24). TAL 이펙터 코딩 유전자도 또한 둘 다 반복 도메인을 위한 코딩 서열을 포함하는 BamHI 제한 단편 및 그 이전에 287개의 아미노산 및 그 이후에 231개의 아미노산을 갖는다 (도 4 및 24; 또한 도 22a 참조). BamHI 단편이 없는 것은 TAL 이펙터 전하 활성화 도메인이다. SphI 단편 및 BamHI 단편은 둘 다 뉴클레아제 발현 벡터 pFZ85 내에 존재하는 FokI를 코딩하는 DNA 단편으로 융합하였다 (도 25). AvrBs3 및 PthXo1에 의해 코딩된 FokI 뉴클레아제 및 BamHI 단편 사이의 융합 단백질은 도 26 및 27에 서열 33 및 34로 제공하였다.
절단하기 위해서 FokI 단량체는 이량체화되어야 하지만, 2개의 DNA 인식 부위 사이의 적절한 스페이서 길이가 불명확하였다. 아연 핑거 어레이가 4-7 아미노산 링커에 의해 FokI로부터 분리되는 ZFN의 경우, 2개의 인식 부위 사이의 전형적인 스페이서는 5-7 bp이다 (문헌 [Handel et al. (2009) Mol. Ther. 17:104-111]). 예를 들어, 235개의 아미노산이 본원에 사용되는 BamHI TALEN 구조체 내의 FokI로부터 반복 도메인을 분리하기 때문에, BamHI 및 SphI 구조체 둘 다에 대해 다양한 스페이서 길이 (6, 9, 12, 15 및 18 bp)를 사용하였다. 양성 대조군으로서, 쥐 전사 인자 Zif268로부터 유래된 DNA 결합 도메인을 갖는 잘 특성화된 아연 핑거 뉴클레아제 (문헌 [Porteus and Baltimore (2003) Science 300:763])를 사용하였다. 음성 대조군으로서, TAL 이펙터 도메인을 촉매 불활성 FokI 변이체에 융합하거나 비동족 DNA 표적에 대해 시험하였다.
밤새 배양한 200 ㎕ 중의 TALEN 발현 또는 표적 플라스미드를 함유하는 반수 세포 유형을 YPD 배지에서 30℃에서 교배하였다. 4시간 후, YPD 배지를 5 ml의 선택적 배치로 교체하고 밤새 30℃에서 인큐베이션하였다. 교배된 배양균을 용균시키고, ONPG 기질을 첨가하고, 96-웰 플레이트 판독기를 사용하여 415 nm에서 흡광도를 읽었다 (상기 타운센드 등의 문헌). β-갈락토시다아제 수준을 기질 절단 속도의 함수로서 계산하였다. 2개의 인식 부위를 분리하는 15 bp 스페이서를 갖는 표적 리포터 구조체에 대해 얻어진 결과는 도 22b에 도시하였다. 원칙적으로 반복 어레이를 코딩하는 SphI 단편으로부터 유도된 모든 뉴클레아제 발현 구조체는 활성을 나타내는데 실패하였으며, 이는 반복 어레이 내의 아미노산 서열에 더하여 일정 아미노산 서열이 작용에 요구됨을 나타낸다 (도 22b). 그러나, BamHI 단편으로부터 유래된 AvrBs3 및 PthXo1 TALEN 둘 다에 대해 왕성한 활성이 관측되었다 (도 22b). PthXo1 TALEN의 활성은 ZFN 양성 대조군의 활성에 가까웠다. 활성은 작용성 FokI 도메인을 필요로 하였고 주어진 TALEN에 의해 인식되는 DNA 표적에 대해 특이적이었다.
FokI를 가장 효율적으로 이량체화할 수 있는 스페이서 길이를 확인하기 위해, TAL 이펙터 결합 부위 사이의 다양한 거리 (12 및 30 bp 사이의 11개의 길이 변형)를 시험하도록 실험을 또한 수행하였다 (도 28a). 두 효소는 모두 2개의 최적의 스페이서 길이 - 15 bp에서 하나 및 21 bp (AvrBs3) 또는 24 bp (PthXo1)에서 다른 하나를 나타내었다. PthXo1의 경우, 13 bp 이상의 모든 시험된 스페이서 길이에 대해 활성이 관측되었다. AvrBs3의 경우에 일부 스페이서 길이는 활성을 나타내지 않았으나, 이는 스페이서 길이가 특정 TALEN에 있어 결정적임을 시사한다.
상기 실험에서는 스페이서 둘 중 한 측면에서 반대편에 위치한 2개의 동일한 인식 서열에 결합하는, 동종이량체 TALEN의 활성을 시험하였다. 이러한 회귀성 부위는 게놈 표적에서 자연적으로 잘 일어나지 않기 때문에, 실험은 TALEN이 이종이량체로서 기능할 수 있는지 여부를 시험하는 것으로 수행되었다. AvrBs3 및 PthXo1 인식 부위는 15 bp 스페이서 둘 중 한 측면 상에서 헤드 투 테일(head to tail) 배열로 배치되었다. AvrBs3 및 PthXo1 TALEN 각각 및 Zif268의 이들의 각 표적 상에서의 활성이 대조군으로 측정되었다. 음성 대조군으로서, 이종이량체 부위에 대해 표적 부위 플라스미드만을 갖는 효모 배양은 LacZ 활성에 대해서 검정하였다. 이종이량체 TALEN의 결과 활성은 2개의 동종이량체 효소에 대해 관찰된 활성의 평균을 계산하였다 (도 28b).
반복 도메인이 TALEN을 임의의 염색체 서열에 표적화되도록 조립될 수 있는지 여부를 시험하기 위해서, 아라비돕시스로부터의 ZFN-ADH1 및 제브라피시(zebrafish)로부터의 그리드락(gridlock)과의 돌연변이생성에 대해 앞서 표적화된 2개의 유전자가 선택되었다 (문헌 [Foley et al. (2009) PLoS One 4:e4348; 및 Zhang et al., 상기 문헌] 참조). 5'T 만큼 앞서고, 문헌 [Moscou 및 Bogdanove (상기 문헌)]에 의해 밝혀진 TAL 이펙터 결합 부위의 조성과 유사한 뉴클레오티드 조성을 갖는 코딩 영역에서 12 내지 13 bp 서열에 대해 조사가 수행되었다. ADH1그리드락에서, 이러한 부위는 평균 7 내지 9 bp마다 발생하였다. ADH1에서 4개의 12 bp 부위가 (염색체 유전자 서열의 360, 408, 928 및 975 위치에서) 선택되고, 그리드락에서 1개의 13bp 부위가 (염색체 유전자 서열의 2356 위치에서; 도 29a) 선택되었다. 천연 TAL 이펙터로부터 가장 풍부한 RVD를 사용하여, TAL 이펙터 반복 도메인이 이들 표적을 인식하도록 제작하였다 (A에 대해서 NI, C에 대해서 HD, G에 대해서 NN 및 T에 대해서 NG). 맞춤형 TALEN을 제작하기 위해서, 이들 RVD를 갖는 반복물을 개별적으로 합성하여 실시예 4 및 5에 기재된 바와 같이 1, 2 또는 3개의 반복물의 모듈로 조립시켰다. 이들 모듈은 오리지널 반복물이 제거된 tal1c 유전자의 유도체 (문헌 [Moscou 및 Bogdanove, 상기 문헌] 참조)로 순차적으로 라이게이션되고, 이들 조작된 TAL 이펙터로부터의 BamHI 단편은 pFZ85에서 FokI의 촉매 도메인을 코딩하는 서열로 융합되었다 (도 25). 아라비돕시스로부터의 ADH1 및 제브라피시 그리드락 유전자에 표적화된 5개의 맞춤형 TALEN이 생성되었다.
이종이량체 TALEN이 자연 발생 DNA 표적에서 절단을 지시하도록 제작될 필요가 있는 것으로 인식되어 있음에도 불구하고, 생성된 맞춤형 TALEN을 동종이량체 TALEN으로서 효모 검정에서 시험하였다 (즉, 동일한 DNA 결합 부위는 16 내지 18 bp 스페이서의 둘 중 한 측면에서 역 배열로 2벌화됨). 스페이서 길이는 다음으로 이웃하는 (및 반대하는) 후보 부위의 3' 말단으로부터 15 bp 가장 가까운 거리를 기준으로 선택되었다. 16 bp 스페이서가 ADH1-360-12, ADH1-408-12r에, 18 bp 스페이서가 ADH1-928-12, ADH1-975-12r 및 그리드락-2356-13r에 사용되었다. 효모 검정은 상기한 바와 같이 수행하였다.
ADH1-360-12 및 그리드락-2356-13r TALEN에 대해서 강건한 뉴클레아제 활성이 관찰되었다 (도 29b). ADH1-928-12 TALEN은 보통의 활성 (그럼에도 음성 대조군을 상당히 뛰어넘음)을 가졌다. 양성 결과를 주는 각각의 TALEN에 대해서, 뉴클레아제 활성은 동족 표적에 대해 특이적이었다. 이들 결과는 신규한 기능적 TALEN이 맞춤화된 반복 도메인의 조립에 의해 생성될 수 있음을 나타낸다.
실시예 7 - 자연 발생 표적 및 TAL 이펙터 쌍은 뉴클레오티드 및 RVD 조성에서 전반적인 위치 치우침을 나타낸다
문헌 [Moscou 및 Bogdanove, 상기 문헌]에 의해 분석된 20개의 쌍을 이룬 표적 및 TAL 이펙터를 전반적인 조성 치우침, 및 뉴클레오티드 또는 RVD 빈도에 미치는 위치 영향에 대해서 평가하였다. (양성 가닥에서의) 부위는 일반적으로 A- 및 C-풍부, 및 G-부족으로 관찰되었다. A의 평균 백분율은 31 ± 16% (표준 편차 1)이었다. C의 평균 백분율은 37 ± 13%이었다. G의 평균 백분율은 9 ± 8%이고, T의 평균 백분율은 22 ± 10%이었다. 배열 길이는 변하기 때문에, 위치 영향의 분석은 각 말단에서 5개의 위치로 한정되었다. 두드러지게는, 표적 서열에서 치우침은 위치 1 및 3에서 A에 대해 및 T에 대항하여 명백하였고, 위치 N 및 가능하게는 2에서 T에 대해 명백하였다. G는 위치 N-1에서 특히 드물었다. 이러한 치우침은 이펙터에서 RVD를 매칭시킴으로써 반영되었고, 위치 1 및 3에서 NI가 가장 일반적이었고, 위치 1에서 NG는 없었으며, 위치 N에서 거의 항상 NG가 있었고, 위치 N-1에서는 NN이 드물게 있었다 (도 30).
실시예 8 - 맞춤형 TAL 이펙터 반복 어레이의 신속 조립 및 클로닝을 위한 방법 및 시약
골든 게이트(Golden Gate) 클로닝 방법 (문헌 [Engler et al. (2008), 상기 문헌; 및 Engler et al. (2009), 상기 문헌] 참조)에서는 인식 부위의 외부를 절단하여 다수의 DNA 단편의 순차배열된 라이게이션에 대해 동시에 맞춤형 돌출부를 생성하는 유형 IIS 제한 엔도뉴클레아제 (예를 들어 BsaI)의 능력을 이용하였다. 이 방법을 사용하여, 몇몇의 DNA 단편이 단일 반응에서 특이적 순서로 어레이로 융합되고, 바람직한 목적지 벡터로 클로닝될 수 있었다 (도 31).
맞춤형 TAL 이펙터 반복을 코딩하는 어레이를 조립하기 위한 방법 및 시약은 골든 게이트 시스템을 기초로 진행되었다. BsaI 부위가 TAL 이펙터 반복 코딩 서열의 둘 중 한 부위 상에 위치하는 경우, 절단에 의해 4-bp 돌출부가 측면에 위치하는 반복 단편이 유리되었다. 절단 부위가 서열-특이적이지 않기 때문에, 엇갈림(staggering)에 의해, 반복 클론은 순차배열된 상보적 돌출부 (점착 말단)로 유리되어, 다중-반복 어레이의 순차배열된 조립을 가능하게 할 수 있다.
58개 플라스미드의 라이브러리 (도 32a 및 32b)를 생성하여 최대 10개의 반복 단위의 동시 조립이 "서브어레이"되도록 하고, 후속하여 이들 서브어레이 1, 2 또는 3개의 동시 조립이 마지막 절단형 반복물과 함께 완전한 맞춤형 어레이가 되도록 하였다. 4개 단편의 엇갈림 세트 (셋트에서 각각의 단편은 4개의 가장 보편적인 RVD인, HD, NG, NI 및 NN 중 상이한 하나로 반복 모듈을 코딩함) 10개가 총 40개의 플라스미드에 대해 테트라시클린 내성 유전자를 운반하는 벡터로 합성되고 클로닝되었다. 20개 아미노산의 종말 절단형 TAL 이펙터 반복을 코딩한 단편 (각 단편은 4개의 가장 보편적인 RVD 중 상이한 하나를 코딩함) 4개를 더 스펙티노마이신 내성 유전자를 운반하는 상이한 벡터로 합성하고 클로닝하여, "최후 반복 플라스미드"로 지정된 플라스미드가 4개 더 수득되었다 (도 32a). 엇갈림 셋트에서 모든 단편들은 벡터에서 BsaI 부위가 측면에 위치함으로써, BsaI에 의한 절단으로 상이한 점착 말단을 갖는 단편을 유리시켜, 적절한 순서로 조립되도록 하였다; 즉, 예를 들어 반복 모듈 1에 대해 단편의 3' 말단에서의 돌출부는 반복 모듈 2에 대해 단편의 5' 말단에서의 돌출부에만 상보적이고, 반복 모듈 2의 3' 말단에서의 돌출부는 반복 모듈 3의 5' 말단에서의 돌출부에만 상보적이었다. 최후 반복 플라스미드에서의 단편은 상이한 유형 IIS 제한 엔도뉴클레아제인 Esp3I에 대한 부위가 측면에 위치하였다. 이하에서 기재하는 14개의 추가의 플라스미드는 목적지 벡터로서 제작되어 조립된 서브어레이를 수용하였다.
제1 목적지 벡터인 플라스미드 pFUS_A를 제작하여 21개 이하의 반복물 (마지막 절단형 반복물을 계산함)의 최종 어레이로 조립되는 10개의 반복물의 제1 서브어레이를 수용하였다. BsaI에 의한 절단이 제1 반복 모듈의 5' 말단에서의 돌출부에 상보적인 한 측면에서의 돌출부 및 10번째 반복 모듈의 3' 말단에서의 돌출부에 상보적인 다른 측면에서의 돌출부를 생성하도록 pFUS_A를 제작하였다. 이러한 최종 어레이로 조립되는 10개 이하의 반복물의 제2 서브어레이를 수용하기 위해, 목적지 벡터 플라스미드 pFUS_B1, pFUS_B2, pFUS_B3, pFUS_B4, pFUS_B5, pFUS_B6, pFUS_B7, pFUS_B8, pFUS_B9 및 pFUS_B10을 제작하여, BsaI에 의해 절단될 때 제1 반복 모듈의 5' 말단 및 상응하는 숫자의 위치에 대한 반복 모듈의 3' 말단에서의 돌출부에 각각 상보적인 돌출부를 가졌다 (예를 들어, 서브어레이의 3' 말단에 대한 pFUS_B6 돌출부는 위치 6에 대한 4개의 반복 모듈 단편의 돌출부에 매칭됨). 플라스미드 pFUS_A 및 pFUS_B 시리즈에서 클로닝된 어레이는 벡터에서 Esp3I 부위가 측면에 위치하고, Esp3I에 의해 절단되어 유리될 때, 어레이는 고유의 상보적 돌출부를 가져 이들이 마지막 절단형 반복물 단편과 함께 순차적으로 목적지 벡터 pTAL (반복 영역을 손실하는 TALEN을 코딩함)로 라이게이션되도록 하였다. Esp3I에 의한 절단이, 제1의 10개의 반복 서브어레이의 5' 말단에서의 돌출부에 상보적인 하나의 말단에서의 돌출부 및 마지막 절단형 반복물 단편의 3' 말단에서의 돌출부에 상보적인 다른 말단에서의 돌출부로 인해 올바른 위치에서 및 올바른 배열로 반복 어레이의 삽입을 가능하게 하도록, pTAL를 제작하였다 (도 33).
최종 2개의 목적 벡터 플라스미드인 pFUS_A30A 및 pFUS_A30B를 제작하여 22 내지 31개의 반복물의 최종 어레이로 조립되는 제1 및 제2의 10개의 반복 서브어레이를 수용하였다. 어레이가 pFUS_B 벡터로부터의 제3의 어레이 및 최후의 반복 플라스미드로부터의 마지막 절단형 반복물 단편과 함께 순차적으로 라이게이션되고, Esp3I에 의한 절단과 유사하게 pTAL로 유리되도록, pFUS_A30A 및 pFUS_A30B를 제작하여 Esp3I에 의한 절단에 의해 적절한 상보적 돌출부를 갖는 어레이가 유리되었다 (도 32).
모든 목적지 벡터는 유형 IIS 제한 엔도뉴클레아제 부위들 사이에서 클로닝된 LacZ 유전자를 가져, 재조합을 위한 블루-화이트 스크리닝을 가능하게 하였다. 암피실린 내성에 대한 유전자를 운반하는 pTAL를 제외하고는, 모든 목적지 벡터는 스펙티노마이신 내성에 대한 유전자를 운반하였다.
이들 시약을 사용하여 맞춤형 TAL 이펙터 반복 어레이를 신속하게 제작하기 위해, 이하의 방법이 확립되었다. 제1 단계에서, 10개 이하의 반복물의 필요한 서브어레이에 대한 적절한 개별 RVD 모듈 플라스미드를 하나의 튜브에서 적절한 목적지 벡터와 함께 혼합하였다. T4 DNA 라이게이즈 및 BsaI 엔도뉴클레아제를 첨가하고, 반응을 PCR 기계에서 37 ℃에서 5분 및 16 ℃에서 10분 (2개의 효소에 대해 각각 최적의 온도임)의 10 사이클 동안 인큐베이션하였다. 이어서 반응 혼합물을 PLASMID-SAFE™ 뉴클레아제로 처리하여, 생체 내 재조합에 의한 더 짧은 불완전 어레이의 클로닝을 방지하기 위해 모든 선형 dsDNA 단편을 가수분해한 다음, 혼합물을 사용하여 화학적으로 적격인 대장균 세포를 형질전환시켰다. 얻어진 재조합 플라스미드는 단리되었고, 올바른 구조체가 확인되었다. 이어서, 제2 단계에서, 제1 단계로부터 확인된 플라스미드를 적합한 최후 반복 플라스미드 및 pTAL와 함께 혼합하고, 절단 및 라이게이션 반응 사이클을 제1 단계에서와 같이 수행하였다. 최종적으로, 반응 생성물을 대장균에 도입하고, 전장 최종 어레이 구조체를 단리하고 확인하였다. 프로토콜은 일주일 내에 한 사람에 의해 완료될 수 있었다.
표 4A의 TALEN 85, 102 및 117 뿐 아니라 이하 실시예 14에 기재되는 TALEN HPRT-3254-17 및 HPRT-3286-20r에 대한 발현 구조체는 본 실시예에 기재된 방법 및 시약을 사용하여 제조하였다.
pTAL에 클로닝된 반복 어레이는 반복 영역이 측면에 있는 SphI 제한 엔도뉴클레아제 보존 부위를 사용하여 다른 TAL 이펙터 유전자 환경으로 쉽게 서브클로닝된다.
실시예 9 - 맞춤형 TALEN 데이터는 RVD 수와 활성 간의 "규칙" 및 상관관계에 대한 초기 지지를 나타낸다
실시예 6은 TALEN DNA 결합 도메인을 조작하여 고유의 DNA 서열을 인식할 수 있도록 수행된 실험을 기재하였다. 기재한 바와 같이, 이들 맞춤형 TALEN은 아라비돕시스 ADH1 및 제브라피시 그리드락 유전자에서의 부위를 인식하였다. 추가의 맞춤형 TAL 이펙터 DNA 결합 도메인을 조작하여, 이들 유전자에서의 부위뿐 아니라 아라비돕시스로부터의 TT4 유전자 및 제브라피시로부터의 텔로머라제에서의 부위도 인식하였다 (문헌 [Foley et al., 상기 문헌; 및 Zhang et al., 상기 문헌]참조). 이들 맞춤형 TALEN은 실시예 3, 4 및 8에 기재한 방법을 사용하여 제조하였다. 맞춤형 TALEN을 조작하는데 있어서, 관찰된 조성 및 위치 치우침이 디자인 원칙 또는 "규칙"으로 채택되었다. 먼저, 5'T 만큼 앞서고 길이가 적어도 15 bp인 코딩 영역에서 서열에 대해 조사를 수행하였고, 상기 언급된 평균값과 일치하는 뉴클레오티드 조성을 가졌다. 특이적으로, A 0 내지 63%, C 11 내지 63%, G 0 내지 25%, T 2 내지 42%인 이들 부위만이 선택되었다. 이러한 부위는 평균적으로 7 내지 9 bp 마다 발생하였다. 이어서 상기 기재한 관찰된 위치 치우침에 대해 확인된 부위가 선택되었다. 이러한 셋트로부터, 각 유전자에서 결합 부위 2쌍은 길이가 15 내지 19 bp이고, 15 내지 18 bp만큼 분리되어, 조작된 TALEN의 결합이 FokI이 이량체화되도록 하는 것으로 확인되었다. 모듈식 조립 방법 (실시예 3 및 4)은 부분 길이의 구조체를 생성하였다.
총 21개의 중간 및 전체 길이 TALEN이 16개의 뉴클레오티드 서열 (각각은 9개의 반복물 또는 그보다 긴 어레이를 가짐)을 표적화하도록 디자인되었다. 이들 TALEN의 아미노산 서열이 도 34a 내지 34u (서열 35 내지 55)에서 제공된다. 이들 21개의 TALEN을 실시예 2 및 6에 기재된 효모 검정을 사용하여 DNA를 절단하는 이들의 능력에 대해 시험하였다. 활성 데이터는 도 35에 나타내고, 표 4A에서 요약하였다.
중간의 부분 길이의 TALEN 중 일부는 뉴클레오티드 조성 및 말단 T에 대한 규칙을 위반하는 표적에 상응하였다. 표 4A는 각 TALEN에 대해, 길이, 이들 2가지 규칙에의 순응성, 및 ZFN268의 활성과 비교한 활성을 나타내었다. 결과는 RVD 어레이의 길이가 증가하면 얻어진 TALEN의 활성이 증가하는 일반적인 경향을 나타내었다. 이는, DNA 표적이 생체 내에서 인식될 수 있기 전에 필요한 최소의 수의 RVD가 존재한다는 것을 암시한다. 추가로, 규칙에의 순응성이 중요한 것으로 나타났다. 검출가능한 활성을 나타내지 않는 6개의 TALEN 중에서, 2개는 표적 조성 규칙을 위반하였고, 2개는 NG에서 종결되지 않았으며, 다른 것은 2개의 규칙 모두를 위반하였다 (하나는 2개의 규칙 모두를 준수하였음). ZFN268의 활성이 25% 미만인 8개의 TALEN 중 3개는 규칙 중 하나를 위반하였고, ZFN268 활성이 25 내지 50%인 4개의 TALEN 중 하나는 NG에서 종결되는 RVD 서열을 갖지 않았다. ZFN268 활성이 50% 이상인 TALEN이 모든 규칙을 준수하며, 동일한 길이의 TALEN에 대해서는 규칙을 위반하는 것들이 일반적으로 순종적 어레이보다 활성이 낮은 것으로 인식되었다. 길이에 있어서 (규칙을 위반하지 않는 중간체의 경우에도) 전체적인 경향에 부합하면, 상응하는 전장의 TALEN은 더 높은 활성을 가졌다 (표 4A 및 도 35). 동일한 표적 상에서 TALEN 길이 차이로 인한 스페이서의 변이는 이러한 관찰에 기여할 수 있으나, 일부 범위의 스페이서 길이는 용인된다 (문헌 [Christian et al., 상기 문헌] 참조).
데이터에 있어서 어느 정도의 복합성이 명백하다. 예를 들어, 활성은 동일한 길이의 순종적 TALEN 중에서도 다르며, 일부 짧은 어레이는 적당히 높은 활성을 갖고, 순종적인 일부 긴 어레이는 활성을 거의 또는 전혀 갖지 않는다 (표 4B). 그럼에도 불구하고, 결과는 1) 일반적으로 반복물의 수가 많을수록 높은 활성이 얻어지고, 2) 조성 및 위치 치우침 규칙에의 순응성은 활성에 있어 중요하다는 결론을 뒷받침한다. 따라서, 아래의 디자인 원칙이 유도된다.
·TAL 이펙터 결합 부위는 최소로 염기 15개의 길이가 되고, 5'에서부터 5' 말단에서의 부위에 바로 앞서 T를 갖는 3'으로 배열되도록 디자인된다.
·부위는 제1 (5') 위치에서 T를 갖거나 제2 위치에서 A를 가질 수 없다.
·부위는 T (3')에서 종결되어야 하며, 최후 위치 바로 옆에는 G를 가질 수 없다.
·부위의 염기 조성은 특정 범위 (평균±표준 편차 2) 내에 속해야 한다: A 0 내지 63%, C 11 내지 63%, G 0 내지 25% 및 T 2 내지 42%.
<표 4A>
Figure 112019009675393-pat00006
<표 4B>
Figure 112019009675393-pat00007
실시예 10 - 이종이량체성 TALEN 쌍은 효모 검정에서 그의 의도된 자연 발생 표적 서열을 절단한다
실시예 2, 6 및 9의 데이터는 맞춤형 TALEN이 신규 표적 DNA 서열을 인식하도록 조작될 수 있다는 것을 나타낸다. 동종이량체성 표적 부위를 인식한 개별 TALEN 단량체를 사용하여 맞춤형 TALEN에 대한 효모 활성 데이터를 모았다. 즉, TALEN의 표적 서열을 15-18 bp 스페이서의 어느 한 측면 상에 역방향으로 복제하였다. 그러나, 내인성 염색체 서열의 절단은 일반적으로 2종의 상이한 맞춤형 TALEN이 스페이서의 어느 한 측면 상의 2개의 상이한 서열을 인식하는 것을 요구하였다. 실시예 6에 기재된 바와 같이, 효모 검정에서 상응하는 키메라 표적 부위를 사용하여 AvrBs3 및 PthXo1 TALEN에 대해 함께 이러한 능력을 나타내었다. 본 발명자들은 2종의 상이한 맞춤형 TALEN이 자연 발생 DNA 서열을 인식하고 절단할 수 있는가를 시험하였다. 실시예 2에 기재된 효모 검정을 이용하여, 아라비돕시스 ADH1 유전자에서 2개의 상이한 표적 서열을 절단하도록 설계된 맞춤형 TALEN을 이들 표적에 대한 활성에 대해 검정하였다. 표적 부위 및 상응하는 TALEN의 DNA 서열을 도 36a에 나타내었다. TALEN의 아미노산 서열을 도 34에 제공하였다. 효모 검정에서 얻은 베타-갈락토시다제 활성을 도 36b에 나타낸 그래프에 플롯팅하였다. TALEN의 자연 발생 표적 서열에 대한 활성은 음성 대조보다 유의하게 높았으며, 이는 TALEN이 내인성 표적 DNA 서열을 인식하고 절단하도록 조작될 수 있다는 것을 나타내었다.
실시예 11 - TALEN은 아라비돕시스에서 천연 유전자를 절단하고, 비정밀 비상동 말단-연결에 의해 돌연변이를 도입한다
아라비돕시스 ADH1 유전자에서 표적 서열을 인식하도록 설계된 활성 TALEN 쌍 중 하나를 시험하여, 염색체 DNA에 결합하고 이를 절단하고 돌연변이화시킬 수 있는가를 결정하였다. 이러한 쌍 (pTALEN 69 및 74)을 포함하는 개별 ADH1 TALEN 각각을, 구성적(constitutive) 35S 프로모터의 제어하에 TALEN을 위치시키는 식물 발현 벡터 pFZ14로 클로닝하였다 (문헌 [Zhang et al., supra]). 그 후, 생성된 구조체를 전기천공에 의해 아라비돕시스 원형질체로 도입하였다. 48시간 후, 게놈 DNA를 단리하고 Tth111l로 소화시켰다. Tth111l 절단 부위는 2개의 TALEN 인식 부위 사이의 스페이서 서열에 위치하였다 (도 37a). TALEN에 의한 염색체 DNA의 절단은 비정밀 비상동 말단-연결 (NHEJ)에 의해 돌연변이를 도입할 것으로 예상되었으나, 이는 실패로 Tth111l에 의해 절단되는 결과를 가져왔다. 그 후, TALEN 인식 부위를 포함하는 375 bp 단편을 PCR 증폭시켰다. PCR 생성물을 Tth111l로 다시 소화시켜, TALEN-매개된 NHEJ에 의해 변형되지 않은 남아있는 게놈 DNA의 대부분을 제거하였다. 그 후, 소화 생성물을 아가로스 겔 상에서 실행시켰다. 절단되지 않은 PCR 생성물을 관찰하였고, 이러한 절단되지 않은 PCR 생성물은 내인성 표적 서열에서 뉴클레아제 활성 (이 경우에 TALEN 활성)의 특징이다 (문헌 [Zhang et al., supra]). 비절단 DNA를 클로닝하고 DNA 서열분석에 의해 분석하였다. 9종의 독립적 클론의 서열분석은 6종이 NHEJ에 의해 도입된 돌연변이를 함유한다는 것을 나타내었다 (도 37b). 그러므로, TALEN은 내인성 염색체 좌위를 절단하고, DNA 이중 가닥 파열 및 돌연변이를 도입하였다.
실시예 12 - 표적화 능력의 향상
TAL 이펙터 DNA 암호의 코어에서, 4종의 가장 흔한 RVD 각각은 회합 빈도에 기초하여 4종의 뉴클레오티드에 대한 명백한 1-대-1 특이성을 갖는다. 이는 HD, NG 및 NI에 대해 현저하게 그러하나, NN에 대해서는 덜 그러하다 (도 1c). NN은 G와는 가장 빈번하게, 그러나 A와는 거의 보통정도로, 및 C 또는 T와는 이따금 회합한다. 13 RVD 서열에서 4개의 위치에 NN을 갖는 무작위로 조립된 TAL 이펙터에 대해, 인공 표적 중 모든 상응하는 위치에 G를 갖는 것은 최고 활성을 제공하였다 (문헌 [Boch et al. (2009) Science 326:1509-1512]). 활성을 감소시켰으나 폐지시키지는 않았고, C 및 T는 검출가능한 활성을 제거하였다. 24 RVD 이펙터 PthXo1에 대한 결합 부위에서 가장 첫번째 위치에서 G가 C, T 또는 A로 치환된 경우, 활성의 극적 손실이 관찰되었으며, 이는 NN이다 (문헌 [Romer et al. (2010) New Phytol. 187:1048-1057]). 그러나, 이는 훨씬 더 짧은 AvrHah1 (14 RVD)이 A와 정렬된 NN으로 개시하고, 23 RVD 이펙터 PthXo6이 위치 4-6에 일렬로 3개의 NN (각각이 A와 정렬됨)을 갖으나, 이들 단백질 양자 모두는 고도로 활성이라는 관찰과는 대조적이었다 (문헌 [Schornack et al. (2008) New Phytol. 179:546-556]; 및 [Romer et al., supra] 참조). 그러므로 G에 대한 NN의 특이성은 일반적으로 약한 것으로 보이고, 정도는 다양할 수 있다.
TAL 이펙터 표적 부위 바로 앞의 티민의 관찰된 불변성은 여러 이펙터에 대한 요구사항이다 [문헌 [Boch et al., supra]; [Romer et al., supra]; 및 [Romer et al. (2009) Plant Physiol. 150:1697-1712]]. TAL 이펙터에서 반복 영역 바로 앞의 아미노산 서열 (고도로 보존됨) (도 38a)은 아미노산 서열 및 예측된 이차 구조 양자 모두에서 반복물과 유의한 유사성을 공유한다 (도 38b 및 문헌 [Bodganove et al. (2010) Curr. Opin. Plant Biol. 13:394-401]). "0th" 반복물이라고 불리는 이러한 서열이 결합 부위의 위치 -1에 있는 T에 대한 요구사항에 대한 기본이고, RVD-동족 위치에 있는 잔기 (도 38b)가 뉴클레오티드를 특정한다는 것을 가정하였다.
이들 발견에 기초하여, G에 대한 높은 특이성을 갖는 반복물을 혼입시킴으로써, 그리고 -1에 있는 T에 대한 요구사항을 완화시킴으로써 조작된 TAL 이펙터 단백질에 대한 표적화 능력이 향상될 수 있다는 것을 가정하였다. NN이 나타내는 것보다 G에 대한 더 강한 특이성에 대해 신규하고 희귀한 RVD를 시험하고, 흔한 RVD를 갖는 0th 반복물의 RVD-동족 잔기를 대체하여 실험을 개시하였다.
G에 대한 강한 특이성에 대한 신규하고 희귀한 RVD: 상기 개시된 모듈 (예를 들어, 실시예 4 참조)은 4종의 뉴클레오티드 염기 (각각 A, C, G 및 T)에 대한 결합을 특정하기 위해 4종의 특정 RVD (NI, HD, NN 및 NG)를 사용하였다. 다른 RVD를 함유하는 반복물이 또한 유용할 수 있고, NI, HD, NN 및 NG와 비교하여 4종의 염기에 대한 증가된 특이성 및/또는 친화성을 가질 수 있다. G에 대한 특이성의 개선을 위해, 신규하고 희귀한 RVD를 코딩하는 여러 반복물을 제작하였다. 희귀한 RVD NK, HN 및 NA가 G와 회합하였으며, 이는 N이 잔기 중 하나 또는 나머지 다른 하나만큼 중요할 수 있다는 것을 제안하였다 (도 1c). 그러므로, 표 5에 나타낸 RVD를 갖는 반복물을 코딩하는 유도체의 광범위한 세트를 제작하였다. 좌측 컬럼은 위치 12에 극성 아미노산 (R, K, D, E, Q, H, S, T 또는 Y) 및 위치 13에 N을 갖는 RVD를 나열한다. 우측 컬럼은 RVD의 제2 위치에 17종의 다른 아미노산 (G, L, V, R, K, D, E, Q, H, T, M, C, P, Y, W 또는 F) 중 임의의 것과 제1 위치에 N의 조합을 나열한다. N 없이 더 큰 특이성의 가능성을 설명하기 위해, 위치 12에 극성 아미노산 (R, K, D, E, Q, H, S, T 또는 Y) 및 위치 13에 갭 (*)을 갖는 반복물을 또한 제조하였다 (가운데 컬럼).
TAL 이펙터의 전사 활성화 활성에 대한 정량적 리포터 유전자 기반 검정에서, 예컨대 니코티아나 벤타미아나(Nicotiana benthamiana)에서 GUS 또는 이중 루시페라제 리포터 기반, 아그로박테리움(Agrobacterium)-매개된 일과성 발현 검정, 또는 상기 기재된 사카로미세스 세레비시아에(Saccharomyces cerevisiae)에서 lacZ 리포터 기반 TALEN 검정 (예를 들어, 실시예 2 참조)에서의 기능에 대해 신규 인공 RVD를 시험하였다. 시험되는 RVD를 함유하는 반복물 모듈을 활성의 측정가능한 및 미포화(sub-saturation) 수준으로 TAL 이펙터 또는 TALEN으로 혼입시키고, 상응하는 위치에 모든 4종의 뉴클레오티드의 통합된 과돌연변이를 갖는 DNA 표적 세트에 대한 활성의 차이에 대해 생성된 단백질을 시험하였다. 구체적으로, 식물내 및 효모 검정에서 최소로 활성이고 3개의 첨가된 반복물에서 미스매치에 대해 반응성인 PthXo1 변이체(들)로 개시하여, 각각의 신규하고 희귀한 반복물 (세가지 동의체에서)을 함유하는 TALEN을, 상응하는 위치 각각에 G를 갖는 표적에 대해 생체내에서 시험하였다. 증가된 활성을 나타내는 임의의 것에 대해, 특이성을 확인하기 위해, 상기 위치에 다른 뉴클레오티드로 과돌연변이된 표적으로 검정을 반복하였다.
<표 5>
Figure 112019009675393-pat00008
aN*, NG 및 NS nt 회합 빈도는 공지되어 있다. 별표는 RVD에서 2nd 위치 (즉, 컨센서스(consensus) 반복 서열의 13th 위치)에 상응하는 갭을 나타낸다.
위치 -1에 T의 특이성을 완화시키기 위한 0 th 반복물의 RVD -동족 위치에 대한 흔한 RVD 치환: 0th 반복물 및 반복 컨센서스 서열의 이차 구조 예측 및 정렬은 0th 반복물에 KR* (별표는 갭을 나타냄)에 의해 차지된 위치가 RVD와 동족이고, 따라서 -1에 T를 특정하는 잔기였다는 것을 제안하였다. KR 및 별도로 R*에 대한 HD, NG, NI 및 NN의 치환을 갖는 PthXo1의 변이체를 상기 기재된 Tal1c "주쇄" 구조체에 제작하였다. 위치 -1에 상응하는 뉴클레오티드, 즉 C, T, A 및 G 각각을 갖는 표적을 이용하여, 이들 변이체의 활성을 식물내 및 효모 검정에서 야생형 이펙터에 대해 비교하였다. 0th 반복물의 위치 11에 K에 대해 치환된, 컨센서스 반복 서열의 위치 11에 있는 잔기인 S를 갖는 PthXo1의 추가 변이체를 제작하였다. 그리고, 0th 반복물 (표 6)의 위치 15에 V에 대한, 컨센서스 반복 서열의 위치 16에 있는 잔기인 K의 치환과 조합된 이러한 치환을 갖는 다른 변이체를 제작하였다. TAL 이펙터 활성에 대한 근위 TATA 박스를 포함시킬 수 있었다. 또한, -1에 T가 TATA 박스의 일부인 것으로 보이는 AvrBs3과 달리, PthXo1 결합 부위에 가장 가까운 TATA 박스가 46 bp 하류이고, -1에서 변형에 의해 동요되지 않을 것이기 때문에, PthXo1은 이러한 실험에 유용하였다.
상기 변형이 G에 대한 향상된 표적화 또는 T가 아닌 뉴클레오티드보다 앞에 있는 서열을 표적화하는 증가된 능력을 초래하지 않는다면, 인공 RVD의 보다 포괄적인 세트를 G 특이성에 대해 시험하고, 흔한 RVD가 아닌 치환을 0th 반복물에 대해 시험하였다.
<표 6>
Figure 112019009675393-pat00009
후보물질 및 치환된 RVD는 진한 글자이다. 다른 치환 또는 변형은 밑줄이다. 별표는 컨센서스 반복 서열에 대해 상대적인 갭을 나타낸다.
서열
실시예 13 - 신규 예측된 뉴클레오티드 특이적 RVD
표 1A 및 1B에 나열된 RVD가 RVD 중 제2 아미노산 잔기 (즉, 전체 반복물 중 13th)에 의해 그룹화된 경우, RVD의 제1 위치에 아미노산과 상관없이 RVD에 의해 특정된 뉴클레오티드(들)와 아미노산의 거의 완전한 상관관계가 있었다는 것이 관찰되었다 (표 7). 그러므로, 갭 (별표에 의해 나타냄)에서 종결되는 RVD는 C 또는 T, 또는 T를 특정하고; D에서 종결되는 RVD는 C를 특정하고; G에서 종결되는 RVD는 T를 특정하고; N에서 종결되는 RVD는 G 또는 A, 또는 G를 특정한다. 또한, RVD의 위치 1에 아미노산이 H, I, N, S 또는 Y인 것으로 관찰되었다. 이들 관찰은 RVD 특이성이 제1 위치에 잔기가 H, I, N, S 또는 Y인 것과 독립적으로 제2 위치에 잔기에 의해 결정된다는 것을 제안하였다. 그러므로, 제1 위치에 잔기 H, I, S, N 또는 Y와 제2 위치에서 관찰된 잔기를 조합하는 여러 신규 (즉, 아직 관찰되지 않은) RVD에 대해 특이성이 예측되었다. 그러므로, I*, S* 및 Y*는 C 또는 T, 또는 T를 특정하는 것으로 예측되고; ID, SD 및 YD는 C를 특정하는 것으로 예측되고; SG는 T를 특정하는 것으로 예측되고; IN 및 YN은 G 또는 A, 또는 G를 특정하는 것으로 예측되었다. 또한, NK의 관찰된 특이성에 기초하여 제2 위치에 K 대신에 오직 하나가 존재하였으나, HK, IK, SK 및 YK가 G를 특정하는 것으로 예측되었다.
실시예 2 및 11에 기재된 바와 같이 정량적 TAL 이펙터 및 TALEN 활성 검정에서 기능 및 특이성에 대해 이들 신규 RVD를 시험하고 기존 RVD와 비교하였다.
<표 71>
Figure 112019009675393-pat00010
1 별표는 갭을 나타낸다. 유사 특이성을 갖는 RVD 그룹을 굵은선으로 테두리 표시하였다.
실시예 14 - 맞춤형 TALEN은 동물 세포에서 내인성 표적을 절단하고, 비정밀 비상동 말단-연결에 의해 돌연변이를 도입한다
동물 세포에서 표적화된 돌연변이생성을 위해 TALEN을 사용할 수 있는가를 시험하기 위해, 먼저 TAL 이펙터 AvrBs3, PthXo1 및 Tal1c의 발현을 인간 배아 신장 (HEK) 293T 세포에서 시험하였다. AvrBs3, PthXo1 및 Tal1c 코딩 유전자로부터 정지 코돈을 제거하고, 단백질 면역검출을 위해 V5 에피토프를 코딩하는 벡터에서 하류 서열을 갖는 프레임에서 포유동물 발현 벡터 pcDNA3.2/V5-DEST (미국 캘리포니아주 칼스배드에 소재한 인비트로젠(Invitrogen))로 유전자를 서브클로닝하였다. pcDNA3.2/V5-DEST는 구성적 인간 사이토메갈로바이러스 (CMV) 프로모터의 제어하에 TAL 이펙터 유전자를 위치시켰다. 생성된 플라스미드로 리포펙타민(Lipofectamine) 2000 (인비트로젠)을 사용하여 HEK 293T 세포를 개별적으로 형질감염시키고, 24시간 후, 세포의 각각의 형질감염된 배치(batch)로부터 총 단백질을 단리하고, 폴리아크릴아미드 겔 전기영동법, 웨스턴 블럿팅 및 마우스 항-V5 항체를 이용한 면역표지로 처리하였다. 슈퍼시그널 위트 피코 케미루미네슨트 키트(SuperSignal Weat Pico Chemiluminescent kit) (써모사이언티픽, 인크.(ThermoScientific, Inc.))를 이용하여 염소 항-마우스 항체-양고추냉이 퍼옥시다제 접합체로 표지된 단백질을 검출하였다. 액틴의 면역표지화 및 검출에 의해 등가의 로딩을 확인하였다. 각각의 TAL 이펙터 단백질을 명백한 분해 없이 검출가능하게 발현시켰다 (도 39).
다음, 내인성 인간 HPRT 유전자 및 소위 HPRT-3254-17 및 HPRT-3286-20r에서 서열을 표적화하도록 한 쌍의 TALEN을 실시예 9에 기재된 바와 같이 설계하였다 (도 40a 및 도 40b). 실시예 8에 기재된 골든 게이트(Golden Gate) 클로닝-기반 방법 및 시약을 이용하여 플라스미드 pTALEN141 코딩 HPRT-3254-17 및 플라스미드 pTALEN142 코딩 HPRT-3286-20r을 제작하였다. 그 후, TALEN 유전자를 포유동물 발현 벡터 pCDNA3.1(-) (인비트로젠, 인크.)로 서브클로닝하여 (여기서 상기 벡터는 상기 유전자를 구성적 CMV 프로모터의 제어하에 위치시킴), 플라스미드 pTALEN141M 및 pTALEN 142M을 수득하였다. 그 후, HEK 293T 세포를 pTALEN141M 및 pTALEN142M 양자 모두 함께 및 별도로 음성 대조로서 pCDNA3.1(-)로 형질감염시켰다. 72시간 후, 게놈 DNA를 단리하고, 제한 엔도뉴클레아제 Bpu10I로 소화시켰다. Bpu10I 부위는 HPRT에서 HPRT-3254-17 및 HPRT-3286-20r 결합 부위를 분리시키는 스페이서 내에 존재하였다 (도 41a). Bpu10I 소화 후, TALEN-처리된 샘플 및 대조 샘플 양자 모두로부터 TALEN-표적화된 부위를 스패닝하는 244 bp 단편을 증폭시키기 위해 PCR을 이용하였다. 샘플 양자 모두로부터 예상된 단편을 증폭시켰으며, 이는 게놈 DNA의 Bpu10I 소화가 불완전하였다는 것을 나타내었다. 그러나, Bpu10I에 의한 PCR 생성물의 후속적 소화는 대조 샘플로부터 증폭된 생성물의 완전 절단을 초래하였으나, TALEN 처리된 샘플로부터 생성물의 불완전 절단을 초래하였다 (도 41b). TALEN-처리된 샘플 중 절단-내성 PCR 생성물의 존재는 HPRT에서 의도된 표적에 TALEN-매개된 이중 가닥 파열의 비상동 말단 연결에 의한 불완전 복구의 결과로서 내인성 Bpu10I 부위가 생체내에서 돌연변이되었다는 증거를 제공한다. 그러므로, TALEN을 포유동물 세포에서 표적화된 돌연변이생성을 위해 사용할 수 있다.
기타 실시양태
본 발명은 그의 상세한 설명과 함께 기재되었으나, 상기 기재는 첨부된 특허청구범위에 의해 한정되는 본 발명의 범위를 예시하는 것으로 의도되며 이를 제한하는 것으로 의도되지 않는 것으로 이해된다. 다른 측면, 장점 및 변형은 하기 특허청구범위 내에 포함된다.
SEQUENCE LISTING <110> Regents of the University of Minnesota Iowa State University Research Foundation, Inc. <120> TAL EFFECTOR-MEDIATED DNA MODIFICATION <130> 09531/0305WO1 <140> PCT/US2010/059932 <141> 2010-12-10 <150> 61/366,685 <151> 2010-07-22 <150> 61/352,108 <151> 2010-06-07 <150> 61/285,324 <151> 2009-12-10 <160> 93 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> generic sequence <400> 1 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 2 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 2 agaagaagag acccata 17 <210> 3 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 3 atataaacct aaccatcc 18 <210> 4 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 4 atataaacct gacccttt 18 <210> 5 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 5 atataaacct ctct 14 <210> 6 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 6 atataaacct aacca 15 <210> 7 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 7 ataaacctaa ccat 14 <210> 8 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 8 gcatctcccc ctactgtaca ccac 24 <210> 9 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 9 ataaaaggcc ctcaccaacc cat 23 <210> 10 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 10 ataatcccca aatcccctcc tc 22 <210> 11 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 11 ccccctcgct tccctt 16 <210> 12 <211> 1164 <212> PRT <213> Xanthomonas euvesicatoria <400> 12 Met Asp Pro Ile Arg Ser Arg Thr Pro Ser Pro Ala Arg Glu Leu Leu 1 5 10 15 Pro Gly Pro Gln Pro Asp Gly Val Gln Pro Thr Ala Asp Arg Gly Val 20 25 30 Ser Pro Pro Ala Gly Gly Pro Leu Asp Gly Leu Pro Ala Arg Arg Thr 35 40 45 Met Ser Arg Thr Arg Leu Pro Ser Pro Pro Ala Pro Ser Pro Ala Phe 50 55 60 Ser Ala Gly Ser Phe Ser Asp Leu Leu Arg Gln Phe Asp Pro Ser Leu 65 70 75 80 Phe Asn Thr Ser Leu Phe Asp Ser Leu Pro Pro Phe Gly Ala His His 85 90 95 Thr Glu Ala Ala Thr Gly Glu Trp Asp Glu Val Gln Ser Gly Leu Arg 100 105 110 Ala Ala Asp Ala Pro Pro Pro Thr Met Arg Val Ala Val Thr Ala Ala 115 120 125 Arg Pro Pro Arg Ala Lys Pro Ala Pro Arg Arg Arg Ala Ala Gln Pro 130 135 140 Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr 145 150 155 160 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 165 170 175 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 180 185 190 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 195 200 205 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 210 215 220 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 225 230 235 240 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 245 250 255 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 260 265 270 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 275 280 285 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 290 295 300 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 305 310 315 320 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 325 330 335 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 340 345 350 Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn 355 360 365 Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 370 375 380 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 385 390 395 400 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 405 410 415 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 420 425 430 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala 435 440 445 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 450 455 460 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 465 470 475 480 Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 485 490 495 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 500 505 510 Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 515 520 525 Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 530 535 540 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 545 550 555 560 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 565 570 575 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 580 585 590 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 595 600 605 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 610 615 620 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 625 630 635 640 Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val 645 650 655 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 660 665 670 Ser Asn Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 675 680 685 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 690 695 700 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 705 710 715 720 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 725 730 735 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 740 745 750 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 755 760 765 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 770 775 780 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 785 790 795 800 Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala 805 810 815 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 820 825 830 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 835 840 845 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 850 855 860 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 865 870 875 880 Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp 885 890 895 Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys 900 905 910 Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His 915 920 925 Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr 930 935 940 Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe 945 950 955 960 Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr 965 970 975 Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val 980 985 990 Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser 995 1000 1005 Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys 1010 1015 1020 Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His Ala 1025 1030 1035 1040 Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His 1045 1050 1055 Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp 1060 1065 1070 Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg Val 1075 1080 1085 Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys 1090 1095 1100 Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro 1105 1110 1115 1120 Thr Ala Ala Asp Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp 1125 1130 1135 Glu Asp Pro Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu 1140 1145 1150 Glu Glu Leu Ala Trp Leu Met Glu Leu Leu Pro Gln 1155 1160 <210> 13 <211> 4366 <212> DNA <213> Xanthomonas euvesicatoria <400> 13 gaattcaagg tgtcaaaaag cgataggcgg aattatagat gtacttgtat gaacttatca 60 acgccagttt agtgaacggg ttcgacaaag cgaaaccaac acccaggcgc gaaagccttg 120 cgccgcaatg ctttccggca atgtgaccca gggcattgac cgaaacggcg taggaatttc 180 ggaacacgac ggtaggggaa tgctctaccg cccggctacg caaaagcact ctcgcctgcc 240 agacgcgcca ctgcgtggaa ttggccgtta tgtccgctgg cggcctcgcc gccgtagtgc 300 ttgcagcgca gccttgaatg atcgaacatc aaacatcact gtttgatagg tcgatcatga 360 catcgcccat ttcgagggtc ggcagggatt cgtgtaaaaa acagccaaaa gtgagctaac 420 tcgctgtcag cacagaaatt tttcacaacc ttctgccgat cctccatgcg ggtccgtgat 480 cgccttcatg tctgcgcctc accctggtcg tcgagggttg ccaggatcac ccgaagttgt 540 gtactgccat gcggcctcgg aagctatgta ggaaccacag accgctagtc tggaggcgac 600 catgtaaaga ggtatgcctg atggatccca ttcgttcgcg cacaccaagt cctgcccgcg 660 agcttctgcc cggaccccaa cccgatgggg ttcagccgac tgcagatcgt ggggtgtctc 720 cgcctgccgg cggccccctg gatggcttgc ccgctcggcg gacgatgtcc cggacccggc 780 tgccatctcc ccctgccccc tcacctgcgt tctcggcggg cagcttcagt gacctgttac 840 gtcagttcga tccgtcactt tttaatacat cgctttttga ttcattgcct cccttcggcg 900 ctcaccatac agaggctgcc acaggcgagt gggatgaggt gcaatcgggt ctgcgggcag 960 ccgacgcccc cccacccacc atgcgcgtgg ctgtcactgc cgcgcggccg ccgcgcgcca 1020 agccggcgcc gcgacgacgt gctgcgcaac cctccgacgc ttcgccggcc gcgcaggtgg 1080 atctacgcac gctcggctac agccagcagc aacaggagaa gatcaaaccg aaggttcgtt 1140 cgacagtggc gcagcaccac gaggcactgg tcggccatgg gtttacacac gcgcacatcg 1200 ttgcgctcag ccaacacccg gcagcgttag ggaccgtcgc tgtcaagtat caggacatga 1260 tcgcagcgtt gccagaggcg acacacgaag cgatcgttgg cgtcggcaaa cagtggtccg 1320 gcgcacgcgc tctggaggcc ttgctcacgg tggcgggaga gttgagaggt ccaccgttac 1380 agttggacac aggccaactt ctcaagattg caaaacgtgg cggcgtgacc gcagtggagg 1440 cagtgcatgc atggcgcaat gcactgacgg gtgcccccct gaacctgacc ccggagcagg 1500 tggtggccat cgccagccac gatggcggca agcaggcgct ggagacggtg cagcggctgt 1560 tgccggtgct gtgccaggcc catggcctga ccccgcagca ggtggtggcc atcgccagca 1620 atggcggtgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg ctgtgccagg 1680 cccatggcct gaccccgcag caggtggtgg ccatcgccag caatagcggt ggcaagcagg 1740 cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg 1800 agcaggtggt ggccatcgcc agcaatggcg gtggcaagca ggcgctggag acggtgcagc 1860 ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg gtggccatcg 1920 ccagcaatat tggtggcaag caggcgctgg agacggtgca ggcgctgttg ccggtgctgt 1980 gccaggccca tggcctgacc ccggagcagg tggtggccat cgccagcaat attggtggca 2040 agcaggcgct ggagacggtg caggcgctgt tgccggtgct gtgccaggcc catggcctga 2100 ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg ctggagacgg 2160 tgcaggcgct gttgccggtg ctgtgccagg cccatggcct gaccccggag caggtggtgg 2220 ccatcgccag ccacgatggc ggcaagcagg cgctggagac ggtgcagcgg ctgttgccgg 2280 tgctgtgcca ggcccatggc ctgaccccgg agcaggtggt ggccatcgcc agccacgatg 2340 gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg 2400 gcctgacccc gcagcaggtg gtggccatcg ccagcaatgg cggtggcaag caggcgctgg 2460 agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc ccggagcagg 2520 tggtggccat cgccagcaat agcggtggca agcaggcgct ggagacggtg caggcgctgt 2580 tgccggtgct gtgccaggcc catggcctga ccccggagca ggtggtggcc atcgccagca 2640 atagcggtgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg ctgtgccagg 2700 cccatggcct gaccccggag caggtggtgg ccatcgccag ccacgatggc ggcaagcagg 2760 cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg 2820 agcaggtggt ggccatcgcc agccacgatg gcggcaagca ggcgctggag acggtgcagc 2880 ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg gtggccatcg 2940 ccagccacga tggcggcaag caggcgctgg agacggtgca gcggctgttg ccggtgctgt 3000 gccaggccca tggcctgacc ccgcagcagg tggtggccat cgccagcaat ggcggcggca 3060 ggccggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc catggcctga 3120 ccccggagca ggtggtggcc atcgccagcc acgatggcgg caagcaggcg ctggagacgg 3180 tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccgcag caggtggtgg 3240 ccatcgccag caatggcggc ggcaggccgg cgctggagag cattgttgcc cagttatctc 3300 gccctgatcc ggcgttggcc gcgttgacca acgaccacct cgtcgccttg gcctgcctcg 3360 gcggacgtcc tgcgctggat gcagtgaaaa agggattgcc gcacgcgccg gccttgatca 3420 aaagaaccaa tcgccgtatt cccgaacgca catcccatcg cgttgccgac cacgcgcaag 3480 tggttcgcgt gctgggtttt ttccagtgcc actcccaccc agcgcaagca tttgatgacg 3540 ccatgacgca gttcgggatg agcaggcacg ggttgttaca gctctttcgc agagtgggcg 3600 tcaccgaact cgaagcccgc agtggaacgc tccccccagc ctcgcagcgt tgggaccgta 3660 tcctccaggc atcagggatg aaaagggcca aaccgtcccc tacttcaact caaacgccgg 3720 atcaggcgtc tttgcatgca ttcgccgatt cgctggagcg tgaccttgat gcgcctagcc 3780 caatgcacga gggagatcag acgcgggcaa gcagccgtaa acggtcccga tcggatcgtg 3840 ctgtcaccgg tccctccgca cagcaatcgt tcgaggtgcg cgttcccgaa cagcgcgatg 3900 cgctgcattt gcccctcagt tggagggtaa aacgcccgcg taccagtatc gggggcggcc 3960 tcccggatcc tggtacgccc acggctgccg acctggcagc gtccagcacc gtgatgcggg 4020 aacaagatga ggaccccttc gcaggggcag cggatgattt cccggcattc aacgaagagg 4080 agctcgcatg gttgatggag ctattgcctc agtgaggctc agtcggtgac tacctgagcg 4140 tcggcaggga ttggtgtaag taacctttac tgacagcgag ttagcccact tttggctgtt 4200 ttttacacaa atccctgcct cccctctggt tgcaccacac ccgtacacca agcgcggcgg 4260 cgaagcaggc accgagtggt tccgctgcgg tgttgcgttc cctaaccagg gcggtggcta 4320 tacgctcaag ctgcgcaccg tcccggtggc gatcgacgac gaaatg 4366 <210> 14 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 14 tatataaacc taaccatcct cacaacttca agttatcgga tggttaggtt tatata 56 <210> 15 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 15 tatataaacc taaccatccg ataacttgaa gttgtgagga tggttaggtt tatata 56 <210> 16 <211> 1373 <212> PRT <213> Xanthomonas euvesicatoria <400> 16 Met Asp Pro Ile Arg Ser Arg Thr Pro Ser Pro Ala Arg Glu Leu Leu 1 5 10 15 Pro Gly Pro Gln Pro Asp Arg Val Gln Pro Thr Ala Asp Arg Gly Gly 20 25 30 Ala Pro Pro Ala Gly Gly Pro Leu Asp Gly Leu Pro Ala Arg Arg Thr 35 40 45 Met Ser Arg Thr Arg Leu Pro Ser Pro Pro Ala Pro Ser Pro Ala Phe 50 55 60 Ser Ala Gly Ser Phe Ser Asp Leu Leu Arg Gln Phe Asp Pro Ser Leu 65 70 75 80 Leu Asp Thr Ser Leu Leu Asp Ser Met Pro Ala Val Gly Thr Pro His 85 90 95 Thr Ala Ala Ala Pro Ala Glu Cys Asp Glu Val Gln Ser Gly Leu Arg 100 105 110 Ala Ala Asp Asp Pro Pro Pro Thr Val Arg Val Ala Val Thr Ala Ala 115 120 125 Arg Pro Pro Arg Ala Lys Pro Ala Pro Arg Arg Arg Ala Ala Gln Pro 130 135 140 Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr 145 150 155 160 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Gly Ser Thr Val 165 170 175 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 180 185 190 Ile Val Ala Leu Ser Arg His Pro Ala Ala Leu Gly Thr Val Ala Val 195 200 205 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Asp 210 215 220 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 225 230 235 240 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 245 250 255 Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 260 265 270 Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 275 280 285 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 290 295 300 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 305 310 315 320 His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly 325 330 335 Gly Lys Gln Ala Leu Glu Thr Met Gln Arg Leu Leu Pro Val Leu Cys 340 345 350 Gln Ala His Gly Leu Pro Pro Asp Gln Val Val Ala Ile Ala Ser Asn 355 360 365 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 370 375 380 Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 385 390 395 400 Ser His Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 405 410 415 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala 420 425 430 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 435 440 445 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val 450 455 460 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 465 470 475 480 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 485 490 495 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr 500 505 510 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 515 520 525 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 530 535 540 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Thr His Gly Leu 545 550 555 560 Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 565 570 575 Ala Leu Glu Thr Val Gln Gln Leu Leu Pro Val Leu Cys Gln Ala His 580 585 590 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 595 600 605 Lys Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 610 615 620 Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly 625 630 635 640 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 645 650 655 Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 660 665 670 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 675 680 685 Val Leu Cys Gln Ala His Gly Leu Thr Gln Val Gln Val Val Ala Ile 690 695 700 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 705 710 715 720 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 725 730 735 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 740 745 750 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 755 760 765 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 770 775 780 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Gln 785 790 795 800 Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 805 810 815 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 820 825 830 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 835 840 845 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 850 855 860 Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 865 870 875 880 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 885 890 895 Asp His Gly Leu Thr Leu Ala Gln Val Val Ala Ile Ala Ser Asn Ile 900 905 910 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 915 920 925 Cys Gln Ala His Gly Leu Thr Gln Asp Gln Val Val Ala Ile Ala Ser 930 935 940 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 945 950 955 960 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 965 970 975 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 980 985 990 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Leu Asp Gln Val Val 995 1000 1005 Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 1010 1015 1020 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 1025 1030 1035 1040 Val Ala Ile Ala Ser Asn Ser Gly Gly Lys Gln Ala Leu Glu Thr Val 1045 1050 1055 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asn 1060 1065 1070 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser 1075 1080 1085 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 1090 1095 1100 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met 1105 1110 1115 1120 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg 1125 1130 1135 Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr 1140 1145 1150 Ala Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro 1155 1160 1165 Ala Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn 1170 1175 1180 Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala 1185 1190 1195 1200 Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu 1205 1210 1215 Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln 1220 1225 1230 Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg 1235 1240 1245 Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Gly Ala 1250 1255 1260 Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser 1265 1270 1275 1280 Ala Gln His Ser Phe Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu 1285 1290 1295 His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Gly 1300 1305 1310 Gly Gly Leu Pro Asp Pro Gly Thr Pro Ile Ala Ala Asp Leu Ala Ala 1315 1320 1325 Ser Ser Thr Val Met Trp Glu Gln Asp Ala Ala Pro Phe Ala Gly Ala 1330 1335 1340 Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu Glu Leu Ala Trp Leu Met 1345 1350 1355 1360 Glu Leu Leu Pro Gln Ser Gly Ser Val Gly Gly Thr Ile 1365 1370 <210> 17 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> synthetic <220> <221> misc_feature <222> 34, 35, 36 <223> n = CAT or CAC or AAC or AAT <220> <221> misc_feature <222> 37, 38, 39 <223> n = GAC or GAT or GGA or GGC or GGG or GGT or TCA or TCC or TCG or TCT or AGC or AGT or ATA or ATC or ATT <400> 17 ctgaccccgg cacaggtggt ggccatcgcc agcnnnnnng gcggcaagca ggcgctggag 60 acggtgcagc ggctgttgcc ggtgctgtgc caggaccatg gc 102 <210> 18 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> synthetic <220> <221> VARIANT <222> 12, 13 <223> Xaa = His Asp or Asn Gly or Asn Ser or Asn Ile <400> 18 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 19 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> synthetic <220> <221> misc_feature <222> 34, 35, 36 <223> n = CAT or CAC or AAC or AAT <220> <221> misc_feature <222> 37, 38, 39 <223> n = GAC or GAT or GGA or GGC or GGG or GGT or TCA or TCC or TCG or TCT or AGC or AGT or ATA or ATC or ATT <400> 19 ctgaccccgg cacaggtggt ggccatcgcc agcnnnnnng gcggcaagca ggcgctcgag 60 agc 63 <210> 20 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> synthetic <220> <221> VARIANT <222> 12, 13 <223> Xaa = His Asp or Asn Gly or Asn Ser or Asn Ile <400> 20 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ser 20 <210> 21 <211> 12 <212> DNA <213> Xanthomonas oryzae <400> 21 gcgctggaga gc 12 <210> 22 <211> 4 <212> PRT <213> Xanthomonas oryzae <400> 22 Ala Leu Glu Ser 1 <210> 23 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 23 gcgctcgagt cc 12 <210> 24 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 24 tcgagacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg accccggacc 60 aagtggtggc catcgccagc aacattggcg gcaagcaagc gc 102 <210> 25 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 25 tcgagcgctt gcttgccgcc aatgttgctg gcgatggcca ccacttggtc cggggtcagg 60 ccatggtcct ggcacagcac cggcaacagc cgctgcaccg tc 102 <210> 26 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 26 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 1 5 10 15 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 20 25 30 Ala Leu Glu 35 <210> 27 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 27 tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg accccggacc 60 aagtggtggc tatcgccagc aacattggcg gcaagcaagc gc 102 <210> 28 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 28 tcgagcgctt gcttgccgcc aatgttgctg gcgatagcca ccacttggtc cggggtcagg 60 ccatggtcct ggcacagcac cggcaacagc cgctgcaccg tt 102 <210> 29 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 29 atcaagattc tcttcact 18 <210> 30 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> target sequence <400> 30 cccagaagta aacat 15 <210> 31 <211> 598 <212> PRT <213> Xanthomonas oryzae <400> 31 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 35 40 45 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 50 55 60 Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn 65 70 75 80 Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 85 90 95 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 100 105 110 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 115 120 125 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 130 135 140 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala 145 150 155 160 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 165 170 175 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 180 185 190 Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 195 200 205 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 210 215 220 Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 225 230 235 240 Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 245 250 255 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 260 265 270 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 275 280 285 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 290 295 300 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 305 310 315 320 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 325 330 335 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 340 345 350 Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val 355 360 365 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 370 375 380 Ser Asn Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 385 390 395 400 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 405 410 415 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 420 425 430 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 435 440 445 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 450 455 460 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 465 470 475 480 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 485 490 495 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 500 505 510 Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala 515 520 525 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 530 535 540 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 545 550 555 560 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 565 570 575 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 580 585 590 Gly Arg Pro Ala Leu Glu 595 <210> 32 <211> 4122 <212> DNA <213> Xanthomonas oryzae <400> 32 atggatccca ttcgttcgcg cacgccaagt cctgcccgcg agcttctgcc cggaccccaa 60 ccggataggg ttcagccgac tgcagatcgg gggggggctc cgcctgctgg cggccccctg 120 gatggcttgc ccgctcggcg gacgatgtcc cggacccggc tgccatctcc ccctgcgccc 180 tcgcctgcgt tctcggcggg cagcttcagc gatctgctcc gtcagttcga tccgtcgctt 240 cttgatacat cgcttcttga ttcgatgcct gccgtcggca cgccgcatac agcggctgcc 300 ccagcagagt gcgatgaggt gcaatcgggt ctgcgtgcag ccgatgaccc gccacccacc 360 gtgcgtgtcg ctgtcactgc cgcgcggccg ccgcgcgcca agccggcccc gcgacggcgt 420 gcggcgcaac cctccgacgc ttcgccggcc gcgcaggtgg atctacgcac gctcggctac 480 agtcagcagc agcaagagaa gatcaaaccg aaggtgggtt cgacagtggc gcagcaccac 540 gaggcactgg tgggccatgg gtttacacac gcgcacatcg ttgcgctcag ccgacacccg 600 gcagcgttag ggaccgtcgc tgtcaagtat caggacatga tcgcggcgtt accagaggcg 660 acacacgaag acatcgttgg tgtcggcaaa cagtggtccg gcgcacgcgc cctggaggcc 720 ttgctcacgg tggcgggaga gttgagaggt ccaccgttac agttggacac aggccaactt 780 gtcaagattg caaaacgtgg cggcgtgacc gcagtggagg cagtgcatgc atcgcgcaat 840 gcactgacgg gtgcccccct gaacctgacc ccggcacagg tggtggccat cgccagcaat 900 aacggtggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 960 catggcctga ccccggcgca ggtggtggcc atcgccagcc acgatggcgg caagcaggca 1020 ctggagacga tgcagcggct gttgccggtg ctgtgccagg cccatggcct gcccccggac 1080 caggtggtgg ccatcgccag caatattggc ggcaagcagg cgctggagac ggtgcagcgg 1140 ctgttgccgg tgctctgcca ggcccatggc ctgaccccgg accaggtggt ggccatcgcc 1200 agccatggcg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctctgc 1260 caggcccatg gcctgacccc ggaccaggtg gtggccatcg ccagccacga tggcggcaag 1320 caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 1380 ccggaccagg tggtggccat cgccagcaat ggcggcggca agcaggcgct ggagacggtg 1440 cagcggctgt tgccggtgct gtgccaggcc catggtctga ccccggacca ggtggtggcc 1500 atcgccagca atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1560 tgccaggccc atggcctgac cccggaccag gtggtggcca tcgccagcca cgatggcggc 1620 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccagac ccatggtctg 1680 accccggcgc aggtggtggc catcgccagc cacgatggcg gcaagcaggc gctggagacg 1740 gtgcagcagc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1800 gccatcgcca gcaatattgg cggcaagcag gcgctagcga cggtgcagcg gctgttgccg 1860 gtgctgtgcc aagcccatgg cctgaccccg gaccaggtgg tggccatcgc cagcaatggc 1920 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1980 ggcctgaccc cggaccaggt ggtggccatc gccagcaatg gcggcggcaa gcaggcgctg 2040 gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggtctgac ccaggtgcag 2100 gtggtggcca tcgccagcaa tattggcggc aagcaggcgc tggagacggt gcagcggctg 2160 ttgccggtgc tgtgccaggc ccatggcctg accccggcgc aggtggtggc catcgccagc 2220 cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 2280 gcccatggcc tgaccccgga ccaagtggtg gccatcgcca gcaatggcgg cggcaagcag 2340 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgacccag 2400 gagcaggtgg tggccatcgc cagcaataac ggcggcaagc aggcgctgga gacggtgcag 2460 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggaccaggt ggtggccatc 2520 gccagcaatg gcggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 2580 tgccaggccc atggtctgac cccggcgcag gtggtggcca tcgccagcaa tattggcggc 2640 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 2700 accctggcgc aggtggtggc catcgccagc aatattggcg gcaagcaggc gctggagacg 2760 gtgcagcggc tgttgccggt gctgtgccag gcacatggcc tgacccagga ccaggtggtg 2820 gccatcgcca gcaatattgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 2880 gtgctgtgcc aggaccatgg cctgaccccg gaccaggtcg tggccatcgc cagcaatatt 2940 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggaccat 3000 ggcctgaccc tggaccaggt ggtggccatc gccagcaatg gcggcaagca ggcgctggag 3060 acggtgcagc ggctgttgcc ggtgctgtgc caggaccatg gactgacccc ggaccaggtc 3120 gtggccatcg ccagcaatag tggcggcaag caggcgctgg agacggtgca gcggctgttg 3180 ccggtgctgt gccaggacca tggcctgacc ccgaaccagg tggtggccat cgccagcaat 3240 ggcggcaagc aggcgctgga gagcattgtt gcccagttat ctcgccctga tccggcgttg 3300 gccgcgttga ccaacgacca cctcgtcgcc ttggcctgcc tcggcggacg tcctgccatg 3360 gatgcagtga aaaagggatt gccgcacgcg ccggaattga tcagaagagt caatcgccgt 3420 attggcgaac gcacgtccca tcgcgttgcc gactacgcgc aagtggttcg cgtgctggag 3480 tttttccagt gccactccca cccagcgtac gcatttgatg aggccatgac gcagttcggg 3540 atgagcagga acgggttggt acagctcttt cgcagagtgg gcgtcaccga actcgaagcc 3600 cgcggtggaa cgctcccccc agcctcgcag cgttgggacc gtatcctcca ggcatcaggg 3660 atgaaaaggg ccaaaccgtc ccctacttca gctcaaacac cggatcaggc gtctttgcat 3720 gcattcgccg attcgctgga gcgtgacctt gatgcgccta gcccaatgca cgagggagat 3780 cagacagggg caagcagccg taaacggtcc cgatcggatc gtgctgtcac cggcccctcc 3840 gcacagcact ctttcgaggt gcgcgttccc gaacagcgcg atgcgctgca tttgcccctc 3900 agctggaggg taaaacgccc gcgtaccagg atcgggggcg gcctcccgga tcctggtacg 3960 cccatcgctg ccgacctggc agcgtccagc accgtgatgt gggaacaaga tgcggccccc 4020 ttcgcagggg cagcggatga tttcccggca ttcaacgaag aggagctcgc atggttgatg 4080 gagctattgc ctcagtcagg ctcagtcgga gggacgatct ga 4122 <210> 33 <211> 1341 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 33 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Ser Arg Thr 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Gly Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Pro Pro Ala Gly Gly Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Met Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Gln Phe Asp Pro Ser Leu Phe Asn Thr Ser Leu Phe Asp Ser 100 105 110 Leu Pro Pro Phe Gly Ala His His Thr Glu Ala Ala Thr Gly Glu Trp 115 120 125 Asp Glu Val Gln Ser Gly Leu Arg Ala Ala Asp Ala Pro Pro Pro Thr 130 135 140 Met Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ser Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 435 440 445 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ser Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ser Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 740 745 750 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His 785 790 795 800 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Thr Val Gln Arg Leu Leu 835 840 845 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 850 855 860 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 865 870 875 880 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val 885 890 895 Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile 900 905 910 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 915 920 925 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp 930 935 940 Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr 945 950 955 960 Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp His Ala 965 970 975 Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys His Ser His Pro Ala 980 985 990 Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met Ser Arg His Gly 995 1000 1005 Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg 1010 1015 1020 Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln 1025 1030 1035 1040 Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Thr Gln Thr 1045 1050 1055 Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp 1060 1065 1070 Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser 1075 1080 1085 Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala 1090 1095 1100 Gln Gln Ser Phe Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His 1105 1110 1115 1120 Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Ser Ile Gly Gly 1125 1130 1135 Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu 1140 1145 1150 Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His 1155 1160 1165 Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg 1170 1175 1180 Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr 1185 1190 1195 1200 Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr 1205 1210 1215 Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala 1220 1225 1230 Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln 1235 1240 1245 Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn 1250 1255 1260 Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu 1265 1270 1275 1280 Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg 1285 1290 1295 Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu 1300 1305 1310 Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu 1315 1320 1325 Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1330 1335 1340 <210> 34 <211> 1542 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 34 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Met 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Pro Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 530 535 540 Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 545 550 555 560 His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 565 570 575 Val Leu Cys Gln Thr His Gly Leu Thr Pro Ala Gln Val Val Ala Ile 580 585 590 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Gln Leu 595 600 605 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val 610 615 620 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Ala Thr Val Gln 625 630 635 640 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 645 650 655 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 660 665 670 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 675 680 685 Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu 690 695 700 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 705 710 715 720 Thr Gln Val Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 725 730 735 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 740 745 750 Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 755 760 765 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 770 775 780 Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly 785 790 795 800 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 805 810 815 Cys Gln Ala His Gly Leu Thr Gln Glu Gln Val Val Ala Ile Ala Ser 820 825 830 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 835 840 845 Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 850 855 860 Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 865 870 875 880 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 885 890 895 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 900 905 910 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Leu Ala Gln 915 920 925 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr 930 935 940 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Gln 945 950 955 960 Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 965 970 975 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 980 985 990 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 995 1000 1005 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 1010 1015 1020 Gly Leu Thr Leu Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 1025 1030 1035 1040 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 1045 1050 1055 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ser Gly 1060 1065 1070 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 1075 1080 1085 Gln Asp His Gly Leu Thr Pro Asn Gln Val Val Ala Ile Ala Ser Asn 1090 1095 1100 Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro 1105 1110 1115 1120 Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala 1125 1130 1135 Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro 1140 1145 1150 His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg 1155 1160 1165 Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu 1170 1175 1180 Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met 1185 1190 1195 1200 Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe Arg Arg 1205 1210 1215 Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro Pro Ala 1220 1225 1230 Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala 1235 1240 1245 Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser Leu His 1250 1255 1260 Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met 1265 1270 1275 1280 His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser 1285 1290 1295 Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg 1300 1305 1310 Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val 1315 1320 1325 Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser 1330 1335 1340 Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu 1345 1350 1355 1360 Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu 1365 1370 1375 Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met 1380 1385 1390 Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly 1395 1400 1405 Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp 1410 1415 1420 Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu 1425 1430 1435 1440 Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln 1445 1450 1455 Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro 1460 1465 1470 Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys 1475 1480 1485 Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys 1490 1495 1500 Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met 1505 1510 1515 1520 Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn 1525 1530 1535 Asn Gly Glu Ile Asn Phe 1540 <210> 35 <211> 1035 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 35 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala 595 600 605 Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 610 615 620 Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val 625 630 635 640 Lys Lys Gly Leu Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg 645 650 655 Arg Ile Ala Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val 660 665 670 Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala 675 680 685 Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val 690 695 700 Gln Leu Phe Arg Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly 705 710 715 720 Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser 725 730 735 Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp 740 745 750 Gln Thr Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp 755 760 765 Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg 770 775 780 Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln 785 790 795 800 Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro 805 810 815 Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu 820 825 830 Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu 835 840 845 Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr 850 855 860 Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu 865 870 875 880 Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly 885 890 895 Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val 900 905 910 Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser 915 920 925 Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr 930 935 940 Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp 945 950 955 960 Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val 965 970 975 Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn 980 985 990 His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu 995 1000 1005 Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val 1010 1015 1020 Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1025 1030 1035 <210> 36 <211> 1069 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 36 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile 625 630 635 640 Val Ala Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn 645 650 655 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp 660 665 670 Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Phe Ile Arg Arg Val 675 680 685 Asn Arg Arg Ile Ala Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala 690 695 700 His Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala 705 710 715 720 His Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg His Gly 725 730 735 Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Phe Glu Ala Arg 740 745 750 Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln 755 760 765 Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr 770 775 780 Pro Asp Gln Thr Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp 785 790 795 800 Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser 805 810 815 Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala 820 825 830 Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His 835 840 845 Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly 850 855 860 Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu 865 870 875 880 Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His 885 890 895 Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg 900 905 910 Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr 915 920 925 Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr 930 935 940 Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala 945 950 955 960 Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln 965 970 975 Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn 980 985 990 Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu 995 1000 1005 Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg 1010 1015 1020 Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu 1025 1030 1035 1040 Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu 1045 1050 1055 Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1060 1065 <210> 37 <211> 1137 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 37 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala 705 710 715 720 Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg 725 730 735 Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Phe 740 745 750 Ile Arg Arg Val Asn Arg Arg Ile Ala Glu Arg Thr Ser His Arg Val 755 760 765 Ala Asp Tyr Ala His Val Val Arg Val Leu Glu Phe Phe Gln Cys His 770 775 780 Ser His Pro Ala His Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met 785 790 795 800 Ser Arg His Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu 805 810 815 Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp 820 825 830 Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr 835 840 845 Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu His Ala Phe Ala Asp Ser 850 855 860 Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln 865 870 875 880 Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr 885 890 895 Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg 900 905 910 Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 915 920 925 Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val 930 935 940 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 945 950 955 960 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 965 970 975 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 980 985 990 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 995 1000 1005 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 1010 1015 1020 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 1025 1030 1035 1040 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 1045 1050 1055 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 1060 1065 1070 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 1075 1080 1085 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 1090 1095 1100 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 1105 1110 1115 1120 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 1125 1130 1135 Phe <210> 38 <211> 1137 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 38 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala 705 710 715 720 Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg 725 730 735 Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Phe 740 745 750 Ile Arg Arg Val Asn Arg Arg Ile Ala Glu Arg Thr Ser His Arg Val 755 760 765 Ala Asp Tyr Ala His Val Val Arg Val Leu Glu Phe Phe Gln Cys His 770 775 780 Ser His Pro Ala His Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met 785 790 795 800 Ser Arg His Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu 805 810 815 Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp 820 825 830 Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr 835 840 845 Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu His Ala Phe Ala Asp Ser 850 855 860 Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln 865 870 875 880 Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr 885 890 895 Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg 900 905 910 Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 915 920 925 Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val 930 935 940 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 945 950 955 960 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 965 970 975 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 980 985 990 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 995 1000 1005 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 1010 1015 1020 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 1025 1030 1035 1040 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 1045 1050 1055 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 1060 1065 1070 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 1075 1080 1085 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 1090 1095 1100 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 1105 1110 1115 1120 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 1125 1130 1135 Phe <210> 39 <211> 1137 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 39 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 690 695 700 Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala 705 710 715 720 Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg 725 730 735 Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Phe 740 745 750 Ile Arg Arg Val Asn Arg Arg Ile Ala Glu Arg Thr Ser His Arg Val 755 760 765 Ala Asp Tyr Ala His Val Val Arg Val Leu Glu Phe Phe Gln Cys His 770 775 780 Ser His Pro Ala His Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met 785 790 795 800 Ser Arg His Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu 805 810 815 Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp 820 825 830 Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr 835 840 845 Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu His Ala Phe Ala Asp Ser 850 855 860 Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln 865 870 875 880 Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr 885 890 895 Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg 900 905 910 Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 915 920 925 Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val 930 935 940 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 945 950 955 960 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 965 970 975 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 980 985 990 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 995 1000 1005 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 1010 1015 1020 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 1025 1030 1035 1040 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 1045 1050 1055 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 1060 1065 1070 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 1075 1080 1085 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 1090 1095 1100 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 1105 1110 1115 1120 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 1125 1130 1135 Phe <210> 40 <211> 1137 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 40 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala 705 710 715 720 Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg 725 730 735 Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Phe 740 745 750 Ile Arg Arg Val Asn Arg Arg Ile Ala Glu Arg Thr Ser His Arg Val 755 760 765 Ala Asp Tyr Ala His Val Val Arg Val Leu Glu Phe Phe Gln Cys His 770 775 780 Ser His Pro Ala His Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met 785 790 795 800 Ser Arg His Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu 805 810 815 Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp 820 825 830 Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr 835 840 845 Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu His Ala Phe Ala Asp Ser 850 855 860 Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln 865 870 875 880 Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr 885 890 895 Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg 900 905 910 Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 915 920 925 Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val 930 935 940 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 945 950 955 960 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 965 970 975 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 980 985 990 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 995 1000 1005 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 1010 1015 1020 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 1025 1030 1035 1040 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 1045 1050 1055 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 1060 1065 1070 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 1075 1080 1085 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 1090 1095 1100 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 1105 1110 1115 1120 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 1125 1130 1135 Phe <210> 41 <211> 1137 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 41 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala 705 710 715 720 Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg 725 730 735 Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Phe 740 745 750 Ile Arg Arg Val Asn Arg Arg Ile Ala Glu Arg Thr Ser His Arg Val 755 760 765 Ala Asp Tyr Ala His Val Val Arg Val Leu Glu Phe Phe Gln Cys His 770 775 780 Ser His Pro Ala His Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met 785 790 795 800 Ser Arg His Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu 805 810 815 Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp 820 825 830 Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr 835 840 845 Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu His Ala Phe Ala Asp Ser 850 855 860 Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln 865 870 875 880 Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr 885 890 895 Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg 900 905 910 Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 915 920 925 Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val 930 935 940 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 945 950 955 960 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 965 970 975 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 980 985 990 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 995 1000 1005 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 1010 1015 1020 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 1025 1030 1035 1040 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 1045 1050 1055 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 1060 1065 1070 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 1075 1080 1085 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 1090 1095 1100 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 1105 1110 1115 1120 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 1125 1130 1135 Phe <210> 42 <211> 1171 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 42 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 725 730 735 Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Arg Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Glu Phe Ile Arg Arg Val Asn Arg Arg Ile Ala Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Asp Tyr Ala His Val Val Arg Val Leu Glu Phe Phe Gln 805 810 815 Cys His Ser His Pro Ala His Ala Phe Asp Glu Ala Met Thr Gln Phe 820 825 830 Gly Met Ser Arg His Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val 835 840 845 Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg 850 855 860 Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser 865 870 875 880 Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu His Ala Phe Ala 885 890 895 Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly 900 905 910 Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala 915 920 925 Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu 930 935 940 Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro 945 950 955 960 Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln 965 970 975 Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys 980 985 990 Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg 995 1000 1005 Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe 1010 1015 1020 Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys 1025 1030 1035 1040 Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val 1045 1050 1055 Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly 1060 1065 1070 Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn 1075 1080 1085 Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val 1090 1095 1100 Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr 1105 1110 1115 1120 Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala 1125 1130 1135 Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala 1140 1145 1150 Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu 1155 1160 1165 Ile Asn Phe 1170 <210> 43 <211> 1239 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 43 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg 805 810 815 Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu 820 825 830 Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu 835 840 845 Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile Ala Glu 850 855 860 Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg Val Leu 865 870 875 880 Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp Glu Ala 885 890 895 Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu Phe Arg 900 905 910 Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro 915 920 925 Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg 930 935 940 Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu 945 950 955 960 His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro 965 970 975 Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg 980 985 990 Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val 995 1000 1005 Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg 1010 1015 1020 Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile 1025 1030 1035 1040 Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 1045 1050 1055 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 1060 1065 1070 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 1075 1080 1085 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 1090 1095 1100 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 1105 1110 1115 1120 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 1125 1130 1135 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 1140 1145 1150 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 1155 1160 1165 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 1170 1175 1180 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 1185 1190 1195 1200 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 1205 1210 1215 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 1220 1225 1230 Asn Asn Gly Glu Ile Asn Phe 1235 <210> 44 <211> 1239 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 44 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg 805 810 815 Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu 820 825 830 Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu 835 840 845 Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile Ala Glu 850 855 860 Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg Val Leu 865 870 875 880 Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp Glu Ala 885 890 895 Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu Phe Arg 900 905 910 Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro 915 920 925 Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg 930 935 940 Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu 945 950 955 960 His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro 965 970 975 Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg 980 985 990 Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val 995 1000 1005 Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg 1010 1015 1020 Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile 1025 1030 1035 1040 Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 1045 1050 1055 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 1060 1065 1070 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 1075 1080 1085 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 1090 1095 1100 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 1105 1110 1115 1120 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 1125 1130 1135 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 1140 1145 1150 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 1155 1160 1165 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 1170 1175 1180 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 1185 1190 1195 1200 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 1205 1210 1215 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 1220 1225 1230 Asn Asn Gly Glu Ile Asn Phe 1235 <210> 45 <211> 1239 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 45 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg 805 810 815 Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu 820 825 830 Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu 835 840 845 Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile Ala Glu 850 855 860 Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg Val Leu 865 870 875 880 Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp Glu Ala 885 890 895 Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu Phe Arg 900 905 910 Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro 915 920 925 Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg 930 935 940 Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu 945 950 955 960 His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro 965 970 975 Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg 980 985 990 Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val 995 1000 1005 Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg 1010 1015 1020 Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile 1025 1030 1035 1040 Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 1045 1050 1055 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 1060 1065 1070 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 1075 1080 1085 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 1090 1095 1100 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 1105 1110 1115 1120 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 1125 1130 1135 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 1140 1145 1150 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 1155 1160 1165 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 1170 1175 1180 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 1185 1190 1195 1200 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 1205 1210 1215 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 1220 1225 1230 Asn Asn Gly Glu Ile Asn Phe 1235 <210> 46 <211> 1239 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 46 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg 805 810 815 Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu 820 825 830 Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu 835 840 845 Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile Ala Glu 850 855 860 Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg Val Leu 865 870 875 880 Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp Glu Ala 885 890 895 Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu Phe Arg 900 905 910 Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro 915 920 925 Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg 930 935 940 Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu 945 950 955 960 His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro 965 970 975 Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg 980 985 990 Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val 995 1000 1005 Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg 1010 1015 1020 Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile 1025 1030 1035 1040 Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 1045 1050 1055 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 1060 1065 1070 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 1075 1080 1085 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 1090 1095 1100 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 1105 1110 1115 1120 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 1125 1130 1135 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 1140 1145 1150 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 1155 1160 1165 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 1170 1175 1180 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 1185 1190 1195 1200 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 1205 1210 1215 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 1220 1225 1230 Asn Asn Gly Glu Ile Asn Phe 1235 <210> 47 <211> 1239 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 47 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg 805 810 815 Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu 820 825 830 Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu 835 840 845 Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile Ala Glu 850 855 860 Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg Val Leu 865 870 875 880 Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp Glu Ala 885 890 895 Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu Phe Arg 900 905 910 Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro 915 920 925 Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg 930 935 940 Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu 945 950 955 960 His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro 965 970 975 Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg 980 985 990 Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val 995 1000 1005 Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg 1010 1015 1020 Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile 1025 1030 1035 1040 Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 1045 1050 1055 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 1060 1065 1070 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 1075 1080 1085 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 1090 1095 1100 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 1105 1110 1115 1120 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 1125 1130 1135 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 1140 1145 1150 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 1155 1160 1165 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 1170 1175 1180 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 1185 1190 1195 1200 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 1205 1210 1215 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 1220 1225 1230 Asn Asn Gly Glu Ile Asn Phe 1235 <210> 48 <211> 1239 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 48 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg 805 810 815 Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu 820 825 830 Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu 835 840 845 Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile Ala Glu 850 855 860 Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg Val Leu 865 870 875 880 Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp Glu Ala 885 890 895 Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu Phe Arg 900 905 910 Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu Pro Pro 915 920 925 Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg 930 935 940 Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr Ser Leu 945 950 955 960 His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro 965 970 975 Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg 980 985 990 Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val 995 1000 1005 Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg 1010 1015 1020 Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile 1025 1030 1035 1040 Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 1045 1050 1055 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 1060 1065 1070 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 1075 1080 1085 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 1090 1095 1100 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 1105 1110 1115 1120 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 1125 1130 1135 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 1140 1145 1150 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 1155 1160 1165 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 1170 1175 1180 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 1185 1190 1195 1200 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 1205 1210 1215 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 1220 1225 1230 Asn Asn Gly Glu Ile Asn Phe 1235 <210> 49 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 49 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 785 790 795 800 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu 835 840 845 Ser Arg Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val 850 855 860 Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys 865 870 875 880 Gly Leu Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile 885 890 895 Ala Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg 900 905 910 Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp 915 920 925 Glu Ala Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu 930 935 940 Phe Arg Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu 945 950 955 960 Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met 965 970 975 Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr 980 985 990 Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro 995 1000 1005 Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg 1010 1015 1020 Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val 1025 1030 1035 1040 Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser 1045 1050 1055 Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp 1060 1065 1070 Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 1075 1080 1085 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 1090 1095 1100 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 1105 1110 1115 1120 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 1125 1130 1135 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 1140 1145 1150 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 1155 1160 1165 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 1170 1175 1180 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 1185 1190 1195 1200 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 1205 1210 1215 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 1220 1225 1230 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 1235 1240 1245 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 1250 1255 1260 Lys Phe Asn Asn Gly Glu Ile Asn Phe 1265 1270 <210> 50 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 50 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 785 790 795 800 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu 835 840 845 Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val 850 855 860 Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys 865 870 875 880 Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile 885 890 895 Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg 900 905 910 Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp 915 920 925 Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu 930 935 940 Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu 945 950 955 960 Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met 965 970 975 Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala 980 985 990 Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro 995 1000 1005 Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg 1010 1015 1020 Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val 1025 1030 1035 1040 Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser 1045 1050 1055 Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp 1060 1065 1070 Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 1075 1080 1085 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 1090 1095 1100 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 1105 1110 1115 1120 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 1125 1130 1135 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 1140 1145 1150 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 1155 1160 1165 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 1170 1175 1180 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 1185 1190 1195 1200 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 1205 1210 1215 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 1220 1225 1230 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 1235 1240 1245 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 1250 1255 1260 Lys Phe Asn Asn Gly Glu Ile Asn Phe 1265 1270 <210> 51 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 51 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 785 790 795 800 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu 835 840 845 Ser Arg Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val 850 855 860 Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys 865 870 875 880 Gly Leu Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg Arg Ile 885 890 895 Ala Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val Val Arg 900 905 910 Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala Phe Asp 915 920 925 Glu Ala Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val Gln Leu 930 935 940 Phe Arg Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly Thr Leu 945 950 955 960 Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met 965 970 975 Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Thr 980 985 990 Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro 995 1000 1005 Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg 1010 1015 1020 Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val 1025 1030 1035 1040 Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser 1045 1050 1055 Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp 1060 1065 1070 Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 1075 1080 1085 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 1090 1095 1100 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 1105 1110 1115 1120 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 1125 1130 1135 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 1140 1145 1150 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 1155 1160 1165 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 1170 1175 1180 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 1185 1190 1195 1200 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 1205 1210 1215 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 1220 1225 1230 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 1235 1240 1245 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 1250 1255 1260 Lys Phe Asn Asn Gly Glu Ile Asn Phe 1265 1270 <210> 52 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 52 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 785 790 795 800 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 835 840 845 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 850 855 860 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala 865 870 875 880 Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 885 890 895 Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val 900 905 910 Lys Lys Gly Leu Pro His Ala Pro Glu Phe Ile Arg Arg Val Asn Arg 915 920 925 Arg Ile Ala Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala His Val 930 935 940 Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala His Ala 945 950 955 960 Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Val 965 970 975 Gln Leu Phe Arg Arg Val Gly Val Thr Glu Phe Glu Ala Arg Tyr Gly 980 985 990 Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser 995 1000 1005 Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp 1010 1015 1020 Gln Thr Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp 1025 1030 1035 1040 Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg 1045 1050 1055 Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln 1060 1065 1070 Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro 1075 1080 1085 Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu 1090 1095 1100 Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu 1105 1110 1115 1120 Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr 1125 1130 1135 Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu 1140 1145 1150 Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly 1155 1160 1165 Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val 1170 1175 1180 Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser 1185 1190 1195 1200 Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr 1205 1210 1215 Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp 1220 1225 1230 Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val 1235 1240 1245 Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn 1250 1255 1260 His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu 1265 1270 1275 1280 Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val 1285 1290 1295 Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1300 1305 <210> 53 <211> 1341 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 53 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 785 790 795 800 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 835 840 845 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 850 855 860 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 865 870 875 880 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 885 890 895 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile 900 905 910 Val Ala Gln Leu Ser Arg Arg Asp Pro Ala Leu Ala Ala Leu Thr Asn 915 920 925 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp 930 935 940 Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Phe Ile Arg Arg Val 945 950 955 960 Asn Arg Arg Ile Ala Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala 965 970 975 His Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala 980 985 990 His Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg His Gly 995 1000 1005 Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Phe Glu Ala Arg 1010 1015 1020 Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln 1025 1030 1035 1040 Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr 1045 1050 1055 Pro Asp Gln Thr Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp 1060 1065 1070 Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser 1075 1080 1085 Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala 1090 1095 1100 Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His 1105 1110 1115 1120 Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly 1125 1130 1135 Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu 1140 1145 1150 Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His 1155 1160 1165 Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg 1170 1175 1180 Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr 1185 1190 1195 1200 Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr 1205 1210 1215 Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala 1220 1225 1230 Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln 1235 1240 1245 Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn 1250 1255 1260 Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu 1265 1270 1275 1280 Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg 1285 1290 1295 Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu 1300 1305 1310 Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu 1315 1320 1325 Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1330 1335 1340 <210> 54 <211> 1341 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 54 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 835 840 845 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 850 855 860 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 865 870 875 880 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 885 890 895 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile 900 905 910 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 915 920 925 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp 930 935 940 Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val 945 950 955 960 Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala 965 970 975 Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala 980 985 990 Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly 995 1000 1005 Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg 1010 1015 1020 Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln 1025 1030 1035 1040 Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr 1045 1050 1055 Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp 1060 1065 1070 Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser 1075 1080 1085 Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala 1090 1095 1100 Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His 1105 1110 1115 1120 Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly 1125 1130 1135 Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu 1140 1145 1150 Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His 1155 1160 1165 Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg 1170 1175 1180 Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr 1185 1190 1195 1200 Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr 1205 1210 1215 Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala 1220 1225 1230 Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln 1235 1240 1245 Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn 1250 1255 1260 Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu 1265 1270 1275 1280 Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg 1285 1290 1295 Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu 1300 1305 1310 Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu 1315 1320 1325 Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1330 1335 1340 <210> 55 <211> 1341 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 55 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 835 840 845 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 850 855 860 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 865 870 875 880 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 885 890 895 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile 900 905 910 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 915 920 925 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp 930 935 940 Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val 945 950 955 960 Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala 965 970 975 Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala 980 985 990 Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly 995 1000 1005 Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg 1010 1015 1020 Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln 1025 1030 1035 1040 Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr 1045 1050 1055 Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp 1060 1065 1070 Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser 1075 1080 1085 Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala 1090 1095 1100 Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His 1105 1110 1115 1120 Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly 1125 1130 1135 Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu 1140 1145 1150 Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His 1155 1160 1165 Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg 1170 1175 1180 Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr 1185 1190 1195 1200 Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr 1205 1210 1215 Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala 1220 1225 1230 Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln 1235 1240 1245 Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn 1250 1255 1260 Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu 1265 1270 1275 1280 Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg 1285 1290 1295 Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu 1300 1305 1310 Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu 1315 1320 1325 Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1330 1335 1340 <210> 56 <211> 51 <212> DNA <213> Arabidopsis <400> 56 tatcaagatt ctcttcactt ctctctgtca caccgatgtt tacttctggg a 51 <210> 57 <211> 50 <212> DNA <213> Arabidopsis <400> 57 tccggatgct cctcttgaca aggtctgtat tgtcagttgt ggtttgtcta 50 <210> 58 <211> 48 <212> DNA <213> Arabidopsis <400> 58 ccggatgctc ctcttgacaa ggtctgtatt gtcagttgtg gtttgtct 48 <210> 59 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> modified Arabidopsis <400> 59 ccggatgctc ctcttgacaa ttgtcagttg tggtttgtct 40 <210> 60 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> modified Arabidopsis <400> 60 ccggatgctc ctcttgacaa gtattgtcag ttgtggtttg tct 43 <210> 61 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> modified Arabidopsis <400> 61 ccggatgctc ctcttgacaa ttgtggtttg tct 33 <210> 62 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> modified Arabidopsis <400> 62 ccggatgctc ctcttgacaa ggattgtcag ttgtggtttg tct 43 <210> 63 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> modified Arabidopsis <400> 63 ccggatgctc ctcttgacaa attgtcagtt gtggtttgtc t 41 <210> 64 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> modified Arabidopsis <400> 64 ccggatgctc ctcttgacaa ggtattgtca gttgtggttt gtct 44 <210> 65 <211> 34 <212> PRT <213> Xanthomonas gardneri <400> 65 Leu Asp Thr Gly Gln Leu Phe Lys Ile Ala Lys Arg Gly Gly Val Thr 1 5 10 15 Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro 20 25 30 Leu Asn <210> 66 <211> 34 <212> PRT <213> Xanthomonas campestris <400> 66 Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr 1 5 10 15 Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro 20 25 30 Leu Asn <210> 67 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 67 Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr 1 5 10 15 Ala Val Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro 20 25 30 Leu Asn <210> 68 <211> 34 <212> PRT <213> Xanthomonas citri <400> 68 Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr 1 5 10 15 Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro 20 25 30 Leu Asn <210> 69 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 69 Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr 1 5 10 15 Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro 20 25 30 Leu Asn <210> 70 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 70 Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr 1 5 10 15 Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro 20 25 30 Leu Asn <210> 71 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 71 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 72 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 72 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 785 790 795 800 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 835 840 845 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 850 855 860 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala 865 870 875 880 Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 885 890 895 Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val 900 905 910 Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg 915 920 925 Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val 930 935 940 Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala 945 950 955 960 Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val 965 970 975 Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly 980 985 990 Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser 995 1000 1005 Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp 1010 1015 1020 Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp 1025 1030 1035 1040 Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg 1045 1050 1055 Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln 1060 1065 1070 Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro 1075 1080 1085 Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu 1090 1095 1100 Pro Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu 1105 1110 1115 1120 Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr 1125 1130 1135 Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu 1140 1145 1150 Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly 1155 1160 1165 Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val 1170 1175 1180 Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser 1185 1190 1195 1200 Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr 1205 1210 1215 Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp 1220 1225 1230 Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val 1235 1240 1245 Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn 1250 1255 1260 His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu 1265 1270 1275 1280 Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val 1285 1290 1295 Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 1300 1305 <210> 73 <211> 1409 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 73 Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp 1 5 10 15 Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg 20 25 30 Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val 35 40 45 Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu 50 55 60 Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser 65 70 75 80 Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu 85 90 95 Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser 100 105 110 Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp 115 120 125 Asp Glu Ala Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr 130 135 140 Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala 145 150 155 160 Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln 165 170 175 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 180 185 190 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 195 200 205 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 210 215 220 Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala 225 230 235 240 Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp 245 250 255 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu 260 265 270 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala 275 280 285 Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn 290 295 300 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Ala Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 405 410 415 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 675 680 685 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 740 745 750 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly 755 760 765 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 770 775 780 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 785 790 795 800 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 805 810 815 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 820 825 830 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 835 840 845 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 850 855 860 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 865 870 875 880 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 885 890 895 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 900 905 910 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 915 920 925 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 930 935 940 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 945 950 955 960 Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 965 970 975 Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala 980 985 990 Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg 995 1000 1005 Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu 1010 1015 1020 Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val 1025 1030 1035 1040 Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His 1045 1050 1055 Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met 1060 1065 1070 Ser Arg Asn Gly Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu 1075 1080 1085 Leu Glu Ala Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp 1090 1095 1100 Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr 1105 1110 1115 1120 Ser Ala Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser 1125 1130 1135 Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln 1140 1145 1150 Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr 1155 1160 1165 Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg 1170 1175 1180 Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 1185 1190 1195 1200 Arg Ile Trp Gly Gly Leu Pro Asp Pro Ile Ser Arg Ser Gln Leu Val 1205 1210 1215 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 1220 1225 1230 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 1235 1240 1245 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 1250 1255 1260 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 1265 1270 1275 1280 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 1285 1290 1295 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 1300 1305 1310 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 1315 1320 1325 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 1330 1335 1340 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 1345 1350 1355 1360 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 1365 1370 1375 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 1380 1385 1390 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 1395 1400 1405 Phe <210> 74 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 74 Lys Ile Ala Lys Arg Gly Gly Val 1 5 <210> 75 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 75 Lys Ile Ala Asn Gly Gly Gly Val 1 5 <210> 76 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 76 Lys Ile Ala Asn Ile Gly Gly Val 1 5 <210> 77 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 77 Lys Ile Ala His Asp Gly Gly Val 1 5 <210> 78 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 78 Lys Ile Ala Asn Asn Gly Gly Val 1 5 <210> 79 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 79 Lys Ile Ala Lys Arg Gly Gly Val 1 5 <210> 80 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 80 Lys Ile Ala Ser Asn Gly Gly Gly Val 1 5 <210> 81 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 81 Lys Ile Ala Ser Asn Ile Gly Gly Val 1 5 <210> 82 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 82 Lys Ile Ala Ser His Asp Gly Gly Val 1 5 <210> 83 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 83 Lys Ile Ala Ser Asn Asn Gly Gly Val 1 5 <210> 84 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 84 Lys Ile Ala Lys Arg Gly Gly Val 1 5 <210> 85 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 85 Lys Ile Ala Lys Asn Gly Gly Gly Val 1 5 <210> 86 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 86 Lys Ile Ala Lys Asn Ile Gly Gly Val 1 5 <210> 87 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 87 Lys Ile Ala Lys His Asp Gly Gly Val 1 5 <210> 88 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 88 Lys Ile Ala Lys Asn Asn Gly Gly Val 1 5 <210> 89 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 89 Lys Ile Ala Lys Arg Gly Gly Val 1 5 <210> 90 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 90 Lys Ile Ala Ser Asn Gly Gly Gly Lys 1 5 <210> 91 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 91 Lys Ile Ala Ser Asn Ile Gly Gly Lys 1 5 <210> 92 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 92 Lys Ile Ala Ser His Asp Gly Gly Lys 1 5 <210> 93 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 93 Lys Ile Ala Ser Asn Asn Gly Gly Lys 1 5

Claims (13)

  1. 서열-특이적 엔도뉴클레아제를 코딩하는 재조합 핵산을 포함하는 발현 벡터이며, 여기서 상기 재조합 핵산은 프로모터 서열에 작동가능하게 연결된, 뉴클레아제를 코딩하는 뉴클레오티드 서열에 연결된 서열-특이적 TAL 이펙터를 코딩하는 뉴클레오티드 서열을 포함하고, 상기 벡터는 플라스미드인 발현 벡터.
  2. 제1항에 있어서, 상기 뉴클레아제가 유형 II 제한 엔도뉴클레아제인 발현 벡터.
  3. 제2항에 있어서, 상기 뉴클레아제가 FokI인 발현 벡터.
  4. 제1항에 있어서, 상기 서열-특이적 TAL 이펙터를 코딩하는 뉴클레오티드 서열이, 특이적 DNA 서열을 인식하고 결합할 수 있는 고도의 가변 잔기를 갖는 다수의 탠덤(tandem) 반복물을 코딩하며, 여기서 상기 고도의 가변 잔기는 각 반복물의 N-말단으로부터의 아미노산 위치 12 및 13에 위치하는 것인 발현 벡터.
  5. 제4항에 있어서, 상기 반복물이 AvrBs3의 중심 영역으로부터 선택된 34개 아미노산 반복물인 발현 벡터.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 서열-특이적 TAL 이펙터를 코딩하는 뉴클레오티드 서열이, 절단된(truncated) tal 유전자를 함유하는 게이트웨이-레디 고카피 박테리아 클로닝 벡터(Gateway-ready high copy bacterial cloning vector)에 TAL 이펙터 반복물을 코딩하는 서열을 순차적으로 도입함으로써 조립된 것이며, 여기서 절단된 tal 유전자에는 중심 반복 영역은 결여되어 있으나 특징적인 마지막 반쪽 반복물은 함유되어 있는 것인 발현 벡터.
  7. 제1항 내지 제5항 중 어느 한 항에 따른 재조합 핵산을 전사시키는 단계, 또는 상기 재조합 핵산을 전사 및 번역시키는 단계를 포함하는, 서열-특이적 엔도뉴클레아제 메신저 RNA (mRNA) 또는 단백질을 생성하는 방법.
  8. 제7항의 방법에 의해 얻을 수 있으며, 상기 재조합 핵산에 의해 코딩되는 뉴클레아제가 FokI인 서열-특이적 엔도뉴클레아제 mRNA.
  9. 제1항 내지 제5항 중 어느 한 항에 따른 재조합 핵산 또는
    상기 재조합 핵산을 전사시키는 단계, 또는 상기 재조합 핵산을 전사 및 번역시키는 단계를 포함하는 방법에 의해 생성된 mRNA
    를 포함하는 치료 조성물.
  10. 제9항에 있어서, 바이러스 질환의 치료에 사용하기 위한 치료 조성물.
  11. 세포에서의 표적화된 유전자 재조합을 위한 시험관내 방법이며,
    (a) 제1항 내지 제5항 중 어느 한 항에 따른 재조합 핵산 또는 상기 재조합 핵산으로부터 전사된 mRNA를 단리된 세포 내로 도입하는 단계이며,
    여기서 상기 mRNA는 선택된 DNA 표적 서열을 표적으로 하는 TAL 이펙터 엔도뉴클레아제를 코딩하고 상기 재조합 핵산에 의해 코딩되는 뉴클레아제는 FokI인 단계,
    (b) 상기 세포 내에서 TAL 이펙터 엔도뉴클레아제의 발현을 유도하는 단계, 및
    (c) 선택된 DNA 표적 서열이 돌연변이를 나타내는 세포를 확인하는 단계
    를 포함하고, 인간의 생식 계열 유전자 정체성은 변형시키지 않는 것인 시험관내 방법.
  12. 제11항에 있어서, 단계 (c)에서의 상기 돌연변이가 유전 물질의 결실, 유전 물질의 삽입, 또는 둘 다로 이루어진 군으로부터 선택되는 것인 시험관내 방법.
  13. 제11항에 있어서, 상기 세포가 곤충 세포, 식물 세포, 어류 세포 또는 포유동물 세포인 시험관내 방법.
KR1020197002716A 2009-12-10 2010-12-10 Tal 이펙터-매개된 dna 변형 KR102110725B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US28532409P 2009-12-10 2009-12-10
US61/285,324 2009-12-10
US35210810P 2010-06-07 2010-06-07
US61/352,108 2010-06-07
US36668510P 2010-07-22 2010-07-22
US61/366,685 2010-07-22
PCT/US2010/059932 WO2011072246A2 (en) 2009-12-10 2010-12-10 Tal effector-mediated dna modification

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020127017754A Division KR102110608B1 (ko) 2009-12-10 2010-12-10 Tal 이펙터-매개된 dna 변형

Publications (2)

Publication Number Publication Date
KR20190012274A KR20190012274A (ko) 2019-02-08
KR102110725B1 true KR102110725B1 (ko) 2020-05-13

Family

ID=43825298

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020197002716A KR102110725B1 (ko) 2009-12-10 2010-12-10 Tal 이펙터-매개된 dna 변형
KR1020127017754A KR102110608B1 (ko) 2009-12-10 2010-12-10 Tal 이펙터-매개된 dna 변형

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020127017754A KR102110608B1 (ko) 2009-12-10 2010-12-10 Tal 이펙터-매개된 dna 변형

Country Status (19)

Country Link
US (10) US8586363B2 (ko)
EP (3) EP2510096B2 (ko)
JP (3) JP2013513389A (ko)
KR (2) KR102110725B1 (ko)
CN (2) CN106834320B (ko)
AU (2) AU2010327998B2 (ko)
BR (1) BR112012014080A2 (ko)
CA (1) CA2783351C (ko)
DK (2) DK2816112T3 (ko)
ES (2) ES2696825T3 (ko)
HK (1) HK1205527A1 (ko)
HU (1) HUE041436T2 (ko)
IL (2) IL220234B (ko)
NO (1) NO2510096T3 (ko)
PL (2) PL2816112T3 (ko)
PT (2) PT2510096E (ko)
SG (1) SG181601A1 (ko)
TR (1) TR201815882T4 (ko)
WO (1) WO2011072246A2 (ko)

Families Citing this family (760)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120196370A1 (en) 2010-12-03 2012-08-02 Fyodor Urnov Methods and compositions for targeted genomic deletion
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
JP5798116B2 (ja) * 2009-06-30 2015-10-21 サンガモ バイオサイエンシーズ, インコーポレイテッド 生物活性のあるヌクレアーゼの迅速なスクリーニングおよびヌクレアーゼ修飾細胞の単離
KR102110725B1 (ko) 2009-12-10 2020-05-13 리전츠 오브 더 유니버스티 오브 미네소타 Tal 이펙터-매개된 dna 변형
EP2660318A1 (en) * 2010-02-09 2013-11-06 Sangamo BioSciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
WO2011139335A1 (en) * 2010-04-26 2011-11-10 Sangamo Biosciences, Inc. Genome editing of a rosa locus using zinc-finger nucleases
JP6208580B2 (ja) 2010-05-17 2017-10-04 サンガモ セラピューティクス, インコーポレイテッド 新規のdna結合タンパク質及びその使用
NZ708078A (en) 2010-06-02 2017-01-27 Evolva Nutrition Inc Recombinant production of steviol glycosides
EP2392208B1 (en) * 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
JP2013534417A (ja) * 2010-06-14 2013-09-05 アイオワ ステート ユニバーシティ リサーチ ファウンデーション,インコーポレーティッド Talエフェクターとfokiの融合タンパク質のヌクレアーゼ活性
EP2596011B1 (en) 2010-07-21 2018-10-03 Sangamo Therapeutics, Inc. Methods and compositions for modification of a hla locus
US10920242B2 (en) 2011-02-25 2021-02-16 Recombinetics, Inc. Non-meiotic allele introgression
US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
EP2678434B1 (en) * 2011-02-25 2018-11-07 Recombinetics, Inc. Genetically modified animals and methods for making the same
WO2012138939A1 (en) * 2011-04-05 2012-10-11 Philippe Duchateau New tale-protein scaffolds and uses thereof
KR102068107B1 (ko) 2011-04-27 2020-01-20 아미리스 인코퍼레이티드 게놈 변형 방법
CN103597082B (zh) 2011-06-06 2017-09-15 拜尔作物科学公司 用于在预选位点修饰植物基因组的方法和手段
JP6214530B2 (ja) 2011-07-15 2017-10-18 ザ ジェネラル ホスピタル コーポレイション 転写活性化因子様エフェクターの組立て方法
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
WO2013016446A2 (en) 2011-07-25 2013-01-31 Sangamo Biosciences, Inc. Methods and compositions for alteration of a cystic fibrosis transmembrane conductance regulator (cftr) gene
WO2013016434A1 (en) * 2011-07-27 2013-01-31 The Board Institute, Inc. Compositions and methods of treating head and neck cancer
WO2013019745A1 (en) * 2011-07-29 2013-02-07 Georgia Health Sciences University Methods and compositions for genetically modifiying cells
US20140309145A1 (en) * 2011-07-29 2014-10-16 Cellectis Sa High throughput method for assembly and cloning polynucleotides comprising highly similar polynucleotidic modules
CN102787125B (zh) * 2011-08-05 2013-12-04 北京大学 一种构建tale重复序列的方法
KR20200057799A (ko) 2011-08-08 2020-05-26 에볼바 에스아 스테비올 글리코시드의 재조합 생산
CN107287234A (zh) 2011-08-22 2017-10-24 拜尔作物科学公司 修饰植物基因组的方法和手段
JP6185916B2 (ja) 2011-09-21 2017-08-23 サンガモ セラピューティクス, インコーポレイテッド 導入遺伝子発現を制御するための方法および組成物
WO2013050593A1 (en) 2011-10-07 2013-04-11 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013050318A1 (en) 2011-10-07 2013-04-11 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013050611A1 (en) 2011-10-07 2013-04-11 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013053711A1 (en) 2011-10-10 2013-04-18 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013053686A1 (en) 2011-10-10 2013-04-18 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
EP2766487A1 (en) 2011-10-12 2014-08-20 Bayer CropScience AG Plants with decreased activity of a starch dephosphorylating enzyme
US20140283819A1 (en) 2011-10-12 2014-09-25 Bayer Cropscience Ag Plants with decreased activity of a starch dephosphorylating enzyme
AU2012326971C1 (en) 2011-10-21 2018-02-08 Kyushu University, National University Corporation Method for designing RNA binding protein utilizing PPR motif, and use thereof
EP2771457B1 (en) * 2011-10-27 2017-11-22 Sangamo Therapeutics, Inc. Methods and compositions for modification of the hprt locus
CN104093842B (zh) 2011-10-31 2016-12-07 先锋国际良种公司 改善植物耐旱性、氮利用效率和产量
AU2012340213B2 (en) * 2011-11-16 2017-12-07 Sangamo Therapeutics, Inc. Modified DNA-binding proteins and uses thereof
US20130137173A1 (en) * 2011-11-30 2013-05-30 Feng Zhang Nucleotide-specific recognition sequences for designer tal effectors
US10801017B2 (en) 2011-11-30 2020-10-13 The Broad Institute, Inc. Nucleotide-specific recognition sequences for designer TAL effectors
US8450107B1 (en) 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
US8497124B2 (en) 2011-12-05 2013-07-30 Factor Bioscience Inc. Methods and products for reprogramming cells to a less differentiated state
EP3835420A1 (en) 2011-12-05 2021-06-16 Factor Bioscience Inc. Methods and products for transfecting cells
EP2790708B1 (en) 2011-12-16 2024-10-23 Targetgene Biotechnologies Ltd. Compositions and methods for modifying a predetermined target nucleic acid sequence
DE102011122267A1 (de) 2011-12-23 2013-06-27 Kws Saat Ag Neue aus Pflanzen stammende cis-regulatorische Elemente für die Entwicklung Pathogen-responsiver chimärer Promotoren
WO2013101877A2 (en) 2011-12-29 2013-07-04 Iowa State University Research Foundation, Inc. Genetically modified plants with resistance to xanthomonas and other bacterial plant pathogens
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
EP2612918A1 (en) 2012-01-06 2013-07-10 BASF Plant Science Company GmbH In planta recombination
EA201400995A1 (ru) 2012-03-13 2015-02-27 Юниверсити Оф Гуэлф Способы повышения выносливости к тепловому стрессу и содержания аминокислот в растениях
US20150203864A1 (en) 2012-03-13 2015-07-23 University Of Guelph Myb55 promoter and use thereof
EP2825190B1 (en) * 2012-03-15 2016-11-30 Cellectis Repeat variable diresidues for targeting nucleotides
EP2828384B1 (en) 2012-03-23 2018-05-09 Cellectis Method to overcome dna chemical modifications sensitivity of engineered tale dna binding domains
CN102628037B (zh) * 2012-03-31 2013-07-24 西南大学 家蚕油蚕基因BmBlos2遗传改造系统及其制备方法和应用
EP2834357B1 (en) * 2012-04-04 2017-12-27 Life Technologies Corporation Tal-effector assembly platform, customized services, kits and assays
DK2839013T3 (da) 2012-04-18 2020-09-14 Univ Leland Stanford Junior Ikke-disruptiv-gen-targetering
CA2871008C (en) 2012-04-23 2022-11-22 Bayer Cropscience Nv Targeted genome engineering in plants
SG10201702445TA (en) 2012-04-25 2017-04-27 Regeneron Pharma Nuclease-mediated targeting with large targeting vectors
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
RU2658437C2 (ru) 2012-05-02 2018-06-21 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Направленная модификация малатдегидрогеназы
RU2650819C2 (ru) 2012-05-07 2018-04-17 Сангамо Терапьютикс, Инк. Способы и композиции для опосредованной нуклеазой направленной интеграции трансгенов
US11120889B2 (en) 2012-05-09 2021-09-14 Georgia Tech Research Corporation Method for synthesizing a nuclease with reduced off-site cleavage
HUE038850T2 (hu) 2012-05-25 2018-11-28 Univ California Eljárások és kompozíciók cél-DNS RNS-irányított módosításához és transzkripció RNS-irányított modulálásához
CA3133545C (en) 2012-05-25 2023-08-08 Cellectis Use of pre t alpha or functional variant thereof for expanding tcr alpha deficient t cells
CA2872128C (en) 2012-05-25 2017-09-19 Evolutionary Genomics, Inc. Dirigent gene eg261 and its orthologs and paralogs and their uses for pathogen resistance in plants
US9605274B2 (en) 2012-05-25 2017-03-28 Evolutionary Genomics, Inc. Dirigent gene EG261 and its orthologs and paralogs and their uses for pathogen resistance in plants
US9890364B2 (en) 2012-05-29 2018-02-13 The General Hospital Corporation TAL-Tet1 fusion proteins and methods of use thereof
US10815500B2 (en) * 2012-06-05 2020-10-27 Cellectis Transcription activator-like effector (TALE) fusion protein
US9815877B2 (en) 2012-06-07 2017-11-14 The Children's Hospital Of Philadelphia Controlled gene expression methods
MX2014015204A (es) 2012-06-12 2015-08-07 Genentech Inc Metodos y composiciones para generar alelos con inactivacion condicional.
BR112014031260A2 (pt) 2012-06-15 2019-08-20 Du Pont métodos e composições que envolvem variantes de als com preferência de substrato nativo
US20150225734A1 (en) * 2012-06-19 2015-08-13 Regents Of The University Of Minnesota Gene targeting in plants using dna viruses
AR091482A1 (es) * 2012-06-21 2015-02-04 Recombinetics Inc Celulas modificadas geneticamente y metodos par su obtencion
US20150291951A1 (en) * 2012-06-22 2015-10-15 Mayo Foundation For Medical Education And Research Genome editing
CA2878134A1 (en) 2012-07-06 2014-01-09 National Institute Of Agrobiological Sciences Wheat with increased number of grains and method for producing the same, and agent for increasing the number of wheat grains
EP2872154B1 (en) 2012-07-11 2017-05-31 Sangamo BioSciences, Inc. Methods and compositions for delivery of biologics
HUE041553T2 (hu) 2012-07-11 2019-05-28 Sangamo Therapeutics Inc Lizoszomális tárolási betegségek (LSD) kezelése és génterápia
US20140072961A1 (en) * 2012-07-11 2014-03-13 University of Nevada, Las Vegas Method of Genome Surgery with Paired, Permeant Endonuclease Excision
EP2687605A1 (en) 2012-07-19 2014-01-22 Biogemma Method for performing homologous recombination
EP2877488B1 (en) 2012-07-24 2021-02-24 Cellectis New modular base-specific nucleic acid binding domains from burkholderia rhizoxinica proteins
CN105188767A (zh) 2012-07-25 2015-12-23 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
SG11201500852WA (en) 2012-08-29 2015-04-29 Sangamo Biosciences Inc Methods and compositions for treatment of a genetic condition
US10378007B2 (en) * 2012-09-03 2019-08-13 Cellectis Methods for modulating TAL specificity
AU2013312801B2 (en) * 2012-09-04 2018-11-15 The Scripps Research Institute Chimeric polypeptides having targeted binding specificity
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
CN105264067B (zh) 2012-09-07 2020-11-10 美国陶氏益农公司 Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
EP3257952B1 (en) 2012-09-11 2020-02-12 Life Technologies Corporation Nucleic acid amplification
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
EP2906602B1 (en) 2012-10-12 2019-01-16 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
MX2015005255A (es) * 2012-10-30 2015-10-29 Recombinetics Inc Control de la maduracion sexual en animales.
US20150291967A1 (en) 2012-10-31 2015-10-15 Luc Mathis Coupling herbicide resistance with targeted insertion of transgenes in plants
AU2013337832B2 (en) 2012-11-01 2019-04-04 Cellectis Plants for production of therapeutic proteins
RU2019143431A (ru) 2012-11-01 2020-04-28 Фэктор Байосайенс Инк. Способы и продукты для экспрессии белков в клетках
US9756871B2 (en) 2012-11-20 2017-09-12 J.R. Simplot Company TAL-mediated transfer DNA insertion
AU2013355327A1 (en) 2012-12-05 2015-06-11 Sangamo Therapeutics, Inc. Methods and compositions for regulation of metabolic disorders
EP3141604A1 (en) 2012-12-06 2017-03-15 Sigma-Aldrich Co. LLC Crispr-based genome modification and regulation
CN103013954B (zh) * 2012-12-17 2014-03-05 中国科学院遗传与发育生物学研究所 水稻基因badh2的定点敲除系统及其应用
US9708589B2 (en) 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases
WO2014100525A2 (en) 2012-12-21 2014-06-26 Pioneer Hi-Bred International, Inc. Compositions and methods for auxin-analog conjugation
CA2895909C (en) 2012-12-21 2021-07-06 Cellectis Potatoes with reduced cold-induced sweetening
CA3171770A1 (en) 2013-02-06 2014-08-14 Evolva Sa Methods for improved production of rebaudioside d and rebaudioside m
AU2014214719B2 (en) * 2013-02-07 2020-02-13 The General Hospital Corporation Tale transcriptional activators
BR112015019160A2 (pt) 2013-02-11 2017-08-22 Dalgaard Mikkelsen Michael Produção de glicosídeos de esteviol em hospedeiros recombinantes
CN103319574A (zh) * 2013-02-16 2013-09-25 清华大学 分离的多肽及其应用
KR102209979B1 (ko) 2013-02-20 2021-02-01 리제너론 파마슈티칼스 인코포레이티드 랫트의 유전자 변형
US20150353885A1 (en) 2013-02-21 2015-12-10 Cellectis Method to counter-select cells or organisms by linking loci to nuclease components
CA2901676C (en) 2013-02-25 2023-08-22 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
AU2014223243B2 (en) * 2013-03-01 2019-10-17 Regents Of The University Of Minnesota Talen-based gene correction
WO2014164828A2 (en) 2013-03-11 2014-10-09 Pioneer Hi-Bred International, Inc. Methods and compositions employing a sulfonylurea-dependent stabilization domain
EP2970935A1 (en) 2013-03-14 2016-01-20 Pioneer Hi-Bred International, Inc. Compositions having dicamba decarboxylase activity and methods of use
GB2527450A (en) 2013-03-14 2015-12-23 Caribou Biosciences Inc Compositions and methods of nucleic acid-targeting nucleic acids
US20140287419A1 (en) 2013-03-14 2014-09-25 Arzeda Corp. Compositions Having Dicamba Decarboxylase Activity and Methods of Use
US10113162B2 (en) 2013-03-15 2018-10-30 Cellectis Modifying soybean oil composition through targeted knockout of the FAD2-1A/1B genes
US11039586B2 (en) 2013-03-15 2021-06-22 Monsanto Technology Llc Creation and transmission of megaloci
US20140363561A1 (en) * 2013-03-15 2014-12-11 J.R. Simplot Company Tal-mediated transfer dna insertion
AU2014227831B2 (en) * 2013-03-15 2020-01-30 Regents Of The University Of Minnesota Engineering plant genomes using CRISPR/Cas systems
US10793867B2 (en) 2013-03-15 2020-10-06 Monsanto Technology, Llc Methods for targeted transgene-integration using custom site-specific DNA recombinases
CA2906406C (en) * 2013-03-15 2023-03-14 Cellectis Modifying soybean oil composition through targeted knockout of the fad2-1a/1b genes
BR112015025006A2 (pt) 2013-04-02 2017-10-10 Bayer Cropscience Nv engenharia genômica alvejada em eucariontes
CN105263312A (zh) 2013-04-05 2016-01-20 美国陶氏益农公司 用于在植物基因组内整合外源序列的方法和组合物
AU2014253942B9 (en) 2013-04-16 2020-08-13 Regeneron Pharmaceuticals, Inc. Targeted modification of rat genome
WO2014169810A1 (zh) * 2013-04-16 2014-10-23 深圳华大基因科技服务有限公司 分离的寡核苷酸及其用途
CA2910050A1 (en) 2013-04-22 2014-10-30 Kyushu University, National University Corporation Dna-binding protein using ppr motif, and use thereof
EP2796558A1 (en) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
CN103233004B (zh) * 2013-04-28 2015-04-29 新疆农垦科学院 一种人工dna分子及检测目标基因表达的方法
WO2014186435A2 (en) 2013-05-14 2014-11-20 University Of Georgia Research Foundation, Inc. Compositions and methods for reducing neointima formation
EP3008186B1 (en) * 2013-06-14 2018-11-28 Cellectis Methods for non-transgenic genome editing in plants
CN113425857A (zh) 2013-06-17 2021-09-24 布罗德研究所有限公司 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途
JP6665088B2 (ja) * 2013-06-17 2020-03-13 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための最適化されたCRISPR−Cas二重ニッカーゼ系、方法および組成物
EP2818867A1 (en) 2013-06-27 2014-12-31 INSERM (Institut National de la Santé et de la Recherche Médicale) Antibodies conjugated to at least one nucleic acid molecule and their use in multiplex immuno-detection assays
US20160369268A1 (en) * 2013-07-01 2016-12-22 The Board Of Regents Of The University Of Texas System Transcription activator-like effector (tale) libraries and methods of synthesis and use
US10563225B2 (en) * 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
ES2915377T3 (es) 2013-08-02 2022-06-22 Enevolv Inc Procedimientos y células huésped para ingeniería genómica, de vías y biomolécular
US10006011B2 (en) 2013-08-09 2018-06-26 Hiroshima University Polypeptide containing DNA-binding domain
JP5931022B2 (ja) 2013-08-09 2016-06-08 国立大学法人広島大学 Dna結合ドメインを含むポリペプチド
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
PL3041345T3 (pl) 2013-09-04 2024-07-22 KWS SAAT SE & Co. KGaA Roślina odporna na helminthosporium turcicum
DE102013014637A1 (de) 2013-09-04 2015-03-05 Kws Saat Ag HELMlNTHOSPORlUM TURClCUM-RESlSTENTE PFLANZE
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
ES2972527T3 (es) 2013-09-11 2024-06-13 Eagle Biologics Inc Formulaciones proteicas líquidas que contienen colorantes orgánicos solubles en agua
PT3049116T (pt) * 2013-09-23 2019-04-03 Rensselaer Polytech Inst Distribuição genética mediada por nanopartículas, edição genómica e modificação direcionada a ligantes em várias populações celulares
AU2014334590A1 (en) 2013-10-18 2016-04-28 Pioneer Hi-Bred International, Inc. Glyphosate-N-acetyltransferase (GLYAT) sequences and methods of use
EP3060682B1 (en) 2013-10-25 2023-08-30 Livestock Improvement Corporation Limited Genetic markers and uses therefor
JP2016535781A (ja) 2013-11-03 2016-11-17 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 経皮薬物送達のためのイオン性液体
US10273493B2 (en) 2013-11-04 2019-04-30 Dow Agrosciences Llc Optimal maize loci
RU2016120636A (ru) 2013-11-04 2017-12-06 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Оптимальные локусы сои
TWI659103B (zh) 2013-11-04 2019-05-11 陶氏農業科學公司 最適大豆基因座(二)
UY35815A (es) 2013-11-04 2015-05-29 Dow Agrosciences Llc ?locus óptimos del maíz?
JP5900942B2 (ja) 2013-11-06 2016-04-06 国立大学法人広島大学 核酸挿入用ベクター
WO2015070062A1 (en) * 2013-11-07 2015-05-14 Massachusetts Institute Of Technology Cell-based genomic recorded accumulative memory
EP2878667A1 (en) 2013-11-29 2015-06-03 Institut Pasteur TAL effector means useful for partial or full deletion of DNA tandem repeats
CN103710360A (zh) * 2013-12-03 2014-04-09 南方医科大学珠江医院 提高HepGL肝癌细胞氨基甲酰磷酸合成酶表达的方法
SI3080279T1 (sl) 2013-12-11 2019-01-31 Regeneron Pharmaceuticals, Inc. Postopki in sestavki za ciljano spremembo genoma
SG10201700961TA (en) 2013-12-11 2017-04-27 Regeneron Pharma Methods and compositions for the targeted modification of a genome
JP6793547B2 (ja) 2013-12-12 2020-12-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
AU2014362248A1 (en) 2013-12-12 2016-06-16 Massachusetts Institute Of Technology Compositions and methods of use of CRISPR-Cas systems in nucleotide repeat disorders
DK3079725T3 (da) 2013-12-12 2020-01-20 Broad Inst Inc Administration, brug og terapeutiske anvendelser af crispr-cas-systemerne og sammensætninger til genomredigering
JP2017505756A (ja) 2013-12-13 2017-02-23 ザ ジェネラル ホスピタル コーポレイション 可溶性高分子量(hmw)タウ種およびその用途
WO2015092460A1 (en) 2013-12-18 2015-06-25 INSERM (Institut National de la Santé et de la Recherche Médicale) New gene mutations for the diagnosis of arthrogryposis multiplex congenita and congenital peripheral neuropathies disease
AU2014368982B2 (en) 2013-12-19 2021-03-25 Amyris, Inc. Methods for genomic integration
US10233456B2 (en) * 2014-01-30 2019-03-19 The Board Of Trustees Of The University Of Arkansas Method, vectors, cells, seeds and kits for stacking genes into a single genomic site
AU2015210769B2 (en) 2014-01-31 2019-02-07 Factor Bioscience Inc. Methods and products for nucleic acid production and delivery
PL3102673T3 (pl) 2014-02-03 2020-11-02 Sangamo Therapeutics, Inc. Sposoby i kompozycje do leczenia talasemii beta
CN104844696A (zh) * 2014-02-19 2015-08-19 北京大学 一种转录激活子样效应因子功能蛋白设计、合成及其应用
TW201538518A (zh) 2014-02-28 2015-10-16 Dow Agrosciences Llc 藉由嵌合基因調控元件所賦予之根部特異性表現
CN111471675A (zh) * 2014-03-05 2020-07-31 国立大学法人神户大学 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体
US10612041B2 (en) 2014-03-21 2020-04-07 The Board Of Trustees Of The Leland Stanford Junior University Genome editing without nucleases
US10349639B2 (en) 2014-03-26 2019-07-16 University Of Maryland, College Park Targeted genome editing in zygotes of domestic large animals
US10507232B2 (en) * 2014-04-02 2019-12-17 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
WO2015164748A1 (en) 2014-04-24 2015-10-29 Sangamo Biosciences, Inc. Engineered transcription activator like effector (tale) proteins
BR112016024945A2 (pt) 2014-04-28 2017-10-24 Recombinetics Inc edição de gene multiplex em suínos
WO2015165275A1 (zh) * 2014-04-30 2015-11-05 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路
CN104611365B (zh) * 2014-07-17 2017-06-16 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路
WO2015165276A1 (zh) * 2014-04-30 2015-11-05 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路的试剂盒
DE102014106327A1 (de) 2014-05-07 2015-11-12 Universitätsklinikum Hamburg-Eppendorf (UKE) TAL-Effektornuklease zum gezielten Knockout des HIV-Korezeptors CCR5
US11918695B2 (en) 2014-05-09 2024-03-05 Yale University Topical formulation of hyperbranched polymer-coated particles
EP3140269B1 (en) 2014-05-09 2023-11-29 Yale University Hyperbranched polyglycerol-coated particles and methods of making and using thereof
WO2015175642A2 (en) 2014-05-13 2015-11-19 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a disease
HUE049776T2 (hu) 2014-06-06 2020-10-28 Regeneron Pharma Módszerek és készítmények egy célzott lókusz módosítására
WO2015189409A1 (en) 2014-06-12 2015-12-17 Sesvanderhave N.V. Transformation method of sugar beet protoplasts by talen platform technology
WO2015188870A1 (en) 2014-06-12 2015-12-17 Sesvanderhave N.V. Use of selectable marker gene in sugar beet protoplasts transformation method and system
EP3158072B1 (en) * 2014-06-20 2021-01-13 Cellectis Potatoes with reduced granule-bound starch synthase
LT3354732T (lt) 2014-06-23 2020-04-10 Regeneron Pharmaceuticals, Inc. Nukleazės tarpininkaujamas dnr surinkimas
PT3161128T (pt) 2014-06-26 2018-11-21 Regeneron Pharma Métodos e composições para modificações genéticas alvejadas e métodos de utilização
WO2016000237A1 (en) 2014-07-03 2016-01-07 Pioneer Overseas Corporation Plants having enhanced tolerance to insect pests and related constructs and methods involving insect tolerance genes
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
CN114410493A (zh) 2014-08-11 2022-04-29 埃沃尔瓦公司 在重组宿主中生产甜菊醇糖苷
CN107429241A (zh) 2014-08-14 2017-12-01 北京百奥赛图基因生物技术有限公司 Dna敲入系统
CN105367628B (zh) * 2014-08-19 2019-07-26 深圳华大基因农业控股有限公司 一对高效编辑水稻waxy基因的talen其识别打靶位点及其应用
CN105367631B (zh) * 2014-08-25 2019-05-14 深圳华大基因科技有限公司 一种转录激活子样效应因子核酸酶及其编码基因和应用
CN106715699A (zh) 2014-09-07 2017-05-24 西莱克塔生物科技公司 用于减弱抗病毒转移载体免疫应答的方法和组合物
CN107109358B (zh) 2014-09-09 2022-08-02 埃沃尔瓦公司 在重组宿主中生产甜菊醇糖苷
KR101528812B1 (ko) * 2014-09-18 2015-06-15 강원대학교산학협력단 SETDB1 HMTase 발현 저해방법
CN105440111B (zh) * 2014-09-30 2019-08-13 深圳华大基因研究院 一对转录激活子样效应因子核酸酶及其编码序列与应用
CN106999510B (zh) 2014-10-01 2021-04-30 伊格尔生物制品有限公司 含有粘度降低剂的多糖和核酸制剂
CN104357440B (zh) * 2014-10-09 2017-06-13 中山大学 一对靶向斑马鱼Forkhead box n1基因的Talen识别序列及其mRNA制备方法
CA2963693A1 (en) 2014-10-10 2016-04-14 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
KR20170070136A (ko) 2014-10-15 2017-06-21 리제너론 파마슈티칼스 인코포레이티드 만능성 세포를 생성하거나 유지하는 방법 및 조성물
WO2016066671A1 (en) 2014-10-29 2016-05-06 INSERM (Institut National de la Santé et de la Recherche Médicale) Method for treating resistant cancers using progastrin inhibitors
US10920215B2 (en) 2014-11-04 2021-02-16 National University Corporation Kobe University Method for modifying genome sequence to introduce specific mutation to targeted DNA sequence by base-removal reaction, and molecular complex used therein
WO2016077273A1 (en) * 2014-11-11 2016-05-19 Q Therapeutics, Inc. Engineering mesenchymal stem cells using homologous recombination
DE102014016667B4 (de) 2014-11-12 2024-03-07 Kws Saat Se Haploideninduktoren
WO2016077429A1 (en) 2014-11-12 2016-05-19 Recombinetics, Inc. Heterozygous modifications of tumor suppressor genes and swine model of neurofibromatosis type 1
US20160138040A1 (en) * 2014-11-13 2016-05-19 Cellectis Brassica engineered to confer herbicide tolerance
EP3889260A1 (en) 2014-12-12 2021-10-06 The Broad Institute, Inc. Protected guide rnas (pgrnas)
WO2016100333A1 (en) 2014-12-15 2016-06-23 Syngenta Participations Ag Pesticidal microrna carriers and use thereof
RU2707137C2 (ru) 2014-12-19 2019-11-22 Регенерон Фармасьютикалз, Инк. Способы и композиции для нацеленной генетической модификации посредством одноэтапного множественного нацеливания
CN113337533A (zh) 2014-12-23 2021-09-03 先正达参股股份有限公司 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物
WO2016118560A1 (en) * 2015-01-20 2016-07-28 Mayo Foundation For Medical Education And Research Methods and materials for assembling nucleic acid constructs
SG11201706041XA (en) 2015-01-26 2017-08-30 Fate Therapeutics Inc Methods and compositions for inducing hematopoietic cell differentiation
WO2016120486A1 (en) 2015-01-30 2016-08-04 Evolva Sa Production of steviol glycosides in recombinant hosts
JP2018508203A (ja) 2015-02-02 2018-03-29 セレクティス T−dna組込みを伴わない、アグロバクテリウムが介在するゲノム改変
WO2016124920A1 (en) 2015-02-03 2016-08-11 The Institute Of Genetics And Developmental Biology Rice plants with altered seed phenotype and quality
US10793868B2 (en) 2015-02-03 2020-10-06 Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Plants with increased seed size
WO2016130600A2 (en) 2015-02-09 2016-08-18 Duke University Compositions and methods for epigenome editing
EP3256148A1 (en) 2015-02-12 2017-12-20 INSERM - Institut National de la Santé et de la Recherche Médicale Methods for predicting the responsiveness of a patient affected with malignant hematological disease to chemotherapy treatment and methods of treatment of such disease
JP7199809B2 (ja) 2015-02-13 2023-01-06 ファクター バイオサイエンス インコーポレイテッド 核酸製品及びその投与方法
JP6590333B2 (ja) * 2015-02-26 2019-10-16 学校法人東京理科大学 Dna結合ドメイン組込み用ベクターおよびそのセット、融合タンパク質コーディングベクターおよびそのセットならびにその製造方法、デスティネーションベクター、植物細胞用発現ベクターおよびその製造方法、植物細胞用発現ベクター作製用キット、形質転換方法、ならびにゲノム編集方法
CA2977685C (en) 2015-03-02 2024-02-20 Sinai Health System Homologous recombination factors
WO2016142427A1 (en) 2015-03-10 2016-09-15 INSERM (Institut National de la Santé et de la Recherche Médicale) Method ank kit for reprogramming somatic cells
EP3862426A3 (en) 2015-03-16 2021-11-17 DSM IP Assets B.V. Udp-glycosyltransferases
EP3279321A4 (en) * 2015-03-16 2018-10-31 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method of applying non-genetic substance to perform site-directed reform of plant genome
WO2016153305A1 (ko) * 2015-03-26 2016-09-29 한국생명공학연구원 표적 유전자 특이적 핵산 프로브 및 Fok Ι 제한효소 이량체를 이용하여 세포 내에서 표적 유전자를 특이적으로 편집하기 위한 조성물 및 이의 용도
WO2016161004A1 (en) * 2015-03-30 2016-10-06 The Board Of Regents Of The Nevada System Of Higher Educ. On Behalf Of The University Of Nevada, La Compositions comprising talens and methods of treating hiv
CA2981077A1 (en) 2015-04-03 2016-10-06 Dana-Farber Cancer Institute, Inc. Composition and methods of genome editing of b-cells
EP3289080B1 (en) 2015-04-30 2021-08-25 The Trustees of Columbia University in the City of New York Gene therapy for autosomal dominant diseases
CN108026566A (zh) 2015-05-04 2018-05-11 特拉维夫大学拉莫特有限公司 用于使dna片段化的方法和试剂盒
EP3095870A1 (en) 2015-05-19 2016-11-23 Kws Saat Se Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom
WO2016205613A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzyme mutations reducing off-target effects
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
ES2594486B1 (es) * 2015-06-19 2017-09-26 Biopraxis Research Aie Molécula de ácido nucleico, proteína de fusión y método para modificar el material genético de una célula
EP3316676A4 (en) 2015-06-30 2018-12-12 Regents of the University of Minnesota Haploid inducer line for accelerated genome editing
RU2018105883A (ru) 2015-07-17 2019-08-19 Инститьют Оф Джинетикс Энд Дивелопментал Байолоджи Чайниз Академи Оф Сайенсиз Растения пшеницы, устойчивые к мучнистой росе
CA2997535A1 (en) 2015-07-23 2017-01-26 Mayo Foundation For Medical Education And Research Editing mitochondrial dna
EP3332018B1 (en) 2015-08-07 2022-07-27 Evolva SA Production of steviol glycosides in recombinant hosts
AU2016308339A1 (en) 2015-08-18 2018-04-12 Baylor College Of Medicine Methods and compositions for altering function and structure of chromatin loops and/or domains
US10898522B2 (en) * 2015-08-19 2021-01-26 Children's Research Institute, Children's National Medical Center Compositions and methods for treating graft versus host disease
US10767173B2 (en) 2015-09-09 2020-09-08 National University Corporation Kobe University Method for converting genome sequence of gram-positive bacterium by specifically converting nucleic acid base of targeted DNA sequence, and molecular complex used in same
US10837024B2 (en) 2015-09-17 2020-11-17 Cellectis Modifying messenger RNA stability in plant transformations
EP4089175A1 (en) 2015-10-13 2022-11-16 Duke University Genome engineering with type i crispr systems in eukaryotic cells
US11207393B2 (en) 2015-10-16 2021-12-28 President And Fellows Of Harvard College Regulatory T cell PD-1 modulation for regulating T cell effector immune responses
JP7109784B2 (ja) 2015-10-23 2022-08-01 プレジデント アンド フェローズ オブ ハーバード カレッジ 遺伝子編集のための進化したCas9蛋白質
EP3367788A4 (en) 2015-10-27 2019-07-31 Recombinetics, Inc. ENGINEERING OF HUMANIZED PLAQUETTES AND LYMPHOCYTES BY GENETIC COMPLEMENTATION
AU2016343978A1 (en) 2015-10-29 2018-05-17 Dana-Farber Cancer Institute, Inc. Methods for identification, assessment, prevention, and treatment of metabolic disorders using PM20D1 and N-lipidated amino acids
WO2017079428A1 (en) 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
PT3371314T (pt) 2015-11-04 2023-08-31 Fate Therapeutics Inc Modificação genómica de células pluripotentes
WO2017078807A1 (en) 2015-11-04 2017-05-11 Fate Therapeutics, Inc. Methods and compositions for inducing hematopoietic cell differentiation
AU2016355178B9 (en) 2015-11-19 2019-05-30 Massachusetts Institute Of Technology Lymphocyte antigen CD5-like (CD5L)-interleukin 12B (p40) heterodimers in immunity
ES2899176T3 (es) 2015-11-27 2022-03-10 Kws Saat Se & Co Kgaa Plantas tolerantes a las bajas temperaturas
CN108495932B (zh) 2015-11-27 2022-08-09 国立大学法人神户大学 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体
WO2017106528A2 (en) 2015-12-18 2017-06-22 Sangamo Biosciences, Inc. Targeted disruption of the t cell receptor
CN117137947A (zh) 2015-12-18 2023-12-01 桑格摩生物治疗股份有限公司 Mhc细胞受体的靶向破坏
US11840693B2 (en) 2015-12-21 2023-12-12 KWS SAAT SE & Co. KGaA Restorer plants
DE102015016445A1 (de) 2015-12-21 2017-06-22 Kws Saat Se Restorer-Pflanze
DE102015017161A1 (de) 2015-12-21 2017-06-22 Kws Saat Se Restorer-Pflanze
MY196175A (en) 2016-01-11 2023-03-20 Univ Leland Stanford Junior Chimeric Proteins And Methods Of Regulating Gene Expression
KR20180095719A (ko) 2016-01-11 2018-08-27 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 키메라 단백질 및 면역요법 방법
EP3410843A1 (en) 2016-02-02 2018-12-12 Cellectis Modifying soybean oil composition through targeted knockout of the fad3a/b/c genes
CA3014792A1 (en) 2016-02-16 2017-08-24 Carnegie Mellon University Compositions for enhancing targeted gene editing and methods of use thereof
US20200308590A1 (en) 2016-02-16 2020-10-01 Yale University Compositions and methods for treatment of cystic fibrosis
EP3417061B1 (en) 2016-02-18 2022-10-26 The Regents of the University of California Methods and compositions for gene editing in stem cells
EP3881857A1 (en) 2016-02-18 2021-09-22 The Penn State Research Foundation Generating gabaergic neurons in brains
CA3014871A1 (en) 2016-02-26 2017-08-31 Cellectis Micelle based system nuclease encapsulation for in-vivo gene editing
JP2019515654A (ja) 2016-03-16 2019-06-13 ザ ジェイ. デヴィッド グラッドストーン インスティテューツ 肥満及び/又は糖尿病を処置するための方法及び組成物、並びに候補処置薬剤を識別するための方法及び組成物
AU2017238054B2 (en) 2016-03-21 2023-10-19 Dana-Farber Cancer Institute, Inc. T-cell exhaustion state-specific gene expression regulators and uses thereof
WO2017165167A1 (en) 2016-03-23 2017-09-28 The Regents Of The University Of California Methods of treating mitochondrial disorders
US20190117799A1 (en) 2016-04-01 2019-04-25 The Brigham And Women's Hospital, Inc. Stimuli-responsive nanoparticles for biomedical applications
EP3442355A1 (en) 2016-04-13 2019-02-20 Evolva SA Production of steviol glycosides in recombinant hosts
EP3443088B1 (en) 2016-04-13 2024-09-18 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
US10188749B2 (en) 2016-04-14 2019-01-29 Fred Hutchinson Cancer Research Center Compositions and methods to program therapeutic cells using targeted nucleic acid nanocarriers
CN109121413A (zh) * 2016-04-14 2019-01-01 弗莱德哈钦森癌症研究中心 使用靶向核酸纳米载体编程治疗性细胞的组合物和方法
EP3429633B1 (en) 2016-04-15 2021-02-24 Cellectis A method of engineering drug-specific hypersensitive t-cells for immunotherapy by gene inactivation
CN107312788B (zh) * 2016-04-26 2020-07-28 中国科学院动物研究所 一种tale重复序列载体的构建方法
US10751423B2 (en) 2016-05-02 2020-08-25 Massachusetts Institute Of Technology Nanoparticle conjugates of highly potent toxins and intraperitoneal administration of nanoparticles for treating or imaging cancer
CN109312378A (zh) 2016-05-16 2019-02-05 埃沃尔瓦公司 在重组宿主中产生甜菊醇糖苷
EP4219731A3 (en) 2016-05-18 2023-08-09 Amyris, Inc. Compositions and methods for genomic integration of nucleic acids into exogenous landing pads
CN105950623B (zh) * 2016-05-19 2018-11-30 电子科技大学 一种用于talen高效构建的双rvd单元模块库及talen构建方法
MX2018014496A (es) 2016-05-26 2019-03-28 Nunhems Bv Plantas productoras de frutas sin semillas.
US11293021B1 (en) 2016-06-23 2022-04-05 Inscripta, Inc. Automated cell processing methods, modules, instruments, and systems
EP3474849A4 (en) 2016-06-27 2020-07-29 The Broad Institute, Inc. COMPOSITIONS AND METHODS FOR DETECTION AND TREATMENT OF DIABETES
US20190359992A1 (en) 2016-06-28 2019-11-28 Cellectis Altering expression of gene products in plants through targeted insertion of nucleic acid sequences
CN105949293B (zh) * 2016-06-28 2019-08-13 福建农林大学 植物源高效转录激活功能域sac3及应用
AU2017291851B2 (en) 2016-07-06 2022-10-13 Cellectis Sequential gene editing in primary immune cells
WO2018013932A1 (en) 2016-07-15 2018-01-18 Salk Institute For Biological Studies Methods and compositions for genome editing in non-dividing cells
CA3031206A1 (en) 2016-07-29 2018-02-01 Regeneron Pharmaceuticals, Inc. Fibrillin-1 mutations for modeling neonatal progeroid syndrome with congenital lipodystrophy
IL264565B2 (en) 2016-08-03 2024-07-01 Harvard College Adenosine nuclear base editors and their uses
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
KR20190038613A (ko) 2016-08-11 2019-04-08 더 잭슨 래보라토리 유전자 변형된 면역결핍 비-인간 동물에서의 개선된 인간 적혈구 생존에 관한 방법 및 조성물
EP3500666A4 (en) 2016-08-17 2020-04-08 Monsanto Technology LLC METHODS AND COMPOSITIONS FOR SMALL-SIZED PLANTS THROUGH THE MANIPULATION OF GIBBERRELL METABOLISM TO INCREASE HARVEST YIELD
CA3033788A1 (en) 2016-08-17 2018-02-22 Factor Bioscience Inc. Nucleic acid products and methods of administration thereof
WO2018035456A1 (en) 2016-08-18 2018-02-22 Cellectis Black-spot resistant potatoes with reduced tuber-specific polyphenol oxidase activity
EP3964573A1 (en) 2016-08-24 2022-03-09 Sangamo Therapeutics, Inc. Engineered target specific nucleases
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018044920A1 (en) 2016-08-29 2018-03-08 The Regents Of The University Of California Topical formulations based on ionic species for skin treatment
CA3035484A1 (en) 2016-09-01 2018-03-08 Cellectis Methods for altering amino acid content in plants
WO2018049009A2 (en) 2016-09-07 2018-03-15 Sangamo Therapeutics, Inc. Modulation of liver genes
CA3034643A1 (en) 2016-09-20 2018-03-29 Ellen Weisberg Compositions and methods for identification, assessment, prevention, and treatment of aml using usp10 biomarkers and modulators
US20180084767A1 (en) 2016-09-21 2018-03-29 Recombinetics, Inc. Animal models for cardiomyopathy
US20190225974A1 (en) 2016-09-23 2019-07-25 BASF Agricultural Solutions Seed US LLC Targeted genome optimization in plants
ES2811500T3 (es) 2016-10-04 2021-03-12 Prec Biosciences Inc Dominios coestimuladores para su uso en células genéticamente modificadas
UA127311C2 (uk) 2016-10-10 2023-07-19 Лімагрен Юроп Нуклеїнова кислота, що кодує резистентність sm1 до оранжевої злакової галиці, і спосіб її застосування
WO2018069232A1 (en) 2016-10-10 2018-04-19 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for predicting the risk of having cardiac hypertrophy
JP2019530464A (ja) 2016-10-14 2019-10-24 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸塩基エディターのaav送達
GB201617559D0 (en) 2016-10-17 2016-11-30 University Court Of The University Of Edinburgh The Swine comprising modified cd163 and associated methods
WO2018073391A1 (en) 2016-10-19 2018-04-26 Cellectis Targeted gene insertion for improved immune cells therapy
WO2018073393A2 (en) 2016-10-19 2018-04-26 Cellectis Tal-effector nuclease (talen) -modified allogenic cells suitable for therapy
US20190249183A1 (en) 2016-10-24 2019-08-15 Javier Gil Humanes Multiplex gene targeting in plants
WO2018076335A1 (en) 2016-10-31 2018-05-03 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Compositions and methods for enhancing abiotic stress tolerance
WO2018144097A1 (en) 2016-11-04 2018-08-09 Akeagen Llc Genetically modified non-human animals and methods for producing heavy chain-only antibodies
CN110100006A (zh) 2016-11-07 2019-08-06 埃沃尔瓦公司 重组宿主中甜菊糖苷的生产
UY37482A (es) 2016-11-16 2018-05-31 Cellectis Métodos para alterar el contenido de aminoácidos en plantas mediante mutaciones de desplazamiento de marco
CN110214185A (zh) 2016-11-28 2019-09-06 国立大学法人大阪大学 基因组编辑方法
EP3554555A4 (en) 2016-12-14 2021-02-24 Ligandal, Inc. COMPOSITIONS AND METHODS FOR ADMINISTRATION OF NUCLEIC ACID AND / OR PROTEIN LOAD
US20200085758A1 (en) 2016-12-16 2020-03-19 The Brigham And Women's Hospital, Inc. Co-delivery of nucleic acids for simultaneous suppression and expression of target genes
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
WO2018123938A1 (ja) * 2016-12-27 2018-07-05 国立研究開発法人農業・食品産業技術総合研究機構 ゲノム編集植物の作出方法
CN110121336A (zh) 2017-01-05 2019-08-13 弗莱德哈钦森癌症研究中心 改善疫苗功效的系统和方法
GB201700380D0 (en) 2017-01-10 2017-02-22 Plant Bioscience Ltd Methods of increasing seed yield
EP3571301A1 (en) 2017-01-23 2019-11-27 Regeneron Pharmaceuticals, Inc. Hsd17b13 variants and uses thereof
US20190367937A1 (en) 2017-02-09 2019-12-05 Fujian Agriculture And Forestry University Expression of a phosphate transporter for improving plant yield
CA3054031A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Compositions and methods for gene editing
EP3366778A1 (de) 2017-02-28 2018-08-29 Kws Saat Se Haploidisierung in sorghum
US11307139B2 (en) 2017-03-03 2022-04-19 Pioneer Hi-Bred International, Inc. Non-destructive assay for soybean seeds using near infrared analysis
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
KR20190127797A (ko) 2017-03-10 2019-11-13 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 시토신에서 구아닌으로의 염기 편집제
WO2018175581A1 (en) 2017-03-21 2018-09-27 The Jackson Laboratory A GENETICALLY MODIFIED MOUSE EXPRESSING HUMAN APOE4 MOUSE Trem2.p.R47H AND METHODS OF USE THEREOF
US11845953B2 (en) 2017-03-22 2023-12-19 National University Corporation Kobe University Method for converting nucleic acid sequence of cell specifically converting nucleic acid base of targeted DNA using cell endogenous DNA modifying enzyme, and molecular complex used therein
IL306092A (en) 2017-03-23 2023-11-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
EP3600269A1 (en) 2017-03-24 2020-02-05 INSERM - Institut National de la Santé et de la Recherche Médicale Gfi1 inhibitors for the treatment of hyperglycemia
WO2018172785A1 (en) 2017-03-24 2018-09-27 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Methods for increasing grain yield
US11542497B2 (en) 2017-03-30 2023-01-03 The University Of Tokyo Method for evaluating multiple different genes of interest
WO2018183908A1 (en) 2017-03-31 2018-10-04 Dana-Farber Cancer Institute, Inc. Compositions and methods for treating ovarian tumors
US20200113821A1 (en) 2017-04-04 2020-04-16 Yale University Compositions and methods for in utero delivery
WO2018191520A1 (en) 2017-04-12 2018-10-18 The Broad Institute, Inc. Respiratory and sweat gland ionocytes
WO2018191553A1 (en) 2017-04-12 2018-10-18 Massachusetts Eye And Ear Infirmary Tumor signature for metastasis, compositions of matter methods of use thereof
EP3392339A1 (en) 2017-04-18 2018-10-24 Rheinisch-Westfälische Technische Hochschule (RWTH) Aachen Improved genome editing in plant cells
CN116555353A (zh) 2017-04-20 2023-08-08 E开创生物技术股份有限公司 产生基因修改的动物的方法
WO2018195486A1 (en) 2017-04-21 2018-10-25 The Broad Institute, Inc. Targeted delivery to beta cells
HUE067206T2 (hu) 2017-04-25 2024-10-28 Cellectis Csökkent ligninösszetételû lucerna
IL301115A (en) 2017-04-28 2023-05-01 Acuitas Therapeutics Inc New lipid carbonyl and lipid nanoparticle formulations for delivery of nucleic acids
RU2019139045A (ru) 2017-05-03 2021-06-03 Сангамо Терапьютикс, Инк. Способы и композиции для модификации гена регулятора трансмембранной проводимости при кистозном фиброзе (cftr)
WO2018204777A2 (en) 2017-05-05 2018-11-08 The Broad Institute, Inc. Methods for identification and modification of lncrna associated with target genotypes and phenotypes
CA3062698A1 (en) 2017-05-08 2018-11-15 Precision Biosciences, Inc. Nucleic acid molecules encoding an engineered antigen receptor and an inhibitory nucleic acid molecule and methods of use thereof
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
KR102652838B1 (ko) 2017-05-12 2024-04-01 더 잭슨 래보라토리 Mhc 부류 i 및 부류 ii가 결여된 nsg 마우스
WO2018211032A1 (en) 2017-05-17 2018-11-22 Evolva Sa Production of steviol glycosides in recombinant hosts
BR112019024739A2 (pt) 2017-05-25 2020-06-16 Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Métodos para aumentar a produtividade do grão
EP3409104A1 (en) 2017-05-31 2018-12-05 Vilmorin et Cie Tomato plant resistant to tomato yellow leaf curl virus, powdery mildew, and nematodes
EP3409106A1 (en) 2017-06-01 2018-12-05 Vilmorin et Cie Tolerance in plants of solanum lycopersicum to the tobamovirus tomato brown rugose fruit virus (tbrfv)
WO2020249996A1 (en) 2019-06-14 2020-12-17 Vilmorin & Cie Resistance in plants of solanum lycopersicum to the tobamovirus tomato brown rugose fruit virus
SG11201911597YA (en) 2017-06-05 2020-01-30 Regeneron Pharma B4galt1 variants and uses thereof
US11879128B2 (en) 2017-06-05 2024-01-23 Consejo Superior De Investigaciones Científicas (Csic)—Delegación Andalucía Targeting of gluten by genome editing
WO2018226685A2 (en) 2017-06-06 2018-12-13 Dana-Farber Cancer Institute, Inc. Methods for sensitizing cancer cells to t cell-mediated killing by modulating molecular pathways
WO2018231999A1 (en) 2017-06-13 2018-12-20 Regents Of The University Of Minnesota Materials and methods for increasing gene editing frequency
WO2018232195A1 (en) 2017-06-14 2018-12-20 The Broad Institute, Inc. Compositions and methods targeting complement component 3 for inhibiting tumor growth
CN111344020A (zh) 2017-06-15 2020-06-26 加利福尼亚大学董事会 靶向非病毒dna插入
US11512287B2 (en) 2017-06-16 2022-11-29 Sangamo Therapeutics, Inc. Targeted disruption of T cell and/or HLA receptors
WO2018234239A1 (en) 2017-06-19 2018-12-27 Cellectis ANTI-HBV POLYTHERAPIES INVOLVING SPECIFIC ENDONUCLEASES
CA3067446A1 (en) 2017-06-20 2018-12-27 Institut Curie Immune cells defective for suv39h1
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
MX2019015413A (es) 2017-06-23 2020-07-20 Univ Kentucky Res Found Metodo.
WO2019005884A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-ADENINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED NUCLEIC ACID EDITION
US20190002874A1 (en) 2017-06-30 2019-01-03 Inscripta, Inc. Cell libraries created using rationally designed nucleic acids
US11053484B2 (en) 2017-06-30 2021-07-06 Precision Biosciences, Inc. Genetically-modified T cells comprising a modified intron in the T cell receptor alpha gene
CN111094573A (zh) * 2017-07-12 2020-05-01 梅约医学教育与研究基金会 有效靶向敲入或基因置换的材料和方法
US12049643B2 (en) 2017-07-14 2024-07-30 The Broad Institute, Inc. Methods and compositions for modulating cytotoxic lymphocyte activity
EP3654993A4 (en) 2017-07-17 2021-08-25 The Broad Institute, Inc. HUMAN COLON CELL ATLAS IN GOOD HEALTH WITH HEMORRHAGIC RECTO-COLITIS
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
WO2019024081A1 (zh) 2017-08-04 2019-02-07 北京大学 特异性识别甲基化修饰dna碱基的tale rvd及其应用
WO2019033053A1 (en) 2017-08-11 2019-02-14 Recombinetics, Inc. INDUCIBLE DISEASE MODELS, METHODS OF MAKING AND USING THEM IN TISSUE COMPLEMENTATION
EP3447134B1 (en) 2017-08-22 2023-10-11 KWS SAAT SE & Co. KGaA Increased fungal resistance in crop plants
CN111263810A (zh) 2017-08-22 2020-06-09 纳匹基因公司 使用多核苷酸指导的核酸内切酶的细胞器基因组修饰
WO2019038417A1 (en) 2017-08-25 2019-02-28 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences METHODS FOR INCREASING GRAIN YIELD
US10738327B2 (en) 2017-08-28 2020-08-11 Inscripta, Inc. Electroporation cuvettes for automation
WO2019043082A1 (en) 2017-08-29 2019-03-07 Kws Saat Se BLUE ALEURONE ENHANCED AND OTHER SEGREGATION SYSTEMS
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
BR112020005217A2 (pt) 2017-09-18 2020-09-15 Amyris, Inc. métodos para a engenharia genética de células hospedeiras de kluyveromyces
BR112020005166A2 (pt) 2017-09-18 2020-09-24 Amyris, Inc. métodos para integração genômica para células hospedeiras de kluyveromyces
CA3076249A1 (en) 2017-09-21 2019-03-28 Dana-Farber Cancer Institute, Inc. Isolation, preservation, compositions and uses of extracts from justicia plants
US20190098879A1 (en) 2017-09-29 2019-04-04 Regeneron Pharmaceuticals, Inc. Non-Human Animals Comprising A Humanized TTR Locus And Methods Of Use
US10435713B2 (en) 2017-09-30 2019-10-08 Inscripta, Inc. Flow through electroporation instrumentation
EP3692057B9 (en) 2017-10-03 2023-10-04 Precision BioSciences, Inc. Modified epidermal growth factor receptor peptides for use in genetically-modified cells
WO2019071054A1 (en) 2017-10-04 2019-04-11 The Broad Institute, Inc. METHODS AND COMPOSITIONS FOR MODIFYING THE FUNCTION AND STRUCTURE OF BUCKLES AND / OR CHROMATIN DOMAINS
KR20200086670A (ko) 2017-10-13 2020-07-17 셀렉타 바이오사이언시즈, 인크. 항바이러스 전달 벡터 IgM 반응을 약화시키기 위한 방법 및 조성물
CA3082251A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. Uses of adenosine base editors
US20200237823A1 (en) 2017-10-19 2020-07-30 Cellectis Targeted gene integration of nk inhibitors genes for improved immune cells therapy
EA202091056A1 (ru) 2017-10-27 2020-09-17 Те Риджентс Оф Те Юниверсити Оф Калифорния Направленная замена эндогенных т-клеточных рецепторов
AR114025A1 (es) 2017-10-31 2020-07-15 Limagrain Europe Trigo que comprende alelos restauradores de la fertilidad masculina
WO2019089913A1 (en) 2017-11-01 2019-05-09 Precision Biosciences, Inc. Engineered nucleases that target human and canine factor viii genes as a treatment for hemophilia a
EP3710039A4 (en) 2017-11-13 2021-08-04 The Broad Institute, Inc. METHODS AND COMPOSITIONS FOR CANCER TREATMENT BY TARGETING THE CLEC2D-KLRB1 PATH
US10953036B2 (en) 2017-11-20 2021-03-23 University Of Georgia Research Foundation, Inc. Compositions and methods of modulating HIF-2A to improve muscle generation and repair
WO2019106163A1 (en) 2017-12-01 2019-06-06 Cellectis Reprogramming of genetically engineered primary immune cells
US20200354413A1 (en) 2017-12-15 2020-11-12 Dana-Farber Cancer Institute, Inc. Stabilized peptide-mediated targeted protein degradation
MX2020005701A (es) 2017-12-22 2020-10-28 Fate Therapeutics Inc Células efectoras inmunitarias potenciadas y usos de las mismas.
EP3501268B1 (en) 2017-12-22 2021-09-15 KWS SAAT SE & Co. KGaA Regeneration of plants in the presence of histone deacetylase inhibitors
CN107868123B (zh) 2017-12-25 2020-05-12 中国农业科学院作物科学研究所 一种同时提高植物产量和抗性的基因及其应用
EP3508581A1 (en) 2018-01-03 2019-07-10 Kws Saat Se Regeneration of genetically modified plants
US11994512B2 (en) 2018-01-04 2024-05-28 Massachusetts Institute Of Technology Single-cell genomic methods to generate ex vivo cell systems that recapitulate in vivo biology with improved fidelity
CA3086620A1 (en) 2018-01-12 2019-07-18 Basf Se Gene underlying the number of spikelets per spike qtl in wheat on chromosome 7a
US11873499B2 (en) 2018-02-14 2024-01-16 Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Methods of increasing nutrient use efficiency
MX2020008560A (es) 2018-02-15 2020-10-12 Monsanto Technology Llc Composiciones y metodos para mejorar los rendimientos de cultivos mediante el apilamiento de rasgos.
CA3092372A1 (en) 2018-02-26 2019-08-29 AnTolRx, Inc. Tolerogenic liposomes and methods of use thereof
CN112153990A (zh) 2018-03-23 2020-12-29 纽约市哥伦比亚大学理事会 用于常染色体显性疾病的基因编辑
US11041169B2 (en) 2018-03-26 2021-06-22 National University Corporation Kobe University Method for modifying target site in double-stranded DNA in cell
EP3545756A1 (en) 2018-03-28 2019-10-02 KWS SAAT SE & Co. KGaA Regeneration of plants in the presence of inhibitors of the histone methyltransferase ezh2
EP3749762A1 (en) 2018-03-29 2020-12-16 Cellectis Tale-nucleases for allele-specific codon modification
CN112204131A (zh) 2018-03-29 2021-01-08 因思科瑞普特公司 用于诱导和转化的细胞生长速率的自动化控制
AU2019243315A1 (en) 2018-03-29 2020-09-24 Fate Therapeutics, Inc. Engineered immune effector cells and use thereof
AU2019247490A1 (en) 2018-04-06 2020-10-22 Children's Medical Center Corporation Compositions and methods for somatic cell reprogramming and modulating imprinting
GB201805865D0 (en) 2018-04-09 2018-05-23 Innes John Centre Genes
WO2019200004A1 (en) 2018-04-13 2019-10-17 Inscripta, Inc. Automated cell processing instruments comprising reagent cartridges
WO2019204226A1 (en) 2018-04-16 2019-10-24 University Of Massachusetts Compositions and methods for improved gene editing
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
EP3560330B1 (en) 2018-04-24 2022-06-15 KWS SAAT SE & Co. KGaA Plants with improved digestibility and marker haplotypes
US10557216B2 (en) 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
US10501738B2 (en) 2018-04-24 2019-12-10 Inscripta, Inc. Automated instrumentation for production of peptide libraries
TWI686477B (zh) * 2018-04-25 2020-03-01 國立成功大學 特異性造成植物葉綠體基因變異的轉殖載體、套組、方法及利用其產生之轉殖植物細胞與農桿菌
US11957695B2 (en) 2018-04-26 2024-04-16 The Broad Institute, Inc. Methods and compositions targeting glucocorticoid signaling for modulating immune responses
US20210147831A1 (en) 2018-04-27 2021-05-20 The Broad Institute, Inc. Sequencing-based proteomics
JP2021521874A (ja) 2018-05-02 2021-08-30 セレクティスCellectis 増大した食物繊維を含むコムギの操作
US20210386829A1 (en) 2018-05-04 2021-12-16 The Broad Institute, Inc. Compositions and methods for modulating cgrp signaling to regulate innate lymphoid cell inflammatory responses
EP3567111A1 (en) 2018-05-09 2019-11-13 KWS SAAT SE & Co. KGaA Gene for resistance to a pathogen of the genus heterodera
WO2019215500A1 (en) 2018-05-11 2019-11-14 Crispr Therapeutics Ag Methods and compositions for treating cancer
GB201808424D0 (en) 2018-05-23 2018-07-11 Lucite Int Uk Ltd Methods for producing BMA and MMA using genetically modified microorganisms
US20210371932A1 (en) 2018-06-01 2021-12-02 Massachusetts Institute Of Technology Methods and compositions for detecting and modulating microenvironment gene signatures from the csf of metastasis patients
GB201809273D0 (en) 2018-06-06 2018-07-25 Vib Vzw Novel mutant plant cinnamoyl-coa reductase proteins
EP3800998A1 (en) 2018-06-07 2021-04-14 The State of Israel, Ministry of Agriculture & Rural Development, Agricultural Research Organization (ARO) (Volcani Center) Methods of regenerating and transforming cannabis
CA3102978A1 (en) 2018-06-07 2019-12-12 The State Of Israel, Ministry Of Agriculture & Rural Development, Agricultural Research Organization (Aro) (Volcani Center) Nucleic acid constructs and methods of using same
KR20210018437A (ko) 2018-06-07 2021-02-17 더 브리검 앤드 우먼즈 하스피털, 인크. 조혈 줄기 세포를 생산하기 위한 방법
US12036240B2 (en) 2018-06-14 2024-07-16 The Broad Institute, Inc. Compositions and methods targeting complement component 3 for inhibiting tumor growth
BR112020025311A2 (pt) 2018-06-15 2021-03-09 KWS SAAT SE & Co. KGaA Métodos para melhorar a engenharia e regeneração do genoma em planta ii
AU2019285083B2 (en) 2018-06-15 2024-01-25 KWS SAAT SE & Co. KGaA Methods for improving genome engineering and regeneration in plant
WO2019238832A1 (en) 2018-06-15 2019-12-19 Nunhems B.V. Seedless watermelon plants comprising modifications in an abc transporter gene
CA3103564A1 (en) 2018-06-15 2019-12-19 KWS SAAT SE & Co. KGaA Methods for enhancing genome engineering efficiency
EP3809838A4 (en) 2018-06-21 2022-03-23 The Jackson Laboratory GENETICALLY MODIFIED MOUSE MODELS OF ALZHEIMER'S DISEASE
US11608506B2 (en) 2018-06-26 2023-03-21 Regents Of The University Of Minnesota Delivery of developmental regulators to plants for the induction of meristematic tissue with genetic alterations
WO2020005667A1 (en) 2018-06-29 2020-01-02 Pioneer Hi-Bred International, Inc. Compositions and methods for editing an endogenous nac gene in plants
WO2020005383A1 (en) 2018-06-30 2020-01-02 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
CA3105331A1 (en) 2018-07-09 2020-01-16 Cellectis Canola with high oleic acid
US20210310039A1 (en) 2018-07-31 2021-10-07 The University Of Tokyo Membrane protein activity measurement method
EP3830278A4 (en) 2018-08-01 2022-05-25 University of Georgia Research Foundation, Inc. COMPOSITIONS AND METHODS FOR ENHANCING EMBRYO DEVELOPMENT
GB201812603D0 (en) 2018-08-02 2018-09-19 British American Tobacco Investments Ltd Method
CN112585266A (zh) 2018-08-07 2021-03-30 摩大力斯医疗株式会社 新型转录激活物
EP3607819A1 (en) 2018-08-10 2020-02-12 Vilmorin et Cie Resistance to xanthomonas campestris pv. campestris (xcc) in cauliflower
US11142740B2 (en) 2018-08-14 2021-10-12 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
US10532324B1 (en) 2018-08-14 2020-01-14 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
WO2020041380A1 (en) 2018-08-20 2020-02-27 The Broad Institute, Inc. Methods and compositions for optochemical control of crispr-cas9
WO2020041249A1 (en) 2018-08-23 2020-02-27 Sangamo Therapeutics, Inc. Engineered target specific base editors
US20210189376A1 (en) 2018-08-29 2021-06-24 Amyris, Inc. Cells and methods for selection based assay
CN109706155B (zh) * 2018-08-30 2022-04-19 南京农业大学 pOsHEN1::OsSPL14基因表达盒及其构建方法和应用
US11965154B2 (en) 2018-08-30 2024-04-23 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
KR20210054547A (ko) 2018-08-31 2021-05-13 예일 유니버시티 삼중체 및 뉴클레아제 기반 유전자 편집을 향상시키기 위한 조성물 및 방법
EP3623379A1 (en) 2018-09-11 2020-03-18 KWS SAAT SE & Co. KGaA Beet necrotic yellow vein virus (bnyvv)-resistance modifying gene
WO2020056170A1 (en) 2018-09-12 2020-03-19 Fred Hutchinson Cancer Research Center Reducing cd33 expression to selectively protect therapeutic cells
EP3853244A4 (en) 2018-09-18 2022-09-14 Sangamo Therapeutics, Inc. PROGRAMMED CELL DEATH 1 (PD1) SPECIFIC NUCLEASES
KR20210070305A (ko) 2018-09-18 2021-06-14 브이엔브이 뉴코 인크. Arc 기반 캡시드 및 이의 용도
CA3113130A1 (en) * 2018-09-20 2020-03-26 Sanofi Intron-based universal cloning methods and compositions
GB201815672D0 (en) 2018-09-26 2018-11-07 Innes John Centre Methods for altering starch granule size profile
CN112867794A (zh) 2018-10-04 2021-05-28 株式会社钟化 用于植物的基因组编辑的dna构建物
US20220411783A1 (en) 2018-10-12 2022-12-29 The Broad Institute, Inc. Method for extracting nuclei or whole cells from formalin-fixed paraffin-embedded tissues
EP3867375A1 (en) 2018-10-15 2021-08-25 Fondazione Telethon Genome editing methods and constructs
US20220030788A1 (en) 2018-10-16 2022-02-03 Pioneer Hi-Bred International, Inc. Genome edited fine mapping and causal gene identification
WO2020081730A2 (en) 2018-10-16 2020-04-23 Massachusetts Institute Of Technology Methods and compositions for modulating microenvironment
EP3870697A4 (en) 2018-10-22 2022-11-09 Inscripta, Inc. MODIFIED ENZYMES
BR112021007503A2 (pt) 2018-10-22 2021-11-03 Univ Rochester Proteína de fusão, molécula de ácido nucleico, método para edição de material genético, e, sistemas para edição de material genético e para distribuição de componentes de edição de genoma
US11214781B2 (en) 2018-10-22 2022-01-04 Inscripta, Inc. Engineered enzyme
GB201817971D0 (en) 2018-11-02 2018-12-19 British American Tobacco Investments Ltd Method
AU2019370485A1 (en) 2018-11-02 2021-05-13 Annexon, Inc. Compositions and methods for treating brain injury
JP7553440B2 (ja) 2018-11-07 2024-09-18 クリスパー セラピューティクス アクチェンゲゼルシャフト 抗cd33免疫細胞癌療法
KR20210089707A (ko) 2018-11-07 2021-07-16 크리스퍼 테라퓨틱스 아게 항-liv1 면역세포 암 치료법
BR112021008083A2 (pt) 2018-11-07 2021-08-10 Crispr Therapeutics Ag terapia contra o câncer com célula imunológica anti-ptk7
GB201818715D0 (en) 2018-11-16 2019-01-02 British American Tobacco Investments Ltd Method
WO2020112647A1 (en) 2018-11-27 2020-06-04 Khona Scientific Llc Bidirectional multi-enzymatic scaffolds for biosynthesizing cannabinoids
WO2020112195A1 (en) 2018-11-30 2020-06-04 Yale University Compositions, technologies and methods of using plerixafor to enhance gene editing
WO2020118073A1 (en) 2018-12-05 2020-06-11 Vertex Pharmaceuticals Incorporated Gene-editing systems for editing a cystic fibrosis transmembrane regulator (cftr) gene
KR20200071198A (ko) 2018-12-10 2020-06-19 네오이뮨텍, 인코퍼레이티드 Nrf2 발현 조절 기반 T 세포 항암면역치료법
GB201820109D0 (en) 2018-12-11 2019-01-23 Vib Vzw Plants with a lignin trait and udp-glycosyltransferase mutation
CN113544266A (zh) 2018-12-17 2021-10-22 博德研究所 Crispr相关转座酶系统和其使用方法
AU2019403015B2 (en) 2018-12-20 2024-01-18 Regeneron Pharmaceuticals, Inc. Nuclease-mediated repeat expansion
US20220090047A1 (en) 2018-12-21 2022-03-24 Precision Biosciences, Inc. Genetic modification of the hydroxyacid oxidase 1 gene for treatment of primary hyperoxaluria
US11739156B2 (en) 2019-01-06 2023-08-29 The Broad Institute, Inc. Massachusetts Institute of Technology Methods and compositions for overcoming immunosuppression
CN113474328A (zh) 2019-01-11 2021-10-01 爱康泰生治疗公司 用于脂质纳米颗粒递送活性剂的脂质
AU2020208190B2 (en) 2019-01-15 2022-07-28 Seminis Vegetable Seeds, Inc. Green bean plants with improved disease resistance
GB201900940D0 (en) 2019-01-23 2019-03-13 British American Tobacco Investments Ltd Method
WO2020157573A1 (en) 2019-01-29 2020-08-06 The University Of Warwick Methods for enhancing genome engineering efficiency
JP2022519706A (ja) 2019-02-06 2022-03-24 ヴィルモラン・エ・シエ 細胞質雄性不稔を司る新たな遺伝子
US20230053540A1 (en) 2019-02-19 2023-02-23 Massachusetts Institute Of Technology Treatment of liver injury
WO2020178193A1 (en) 2019-03-01 2020-09-10 INSERM (Institut National de la Santé et de la Recherche Médicale) Method of treatment of sarcoidosis
JP2022524037A (ja) 2019-03-07 2022-04-27 ザ トラスティーズ オブ コロンビア ユニバーシティー イン ザ シティー オブ ニューヨーク Tn7様トランスポゾンを用いたRNA誘導DNA組込み
EP3708651A1 (en) 2019-03-12 2020-09-16 KWS SAAT SE & Co. KGaA Improving plant regeneration
US20220152115A1 (en) 2019-03-13 2022-05-19 The Broad Institute, Inc. Microglial progenitors for regeneration of functional microglia in the central nervous system and therapeutics uses thereof
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
US10815467B2 (en) 2019-03-25 2020-10-27 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
EP3947682B1 (en) 2019-04-03 2023-10-11 Precision Biosciences, Inc. Genetically-modified immune cells comprising a microrna-adapted shrna (shrnamir)
US20200318136A1 (en) 2019-04-03 2020-10-08 Regeneron Pharmaceuticals, Inc. Methods and compositions for insertion of antibody coding sequences into a safe harbor locus
EP3772929B1 (en) 2019-04-04 2023-11-15 Regeneron Pharmaceuticals, Inc. Rodents comprising a humanized coagulation factor 12 locus
EP3775201B1 (en) 2019-04-04 2022-06-15 Regeneron Pharmaceuticals, Inc. Methods for scarless introduction of targeted modifications into targeting vectors
US20220186263A1 (en) 2019-04-05 2022-06-16 Osaka University Method for producing knock-in cell
EP3947646A1 (en) 2019-04-05 2022-02-09 Precision BioSciences, Inc. Methods of preparing populations of genetically-modified immune cells
EP3969607A1 (en) 2019-05-13 2022-03-23 KWS SAAT SE & Co. KGaA Drought tolerance in corn
GB201906768D0 (en) 2019-05-14 2019-06-26 British American Tobacco Investments Ltd Method
CN113924367B (zh) 2019-05-23 2024-07-23 南京农业大学 提高水稻籽粒产量的方法
AR118995A1 (es) 2019-05-25 2021-11-17 Kws Saat Se & Co Kgaa Mejorador de la inducción de haploides
CN114206396A (zh) 2019-05-28 2022-03-18 西莱克塔生物科技公司 用于减弱抗病毒转移载体免疫应答的方法和组合物
WO2020243371A1 (en) 2019-05-28 2020-12-03 Massachusetts Institute Of Technology Methods and compositions for modulating immune responses
US20220243178A1 (en) 2019-05-31 2022-08-04 The Broad Institute, Inc. Methods for treating metabolic disorders by targeting adcy5
WO2020247452A1 (en) 2019-06-04 2020-12-10 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use
WO2020244759A1 (en) 2019-06-05 2020-12-10 Klemm & Sohn Gmbh & Co. Kg New plants having a white foliage phenotype
AU2020288623A1 (en) 2019-06-06 2022-01-06 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
CN113939595A (zh) 2019-06-07 2022-01-14 瑞泽恩制药公司 包括人源化白蛋白基因座的非人动物
CN113906134A (zh) 2019-06-14 2022-01-07 瑞泽恩制药公司 Tau蛋白病模型
EP3987024A4 (en) 2019-06-20 2023-11-01 University Of Massachusetts COMPOSITIONS AND METHODS FOR IMPROVED GENE EDITING
WO2020254850A1 (en) 2019-06-21 2020-12-24 Vilmorin & Cie Improvement of quality and permanence of green color of peppers at maturity and over-maturity
CA3139124C (en) 2019-06-21 2023-01-31 Inscripta, Inc. Genome-wide rationally-designed mutations leading to enhanced lysine production in e. coli
US10927385B2 (en) 2019-06-25 2021-02-23 Inscripta, Inc. Increased nucleic-acid guided cell editing in yeast
EP3990009A1 (en) 2019-06-27 2022-05-04 CRISPR Therapeutics AG Use of chimeric antigen receptor t cells and nk cell inhibitors for treating cancer
EP3757219A1 (en) 2019-06-28 2020-12-30 KWS SAAT SE & Co. KGaA Enhanced plant regeneration and transformation by using grf1 booster gene
GB201909562D0 (en) 2019-07-03 2019-08-14 British American Tobacco Investments Ltd Method
GB201909563D0 (en) 2019-07-03 2019-08-14 British American Tobacco Investments Ltd Method
WO2021004938A1 (en) 2019-07-05 2021-01-14 Biogemma Method for increasing yield in plants
EP3997111A4 (en) 2019-07-11 2023-07-26 The Regents Of The University Of California METHODS FOR ENHANCED REGENERATION OF TRANSGENIC PLANTS USING GROWTH REGULATORY FACTOR (GRF), GRF INTERACTION FACTOR (GIF), OR GIF-GRF CHIMERIC GENES AND PROTEINS
JP2022542102A (ja) 2019-07-23 2022-09-29 ムネモ・セラピューティクス Suv39h1欠損免疫細胞
FR3099178A1 (fr) 2019-07-24 2021-01-29 Soltis Tournesol à teneur élevée en acide oléique et procédé d’obtention
WO2021016608A1 (en) 2019-07-25 2021-01-28 Precision Biosciences, Inc. Compositions and methods for sequential stacking of nucleic acid sequences into a genomic locus
US10501404B1 (en) 2019-07-30 2019-12-10 Factor Bioscience Inc. Cationic lipids and transfection methods
WO2021019272A1 (en) 2019-07-31 2021-02-04 Vilmorin & Cie Tolerance to tolcndv in cucumber
EP3772542A1 (en) 2019-08-07 2021-02-10 KWS SAAT SE & Co. KGaA Modifying genetic variation in crops by modulating the pachytene checkpoint protein 2
EP4017526A1 (en) 2019-08-20 2022-06-29 Precision BioSciences, Inc. Lymphodepletion dosing regimens for cellular immunotherapies
WO2021035170A1 (en) 2019-08-21 2021-02-25 Precision Biosciences, Inc. Compositions and methods for tcr reprogramming using fusion proteins
US20220298501A1 (en) 2019-08-30 2022-09-22 The Broad Institute, Inc. Crispr-associated mu transposase systems
JP2022546699A (ja) 2019-08-30 2022-11-07 イェール ユニバーシティー 核酸を細胞に送達するための組成物および方法
US20210079347A1 (en) 2019-09-06 2021-03-18 Crispr Therapeutics Ag Genetically engineered t cells having improved persistence in culture
WO2021061815A1 (en) 2019-09-23 2021-04-01 Omega Therapeutics, Inc. COMPOSITIONS AND METHODS FOR MODULATING HEPATOCYTE NUCLEAR FACTOR 4-ALPHA (HNF4α) GENE EXPRESSION
EP4048807A1 (en) 2019-09-23 2022-08-31 Omega Therapeutics, Inc. Compositions and methods for modulating apolipoprotein b (apob) gene expression
US11542513B2 (en) 2019-09-26 2023-01-03 Seminis Vegetable Seeds, Inc. Lettuce plants having resistance to Nasonovia ribisnigri biotype Nr:1
GB201914137D0 (en) 2019-10-01 2019-11-13 Univ Leeds Innovations Ltd Modified Plants
US11981922B2 (en) 2019-10-03 2024-05-14 Dana-Farber Cancer Institute, Inc. Methods and compositions for the modulation of cell interactions and signaling in the tumor microenvironment
EP3808170A1 (en) 2019-10-17 2021-04-21 Bejo Zaden B.V. Lactuca sativa resistance to bremia lactucae
EP4045522A1 (en) 2019-10-17 2022-08-24 KWS SAAT SE & Co. KGaA Enhanced disease resistance of crops by downregulation of repressor genes
WO2021087305A1 (en) 2019-10-30 2021-05-06 Precision Biosciences, Inc. Cd20 chimeric antigen receptors and methods of use for immunotherapy
CN112779266A (zh) 2019-11-06 2021-05-11 青岛清原化合物有限公司 在生物体内创制新基因的方法及应用
IL292605A (en) 2019-11-08 2022-07-01 Regeneron Pharma CRISPR and AAV strategies for the treatment of x-linked childhood retinoschisis
CN115335528A (zh) 2019-11-12 2022-11-11 科沃施种子欧洲股份两合公司 孢囊线虫属病原体抗性基因
WO2021095847A1 (ja) 2019-11-14 2021-05-20 国立大学法人広島大学 抗原特異的受容体遺伝子を環状dnaを用いてt細胞ゲノムに導入する方法
JP7448120B2 (ja) 2019-11-14 2024-03-12 国立研究開発法人農業・食品産業技術総合研究機構 プラズマを用いてゲノム編集酵素を植物細胞内に導入する方法
WO2021094805A1 (en) 2019-11-14 2021-05-20 Vilmorin & Cie Resistance to acidovorax valerianellae in corn salad
US11203762B2 (en) 2019-11-19 2021-12-21 Inscripta, Inc. Methods for increasing observed editing in bacteria
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
CA3159737A1 (en) 2019-11-27 2021-06-03 Zachary DEMOREST Tal-effector nucleases for gene editing
CA3160096A1 (en) 2019-12-06 2021-06-10 Bruce J. Mccreedy Jr. Methods for cancer immunotherapy
KR20220110778A (ko) 2019-12-10 2022-08-09 인스크립타 인코포레이티드 신규 mad 뉴클레아제
US10704033B1 (en) 2019-12-13 2020-07-07 Inscripta, Inc. Nucleic acid-guided nucleases
WO2021117874A1 (ja) 2019-12-13 2021-06-17 中外製薬株式会社 細胞外プリン受容体リガンドを検出するシステムおよび当該システムを導入した非ヒト動物
EP3835309A1 (en) 2019-12-13 2021-06-16 KWS SAAT SE & Co. KGaA Method for increasing cold or frost tolerance in a plant
CN113061626B (zh) * 2019-12-16 2024-01-19 中国科学院脑科学与智能技术卓越创新中心 一种组织特异性敲除斑马鱼基因的方法及应用
KR20220118498A (ko) 2019-12-18 2022-08-25 인스크립타 인코포레이티드 핵산-가이드된 뉴클레아제 편집된 세포의 생체 내 검출을 위한 캐스케이드/dcas3 상보 검정
GB201918902D0 (en) 2019-12-19 2020-02-05 Genome Res Ltd Cell differentiation
US10689669B1 (en) 2020-01-11 2020-06-23 Inscripta, Inc. Automated multi-module cell processing methods, instruments, and systems
EP4096770A1 (en) 2020-01-27 2022-12-07 Inscripta, Inc. Electroporation modules and instrumentation
BR112022014799A2 (pt) 2020-01-31 2022-09-20 Calyxt Inc Planta de soja, parte de planta ou célula de planta, método para gerar uma planta de soja e composição de óleo de soja
EP4100525A1 (en) 2020-02-05 2022-12-14 Institut National de la Santé et de la Recherche Médicale (INSERM) Methods of treatment of cancer disease by targeting an epigenetic factor
WO2021158915A1 (en) 2020-02-06 2021-08-12 Precision Biosciences, Inc. Recombinant adeno-associated virus compositions and methods for producing and using the same
BR112022017197A2 (pt) 2020-02-28 2022-11-01 Pioneer Hi Bred Int Sistema de produção haploide duplicado de sorgo
CN115485385A (zh) 2020-03-04 2022-12-16 瑞泽恩制药公司 用于使肿瘤细胞对免疫疗法敏感的方法和组合物
WO2021183636A1 (en) 2020-03-10 2021-09-16 Calyxt, Inc. Transformation and regeneration of cannabaceae
WO2021183720A1 (en) 2020-03-11 2021-09-16 Omega Therapeutics, Inc. Compositions and methods for modulating forkhead box p3 (foxp3) gene expression
JPWO2021193865A1 (ko) 2020-03-26 2021-09-30
WO2021191870A1 (en) 2020-03-27 2021-09-30 Dcprime B.V. Ex vivo use of modified cells of leukemic origin for enhancing the efficacy of adoptive cell therapy
WO2021202648A1 (en) 2020-03-31 2021-10-07 Calyxt, Inc. Agrobacterium-mediated infiltration of cannabaceae
CN115697044A (zh) 2020-03-31 2023-02-03 艾洛生物系统有限公司 西瓜和其他葫芦科中内源罗汉果苷途径基因的调控
KR20220165764A (ko) 2020-04-09 2022-12-15 아아르. 제이. 레날드즈 토바코 캄파니 니코티아나 타바쿰에서 니코틴 수준을 조절하는 방법
US20230165205A1 (en) 2020-04-14 2023-06-01 ACADEMISCH ZIEKENHUIS LEIDEN (h.o.d.n. LUMC) Methods for induction of endogenous tandem duplication events
NL2025344B1 (en) 2020-04-14 2021-10-26 Academisch Ziekenhuis Leiden Methods for induction of endogenous tandem duplication events
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
US20230279440A1 (en) 2020-05-06 2023-09-07 Cellectis S.A. Methods to genetically modify cells for delivery of therapeutic proteins
WO2021224395A1 (en) 2020-05-06 2021-11-11 Cellectis S.A. Methods for targeted insertion of exogenous sequences in cellular genomes
EP4146797A1 (en) 2020-05-06 2023-03-15 Orchard Therapeutics (Europe) Limited Treatment for neurodegenerative diseases
WO2021226558A1 (en) 2020-05-08 2021-11-11 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2021231259A1 (en) 2020-05-11 2021-11-18 Precision Biosciences, Inc. Self-limiting viral vectors encoding nucleases
US11787841B2 (en) 2020-05-19 2023-10-17 Inscripta, Inc. Rationally-designed mutations to the thrA gene for enhanced lysine production in E. coli
PE20230080A1 (es) 2020-05-29 2023-01-11 Kws Saat Se And Co Kgaa Induccion de haploides en plantas
WO2021245435A1 (en) 2020-06-03 2021-12-09 Vilmorin & Cie Melon plants resistant to scab disease, aphids and powdery mildew
CA3186284A1 (en) 2020-06-05 2021-12-09 Vilmorin & Cie Resistance in plants of solanum lycopersicum to the tobrfv
WO2021248052A1 (en) 2020-06-05 2021-12-09 The Broad Institute, Inc. Compositions and methods for treating neoplasia
US20230305023A1 (en) 2020-06-25 2023-09-28 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods of treatment and diagnostic of pathological conditions associated with intense stress
CA3185917A1 (en) 2020-07-14 2022-01-20 Daniela SCHEUERMANN Methods for identifying and selecting maize plants with resistance to northern corn leaf blight
AU2021204717A1 (en) 2020-07-15 2022-02-03 Seminis Vegetable Seeds, Inc. Green Bean Plants with Improved Disease Resistance
CN116096702A (zh) 2020-07-16 2023-05-09 爱康泰生治疗公司 用于脂质纳米颗粒的阳离子脂质
US20230303974A1 (en) 2020-07-30 2023-09-28 Institut Curie Immune Cells Defective for SOCS1
EP4192875A1 (en) 2020-08-10 2023-06-14 Precision BioSciences, Inc. Antibodies and fragments specific for b-cell maturation antigen and uses thereof
US20220064596A1 (en) 2020-08-25 2022-03-03 Kite Pharma, Inc. T cells with improved functionality
MX2023002480A (es) 2020-08-31 2023-05-18 Univ Yale "composiciones y métodos para el suministro de ácidos nucleicos a las células.
JPWO2022050413A1 (ko) 2020-09-04 2022-03-10
WO2022049273A1 (en) 2020-09-07 2022-03-10 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods of treatment of inflammatory bowel diseases
US11299731B1 (en) 2020-09-15 2022-04-12 Inscripta, Inc. CRISPR editing to embed nucleic acid landing pads into genomes of live cells
EP3971295A1 (en) 2020-09-16 2022-03-23 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Methods for the production of genome edited plants
MX2023003365A (es) 2020-09-23 2023-03-29 Crispr Therapeutics Ag Linfocitos t modificados por ingenieria genetica con disrupcion de regnasa-1 y/o tgfbrii tienen una funcionalidad y una persistencia mejoradas.
CA3193099A1 (en) 2020-09-24 2022-03-31 David R. Liu Prime editing guide rnas, compositions thereof, and methods of using the same
CN116322313A (zh) 2020-10-02 2023-06-23 维尔莫林公司 保质期延长的甜瓜
WO2022076547A1 (en) 2020-10-07 2022-04-14 Precision Biosciences, Inc. Lipid nanoparticle compositions
US20240060079A1 (en) 2020-10-23 2024-02-22 Elo Life Systems Methods for producing vanilla plants with improved flavor and agronomic production
WO2022097663A1 (ja) 2020-11-06 2022-05-12 エディットフォース株式会社 FokIヌクレアーゼドメインの変異体
EP4240874A1 (en) 2020-11-06 2023-09-13 Institut National de la Santé et de la Recherche Médicale (INSERM) Methods for diagnosis and treating polycystic ovary syndrome (pcos)
US11512297B2 (en) 2020-11-09 2022-11-29 Inscripta, Inc. Affinity tag for recombination protein recruitment
US20230407350A1 (en) 2020-11-10 2023-12-21 Industrial Microbes, Inc. Microorganisms capable of producing poly(hiba) from feedstock
CN117279502A (zh) 2020-11-20 2023-12-22 雷维维科公司 用于异种移植的生长激素受体敲除的多转基因猪
WO2022112469A1 (en) 2020-11-27 2022-06-02 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for diagnosis and monitoring of toxic epidermal necrolysis
EP4251746A1 (en) 2020-11-30 2023-10-04 Cellectis SA Use of aminoquinoline compounds for higher gene integration
US11661459B2 (en) 2020-12-03 2023-05-30 Century Therapeutics, Inc. Artificial cell death polypeptide for chimeric antigen receptor and uses thereof
CA3203609A1 (en) 2020-12-03 2022-06-09 Vilmorin & Cie Tomato plants resistant to tobrfv, tmv, tomv and tommv and corresponding resistance genes
WO2022120334A1 (en) 2020-12-03 2022-06-09 Century Therapeutics, Inc. Genetically engineered cells and uses thereof
EP4019639A1 (en) 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris
EP4019638A1 (en) 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris
WO2022137181A1 (en) 2020-12-23 2022-06-30 Crispr Therapeutics Ag Co-use of lenalidomide with car-t cells
WO2022146654A1 (en) 2020-12-28 2022-07-07 Janssen Pharmaceuticals, Inc. Transcription activator-like effector nucleases (talens) targeting hbv
EP4271802A1 (en) 2021-01-04 2023-11-08 Inscripta, Inc. Mad nucleases
WO2022150269A1 (en) 2021-01-07 2022-07-14 Inscripta, Inc. Mad nucleases
WO2022150790A2 (en) 2021-01-11 2022-07-14 The Broad Institute, Inc. Prime editor variants, constructs, and methods for enhancing prime editing efficiency and precision
JP2024502630A (ja) 2021-01-12 2024-01-22 マーチ セラピューティクス, インコーポレイテッド コンテキスト依存性二本鎖dna特異的デアミナーゼ及びその使用
WO2022165111A1 (en) 2021-01-28 2022-08-04 Precision Biosciences, Inc. Modulation of tgf beta signaling in genetically-modified eukaryotic cells
US11884924B2 (en) 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
WO2022189967A1 (en) 2021-03-09 2022-09-15 Crispr Therapeutics Ag Genetically engineered t cells with ptpn2 knockout have improved functionality and anti-tumor activity
EP4304633A1 (en) 2021-03-12 2024-01-17 Mendus B.V. Methods of vaccination and use of cd47 blockade
WO2022198094A1 (en) 2021-03-18 2022-09-22 Calyxt, Inc. Producing albumin in cannabaceae plant parts
WO2022198107A1 (en) 2021-03-18 2022-09-22 Calyxt, Inc. Producing betalain in cannabaceae plant parts
WO2022198106A1 (en) 2021-03-18 2022-09-22 Calyxt, Inc. Producing betalains using plant cell matrices
WO2022198093A1 (en) 2021-03-18 2022-09-22 Calyxt, Inc. Producing albumin using plant cell matrices
WO2022198085A2 (en) 2021-03-18 2022-09-22 Calyxt, Inc. Plant cell matrices and methods thereof
WO2022208489A1 (en) 2021-04-02 2022-10-06 Vilmorin & Cie Semi-determinate or determinate growth habit trait in cucurbita
CN117479952A (zh) 2021-04-07 2024-01-30 世纪治疗股份有限公司 用于嵌合抗原受体细胞的组合的人工细胞死亡/报告系统多肽及其用途
CA3214473A1 (en) 2021-04-07 2022-10-13 Century Therapeutics, Inc. Compositions and methods for generating alpha-beta t cells from induced pluripotent stem cells
JP2024519515A (ja) 2021-04-07 2024-05-15 センチュリー セラピューティクス,インコーポレイテッド 人工多能性幹細胞からガンマ-デルタt細胞を生成するための組成物および方法
WO2022218998A1 (en) 2021-04-13 2022-10-20 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for treating hepatitis b and d virus infection
WO2022226316A1 (en) 2021-04-22 2022-10-27 Precision Biosciences, Inc. Compositions and methods for generating male sterile plants
AU2022261125A1 (en) 2021-04-23 2023-11-23 University Of Rochester Genome editing by directed non-homologous dna insertion using a retroviral integrase-cas fusion protein and methods of treatment
MX2023012760A (es) 2021-04-30 2023-11-13 Cellectis Sa Nuevos cars anti-muc1 y celulas inmunitarias editadas geneticamente para inmunoterapia contra el cancer de tumores solidos.
EP4337769A1 (en) 2021-05-10 2024-03-20 SQZ Biotechnologies Company Methods for delivering genome editing molecules to the nucleus or cytosol of a cell and uses thereof
WO2022251644A1 (en) 2021-05-28 2022-12-01 Lyell Immunopharma, Inc. Nr4a3-deficient immune cells and uses thereof
KR20240027676A (ko) 2021-06-02 2024-03-04 라이엘 이뮤노파마, 인크. Nr4a3-결핍 면역 세포 및 이의 용도
US20230045095A1 (en) 2021-06-23 2023-02-09 Massachusetts Institute Of Technology Compositions, Methods and Systems for the Delivery of Gene Editing Material to Cells
EP4367248A1 (en) 2021-07-07 2024-05-15 Cibus Europe B.V. Transcription activator-like effectors fused to inteins
EP4367242A2 (en) 2021-07-07 2024-05-15 Omega Therapeutics, Inc. Compositions and methods for modulating secreted frizzled receptor protein 1 (sfrp1) gene expression
EP4376596A1 (en) 2021-07-30 2024-06-05 KWS SAAT SE & Co. KGaA Plants with improved digestibility and marker haplotypes
IL310564A (en) 2021-08-06 2024-03-01 Vilmorin & Cie Resistance to Leveillula Taurica in pepper plant
JP7125727B1 (ja) 2021-09-07 2022-08-25 国立大学法人千葉大学 核酸配列改変用組成物および核酸配列の標的部位を改変する方法
WO2023042079A1 (en) 2021-09-14 2023-03-23 Crispr Therapeutics Ag Genetically engineered immune cells having a disrupted cd83 gene
WO2023043511A1 (en) 2021-09-17 2023-03-23 Calyxt, Inc. Transforming cannabaceae cells
EP4404740A1 (en) 2021-09-20 2024-07-31 Revivicor Inc. Multitransgenic pigs comprising ten genetic modifications for xenotransplantation
GB202113933D0 (en) 2021-09-29 2021-11-10 Genome Res Ltd Methods for gene editing
US20230141563A1 (en) 2021-10-12 2023-05-11 Selecta Biosciences, Inc. Methods and compositions for attenuating anti-viral transfer vector igm responses
MX2024003887A (es) 2021-10-14 2024-07-09 Arsenal Biosciences Inc Células inmunitarias que tienen arnch coespresados y sistemas de compuerta lógica.
JP2024538100A (ja) 2021-10-14 2024-10-18 ロンザ セールス アーゲー 細胞外小胞の産生のための改変産生細胞
WO2023064872A1 (en) 2021-10-14 2023-04-20 Precision Biosciences, Inc. Combinations of anti-bcma car t cells and gamma secretase inhibitors
EP4419111A1 (en) 2021-10-19 2024-08-28 Precision Biosciences, Inc. Gene editing methods for treating alpha-1 antitrypsin (aat) deficiency
CA3234404A1 (en) 2021-10-20 2023-04-27 Steven A. Goldman Treatment with genetically modified cells, and genetically modified cells per se, with increased competitive advantage and/or decreased competitive disadvantage
WO2023070043A1 (en) 2021-10-20 2023-04-27 Yale University Compositions and methods for targeted editing and evolution of repetitive genetic elements
WO2023069478A1 (en) 2021-10-20 2023-04-27 University Of Rochester Methods and compositions for rejuvenating cns glial populations by suppression of transcription factors
IL311786A (en) 2021-10-21 2024-05-01 Vertex Pharma hypoimmune cells
CA3237696A1 (en) 2021-11-08 2023-05-11 Progentos Therapeutics, Inc. Platelet-derived growth factor receptor (pdgfr) alpha inhibitors and uses thereof
WO2023086847A1 (en) 2021-11-10 2023-05-19 Encodia, Inc. Methods for barcoding macromolecules in individual cells
WO2023091910A1 (en) 2021-11-16 2023-05-25 Precision Biosciences, Inc. Methods for cancer immunotherapy
MX2024006051A (es) 2021-11-23 2024-06-26 Cellectis Sa Nuevos andamios de proteinas tale con relaciones de actividad en objetivo/fuera de objetivo mejoradas.
CN118401658A (zh) 2021-11-26 2024-07-26 益杰立科(上海)生物科技有限公司 调节pcsk9的方法及其用途
GB202117314D0 (en) 2021-11-30 2022-01-12 Clarke David John Cyclic nucleic acid fragmentation
WO2023102393A1 (en) 2021-11-30 2023-06-08 Pioneer Hi-Bred International, Inc. High efficiency large scale chromosomal genome manipulation
KR20240112361A (ko) 2021-12-03 2024-07-18 더 브로드 인스티튜트, 인코퍼레이티드 핵산 프로그래밍가능한 융합 단백질의 전달을 위한 자가-조립 바이러스-유사 입자 및 그의 제조 및 사용 방법
AU2022402249A1 (en) 2021-12-03 2024-07-11 President And Fellows Of Harvard College Compositions and methods for efficient in vivo delivery
US20230193310A1 (en) 2021-12-10 2023-06-22 Seminis Vegetabe Seeds, Inc. Lettuce plants having resistance to downy mildew
GB202118058D0 (en) 2021-12-14 2022-01-26 Univ Warwick Methods to increase yields in crops
WO2023111913A1 (en) 2021-12-15 2023-06-22 Crispr Therapeutics Ag Engineered anti-liv1 cell with regnase-1 and/or tgfbrii disruption
EP4450634A1 (en) 2021-12-15 2024-10-23 Nanjing GenScript Biotech Co., Ltd. Method for detecting integration site
KR20240123832A (ko) 2021-12-16 2024-08-14 아퀴타스 테라퓨틱스 인크. 지질 나노입자 제형에 사용하기 위한 지질
WO2023114935A1 (en) * 2021-12-17 2023-06-22 Altius Institute For Biomedical Sciences Nucleic acid sequences encoding repeated sequences resistant to recombination in viruses
EP4452304A1 (en) 2021-12-22 2024-10-30 CRISPR Therapeutics AG Genetically engineered t cells with disrupted casitas b-lineage lymphoma proto-oncogene-b (cblb) and uses thereof
WO2023126458A1 (en) 2021-12-28 2023-07-06 Mnemo Therapeutics Immune cells with inactivated suv39h1 and modified tcr
WO2023129937A1 (en) 2021-12-29 2023-07-06 Century Therapeutics, Inc. Genetically engineered cells having anti-cd19 / anti-cd22 chimeric antigen receptors, and uses thereof
AU2022424002A1 (en) 2021-12-29 2024-06-13 Bristol-Myers Squibb Company Generation of landing pad cell lines
WO2023150553A1 (en) 2022-02-01 2023-08-10 University Of Rochester Gpr17 promoter-based targeting and transduction of glial progenitor cells
WO2023150557A1 (en) 2022-02-01 2023-08-10 University Of Rochester Methods of generating a population of neurons from human glial progenitor cells and genetic constructs for carrying out such methods
KR20240132132A (ko) 2022-02-03 2024-09-02 니코벤처스 트레이딩 리미티드 담배 식물들에서 알칼로이드 함량을 조절하는 방법
MX2024009603A (es) 2022-02-03 2024-08-14 Nicoventures Trading Ltd Metodo.
KR20240132133A (ko) 2022-02-04 2024-09-02 니코벤처스 트레이딩 리미티드 담배 식물들에서 알칼로이드 함량을 조절하는 방법
WO2023158732A1 (en) 2022-02-16 2023-08-24 Dana-Farber Cancer Institute, Inc. Methods for decreasing pathologic alpha-synuclein using agents that modulate fndc5 or biologically active fragments thereof
WO2023166425A1 (en) 2022-03-01 2023-09-07 Crispr Therapeutics Ag Methods and compositions for treating angiopoietin-like 3 (angptl3) related conditions
US20230357437A1 (en) 2022-03-09 2023-11-09 Selecta Biosciences, Inc. Immunosuppressants in combination with anti-igm agents and related dosing
WO2023180904A1 (en) 2022-03-21 2023-09-28 Crispr Therapeutics Ag Methods and compositions for treating lipoprotein-related diseases
TW202346575A (zh) 2022-03-23 2023-12-01 瑞士商Crispr治療公司 具有regnase-1及/或tgfbrii破壞的抗cd83 car-t細胞
WO2023180968A1 (en) 2022-03-23 2023-09-28 Crispr Therapeutics Ag Anti-cd19 car-t cells with multiple gene edits and therapeutic uses thereof
EP4256950A1 (en) 2022-04-06 2023-10-11 Vilmorin et Cie Tolerance to cgmmv in cucumber
GB202205149D0 (en) 2022-04-07 2022-05-25 Nicoventures Trading Ltd Method
GB202205148D0 (en) 2022-04-07 2022-05-25 Nicoventures Trading Ltd Method
JP2024515919A (ja) 2022-04-08 2024-04-11 フェイト セラピューティクス,インコーポレイティド 腫瘍標的化のためのキメラ抗原受容体
GB202205561D0 (en) 2022-04-14 2022-06-01 Nicoventures Trading Ltd Method
GB202205562D0 (en) 2022-04-14 2022-06-01 Nicoventures Trading Ltd Method
GB202206107D0 (en) 2022-04-27 2022-06-08 Nicoventures Trading Ltd Method
GB202206109D0 (en) 2022-04-27 2022-06-08 Nicoventures Trading Ltd Method
WO2023213831A1 (en) 2022-05-02 2023-11-09 Fondazione Telethon Ets Homology independent targeted integration for gene editing
WO2023220603A1 (en) 2022-05-09 2023-11-16 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2023225665A1 (en) 2022-05-19 2023-11-23 Lyell Immunopharma, Inc. Polynucleotides targeting nr4a3 and uses thereof
EP4279085A1 (en) 2022-05-20 2023-11-22 Mnemo Therapeutics Compositions and methods for treating a refractory or relapsed cancer or a chronic infectious disease
EP4278891A1 (en) 2022-05-20 2023-11-22 KWS SAAT SE & Co. KGaA Clubroot resistance and markers in brassica
GB202207774D0 (en) 2022-05-26 2022-07-13 Cambridge Entpr Ltd Modified plants
WO2023240212A2 (en) 2022-06-08 2023-12-14 Century Therapeutics, Inc. Genetically engineered cells having anti-cd133 / anti-egfr chimeric antigen receptors, and uses thereof
WO2023240147A1 (en) 2022-06-08 2023-12-14 Century Therapeutics, Inc. Genetically engineered cells expressing cd16 variants and nkg2d and uses thereof
WO2023240169A1 (en) 2022-06-08 2023-12-14 Century Therapeutics, Inc. Immunoeffector cells derived from induced pluripotent stem cells genetically engineered with membrane bound il12 and uses thereof
US20240041757A1 (en) 2022-06-17 2024-02-08 Crispr Therapeutics Ag LIPID NANOPARTICLES (LNPs)-BASED OCULAR DELIVERY
US20230404003A1 (en) 2022-06-21 2023-12-21 Seminis Vegetable Seeds, Inc. Novel qtls conferring resistance to cucumber mosaic virus
WO2023248147A1 (en) 2022-06-21 2023-12-28 Crispr Therapeutics Ag Methods and compositions for in vivo editing of stem cells
WO2023248145A1 (en) 2022-06-21 2023-12-28 Crispr Therapeutics Ag Compositions and methods for treating human immunodeficiency virus
WO2024003786A1 (en) 2022-06-29 2024-01-04 Crispr Therapeutics Ag Chimeric antigen receptor targeting gpc-3 and immune cells expressing such for therapeutic uses
GB2621813A (en) 2022-06-30 2024-02-28 Univ Newcastle Preventing disease recurrence in Mitochondrial replacement therapy
WO2024020360A1 (en) 2022-07-18 2024-01-25 Pairwise Plants Services, Inc. Mustard green plants named 'pwrg-1', 'pwrg-2,' and 'pwsgc'
WO2024020597A1 (en) 2022-07-22 2024-01-25 The Johns Hopkins University Dendrimer-enabled targeted intracellular crispr/cas system delivery and gene editing
WO2024026474A1 (en) 2022-07-29 2024-02-01 Regeneron Pharmaceuticals, Inc. Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle
WO2024023801A2 (en) 2022-07-29 2024-02-01 Crispr Therapeutics Ag Genetically engineered immune cells having disrupted transporter associated with antigen processing-1 (tap-1) gene
WO2024023804A2 (en) 2022-07-29 2024-02-01 Crispr Therapeutics Ag Genetically engineered immune cells having disrupted transporter associated with antigen processing binding protein (tapbp) gene
WO2024023802A2 (en) 2022-07-29 2024-02-01 Crispr Therapeutics Ag Genetically engineered immune cells having disrupted transporter associated with antigen processing-2 (tap-2) gene
LU502613B1 (en) 2022-08-01 2024-02-01 Plant Bioscience Ltd Methods of altering the starch granule profile in plants
WO2024031053A1 (en) 2022-08-05 2024-02-08 Regeneron Pharmaceuticals, Inc. Aggregation-resistant variants of tdp-43
WO2024042199A1 (en) 2022-08-26 2024-02-29 KWS SAAT SE & Co. KGaA Use of paired genes in hybrid breeding
WO2024062388A2 (en) 2022-09-20 2024-03-28 Crispr Therapeutics Ag Genetically engineered immune cells expressing chimeric antigen receptor targeting cd20
WO2024064958A1 (en) 2022-09-23 2024-03-28 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells
WO2024064952A1 (en) 2022-09-23 2024-03-28 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells overexpressing c-jun
WO2024062138A1 (en) 2022-09-23 2024-03-28 Mnemo Therapeutics Immune cells comprising a modified suv39h1 gene
GB202214410D0 (en) 2022-09-30 2022-11-16 Ivy Farm Tech Limited genetically modified cells
WO2024077174A1 (en) 2022-10-05 2024-04-11 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells
WO2024081736A2 (en) 2022-10-11 2024-04-18 Yale University Compositions and methods of using cell-penetrating antibodies
WO2024079157A1 (en) 2022-10-11 2024-04-18 KWS SAAT SE & Co. KGaA Virus and insect resistance and markers in barley
WO2024084025A1 (en) 2022-10-21 2024-04-25 Keygene N.V. Rna transfection in plant cells with modified rna
WO2024102838A1 (en) 2022-11-09 2024-05-16 Century Therapeutics, Inc. Engineered interleukin-7 receptors and uses thereof
WO2024103017A2 (en) 2022-11-10 2024-05-16 Century Therapeutics, Inc. Genetically engineered cells having anti-nectin4 chimeric antigen receptors, and uses thereof
WO2024107765A2 (en) 2022-11-14 2024-05-23 Regeneron Pharmaceuticals, Inc. Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes
WO2024108092A1 (en) 2022-11-17 2024-05-23 The Broad Institute, Inc. Prime editor delivery by aav
WO2024119101A1 (en) 2022-12-01 2024-06-06 Yale University Stimuli-responsive traceless engineering platform for intracellular payload delivery
WO2024124044A1 (en) 2022-12-07 2024-06-13 The Brigham And Women’S Hospital, Inc. Compositions and methods targeting sat1 for enhancing anti¬ tumor immunity during tumor progression
WO2024121354A1 (en) 2022-12-08 2024-06-13 Keygene N.V. Duplex sequencing with covalently closed dna ends
WO2024138087A2 (en) 2022-12-23 2024-06-27 The Broad Institute, Inc. Methods and compositions for modulating cellular factors to increase prime editing efficiencies
GB202219829D0 (en) 2022-12-29 2023-02-15 Ivy Farm Tech Limited Genetically manipulated cells
WO2024141599A1 (en) 2022-12-29 2024-07-04 Vilmorin & Cie Tomato plants resistant to resistance-breaking tswv strains and corresponding resistance genes
WO2024155741A1 (en) 2023-01-18 2024-07-25 The Broad Institute, Inc. Prime editing-mediated readthrough of premature termination codons (pert)
WO2024155745A1 (en) 2023-01-18 2024-07-25 The Broad Institute, Inc. Base editing-mediated readthrough of premature termination codons (bert)
GB202300905D0 (en) 2023-01-20 2023-03-08 Nicoventures Trading Ltd Method
WO2024161358A1 (en) 2023-02-01 2024-08-08 Dlf Seeds A/S Beet yellows virus resistance
WO2024170505A1 (en) 2023-02-13 2024-08-22 Institut National de la Santé et de la Recherche Médicale Methods of treatment of iron overload associated diseases
US20240301447A1 (en) 2023-02-15 2024-09-12 Arbor Biotechnologies, Inc. Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript
GB202303077D0 (en) 2023-03-02 2023-04-19 Univ Oslo Brassica plants with improved seed retention
WO2024192108A1 (en) 2023-03-14 2024-09-19 Evolveimmune Therapeutics, Inc. Genetically modified car t cells and methods of making and using the same
WO2024206821A1 (en) 2023-03-31 2024-10-03 Briacell Therapeutics Corp. Methods for enhancing the immunogenicity of cellular vaccines
WO2024209000A1 (en) 2023-04-04 2024-10-10 Keygene N.V. Linkers for duplex sequencing
AU2024202284A1 (en) 2023-04-14 2024-10-31 Seminis Vegetable Seeds, Inc. Methods and compositions for Peronospora resistance in spinach
WO2024216116A1 (en) 2023-04-14 2024-10-17 Precision Biosciences, Inc. Muscle-specific expression cassettes
WO2024216118A1 (en) 2023-04-14 2024-10-17 Precision Biosciences, Inc. Muscle-specific expression cassettes
WO2024218394A1 (en) 2023-04-21 2024-10-24 Fondazione Telethon Ets Genome editing methods and constructs
WO2024226499A1 (en) 2023-04-24 2024-10-31 The Broad Institute, Inc. Compositions and methods for modifying fertility
WO2024223402A1 (en) 2023-04-24 2024-10-31 Institut National de la Santé et de la Recherche Médicale Biallelic gene mutations for the diagnosis of neonatal systemic hypertension
WO2024223900A1 (en) 2023-04-28 2024-10-31 Vilmorin & Cie Genetic determinants conferring improved tobrfv resistance

Family Cites Families (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4179337A (en) 1973-07-20 1979-12-18 Davis Frank F Non-immunogenic polypeptides
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US4761373A (en) 1984-03-06 1988-08-02 Molecular Genetics, Inc. Herbicide resistance in plants
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
CA1293460C (en) 1985-10-07 1991-12-24 Brian Lee Sauer Site-specific recombination of dna in yeast
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
ES2018274T5 (es) 1986-03-11 1996-12-16 Plant Genetic Systems Nv Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US5273894A (en) 1986-08-23 1993-12-28 Hoechst Aktiengesellschaft Phosphinothricin-resistance gene, and its use
US5276268A (en) 1986-08-23 1994-01-04 Hoechst Aktiengesellschaft Phosphinothricin-resistance gene, and its use
US5013659A (en) 1987-07-27 1991-05-07 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
US5006333A (en) 1987-08-03 1991-04-09 Ddi Pharmaceuticals, Inc. Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols
US5162602A (en) 1988-11-10 1992-11-10 Regents Of The University Of Minnesota Corn plants tolerant to sethoxydim and haloxyfop herbicides
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
US5204253A (en) 1990-05-29 1993-04-20 E. I. Du Pont De Nemours And Company Method and apparatus for introducing biological substances into living cells
US5767366A (en) 1991-02-19 1998-06-16 Louisiana State University Board Of Supervisors, A Governing Body Of Louisiana State University Agricultural And Mechanical College Mutant acetolactate synthase gene from Ararbidopsis thaliana for conferring imidazolinone resistance to crop plants
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5792640A (en) 1992-04-03 1998-08-11 The Johns Hopkins University General method to clone hybrid restriction endonucleases using lig gene
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
WO1994000977A1 (en) 1992-07-07 1994-01-20 Japan Tobacco Inc. Method of transforming monocotyledon
AU6234594A (en) 1993-02-12 1994-08-29 Johns Hopkins University, The Functional domains in (flavobacterium okeanokoites) (foki) restriction endonuclease
US6808904B2 (en) 1994-06-16 2004-10-26 Syngenta Participations Ag Herbicide-tolerant protox genes produced by DNA shuffling
US7285416B2 (en) 2000-01-24 2007-10-23 Gendaq Limited Regulated gene expression in plants
US6326166B1 (en) 1995-12-29 2001-12-04 Massachusetts Institute Of Technology Chimeric DNA-binding proteins
US5824497A (en) 1995-02-10 1998-10-20 Mcmaster University High efficiency translation of mRNA molecules
US5853973A (en) 1995-04-20 1998-12-29 American Cyanamid Company Structure based designed herbicide resistant products
US6084155A (en) 1995-06-06 2000-07-04 Novartis Ag Herbicide-tolerant protoporphyrinogen oxidase ("protox") genes
JPH10117776A (ja) 1996-10-22 1998-05-12 Japan Tobacco Inc インディカイネの形質転換方法
US6197928B1 (en) 1997-03-14 2001-03-06 The Regents Of The University Of California Fluorescent protein sensors for detection of analytes
GB9819693D0 (en) 1998-09-10 1998-11-04 Zeneca Ltd Glyphosate formulation
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
CA2361191A1 (en) 1999-02-03 2000-08-10 The Children's Medical Center Corporation Gene repair involving the induction of double-stranded dna cleavage at a chromosomal target site
US6451732B1 (en) 1999-06-04 2002-09-17 Syngenta, Limited Herbicidal compositions of glyphosate trimesium
ATE353361T1 (de) 2000-04-28 2007-02-15 Sangamo Biosciences Inc Gezielten modifikation der chromatinstruktur
US6368227B1 (en) 2000-11-17 2002-04-09 Steven Olson Method of swinging on a swing
WO2002057294A2 (en) 2001-01-22 2002-07-25 Sangamo Biosciences, Inc. Zinc finger proteins for dna binding and gene regulation in plants
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
WO2009095742A1 (en) 2008-01-31 2009-08-06 Cellectis New i-crei derived single-chain meganuclease and uses thereof
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
JP4966006B2 (ja) 2003-01-28 2012-07-04 セレクティス カスタムメイドメガヌクレアーゼおよびその使用
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US7189691B2 (en) * 2004-04-01 2007-03-13 The Administrators Of The Tulane Educational Fund Methods and compositions for treating leukemia
WO2005111226A2 (en) 2004-05-03 2005-11-24 New England Biolabs, Inc. Characterization of mcra subunits and uses thereof
WO2006042145A2 (en) * 2004-10-07 2006-04-20 Cornell Research Foundation, Inc. THE RICE BACTERIAL BLIGHT DISEASE RESISTANCE GENE xa5
WO2007060495A1 (en) 2005-10-25 2007-05-31 Cellectis I-crei homing endonuclease variants having novel cleavage specificity and use thereof
WO2007102618A1 (en) * 2006-03-08 2007-09-13 Kyoto University Nucleic acid cleaving agent
WO2008010009A1 (en) 2006-07-18 2008-01-24 Cellectis Meganuclease variants cleaving a dna target sequence from a rag gene and uses thereof
US8563314B2 (en) 2007-09-27 2013-10-22 Sangamo Biosciences, Inc. Methods and compositions for modulating PD1
BRPI0817447A8 (pt) 2007-09-28 2016-12-27 Two Blades Found Molécula isolada ou recombinante de ácido nuceico, cassete de expressão, vetor, planta transformada, célula hospedeira não-humana, métodos para aumentar a resistência de uma planta a pelo menos um patógeno de planta, para expressar um gene de interesse em uma planta ou célula de planta, para expressar genes em alto nível em uma planta ou célula de planta, e para causar morte celular em uma parte da planta de interesse, e, polipeptídeo isolado
US9133467B2 (en) 2008-11-10 2015-09-15 Two Blades Foundation Pathogen-inducible promoters and their use in enhancing the disease resistance of plants
EP2206726A1 (en) * 2009-01-08 2010-07-14 Universite Joseph Fourier Non-invasive tools for detecting vulnerable atherosclerotic plaques
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
NZ619886A (en) 2009-08-11 2015-03-27 Sangamo Biosciences Inc Organisms homozygous for targeted modification
MY176922A (en) 2009-10-22 2020-08-26 Sangamo Biosciences Inc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
US8956828B2 (en) 2009-11-10 2015-02-17 Sangamo Biosciences, Inc. Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
EP2504430A4 (en) 2009-11-27 2013-06-05 Basf Plant Science Co Gmbh CHIMERIC ENDONUCLEASES AND USES THEREOF
BR112012012588B1 (pt) 2009-11-27 2019-03-26 Basf Plant Science Company Gmbh Endonuclease, método para recombinação homóloga de polinucleotídeos e método para mutação direcionada de polinucleotídeos
EP2504429B1 (en) 2009-11-27 2016-04-20 BASF Plant Science Company GmbH Chimeric endonucleases and uses thereof
KR102110725B1 (ko) * 2009-12-10 2020-05-13 리전츠 오브 더 유니버스티 오브 미네소타 Tal 이펙터-매개된 dna 변형
US20110203012A1 (en) 2010-01-21 2011-08-18 Dotson Stanton B Methods and compositions for use of directed recombination in plant breeding
EP2615106B1 (en) 2010-02-08 2018-04-25 Sangamo Therapeutics, Inc. Engineered cleavage half-domains
EP2660318A1 (en) 2010-02-09 2013-11-06 Sangamo BioSciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
WO2011139335A1 (en) 2010-04-26 2011-11-10 Sangamo Biosciences, Inc. Genome editing of a rosa locus using zinc-finger nucleases
JP6208580B2 (ja) 2010-05-17 2017-10-04 サンガモ セラピューティクス, インコーポレイテッド 新規のdna結合タンパク質及びその使用
EP2392208B1 (en) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
JP2013534417A (ja) 2010-06-14 2013-09-05 アイオワ ステート ユニバーシティ リサーチ ファウンデーション,インコーポレーティッド Talエフェクターとfokiの融合タンパク質のヌクレアーゼ活性
AU2018251150B2 (en) * 2017-04-13 2024-05-09 Albert-Ludwigs-Universität Freiburg New sequence specific reagents targeting CCR5 in primary hematopoietic cells

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Boch 등. Science. Vol. 326, No. 5959, 페이지 1509-1512 (2009.10.29.)*
Cathomen 등. Molecular Therapy. Vol. 16, No. 7, 페이지 1200-1207 (2008.06.10.)*

Also Published As

Publication number Publication date
CN106834320B (zh) 2021-05-25
EP3456826A1 (en) 2019-03-20
DK2510096T3 (en) 2015-01-12
US11274294B2 (en) 2022-03-15
US20140335618A1 (en) 2014-11-13
ES2527997T5 (es) 2018-05-17
BR112012014080A2 (pt) 2015-10-27
EP2816112A1 (en) 2014-12-24
DK2510096T4 (en) 2018-05-14
JP6526612B2 (ja) 2019-06-05
ES2696825T3 (es) 2019-01-18
EP3456826B1 (en) 2023-06-28
AU2010327998A2 (en) 2012-11-29
PL2510096T5 (pl) 2018-06-29
US20200102550A1 (en) 2020-04-02
US8586363B2 (en) 2013-11-19
EP2510096B1 (en) 2014-10-22
US10619153B2 (en) 2020-04-14
AU2010327998B2 (en) 2015-11-12
US20110145940A1 (en) 2011-06-16
IL267164A (en) 2019-08-29
PL2510096T3 (pl) 2015-07-31
EP2510096B2 (en) 2018-02-07
JP2013513389A (ja) 2013-04-22
CN102770539A (zh) 2012-11-07
US20120214228A1 (en) 2012-08-23
DK2816112T3 (en) 2018-11-19
US20140335592A1 (en) 2014-11-13
PL2816112T3 (pl) 2019-03-29
US8440431B2 (en) 2013-05-14
CN106834320A (zh) 2017-06-13
AU2010327998A1 (en) 2012-07-26
JP2017070287A (ja) 2017-04-13
JP6964621B2 (ja) 2021-11-10
US8697853B2 (en) 2014-04-15
CA2783351A1 (en) 2011-06-16
US20120178131A1 (en) 2012-07-12
HK1205527A1 (en) 2015-12-18
JP2019146582A (ja) 2019-09-05
PT2510096E (pt) 2015-02-04
US8450471B2 (en) 2013-05-28
US20180051267A1 (en) 2018-02-22
CA2783351C (en) 2021-09-07
WO2011072246A2 (en) 2011-06-16
US8440432B2 (en) 2013-05-14
AU2015246062B2 (en) 2017-01-19
US20120178169A1 (en) 2012-07-12
IL220234B (en) 2020-09-30
SG181601A1 (en) 2012-07-30
KR20120101532A (ko) 2012-09-13
WO2011072246A3 (en) 2012-02-02
US20130122581A1 (en) 2013-05-16
NO2510096T3 (ko) 2015-03-21
ES2527997T3 (es) 2015-02-03
EP2510096A2 (en) 2012-10-17
AU2015246062A1 (en) 2015-11-05
KR102110608B1 (ko) 2020-05-14
US20180051266A1 (en) 2018-02-22
US9758775B2 (en) 2017-09-12
PT2816112T (pt) 2018-11-20
TR201815882T4 (tr) 2018-11-21
US10400225B2 (en) 2019-09-03
HUE041436T2 (hu) 2019-05-28
IL220234A0 (en) 2012-07-31
CN102770539B (zh) 2016-08-03
KR20190012274A (ko) 2019-02-08
EP2816112B1 (en) 2018-08-15

Similar Documents

Publication Publication Date Title
US11274294B2 (en) TAL effector-mediated DNA modification

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant