Nothing Special   »   [go: up one dir, main page]

WO2015020218A1 - Highly-active tale protein by altering dna-bound protein domain - Google Patents

Highly-active tale protein by altering dna-bound protein domain Download PDF

Info

Publication number
WO2015020218A1
WO2015020218A1 PCT/JP2014/071116 JP2014071116W WO2015020218A1 WO 2015020218 A1 WO2015020218 A1 WO 2015020218A1 JP 2014071116 W JP2014071116 W JP 2014071116W WO 2015020218 A1 WO2015020218 A1 WO 2015020218A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
amino acid
modified
target
dtale
Prior art date
Application number
PCT/JP2014/071116
Other languages
French (fr)
Japanese (ja)
Inventor
康志 岡田
一穂 池田
Original Assignee
独立行政法人理化学研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 独立行政法人理化学研究所 filed Critical 独立行政法人理化学研究所
Publication of WO2015020218A1 publication Critical patent/WO2015020218A1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • C12Q1/44Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving esterase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/04Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)

Definitions

  • TALE can be applied to transcription regulation, epigenome control, and the like as an artificial transcription factor that binds to a specific transcription factor binding region in the promoter region, for example, by utilizing the binding ability to such a target base sequence.
  • Non-Patent Documents 12 to 14 and Patent Document 1 various approaches have been attempted so far focusing on the RVD region in order to improve the binding stability with DNA (for example, Non-Patent Documents 12 to 14 and Patent Document 1). .
  • sufficient cleavage efficiency may still not be obtained, and it is desired to modify the TALE part that has both binding stability and specificity for the target base sequence.
  • the present inventors have intensively studied to solve the above-mentioned problems.
  • the present inventors analyzed the sequence of the repetitive portion of the DNA binding domain of about 1000 types of TALE possessed by various bacteria of the genus Xanthomonas.
  • RVD 12th to 13th amino acids
  • the 4th and 32nd positions in each module These amino acids also have low sequence conservation. Therefore, the present inventors further examined the molecular structure of TALE, and the 4th and 32nd amino acids were involved in the binding between adjacent modules and played an important role in stabilizing the tertiary structure of the TALE molecule.
  • the functional domain includes all or part of a fluorescent protein, photoprotein, or chromoprotein, or all or part of an enzyme protein that catalyzes fluorescence, luminescence, or color reaction.
  • the modified protein according to any one of the above.
  • An isolated nucleic acid encoding the amino acid sequence of the modified protein according to any one of [1] to [13] above.
  • An expression vector comprising the nucleic acid according to [14] above.
  • the cells are animal sperm, unfertilized eggs, fertilized eggs, cells constituting fetuses or adults, cells collected from plants or animal tissues, embryonic stem cells (ES cells), or artificial pluripotency
  • ES cells embryonic stem cells
  • iPS cell a stem cell
  • An expression vector containing a nucleic acid to be introduced is introduced into a cell, the modified protein is expressed in the cell, and the modified protein is bound to the region, so that (a) the region is cleaved, or (b) Modifying the region by cleaving the region and applying homologous recombination repair or non-homologous end-joining repair to the cleaved region, (c) modifying the region, or (d) Changing the gene expression around the region; (3) The method including the step of producing an individual or strain of the mutant organism from the cells obtained in step (2). [21] An individual or strain of a mutant organism obtained by the method according to [20] above.
  • a method for screening a modified protein whose binding activity to a target DNA is changed compared to an unmodified protein (1) a step of measuring the binding activity of the modified protein according to any one of [1] to [13] to the target DNA; (2) measuring the binding activity of the unmodified protein having no artificial mutation in the modified protein to the target DNA; (3) When the binding activity of the modified protein is changed as compared with the binding activity of the unmodified protein, the modified protein has a binding activity to the target DNA that is not
  • the said method which has the process of selecting as a modified protein changed compared with the modified protein.
  • the present invention also provides a nucleic acid encoding the protein, an expression vector containing the nucleic acid, a method for screening the protein, a method for introducing mutation or modification into the genome using the protein, nucleic acid, expression vector, or the like. .
  • Lane 1 dTALE 209F and target 209F
  • 2 dTALE 209F and control target
  • 3 dTALE 209mF and target 209F
  • 4 dTALE 209mF and control target
  • 5 dTALE 209QF and target 209F
  • 6 dTALE 209QF and control target dTALE 209R (conventional) and dTALE 209mR (modified (EA)), dTALE 209QR (modified (EQ)), dTALE 209m-QR (combined modified (EA-EQ)), and dTALE 209Q-mR
  • EA-EQ type complex modified type
  • Lane 1 dTALE S1PR3F and target S1PR3F
  • 2 dTALE S1PR3mF and target S1PR3F
  • 3 dTALE S1PR3m2F and target S1PR3F
  • dTALE S1PR3R conventional type
  • EA type modified type
  • dTALE S1PR3m2R modified type (QA type)
  • Lane 1 dTALE S1PR3R and target S1PR3R
  • 2 dTALE S1PR3mR and target S1PR3R
  • 3 dTALE S1PR3m2R and target S1PR3R
  • Diagram showing comparison of DNA binding activity of dTALE SphkF (conventional type), dTALE SphkmF (modified type (EA type)), dTALE SphkpmF (modified type (incomplete EA type)) and dTALE Sphkm2F (modified type (QA type)) It is.
  • Lane 1 dTALE SphkF and target SphkF
  • 2 dTALE SphkpmF and target SphkF
  • 3 dTALE SphkmF and target SphkF
  • 4 dTALE Sphkm2F and target SphkF
  • Lane 1 dTALE SphkR and target SphkR
  • 2 dTALE SphkmR and target SphkR
  • 3 dTALE Sphkm2R and target SphkR
  • Lane 1 dTALE CG16798R and target CG16789R
  • 2 dTALE CG16798mR and target CG16798R
  • 3 dTALE CG16798m2R and target CG16798R
  • Comparison of DNA binding activity of dTALE 209R (conventional), dTALE 209mR (modified (EA)), dTALE 209m2R (modified (QA)), and dTALE 209m3R (combined modified (EA-QA))
  • Lane 1 dTALE 85F and target 85F
  • 2 dTALE 85F and nonspecific target TRE
  • 3 dTALE 85pmF and target 85F
  • 4 dTALE 85pmF and nonspecific target TRE
  • 5 dTALE 85mF and target 85F
  • 6 dTALE 85mF and non-specific target TRE It is a figure which shows the comparison of DNA binding activity of dTALE 85R (conventional type), dTALE 85pmR (modified type (incomplete EA type)) and dTALE 85mR (modified type (EA type)).
  • Lane 1 dTALE 85R and target 85R, 2: dTALE 85R and nonspecific target TRE, 3: dTALE 85pmR and target 85R, 4: dTALE 85pmR and nonspecific target TRE, 5: dTALE 85mR and target 85R, 6: dTALE 85mR and non-specific target TRE dTALE 209R (conventional type), dTALE 209mR (modified type (EA type)), dTALE 209h1R (combined modified type (DD-DA-EA type)), dTALE 209h3R (combined modified type (mixed type 1)), and dTALE 209h2R It is a figure which shows the comparison of the specific and non-specific DNA binding activity of (complex modified type (DA-EA type)).
  • Lane 1 dTALE CG16798F and target CG16798F
  • 2 dTALE CG16798mF and target CG16798F
  • 3 dTALE CG16798m2F and target CG16798F
  • 4 dTALE EQ-CG16798F and target CG16798F
  • 5 dTALE EQ-CG16798F and target CG16798F CG16798m2F and target CG16798F
  • Lane 1 dTALE CG16798R and target CG16798R
  • 2 dTALE CG16798mR and target CG16798R
  • 3 dTALE CG16798m2R and target CG16798R
  • 4 dTALE EQ-CG16798R and target CG16798R
  • 5 dTALE EQ-CG16798R and EQ-CG16798R CG16798m2R and target CG16798R
  • Lane 1 dTALE SphkR and target SphkR
  • 2 dTALE SphkmR and target SphkR
  • 3 dTALE Sphkm2R and target SphkR
  • 4 dTALE EQ-SphkR and target SphkR
  • 5 dTALE EQ-SphkR-EQ-SphkR-E6 Sphkm2R and target SphkR
  • Lane 1 dTALE 209m2R and target 209R
  • 2 dTALE EQ-oryzaeLR-209m2R and target 209R
  • 3 dTALE EQ-209m2R and target 209R
  • 4 dTALE oryzae-EQLR-209m2R and target 209R
  • 6 dTALE citri-209m2R and target 209R
  • 7 dTALE 209m2R and target 209R-1c
  • 8 dTALE EQ-oryzaeLR-209m2R and target 209R-1c
  • 10 dTALE eoryzae-EQLR-209m2R and target 209R-1c
  • 11 dTALE citri-EQLR-20
  • Lane 1 dTALE 209m2R and target 209R-1m
  • 2 dTALE EQ-oryzaeLR-209m2R and target 209R-1m
  • 3 dTALE EQ-209m2R and target 209R-1m
  • 4 dTALE oryzae-EQLR-209m2R and target 209R-1m
  • 5 dTALE citri-EQLR-209m2R and target 209R-1m
  • 6 dTALE citri-209m2R and target 209R-1m
  • 7 dTALE 2209m2R and target 209R-2w
  • 8 dTALE EQ-oryzaeLR-209m2R and target 209R-2w
  • 10 dTALE oryzae-EQLR-209m2R and target 209R-2w
  • 11 dTALE citri-EQLR-209m2R and target
  • Lane 1 dTALE TRE and target TRE
  • 2 dTALE TRE and control target
  • 3 dTALE TREn5 and target TRE-G3A3-TRE
  • 4 dTALE TREn5 and control target
  • 5 dTALE TREn6 and target TRE-G3A3-TRE
  • 6 DTALE TREn6 and control target
  • the protein of the present invention when the protein of the present invention further contains an epigenome regulatory factor, the target DNA in the genome of the target cell, DNA methylation, post-translational modification of proteins such as histones, chromatin It may be located in or near the epigenomic region such as formation, formation of a nuclear structure.
  • the protein of the present invention has the binding activity to the target DNA can be determined using the method described in the screening method described later.
  • the protein of the present invention has a specific binding activity to a target DNA (that is, it binds to a target DNA with a significant binding force, but binds to a DNA containing a different sequence. Is significantly reduced or does not substantially bind).
  • the protein of the present invention has a binding affinity that is reduced by one or more orders of magnitude in the in vitro activity measurement method for a DNA sequence different from the target DNA, or significant in an intracellular activity measurement method such as a dTALE assay. That do not exhibit significant activity.
  • Each module has the following amino acid sequence: LTPDQVVAIASNGGGKQALETVQRLLPVLCQDHG (SEQ ID NO: 1) Or an amino acid sequence in which an amino acid mutation (deletion, substitution, addition) occurs in the amino acid sequence.
  • the number of mutated amino acids is usually within 10 amino acids, preferably within 8 amino acids, more preferably within 6 amino acids, and even more preferably the number (4, 3, 2, or 1) amino acids.
  • Each module preferably has an amino acid sequence having 80% or more homology with the amino acid sequence of SEQ ID NO: 1.
  • the 4th and 32nd amino acid residues are involved in binding between adjacent repeats (ie, modules) and are important for stabilizing the conformation of the TALE molecule. Plays an important role. Therefore, at least one (eg, one, two, three, four, or five) amino acid residues in the fourth and its vicinity (and hence 2-6) and / or the 32nd and its The module is designed to have an artificial mutation in at least one (eg, 1, 2, 3, 4 or 5) amino acid residues in the vicinity (thus 30-34). By artificially modifying the amino acid sequence, the binding strength of the protein of the present invention to the target DNA can be controlled.
  • the target to be mutated of the 2nd to 6th amino acid residues is preferably the 3rd to 6th amino acid residues, and more preferably the 4th amino acid residue.
  • the target to be mutated among the 30th to 34th amino acid residues is preferably the 31st to 34th amino acid residues, and more preferably the 32nd amino acid residue. Therefore, as a particularly preferred embodiment, the 4th and 32nd amino acid residues are subjected to mutation in the module.
  • the fourth amino acid residue is modified to be glutamic acid and the 32nd amino acid residue is modified to be alanine.
  • the fourth amino acid residue is aspartic acid
  • the 31st amino acid residue is glutamic acid
  • the 32nd amino acid residue is glutamine. It has been done.
  • amino acid residues other than the 4th and / or 32nd positions may be further artificially modified or may not be modified.
  • the position of the amino acid residue means the position when the amino acid sequence of SEQ ID NO: 1 and the modified amino acid sequence are aligned.
  • the alignment of amino acid sequences can be obtained using a general program such as BLAST2 Sequence or Align.
  • positions other than the above in the module that is, positions other than the 2nd to 6th, 12th to 13th, 20th to 26th, and 30th to 34th are as long as the specific binding activity to the target DNA is not inhibited. It may have an artificial variation from one amino acid sequence. For example, by mutating serine (S), the 11th base in SEQ ID NO: 1, to asparagine (N), when RVD is NN, the binding activity to adenine is reduced without reducing the binding activity to guanine. Can be improved.
  • the TALE protein is composed of a repeat motif responsible for specific DNA binding and a DNA binding domain outside the repeat responsible for non-specific DNA binding.
  • the TALE moiety in the proteins of the present invention may include such repeat outer DNA binding domains.
  • the domain may have an artificial mutation.
  • the TALE moiety has a structure such as a tag sequence for detection and purification, a nuclear localization sequence, a reporter sequence such as a fluorescent protein, or an intervening sequence that is cleaved by an endogenous enzyme in a cell. May be.
  • the protein of the present invention is the same as the TALE moiety in the protein of the present invention except that the protein of the present invention does not have the above-mentioned artificial mutation (eg, the above-described artificial modification is not performed). It is preferable that the binding activity to the target DNA is increased as compared with a protein containing a TALE moiety having an amino acid sequence.
  • the increase in binding activity was measured by the method described in Example 1 described later (Mussolino et al., Nucleic Acids Res. 2011; 39 (21): 9283, Cong et. Al., Nat Commun. 2012 ; 3: 968), preferably at least 1.5 times, more preferably at least 2 times, even more preferably at least 5 times, and particularly preferably at least 10 times.
  • the protein of the present invention may have a reduced binding activity to the target DNA as compared to the unmodified protein having no artificial mutation in the protein of the present invention.
  • the reduction in binding activity can be examined in the same manner as described above, for example, 2/3 or less, 1/2 or less, or 1/4 or less.
  • the functional domain also includes a transcriptional activator domain such as VP16, a transcriptional repressor domain such as KRAB, or a DNA methyltransferase or histone acetyltransferase in order to use the protein of the present invention in transcriptional activity regulation or epigenome control. Or an epigenome regulator domain such as histone deacetylase.
  • the functional domain may also include all or part of a fluorescent protein, photoprotein, chromoprotein, or all or part of an enzyme protein that catalyzes a fluorescent, luminescent or chromogenic reaction.
  • the “part” means, for example, a part capable of exhibiting a target function by itself.
  • the protein of the present invention can be produced according to the production method of the present invention described later.
  • the present invention also provides an isolated nucleic acid (hereinafter also referred to as the nucleic acid of the present invention) encoding the amino acid sequence of the protein of the present invention.
  • Biol. (2012) Chapter 12: Unit 12.15 can be obtained from Addgene (For example, cell engineering, Vol. 32, No. 5 (2013): 510-514, etc.). These kits are convenient because conventional TALENs can be prepared simply by connecting modules corresponding to the target DNA sequence according to the manufacturer's manual. In order to produce a TALE-containing protein that does not contain a nuclease, the FokI functional domain may be simply removed from the vectors contained in these kits.
  • plasmid vectors derived from E. coli (eg, pBR322, pBR325, pUC12, pUC13), plasmid vectors derived from Bacillus subtilis (eg, pUB110, pTP5, pC194), yeast-derived plasmid vectors (eg, pSH19, pSH15), Examples include plasmid vectors for eukaryotic cells (pCS2, pCMV, pcDNA, pCAGGS), binary vectors for plant cells, and the like, which can be appropriately selected according to the type of host used and the purpose of use.
  • E. coli eg, pBR322, pBR325, pUC12, pUC13
  • Bacillus subtilis eg, pUB110, pTP5, pC194
  • yeast-derived plasmid vectors eg, pSH19, pSH15
  • Examples include plasmid vectors for eukaryotic cells (p
  • the expression vector of the present invention is preferably isolated or purified.
  • dTALE Construction of dTALE
  • pCS2-TALE-VP48 vector pCS2-TALE (citri) -VP48 vector
  • pCS2-TALE EQ

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

The present invention provides: a protein containing an altered-type TALE section which exerts excellent binding activity with respect to a given target DNA base sequence with which sufficient DNA binding activity could not have been conventionally achieved; a nucleic acid coding for the aforementioned protein; an expression vector containing said nucleic acid; uses for the aforementioned protein, nucleic acid, and expression vector; and a method for screening the aforementioned protein. Specifically, the present invention provides an isolated altered-type protein exerting binding activity with respect to a target DNA, the altered-type protein containing a Transcription Activator-Like (TAL) Effector section derived from a Xanthomonas bacterium and having a repeating structure of multiple modules, wherein each of the modules has a target base recognition region for recognizing one base constituting the base sequence of the target DNA, and at least one of the modules has an amino acid sequence which was altered so that at least one amino acid residue, which is selected from a group comprising the 2nd to 6th and the 30th to 34th amino acids in an amino acid sequence represented by sequence number 1, has an artificial mutation.

Description

DNA結合タンパク質ドメインの改変による高活性TALEタンパク質Highly active TALE protein by modification of DNA binding protein domain
 本発明は、標的DNAに対する結合活性が変化した改変型TALE部分を含むタンパク質、前記タンパク質をコードする核酸、前記核酸を含む発現ベクター、およびそれらの用途、ならびにTALE部分を含むタンパク質において標的DNAに対する結合活性を変化させる方法等に関する。 The present invention relates to a protein comprising a modified TALE moiety with altered binding activity to the target DNA, a nucleic acid encoding the protein, an expression vector comprising the nucleic acid, and their use, and binding to the target DNA in the protein comprising the TALE moiety The present invention relates to a method for changing activity.
 個々の遺伝子の機能を調べる手法として、相同組換えを利用した標的遺伝子のノックアウト(破壊)や外来遺伝子のノックイン(付加)によるゲノム編集技術が広く用いられている。ゲノム編集技術においては、様々な生物種における任意の遺伝子配列をより選択的かつ自在に改変可能な技術が求められており、近年、人工ヌクレアーゼ(ZFNやTALEN)を利用した新たなツールが注目されている。 As a method for examining the functions of individual genes, genome editing techniques using knockout (destruction) of target genes and knockin (addition) of foreign genes using homologous recombination are widely used. In genome editing technology, there is a demand for technology that can selectively and freely modify arbitrary gene sequences in various biological species. In recent years, new tools using artificial nucleases (ZFN and TALEN) have attracted attention. ing.
 人工ヌクレアーゼは、DNAに配列特異的に結合するドメインと、DNA切断ドメインを連結させたキメラタンパク質である。前者が標的DNA配列を特異的に認識して結合し、後者がその近傍でDNAを切断する。切断されたDNAが、内在性の機構で修復される過程を利用して、標的遺伝子への欠失・挿入・塩基置換などの変異導入や、標的領域近傍への外来DNAの特異的導入を容易に行うことが可能となる。これにより、多くの植物、微生物、動物において、目的通りにゲノム配列の改変が生じた培養細胞や生物個体を得ることができる。将来的には、疾患モデルの作成、疾患原因遺伝子の改変による遺伝子治療、および目的とする形質の植物の作出などへの応用展開が期待される。 Artificial nuclease is a chimeric protein in which a domain that specifically binds to DNA and a DNA cleavage domain are linked. The former specifically recognizes and binds to the target DNA sequence, and the latter cleaves the DNA in the vicinity. Utilizing the process by which cleaved DNA is repaired by an endogenous mechanism, it is easy to introduce mutations such as deletion, insertion, and base substitution into the target gene, and to introduce specific foreign DNA into the vicinity of the target region. Can be performed. As a result, in many plants, microorganisms, and animals, cultured cells or individual organisms in which the genomic sequence has been modified as intended can be obtained. In the future, it is expected to be applied to the creation of disease models, gene therapy by modifying disease-causing genes, and the creation of plants with the desired traits.
 TALENは、植物病原性細菌Xanthomonas属が有する転写因子Transcription Activator-Like (TAL) Effector(TALE)をDNA結合ドメインとして利用し、これにDNA切断ドメイン (エンドヌクレアーゼ)を融合させた人工ヌクレアーゼである。TALENは、競合するZinc Finger Nuclease(ZFN)に比べて標的遺伝子の自由度が高く、作製の簡便さやコスト等の点において有利であり、ラボベースの設計を支援するためのデータベースやキット、プロトコール等が提供されている(例えば、非特許文献1~3等)。 TALEN is an artificial nuclease that uses the transcription factor Transcription Activator-Like TAL (TAL) Effector (TALE) possessed by the genus Xanthomonas as a DNA binding domain, and is fused with a DNA cleavage domain エ ン ド (endonuclease). TALEN has a higher degree of freedom in target genes compared to competing Zinc Finger Nuclease (ZFN), and is advantageous in terms of ease of production, cost, etc. There are databases, kits, protocols, etc. to support lab-based design. Provided (for example, Non-Patent Documents 1 to 3).
 TALEは、病原性細菌が感染したときに、宿主細胞の免疫機構が働くのを抑えるための遺伝子発現調節に関わる転写因子として発見された(非特許文献5)。TALENにおいて、TALE由来のDNA結合ドメインは約34アミノ酸からなる構造単位(モジュール)を10~30個の繰り返し数で連結させて、目的とするゲノム上の標的塩基配列(およそ17bp)に結合するように設計される。各モジュールは、上記標的塩基配列を構成する1塩基を認識するように改変される、2アミノ酸残基を有する可変領域を含む。該可変領域は、Repeat-Variable-Diresidues (RVD)と呼ばれ、通常12、13番目のアミノ酸がこれに相当する。即ち、TALENにおいては、塩基種(A、G、T、C)毎に上記可変領域が改変された各モジュールを、上記標的塩基配列に応じて連結することにより、TALEが上記標的塩基配列を特異的に認識して結合し、上記DNA切断ドメインによりDNAの2本鎖切断が引き起こされる(例えば、非特許文献4、6~8等)。 TALE was discovered as a transcription factor involved in gene expression regulation to suppress the host cell's immune mechanism from acting when pathogenic bacteria are infected (Non-patent Document 5). In TALEN, the DNA binding domain derived from TALE is linked to a target base sequence (approximately 17 bp) on the target genome by linking structural units (modules) consisting of about 34 amino acids with a repeat number of 10 to 30. Designed to. Each module includes a variable region having 2 amino acid residues that is modified to recognize one base constituting the target base sequence. The variable region is called Repeat-Variable-Diresidues (RVD), and the 12th and 13th amino acids usually correspond to this. That is, in TALEN, TALE makes the target base sequence specific by linking each module in which the variable region is modified for each base type (A, G, T, C) according to the target base sequence. Recognizes and binds to the DNA, and double-strand breaks of DNA are caused by the above-mentioned DNA cleavage domain (for example, Non-Patent Documents 4, 6 to 8).
 また、TALEは、かかる標的塩基配列への結合能を利用して、例えばプロモーター領域内の特定の転写因子結合領域に結合する人工転写因子として転写調節や、エピゲノム制御等への応用も可能である。 In addition, TALE can be applied to transcription regulation, epigenome control, and the like as an artificial transcription factor that binds to a specific transcription factor binding region in the promoter region, for example, by utilizing the binding ability to such a target base sequence. .
 最近、非特許文献9~11に開示されるように、TALEの立体構造が明らかになり、Helix-turn-helix構造を有するモジュールの繰り返し構造が、目的のDNAの主溝に巻き付き、各モジュールのturn部分に位置するRVD領域がDNAとの結合安定性と特異性に寄与することを示唆する報告がなされた。 Recently, as disclosed in Non-Patent Documents 9 to 11, the three-dimensional structure of TALE has been clarified, and a repeating structure of a module having a Helix-turn-helix structure is wound around the main groove of the target DNA, There have been reports suggesting that the RVD region located in the turn part contributes to the stability and specificity of binding to DNA.
 TALENの改良においては、DNAとの結合安定性の向上を図るために、これまでRVD領域に着目して様々なアプローチが試みられている(例えば、非特許文献12~14及び特許文献1等)。しかしながら、目的とするゲノムによっては、未だ十分な切断効率を得られない場合があり、より標的塩基配列に対する結合安定性と特異性とを兼ね備えたTALE部分の改変が望まれる。 In the improvement of TALEN, various approaches have been attempted so far focusing on the RVD region in order to improve the binding stability with DNA (for example, Non-Patent Documents 12 to 14 and Patent Document 1). . However, depending on the target genome, sufficient cleavage efficiency may still not be obtained, and it is desired to modify the TALE part that has both binding stability and specificity for the target base sequence.
特表2013-513389号公報Special Table 2013-513389
 本発明は、当該技術分野における上述の現状に鑑み為されたものであり、従来型のTALEでは、十分な結合活性が得られなかった任意の標的DNA塩基配列に対して、優れたDNA結合安定性と特異性とを有する改変型のTALE部分を含むタンパク質、前記タンパク質をコードする核酸、前記核酸を含む発現ベクター、およびそれらの用途、ならびに前記タンパク質のスクリーニング方法、等を提供することを目的とする。 The present invention has been made in view of the above-described present situation in the technical field, and has excellent DNA binding stability with respect to an arbitrary target DNA base sequence for which sufficient binding activity has not been obtained with conventional TALE. It is an object to provide a protein containing a modified TALE moiety having sex and specificity, a nucleic acid encoding the protein, an expression vector containing the nucleic acid, their use, and a screening method for the protein. To do.
 本発明者らは、上述の課題を解決するために鋭意検討を行った。その過程で、本発明者らは、Xanthomonas属の種々の細菌が持つ約1000種類のTALEのDNA結合ドメインの繰り返し部分の配列を解析した。その結果、DNAの特定の塩基の認識に寄与することが従来知られていた、繰り返し部分の各モジュール内の12-13番目のアミノ酸(RVD)に加えて、各モジュール内の4番目および32番目のアミノ酸も配列保存性が低いことを見出した。そこで、本発明者らは更にTALEの分子構造を検討したところ、4番目および32番目のアミノ酸は、隣接するモジュール間の結合に関与し、TALE分子の立体構造の安定化に重要な役割を果たしていることが示唆された。係る知見に基づき、本発明者らは、これらのアミノ酸に変異を導入することにより、TALEの活性を人為的に変化させることができる可能性を着想し、VoytasらのGolden Gate TALEN構築手法およびその改変法(非特許文献1および2)をベースに、4番目および32番目のアミノ酸残基に変異を導入し、活性を測定する実験を行った。その結果、変異の導入により、標的DNA配列に対する特異的な結合活性が向上した高活性のTALEタンパク質の構築に成功した。以上の知見に基づき、本発明者らは更なる検討を行い、本発明を完成させるに至った。 The present inventors have intensively studied to solve the above-mentioned problems. In the process, the present inventors analyzed the sequence of the repetitive portion of the DNA binding domain of about 1000 types of TALE possessed by various bacteria of the genus Xanthomonas. As a result, in addition to the 12th to 13th amino acids (RVD) in each module of the repetitive part, which was previously known to contribute to the recognition of specific bases in DNA, the 4th and 32nd positions in each module These amino acids also have low sequence conservation. Therefore, the present inventors further examined the molecular structure of TALE, and the 4th and 32nd amino acids were involved in the binding between adjacent modules and played an important role in stabilizing the tertiary structure of the TALE molecule. It was suggested that Based on such findings, the present inventors have conceived the possibility that the activity of TALE can be artificially changed by introducing mutations into these amino acids, and the Voytas et al. Golden Gate TALEN construction method and its Based on the modification method (Non-patent Documents 1 and 2), mutations were introduced into the 4th and 32nd amino acid residues, and experiments were conducted to measure the activity. As a result, a highly active TALE protein with improved specific binding activity to the target DNA sequence was successfully constructed by introducing mutations. Based on the above findings, the present inventors have made further studies and completed the present invention.
 本発明は、即ち、以下の通りである。
[1]標的DNAに対する結合活性を有する単離された改変型タンパク質であって、
 前記改変型タンパク質は、複数のモジュールの繰返し構造を有するXanthomonas属細菌由来Transcription Activator-Like (TAL) Effector部分を含み、
 前記複数のモジュールの各々は、前記標的DNAの塩基配列を構成するそれぞれ1塩基を認識する標的塩基認識領域を有し、かつ、
 前記複数のモジュールのうちの少なくとも1つは、配列番号1で表されるアミノ酸配列において、2~6番目および30~34番目からなる群から選択される少なくとも1つのアミノ酸残基が人為的な変異を有するように改変されたアミノ酸配列を有する、
前記改変型タンパク質。
[2]前記人為的な変異を有するように改変されたアミノ酸配列を有するモジュールの少なくとも1つが、配列番号1で表されるアミノ酸配列において、2~6番目からなる群から選択される少なくとも1つのアミノ酸残基と30~34番目からなる群から選択される少なくとも1つのアミノ酸残基とが人為的な変異を有するように改変されたものである、上記[1]に記載の改変型タンパク質。
[3]前記複数のモジュールのうちの少なくとも1つが、配列番号1で表されるアミノ酸配列において、20~26番目からなる群から選択される少なくとも1つのアミノ酸残基が人為的な変異を有するように改変されたものである、上記[1]または[2]に記載の改変型タンパク質。
[4]前記複数のモジュールのうちの少なくとも1つが、配列番号1で表されるアミノ酸配列において11番目のアミノ酸残基がアスパラギンになるように人為的に改変されている、上記[1]~[3]のいずれかに記載の改変型タンパク質。
[5]前記人為的な変異を有するように改変されたアミノ酸配列を有するモジュールの少なくとも1つが、配列番号1で表されるアミノ酸配列と80%以上の相同性を有し、かつ、前記相同性を有するアミノ酸配列と配列番号1で表されるアミノ酸配列とをアライメントしたとき、配列番号1で表されるアミノ酸配列において4番目および/または32番目のアミノ酸残基が人為的な変異を有するように改変されたものである、上記[1]~[4]のいずれかに記載の改変型タンパク質。
[6]前記配列番号1で表されるアミノ酸配列と80%以上の相同性を有するアミノ酸配列を有するモジュールの少なくとも1つが、前記相同性を有するアミノ酸配列と配列番号1で表されるアミノ酸配列とをアライメントしたとき、(i)配列番号1で表されるアミノ酸配列において4番目のアミノ酸残基がグルタミン酸となり、かつ32番目のアミノ酸残基がアラニンとなるように改変されたものであるか、または(ii)配列番号1で表されるアミノ酸配列において4番目のアミノ酸残基がグルタミンとなり、かつ32番目のアミノ酸残基がアラニンとなるように改変されたものである、上記[5]に記載の改変型タンパク質。
[7]前記複数のモジュールの全てにおいて、前記変異が同一のパターンである、上記[1]~[6]のいずれかに記載の改変型タンパク質。
[8]前記繰返し構造におけるモジュールの個数が、6~36個である、上記[1]~[7]のいずれかに記載の改変型タンパク質。
[9]前記TAL Effector部分が由来するXanthomonas属細菌に由来しない機能ドメインを更に含む、上記[1]~[8]のいずれかに記載の改変型タンパク質。
[10]前記機能ドメインが、核酸分解酵素または核酸転移酵素の全部もしくは一部分である、上記[9]に記載の改変型タンパク質。
[11]前記核酸分解酵素が、制限酵素FokIのDNA切断ドメインを含む、上記[10]に記載の改変型タンパク質。
[12]前記機能ドメインが、転写活性化因子ドメイン、転写抑制因子ドメインまたはエピゲノム制御因子ドメインを含む、上記[9]に記載の改変型タンパク質。
[13]前記機能ドメインが、蛍光タンパク質、発光タンパク質、色素タンパク質の全体または一部分、あるいは、蛍光、発光または発色反応を触媒する酵素タンパク質の全体または一部分を含む、上記[9]~[12]のいずれかに記載の改変型タンパク質。
[14]上記[1]~[13]のいずれか1項に記載の改変型タンパク質のアミノ酸配列をコードする単離された核酸。
[15]上記[14]に記載の核酸を含む発現ベクター。
[16]上記[15]に記載の発現ベクターが導入された形質転換体。
[17]上記[1]~[13]のいずれかに記載の改変型タンパク質の製造方法であって、当該方法は、
 元となるタンパク質をコードする核酸において変異を導入する工程であって、該変異は、該変異した核酸がコードするタンパク質において、前記改変型タンパク質が有する前記人為的な変異を生じるようなものであり、該元となるタンパク質は、前記人為的な変異を導入されたタンパク質のアミノ酸配列が前記改変型タンパク質のアミノ酸配列となるようなものである、前記工程、
 前記変異した核酸を含む発現ベクターを調製し、該発現ベクターを宿主細胞に導入することにより形質転換体を取得する工程、および、
 前記形質転換体を培養し、培養物から前記改変型タンパク質を単離する工程
を含む、前記方法。
[18]上記[1]~[13]のいずれかに記載の改変型タンパク質を細胞に導入するか、または、前記改変型タンパク質のアミノ酸配列をコードするRNAもしくは前記改変型タンパク質のアミノ酸配列をコードする核酸を含む発現ベクターを細胞に導入して前記細胞内で前記改変型タンパク質を発現させ、前記改変型タンパク質を標的遺伝子および/またはその周辺の領域に結合させることにより、(a)前記領域を切断するか、(b)前記領域を切断し、かつ切断された前記領域に相同組み換え修復または非相同末端連結修復を作用させることにより前記領域を改変するか、(c)前記領域を修飾するか、または、(d)前記領域周辺の遺伝子発現を変化させる工程を含む、前記細胞における前記領域の切断、改変または修飾方法。
[19]前記細胞が、動物の精子、未受精卵、受精卵、胎児もしくは成体を構成する細胞、もしくは、植物ないし動物の組織から採取した細胞、胚性幹細胞(ES細胞)または人工多能性幹細胞(iPS細胞)である、上記[18]に記載の方法。
[20]標的遺伝子および/またはその周辺の領域が切断、改変または修飾された変異生物の個体または系統を作製するための方法であって、前記方法は、
(1)前記領域を含む前記生物の細胞を用意する工程と、
(2)上記[1]~[13]のいずれかに記載の改変型タンパク質を細胞に導入するか、または、前記改変型タンパク質のアミノ酸配列をコードするRNAもしくは前記改変型タンパク質のアミノ酸配列をコードする核酸を含む発現ベクターを細胞に導入して前記細胞内で前記改変型タンパク質を発現させ、前記改変型タンパク質を前記領域に結合させることにより、(a)前記領域を切断するか、(b)前記領域を切断し、かつ切断された前記領域に相同組み換え修復または非相同末端連結修復を作用させることにより前記領域を改変するか、(c)前記領域を修飾するか、または、(d)前記領域周辺の遺伝子発現を変化させる工程と、
(3)工程(2)により得られた細胞から前記変異生物の個体または系統を作製する工程と
を含む、前記方法。
[21]上記[20]に記載の方法により得られた、変異生物の個体または系統。
[22]標的DNAに対する結合活性が未改変型タンパク質と比較して変化した改変型タンパク質をスクリーニングするための方法であって、
(1)上記[1]~[13]のいずれかに記載の改変型タンパク質の、前記標的DNAに対する結合活性を測定する工程、
(2)前記改変型タンパク質における前記人為的な変異を有しない未改変型タンパク質の、前記標的DNAに対する結合活性を測定する工程、
(3)前記未改変型タンパク質が有する前記結合活性と比較して、前記改変型タンパク質が有する前記結合活性が変化している場合に、前記改変型タンパク質を、前記標的DNAに対する結合活性が前記未改変型タンパク質と比較して変化した改変型タンパク質として選択する工程
を有する、前記方法。
[23]前記工程(1)の以前に、上記[17]に記載の方法を用いて前記改変型タンパク質を調製する工程を更に含む、上記[22]に記載の方法。
[24]標的DNAに対する切断活性が未改変型タンパク質と比較して変化した改変型タンパク質をスクリーニングするための方法であって、
(1)上記[10]または[11]に記載の改変型タンパク質の、該標的DNAに対する切断活性を測定する工程、
(2)該改変型タンパク質における該人為的な変異を有しない未改変型タンパク質の、該標的DNAに対する切断活性を測定する工程、
(3)該未改変型タンパク質が有する該切断活性と比較して、該改変型タンパク質が有する該切断活性が変化している場合に、該改変型タンパク質を、該標的DNAに対する切断活性が該未改変型タンパク質と比較して変化した改変型タンパク質として選択する工程
を有する、前記方法。
[25]前記工程(1)の以前に、上記[17]に記載の方法を用いて前記改変型タンパク質を調製する工程を更に含む、上記[24]に記載の方法。
That is, the present invention is as follows.
[1] An isolated modified protein having binding activity to a target DNA,
The modified protein includes a Transcription Activator-Like (TAL) Effector portion derived from a genus Xanthomonas having a repeating structure of a plurality of modules,
Each of the plurality of modules has a target base recognition region that recognizes one base constituting the base sequence of the target DNA, and
In at least one of the plurality of modules, in the amino acid sequence represented by SEQ ID NO: 1, at least one amino acid residue selected from the group consisting of 2 to 6 and 30 to 34 is artificially mutated Having an amino acid sequence modified to have
The modified protein.
[2] At least one of the modules having an amino acid sequence modified to have an artificial mutation is at least one selected from the group consisting of 2 to 6 in the amino acid sequence represented by SEQ ID NO: 1. The modified protein according to [1] above, wherein the amino acid residue and at least one amino acid residue selected from the group consisting of 30 to 34 are modified so as to have an artificial mutation.
[3] At least one of the plurality of modules is such that at least one amino acid residue selected from the group consisting of 20th to 26th in the amino acid sequence represented by SEQ ID NO: 1 has an artificial mutation The modified protein according to the above [1] or [2], which has been modified to.
[4] The above [1] to [1], wherein at least one of the plurality of modules is artificially modified so that the 11th amino acid residue in the amino acid sequence represented by SEQ ID NO: 1 is asparagine. 3]. The modified protein according to any one of [3].
[5] At least one of the modules having an amino acid sequence modified to have an artificial mutation has 80% or more homology with the amino acid sequence represented by SEQ ID NO: 1, and the homology When the amino acid sequence represented by SEQ ID NO: 1 is aligned with the amino acid sequence represented by SEQ ID NO: 1, the 4th and / or 32nd amino acid residue in the amino acid sequence represented by SEQ ID NO: 1 has an artificial mutation The modified protein according to any one of [1] to [4] above, which is modified.
[6] At least one of the modules having an amino acid sequence having 80% or more homology with the amino acid sequence represented by SEQ ID NO: 1 comprises the amino acid sequence having the homology and the amino acid sequence represented by SEQ ID NO: 1. (I) the amino acid sequence represented by SEQ ID NO: 1 has been modified so that the fourth amino acid residue is glutamic acid and the 32nd amino acid residue is alanine, or (Ii) The amino acid sequence represented by SEQ ID NO: 1 according to the above [5], which is modified so that the fourth amino acid residue is glutamine and the 32nd amino acid residue is alanine. Modified protein.
[7] The modified protein according to any one of [1] to [6] above, wherein the mutation has the same pattern in all of the plurality of modules.
[8] The modified protein according to any one of [1] to [7] above, wherein the number of modules in the repeating structure is 6 to 36.
[9] The modified protein according to any one of [1] to [8] above, further comprising a functional domain not derived from a genus Xanthomonas from which the TAL Effector moiety is derived.
[10] The modified protein according to [9] above, wherein the functional domain is all or a part of a nucleolytic enzyme or a nucleotransferase.
[11] The modified protein according to [10] above, wherein the nucleolytic enzyme contains a DNA cleavage domain of the restriction enzyme FokI.
[12] The modified protein according to [9] above, wherein the functional domain includes a transcriptional activator domain, a transcriptional repressor domain, or an epigenome regulator domain.
[13] The above [9] to [12], wherein the functional domain includes all or part of a fluorescent protein, photoprotein, or chromoprotein, or all or part of an enzyme protein that catalyzes fluorescence, luminescence, or color reaction. The modified protein according to any one of the above.
[14] An isolated nucleic acid encoding the amino acid sequence of the modified protein according to any one of [1] to [13] above.
[15] An expression vector comprising the nucleic acid according to [14] above.
[16] A transformant into which the expression vector according to [15] is introduced.
[17] A method for producing the modified protein according to any one of [1] to [13] above, wherein the method comprises:
A step of introducing a mutation in the nucleic acid encoding the original protein, wherein the mutation is such that the artificial mutation of the modified protein occurs in the protein encoded by the mutated nucleic acid; The original protein is such that the amino acid sequence of the protein into which the artificial mutation is introduced becomes the amino acid sequence of the modified protein,
Preparing an expression vector containing the mutated nucleic acid and obtaining the transformant by introducing the expression vector into a host cell; and
The method comprising culturing the transformant and isolating the modified protein from the culture.
[18] The modified protein according to any one of [1] to [13] is introduced into a cell, or RNA encoding the amino acid sequence of the modified protein or the amino acid sequence of the modified protein is encoded. An expression vector containing a nucleic acid to be expressed is introduced into a cell, the modified protein is expressed in the cell, and the modified protein is bound to a target gene and / or a region around it, (a) Whether to cleave, (b) modify the region by cleaving the region and applying homologous recombination repair or non-homologous end-joining repair to the cleaved region, or (c) modifying the region Or (d) a method of cleaving, altering or modifying the region in the cell, comprising the step of changing gene expression around the region.
[19] The cells are animal sperm, unfertilized eggs, fertilized eggs, cells constituting fetuses or adults, cells collected from plants or animal tissues, embryonic stem cells (ES cells), or artificial pluripotency The method according to [18] above, which is a stem cell (iPS cell).
[20] A method for producing an individual or strain of a mutant organism in which a target gene and / or a region around it is cleaved, altered or modified,
(1) preparing a cell of the organism including the region;
(2) The modified protein according to any one of the above [1] to [13] is introduced into a cell, or the RNA encoding the amino acid sequence of the modified protein or the amino acid sequence of the modified protein is encoded. An expression vector containing a nucleic acid to be introduced is introduced into a cell, the modified protein is expressed in the cell, and the modified protein is bound to the region, so that (a) the region is cleaved, or (b) Modifying the region by cleaving the region and applying homologous recombination repair or non-homologous end-joining repair to the cleaved region, (c) modifying the region, or (d) Changing the gene expression around the region;
(3) The method including the step of producing an individual or strain of the mutant organism from the cells obtained in step (2).
[21] An individual or strain of a mutant organism obtained by the method according to [20] above.
[22] A method for screening a modified protein whose binding activity to a target DNA is changed compared to an unmodified protein,
(1) a step of measuring the binding activity of the modified protein according to any one of [1] to [13] to the target DNA;
(2) measuring the binding activity of the unmodified protein having no artificial mutation in the modified protein to the target DNA;
(3) When the binding activity of the modified protein is changed as compared with the binding activity of the unmodified protein, the modified protein has a binding activity to the target DNA that is not The said method which has the process of selecting as a modified protein changed compared with the modified protein.
[23] The method according to [22] above, further comprising the step of preparing the modified protein using the method according to [17] before the step (1).
[24] A method for screening a modified protein whose cleavage activity against a target DNA is changed as compared with an unmodified protein,
(1) a step of measuring the cleavage activity of the modified protein according to [10] or [11] with respect to the target DNA;
(2) a step of measuring the cleavage activity of the unmodified protein having no artificial mutation in the modified protein with respect to the target DNA;
(3) When the cleavage activity of the modified protein is changed as compared to the cleavage activity of the unmodified protein, the modified protein has a cleavage activity against the target DNA. The said method which has the process of selecting as a modified protein changed compared with the modified protein.
[25] The method according to [24], further comprising the step of preparing the modified protein using the method according to [17] before the step (1).
 本発明に係る改変型TALE部分は、従来型のTALEでは、十分なDNA結合活性を得られなかった任意の標的DNA塩基配列に対して、優れた結合活性(高い結合安定性および結合特異性)が得られる。そのため、そのような改変型TALE部分を含む本発明のタンパク質は、配列非依存的なDNA切断ドメインとの組み合わせを利用したゲノム編集や、標的遺伝子を特異的に活性化または抑制するための人工転写因子としての利用等において、高い効率を提供できる。本発明はまた、TALE部分の改変により、標的DNA塩基配列に対する結合活性を制御(増大または低減)することを可能とする。本発明はまた、前記タンパク質をコードする核酸、前記核酸を含む発現ベクター、前記タンパク質のスクリーニング方法、前記のタンパク質、核酸または発現ベクター等を利用したゲノムへの変異または修飾の導入方法等も提供する。 The modified TALE portion according to the present invention has excellent binding activity (high binding stability and binding specificity) for any target DNA base sequence for which sufficient DNA binding activity could not be obtained with conventional TALE. Is obtained. Therefore, the protein of the present invention containing such a modified TALE moiety can be used for genome editing using a combination with a sequence-independent DNA cleavage domain, or artificial transcription for specifically activating or suppressing a target gene. High efficiency can be provided in use as a factor. The present invention also makes it possible to control (increase or decrease) the binding activity to the target DNA base sequence by modifying the TALE moiety. The present invention also provides a nucleic acid encoding the protein, an expression vector containing the nucleic acid, a method for screening the protein, a method for introducing mutation or modification into the genome using the protein, nucleic acid, expression vector, or the like. .
天然TALEのリピート配列におけるアミノ酸残基の保存性解析の結果を示す図である。It is a figure which shows the result of the conservation property of the amino acid residue in the repeat sequence of natural TALE. 10種類のX. oryzaeのTALEリピートの4番目、32番目のアミノ酸残基の組み合わせを示す図である。It is a figure which shows the combination of the 4th and 32nd amino acid residue of TALE repeat of 10 types of X. oryzae. X. citri等で見られる、TALEリピートの4番目、32番目のアミノ酸残基のEA型の組み合わせを示す図である。It is a figure which shows the combination of the EA type | mold of the 4th and 32nd amino acid residues of a TALE repeat seen in X. citri etc. X. axonopodis等で見られる、TALEリピートの4番目、32番目のアミノ酸残基のDQ型の組み合わせを示す図である。It is a figure which shows the combination of DQ type | mold of the 4th and 32nd amino acid residue of TALE repeat seen in X. axonopodis etc. TALEリピートの4番目および32番目の残基がTALEリピート間の結合に関与することを説明するための図である。It is a figure for demonstrating that the 4th and 32nd residue of a TALE repeat participates in the coupling | bonding between TALE repeats. DNA非結合時および結合時のTALEの構造を説明するための図である。It is a figure for demonstrating the structure of TALE at the time of DNA non-bonding and a coupling | bonding. dTALE 85F(従来型)とdTALE 85mF(改変型(EA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 85Fとターゲット85F, 2: dTALE 85Fとコントロールターゲット, 3: dTALE 85mFとターゲット85F, 4: dTALE 85mFとコントロールターゲットIt is a figure which shows the comparison of the DNA binding activity of dTALE 85F (conventional type) and dTALE 85mF (modified type (EA type)). Lane 1: dTALE 85F and target 85F, 2: dTALE 85F and control target, 3: dTALE 85mF and target 85F, 4: dTALE 85mF and control target dTALE 85R (従来型)とdTALE 85mR(改変型(EA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 85Rとターゲット85R, 2: dTALE 85Rとコントロールターゲット, 3: dTALE 85mRとターゲット85R, 4: dTALE 85mRとコントロールターゲットIt is a figure which shows the comparison of the DNA binding activity of dTALE 85R (conventional type) and dTALE 85mR (modified type (EA type)). Lane 1: dTALE 85R and target 85R, 2: dTALE 85R and control target, 3: dTALE 85mR and target 85R, 4: dTALE 85mR and control target dTALE 209F(従来型)とdTALE 209mF(改変型(EA型))、およびdTALE 209QF(改変型(EQ型))のDNA結合活性の比較を示す図である。レーン1: dTALE 209Fとターゲット209F, 2: dTALE 209Fとコントロールターゲット, 3: dTALE 209mFとターゲット209F, 4: dTALE 209mFとコントロールターゲット, 5: dTALE 209QFとターゲット209F, 6: dTALE 209QFとコントロールターゲットIt is a figure which shows the comparison of DNA binding activity of dTALE-209F (conventional type), dTALE-209mF (modified type (EA type)), and dTALE-209QF (modified type (EQ type)). Lane 1: dTALE 209F and target 209F, 2: dTALE 209F and control target, 3: dTALE 209mF and target 209F, 4: dTALE 209mF and control target, 5: dTALE 209QF and target 209F, 6: dTALE 209QF and control target dTALE 209R(従来型)とdTALE 209mR(改変型(EA型))、dTALE 209QR(改変型(EQ型))、dTALE 209m-QR(複合改変型(EA-EQ型))、およびdTALE 209Q-mR(複合改変型(EA-EQ型))のDNA結合活性の比較を示す図である。レーン1: dTALE 209Rとターゲット209R, 2: dTALE 209Rとコントロールターゲット, 3: dTALE 209mRとターゲット209R, 4: dTALE 209mRとコントロールターゲット, 5: dTALE 209QRとターゲット209R, 6: dTALE 209QRとコントロールターゲット, 7: dTALE 209m-QRとターゲット209R, 8: dTALE 209m-QRとコントロールターゲット, 9: dTALE 209Q-mRとターゲット209R, 10: dTALE 209Q-mRとコントロールターゲットdTALE 209R (conventional) and dTALE 209mR (modified (EA)), dTALE 209QR (modified (EQ)), dTALE 209m-QR (combined modified (EA-EQ)), and dTALE 209Q-mR It is a figure which shows the comparison of the DNA binding activity of (complex modified type (EA-EQ type)). Lane 1: dTALE 209R and target 209R, 2: dTALE 209R and control target, 3: dTALE 209mR and target 209R, 4: dTALE 209mR and control target, 5: dTALE 209QR and target 209R, 6: dTALE 209QR and control target, 7 : DTALE 209m-QR and target 209R, 8: dTALE 209m-QR and control target, 9: dTALE 209Q-mR and target 209R, 10: TdTALE 209Q-mR and control target HMAによる従来型TALENと改変型TALENの活性の比較を示す図である。It is a figure which shows the comparison of the activity of the conventional TALEN and modified TALEN by HMA. 従来型TALEN 209Fと改変型TALEN 209mFのin vitro DNA切断活性の比較を示す図である。It is a figure which shows the comparison of the in-vitro DNA cutting activity of conventional TALEN-209F and modified TALEN-209mF. 従来型TALEN 209Rと改変型TALEN 209mRのin vitro DNA切断活性の比較を示す図である。It is a figure which shows the comparison of in-vitro DNA cutting activity of conventional TALEN-209R and modified TALEN-209mR. dTALE 85F (従来型)とdTALE 85mF (改変型(EA型))、及びdTALE 85m2F (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 85Fとターゲット85F, 2: dTALE 85Fと非特異的ターゲット 209R, 3: dTALE 85mFとターゲット85F, 4: dTALE 85mFと非特異的ターゲット 209R, 5: dTALE 85m2Fとターゲット85F, 6: dTALE 85m2Fと非特異的ターゲット 209RIt is a figure which shows the comparison of DNA binding activity of dTALE 85F (conventional type), dTALE 85mF (modified type (EA type)), and dTALE 85m2F (modified type (QA type)). Lane 1: dTALE 85F and target 85F, 2: dTALE 85F and nonspecific target 209R, 3: dTALE 85mF and target 85F, 4: dTALE 85mF and nonspecific target 209R, 5: dTALE 85m2F and target 85F, 6: dTALE 85m2F and non-specific target 209R dTALE 85R (従来型)とdTALE 85mR (改変型(EA型))、及びdTALE 85m2R (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 85Rとターゲット85R, 2: dTALE 85Rと非特異的ターゲット 209R, 3: dTALE 85mRとターゲット85R, 4: dTALE 85mRと非特異的ターゲット 209R, 5: dTALE 85m2Rとターゲット85R, 6: dTALE 85m2Rと非特異的ターゲット 209RIt is a figure which shows the comparison of DNA binding activity of dTALE 85R (conventional type), dTALE 85mR (modified type (EA type)), and dTALE 85m2R (modified type (QA type)). Lane 1: dTALE 85R and target 85R, 2: dTALE 85R and nonspecific target 209R, 3: dTALE 85mR and target 85R, 4: dTALE 85mR and nonspecific target 209R, 5: dTALE 85m2R and target 85R, 6: dTALE 85m2R and non-specific target 209R dTALE 209F (従来型)とdTALE 209mF (改変型(EA型))、及びdTALE 209m2F (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 209Fとターゲット209F, 2: dTALE 209Fと非特異的ターゲット 209R, 3: dTALE 209mFとターゲット209F, 4: dTALE 209mFと非特異的ターゲット 209R, 5: dTALE 209m2Fとターゲット209F, 6: dTALE 209m2Fと非特異的ターゲット 209RIt is a figure which shows the comparison of the DNA binding activity of dTALE-209F (conventional type), dTALE-209mF (modified type (EA type)), and dTALE-209m2F (modified type (QA type)). Lane 1: dTALE 209F and target 209F, 2: dTALE 209F and non-specific target 209R, 3: dTALE 209mF and target 209F, 4: dTALE 209mF and non-specific target 209R, 5: dTALE 209m2F and target 209F, 6: dTALE 209m2F and non-specific target 209R dTALE S1PR3F (従来型)とdTALE S1PR3mF (改変型(EA型))、及びdTALE S1PR3m2F (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE S1PR3FとターゲットS1PR3F, 2: dTALE S1PR3mFとターゲット S1PR3F, 3: dTALE S1PR3m2FとターゲットS1PR3FIt is a figure which shows the comparison of the DNA binding activity of dTALE S1PR3F (conventional type), dTALE S1PR3mF (modified type (EA type)), and dTALE S1PR3m2F (modified type (QA type)). Lane 1: dTALE S1PR3F and target S1PR3F, 2: dTALE S1PR3mF and target S1PR3F, 3: dTALE S1PR3m2F and target S1PR3F dTALE S1PR3R (従来型)とdTALE S1PR3mR (改変型(EA型))、及びdTALE S1PR3m2R (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE S1PR3RとターゲットS1PR3R, 2: dTALE S1PR3mRとターゲット S1PR3R, 3: dTALE S1PR3m2RとターゲットS1PR3RIt is a figure which shows the comparison of DNA-binding activity of dTALE S1PR3R (conventional type), dTALE S1PR3mR (modified type (EA type)), and dTALE S1PR3m2R (modified type (QA type)). Lane 1: dTALE S1PR3R and target S1PR3R, 2: dTALE S1PR3mR and target S1PR3R, 3: dTALE S1PR3m2R and target S1PR3R dTALE SphkF(従来型)、dTALE SphkmF(改変型(EA型))、dTALE SphkpmF(改変型(不完全EA型))及びdTALE Sphkm2F(改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE SphkFとターゲットSphkF, 2: dTALE SphkpmFとターゲット SphkF, 3: dTALE SphkmFとターゲット SphkF, 4: dTALE Sphkm2FとターゲットSphkFDiagram showing comparison of DNA binding activity of dTALE SphkF (conventional type), dTALE SphkmF (modified type (EA type)), dTALE SphkpmF (modified type (incomplete EA type)) and dTALE Sphkm2F (modified type (QA type)) It is. Lane 1: dTALE SphkF and target SphkF, 2: dTALE SphkpmF and target SphkF, 3: dTALE SphkmF and target SphkF, 4: dTALE Sphkm2F and target SphkF dTALE SphkR (従来型)とdTALE SphkmR (改変型(EA型))、及びdTALE Sphkm2R (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE SphkRとターゲットSphkR, 2: dTALE SphkmRとターゲット SphkR, 3: dTALE Sphkm2RとターゲットSphkRIt is a figure which shows the comparison of DNA binding activity of dTALE SphkR (conventional type), dTALE SphkmR (modified type (EA type)), and dTALE Sphkm2R (modified type (QA type)). Lane 1: dTALE SphkR and target SphkR, 2: dTALE SphkmR and target SphkR, 3: dTALE Sphkm2R and target SphkR dTALE CG16798F (従来型)とdTALE CG16798mF (改変型(EA型))、及びdTALE CG16798m2F (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE CG16798FとターゲットCG16798F, 2: dTALE CG16798mFとターゲット CG16798F, 3: dTALE CG16798m2FとターゲットCG16798FIt is a figure which shows the comparison of the DNA binding activity of dTALE CG16798F (conventional type), dTALE CG16798mF (modified type (EA type)), and dTALE CG16798m2F (modified type (QA type)). Lane 1: dTALE CG16798F and target CG16798F, 2: dTALE CG16798mF and target CG16798F, 3: dTALE CG16798m2F and target CG16798F dTALE CG16798R (従来型)とdTALE CG16798mR (改変型(EA型))、及びdTALE CG16798m2R (改変型(QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE CG16798RとターゲットCG16789R, 2: dTALE CG16798mRとターゲット CG16798R, 3: dTALE CG16798m2RとターゲットCG16798RIt is a figure which shows the comparison of DNA-binding activity of dTALE CG16798R (conventional type), dTALE CG16798mR (modified type (EA type)), and dTALE CG16798m2R (modified type (QA type)). Lane 1: dTALE CG16798R and target CG16789R, 2: dTALE CG16798mR and target CG16798R, 3: dTALE CG16798m2R and target CG16798R dTALE 209R (従来型)、dTALE 209mR (改変型(EA型))、dTALE 209m2R (改変型(QA型))、及びdTALE 209m3R (複合改変型(EA-QA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 209Rとターゲット209R, 2: dTALE 209mRとターゲット 209R, 3: dTALE 209m3Rとターゲット209R, 4: dTALE 209m2Rとターゲット209RComparison of DNA binding activity of dTALE 209R (conventional), dTALE 209mR (modified (EA)), dTALE 209m2R (modified (QA)), and dTALE 209m3R (combined modified (EA-QA)) FIG. Lane 1: dTALE 209R and target 209R, 2: dTALE 209mR and target 209R, 3: dTALE 209m3R and target 209R, 4: dTALE 209m2R and target 209R dTALE 85F(従来型)、dTALE 85pmF(改変型(不完全EA型))及びdTALE 85mF(改変型(EA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 85Fとターゲット85F, 2: dTALE 85Fと非特異的ターゲットTRE, 3: dTALE 85pmFとターゲット85F, 4: dTALE 85pmFと非特異的ターゲットTRE, 5: dTALE 85mFとターゲット85F, 6: dTALE 85mFと非特異的ターゲットTREIt is a figure which shows the comparison of the DNA binding activity of dTALE 85F (conventional type), dTALE 85pmF (modified type (incomplete EA type)) and dTALE 85mF (modified type (EA type)). Lane 1: dTALE 85F and target 85F, 2: dTALE 85F and nonspecific target TRE, 3: dTALE 85pmF and target 85F, 4: dTALE 85pmF and nonspecific target TRE, 5: dTALE 85mF and target 85F, 6: dTALE 85mF and non-specific target TRE dTALE 85R(従来型)、dTALE 85pmR(改変型(不完全EA型))及びdTALE 85mR(改変型(EA型))のDNA結合活性の比較を示す図である。レーン1: dTALE 85Rとターゲット85R, 2: dTALE 85Rと非特異的ターゲットTRE, 3: dTALE 85pmRとターゲット85R, 4: dTALE 85pmRと非特異的ターゲットTRE, 5: dTALE 85mRとターゲット85R, 6: dTALE 85mRと非特異的ターゲットTREIt is a figure which shows the comparison of DNA binding activity of dTALE 85R (conventional type), dTALE 85pmR (modified type (incomplete EA type)) and dTALE 85mR (modified type (EA type)). Lane 1: dTALE 85R and target 85R, 2: dTALE 85R and nonspecific target TRE, 3: dTALE 85pmR and target 85R, 4: dTALE 85pmR and nonspecific target TRE, 5: dTALE 85mR and target 85R, 6: dTALE 85mR and non-specific target TRE dTALE 209R (従来型)、dTALE 209mR (改変型(EA型))、dTALE 209h1R (複合改変型(DD-DA-EA型))、dTALE 209h3R (複合改変型(混合型1))、及びdTALE 209h2R (複合改変型(DA-EA型))の特異的及び非特異的DNA結合活性の比較を示す図である。レーン1: dTALE 209Rとターゲット209R, 2: dTALE 209Rとターゲット209R-1c, 3: dTALE 209Rとターゲット209R-1n, 4: dTALE 209Rとターゲット209R-1m, 5: dTALE 209Rとターゲット209R-3m, 6: dTALE 209mRとターゲット209R, 7: dTALE 209mRとターゲット209R-1c, 8: dTALE 209mRとターゲット209R-1n, 9: dTALE 209mRとターゲット209R-1m, 10: dTALE 209mRとターゲット209R-3m, 11: dTALE 209h1Rとターゲット209R, 12: dTALE 209h1Rとターゲット209R-1c, 13: dTALE 209h1Rとターゲット209R-1n, 14: dTALE 209h1Rとターゲット209R-1m, 15: dTALE 209h1Rとターゲット209R-3m, 16: dTALE 209h3Rとターゲット209R, 17: dTALE 209h3Rとターゲット209R-1c, 18: dTALE 209h3Rとターゲット209R-1n, 19: dTALE 209h3Rとターゲット209R-1m, 20: dTALE 209h3Rとターゲット209R-3m, 21: dTALE 209h2Rとターゲット209R, 22: dTALE 209h2Rとターゲット209R-1c, 23: dTALE 209h2Rとターゲット209R-1n, 24: dTALE 209h2Rとターゲット209R-1m, 25: dTALE 209h2Rとターゲット209R-3mdTALE 209R (conventional type), dTALE 209mR (modified type (EA type)), dTALE 209h1R (combined modified type (DD-DA-EA type)), dTALE 209h3R (combined modified type (mixed type 1)), and dTALE 209h2R It is a figure which shows the comparison of the specific and non-specific DNA binding activity of (complex modified type (DA-EA type)). Lane 1: dTALE 209R and target 209R, 2: dTALE 209R and target 209R-1c, 3: dTALE 209R and target 209R-1n, 4: dTALE 209R and target 209R-1m, 5: dTALE 209R and target 209R-3m, 6 : DTALE 209mR and target 209R, 7: dTALE 209mR and target 209R-1c, 8: dTALE 209mR and target 209R-1n, 9: RdTALE 209mR and target 209R-1m, 10: dTALE 209mR and target 209R-3m, 11: dTALE 209h1R and target 209R, 12: dTALE 209h1R and target 209R-1c, 13: dTALE 209h1R and target 209R-1n, 14: dTALE 209h1R and target 209R-1m, 15: dTALE 209h1R and target 209R-3m, 16: dTALE 209h3 Target 209R, 17: dTALE 209h3R and target 209R-1c, 18: dTALE 209h3R and target 209R-1n, 19: dTALE 209h3R and target 209R-1m, 20: dTALE 209h3R and target 209R-3m, 21: dTALE 209h2R and target 209R , 22: dTALE 209h2R and target 209R-1c, 23: dTALE 209h2R And target 209R-1n, 24: dTALE 209h2R and target 209R-1m, 25: dTALE 209h2R and target 209R-3m dTALE 209mR (改変型(EA型))及びdTALE 209h4R (複合改変型(混合型2))の特異的及び非特異的DNA結合活性の比較を示す図である。レーン1: dTALE 209mRとターゲット209R, 2: dTALE 209mRとターゲット209R-1c, 3: dTALE 209mRとターゲット209R-1n, 4: dTALE 209mRとターゲット209R-1m, 5: dTALE 209mRとターゲット209R-3m, 6: dTALE 209h4Rとターゲット209R, 7: dTALE 209h4Rとターゲット209R-1c, 8: dTALE 209h4Rとターゲット209R-1n, 9: dTALE 209h4Rとターゲット209R-1m, 10: dTALE 209h4Rとターゲット209R-3mIt is a figure which shows the comparison of the specific and non-specific DNA binding activity of dTALE-209mR (modified type (EA type)) and dTALE-209h4R (combined modified type (mixed type 2)). Lane 1: dTALE 209mR and target 209R, 2: dTALE 209mR and target 209R-1c, 3: dTALE 209mR and target 209R-1n, 4: dTALE 209mR and target 209R-1m, 5: dTALE 209mR and target 209R-3m, 6 : DTALE 209h4R and target 209R, 7: dTALE 209h4R and target 209R-1c, 8: dTALE 209h4R and target 209R-1n, 9: dTALE 209h4R and target 209R-1m, 10: dTALE 209h4R and target 209R-3m dTALE 209R (従来型)とdTALE 209 4AR (改変型(4A型))及びdTALE 209 4ER (改変型(4E型))の特異的及び非特異的DNA結合活性の比較を示す図である。レーン1: dTALE 209 4ERとターゲット209R, 2: dTALE 209 4ERとターゲット209R-1c, 3: dTALE 209 4ERとターゲット209R-1n, 4: dTALE 209 4ERとターゲット209R-1m, 5: dTALE 209 4ERとターゲット209R-2w, 6: dTALE 209 4ERとターゲット209R-3m, 7: dTALE 209 4ARとターゲット209R, 8: dTALE 209 4ARとターゲット209R-1c, 9: dTALE 209 4ARとターゲット209R-1n, 10: dTALE 209 4ARとターゲット209R-1m, 11: dTALE 209 4ARとターゲット209R-2w, 12: dTALE 209 4ARとターゲット209R-3m, 13: dTALE 209Rとターゲット209RIt is a figure which shows the comparison of the specific and non-specific DNA binding activity of dTALE-209R (conventional type), dTALE-209-4AR (modified type (4A type)), and dTALE-209-4ER type (modified type (type 4E)). Lane 1: dTALE 209 4ER and target 209R, 2: dTALE 209 4ER and target 209R-1c, 3: dTALET209 4ER and target 209R-1n, 4: dTALE 209 4ER and target 209R-1m, 5: dTALE 209 4ER and target 209R-2w, 6: dTALE 209 4ER and target 209R-3m, 7: dTALE 209 4AR and target 209R, 8: dTALE 209 4AR and target 209R-1c, 9: dTALE 209 4AR and target 209R-1n, 10: dTALE 209 4AR and target 209R-1m, 11: dTALE 209 4AR and target 209R-2w, 12: dTALE 209 4AR and target 209R-3m, 13: dTALE 209R and target 209R 天然TALEタンパク質のリピートモチーフ外のN末側の配列(N-TAL)についての系統的配列解析の結果を示す図である。It is a figure which shows the result of the systematic sequence analysis about the arrangement | sequence (N-TAL) of the N terminal side out of the repeat motif of natural TALE protein. 天然TALEタンパク質のリピートモチーフ外のC末側の配列(C-TAL)についての系統的配列解析の結果を示す図である。It is a figure which shows the result of the systematic sequence analysis about the sequence | arrangement (C-TAL) of the C terminal side out of the repeat motif of natural TALE protein. dTALE CG16798F、dTALE CG16798mF、dTALE CG16798m2F、dTALE EQ-CG16798F、dTALE EQ-CG16798mF、dTALE EQ-CG16798m2FのDNA結合活性の比較を示す図である。レーン1: dTALE CG16798FとターゲットCG16798F, 2: dTALE CG16798mFとターゲットCG16798F, 3: dTALE CG16798m2FとターゲットCG16798F, 4: dTALE EQ-CG16798FとターゲットCG16798F, 5: dTALE EQ-CG16798mFとターゲットCG16798F, 6: dTALE EQ-CG16798m2FとターゲットCG16798FIt is a figure which shows the comparison of the DNA binding activity of dTALE CG16798F, dTALE CG16798mF, dTALE CG16798m2F, dTALE EQ-CG16798F, dTALE EQ-CG16798mF, dTALE EQ-CG16798m2F. Lane 1: dTALE CG16798F and target CG16798F, 2: dTALE CG16798mF and target CG16798F, 3: dTALE CG16798m2F and target CG16798F, 4: dTALE EQ-CG16798F and target CG16798F, 5: dTALE EQ-CG16798F and target CG16798F CG16798m2F and target CG16798F dTALE CG16798R、dTALE CG16798mR、dTALE CG16798m2R、dTALE EQ-CG16798R、dTALE EQ-CG16798mR、dTALE EQ-CG16798m2RのDNA結合活性の比較を示す図である。レーン1: dTALE CG16798RとターゲットCG16798R, 2: dTALE CG16798mRとターゲットCG16798R, 3: dTALE CG16798m2RとターゲットCG16798R, 4: dTALE EQ-CG16798RとターゲットCG16798R, 5: dTALE EQ-CG16798mRとターゲットCG16798R, 6: dTALE EQ-CG16798m2RとターゲットCG16798RIt is a figure which shows the comparison of the DNA binding activity of dTALE CG16798R, dTALE CG16798mR, dTALE CG16798m2R, dTALE EQ-CG16798R, dTALE EQ-CG16798mR, and dTALE EQ-CG16798m2R. Lane 1: dTALE CG16798R and target CG16798R, 2: dTALE CG16798mR and target CG16798R, 3: dTALE CG16798m2R and target CG16798R, 4: dTALE EQ-CG16798R and target CG16798R, 5: dTALE EQ-CG16798R and EQ-CG16798R CG16798m2R and target CG16798R dTALE SphkF、dTALE SphkmF、dTALE Sphkm2F、dTALE EQ-SphkF、dTALE EQ-SphkmF、dTALE EQ-Sphkm2FのDNA結合活性の比較を示す図である。レーン1: dTALE SphkFとターゲットSphkF, 2: dTALE SphkmFとターゲットSphkF, 3: dTALE Sphkm2FとターゲットSphkF, 4: dTALE EQ-SphkFとターゲットSphkF, 5: dTALE EQ-SphkmFとターゲットSphkF, 6: dTALE EQ-Sphkm2FとターゲットSphkFIt is a figure which shows the comparison of the DNA binding activity of dTALE SphkF, dTALE SphkmF, dTALE Sphkm2F, dTALE EQ-SphkF, dTALE EQ-SphkmF, and dTALE EQ-Sphkm2F. Lane 1: dTALE SphkF and target SphkF, 2: dTALE SphkmF and target SphkF, 3: dTALE Sphkm2F and target SphkF, 4: dTALE EQ-SphkF and target SphkF, 5: dTALE EQ-SphkF, -6: SphkF Sphkm2F and target SphkF dTALE SphkR、dTALE SphkmR、dTALE Sphkm2R、dTALE EQ-SphkR、dTALE EQ-SphkmR、dTALE EQ-Sphkm2RのDNA結合活性の比較を示す図である。レーン1: dTALE SphkRとターゲットSphkR, 2: dTALE SphkmRとターゲットSphkR, 3: dTALE Sphkm2RとターゲットSphkR, 4: dTALE EQ-SphkRとターゲットSphkR, 5: dTALE EQ-SphkmRとターゲットSphkR, 6: dTALE EQ-Sphkm2RとターゲットSphkRIt is a figure which shows the comparison of the DNA binding activity of dTALE SphkR, dTALE SphkmR, dTALE Sphkm2R, dTALE EQ-SphkR, dTALE EQ-SphkmR, and dTALE EQ-Sphkm2R. Lane 1: dTALE SphkR and target SphkR, 2: dTALE SphkmR and target SphkR, 3: dTALE Sphkm2R and target SphkR, 4: dTALE EQ-SphkR and target SphkR, 5: dTALE EQ-SphkR-EQ-SphkR-E6 Sphkm2R and target SphkR dTALE 85mR、dTALE EQ-85mR、dTALE citri-85mR、dTALE 85m2R、dTALE EQ-85m2R、dTALE citri-85m2RのDNA結合活性の比較を示す図である。レーン1: dTALE 85mRとターゲット85R, 2: dTALE EQ-85mRとターゲット85R, 3: dTALE citri-85mRとターゲット85R, 4: dTALE 85m2Rとターゲット85R, 5: dTALE EQ-85m2Rとターゲット85R, 6: dTALE citri-85m2Rとターゲット85RIt is a figure which shows the comparison of the DNA binding activity of dTALE 85mR, dTALE EQ-85mR, dTALE citri-85mR, dTALE 85m2R, dTALE EQ-85m2R, and dTALE citri-85m2R. Lane 1: dTALE 85mR and target 85R, 2: dTALE EQ-85mR and target 85R, 3: dTALE citri-85mR and target 85R, 4: dTALE 85m2R and target 85R, 5: dTALE EQ-85m2R and target 85R, 6: dALE citri-85m2R and target 85R dTALE 209m2R、dTALE EQ-oryzaeLR-209m2R、dTALE EQ-209m2R、dTALE oryzae-EQLR-209m2R、dTALE citri-EQLR-209m2R、dTALE citri-209m2Rの特異的及び非特異的DNA結合活性の比較を示す図である。レーン1: dTALE 209m2Rとターゲット209R, 2: dTALE EQ-oryzaeLR-209m2Rとターゲット209R, 3: dTALE EQ-209m2Rとターゲット209R, 4: dTALE oryzae-EQLR-209m2Rとターゲット209R, 5: dTALE citri-EQLR-209m2Rとターゲット209R, 6: dTALE citri-209m2Rとターゲット209R, 7: dTALE 209m2Rとターゲット209R-1c, 8: dTALE EQ-oryzaeLR-209m2Rとターゲット209R-1c, 9: dTALE EQ-209m2Rとターゲット209R-1c, 10: dTALE oryzae-EQLR-209m2Rとターゲット209R-1c, 11: dTALE citri-EQLR-209m2Rとターゲット209R-1c, 12: dTALE citri-209m2Rとターゲット209R-1c, 13: dTALE 209m2Rとターゲット209R-1n, 14: dTALE EQ-oryzaeLR-209m2Rとターゲット209R-1n, 15: dTALE EQ-209m2Rとターゲット209R-1n, 16: dTALE oryzae-EQLR-209m2Rとターゲット209R-1n, 17: dTALE citri-EQLR-209m2Rとターゲット209R-1n, 18: dTALE citri-209m2Rとターゲット209R-1nComparison of specific and non-specific DNA binding activities of dTALE 209m2R, dTALE Eq-oryzaeLR-209m2R, dTALE EQ-209m2R, dTALE oryzae-EQLR-209m2R, dTALE citri-EQLR-209m2R, dTALE citri-209m2R . Lane 1: dTALE 209m2R and target 209R, 2: dTALE EQ-oryzaeLR-209m2R and target 209R, 3: dTALE EQ-209m2R and target 209R, 4: dTALE oryzae-EQLR-209m2R and target 209R, 5: dTALE-citri-citri-citri-citri-citri 209m2R and target 209R, 6: dTALE citri-209m2R and target 209R, 7: dTALE 209m2R and target 209R-1c, 8: dTALE EQ-oryzaeLR-209m2R and target 209R-1c, 9: dTALE EQ-209m2R and target 209R-1c , 10: dTALE eoryzae-EQLR-209m2R and target 209R-1c, 11: dTALE citri-EQLR-209m2R and target 209R-1c, 12: dTALE citri-209m2R and target 209R-1c, 13: dTALE 209m2R and target 209R-1n , 14: dTALE EQ-oryzaeLR-209m2R and target 209R-1n, 15: dTALE EQ-209m2R and target 209R-1n, 16: dTALE oryzae-EQLR-209m2R and target 209R-1n, 17: dTALE citri-EQLR-209m2R Target 209R-1n, 18: dTALE citri-209m2R and target 209R-1n dTALE 209m2R、dTALE EQ-oryzaeLR-209m2R、dTALE EQ-209m2R、dTALE oryzae-EQLR-209m2R、dTALE citri-EQLR-209m2R、dTALE citri-209m2Rの特異的及び非特異的DNA結合活性の比較を示す図である。レーン1: dTALE 209m2Rとターゲット209R-1m, 2: dTALE EQ-oryzaeLR-209m2Rとターゲット209R-1m, 3: dTALE EQ-209m2Rとターゲット209R-1m, 4: dTALE oryzae-EQLR-209m2Rとターゲット209R-1m, 5: dTALE citri-EQLR-209m2Rとターゲット209R-1m, 6: dTALE citri-209m2Rとターゲット209R-1m, 7: dTALE 209m2Rとターゲット209R-2w, 8: dTALE EQ-oryzaeLR-209m2Rとターゲット209R-2w, 9: dTALE EQ-209m2Rとターゲット209R-2w, 10: dTALE oryzae-EQLR-209m2Rとターゲット209R-2w, 11: dTALE citri-EQLR-209m2Rとターゲット209R-2w, 12: dTALE citri-209m2Rとターゲット209R-2w, 13: dTALE 209m2Rとターゲット209R-2s, 14: dTALE EQ-oryzaeLR-209m2Rとターゲット209R-2s, 15: dTALE EQ-209m2Rとターゲット209R-2s, 16: dTALE oryzae-EQLR-209m2Rとターゲット209R-2s, 17: dTALE citri-EQLR-209m2Rとターゲット209R-2s, 18: dTALE citri-209m2Rとターゲット209R-2s, 19: dTALE 209m2Rとターゲット209RComparison of specific and non-specific DNA binding activities of dTALE 209m2R, dTALE Eq-oryzaeLR-209m2R, dTALE EQ-209m2R, dTALE oryzae-EQLR-209m2R, dTALE citri-EQLR-209m2R, dTALE citri-209m2R . Lane 1: dTALE 209m2R and target 209R-1m, 2: dTALE EQ-oryzaeLR-209m2R and target 209R-1m, 3: dTALE EQ-209m2R and target 209R-1m, 4: dTALE oryzae-EQLR-209m2R and target 209R-1m , 5: dTALE citri-EQLR-209m2R and target 209R-1m, 6: dTALE citri-209m2R and target 209R-1m, 7: dTALE 2209m2R and target 209R-2w, 8: dTALE EQ-oryzaeLR-209m2R and target 209R-2w , 9: dTALE EQ-209m2R and target 209R-2w, 10: dTALE oryzae-EQLR-209m2R and target 209R-2w, 11: dTALE citri-EQLR-209m2R and target 209R-2w, 12: -2dTALE citri-209m2R and target 209R -2w, 13: dTALE 209m2R and target 209R-2s, 14: dTALE EQ-oryzaeLR-209m2R and target 209R-2s, 15: dTALE EQ-209m2R and target 209R-2s, 16: dTALE oryzae-EQLR-209m2R and target 209R -2s, 17: dTALE citri-EQLR-209m2R and target 209R-2s, 18: dTALE citri-209m2R and target 209R-2s, 19: dTALE 209m2R and target 209R 従来型NNとN型NNのDNA結合活性の比較を示す図である。レーン1: dTALE TREとターゲットTRE, 2: dTALE TREとコントロールターゲット, 3: dTALE TREn1とターゲットTRE-G5, 4: dTALE TREn1とターゲットTRE-A5, 5: dTALE TREn1とコントロールターゲット, 6: dTALE TREn2とターゲットTRE-G5, 7: dTALE TREn2とターゲットTRE-A5, 8: dTALE TREn2とコントロールターゲット, 9: dTALE TREn3とターゲットTRE-GA3, 10: dTALE TREn3とコントロールターゲット, 11: dTALE TREn4とターゲットTRE-GA3, 12: dTALE TREn4とコントロールターゲットIt is a figure which shows the comparison of the DNA binding activity of conventional NN and N type NN. Lane 1: dTALE TRE and target TRE, 2: dTALE TRRE and target TRE-G5, 4: dTALE TREn1 and target TRE-A5, 5: dTALE TREn1 and control target, 6: dTALE TREn2 Target TRE-G5, 7: dTALE TREn2 and target TRE-A5, 8: dTALE TREn2 and control target, 9: dTALE TREn3 and target TRE-GA3, 10: dTALE TREn3 and control target, 11: dTALE TREn4 and target TRE-GA3 , 12: dTALE TREn4 and control target 従来型NNとN型NNのDNA結合活性の比較を示す図である。レーン1: dTALE TREとターゲットTRE, 2: dTALE TREとコントロールターゲット, 3: dTALE TREn5とターゲットTRE-G3A3-TRE, 4: dTALE TREn5とコントロールターゲット, 5: dTALE TREn6とターゲットTRE-G3A3-TRE, 6: dTALE TREn6とコントロールターゲットIt is a figure which shows the comparison of the DNA binding activity of conventional NN and N type NN. Lane 1: dTALE TRE and target TRE, 2: dTALE TRE and control target, 3: dTALE TREn5 and target TRE-G3A3-TRE, 4: dTALE TREn5 and control target, 5: dTALE TREn6 and target TRE-G3A3-TRE, 6 : DTALE TREn6 and control target
 以下、本発明を詳細に説明する。 Hereinafter, the present invention will be described in detail.
(タンパク質)
 本発明は、標的DNAに対する結合活性を有する単離された改変型タンパク質(以下、本発明のタンパク質ともいう)を提供する。
(protein)
The present invention provides an isolated modified protein (hereinafter also referred to as the protein of the present invention) having binding activity to a target DNA.
 本発明のタンパク質は、従来十分な結合活性を得られなかった任意の標的DNA配列に対する十分な結合活性の向上が実現可能であるため、上記の「標的DNA」は、任意の一本鎖DNA配列であってよい。標的DNA配列は、典型的には6~36塩基の長さであり、好ましくは14~24塩基の長さであり、より好ましくは16~22塩基の長さである。標的DNA配列の長さが6塩基より短くなると、結合力の低下や結合特異性の低減等を招き得る。一方、標的DNA配列の長さが36塩基より長くなると、本発明のタンパク質が有すべきモジュールの個数が増大し、ひいては該タンパク質の作製が非効率的ないし困難となり得る。 Since the protein of the present invention can achieve sufficient improvement in binding activity for any target DNA sequence that has not been able to obtain sufficient binding activity in the past, the above-mentioned "target DNA" can be any single-stranded DNA sequence. It may be. The target DNA sequence is typically 6-36 bases in length, preferably 14-24 bases in length, more preferably 16-22 bases in length. If the length of the target DNA sequence is shorter than 6 bases, it may lead to a decrease in binding force or a decrease in binding specificity. On the other hand, when the length of the target DNA sequence is longer than 36 bases, the number of modules that the protein of the present invention should have increases, and as a result, the production of the protein can be inefficient or difficult.
 本発明のタンパク質が、後述するように、二量体を形成することで機能するエンドヌクレアーゼ部分を更に含むものである場合、第1の本発明のタンパク質の標的DNAおよび第2の本発明のタンパク質の標的DNAは、共に上記したような標的DNA配列の基準を満たすと共に、両標的DNAは、切断を所望するDNA中で典型的には15-18bp分離されたものであってよい。二量体を形成したエンドヌクレアーゼは、上記の2つの標的DNAの間の位置において二本鎖切断を生じることができる。
 本発明のタンパク質が、後述するように、転写活性化因子または転写抑制因子を更に含むものである場合、標的DNAは、標的遺伝子の転写調節領域内にあってよい。
 一方、本発明のタンパク質が、後述するように、エピゲノム制御因子を更に含むものである場合、標的DNAは、対象とする細胞のゲノム中、DNAのメチル化、ヒストン等のタンパク質の翻訳後修飾、クロマチンの形成、核内構造体の形成等のエピゲノム領域またはその近傍に位置し得る。
When the protein of the present invention further contains an endonuclease moiety that functions by forming a dimer, as described later, the target DNA of the first protein of the present invention and the target of the second protein of the present invention Both DNAs meet the criteria for target DNA sequences as described above, and both target DNAs may be typically separated by 15-18 bp in the DNA desired to be cleaved. The endonuclease that formed the dimer can produce a double-strand break at the location between the two target DNAs.
As described later, when the protein of the present invention further contains a transcriptional activator or transcriptional repressor, the target DNA may be in the transcriptional regulatory region of the target gene.
On the other hand, as will be described later, when the protein of the present invention further contains an epigenome regulatory factor, the target DNA in the genome of the target cell, DNA methylation, post-translational modification of proteins such as histones, chromatin It may be located in or near the epigenomic region such as formation, formation of a nuclear structure.
 本発明のタンパク質が標的DNAに対する結合活性を有するか否かは、後述するスクリーニング方法において説明する方法を用いて決定することができる。本発明のタンパク質は、標的DNAに対する特異的な結合活性を有する(即ち、標的DNAに対しては有意な結合力を以って結合するが、それとは異なる配列を含むDNAに対しては結合活性が顕著に低下するないし実質的に結合しない)ことが好ましい。例えば、本発明のタンパク質は、標的DNAとは異なるDNA配列に対して、試験管内活性計測法で結合親和性が1桁ないしそれ以上低下する、あるいは、dTALEアッセイなどの細胞内活性計測法で有意な活性を示さないものであり得る。 Whether or not the protein of the present invention has the binding activity to the target DNA can be determined using the method described in the screening method described later. The protein of the present invention has a specific binding activity to a target DNA (that is, it binds to a target DNA with a significant binding force, but binds to a DNA containing a different sequence. Is significantly reduced or does not substantially bind). For example, the protein of the present invention has a binding affinity that is reduced by one or more orders of magnitude in the in vitro activity measurement method for a DNA sequence different from the target DNA, or significant in an intracellular activity measurement method such as a dTALE assay. That do not exhibit significant activity.
 本発明のタンパク質は、複数のモジュールの繰返し構造を有するXanthomonas属細菌由来Transcription Activator-Like (TAL) Effector部分(以下、TALE部分ともいう)を含む。TALE部分は、通常2個以上、好ましくは6個以上、より好ましくは14個以上、更により好ましくは16個以上の上記モジュールを有し、かつ、通常36個以下、好ましくは24個以下、より好ましくは22個以下、更により好ましくは20個以下の上記モジュールを有する。本発明のタンパク質の使用目的に応じても異なるが、モジュールの個数が12個(従って、標的DNA配列の塩基数が12個)より少なくなると、一般に、当該標的DNAがゲノム中に多数存在する可能性があるため好ましくない。一方、モジュールが24個より多くなると、作製が手技的に困難となるのみならず、DNAへの特異的結合活性が却って低下する傾向があるため好ましくない。 The protein of the present invention includes a Transcription Activator-Like (TAL) Effector part (hereinafter also referred to as a TALE part) derived from a genus Xanthomonas having a repetitive structure of a plurality of modules. The TALE portion usually has 2 or more, preferably 6 or more, more preferably 14 or more, and still more preferably 16 or more modules, and usually 36 or less, preferably 24 or less, more Preferably no more than 22, more preferably no more than 20, the above modules. Depending on the purpose of use of the protein of the present invention, if the number of modules is less than 12 (and therefore the number of bases in the target DNA sequence is 12), in general, a large number of the target DNA may exist in the genome. It is not preferable because of its properties. On the other hand, when the number of modules is more than 24, it is not preferable because not only production becomes difficult technically, but also the specific binding activity to DNA tends to decrease.
 各モジュールは、以下のアミノ酸配列:
  LTPDQVVAIASNGGGKQALETVQRLLPVLCQDHG(配列番号1)
、または、該アミノ酸配列においてアミノ酸変異(欠失、置換、付加)が起こっているアミノ酸配列を有する。変異したアミノ酸の数は、通常10アミノ酸以内であり、好ましくは8アミノ酸以内であり、より好ましくは6アミノ酸以内であり、更に好ましくは数(4、3、2または1)アミノ酸である。各モジュールは、配列番号1のアミノ酸配列に対して80%以上の相同性を有するアミノ酸配列を有することが好ましい。アミノ酸配列の相同性は、相同性計算アルゴリズムNCBI BLAST(National Center for Biotechnology Information Basic Local Alignment Search Tool)を用い、以下の条件(期待値=10;ギャップを許す;マトリクス=BLOSUM62;フィルタリング=OFF)にて計算することができる。
Each module has the following amino acid sequence:
LTPDQVVAIASNGGGKQALETVQRLLPVLCQDHG (SEQ ID NO: 1)
Or an amino acid sequence in which an amino acid mutation (deletion, substitution, addition) occurs in the amino acid sequence. The number of mutated amino acids is usually within 10 amino acids, preferably within 8 amino acids, more preferably within 6 amino acids, and even more preferably the number (4, 3, 2, or 1) amino acids. Each module preferably has an amino acid sequence having 80% or more homology with the amino acid sequence of SEQ ID NO: 1. The homology of the amino acid sequence was determined using the homology calculation algorithm NCBI BLAST (National Center for Biotechnology Information Basic Local Alignment Search Tool) under the following conditions (expected value = 10; allow gap; matrix = BLOSUM62; filtering = OFF) Can be calculated.
 上記の配列番号1のアミノ酸配列において、12番目および13番目の塩基は、標的DNAの塩基配列を構成するそれぞれ1塩基を認識する標的塩基認識領域、即ち、repeat variable diresidue (RVD)を構成することが知られている。具体的には、RVDにおいて、HDはCを認識し、NGはTを認識し、NIはAを認識し、NNはGまたはAを認識し、NSはAまたはCまたはGまたはTを認識し、N*(ここで、*はRVDの第2位置中のギャップを表す)はCまたはTを認識し、HGはTを認識し、H*(ここで、*はRVDの第2位置中のギャップを表す)はTを認識し、IGはTを認識し、NKはGを認識し、HAはCを認識し、NDはCを認識し、HIはCを認識し、HNはGを認識し、NAはGを認識し、SNはGまたはAを認識し、かつ、YGはTを認識することが知られている(例えば、特表2013-513389号公報等)。従って、本発明のタンパク質中のモジュールの各々におけるRVDを、標的DNAの塩基配列中の各塩基を認識するように順次構成することによって、本発明のタンパク質を標的DNAに対する結合活性を有するものとすることができる。 In the amino acid sequence of SEQ ID NO: 1, the 12th and 13th bases constitute a target base recognition region that recognizes one base each constituting the base sequence of the target DNA, that is, repeat variable diresidue (RVD). It has been known. Specifically, in RVD, HD recognizes C, NG recognizes T, NI recognizes A, NN recognizes G or A, and NS recognizes A or C or G or T. , N * (where * represents a gap in the second position of RVD) recognizes C or T, HG recognizes T, and H * (where * is in the second position of RVD) (Represents a gap) recognizes T, IG recognizes T, NK recognizes G, HA recognizes C, ND recognizes C, HI recognizes C, HN recognizes G It is known that NA recognizes G, SN recognizes G or A, and YG recognizes T (for example, JP 2013-513389 A). Therefore, the RVD in each of the modules in the protein of the present invention is sequentially constructed so as to recognize each base in the base sequence of the target DNA, so that the protein of the present invention has the binding activity to the target DNA. be able to.
 本発明のタンパク質においては、上記の複数のモジュールのうちの少なくとも1つ(例えば、1つ、2つ、3つ、4つ、5つ以上、10以上、15以上、20以上、25以上、30以上、または全て)は、配列番号1で表されるアミノ酸配列において、2~6番目および30~34番目からなる群から選択される少なくとも1つのアミノ酸残基が人為的な変異を有するように改変されている。ここでいう「人為的な変異」とは、一般的な点変異導入技術(例えば、Sawano et. al. 2000, Nucleic Acids Research 28(16)等)等を利用して導入された変異をいい、種の違い等に基づく天然に生じる変異(mutantやvariant)は含まれない。後述の実施例に示されるように、4番目のアミノ酸残基および32番目のアミノ酸残基は隣接するリピート(即ち、モジュール)間での結合に関与し、TALE分子の立体構造の安定化に重要な役割を果たしている。そのため、4番目およびその近傍(従って2~6番目)のアミノ酸残基の少なくとも1つ(例えば、1つ、2つ、3つ、4つ、または5つ)、および/または、32番目およびその近傍(従って30~34番目)のアミノ酸残基の少なくとも1つ(例えば、1つ、2つ、3つ、4つ、または5つ)のアミノ酸残基において人為的な変異を有するようにモジュールのアミノ酸配列を人為的に改変することにより、本発明のタンパク質による標的DNAに対する結合強度を制御することが可能となる。標的DNAとの結合活性のうち、結合の強度と特異性は本来相反する性質であり、アプリケーションに応じて調節することが望ましい。本発明における上記の人為的な改変や、タンパク質におけるモジュール構成(例:高活性型モジュールとより低い活性のモジュールとの混成)により、これが可能となる。標的DNAに対する結合活性をより効果的に増大させるために、2~6番目からなる群から選択される少なくとも1つ(例えば、1つ、2つ、3つ、4つ、または5つ)のアミノ酸残基と30~34番目からなる群から選択される少なくとも1つ(例えば、1つ、2つ、3つ、4つ、または5つ)のアミノ酸残基とが人為的な変異を有するように改変されることが好ましい。2~6番目のアミノ酸残基のうちの変異させる対象としては、好ましくは3~6番目のアミノ酸残基であり、より好ましくは4番目のアミノ酸残基である。一方、30~34番目のアミノ酸残基のうちの変異させる対象としては、好ましくは31~34番目のアミノ酸残基であり、より好ましくは32番目のアミノ酸残基である。従って、特に好ましい実施形態として、該モジュールにおいて、4番目および32番目のアミノ酸残基が変異に供される。 In the protein of the present invention, at least one of the plurality of modules (for example, 1, 2, 3, 4, 5 or more, 10 or more, 15 or more, 20 or more, 25 or more, 30 The above or all) are modified so that at least one amino acid residue selected from the group consisting of 2 to 6 and 30 to 34 has an artificial mutation in the amino acid sequence represented by SEQ ID NO: 1. Has been. As used herein, `` artificial mutation '' refers to a mutation introduced using a general point mutation introduction technique (e.g., Sawano et. Al. 2000, Nucleic Acids Research 28 (16), etc.) Does not include naturally occurring mutations (mutants and variants) based on species differences. As shown in the examples below, the 4th and 32nd amino acid residues are involved in binding between adjacent repeats (ie, modules) and are important for stabilizing the conformation of the TALE molecule. Plays an important role. Therefore, at least one (eg, one, two, three, four, or five) amino acid residues in the fourth and its vicinity (and hence 2-6) and / or the 32nd and its The module is designed to have an artificial mutation in at least one (eg, 1, 2, 3, 4 or 5) amino acid residues in the vicinity (thus 30-34). By artificially modifying the amino acid sequence, the binding strength of the protein of the present invention to the target DNA can be controlled. Among the binding activities with the target DNA, the binding strength and specificity are inherently contradictory properties, and it is desirable to adjust according to the application. This is made possible by the above-described artificial modification in the present invention and the module configuration of the protein (eg, hybrid of a high activity type module and a lower activity module). At least one (for example, one, two, three, four, or five) amino acids selected from the group consisting of 2 to 6 in order to more effectively increase the binding activity to the target DNA At least one amino acid residue selected from the group consisting of the residue and the 30th to 34th amino acid residues (for example, 1, 2, 3, 4 or 5) has an artificial mutation Preferably it is modified. The target to be mutated of the 2nd to 6th amino acid residues is preferably the 3rd to 6th amino acid residues, and more preferably the 4th amino acid residue. On the other hand, the target to be mutated among the 30th to 34th amino acid residues is preferably the 31st to 34th amino acid residues, and more preferably the 32nd amino acid residue. Therefore, as a particularly preferred embodiment, the 4th and 32nd amino acid residues are subjected to mutation in the module.
 一方、後述する実施例に示されるように、DNA結合時において、配列番号1における23番目のグルタミンは、隣接するリピートの33番目のヒスチジンと水素結合を形成しており、その水素結合の安定化に32番目のアミノ酸残基が寄与している。そのため、23番目およびその近傍(従って20~26番目)のアミノ酸残基も、標的DNAに対する結合活性の制御のための好適な対象であり得る。20~26番目のアミノ酸残基のうち、特に好ましい変異の対象としては、24番目のアミノ酸残基である。20~26番目のアミノ酸残基のうちの変異の個数は特に制限されない。 On the other hand, as shown in the examples described later, at the time of DNA binding, the 23rd glutamine in SEQ ID NO: 1 forms a hydrogen bond with the 33rd histidine of the adjacent repeat, and stabilization of the hydrogen bond The 32nd amino acid residue contributes. Therefore, the amino acid residue at the 23rd position and its vicinity (and hence the 20th to 26th positions) can also be a suitable target for controlling the binding activity to the target DNA. Of the 20th to 26th amino acid residues, the particularly preferred mutation target is the 24th amino acid residue. The number of mutations in the 20th to 26th amino acid residues is not particularly limited.
 上記の各位置における変異後の好適なアミノ酸残基は、標的DNAに対する特異的な結合活性という所望の目標に基づき、当業者は、後述のスクリーニング方法等によって適宜決定することができる。結合活性を上昇させる変異の一例としては、4番目のアミノ酸残基がグルタミン酸となるように改変されており、かつ/または、32番目のアミノ酸残基がアラニンとなるように改変されたものである。4番目のアミノ酸残基がグルタミン酸となるように改変されており、かつ、32番目のアミノ酸残基がアラニンとなるように改変されたものがより好ましい。結合活性を上昇させる変異の別の例としては、4番目のアミノ酸残基がグルタミンとなるように改変されており、かつ/または、32番目のアミノ酸残基がアラニンとなるように改変されたものである。4番目のアミノ酸残基がグルタミン酸となるように改変されており、かつ、32番目のアミノ酸残基がアラニンとなるように改変されたものがより好ましい。逆に、結合活性を低下させる変異の一例としては、4番目のアミノ酸残基がアスパラギン酸で、かつ31番目のアミノ酸残基がグルタミン酸で、かつ32番目のアミノ酸残基がグルタミンであるように改変されたものである。これらの実施形態において、4番目および/または32番目以外のアミノ酸残基が更に人為的に改変されていてもよいし、改変されていなくてもよい。ここで、アミノ酸残基の位置は、配列番号1のアミノ酸配列と、改変後のアミノ酸配列とをアライメントしたときの位置を意味する。アミノ酸配列のアライメントは、BLAST2 SequenceやAlign等の一般的なプログラムを利用して取得することができる。 A suitable amino acid residue after mutation at each position described above can be appropriately determined by a person skilled in the art by a screening method described below based on a desired target of specific binding activity to a target DNA. As an example of a mutation that increases the binding activity, the fourth amino acid residue is modified to be glutamic acid and / or the 32nd amino acid residue is modified to be alanine. . More preferably, the fourth amino acid residue is modified to be glutamic acid and the 32nd amino acid residue is modified to be alanine. As another example of the mutation that increases the binding activity, the fourth amino acid residue is modified to be glutamine and / or the 32nd amino acid residue is modified to be alanine. It is. More preferably, the fourth amino acid residue is modified to be glutamic acid and the 32nd amino acid residue is modified to be alanine. Conversely, as an example of a mutation that reduces the binding activity, the fourth amino acid residue is aspartic acid, the 31st amino acid residue is glutamic acid, and the 32nd amino acid residue is glutamine. It has been done. In these embodiments, amino acid residues other than the 4th and / or 32nd positions may be further artificially modified or may not be modified. Here, the position of the amino acid residue means the position when the amino acid sequence of SEQ ID NO: 1 and the modified amino acid sequence are aligned. The alignment of amino acid sequences can be obtained using a general program such as BLAST2 Sequence or Align.
 また、上記の複数のモジュールの全てにおいて、変異が同一のパターンである、即ち、全てのモジュールが、RVD領域を除いて同一の変異に供されている(従って、全てのモジュールは、RVD領域以外において同一のアミノ酸配列を有する)ことも、本発明のタンパク質の製造効率の観点から好ましい。 In all of the above modules, the mutations have the same pattern, that is, all the modules are subjected to the same mutation except for the RVD region (therefore, all the modules are other than the RVD region). Having the same amino acid sequence) is also preferable from the viewpoint of the production efficiency of the protein of the present invention.
 あるいは、本発明のタンパク質は、高活性型のモジュールが一定以上の割合で含まれれば高い活性を示し得るので、該タンパク質は高活性型のモジュールと、より低い活性のモジュールとが混成したものであってもよい。そのような混成型のタンパク質により、構築したTALEの高い特異的DNA結合活性を保持させつつも、非特異的なDNA結合活性を大幅に低下させることが可能となる。より低い活性のモジュールとしては、本発明に従ってより高い活性を付与する人為的な変異を導入される前の元々のモジュール、例えばRVD領域を除いて配列番号1のアミノ酸と同一の配列を有するもの等が挙げられる。高活性型のモジュールとしては、本発明に従ってより高い活性を付与する人為的な変異を導入されたモジュール、例えば4番目および/または32番目のアミノ酸残基が上述したように改変されているもの等が挙げられる。より低い活性のモジュールの個数は、例えば1~10個、好ましくは数(例:1、2、3、4または5)個であり得、その位置は特に限定されないが、例えばC末寄りのリピートモジュールである。 Alternatively, since the protein of the present invention can exhibit high activity if a high activity module is contained in a certain ratio or more, the protein is a mixture of a high activity module and a lower activity module. There may be. Such a hybrid protein can significantly reduce nonspecific DNA binding activity while maintaining high specific DNA binding activity of the constructed TALE. As a lower activity module, the original module before introduction of an artificial mutation imparting higher activity according to the present invention, for example, one having the same sequence as the amino acid of SEQ ID NO: 1 except for the RVD region, etc. Is mentioned. As a highly active module, a module into which an artificial mutation imparting higher activity is introduced according to the present invention, for example, the amino acid residue at the 4th and / or 32nd has been modified as described above, etc. Is mentioned. The number of lower activity modules may be, for example, 1 to 10, preferably a number (for example, 1, 2, 3, 4 or 5), and the position is not particularly limited. It is a module.
 モジュール内の上記以外の位置、即ち、2~6番目、12~13番目、20~26番目および30~34番目以外の位置は、標的DNAに対する特異的な結合活性を阻害しない限りにおいて、配列番号1のアミノ酸配列から人為的な変異を有してもよい。例えば、配列番号1において11番目の塩基であるセリン(S)をアスパラギン(N)に変異させることにより、RVDがNNの場合に、グアニンへの結合活性を低下させることなくアデニンへの結合活性を向上させ得る。 The positions other than the above in the module, that is, positions other than the 2nd to 6th, 12th to 13th, 20th to 26th, and 30th to 34th are as long as the specific binding activity to the target DNA is not inhibited. It may have an artificial variation from one amino acid sequence. For example, by mutating serine (S), the 11th base in SEQ ID NO: 1, to asparagine (N), when RVD is NN, the binding activity to adenine is reduced without reducing the binding activity to guanine. Can be improved.
 TALEタンパク質は、特異的なDNA結合を担うリピートモチーフと、非特異的なDNA結合を担うリピート外側のDNA結合ドメインとから構成されることが知られている。本発明のタンパク質中のTALE部分は、そのようなリピート外側のDNA結合ドメインを含んでいてもよい。また、後述の実施例にも示されるように、該ドメインは人為的な変異を有していてもよい。代替的または付加的には、該TALE部分は、検出・精製用のタグ配列、核局在化配列、蛍光タンパク質などのレポーター配列、細胞中の内在酵素によって切断される介在配列等の構造を有してもよい。 It is known that the TALE protein is composed of a repeat motif responsible for specific DNA binding and a DNA binding domain outside the repeat responsible for non-specific DNA binding. The TALE moiety in the proteins of the present invention may include such repeat outer DNA binding domains. In addition, as shown in Examples described later, the domain may have an artificial mutation. Alternatively or additionally, the TALE moiety has a structure such as a tag sequence for detection and purification, a nuclear localization sequence, a reporter sequence such as a fluorescent protein, or an intervening sequence that is cleaved by an endogenous enzyme in a cell. May be.
 本発明のタンパク質は、本発明のタンパク質における上記の人為的な変異を有しない未改変型タンパク質(例:上記の人為的な改変を為されていない以外、本発明のタンパク質におけるTALE部分と同一のアミノ酸配列を有するTALE部分を含むタンパク質)と比較して、標的DNAに対する結合活性が増大しているものであることが好ましい。該結合活性の増大は、後述する実施例1に記載の方法で測定した場合に(Mussolino et al., Nucleic Acids Res. 2011; 39(21): 9283, Cong et. al., Nat Commun. 2012; 3: 968)、少なくとも1.5倍であることが好ましく、少なくとも2倍であることがより好ましく、少なくとも5倍であることが更に好ましく、少なくとも10倍であることが特に好ましい。代替的には、本発明のタンパク質は、本発明のタンパク質における上記の人為的な変異を有しない未改変型タンパク質と比較して、標的DNAに対する結合活性が低減しているものであってもよい。結合活性の低減は上記と同様にして調べることができ、例えば、2/3以下、1/2以下または1/4以下である。 The protein of the present invention is the same as the TALE moiety in the protein of the present invention except that the protein of the present invention does not have the above-mentioned artificial mutation (eg, the above-described artificial modification is not performed). It is preferable that the binding activity to the target DNA is increased as compared with a protein containing a TALE moiety having an amino acid sequence. The increase in binding activity was measured by the method described in Example 1 described later (Mussolino et al., Nucleic Acids Res. 2011; 39 (21): 9283, Cong et. Al., Nat Commun. 2012 ; 3: 968), preferably at least 1.5 times, more preferably at least 2 times, even more preferably at least 5 times, and particularly preferably at least 10 times. Alternatively, the protein of the present invention may have a reduced binding activity to the target DNA as compared to the unmodified protein having no artificial mutation in the protein of the present invention. . The reduction in binding activity can be examined in the same manner as described above, for example, 2/3 or less, 1/2 or less, or 1/4 or less.
 本発明のタンパク質は、TAL Effector部分が由来するXanthomonas属細菌に由来しない機能ドメインを更に含んでもよい。該機能ドメインとしては、本発明のタンパク質をゲノム編集において使用するために、核酸分解酵素または核酸転移酵素の全部または一部分であり得る。該核酸分解酵素は、好ましくは塩基配列非依存的なものであり、FokI由来の切断ドメインが例示される。また、塩基配列依存的な核酸分解酵素ドメインの利用や、二量体を形成せずにDNA切断を起こす核酸分解酵素ドメインの利用、さらに、二本鎖切断を行わず、片方の鎖のみを切断するニッカーゼ型などの機能ドメインも最近報告されており、これらの使用もまた好ましい。該機能ドメインはまた、本発明のタンパク質を転写活性調節やエピゲノム制御等において使用するために、VP16等の転写活性化因子ドメイン、KRAB等の転写抑制因子ドメイン、あるいは、DNAメチルトランスフェラーゼ、ヒストンアセチルトランスフェラーゼ、ヒストンデアセチラーゼ等のエピゲノム制御因子ドメイン等であり得る。あるいは、該機能ドメインはまた、蛍光タンパク質、発光タンパク質、色素タンパク質の全体または一部分、あるいは、蛍光、発光または発色反応を触媒する酵素タンパク質の全体または一部分を含んでもよい。ここで「一部分」としては、例えば、それ自体で目的の機能を発揮することができる部分をいう。これらの付加的な部分またはドメインは、上記のTALE部分のC末側に結合されることが多いが、C末側およびN末側のいずれにあってもよい。 The protein of the present invention may further contain a functional domain not derived from a genus Xanthomonas from which the TAL Effector part is derived. The functional domain may be all or part of a nucleolytic enzyme or nucleotransferase in order to use the protein of the present invention in genome editing. The nucleolytic enzyme is preferably independent of the base sequence, and is exemplified by a cleavage domain derived from FokI. Also, use of base sequence-dependent nucleolytic enzyme domain, use of nucleolytic enzyme domain that causes DNA cleavage without forming a dimer, and also cuts only one strand without double strand break Functional domains such as nickase types have recently been reported and their use is also preferred. The functional domain also includes a transcriptional activator domain such as VP16, a transcriptional repressor domain such as KRAB, or a DNA methyltransferase or histone acetyltransferase in order to use the protein of the present invention in transcriptional activity regulation or epigenome control. Or an epigenome regulator domain such as histone deacetylase. Alternatively, the functional domain may also include all or part of a fluorescent protein, photoprotein, chromoprotein, or all or part of an enzyme protein that catalyzes a fluorescent, luminescent or chromogenic reaction. Here, the “part” means, for example, a part capable of exhibiting a target function by itself. These additional portions or domains are often bound to the C-terminal side of the above TALE portion, but may be on either the C-terminal side or the N-terminal side.
 本発明のタンパク質は、後述する本発明の製造方法に従って製造することができる。 The protein of the present invention can be produced according to the production method of the present invention described later.
(核酸)
 本発明はまた、上記の本発明のタンパク質のアミノ酸配列をコードする単離された核酸(以下、本発明の核酸ともいう)を提供する。
(Nucleic acid)
The present invention also provides an isolated nucleic acid (hereinafter also referred to as the nucleic acid of the present invention) encoding the amino acid sequence of the protein of the present invention.
 本発明の核酸は、上記の本発明のタンパク質をコードするものであれば特に制限はない。該核酸はDNAであってもRNAであってもよく、あるいはDNA/RNAキメラであってもよい。好ましくはDNAが挙げられる。また、該核酸は二本鎖であっても、一本鎖であってもよい。二本鎖の場合は、二本鎖DNA、二本鎖RNAまたはDNA:RNAのハイブリッドでもよい。 The nucleic acid of the present invention is not particularly limited as long as it encodes the protein of the present invention. The nucleic acid may be DNA or RNA, or may be a DNA / RNA chimera. Preferably, DNA is used. The nucleic acid may be double-stranded or single-stranded. In the case of a double strand, it may be a double-stranded DNA, a double-stranded RNA or a DNA: RNA hybrid.
 本発明の核酸は、典型的には、市販のキットを利用して作製することができる。該キットは、一般に、TALEをDNA結合ドメインとして利用した人工ヌクレアーゼであるTALENを作製するためのものであり、Golden Gate法(Cermak T, et al., Nucleic Acids Res. (2011) 39: e82)に基づくGolden Gate TALEN and TAL Effector Kitや、その改変法(Sakuma et al., Genes Cells 18(4): 315-26, 2013)に基づくYamamoto Lab TALEN Accessory Pack、Golden Gate法とPCR法を組み合わせたTALE Toolbox Kit、REAL法(Reyon D, et al., Curr. Protoc. Mol. Biol. (2012) Chapter 12: Unit 12.15)に基づくREAL Assembly TALEN Kit等、種々のキットをAddgeneから入手することができる(例えば、細胞工学, Vol. 32, No. 5 (2013): 510-514等)。これらのキットは、製造業者のマニュアルに従って、標的DNA配列に対応するモジュールを単純に繋ぎ合わせるだけで従来のTALENを作製することができるため、簡便である。また、ヌクレアーゼを含まないTALE含有タンパク質を作製するためには、これらのキットに含まれるベクターにおいて、単純にFokI機能ドメインを除去すればよい。更に、一般的な点変異導入技術、例えば、KOD-Plus- Mutagenesis Kit (東洋紡)、PrimeSTAR Mutagenesis Basal Kit (タカラ)、QuikChange Multi Site-Directed Mutagenesis Kit(アジレント)等の市販キットあるいは、PCRなどの慣用技術を使用して、上記のキットのベクターにおいて適宜変異を導入する、あるいは人工遺伝子合成技術を用いた全合成などにより、本発明のタンパク質における上述の人為的な変異を生じさせることができる。 The nucleic acid of the present invention can typically be prepared using a commercially available kit. The kit is generally for producing TALEN, an artificial nuclease using TALE as a DNA binding domain, and the Golden Gate method (Cermak T, et al., Nucleic Acids Res. (2011) 39: e82) A combination of the Golden Gate method based on the Golden Gate TALEN and TAL Effector Kit and Yamamoto Lab TALEN Accessory Pack based on its modified method (Sakuma et al., Genes Cells 18 (4): 315-26, 2013) Various kits such as REALgeneAssembly TALEN Kit based on TALE Toolbox Kit, REAL method (Reyon D, et al., Curr. Protoc. Mol. Biol. (2012) Chapter 12: Unit 12.15) can be obtained from Addgene (For example, cell engineering, Vol. 32, No. 5 (2013): 510-514, etc.). These kits are convenient because conventional TALENs can be prepared simply by connecting modules corresponding to the target DNA sequence according to the manufacturer's manual. In order to produce a TALE-containing protein that does not contain a nuclease, the FokI functional domain may be simply removed from the vectors contained in these kits. Furthermore, general point mutation introduction techniques, for example, commercially available kits such as KOD-Plus- Mutagenesis Kit (Toyobo), PrimeSTAR Mutagenesis Basal Kit (Takara), QuikChange Multi Site-Directed Mutagenesis Kit (Agilent), or conventional methods such as PCR The above-mentioned artificial mutation in the protein of the present invention can be caused by introducing a mutation in the above-described kit vector as appropriate using a technique, or by total synthesis using an artificial gene synthesis technique.
(発現ベクター、形質転換体およびタンパク質の製造方法)
 本発明はまた、上記本発明の核酸を含む発現ベクター(以下、本発明の発現ベクターともいう)および該発現ベクターを含む形質転換体(以下、本発明の形質転換体ともいう)を提供する。本発明は更に、それらを用いて本発明のタンパク質を製造する方法(以下、本発明の製造方法ともいう)も提供する。
(Expression vector, transformant and protein production method)
The present invention also provides an expression vector comprising the nucleic acid of the present invention (hereinafter also referred to as the expression vector of the present invention) and a transformant comprising the expression vector (hereinafter also referred to as the transformant of the present invention). The present invention further provides a method for producing the protein of the present invention using them (hereinafter also referred to as the production method of the present invention).
 本発明の発現ベクターは、本発明の核酸を適当な発現ベクター中のプロモーターの下流に機能可能に連結することにより製造することができる。ベクターの種類としては、プラスミドベクター、ウイルスベクター等を挙げることができ、用いる宿主細胞に応じて適宜選択することが出来る。 The expression vector of the present invention can be produced by operably linking the nucleic acid of the present invention downstream of a promoter in an appropriate expression vector. Examples of the vector include plasmid vectors and virus vectors, and can be appropriately selected depending on the host cell to be used.
 宿主細胞には、原核生物細胞および真核生物細胞が含まれる。原核生物細胞としては、エシェリヒア属菌(エシェリヒア・コリ(Escherichia coli)等)、バチルス属菌(バチルス・サブチルス(Bacillus subtilis)等)、アグロバクテリウム(例えば、リゾビウム属菌(例えば、Rhizobium tumefacience、Rhizobium rhizogenes)等)等が用いられる。真核生物細胞としては、酵母(サッカロマイセス セレビシエ(Saccharomyces cerevisiae)等)、昆虫細胞(夜盗蛾の幼虫由来株化細胞(Spodoptera frugiperda cell;Sf細胞)等)、哺乳動物細胞(ヒト細胞(293等)、サル細胞(COS-7等)、チャイニーズハムスター細胞(CHO細胞等)等)などの株化された細胞に加えて、胎児ないし成体の組織から採取した初代培養細胞(マウス胎児線維芽細胞MEFや初代培養神経細胞など)、また、受精卵から作成されたES細胞や前述初代培養細胞から樹立されたiPS細胞、植物細胞などが用いられる。これらに限定されるものではない。 Host cells include prokaryotic cells and eukaryotic cells. Examples of prokaryotic cells include Escherichia (Escherichia coli), Bacillus (Bacillus cilsubtilis), Agrobacterium (eg Rhizobium リ tumefacience, Rhizobium, etc.). rhizogenes) and the like. Examples of eukaryotic cells include yeasts (such as Saccharomyces cerevisiae), insect cells (such as larvae derived from night stealing larvae (Spodoptera frugiperda cells; Sf cells)), mammalian cells (human cells (293, etc.)). In addition to established cells such as monkey cells (COS-7, etc.), Chinese hamster cells (CHO cells, etc.), primary cultured cells (mouse fetal fibroblasts MEF, Primary cultured neurons), ES cells prepared from fertilized eggs, iPS cells established from the aforementioned primary cultured cells, plant cells, and the like are used. It is not limited to these.
 哺乳動物としては、例えば、マウス、ラット、ハムスター、モルモット等のげっ歯類やウサギ等の実験動物;ブタ、ウシ、ヤギ、ウマ、ヒツジ、ミンク等の家畜;イヌ、ネコ等のペット;ヒトまたは非ヒトの霊長類(例:サル、カニクイザル、アカゲザル、マーモセット、オランウータン、チンパンジーなど)等を挙げることが出来る。また、哺乳動物以外の動物としては、線虫(C. elegans)や魚類(ゼブラフィッシュ)、両生類(アフリカツメガエル、ネッタイツメガエル)などの実験動物を挙げることが出来るが、これらに限定されるものではない。
 また、植物細胞としては、動物細胞以外の細胞、換言すれば細胞壁を持つ細胞であれば、種類は特に制限されず、単子葉植物及び双子葉植物を含む被子植物及び裸子植物(種子植物)、コケ植物、シダ植物、草本植物及び木本植物などいずれでもよい。植物の具体例としては、例えば、ナス科[ナス、トマト、ピーマン、トウガラシ、タバコ等]、イネ科[イネ、コムギ、オオムギ、ペレニアルライグラス、イタリアンライグラス、メドウフェスク、トールフェスク、オーチャードグラス、チモシー等]、アブラナ科[シロイヌナズナ、アブラナ、ハクサイ、キャベツ、ダイコン、ナタネ等]、マメ科[ダイズ、アズキ、インゲン、ソラマメ等]、ウリ科[キュウリ、メロン、スイカ、カボチャ等]、ヒルガオ科[サツマイモ等]、ユリ科[ネギ、タマネギ、ニラ、ニンニク、アスパラガス等]、シソ科[シソ等]、キク科[キク、シュンギク、レタス等]、バラ科[バラ、イチゴ等]、ミカン科[ミカン、サンショウ等]、フトモモ科[ユーカリ等]、ヤナギ科[ポプラ等]、アカザ科[ホウレンソウ、テンサイ等]、リンドウ科[リンドウ等]、ナデシコ科[カーネーション等]の植物が挙げられる。とりわけナス科植物、アブラナ科植物が好ましく、中でもトマト、タバコ、シロイヌナズナが好ましく使用される。
 かかる植物細胞には、植物由来の培養細胞の他、植物体中の細胞も含まれる。さらに、種々の形態の植物由来の植物細胞、例えば、懸濁培養細胞、プロトプラスト、葉の切片、カルス、未熟胚、花粉等が含まれる。
Examples of mammals include laboratory animals such as rodents and rabbits such as mice, rats, hamsters and guinea pigs; domestic animals such as pigs, cows, goats, horses, sheep and minks; pets such as dogs and cats; Non-human primates (eg, monkeys, cynomolgus monkeys, rhesus monkeys, marmosets, orangutans, chimpanzees, etc.). Examples of animals other than mammals include, but are not limited to, laboratory animals such as C. elegans, fish (zebrafish), and amphibians (Xenopus laevis, Nettle Xenopus). is not.
The plant cell is not particularly limited as long as it is a cell other than an animal cell, in other words, a cell having a cell wall, and angiosperm and gymnosperm (seed plant) including monocotyledonous and dicotyledonous plants, Any of moss plants, fern plants, herbaceous plants and woody plants may be used. Specific examples of plants include, for example, eggplant family [eggplant, tomato, pepper, pepper, tobacco, etc.], rice family [rice, wheat, barley, perennial ryegrass, italian ryegrass, meadow phesc, tall fescue, orchardgrass, timothy, etc.] Brassicaceae [Arabidopsis, Brassica, Chinese cabbage, cabbage, Japanese radish, rapeseed, etc.], Leguminosae [soybean, azuki bean, green beans, broad bean, etc.], Cucurbitaceae [cucumber, melon, watermelon, pumpkin, etc.], Convolvulaceae [sweet potato, etc.], Liliaceae [Leek, Onion, Leek, Garlic, Asparagus, etc.], Lamiaceae [Perilla, etc.], Asteraceae [Asteraceae, Chrysanthemum, Lettuce, etc.], Rosaceae [Roses, Strawberries, etc.], Citrus Family [Tangerines, Citrus Etc.], Myrtaceae [eucalyptus etc.], Willowaceae [poplar etc.], Akaza department [E Lenovo, sugar beet, etc.], gentianaceae [gentian, etc.], and a plant of the Caryophyllaceae [carnations, etc.]. In particular, solanaceous plants and cruciferous plants are preferable, and among them, tomato, tobacco, and Arabidopsis are preferably used.
Such plant cells include cells in plant bodies in addition to plant-derived cultured cells. Furthermore, plant cells derived from various forms of plants, such as suspension culture cells, protoplasts, leaf sections, callus, immature embryos, pollen and the like are included.
 プラスミドベクターとしては、大腸菌由来のプラスミドベクター(例、pBR322, pBR325, pUC12, pUC13)、枯草菌由来のプラスミドベクター(例、pUB110, pTP5, pC194)、酵母由来プラスミドベクター(例、pSH19, pSH15)、真核細胞用のプラスミドベクター(pCS2, pCMV, pcDNA, pCAGGS)、植物細胞用のバイナリーベクター等を挙げることができ、用いる宿主の種類や使用目的に応じて適宜選択することが出来る。 As plasmid vectors, plasmid vectors derived from E. coli (eg, pBR322, pBR325, pUC12, pUC13), plasmid vectors derived from Bacillus subtilis (eg, pUB110, pTP5, pC194), yeast-derived plasmid vectors (eg, pSH19, pSH15), Examples include plasmid vectors for eukaryotic cells (pCS2, pCMV, pcDNA, pCAGGS), binary vectors for plant cells, and the like, which can be appropriately selected according to the type of host used and the purpose of use.
 ウイルスベクターの種類は、用いる宿主細胞の種類や使用目的に応じて適宜選択することが出来る。例えば、宿主として昆虫細胞を用いる場合には、バキュロウイルスベクター等を用いることが出来る。また、宿主として哺乳動物細胞を用いる場合には、モロニーマウス白血病ウイルスベクター、レンチウイルスベクター、シンドビスウイルスベクター等のレトロウイルスベクター、アデノウイルスベクター、ヘルペスウイルスベクター、アデノ随伴ウイルスベクター、パルボウイルスベクター、ワクシニアウイルスベクター、センダイウイルスベクター等を用いることが出来る。 The type of virus vector can be appropriately selected according to the type of host cell used and the purpose of use. For example, when insect cells are used as the host, baculovirus vectors can be used. When mammalian cells are used as hosts, Moloney murine leukemia virus vectors, lentivirus vectors, Sindbis virus vectors and other retrovirus vectors, adenovirus vectors, herpes virus vectors, adeno-associated virus vectors, parvovirus vectors, Vaccinia virus vectors, Sendai virus vectors, and the like can be used.
 また、プロモーターは、用いる宿主細胞の種類に対応して、該宿主細胞内で転写を開始可能なものを選択することが出来る。例えば、宿主がエシェリヒア属菌である場合、trpプロモーター、lacプロモーター、T7プロモーターなどが好ましい。宿主がバチルス属菌である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーターなどが好ましい。宿主が酵母である場合、PHO5プロモーター、PGKプロモーターなどが好ましい。宿主が昆虫細胞である場合、ポリヘドリンプロモーター、P10プロモーターなどが好ましい。宿主が哺乳動物細胞である場合、サブゲノミック(26S)プロモーター、CMVプロモーター、SRαプロモーター、CAGプロモーター、EF1プロモーターなどが好ましい。 Also, a promoter that can initiate transcription in the host cell can be selected according to the type of host cell to be used. For example, when the host is Escherichia, trp promoter, lac promoter, T7 promoter and the like are preferable. When the host is Bacillus, SPO1 promoter, SPO2 promoter, penP promoter and the like are preferable. When the host is yeast, PHO5 promoter, PGK promoter, etc. are preferable. When the host is an insect cell, a polyhedrin promoter, a P10 promoter and the like are preferable. When the host is a mammalian cell, a subgenomic (26S) promoter, CMV promoter, SRα promoter, CAG promoter, EF1 promoter and the like are preferable.
 本発明の発現ベクターは、所望によりエンハンサー、スプライシングシグナル、ポリA付加シグナル、選択マーカー、SV40複製起点などを、それぞれ機能可能な態様で含有していてもよい。選択マーカーとしては、例えば、ジヒドロ葉酸還元酵素遺伝子〔メソトレキセート(MTX)耐性〕、アンピシリン耐性遺伝子、ネオマイシン耐性遺伝子、カナマイシン耐性遺伝子、ハイグロマイシン耐性遺伝子等が挙げられる。 The expression vector of the present invention may contain an enhancer, a splicing signal, a poly A addition signal, a selection marker, an SV40 replication origin and the like in a functional manner, if desired. Examples of the selection marker include dihydrofolate reductase gene [methotrexate (MTX) resistance], ampicillin resistance gene, neomycin resistance gene, kanamycin resistance gene, hygromycin resistance gene and the like.
 本発明の発現ベクターは好ましくは単離または精製されている。 The expression vector of the present invention is preferably isolated or purified.
 本発明の発現ベクターは、後述するように、適切な宿主細胞内において、本発明のタンパク質を発現し得るので、例えば本発明のタンパク質の製造に有用である。 Since the expression vector of the present invention can express the protein of the present invention in an appropriate host cell as described later, it is useful for producing the protein of the present invention, for example.
 上記本発明の発現ベクターを、自体公知の遺伝子導入法(例えば、リポフェクション法、リン酸カルシウム法、マイクロインジェクション法、プロトプラスト融合法、エレクトロポレーション法、DEAEデキストラン法、Gene Gunによる遺伝子導入法等)に従って上記宿主細胞へ導入することにより、該発現ベクターが導入された形質転換体(本発明の形質転換体)を製造することができる。該形質転換体は本発明のタンパク質を発現し得る。本発明の形質転換体は、本発明のタンパク質の製造等に有用である。 The above-described expression vector of the present invention is prepared according to a gene transfer method known per se (for example, lipofection method, calcium phosphate method, microinjection method, protoplast fusion method, electroporation method, DEAE dextran method, gene transfer method using Gene Gun). By introducing it into a host cell, a transformant into which the expression vector has been introduced (the transformant of the present invention) can be produced. The transformant can express the protein of the present invention. The transformant of the present invention is useful for producing the protein of the present invention.
 上記本発明のベクターから、in vitro transcription反応によりRNAを合成し、これを受精卵ないし細胞に導入することにより、本発明のタンパク質を細胞内に発現させることも行われる。 The protein of the present invention can also be expressed in cells by synthesizing RNA from the above-described vector of the present invention by in vitro transcription reaction and introducing it into a fertilized egg or cell.
 本発明の形質転換体を、宿主の種類に応じて、自体公知の方法で培養し、培養物から本発明のタンパク質を単離することにより、本発明のタンパク質を製造することが出来る。宿主がエシェリヒア属菌である形質転換体の培養は、LB培地やM9培地等の適切な培地中、通常約15~43℃で、約3~24時間行なわれる。宿主がバチルス属菌である形質転換体の培養は、適切な培地中、通常約30~40℃で、約6~24時間行なわれる。宿主が酵母である形質転換体の培養は、バークホールダー培地等の適切な培地中、通常約20℃~35℃で、約24~72時間行なわれる。宿主が昆虫細胞または昆虫である形質転換体の培養は、約10%のウシ血清が添加されたGrace’s Insect medium等の適切な培地中、通常約27℃で、約3~5日間行なわれる。宿主が動物細胞である形質転換体の培養は、約10%のウシ血清が添加されたMEM培地等の適切な培地中、通常約30℃~40℃で、約15~60時間行なわれる。いずれの培養においても、必要に応じて通気や撹拌を行ってもよい。培養物からの本発明のタンパク質の単離または精製は、例えば、菌体溶解液や培養上清を、逆相クロマトグラフィー、イオン交換クロマトグラフィー、アフィニティクロマトグラフィーなどの複数のクロマトグラフィーに供することにより達成することができる。 The protein of the present invention can be produced by culturing the transformant of the present invention by a method known per se according to the type of host and isolating the protein of the present invention from the culture. The transformant whose host is an Escherichia bacterium is cultured in an appropriate medium such as LB medium or M9 medium, usually at about 15 to 43 ° C. for about 3 to 24 hours. The transformant whose host is Bacillus is cultured in an appropriate medium, usually at about 30 to 40 ° C. for about 6 to 24 hours. Culturing of the transformant whose host is yeast is carried out in an appropriate medium such as a Birkholder medium, usually at about 20 ° C. to 35 ° C. for about 24 to 72 hours. Cultivation of transformants whose hosts are insect cells or insects is usually carried out in a suitable medium such as Grace's Insect medium supplemented with about 10% bovine serum, usually at about 27 ° C for about 3 to 5 days. The transformant whose host is an animal cell is cultured in an appropriate medium such as MEM medium supplemented with about 10% bovine serum, usually at about 30 ° C. to 40 ° C. for about 15 to 60 hours. In any culture, aeration and agitation may be performed as necessary. Isolation or purification of the protein of the present invention from the culture can be achieved, for example, by subjecting the cell lysate or culture supernatant to multiple chromatography such as reverse phase chromatography, ion exchange chromatography, affinity chromatography and the like. Can be achieved.
 なお、本発明に従って本発明のタンパク質を製造するための元となるタンパク質(未改変型タンパク質)は、そのアミノ酸配列において上述の人為的な変異を導入されたタンパク質が本発明のタンパク質に包含されるものになり得る限り、特に制限されない。従って、該未改変型タンパク質は、複数のモジュールの繰返し構造を有するXanthomonas属細菌由来TALE部分を含み、かつ前記複数のモジュールの各々は、前記標的DNAの塩基配列を構成するそれぞれ1塩基を認識する前述の標的塩基認識領域を有するものであり得る。例えば、該未改変型タンパク質中のTALE部分の各モジュールは、配列番号1または、該アミノ酸配列においてアミノ酸変異(欠失、置換、付加)が起こっているアミノ酸配列を有する。変異したアミノ酸の数は、通常10アミノ酸以内であり、好ましくは8アミノ酸以内であり、より好ましくは6アミノ酸以内であり、更に好ましくは数(4、3、2または1)アミノ酸である。各モジュールは、配列番号1のアミノ酸配列に対して80%以上の相同性を有するアミノ酸配列を有することが好ましい。アミノ酸配列の相同性は、相同性計算アルゴリズムNCBI BLAST(National Center for Biotechnology Information Basic Local Alignment Search Tool)を用い、以下の条件(期待値=10;ギャップを許す;マトリクス=BLOSUM62;フィルタリング=OFF)にて計算することができる。該未改変型タンパク質中のTALE部分は、例えば、各モジュール中の標的塩基認識領域が標的DNAを認識できるように構成されている以外は所与の天然TALEと同一の配列を有するものであり得る。 In addition, as for the protein (unmodified protein) used as the origin for manufacturing the protein of this invention according to this invention, the protein into which the above-mentioned artificial variation | mutation was introduce | transduced in the amino acid sequence is included by the protein of this invention There is no particular limitation as long as it can be a thing. Therefore, the unmodified protein includes a TALE portion derived from a genus Xanthomonas having a repetitive structure of a plurality of modules, and each of the plurality of modules recognizes one base constituting the base sequence of the target DNA. It may have the aforementioned target base recognition region. For example, each module of the TALE part in the unmodified protein has SEQ ID NO: 1 or an amino acid sequence in which an amino acid mutation (deletion, substitution, addition) has occurred in the amino acid sequence. The number of mutated amino acids is usually within 10 amino acids, preferably within 8 amino acids, more preferably within 6 amino acids, and even more preferably the number (4, 3, 2, or 1) amino acids. Each module preferably has an amino acid sequence having 80% or more homology with the amino acid sequence of SEQ ID NO: 1. Amino acid sequence homology is calculated using the homology calculation algorithm NCBI BLAST (National Center for Biotechnology Information Basic Local Alignment Search Tool) under the following conditions (expected value = 10; allow gaps; matrix = BLOSUM62; filtering = OFF) Can be calculated. The TALE portion in the unmodified protein can have, for example, the same sequence as a given natural TALE except that the target base recognition region in each module is configured to recognize the target DNA. .
(ゲノム編集方法)
 本発明はまた、対象とする細胞における標的遺伝子またはその周辺の領域においてゲノムを切断、改変または修飾するための方法(以下、これらを総称して本発明のゲノム編集方法ともいう)を提供する。後述の説明から明らかなように、該方法はin vitroで行うことができる。当該方法は、本発明のタンパク質を標的遺伝子および/またはその周辺の領域に結合させることを含み、そのために、本発明のタンパク質を細胞に導入するか、または本発明のタンパク質のアミノ酸配列をコードするRNAもしくは本発明のタンパク質のアミノ酸配列をコードする核酸を含む発現ベクターを細胞に導入して細胞内で本発明のタンパク質を発現させる。
(Genome editing method)
The present invention also provides a method for cleaving, modifying or modifying a genome in a target gene or a region around the target gene in a target cell (hereinafter collectively referred to as the genome editing method of the present invention). As will be apparent from the description below, the method can be performed in vitro. The method includes binding the protein of the present invention to a target gene and / or a region around it, and for that purpose, introduces the protein of the present invention into a cell or encodes the amino acid sequence of the protein of the present invention. An expression vector containing RNA or a nucleic acid encoding the amino acid sequence of the protein of the present invention is introduced into the cell, and the protein of the present invention is expressed in the cell.
 対象とする細胞は、特に制限されず、例えば形質転換体に関して上述した宿主細胞等が挙げられる。 The target cell is not particularly limited, and examples thereof include the host cells described above for the transformant.
 本発明のタンパク質の細胞への導入は、自体公知の細胞へのタンパク質導入方法を用いて実施することができる。そのような方法としては、例えば、タンパク質導入試薬を用いる方法、タンパク質導入ドメイン(PTD)もしくは細胞透過性ペプチド(CPP)融合タンパク質を用いる方法、エレクトロポレーション法、マイクロポレーション法、マイクロインジェクション法、細菌III型分泌系による送達などが挙げられる。タンパク質導入試薬としては、カチオン性脂質をベースとしたBioPOTER Protein Delivery Reagent(Gene Therapy Systmes)、Pro-JectTM Protein Transfection Reagent(PIERCE)およびProVectin(IMGENEX)、脂質をベースとしたProfect-1(Targeting Systems)、膜透過性ペプチドをベースとしたPenetrain Peptide(Q biogene)およびChariot Kit(Active Motif)、HVJエンベロープ(不活化センダイウイルス)を利用したGenomONE(石原産業)等が市販されている。導入はこれらの試薬に添付のプロトコールに従って行うことができるが、一般的な手順は以下の通りである。本発明のタンパク質を適当な溶媒(例えば、PBS、HEPES等の緩衝液)に希釈し、導入試薬を加えて室温で5-15分程度インキュベートして複合体を形成させ、これを無血清培地に交換した細胞に添加して37℃で1ないし数時間インキュベートする。その後培地を除去して血清含有培地に交換する。また、植物細胞へのタンパク質の導入のために、自体公知の方法に従って該細胞からプロトプラストを作製することも行われ得る。 Introduction of the protein of the present invention into cells can be carried out using a method for introducing protein into cells known per se. Examples of such methods include a method using a protein introduction reagent, a method using a protein introduction domain (PTD) or a cell-penetrating peptide (CPP) fusion protein, an electroporation method, a microporation method, a microinjection method, Delivery by a bacterial type III secretion system. Protein introduction reagents include cationic lipid-based BioPOTER Protein Delivery Reagent (Gene Therapy Systmes), Pro-Ject Protein Transfection Reagent (PIERCE) and ProVectin (IMGENEX), and lipid-based Profect-1 (Targeting Systems) ), Penetrain Peptide (Q biogene) and Chariot Kit (Active Motif) based on membrane-permeable peptides, GenomONE (Ishihara Sangyo) using HVJ envelope (inactivated Sendai virus), and the like are commercially available. The introduction can be carried out according to the protocol attached to these reagents, but the general procedure is as follows. The protein of the present invention is diluted in an appropriate solvent (for example, a buffer solution such as PBS, HEPES, etc.), an introduction reagent is added, and the mixture is incubated at room temperature for about 5-15 minutes to form a complex. Add to the exchanged cells and incubate at 37 ° C for 1 to several hours. Thereafter, the medium is removed and replaced with a serum-containing medium. In order to introduce a protein into a plant cell, a protoplast can be produced from the cell according to a method known per se.
 PTDとしては、ショウジョウバエ由来のAntP、HIV由来のTAT(Frankel, A. et al, Cell 55, 1189-93 (1988); Green, M. & Loewenstein, P.M. Cell 55, 1179-88 (1988))、Penetratin (Derossi, D. et al, J. Biol. Chem. 269, 10444-50 (1994))、Buforin II (Park, C. B. et al. Proc. Natl Acad. Sci. USA 97, 8245-50 (2000))、Transportan (Pooga, M. et al. FASEB J. 12, 67-77 (1998))、MAP (model amphipathic peptide) (Oehlke, J. et al. Biochim. Biophys. Acta. 1414, 127-39 (1998))、K-FGF (Lin, Y. Z. et al. J. Biol. Chem. 270, 14255-14258 (1995))、Ku70 (Sawada, M. et al. Nature Cell Biol. 5, 352-7 (2003))、Prion (Lundberg, P. et al. Biochem. Biophys. Res. Commun. 299, 85-90 (2002))、pVEC (Elmquist, A. et al. Exp. Cell Res. 269, 237-44 (2001))、Pep-1 (Morris, M. C. et al. Nature Biotechnol. 19, 1173-6 (2001))、Pep-7 (Gao, C. et al. Bioorg. Med. Chem. 10, 4057-65 (2002))、SynBl (Rousselle, C. et al. MoI. Pharmacol. 57, 679-86 (2000))、HN-I (Hong, F. D. & Clayman, G L. Cancer Res. 60, 6551-6 (2000))、HSV由来のVP22等のタンパク質の細胞通過ドメインを用いたものが開発されている。PTD由来のCPPとしては、11R (Cell Stem Cell, 4:381-384(2009)) や9R (Cell Stem Cell, 4:472-476(2009))等のポリアルギニンが挙げられる。 As PTD, Drosophila-derived AntP, HIV-derived TAT (Frankel, A. et al, Cell 55, 1189-93 (1988); Green, M. & Loewenstein, PM Cell 55, 1179-88 (1988)), Penetratin (Derossi, D. et al, J. Biol. Chem. 269, 10444-50 (1994)), Buforin II (Park, C. B. et al. Proc. Natl Acad. Sci. USA 97, 8245-50 (2000)), Transportan (Pooga, M. et al. FASEB J. 12, 67-77 (1998)), MAP (model amphipathic peptide) (Oehlke, J. et al. Biochim. Biophys. Acta. 1414, 127 -39 (1998)), K-FGF (Lin, Y. Z. et al. J. Biol. Chem. 270, 14255-14258 (1995)), Ku70 (Sawada, M. et al. Nature Cell Biol. 5 , 352-7 (2003)), Prion (Lundberg, P. et al. Biochem. Biophys Res. Commun. 299, 85-90 2002 (2002)), pVEC (Elmquist, A. et al. Exp. Cell Res. 269, 237-44 (2001)), Pep-1 (Morris, M. C. et al. Nature Biotechnol. 19, 1173-6 (2001)), Pep-7 (Gao, C. et al. Bioorg. Med . Chem. 10, 4057-65 ( 2002)), SynBl (Rousselle, C. et al. MoI. Pharmacol. 57, 679-86 (2000)), HN-I (Hong, F. D. & Clayman, G L. Cancer Res. 60, 6551- 6 (2000)), those using cell-passing domains of proteins such as VP22 derived from HSV have been developed. Examples of CPP derived from PTD include polyarginine such as 11R (Cell Stem Cell, 4: 381-384 (2009)) and 9R (Cell Stem Cell, 4: 472-476 (2009)).
 本発明のタンパク質のcDNAとPTD配列もしくはCPP配列とを組み込んだ融合タンパク質発現ベクターを作製して組換え発現させ、融合タンパク質を回収して導入に用いる。導入は、タンパク質導入試薬を添加しない以外は上記と同様にして行うことができる。 A fusion protein expression vector incorporating the cDNA of the protein of the present invention and a PTD sequence or CPP sequence is prepared and recombinantly expressed, and the fusion protein is recovered and used for introduction. Introduction can be performed in the same manner as described above except that no protein introduction reagent is added.
 マイクロインジェクションは、先端径1μm程度のガラス針にタンパク質溶液を入れ、細胞に穿刺導入する方法であり、確実に細胞内にタンパク質を導入することができる。 Microinjection is a method in which a protein solution is put into a glass needle having a tip diameter of about 1 μm and puncture is introduced into a cell, and the protein can be reliably introduced into the cell.
 その他、エレクトロポレーション法、セミインタクトセル法(Kano, F. et al. Methods in Molecular Biology, Vol. 322, 357-365(2006))、Wr-T ペプチドによる導入法(Kondo, E. et al., Mol. Cancer Ther. 3(12), 1623-1630(2004))などのタンパク質導入法も用いることができる。 In addition, electroporation method, semi-intact cell method (Kano, F. et al. Methods in Molecular Biology, Vol. 322, 357-365 (2006)), introduction method using Wr-T peptide (Kondo, E. et al. Protein introduction methods such as Mol. Cancer Ther. 3 (12), 1623-1630 (2004)) can also be used.
 タンパク質導入操作は1回以上の任意の回数(例えば、1回以上10回以下、または1回以上5回以下等)行うことができ、好ましくは導入操作を2回以上(たとえば3回または4回)繰り返して行うことができる。導入操作を繰り返し行う場合の間隔としては、例えば6~48時間、好ましくは12~24時間が挙げられる。 The protein introduction operation can be performed any number of one or more times (for example, 1 to 10 times or 1 to 5 times), and preferably the introduction operation is performed 2 or more times (for example, 3 or 4 times). ) Can be done repeatedly. Examples of the interval when the introduction operation is repeated include 6 to 48 hours, preferably 12 to 24 hours.
 RNAまたは発現ベクターの細胞への導入については上述した通りである。 The introduction of RNA or expression vector into cells is as described above.
 上記の人工ヌクレアーゼの導入またはそれをコードするRNAや発現ベクターの標的細胞への導入・発現により、該細胞中の標的DNA(標的遺伝子)においてdouble strand breaks (DSBs)が生じる。人工ヌクレアーゼによって細胞内に導入されたDSBは、主に2つのDNA修復経路(非相同末端結合(non-homologous end joining; NHEJ)および相同組み換え修復(homology-directed repair; HDR))によって修復される。NHEJによる修復においては、しばしば塩基の欠失や挿入が起こり、フレームシフトによって遺伝子が破壊されることがある。そのため、特に遺伝子を破壊するために好適に利用される。一方、HDRではDSBは正確に修復されるので、人工ヌクレアーゼとともにドナーコンストラクト(標的配列の相同配列を両端に持つ遺伝子)を導入することで、塩基の改変や遺伝子挿入が可能である(Joung JK, et al., Nat. Rev. Mol. Cell Biol. (2013) 14: 49-55)。ドナーコンストラクトの細胞への導入は、上述した発現ベクターの細胞への導入と同様にして行うことができる。更に、2組の人工ヌクレアーゼで同一染色体を切断することで大きな欠失や逆位、異なる染色体を切断することで転座を誘導することも可能である。 The introduction of the above-mentioned artificial nuclease or the introduction / expression of RNA encoding it or an expression vector into a target cell generates double strand breaks (DSBs) in the target DNA (target gene) in the cell. DSBs introduced into cells by artificial nucleases are repaired mainly by two DNA repair pathways: non-homologous end joining (NHEJ) and homology-directed repair (HDR) . In repairs with NHEJ, base deletions and insertions often occur and the gene may be disrupted by frameshifting. Therefore, it is preferably used particularly for destroying genes. On the other hand, since DSB is accurately repaired in HDR, base modification and gene insertion are possible by introducing a donor construct (a gene having a homologous sequence of the target sequence at both ends) together with an artificial nuclease (Joung JK, et al., Nat. Rev. Mol. Cell Biol. (2013) 14: 49-55). Introduction of the donor construct into the cell can be performed in the same manner as the introduction of the expression vector into the cell. Furthermore, it is possible to induce translocations by cutting large chromosomes or inversions by cutting the same chromosome with two pairs of artificial nucleases, or by cutting different chromosomes.
 標的遺伝子が欠失または改変されたかどうかは、例えば、HMA法やCel-I assay等を用いて、または標的配列の塩基配列決定により確認することができる。 Whether the target gene has been deleted or modified can be confirmed, for example, using the HMA method, Cel-I assay, or the like, or by determining the base sequence of the target sequence.
 あるいは、例えば上述のエピゲノム制御因子を含む本発明のタンパク質を上記の領域に結合させることにより、当該領域の修飾を行うことも可能である。 Alternatively, for example, the region can be modified by binding the protein of the present invention containing the above-described epigenome regulatory factor to the region.
 上記の方法を用いて得られた、ゲノムが編集された細胞は、当該細胞が由来する生物の変異個体または変異系統の作製のために使用され得る。 The cells obtained by editing the genome obtained by using the above method can be used for the production of mutant individuals or mutant strains of organisms from which the cells are derived.
(スクリーニング方法)
 本発明はまた、標的DNAに対する結合活性が未改変型タンパク質と比較して変化(向上または低減)した改変型タンパク質をスクリーニングするための方法(以下、本発明のスクリーニング方法Iともいう)を提供する。従って、該方法はまた、標的DNAに対する結合活性が元となるタンパク質(未改変型タンパク質)と比較して変化(向上または低減)した改変型タンパク質を作製するための方法、または、TALE部分を含むタンパク質による標的DNAに対する結合活性を制御するための方法でもある。
(Screening method)
The present invention also provides a method (hereinafter also referred to as screening method I of the present invention) for screening a modified protein whose binding activity to a target DNA is changed (improved or reduced) as compared with an unmodified protein. . Therefore, the method also includes a method for producing a modified protein having altered (improved or reduced) compared to the protein (unmodified protein) whose binding activity to the target DNA is the original, or a TALE moiety. It is also a method for controlling the binding activity of a protein to a target DNA.
 本発明のスクリーニング方法Iは、(1)本発明のタンパク質(改変型タンパク質)の、標的DNAに対する結合活性を測定する工程、および、(2)該改変型タンパク質における該人為的な変異を有しない未改変型タンパク質の、該標的DNAに対する結合活性を測定する工程を含む。これらの工程はin vitroで行われる。また、これらの工程を行う順序は問わない。標的DNAに対する結合能(結合安定性)のみならず、非標的DNA配列も用いて結合の特異性も調べることが好ましい。
 上記の(1)および(2)の工程は、例えば以下の方法で行うことができる。変異導入を行ったモジュールまたは未改変のモジュールを含むTALE由来の人工DNA結合ドメインをタンパク質として試験管内翻訳反応ないし大腸菌などで発現し、標的DNA配列および非標的DNA配列に対する結合親和性をゲルシフトアッセイないしバイオセンサー法で計測する。あるいは、変異導入を行ったモジュールまたは未改変のモジュールを含むTALE由来の人工DNA結合ドメインをVP16などのエンハンサー活性ドメインと融合した発現ベクターないしRNAを作成し、標的DNA配列および非標的DNA配列の下流にルシフェラーゼなどのリポーター発現ユニットを繋いだプラスミドなどと同時に細胞内に導入し、発現誘導活性を測定するdTALEアッセイで計測する。後述の実施例1も参照されたい。
 上記の(1)および(2)の工程で得られた結合活性を互いに比較する。(2)の工程で得られた結合活性と比較して、(1)の工程で得られた結合活性が変化(向上または低減)した場合に、該改変型タンパク質を、該標的DNAに対する結合活性が該未改変型タンパク質と比較して変化した改変型タンパク質として選択する。該比較は有意差の有無に基づいて行うことが好ましい。該結合活性の向上は、例えば上記したような試験管内活性計測法または実施例1に記載の方法(上記のdTALEアッセイ)で測定した場合に、少なくとも1.5倍であることが好ましく、少なくとも2倍であることがより好ましく、少なくとも5倍であることが更に好ましく、少なくとも10倍であることが特に好ましい。該結合活性の低減は、上記と同様の測定で、例えば、2/3以下、1/2以下または1/4以下である。
The screening method I of the present invention includes (1) a step of measuring the binding activity of the protein of the present invention (modified protein) to a target DNA, and (2) no artificial mutation in the modified protein. Measuring the binding activity of the unmodified protein to the target DNA. These steps are performed in vitro. Moreover, the order which performs these processes is not ask | required. It is preferable to examine not only the binding ability to target DNA (binding stability) but also the specificity of binding using non-target DNA sequences.
The above steps (1) and (2) can be performed, for example, by the following method. A TALE-derived artificial DNA binding domain containing a mutagenized or unmodified module is expressed as a protein in a test tube translation reaction or in E. coli, etc., and the binding affinity for target DNA sequences and non-target DNA sequences is determined by gel shift assay or Measure by biosensor method. Alternatively, create an expression vector or RNA by fusing a TALE-derived artificial DNA-binding domain containing a mutagenized or unmodified module with an enhancer activity domain such as VP16, and downstream of the target DNA sequence and non-target DNA sequence. It is introduced into a cell at the same time as a plasmid linked to a reporter expression unit such as luciferase, and measured by a dTALE assay to measure expression-inducing activity. See also Example 1 below.
The binding activities obtained in steps (1) and (2) above are compared with each other. When the binding activity obtained in the step (1) changes (improves or decreases) compared to the binding activity obtained in the step (2), the modified protein binds to the target DNA. Is selected as a modified protein that is altered compared to the unmodified protein. The comparison is preferably performed based on the presence or absence of a significant difference. The improvement of the binding activity is preferably at least 1.5 times, for example, at least 2 times when measured by the in vitro activity measurement method as described above or the method described in Example 1 (the above dTALE assay). More preferably, it is more preferably at least 5 times, and particularly preferably at least 10 times. The reduction of the binding activity is, for example, 2/3 or less, 1/2 or less, or 1/4 or less in the same measurement as described above.
 スクリーニングに供される本発明のタンパク質は、元となるタンパク質(上記の未改変型タンパク質)に基づいて、上述した本発明の製造方法に従って製造することができる。即ち、該方法は、前記工程(1)の以前に、元となる未改変型タンパク質に上記の人為的な変異が導入された本発明のタンパク質(改変型タンパク質)を作製する工程を含むことができ、該工程は、例えば、未改変型タンパク質をコードする核酸に変異(即ち、変異した核酸がコードするタンパク質において、本発明のタンパク質が有すべき上述の人為的な変異を生じるような変異)を導入することにより、本発明のタンパク質をコードする核酸を作製すること、作製された核酸を含む発現ベクターを得、それを上記宿主細胞に導入することにより形質転換体を得ること、そして該形質転換体を培養し、培養物から本発明のタンパク質を単離することにより行うことができる。これらの手順については本明細書中に詳細に説明されている。 The protein of the present invention to be subjected to screening can be produced according to the production method of the present invention described above based on the original protein (the above-mentioned unmodified protein). That is, the method includes a step of producing the protein of the present invention (modified protein) in which the above-described artificial mutation is introduced into the original unmodified protein before the step (1). The step can be performed, for example, by mutating a nucleic acid encoding an unmodified protein (that is, a mutation that causes the above-described artificial mutation that the protein of the present invention should have in the protein encoded by the mutated nucleic acid). To produce a nucleic acid encoding the protein of the present invention, obtain an expression vector containing the produced nucleic acid, introduce it into the host cell, obtain a transformant, and It can be performed by culturing the transformant and isolating the protein of the present invention from the culture. These procedures are described in detail herein.
 本発明はまた、標的DNAに対する切断活性が未改変型タンパク質と比較して変化(向上または低減)した改変型タンパク質をスクリーニングするための方法(以下、本発明のスクリーニング方法IIともいう)を提供する。改変型タンパク質は、ヌクレアーゼ部分を含む本発明のタンパク質である。従って、該方法はまた、標的DNAに対する切断活性が元となるタンパク質(未改変型タンパク質)と比較して変化(向上または低減)した改変型タンパク質を作製するための方法、または、TALE部分およびヌクレアーゼ部分を含むタンパク質による標的DNAに対する切断活性を制御するための方法でもある。 The present invention also provides a method (hereinafter also referred to as screening method II of the present invention) for screening a modified protein having altered (improved or reduced) cleavage activity against the target DNA compared to the unmodified protein. . The modified protein is a protein of the present invention containing a nuclease moiety. Therefore, the method also includes a method for producing a modified protein having altered (improved or reduced) as compared with a protein (unmodified protein) having a cleavage activity against a target DNA, or a TALE moiety and a nuclease. It is also a method for controlling the cleavage activity of a target-containing protein against a target DNA.
 本発明のスクリーニング方法IIは、(1)本発明のタンパク質(改変型タンパク質)の、標的DNAに対する切断活性を測定する工程、および、(2)該改変型タンパク質における該人為的な変異を有しない未改変型タンパク質の、該標的DNAに対する切断活性を測定する工程を含む。これらの工程はin vitroで行われる。また、これらの工程を行う順序は問わない。標的DNAに対する切断活性のみならず、非標的DNA配列も用いて切断の特異性も調べることが好ましい。
 上記の(1)および(2)の工程は、TALENを用いた試験管内での標的DNAおよび非標的DNAの切断活性の計測、あるいは、細胞内ないし個体内での標的DNAの切断活性の計測(SSA法、HMA法など)などを利用して行うことができる。後述の実施例2および3も参照されたい。
 上記の(1)および(2)の工程で測定された切断活性を互いに比較する。(2)の工程で得られた切断活性と比較して、(1)の工程で得られた切断活性が変化(向上または低減)した場合に、該改変型タンパク質を、該標的DNAに対する切断活性が該未改変型タンパク質と比較して変化した改変型タンパク質として選択する。該比較は有意差の有無に基づいて行うことが好ましい。精製タンパク質を用いた試験管内での標的DNAおよび非標的DNA切断活性計測によって、非標的DNA切断が認められず、かつ、標的DNAの単位時間・単位タンパク質量あたりの切断活性が、未改変型タンパク質に対して有意に高いこと、少なくとも1.5倍であることが好ましく、少なくとも2倍であることがより好ましく、少なくとも5倍であることが更に好ましく、少なくとも10倍であることが特に好ましい。
The screening method II of the present invention comprises (1) a step of measuring the cleavage activity of the protein of the present invention (modified protein) against the target DNA, and (2) no artificial mutation in the modified protein. Measuring the cleavage activity of the unmodified protein against the target DNA. These steps are performed in vitro. Moreover, the order which performs these processes is not ask | required. It is preferable to examine not only the cleavage activity against the target DNA but also the specificity of the cleavage using non-target DNA sequences.
The above steps (1) and (2) are carried out by measuring target DNA and non-target DNA cleavage activity in a test tube using TALEN, or measuring target DNA cleavage activity in a cell or an individual ( SSA method, HMA method, etc.) can be used. See also Examples 2 and 3 below.
The cleavage activities measured in the above steps (1) and (2) are compared with each other. When the cleavage activity obtained in the step (1) changes (improves or decreases) compared to the cleavage activity obtained in the step (2), the modified protein is cleaved against the target DNA. Is selected as a modified protein that is altered compared to the unmodified protein. The comparison is preferably performed based on the presence or absence of a significant difference. By measuring the target DNA and non-target DNA cleavage activity in a test tube using purified protein, non-target DNA cleavage is not observed, and the cleavage activity per unit time and amount of protein of the target DNA is unmodified protein. Significantly higher, preferably at least 1.5 times, more preferably at least 2 times, even more preferably at least 5 times, and particularly preferably at least 10 times.
 スクリーニングに供される本発明のタンパク質は、ヌクレアーゼ部分を有する元となるタンパク質(上記の未改変型タンパク質)に基づいて、上述した本発明の製造方法に従って製造することができる。即ち、該方法は、前記工程(1)の以前に、元となる未改変型タンパク質に上記の人為的な変異が導入された本発明のタンパク質(改変型タンパク質)を作製する工程を含むことができ、該工程は、例えば、未改変型タンパク質をコードする核酸に変異(即ち、変異した核酸がコードするタンパク質において、本発明のタンパク質が有すべき上述の人為的な変異を生じるような変異)を導入することにより、本発明のタンパク質をコードする核酸を作製すること、作製された核酸を含む発現ベクターを得、それを上記宿主細胞に導入することにより形質転換体を得ること、そして該形質転換体を培養し、培養物から本発明のタンパク質を単離することにより行うことができる。これらの手順については本明細書中に詳細に説明されている。 The protein of the present invention to be used for screening can be produced according to the production method of the present invention described above based on the original protein having the nuclease moiety (the above-mentioned unmodified protein). That is, the method includes a step of producing the protein of the present invention (modified protein) in which the above-described artificial mutation is introduced into the original unmodified protein before the step (1). The step can be performed, for example, by mutating a nucleic acid encoding an unmodified protein (that is, a mutation that causes the above-described artificial mutation that the protein of the present invention should have in the protein encoded by the mutated nucleic acid). To produce a nucleic acid encoding the protein of the present invention, obtain an expression vector containing the produced nucleic acid, introduce it into the host cell, obtain a transformant, and It can be performed by culturing the transformant and isolating the protein of the present invention from the culture. These procedures are described in detail herein.
 以下、実施例等を示して本発明をより詳細に説明するが、本発明は以下の実施例等により限定されない。 Hereinafter, although an example etc. are shown and the present invention is explained in detail, the present invention is not limited by the following examples etc.
1. 天然TALEのリピート配列の解析および構造学的検討1. Analyzes and structural studies of repeat sequences of natural TALE
 Xanthomonas属の種々の細菌が持つ約1000種類のTALEのDNA結合ドメインのリピート配列を解析した。配列情報はPubMedから入手した。図1に、調べた天然TALEのリピート配列におけるアミノ酸残基の保存性解析の結果を示す。図中、灰色部分は保存されたアミノ酸残基を示す。図1に示されるように、12番目と13番目のいわゆるRVD(repeat variable diresidue)だけでなく、4番目と32番目のアミノ酸も保存性が低いことが分かった。12番目と13番目のRVD残基は、DNA塩基認識の特異性に関わることが既に示されており、X線構造解析の結果もこれを支持する。しかし、4番目と32番目のアミノ酸残基の保存性が低いことは注目されておらず、TALEの活性には影響しないと考えられていた(例:Streubel et al., Nature Biotechnology 30:593-595, 2012)。 The repeat sequences of about 1000 TALE DNA binding domains possessed by various bacteria of the genus Xanthomonas were analyzed. Sequence information was obtained from PubMed. FIG. 1 shows the results of an analysis of the conservation of amino acid residues in the repeat sequence of the examined natural TALE. In the figure, gray portions indicate conserved amino acid residues. As shown in FIG. 1, it was found that not only the 12th and 13th so-called RVDs (repeatesvariable diresidue) but also the 4th and 32nd amino acids had low conservation. The 12th and 13th RVD residues have already been shown to be involved in the specificity of DNA base recognition, and the results of X-ray structural analysis support this. However, the low conservation of amino acid residues at the 4th and 32nd amino acids was not noticed and was not considered to affect the activity of TALE (eg, Streubel et al., Nature Biotechnology 30: 593- 595, 2012).
 更に詳細に個々のXanthomonas属のTALE配列を解析すると、orizae型では、4番目のアミノ酸残基としてはアスパラギン酸(D)の頻度が最も高く、32番目のアミノ酸残基としてもアスパラギン酸(D)の頻度が最も高かった。従来広く用いられているVoytasらによるGolden Gate法およびその改変手法のTALEは、4番目がアスパラギン酸(D)、32番目がアスパラギン酸(D)という組み合わせ(以下、DD型または従来型と称する)を用いていることが配列解析により分かったが、天然TALEでは、orizae型でもDD型リピートが連続することは少なく、citri型等の他の種類のXanthomonasでは、EA型やDQ型等、異なる組み合わせのリピートが連続して見られることが分かった(図2-4)。 When analyzing the TALE sequence of each Xanthomonas genus in more detail, in the orizae type, aspartic acid (D) has the highest frequency as the fourth amino acid residue, and aspartic acid (D) as the 32nd amino acid residue. Was the most frequent. Tale of Golden Gate method and its modification method by Voytas et al., Which has been widely used in the past, is a combination of aspartic acid (D) 4th and aspartic acid (D) 32nd (hereinafter referred to as DD type or conventional type) However, in natural TALE, DD repeats are rare in orizae type, and other types of Xanthomonas such as citri type have different combinations such as EA type and DQ type. It was found that the repeats were continuously observed (Figure 2-4).
 続いて、TALEの分子構造を検討した。図5に示すように、4番目と32番目の残基は隣接するリピート間での結合に関与し、TALE分子の立体構造の安定化に重要な役割を果たしていることが示唆された。 Subsequently, the molecular structure of TALE was examined. As shown in FIG. 5, the 4th and 32nd residues are involved in binding between adjacent repeats, suggesting that they play an important role in stabilizing the conformation of the TALE molecule.
 更に、DNA非結合時および結合時のTALEの構造を詳細に再解析した。図6に示すように、EA型では4番目のグルタミン酸(E)が隣接するリピートの5番目のグルタミン(Q)と水素結合を形成し、32番目のアラニン(A)は、33番目のヒスチジン(H)が隣接するリピートの23番目のグルタミン(Q)と形成する水素結合を安定化していることが示唆された。これらの水素結合は、DNA結合時にのみ見られる構造であり、DNAのmajor grooveに沿って結合した際の立体構造の安定化に寄与すると考えられた。
 一方、この構造から、DA型やDD型ではTALE構造がEA型より不安定であることが予想される。DA型では4番目のアスパラギン酸(D)はグルタミン酸(E)より側鎖が短いため水素結合が届かず、DD型では32番目のアスパラギン酸(D)が33番目のヒスチジン(H)と水素結合を形成して、隣接するリピートの23番目のグルタミン(Q)との水素結合が不安定化されるためである。
Furthermore, the structure of TALE when DNA was not bound and bound was reanalyzed in detail. As shown in FIG. 6, in the EA type, the 4th glutamic acid (E) forms a hydrogen bond with the 5th glutamine (Q) of the adjacent repeat, and the 32nd alanine (A) is the 33rd histidine ( It was suggested that H) stabilized the hydrogen bond formed with the 23rd glutamine (Q) of the adjacent repeat. These hydrogen bonds are structures that can be seen only during DNA binding, and are thought to contribute to the stabilization of the three-dimensional structure when bound along the major groove of DNA.
On the other hand, from this structure, the DA type and DD type are expected to have a more unstable TALE structure than the EA type. In the DA type, the 4th aspartic acid (D) has a shorter side chain than the glutamic acid (E), so hydrogen bonds do not reach.In the DD type, the 32nd aspartic acid (D) is hydrogen bonded to the 33rd histidine (H). This is because the hydrogen bond with the 23rd glutamine (Q) of the adjacent repeat is destabilized.
 以上の解析から、天然のTALEは4番目と32番目のアミノ酸残基に多様性を持たせることで、TALEの立体構造の安定性をその生理機能に応じて調節していることが強く示唆された。このことから、逆に4番目と32番目のアミノ酸残基に変異を加えることで、人工的にTALEの活性を変化させられると予想される。そこで、VoytasらのGolden Gate TALEN構築手法および佐久間らによる改変法をベースに、4番目と32番目のアミノ酸残基に変異を導入する実験を行った。その結果、以下に示すように、標的配列に対する特異的結合能が向上した高活性のTALEタンパク質の構築に成功した。 The above analysis strongly suggests that natural TALE regulates the stability of the three-dimensional structure of TALE according to its physiological function by providing diversity at the 4th and 32nd amino acid residues. It was. On the contrary, it is expected that the activity of TALE can be artificially changed by adding mutation to the 4th and 32nd amino acid residues. Therefore, experiments were carried out to introduce mutations at the 4th and 32nd amino acid residues based on the construction method of Golden Gate TALEN by Voytas et al. And the modification method by Sakuma et al. As a result, as shown below, a highly active TALE protein with improved specific binding ability to the target sequence was successfully constructed.
実施例1:TALE-DNA結合モチーフの各リピートモジュールの4番目のアミノ酸をアスパラギン酸(D)からグルタミン酸(E)に、32番目のアミノ酸をアスパラギン酸(D)からアラニン(A)に改変した改変型TALE(EA型)の作製、同31番目のアミノ酸をグルタミン(Q)からグルタミン酸(E)に、32番目のアミノ酸をアスパラギン酸(D)からグルタミン(Q)に改変した改変型TALE(EQ型)の作製、これらの複合型改変TALEの作製、および、培養細胞を用いたレポーターアッセイによる従来型TALEと改変型TALEとの特異的DNA配列に対する結合活性の比較Example 1: Modification by changing the fourth amino acid of each repeat module of the TALE-DNA binding motif from aspartic acid (D) to glutamic acid (E) and the 32nd amino acid from aspartic acid (D) to alanine (A) Type TALE (EA type), modified TALE (EQ type) in which the 31st amino acid was changed from glutamine (Q) to glutamic acid (E) and the 32nd amino acid was changed from aspartic acid (D) to glutamine (Q) Comparison of binding activity to specific DNA sequences of conventional TALE and modified TALE by reporter assay using cultured cells
 pCS2TAL3-DD (Dahlem et al (PLoS Genet. 2012 Aug;8(8))のC末からFokI機能ドメインを除去し、VP16転写活性化ドメインx3 (VP48)を挿入した(BamHI/XbaI) pCS2-TALE-VP48 ベクターを構築した。該ベクターの配列を配列番号29に示す。また、改変Golden gate法(Sakuma et. al. 2013 Genes to Cells. 18(4) p315)で用いる各ベクター(pFUS_A2A, pFUS_A2B, pFUS_B1, pFUS_B2, pFUS_B3, pFUS_B4, pFUS_B5, pFUS_B6, pHD1, pHD2, pHD3, pHD4, pHD5, pHD6, pNN1, pNN2, pNN3, pNN4, pNN5, pNN6, pNI1, pNI2, pNI3, pNI4, pNI5, pNI6, pNG1, pNG2, pNG3, pNG4, pNG5, pNG6)に、プライマーを用いた通常の点変異導入技術 (参考: Sawano et. al. 2000, Nucleic Acids Research 28(16)など)により、下記の変異を導入した。具体的には、以下のリン酸化処理したプライマーを用い、Taq DNA ligase存在下で、KOD Plus Neoを用い18サイクルのPCRを行った。DpnI処理により変異未導入のプラスミドを分解した後、大腸菌に形質転換しプラスミドを回収した。 The FokI functional domain was removed from the C terminus of pCS2TAL3-DD (Dahlem et al (PLoS Genet. 2012 Aug; 8 (8)) and VP16 transcription activation domain x3 (VP48) was inserted (BamHI / XbaI) pCS2-TALE -VP48 vector was constructed, and the sequence of the vector is shown in SEQ ID NO: 29. In addition, each vector (pFUS_A2A, pFUS_A2B, pGUS_A2A, pFUS_A2B, etc.) used in the modified Golden gate method (Sakuma et. Al. 2013 Genes to Cells. 18 (4) p315) pFUS_B1, pFUS_B2, pFUS_B3, pFUS_B4, pFUS_B5, pFUS_B6, pHD1, pHD2, pHD3, pHD4, pNN3, NIp4 The following mutations were introduced into pNG2, pNG3, pNG4, pNG5, and pNG6) by the usual point mutation introduction technique using primers (reference: Sawano et. al. 2000, Nucleic Acids Research 28 (16), etc.). Specifically, PCR was carried out for 18 cycles using the following phosphorylated primers in the presence of Taq DNA ligase using KOD Plus Neo. After decomposing the mutation not transfected plasmid by management, to recover the transformed plasmids into E. coli.
(変異導入例1)TALE-DNA結合モチーフの各リピートモジュールにおいて、4番目のアミノ酸残基に対応するコドンをGAC(アスパラギン酸(D))からGAG(グルタミン酸(E))に、32番目のアミノ酸残基に対応するコドンをGAC(アスパラギン酸(D))からGCC(アラニン(A))に全て改変した。
 
4番目のアミノ酸の変異導入(アミノ酸をアスパラギン酸(D)からグルタミン酸(E)に改変)に用いたプライマー
CCTGACCCCGGAGCAAGTGGTGGCTAT (4DE-1F)(配列番号2)
CCTGACTCCGGAGCAAGTGGTGGCTAT (4DE-2F) (配列番号3)
 
これらのプライマーによって変異を導入したプラスミド
(4DE-1F): pFUS_A2A, pFUS_A2B, pFUS_B1-6, pNN2-6, pNG2-6, pNI2-6
(4DE-2F): pHD2-6
 
32番目のアミノ酸の変異導入(アスパラギン酸(D)からアラニン(A)に改変)に用いたプライマー
GTGCTGTGCCAGGCCCATGGCCTGAC (32DA-1F) (配列番号4)
GGTCTCAGGCCCATGGCCTGAC (32DA-2F) (配列番号5)
GGTCTCGCCAGGCCCATGGCCTGAC (32DA-3F) (配列番号6)
GTGCTGTGCCAGGCCCATGGGAGACCC (32DA-4F) (配列番号7)
GTGCTGTGCCAGGCCCATGGCCGAGAC (32DA-5F) (配列番号8)
GTGCTGTGCCAGGCCCGAGACCCTCG (32DA-6F) (配列番号9)
 
これらのプライマーによって変異を導入したプラスミド
(32DA-1F): pHD5-6, pNN5-6, pNI5-6, pNG5-6, pFUS_B4-6, pFUS_A2A
(32DA-2F): pHD3, pNN3, pNI3, pNG3, pFUS_B2
(32DA-3F): pHD4, pNN4, pNI4, pNG4, pFUS_B3
(32DA-4F): pHD1, pNN1, pNI1, pNG1
(32DA-5F): pFUS_A2B
(32DA-6F): pHD2, pNN2, pNI2, pNG2
(Mutation example 1) In each repeat module of the TALE-DNA binding motif, the codon corresponding to the fourth amino acid residue is changed from GAC (aspartic acid (D)) to GAG (glutamic acid (E)), and the 32nd amino acid. The codons corresponding to the residues were all changed from GAC (aspartic acid (D)) to GCC (alanine (A)).

Primer used for mutation introduction of the 4th amino acid (amino acid was changed from aspartic acid (D) to glutamic acid (E))
CCTGACCCCGGAGCAAGTGGTGGCTAT (4DE-1F) (SEQ ID NO: 2)
CCTGACTCCGGAGCAAGTGGTGGCTAT (4DE-2F) (SEQ ID NO: 3)

Plasmid with mutations introduced by these primers
(4DE-1F): pFUS_A2A, pFUS_A2B, pFUS_B1-6, pNN2-6, pNG2-6, pNI2-6
(4DE-2F): pHD2-6

Primer used for mutagenesis of the 32nd amino acid (modified from aspartic acid (D) to alanine (A))
GTGCTGTGCCAGGCCCATGGCCTGAC (32DA-1F) (SEQ ID NO: 4)
GGTCTCAGGCCCATGGCCTGAC (32DA-2F) (SEQ ID NO: 5)
GGTCTCGCCAGGCCCATGGCCTGAC (32DA-3F) (SEQ ID NO: 6)
GTGCTGTGCCAGGCCCATGGGAGACCC (32DA-4F) (SEQ ID NO: 7)
GTGCTGTGCCAGGCCCATGGCCGAGAC (32DA-5F) (SEQ ID NO: 8)
GTGCTGTGCCAGGCCCGAGACCCTCG (32DA-6F) (SEQ ID NO: 9)

Plasmid with mutations introduced by these primers
(32DA-1F): pHD5-6, pNN5-6, pNI5-6, pNG5-6, pFUS_B4-6, pFUS_A2A
(32DA-2F): pHD3, pNN3, pNI3, pNG3, pFUS_B2
(32DA-3F): pHD4, pNN4, pNI4, pNG4, pFUS_B3
(32DA-4F): pHD1, pNN1, pNI1, pNG1
(32DA-5F): pFUS_A2B
(32DA-6F): pHD2, pNN2, pNI2, pNG2
(変異導入例2)TALE-DNA結合モチーフの各リピートモジュールにおいて、31番目のアミノ酸残基に対応するコドンをCAG(グルタミン(Q))からGAG(グルタミン酸(E))に、32番目のアミノ酸残基に対応するコドンをGAC(アスパラギン酸(D))からCAG(グルタミン(Q))に全て改変した。
 
変異導入に用いたプライマー
GTGCTGTGCGAGCAGCATGGCCTGAC (31E32Q-1F) (配列番号10)
GGTCTCAGCAGCATGGCCTGAC (31E32Q-2F) (配列番号11)
GGTCTCGCGAGCAGCATGGCCTGAC (31E32Q-3F) (配列番号12)
GTGCTGTGCGAGCAGCATGGGAGACCC (31E32Q-4F) (配列番号13)
GTGCTGTGCGAGCAGCATGGCCGAGAC (31E32Q-5F) (配列番号14)
GTGCTGTGCGAGCAGCGAGACCCTCG (31E32Q-6F) (配列番号15)
GGTGCTGTGCGAGGGAGACCC (31E32Q-7F) (配列番号16)
 
これらのプライマーによって変異を導入したプラスミド
(31E32Q-1F): pHD5-6, pNN5-6, pNI5-6, pNG5-6, pFUS_B4-6, pFUS_A2A
(31E32Q-2F): pHD3, pNN3, pNI3, pNG3, pFUS_B2
(31E32Q-3F): pHD4, pNN4, pNI4, pNG4, pFUS_B3
(31E32Q-4F): pHD1, pNN1, pNI1, pNG1
(31E32Q-5F): pFUS_A2B
(31E32Q-6F): pHD2, pNN2, pNI2, pNG2
(31E32Q-7F): pHD3, pNN3, pNI3, pNG3
(Mutation example 2) In each repeat module of the TALE-DNA binding motif, the codon corresponding to the 31st amino acid residue is changed from CAG (glutamine (Q)) to GAG (glutamic acid (E)), and the 32nd amino acid residue All codons corresponding to the group were changed from GAC (aspartic acid (D)) to CAG (glutamine (Q)).

Primers used for mutagenesis
GTGCTGTGCGAGCAGCATGGCCTGAC (31E32Q-1F) (SEQ ID NO: 10)
GGTCTCAGCAGCATGGCCTGAC (31E32Q-2F) (SEQ ID NO: 11)
GGTCTCGCGAGCAGCATGGCCTGAC (31E32Q-3F) (SEQ ID NO: 12)
GTGCTGTGCGAGCAGCATGGGAGACCC (31E32Q-4F) (SEQ ID NO: 13)
GTGCTGTGCGAGCAGCATGGCCGAGAC (31E32Q-5F) (SEQ ID NO: 14)
GTGCTGTGCGAGCAGCGAGACCCTCG (31E32Q-6F) (SEQ ID NO: 15)
GGTGCTGTGCGAGGGAGACCC (31E32Q-7F) (SEQ ID NO: 16)

Plasmid with mutations introduced by these primers
(31E32Q-1F): pHD5-6, pNN5-6, pNI5-6, pNG5-6, pFUS_B4-6, pFUS_A2A
(31E32Q-2F): pHD3, pNN3, pNI3, pNG3, pFUS_B2
(31E32Q-3F): pHD4, pNN4, pNI4, pNG4, pFUS_B3
(31E32Q-4F): pHD1, pNN1, pNI1, pNG1
(31E32Q-5F): pFUS_A2B
(31E32Q-6F): pHD2, pNN2, pNI2, pNG2
(31E32Q-7F): pHD3, pNN3, pNI3, pNG3
 従来型のプラスミド、および、上記の手法により変異導入したプラスミドを用いて、改変Golden gate法(Sakuma et. al. 2013 Genes to Cells. 18(4) p315)の手法に基づき、pCS2-TALE-VP48ベクターを用い以下のdTALEベクターを構築した。
 
以下の配列はTALEを構成するRVDを示す。
 
85F: NN NG HD NN NG HD HD NI HD NG HD NI NI NG (従来型)
85mF: NN NG HD NN NG HD HD NI HD NG HD NI NI NG (改変型(EA型))
85R: NN HD NG NG NN NG NN NG HD HD HD NI NG NG (従来型)
85mR: NN HD NG NG NN NG NN NG HD HD HD NI NG NG (改変型(EA型))
209F: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN (従来型)
209mF: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN (改変型(EA型))
209QF: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN (改変型(EQ型))
209R: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (従来型)
209mR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (改変型(EA型))
209QR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (改変型(EQ型))
209m-QR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (複合改変型(EA-EQ型)); 1-6番目のリピートモジュールがEA型、7番目以降がEQ型で構成される複合改変型
209Q-mR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (複合改変型(EA-EQ型)); 1-6番目のリピートモジュールがEQ型、7番目以降がEA型で構成される複合改変型
Based on the modified Golden gate method (Sakuma et. Al. 2013 Genes to Cells. 18 (4) p315) using the conventional plasmid and the plasmid mutated by the above method, pCS2-TALE-VP48 The following dTALE vector was constructed using the vector.

The following sequence shows the RVDs that make up TALE.

85F: NN NG HD NN NG HD HD NI HD NG HD NI NI NG (conventional)
85mF: NN NG HD NN NG HD HD NI HD NG HD NI NI NG (modified (EA))
85R: NN HD NG NG NN NG NN NG HD HD HD NI NG NG (conventional)
85mR: NN HD NG NG NN NG NN NG HD HD HD NI NG NG (modified (EA))
209F: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN (conventional)
209mF: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN (modified (EA))
209QF: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN (modified (EQ))
209R: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (conventional)
209mR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (modified (EA))
209QR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (modified (EQ))
209m-QR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (Composite modified type (EA-EQ type)); 1-6th repeat module is EA type, 7th and later are EQ type Composite modified type
209Q-mR: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG (Composite modified type (EA-EQ type)); 1-6th repeat module is configured as EQ type, 7th and later are configured as EA type Composite modified type
 pCS2ベクターに各TALEのターゲット配列x2を挿入し、その下流にminimal CMVプロモーター、FLucを挿入したレポーターベクターを構築した。ターゲット配列が85Fである場合のレポーターベクターpCS2-85Fx2-mCMV-FLucの配列を配列番号28に示している。
 これらとphRL-TKベクターをMDCK2培養細胞に共発現させ、各TALE配列のDNA結合活性をFLucの発光量として定量した。各シグナルは、レニラルシフェラーゼの発光量によって標準化した。(参考: Mussolino et. al. Nucleic Acids Res. 2011; 39(21): 9283., Cong et. al. Nat Commun. 2012;3:968)
ターゲット配列
85F: (T) GTCGTCCACTCAAT (配列番号17)
85R: (T) GCTTGTGTCCCATT (配列番号18)
209F: (T) CACCTTCGACACAGTG (配列番号19)
209R: (T) ACACATCCAGCTGTT (配列番号20)
Control: (T) CCCTATCAGTGATAGAGA (配列番号21)
A reporter vector was constructed in which the target sequence x2 of each TALE was inserted into the pCS2 vector, and a minimal CMV promoter and FLuc were inserted downstream thereof. The sequence of the reporter vector pCS2-85Fx2-mCMV-FLuc when the target sequence is 85F is shown in SEQ ID NO: 28.
These and the phRL-TK vector were co-expressed in MDCK2 cultured cells, and the DNA binding activity of each TALE sequence was quantified as the amount of luminescence of FLuc. Each signal was normalized by the amount of luminescence of Renilla luciferase. (Reference: Mussolino et. Al. Nucleic Acids Res. 2011; 39 (21): 9283., Cong et. Al. Nat Commun. 2012; 3: 968)
Target sequence
85F: (T) GTCGTCCACTCAAT (SEQ ID NO: 17)
85R: (T) GCTTGTGTCCCATT (SEQ ID NO: 18)
209F: (T) CACCTTCGACACAGTG (SEQ ID NO: 19)
209R: (T) ACACATCCAGCTGTT (SEQ ID NO: 20)
Control: (T) CCCTATCAGTGATAGAGA (SEQ ID NO: 21)
 結果を図7~10に示す。上記のdTALEとDNAの結合活性の測定実験において、EA型TALE配列の改変により、最大約2.5倍の特異的DNA配列への結合活性の上昇が認められた(レーン1と3の比較)。一方で、非特異的DNA配列への結合活性に大きな違いは認められなかった(レーン2と4の比較)。また、EQ型TALEは従来型に比べ特異的DNA配列への結合活性は低下した(図9,10のレーン1とレーン5の比較)。EA型とEQ型の複合型TALEは、EA型とEQ型の中間程度のDNA配列への結合活性を示した。
 以上の結果より、本実施例におけるTALE配列の特定部位に変異を導入することにより、標的DNA配列への結合活性を制御できることがわかった。
The results are shown in FIGS. In the above experiment for measuring the binding activity between dTALE and DNA, modification of the EA type TALE sequence resulted in an increase in binding activity to a specific DNA sequence up to about 2.5 times (comparison between lanes 1 and 3). On the other hand, there was no significant difference in the binding activity to nonspecific DNA sequences (comparison between lanes 2 and 4). In addition, the binding activity to specific DNA sequences of EQ type TALE decreased compared to the conventional type (comparison between lanes 1 and 5 in FIGS. 9 and 10). The combined TALE of the EA type and the EQ type showed a binding activity to a DNA sequence in the middle of the EA type and the EQ type.
From the above results, it was found that the binding activity to the target DNA sequence can be controlled by introducing a mutation into a specific site of the TALE sequence in this example.
実施例2:各DNA結合リピートの配列を改変した(4番目のアミノ酸をアスパラギン酸(D)からグルタミン酸(E)に、32番目のアミノ酸をアスパラギン酸(D)からアラニン(A)に改変)改変型TALENの作製、および、従来型TALENと改変型TALENとの活性の比較Example 2: Modification of the sequence of each DNA-binding repeat (Modification of the 4th amino acid from aspartic acid (D) to glutamic acid (E) and the 32nd amino acid from aspartic acid (D) to alanine (A)) Comparison of activity of conventional TALEN and modified TALEN
 ゼブラフィッシュの以下の特異的ゲノム配列を認識、切断する従来型TALENベクター(pCS2TAL3-DD、pCS2TAL3-RR)、および、改変型TALENベクターを構築した。これらのベクターは、Golden-GATE TALENの構築手法に則って、従来型TALEリピートで構成されるTALENおよび改変型TALEリピートで構成されるTALENを作製した。改変型TALENの作製には実施例1において変異を導入した各pFUSベクター、RVDベクターを使用した。ベクター構築に際しての実施例1との違いは、FokI機能ドメインが入ったままの未改変のpCS2TAL3-DD、pCS2TAL3-RRをバックボーンとして用いた点であった。
 即ち、先ずTALENベクターpCS2TAL3-DD、pCS2TAL3-RRを用いて、ゼブラフィッシュの以下の特異的ゲノム配列に対応する従来型TALEリピートで構成されるTALEN、および改変型TALEリピートで構成されるTALENを構築した。
 次いで、これらのベクターおよびmMESSAGE mMACHINE (SP6)を用いて、それぞれのRNAを合成した。Reverse、Forwardの各TALENペアのRNAを各約400pgずつゼブラフィッシュの初期胚に微量注入した。24時間後に、胚を回収し、heteroduplex mobility assay (HMA)によりTALENの活性を評価し、従来型と改変型を比較した。(Ota et. al. Genes to Cells. 2013; 18(6): 450)
TALEN1: 209 (Kif3A)
  For. TALEN: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN
  Rev. TALEN: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG
ターゲットゲノム配列
  T CACCTTCGACACAGTG ttcggcccagacagta AACAGCTGGATGTGT A (配列番号22)
HMAに使用したプライマーペア
  For.: TGATATAAGCAGTGAGCCTCCA (配列番号23)
  Rev.: CAGAGTCTATGATGGGTCGTG (配列番号24)
 
TALEN2: S1PR3a-1
  For. TALEN: NI HD NI NI HD HD NI HD NG HD NI NN NN HD NI 
  Rev. TALEN: NI HD NI HD NI NG NI HD HD NI NN NG NN HD NG NG HD 
ターゲットゲノム配列
  T ACAACCACTCAGGCA agtggggaagaccaa GAAGCACTGGTATGTGT A (配列番号25)
HMAに使用したプライマーペア
  For: GGAATGAATGATGTTATAGTTAGCC (配列番号26)
  Rev: GTAATGTTCTCAATCACGATCAGAG (配列番号27)
Conventional TALEN vectors (pCS2TAL3-DD and pCS2TAL3-RR) that recognize and cleave the following specific genomic sequences of zebrafish and modified TALEN vectors were constructed. These vectors produced TALEN composed of conventional TALE repeats and TALEN composed of modified TALE repeats in accordance with the Golden-GATE TALEN construction method. For the production of modified TALEN, each pFUS vector and RVD vector into which mutations were introduced in Example 1 were used. The difference from Example 1 in constructing the vector was that unmodified pCS2TAL3-DD and pCS2TAL3-RR that contained the FokI functional domain were used as the backbone.
That is, TALEN vectors pCS2TAL3-DD and pCS2TAL3-RR are used to construct TALEN composed of conventional TALE repeats and TALEN composed of modified TALE repeats corresponding to the following specific genomic sequences of zebrafish: did.
Subsequently, each RNA was synthesized using these vectors and mMESSAGE mMACHINE (SP6). About 400pg each of reverse and forward TALEN pair RNA was injected into the early embryo of zebrafish. After 24 hours, the embryos were collected, and the activity of TALEN was evaluated by heteroduplex mobility assay (HMA), and the conventional type and the modified type were compared. (Ota et. Al. Genes to Cells. 2013; 18 (6): 450)
TALEN1: 209 (Kif3A)
For. TALEN: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN
Rev. TALEN: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG
Target genome sequence T CACCTTCGACACAGTG ttcggcccagacagta AACAGCTGGATGTGT A (SEQ ID NO: 22)
Primer pair used for HMA For .: TGATATAAGCAGTGAGCCTCCA (SEQ ID NO: 23)
Rev .: CAGAGTCTATGATGGGTCGTG (SEQ ID NO: 24)

TALEN2: S1PR3a-1
For. TALEN: NI HD NI NI HD HD NI HD NG HD NI NN NN HD NI
Rev. TALEN: NI HD NI HD NI NG NI HD HD NI NN NG NN HD NG NG HD
Target genome sequence T ACAACCACTCAGGCA agtggggaagaccaa GAAGCACTGGTATGTGT A (SEQ ID NO: 25)
Primer pair used for HMA For: GGAATGAATGATGTTATAGTTAGCC (SEQ ID NO: 26)
Rev: GTAATGTTCTCAATCACGATCAGAG (SEQ ID NO: 27)
 結果を図11に示す。上記2例において、TALE配列の改変によりTALEN活性は大幅に上昇した。 The results are shown in FIG. In the above two cases, TALEN activity was significantly increased by modification of the TALE sequence.
実施例3:発現・精製した従来型および改変型TALEN蛋白質の、in vitroにおける特異的DNA切断活性の測定と比較Example 3: Measurement and comparison of specific DNA cleavage activity of expressed and purified conventional and modified TALEN proteins in vitro
 以下のRVD配列を有する従来型および改変型(各DNA結合リピートにおいて、4番目のアミノ酸がアスパラギン酸(D)からグルタミン酸(E)に、32番目のアミノ酸がアスパラギン酸(D)からアラニン(A)に改変されている)TALEN (pCS2-TAF)をpET21bにサブクローニングし、BL21株において発現させ、コバルトレジンを用いて精製した。精製したTALEN蛋白質を下記条件下において標的DNA配列を含む約1400bpのDNAフラグメントと反応させ、切断活性を測定した。
TALEN蛋白質: 209 (Kif3A)
  For. : HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN
  Rev. : NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG
反応条件: 20mM Tris-acetate, 10mM magnesium acetate, 50mM potassium acetate, 1mMDTT, 100μg/ml BSA(bovine serum albumin), 37℃
TALEN濃度 27nM, DNA濃度27nM (ただしレーン1-3は、13.5nM, 27nM, 54nM)
Conventional and modified types having the following RVD sequences (in each DNA binding repeat, the fourth amino acid is from aspartic acid (D) to glutamic acid (E), and the 32nd amino acid is from aspartic acid (D) to alanine (A) TALEN (pCS2-TAF), which has been modified to), was subcloned into pET21b, expressed in the BL21 strain, and purified using cobalt resin. The purified TALEN protein was reacted with an approximately 1400 bp DNA fragment containing the target DNA sequence under the following conditions, and the cleavage activity was measured.
TALEN protein: 209 (Kif3A)
For .: HD NI HD HD NG NG HD NN NI HD NI HD NI NN NG NN
Rev.: NI HD NI HD NI NG HD HD NI NN HD NG NN NG NG
Reaction conditions: 20 mM Tris-acetate, 10 mM magnesium acetate, 50 mM potassium acetate, 1 mM DTT, 100 μg / ml BSA (bovine serum albumin), 37 ° C
TALEN concentration 27nM, DNA concentration 27nM (However, Lanes 1-3 are 13.5nM, 27nM, 54nM)
 結果を図12および13に示す。上記2例において、従来型TALENに比べ、改変型TALENの切断活性が上昇していることが認められた。 The results are shown in Figs. In the above two cases, it was confirmed that the cleavage activity of the modified TALEN was increased compared to the conventional TALEN.
実施例4:更なる改変型TALEの作製、および、従来型TALEと改変型TALEとの特異的DNA配列に対する結合活性の比較Example 4: Production of further modified TALE and comparison of binding activity to specific DNA sequences of conventional TALE and modified TALE
 以上の結果に基づいて更に検討を行い、新たな改変型TALEを作製して、標的DNA配列に対する結合活性の解析を行った。新たに作製した改変型TALEとしては、中でも特に、全リピートモジュールの4番目のアミノ酸残基をグルタミン(Q)、32番目のアミノ酸残基をアラニン(A)に改変したQA型、ならびに、一部のリピートのみを従来型にしたもの、2~4種類の異なる型を混合したものが含まれる。QA型のリピートは、campestrisやcitriなどの天然TALEに認められる。今回の解析により、QA型もEA型と同程度以上に高活性であること、全モジュール中に高活性型が一定以上の割合で含まれれば高い活性を示すことが実証された。
 新たな改変型TALEの作製は、実施例1と同様の手法により行った。より具体的には以下の通りである。
Based on the above results, further studies were made, a new modified TALE was prepared, and the binding activity to the target DNA sequence was analyzed. Among the newly created modified TALE, in particular, the QA type in which the 4th amino acid residue of all repeat modules is modified to glutamine (Q) and the 32nd amino acid residue is alanine (A), and partly This includes the conventional type of repeats only, and a mixture of 2 to 4 different types. QA-type repeats are found in natural TALEs such as campestris and citri. This analysis demonstrates that QA type is also as highly active as EA type, and that it exhibits high activity if all modules contain a high activity type at a certain rate.
A new modified TALE was produced in the same manner as in Example 1. More specifically, it is as follows.
1. Golden gate plasmidベクターへの変異導入
 Golden gate plasmidベクターへの変異導入は実施例1と同様の手法を用いて行った。導入した変異と、そのために用いたプライマーやプラスミドを以下に示す。
1. Mutation Introduction into Golden Gate Plasmid Vector Mutation introduction into the Golden gate plasmid vector was performed using the same method as in Example 1. The introduced mutations and the primers and plasmids used for the mutations are shown below.
(変異導入例4-1)4A変異導入
 
4番目のアミノ酸の変異導入(アミノ酸をアスパラギン酸(D)からアラニン(A)に改変)に用いたプライマー
 
CCTGACCCCGGCCCAAGTGGTGGCTAT  (4DA-1F)(配列番号30)
CCTGACTCCGGCCCAAGTGGTGGCTAT  (4DA-2F) (配列番号31)
 
これらのプライマーによって変異を導入したプラスミド
(4DA-1F): pFUS_A2A, pFUS_A2B, pFUS_B1-6, pNN2-6, pNG2-6, pNI2-6
(4DA-2F): pHD2-6
(Mutation example 4-1) 4A mutagenesis
Primer used for mutation introduction of the 4th amino acid (amino acid is changed from aspartic acid (D) to alanine (A))
CCTGACCCCGGCCCAAGTGGTGGCTAT (4DA-1F) (SEQ ID NO: 30)
CCTGACTCCGGCCCAAGTGGTGGCTAT (4DA-2F) (SEQ ID NO: 31)

Plasmid with mutations introduced by these primers
(4DA-1F): pFUS_A2A, pFUS_A2B, pFUS_B1-6, pNN2-6, pNG2-6, pNI2-6
(4DA-2F): pHD2-6
(変異導入例4-2)4Q32A変異導入
 
4番目のアミノ酸の変異導入(アミノ酸をアスパラギン酸(D)からグルタミン(Q)に改変)に用いたプライマー
 
CCTGACCCCGCAACAAGTGGTGGCTAT  (4DQ-1F)(配列番号32)
CCTGACTCCGCAACAAGTGGTGGCTAT  (4DQ-2F) (配列番号33)
 
これらのプライマーによって変異を導入したプラスミド
(4DQ-1F): pFUS_A2A, pFUS_A2B, pFUS_B1-6, pNN2-6, pNG2-6, pNI2-6
(4DQ-2F): pHD2-6
 
32番目のアミノ酸の変異導入(アスパラギン酸(D)からアラニン(A)に改変)に用いたプライマー
GTGCTGTGCCAGGCCCATGGCCTGAC  (32DA-1F) (配列番号4)
GGTCTCAGGCCCATGGCCTGAC  (32DA-2F) (配列番号5)
GGTCTCGCCAGGCCCATGGCCTGAC  (32DA-3F) (配列番号6)
GTGCTGTGCCAGGCCCATGGGAGACCC  (32DA-4F) (配列番号7)
GTGCTGTGCCAGGCCCATGGCCGAGAC  (32DA-5F) (配列番号8)
GTGCTGTGCCAGGCCCGAGACCCTCG  (32DA-6F) (配列番号9)
 
これらのプライマーによって変異を導入したプラスミド
(32DA-1F): pHD5-6, pNN5-6, pNI5-6, pNG5-6, pFUS_B4-6, pFUS_A2A
(32DA-2F): pHD3, pNN3, pNI3, pNG3, pFUS_B2
(32DA-3F): pHD4, pNN4, pNI4, pNG4, pFUS_B3
(32DA-4F): pHD1, pNN1, pNI1, pNG1
(32DA-5F): pFUS_A2B
(32DA-6F): pHD2, pNN2, pNI2, pNG2
(Mutation example 4-2) 4Q32A mutation introduction
Primer used for mutation introduction of the 4th amino acid (amino acid was changed from aspartic acid (D) to glutamine (Q))
CCTGACCCCGCAACAAGTGGTGGCTAT (4DQ-1F) (SEQ ID NO: 32)
CCTGACTCCGCAACAAGTGGTGGCTAT (4DQ-2F) (SEQ ID NO: 33)

Plasmid with mutations introduced by these primers
(4DQ-1F): pFUS_A2A, pFUS_A2B, pFUS_B1-6, pNN2-6, pNG2-6, pNI2-6
(4DQ-2F): pHD2-6

Primer used for mutagenesis of the 32nd amino acid (modified from aspartic acid (D) to alanine (A))
GTGCTGTGCCAGGCCCATGGCCTGAC (32DA-1F) (SEQ ID NO: 4)
GGTCTCAGGCCCATGGCCTGAC (32DA-2F) (SEQ ID NO: 5)
GGTCTCGCCAGGCCCATGGCCTGAC (32DA-3F) (SEQ ID NO: 6)
GTGCTGTGCCAGGCCCATGGGAGACCC (32DA-4F) (SEQ ID NO: 7)
GTGCTGTGCCAGGCCCATGGCCGAGAC (32DA-5F) (SEQ ID NO: 8)
GTGCTGTGCCAGGCCCGAGACCCTCG (32DA-6F) (SEQ ID NO: 9)

Plasmid with mutations introduced by these primers
(32DA-1F): pHD5-6, pNN5-6, pNI5-6, pNG5-6, pFUS_B4-6, pFUS_A2A
(32DA-2F): pHD3, pNN3, pNI3, pNG3, pFUS_B2
(32DA-3F): pHD4, pNN4, pNI4, pNG4, pFUS_B3
(32DA-4F): pHD1, pNN1, pNI1, pNG1
(32DA-5F): pFUS_A2B
(32DA-6F): pHD2, pNN2, pNI2, pNG2
2. dTALE構築
 dTALEベクターの構築についても実施例1と同様の手法により行った。今回の解析のために用いたdTALEのリピートモジュールの構成を以下に示す。その際に使用された各記号は以下の通りの配列を示す。
DD: 従来型(4番目D、32番目D)
4E: 4番目E、その他は従来型
4A: 4番目A、その他は従来型
EA: 4番目E、32番目A、その他は従来型
QA: 4番目Q、32番目A、その他は従来型
EQ: 31番目E、32番目Q、その他は従来型
DA: 32番目A、その他は従来型
4D: 従来型(4番目D(最後のハーフリピートは32番目のアミノ酸残基は含まない))
 また、括弧内はTALEを構成するRVDを示す。
 
85F: DD(NN) DD(NG) DD(HD) DD(NN) DD(NG) DD(HD) DD(HD) DD(NI) DD(HD) DD(NG) DD(HD) DD(NI) DD(NI) 4D(NG) (従来型)
85mF: EA(NN) EA(NG) EA(HD) EA(NN) EA(NG) EA(HD) EA(HD) EA(NI) EA(HD) EA(NG) EA(HD) EA(NI) EA(NI) 4E(NG) (改変型(EA型))
85pmF: EA(NN) EA(NG) EA(HD) EA(NN) EA(NG) EA(HD) EA(HD) EA(NI) EA(HD) EA(NG) EA(HD) EA(NI) DA(NI) 4D(NG) (改変型(EA型))
85m2F: QA(NN) QA(NG) QA(HD) QA(NN) QA(NG) QA(HD) QA(HD) QA(NI) QA(HD) QA(NG) QA(HD) QA(NI) QA(NI) 4Q(NG) (改変型(QA型))
85R: DD(NN) DD(HD) DD(NG) DD(NG) DD(NN) DD(NG) DD(NN) DD(NG) DD(HD) DD(HD) DD(HD) DD(NI) DD(NG) 4D(NG) (従来型)
85mR: EA(NN) EA(HD) EA(NG) EA(NG) EA(NN) EA(NG) EA(NN) EA(NG) EA(HD) EA(HD) EA(HD) EA(NI) EA(NG) 4E(NG) (改変型(EA型))
85pmR: EA(NN) EA(HD) EA(NG) EA(NG) EA(NN) EA(NG) EA(NN) EA(NG) EA(HD) EA(HD) EA(HD) EA(NI) DA(NG) 4D(NG) (改変型(EA型))
85m2R: QA(NN) QA(HD) QA(NG) QA(NG) QA(NN) QA(NG) QA(NN) QA(NG) QA(HD) QA(HD) QA(HD) QA(NI) QA(NG) 4Q(NG) (改変型(QA型))
209F: DD(HD) DD(NI) DD(HD) DD(HD) DD(NG) DD(NG) DD(HD) DD(NN) DD(NI) DD(HD) DD(NI) DD(HD) DD(NI) DD(NN) DD(NG) 4D(NN) (従来型)
209mF: EA(HD) EA(NI) EA(HD) EA(HD) EA(NG) EA(NG) EA(HD) EA(NN) EA(NI) EA(HD) EA(NI) EA(HD) EA(NI) EA(NN) EA(NG) 4E(NN) (改変型(EA型))
209m2F: QA(HD) QA(NI) QA(HD) QA(HD) QA(NG) QA(NG) QA(HD) QA(NN) QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NN) QA(NG) 4Q(NN) (改変型(QA型))
S1PR3F: DD(NI) DD(HD) DD(NI) DD(NI) DD(HD) DD(HD) DD(NI) DD(HD) DD(NG) DD(HD) DD(NI) DD(NN) DD(NN) DD(HD) 4D(NI) (従来型)
S1PR3mF: EA(NI) EA(HD) EA(NI) EA(NI) EA(HD) EA(HD) EA(NI) EA(HD) EA(NG) EA(HD) EA(NI) EA(NN) EA(NN) EA(HD) 4E(NI) (改変型(EA型))
S1PR3m2F: QA(NI) QA(HD) QA(NI) QA(NI) QA(HD) QA(HD) QA(NI) QA(HD) QA(NG) QA(HD) QA(NI) QA(NN) QA(NN) QA(HD) 4Q(NI) (改変型(QA型))
S1PR3R: DD(NI) DD(HD) DD(NI) DD(HD) DD(NI) DD(NG) DD(NI) DD(HD) DD(HD) DD(NI) DD(NN) DD(NG) DD(NN) DD(HD) DD(NG) DD(NG) 4D(HD) (従来型)
S1PR3mR: EA(NI) EA(HD) EA(NI) EA(HD) EA(NI) EA(NG) EA(NI) EA(HD) EA(HD) EA(NI) EA(NN) EA(NG) EA(NN) EA(HD) EA(NG) EA(NG) 4E(HD) (改変型(EA型))
S1PR3m2R: QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NG) QA(NI) QA(HD) QA(HD) QA(NI) QA(NN) QA(NG) QA(NN) QA(HD) QA(NG) QA(NG) 4Q(HD) (改変型(QA型))
SphkF: DD(HD) DD(NI) DD(NN) DD(NI) DD(NI) DD(NG) DD(HD) DD(NI) DD(HD) DD(NN) DD(HD) DD(HD) DD(HD) DD(NN) DD(NI) 4D(NN) (従来型)
SphkmF: EA(HD) EA(NI) EA(NN) EA(NI) EA(NI) EA(NG) EA(HD) EA(NI) EA(HD) EA(NN) EA(HD) EA(HD) EA(HD) EA(NN) EA(NI) 4E(NN) (改変型(EA型))
SphkpmF: EA(HD) EA(NI) EA(NN) EA(NI) EA(NI) EA(NG) EA(HD) EA(NI) EA(HD) EA(NN) EA(HD) EA(HD) DA(HD) EA(NN) EA(NI) 4D(NN) (改変型(不完全EA型))
Sphkm2F: QA(HD) QA(NI) QA(NN) QA(NI) QA(NI) QA(NG) QA(HD) QA(NI) QA(HD) QA(NN) QA(HD) QA(HD) QA(HD) QA(NN) QA(NI) 4Q(NN) (改変型(QA型))
SphkR: DD(HD) DD(HD) DD(HD) DD(NI) DD(HD) DD(NG) DD(NN) DD(HD) DD(NN) DD(NI) DD(HD) DD(NI) DD(NN) DD(NN) DD(NG) DD(HD) DD(NG) 4D(NN) (従来型)
SphkmR: EA(HD) EA(HD) EA(HD) EA(NI) EA(HD) EA(NG) EA(NN) EA(HD) EA(NN) EA(NI) EA(HD) EA(NI) EA(NN) EA(NN) EA(NG) EA(HD) EA(NG) 4E(NN) (改変型(EA型))
Sphkm2R: QA(HD) QA(HD) QA(HD) QA(NI) QA(HD) QA(NG) QA(NN) QA(HD) QA(NN) QA(NI) QA(HD) QA(NI) QA(NN) QA(NN) QA(NG) QA(HD) QA(NG) 4Q(NN) (改変型(QA型))
CG16798F: DD(NN) DD(NN) DD(HD) DD(HD) DD(NG) DD(NN) DD(NG) DD(HD) DD(NI) DD(NN) DD(HD) DD(NN) DD(NI) DD(HD) DD(NI) 4D(NI) (従来型)
CG16798mF: EA(NN) EA(NN) EA(HD) EA(HD) EA(NG) EA(NN) EA(NG) EA(HD) EA(NI) EA(NN) EA(HD) EA(NN) EA(NI) EA(HD) EA(NI) 4E(NI) (改変型(EA型))
CG16798m2F: QA(NN) QA(NN) QA(HD) QA(HD) QA(NG) QA(NN) QA(NG) QA(HD) QA(NI) QA(NN) QA(HD) QA(NN) QA(NI) QA(HD) QA(NI) 4Q(NI) (改変型(QA型))
CG16798R: DD(NG) DD(NG) DD(HD) DD(NI) DD(HD) DD(NI) DD(NI) DD(NN) DD(NG) DD(NG) DD(NG) DD(NI) DD(NG) DD(NN) DD(NN) DD(NN) DD(HD) 4D(NI) (従来型)
CG16798mR: EA(NG) EA(NG) EA(HD) EA(NI) EA(HD) EA(NI) EA(NI) EA(NN) EA(NG) EA(NG) EA(NG) EA(NI) EA(NG) EA(NN) EA(NN) EA(NN) EA(HD) 4E(NI) (改変型(EA型))
CG16798m2R: QA(NG) QA(NG) QA(HD) QA(NI) QA(HD) QA(NI) QA(NI) QA(NN) QA(NG) QA(NG) QA(NG) QA(NI) QA(NG) QA(NN) QA(NN) QA(NN) QA(HD) 4Q(NI) (改変型(QA型))
209R: DD(NI) DD(HD) DD(NI) DD(HD) DD(NI) DD(NG) DD(HD) DD(HD) DD(NI) DD(NN) DD(HD) DD(NG) DD(NN) DD(NG) 4D(NG) (従来型)
209mR: EA(NI) EA(HD) EA(NI) EA(HD) EA(NI) EA(NG) EA(HD) EA(HD) EA(NI) EA(NN) EA(HD) EA(NG) EA(NN) EA(NG) 4E(NG) (改変型(EA型))
209m2R: QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NG) QA(HD) QA(HD) QA(NI) QA(NN) QA(HD) QA(NG) QA(NN) QA(NG) 4Q(NG) (改変型(QA型))
209m3R: EA(NI) QA(HD) EA(NI) QA(HD) EA(NI) QA(NG) EA(HD) QA(HD) EA(NI) QA(NN) EA(HD) QA(NG) EA(NN) QA(NG) 4E(NG) (複合改変型(EA-QA型))
2. Construction of dTALE The construction of the dTALE vector was also performed in the same manner as in Example 1. The configuration of the dTALE repeat module used for this analysis is shown below. Each symbol used in that case has the following sequence.
DD: Conventional type (4th D, 32nd D)
4E: 4th E, others are conventional
4A: 4th A, others are conventional
EA: 4th E, 32nd A, others are conventional
QA: 4th Q, 32nd A, others are conventional
EQ: 31st E, 32nd Q, etc.
DA: 32nd A, others are conventional
4D: Conventional (4th D (the last half repeat does not include the 32nd amino acid residue))
The parentheses indicate the RVDs that make up the TALE.

85F: DD (NN) DD (NG) DD (HD) DD (NN) DD (NG) DD (HD) DD (HD) DD (NI) DD (HD) DD (NG) DD (HD) DD (NI) DD (NI) 4D (NG) (Conventional)
85mF: EA (NN) EA (NG) EA (HD) EA (NN) EA (NG) EA (HD) EA (HD) EA (NI) EA (HD) EA (NG) EA (HD) EA (NI) EA (NI) 4E (NG) (modified (EA))
85pmF: EA (NN) EA (NG) EA (HD) EA (NN) EA (NG) EA (HD) EA (HD) EA (NI) EA (HD) EA (NG) EA (HD) EA (NI) DA (NI) 4D (NG) (modified (EA))
85m2F: QA (NN) QA (NG) QA (HD) QA (NN) QA (NG) QA (HD) QA (HD) QA (NI) QA (HD) QA (NG) QA (HD) QA (NI) QA (NI) 4Q (NG) (Modified type (QA type))
85R: DD (NN) DD (HD) DD (NG) DD (NG) DD (NN) DD (NG) DD (NN) DD (NG) DD (HD) DD (HD) DD (HD) DD (NI) DD (NG) 4D (NG) (Conventional)
85mR: EA (NN) EA (HD) EA (NG) EA (NG) EA (NN) EA (NG) EA (NN) EA (NG) EA (HD) EA (HD) EA (HD) EA (NI) EA (NG) 4E (NG) (Modified type (EA type))
85pmR: EA (NN) EA (HD) EA (NG) EA (NG) EA (NN) EA (NG) EA (NN) EA (NG) EA (HD) EA (HD) EA (HD) EA (NI) DA (NG) 4D (NG) (modified (EA))
85m2R: QA (NN) QA (HD) QA (NG) QA (NG) QA (NN) QA (NG) QA (NN) QA (NG) QA (HD) QA (HD) QA (HD) QA (NI) QA (NG) 4Q (NG) (Modified type (QA type))
209F: DD (HD) DD (NI) DD (HD) DD (HD) DD (NG) DD (NG) DD (HD) DD (NN) DD (NI) DD (HD) DD (NI) DD (HD) DD (NI) DD (NN) DD (NG) 4D (NN) (Conventional)
209mF: EA (HD) EA (NI) EA (HD) EA (HD) EA (NG) EA (NG) EA (HD) EA (NN) EA (NI) EA (HD) EA (NI) EA (HD) EA (NI) EA (NN) EA (NG) 4E (NN) (Modified type (EA type))
209m2F: QA (HD) QA (NI) QA (HD) QA (HD) QA (NG) QA (NG) QA (HD) QA (NN) QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NN) QA (NG) 4Q (NN) (Modified type (QA type))
S1PR3F: DD (NI) DD (HD) DD (NI) DD (NI) DD (HD) DD (HD) DD (NI) DD (HD) DD (NG) DD (HD) DD (NI) DD (NN) DD (NN) DD (HD) 4D (NI) (conventional)
S1PR3mF: EA (NI) EA (HD) EA (NI) EA (NI) EA (HD) EA (HD) EA (NI) EA (HD) EA (NG) EA (HD) EA (NI) EA (NN) EA (NN) EA (HD) 4E (NI) (Modified type (EA type))
S1PR3m2F: QA (NI) QA (HD) QA (NI) QA (NI) QA (HD) QA (HD) QA (NI) QA (HD) QA (NG) QA (HD) QA (NI) QA (NN) QA (NN) QA (HD) 4Q (NI) (Modified type (QA type))
S1PR3R: DD (NI) DD (HD) DD (NI) DD (HD) DD (NI) DD (NG) DD (NI) DD (HD) DD (HD) DD (NI) DD (NN) DD (NG) DD (NN) DD (HD) DD (NG) DD (NG) 4D (HD) (Conventional)
S1PR3mR: EA (NI) EA (HD) EA (NI) EA (HD) EA (NI) EA (NG) EA (NI) EA (HD) EA (HD) EA (NI) EA (NN) EA (NG) EA (NN) EA (HD) EA (NG) EA (NG) 4E (HD) (Modified type (EA type))
S1PR3m2R: QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NG) QA (NI) QA (HD) QA (HD) QA (NI) QA (NN) QA (NG) QA (NN) QA (HD) QA (NG) QA (NG) 4Q (HD) (modified (QA))
SphkF: DD (HD) DD (NI) DD (NN) DD (NI) DD (NI) DD (NG) DD (HD) DD (NI) DD (HD) DD (NN) DD (HD) DD (HD) DD (HD) DD (NN) DD (NI) 4D (NN) (conventional)
SphkmF: EA (HD) EA (NI) EA (NN) EA (NI) EA (NI) EA (NG) EA (HD) EA (NI) EA (HD) EA (NN) EA (HD) EA (HD) EA (HD) EA (NN) EA (NI) 4E (NN) (Modified type (EA type))
SphkpmF: EA (HD) EA (NI) EA (NN) EA (NI) EA (NI) EA (NG) EA (HD) EA (NI) EA (HD) EA (NN) EA (HD) EA (HD) DA (HD) EA (NN) EA (NI) 4D (NN) (modified (incomplete EA))
Sphkm2F: QA (HD) QA (NI) QA (NN) QA (NI) QA (NI) QA (NG) QA (HD) QA (NI) QA (HD) QA (NN) QA (HD) QA (HD) QA (HD) QA (NN) QA (NI) 4Q (NN) (Modified type (QA type))
SphkR: DD (HD) DD (HD) DD (HD) DD (NI) DD (HD) DD (NG) DD (NN) DD (HD) DD (NN) DD (NI) DD (HD) DD (NI) DD (NN) DD (NN) DD (NG) DD (HD) DD (NG) 4D (NN) (Conventional)
SphkmR: EA (HD) EA (HD) EA (HD) EA (NI) EA (HD) EA (NG) EA (NN) EA (HD) EA (NN) EA (NI) EA (HD) EA (NI) EA (NN) EA (NN) EA (NG) EA (HD) EA (NG) 4E (NN) (modified type (EA type))
Sphkm2R: QA (HD) QA (HD) QA (HD) QA (NI) QA (HD) QA (NG) QA (NN) QA (HD) QA (NN) QA (NI) QA (HD) QA (NI) QA (NN) QA (NN) QA (NG) QA (HD) QA (NG) 4Q (NN) (modified type (QA type))
CG16798F: DD (NN) DD (NN) DD (HD) DD (HD) DD (NG) DD (NN) DD (NG) DD (HD) DD (NI) DD (NN) DD (HD) DD (NN) DD (NI) DD (HD) DD (NI) 4D (NI) (conventional)
CG16798mF: EA (NN) EA (NN) EA (HD) EA (HD) EA (NG) EA (NN) EA (NG) EA (HD) EA (NI) EA (NN) EA (HD) EA (NN) EA (NI) EA (HD) EA (NI) 4E (NI) (Modified type (EA type))
CG16798m2F: QA (NN) QA (NN) QA (HD) QA (HD) QA (NG) QA (NN) QA (NG) QA (HD) QA (NI) QA (NN) QA (HD) QA (NN) QA (NI) QA (HD) QA (NI) 4Q (NI) (Modified type (QA type))
CG16798R: DD (NG) DD (NG) DD (HD) DD (NI) DD (HD) DD (NI) DD (NI) DD (NN) DD (NG) DD (NG) DD (NG) DD (NI) DD (NG) DD (NN) DD (NN) DD (NN) DD (HD) 4D (NI) (Conventional)
CG16798mR: EA (NG) EA (NG) EA (HD) EA (NI) EA (HD) EA (NI) EA (NI) EA (NN) EA (NG) EA (NG) EA (NG) EA (NI) EA (NG) EA (NN) EA (NN) EA (NN) EA (HD) 4E (NI) (modified type (EA type))
CG16798m2R: QA (NG) QA (NG) QA (HD) QA (NI) QA (HD) QA (NI) QA (NI) QA (NN) QA (NG) QA (NG) QA (NG) QA (NI) QA (NG) QA (NN) QA (NN) QA (NN) QA (HD) 4Q (NI) (modified (QA type))
209R: DD (NI) DD (HD) DD (NI) DD (HD) DD (NI) DD (NG) DD (HD) DD (HD) DD (NI) DD (NN) DD (HD) DD (NG) DD (NN) DD (NG) 4D (NG) (Conventional)
209mR: EA (NI) EA (HD) EA (NI) EA (HD) EA (NI) EA (NG) EA (HD) EA (HD) EA (NI) EA (NN) EA (HD) EA (NG) EA (NN) EA (NG) 4E (NG) (modified type (EA type))
209m2R: QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NG) QA (HD) QA (HD) QA (NI) QA (NN) QA (HD) QA (NG) QA (NN) QA (NG) 4Q (NG) (Modified type (QA type))
209m3R: EA (NI) QA (HD) EA (NI) QA (HD) EA (NI) QA (NG) EA (HD) QA (HD) EA (NI) QA (NN) EA (HD) QA (NG) EA (NN) QA (NG) 4E (NG) (Composite modified type (EA-QA type))
3. ターゲットルシフェラーゼベクターの構築
 ターゲットルシフェラーゼベクターの構築も実施例1と同様の手法により行った。
 実施例1と同様に、これらとphRL-TKベクターをMDCK2培養細胞に共発現させ、各TALE配列のDNA結合活性をFLucの発光量として定量した。各シグナルは、レニラルシフェラーゼの発光量によって標準化した。(参考: Mussolino et. al. Nucleic Acids Res. 2011; 39(21): 9283., Cong et. al. Nat Commun. 2012;3:968)
ターゲット配列
85F: (T) GTCGTCCACTCAAT (配列番号17)
85R: (T) GCTTGTGTCCCATT (配列番号18)
209F: (T) CACCTTCGACACAGTG (配列番号19)
209R: (T) ACACATCCAGCTGTT (配列番号20)
S1PR3F: (T) ACAACCACTCAGGCA (配列番号34)
S1PR3R: (T) ACACATACCAGTGCTTC (配列番号35)
SphkF: (T) CAGAATCACGCCCGAG (配列番号36)
SphkR: (T) CCCACTGCGACAGGTCTG (配列番号37)
CG16798F: (T) GGCCTGTCAGCGACAA (配列番号38)
CG16798R: (T) TTCACAAGTTTATGGGCA (配列番号39)
TRE: (T) CCCTATCAGTGATAGAGA (配列番号21)
3. Construction of target luciferase vector The construction of the target luciferase vector was performed in the same manner as in Example 1.
In the same manner as in Example 1, these and the phRL-TK vector were coexpressed in MDCK2 cultured cells, and the DNA binding activity of each TALE sequence was quantified as the amount of luminescence of FLuc. Each signal was normalized by the amount of luminescence of Renilla luciferase. (Reference: Mussolino et. Al. Nucleic Acids Res. 2011; 39 (21): 9283., Cong et. Al. Nat Commun. 2012; 3: 968)
Target sequence
85F: (T) GTCGTCCACTCAAT (SEQ ID NO: 17)
85R: (T) GCTTGTGTCCCATT (SEQ ID NO: 18)
209F: (T) CACCTTCGACACAGTG (SEQ ID NO: 19)
209R: (T) ACACATCCAGCTGTT (SEQ ID NO: 20)
S1PR3F: (T) ACAACCACTCAGGCA (SEQ ID NO: 34)
S1PR3R: (T) ACACATACCAGTGCTTC (SEQ ID NO: 35)
SphkF: (T) CAGAATCACGCCCGAG (SEQ ID NO: 36)
SphkR: (T) CCCACTGCGACAGGTCTG (SEQ ID NO: 37)
CG16798F: (T) GGCCTGTCAGCGACAA (SEQ ID NO: 38)
CG16798R: (T) TTCACAAGTTTATGGGCA (SEQ ID NO: 39)
TRE: (T) CCCTATCAGTGATAGAGA (SEQ ID NO: 21)
 結果を図14-25に示す。上記のdTALEとDNAの結合活性の測定実験において、EA型TALE配列の改変により、最大約7倍の特異的DNA配列への結合活性の上昇が認められた。また、QA型TALE配列の改変により、最大で10倍以上の特異的DNA配列への結合活性の上昇が認められた。一方で、非特異的DNA配列への結合活性に大きな違いは認められなかった(図14-16、24、25)。また、C末側のリピートモジュールに一部従来型を含む不完全EA改変型は、EA型と同程度の特異的DNA結合能を示した(図19、24、25)。
 以上の結果より、本実施例におけるTALE配列の特定部位に変異を導入することにより、標的DNA配列への結合活性を制御できることがわかった。
The results are shown in Fig. 14-25. In the measurement experiment of the above-mentioned dTALE-DNA binding activity, up to about 7-fold increase in binding activity to a specific DNA sequence was observed by modification of the EA type TALE sequence. In addition, the modification of the QA type TALE sequence showed an increase in binding activity to a specific DNA sequence of up to 10 times or more. On the other hand, there was no significant difference in the binding activity to non-specific DNA sequences (FIGS. 14-16, 24, 25). In addition, the incomplete EA modified type, which partially includes the conventional type in the C-terminal repeat module, showed a specific DNA binding ability comparable to that of the EA type (FIGS. 19, 24, and 25).
From the above results, it was found that the binding activity to the target DNA sequence can be controlled by introducing a mutation into a specific site of the TALE sequence in this example.
実施例5:dTALEの非特異的DNA結合活性の測定
 標的配列からわずかに異なる非標的配列へのdTALEの結合活性の測定を行い、結合の特異性について検討した。
 実施例4において変異導入したプラスミドと構築したdTALEを一部共通に用い、更にいくつかの改変型dTALEを構築し、実施例1と同様の手法により以下の測定を行った。従来型を含む各種改変型dTALEと1~3塩基でミスマッチが生じるように設計したターゲットDNA配列を用い、各dTALEの段階的な非特異的DNA結合活性を定量し、比較した。
Example 5: Measurement of non-specific DNA binding activity of dTALE The binding activity of dTALE from a target sequence to a slightly different non-target sequence was measured to examine the specificity of binding.
A part of the dTALE constructed in common with the plasmid introduced with the mutation in Example 4 was used in common, and some modified dTALEs were further constructed. The following measurements were carried out by the same method as in Example 1. Using a target DNA sequence designed so that a mismatch occurs at 1 to 3 bases with various modified dTALEs including the conventional type, the stepwise non-specific DNA binding activity of each dTALE was quantified and compared.
 以下に新たに構築したdTALEのリピートモジュールの構成を示す。
209 4AR: 4A(NI) 4A(HD) 4A(NI) 4A(HD) 4A(NI) 4A(NG) 4A(HD) 4A(HD) 4A(NI) 4A(NN) 4A(HD) 4A(NG) 4A(NN) 4A(NG) 4A(NG) (改変型(4A型))
209 4ER: 4E(NI) 4E(HD) 4E(NI) 4E(HD) 4E(NI) 4E(NG) 4E(HD) 4E(HD) 4E(NI) 4E(NN) 4E(HD) 4E(NG) 4E(NN) 4E(NG) 4E(NG) (改変型(4E型))
209h1R: DD(NI) DA(HD) EA(NI) DD(HD) DA(NI) EA(NG) DD(HD) DA(HD) EA(NI) DD(NN) DA(HD) EA(NG) DD(NN) DA(NG) 4D(NG)  (複合改変型(DD-DA-EA型))
209h2R: DA(NI) EA(HD) DA(NI) EA(HD) DA(NI) EA(NG) DA(HD) EA(HD) DA(NI) EA(NN) DA(HD) EA(NG) DA(NN) EA(NG) 4D(NG)  (複合改変型(DA-EA型))
209h3R: DD(NI) DA(HD) EA(NI) DD(HD) DA(NI) EA(NG) DA(HD) EA(HD) DA(NI) EA(NN) DA(HD) EA(NG) DD(NN) DA(NG) 4D(NG) (複合改変型(混合型1))
209h4R: DD(NI) EA(HD) DA(NI) AD(HD) DD(NI) EA(NG) DA(HD) AD(HD) DA(NI) EA(NN) DA(HD) AD(NG) DD(NN) EA(NG) 4D(NG) (複合改変型(混合型2))
The configuration of the newly built dTALE repeat module is shown below.
209 4AR: 4A (NI) 4A (HD) 4A (NI) 4A (HD) 4A (NI) 4A (NG) 4A (HD) 4A (HD) 4A (NI) 4A (NN) 4A (HD) 4A (NG ) 4A (NN) 4A (NG) 4A (NG) (modified type (4A type))
209 4ER: 4E (NI) 4E (HD) 4E (NI) 4E (HD) 4E (NI) 4E (NG) 4E (HD) 4E (HD) 4E (NI) 4E (NN) 4E (HD) 4E (NG ) 4E (NN) 4E (NG) 4E (NG) (Modified type (4E type))
209h1R: DD (NI) DA (HD) EA (NI) DD (HD) DA (NI) EA (NG) DD (HD) DA (HD) EA (NI) DD (NN) DA (HD) EA (NG) DD (NN) DA (NG) 4D (NG) (Composite modified type (DD-DA-EA type))
209h2R: DA (NI) EA (HD) DA (NI) EA (HD) DA (NI) EA (NG) DA (HD) EA (HD) DA (NI) EA (NN) DA (HD) EA (NG) DA (NN) EA (NG) 4D (NG) (Composite modified type (DA-EA type))
209h3R: DD (NI) DA (HD) EA (NI) DD (HD) DA (NI) EA (NG) DA (HD) EA (HD) DA (NI) EA (NN) DA (HD) EA (NG) DD (NN) DA (NG) 4D (NG) (Composite modified type (mixed type 1))
209h4R: DD (NI) EA (HD) DA (NI) AD (HD) DD (NI) EA (NG) DA (HD) AD (HD) DA (NI) EA (NN) DA (HD) AD (NG) DD (NN) EA (NG) 4D (NG) (Composite modified type (mixed type 2))
 以下に新たに構築したターゲットルシフェラーゼベクターのターゲット配列(下線部がミスマッチ塩基)を示す。
209R-1c: (T) ACACATCCAGCTCTT (配列番号40)
209R-1n: (T) AGACATCCAGCTGTT (配列番号41)
209R-1m: (T) ACACATGCAGCTGTT (配列番号42)
209R-2w: (T) ACACATCCTGCTGAT (配列番号43)
209R-2s: (T) ACACATGCAGCTCTT (配列番号44)
209R-3m: (T) ACTCATGCAGCTCTT (配列番号45)
The target sequence of the newly constructed target luciferase vector (underlined part is mismatch base) is shown below.
209R-1c: (T) ACACATCCAGCT C TT (SEQ ID NO: 40)
209R-1n: (T) A G ACATCCAGCTGTT (SEQ ID NO: 41)
209R-1m: (T) ACACAT G CAGCTGTT (SEQ ID NO: 42)
209R-2w: (T) ACACATCC T GCTG A T (SEQ ID NO: 43)
209R-2s: (T) ACACAT G CAGCT C TT (SEQ ID NO: 44)
209R-3m: (T) AC T CAT G CAGCT C TT (SEQ ID NO: 45)
 結果を図26-28に示す。上記のdTALEとDNAの結合活性の測定実験において、従来型、EA型、複合改変型は、標的DNAのミスマッチ塩基の数および配置に応じ、段階的に標的に対する結合能が低下することが示された。ミスマッチ塩基の配置は3’寄り(TALEのC末寄り)、5’寄り(N末寄り)、中央の順で、TALE-DNA結合活性の低下が認められた。一方で4E型と4A型は非特異的な標的DNAに対しても比較的高い結合活性を示した。
 以上の結果により、標的配列への結合活性と結合の特異性は多くの場合トレードオフの関係にあるが、従来型リピートモジュールと改変型リピートモジュールを混成させることにより、構築したTALEの高い特異的DNA結合活性を保持させつつも、非特異的なDNA結合活性を大幅に低下させることが可能であることが示された。
The results are shown in Figures 26-28. In the above experiment for measuring the binding activity of dTALE and DNA, it was shown that the conventional type, EA type, and complex modified type gradually decrease the target binding ability according to the number and arrangement of mismatch bases in the target DNA. It was. The mismatched bases were arranged in the order of 3 ′ (close to the C end of TALE), 5 ′ (close to the N end), and the center, decreasing TALE-DNA binding activity. On the other hand, types 4E and 4A showed relatively high binding activity against non-specific target DNA.
Based on the above results, the binding activity to the target sequence and the specificity of the binding are often in a trade-off relationship, but by combining the conventional repeat module and the modified repeat module, the high specificity of the constructed TALE is high. It was shown that non-specific DNA binding activity can be significantly reduced while retaining DNA binding activity.
実施例6:TALE C末側およびN末側のリピート外配列のDNA結合活性への影響の解析
 TALEタンパク質は、特異的なDNA結合を担うリピートモチーフと、非特異的なDNA結合を担うリピート外側のDNA結合ドメインから構成されることが分かっている。天然TALEタンパク質の系統的配列解析の結果、リピートモチーフ外のN末側の配列(N-TAL)およびC末側の配列(C-TAL)それぞれにおいて、以下の3系統に分類されることが分かった(図30: N-TAL, 図31: C-TAL): 1. Xanthomonas oryzaeに特徴的に認められるoryzae型、2. oryzae以外の種(citri, campestris, axonopodisなど)において認められるcitri型、3. EQ型のリピートモジュールを持つTALEに認められるEQ型。
 oryzae型のN-TAL、C-TALを採用する従来型dTALEとcitri型、EQ型のdTALEのDNA結合活性を実施例1と同様の手法で計測、比較した。
Example 6: Analysis of the effects of TALE C-terminal and N-terminal repeat sequences on DNA binding activity The TALE protein consists of a repeat motif responsible for specific DNA binding and a repeat outside responsible for non-specific DNA binding. It is known to be composed of DNA binding domains. As a result of systematic sequence analysis of the natural TALE protein, it was found that the N-terminal sequence (N-TAL) and C-terminal sequence (C-TAL) outside the repeat motif are classified into the following three systems: (Figure 30: N-TAL, Figure 31: C-TAL): 1.oryzae type, which is characteristically found in Xanthomonas oryzae, 2.citri type, which is found in species other than oryzae (citri, campestris, axonopodis, etc.) 3. EQ type accepted by TALE with EQ type repeat module.
The DNA binding activity of conventional dTALE, which employs oryzae type N-TAL and C-TAL, and citri type and EQ type dTALE was measured and compared in the same manner as in Example 1.
1. citri型およびEQ型dTALEベクターの構築 1. Construction of citri type and EQ type dTALE vectors
1-1. citri型dTALEベクターの構築
 citri型N-TAL、C-TALをコードする以下の配列の二本鎖DNAを全合成し、pCS2-TALE-VP48ベクターに組み込み(N-TAL; KpnI/BsmBI、C-TAL; BsmBI/BamHI)、pCS2-TALE(citri)-VP48ベクターを構築した(その配列を配列番号51に示す)。なお、改変Golden gate法で使用するpLRベクターは、最後のハーフリピートとC-TALの一部をコードするが、pLRベクターにコードされているC-TAL配列部分はoryzae型とcitri型で共通するため、citri型TALEの構築には従来型のpLRベクターを使用した。
 
Citri-type N-TAL (KpnI/BsmBI)
AAGGGTACCGTAGATTTGAGAACTTTGGGATATTCACAGCAGCAGCAGGAAAAGATCAAGCCCAAAGTGAGGTCGACAGTCGCGCAGCATCACGAAGCGCTGGTGGGTCATGGGTTTACACATGCCCACATCGTAGCCTTGTCGCAGCACCCTGCAGCCCTTGGCACGGTCGCCGTCAAGTACCAGGACATGATTGCGGCGTTGCCGGAAGCCACACATGAGGCGATCGTCGGTGTGGGGAAACAGTGGAGCGGAGCCCGAGCGCTTGAGGCCCTGTTGACGGTCGCGGGAGAGCTGAGAGGGCCTCCCCTTCAGCTGGACACGGGCCAGTTGCTGAAGATCGCGAAGCGGGGAGGAGTCACGGCGGTCGAGGCGGTGCACGCGTGGCGCAATGCGCTCACGGGAGCACCCCTGGAGACGTAC (配列番号46)
 
citri-Type_C-TAL (BsmBI/BamHI)
TATCGTCTCCAACGATCATCTTGTAGCGCTGGCCTGCCTCGGCGGACGACCCGCCTTGGATGCGGTGAAGAAGGGGCTCCCGCACGCGCCTGCATTGATTAAGCGGACCAACAGAAGAATCCCCGAGAGGACATCACATCGAGTGGCAGGATCCAAG (配列番号47)
1-1. Construction of citri-type dTALE vector Totally synthesize double-stranded DNA of the following sequence encoding citri-type N-TAL and C-TAL and incorporate it into pCS2-TALE-VP48 vector (N-TAL; KpnI / BsmBI, C-TAL; BsmBI / BamHI), pCS2-TALE (citri) -VP48 vector was constructed (the sequence is shown in SEQ ID NO: 51). The pLR vector used in the modified Golden gate method encodes the last half repeat and a part of C-TAL, but the C-TAL sequence part encoded in the pLR vector is common to the oryzae and citri types. Therefore, the conventional pLR vector was used for the construction of citri type TALE.

Citri-type N-TAL (KpnI / BsmBI)
AAGGGTACCGTAGATTTGAGAACTTTGGGATATTCACAGCAGCAGCAGGAAAAGATCAAGCCCAAAGTGAGGTCGACAGTCGCGCAGCATCACGAAGCGCTGGTGGGTCATGGGTTTACACATGCCCACATCGTAGCCTTGTCGCAGCACCCTGCAGCCCTTGGCACGGTCGCCGTCAAGTACCAGGACATGATTGCGGCGTTGCCGGAAGCCACACATGAGGCGATCGTCGGTGTGGGGAAACAGTGGAGCGGAGCCCGAGCGCTTGAGGCCCTGTTGACGGTCGCGGGAGAGCTGAGAGGGCCTCCCCTTCAGCTGGACACGGGCCAGTTGCTGAAGATCGCGAAGCGGGGAGGAGTCACGGCGGTCGAGGCGGTGCACGCGTGGCGCAATGCGCTCACGGGAGCACCCCTGGAGACGTAC (SEQ ID NO: 46)

citri-Type_C-TAL (BsmBI / BamHI)
TATCGTCTCCAACGATCATCTTGTAGCGCTGGCCTGCCTCGGCGGACGACCCGCCTTGGATGCGGTGAAGAAGGGGCTCCCGCACGCGCCTGCATTGATTAAGCGGACCAACAGAAGAATCCCCGAGAGGACATCACATCGAGTGGCAGGATCCAAG (SEQ ID NO: 47)
1-2. EQ型dTALEベクターの構築
 配列解析の結果に基づき、代表的なEQ型のN-TAL、C-TALをコードする以下の配列の二本鎖DNAを全合成し、pCS2-TALE-VP48ベクターに組み込み(N-TAL; KpnI/BsmBI、C-TAL; BsmBI/BamHI)、pCS2-TALE(EQ)-VP48ベクターを構築した(その配列を配列番号52に示す)。
 
EQ-type_N-TAL (KpnI/BsmBI)
CAAGGGTACCGTGGATCTATGCACGCTCGGCTACAGTCAGCAGCAGCAAGACGAGATCAAACCGAAGGCCCGTGCTACAGTGGCGCAGCACCACCAGGCACTGATGGGCCATGGGTTTACACGCGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGCCATGATCGCAGCGTTGCCAGAGGCGACACACGAAGACATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTTTCCGGGGAGTTGAGAGGTCCGCCGTTACAGTTGGACACAGGCCAACTTCTGAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGTGCCCCCCTGGAGACGGGCGC (配列番号48)
 
EQ-Type_C-TAL (BsmBI/BamHI)
CCGGTCGTCTCCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCCCTGGAAGCAGTGAAAAAGGGATTGCCGCACGCGCCGACCTTGATCAAAAGAACCAATCGCCGTCTGCCAGAACGCACGTCCCATCGCGTTGCCGGATCCCAACT (配列番号49)
1-2. Construction of EQ-type dTALE vector Based on the results of sequence analysis, double-stranded DNA of the following sequences encoding the typical EQ-type N-TAL and C-TAL was synthesized completely, and pCS2-TALE- It was incorporated into a VP48 vector (N-TAL; KpnI / BsmBI, C-TAL; BsmBI / BamHI), and a pCS2-TALE (EQ) -VP48 vector was constructed (the sequence is shown in SEQ ID NO: 52).

EQ-type_N-TAL (KpnI / BsmBI)
CAAGGGTACCGTGGATCTATGCACGCTCGGCTACAGTCAGCAGCAGCAAGACGAGATCAAACCGAAGGCCCGTGCTACAGTGGCGCAGCACCACCAGGCACTGATGGGCCATGGGTTTACACGCGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGCCATGATCGCAGCGTTGCCAGAGGCGACACACGAAGACATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTTTCCGGGGAGTTGAGAGGTCCGCCGTTACAGTTGGACACAGGCCAACTTCTGAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGTGCCCCCCTGGAGACGGGCGC (SEQ ID NO: 48)

EQ-Type_C-TAL (BsmBI / BamHI)
CCGGTCGTCTCCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCCCTGGAAGCAGTGAAAAAGGGATTGCCGCACGCGCCGACCTTGATCAAAAGAACCAATCGCCGTCTGCCAGAACGCACGTCCCATCGCGTTGCCGGATCCCAACT (SEQ ID NO: 49)
1-3. EQ型pLR-xxベクターの構築
 TALE-DNA結合モチーフにおいて、最後のハーフリピートとC-TALの一部をコードするpLRベクターのC-TAL部分に変異を導入し、EQ型C-TALをコードするpLRベクターを構築した。具体的には、C-TAL N末端から3番目のアミノ酸残基に対応するコドンをGTG(バリン)からTTC(フェニルアラニン)に、11番目のアミノ酸残基に対応するコドンをCCG(プロリン)からCAG(グルタミン)に全て変更した。
 
使用したプライマー
GCGCTCGAAAGCATTTTCGCCCAGCTGAGCCGGCCTGATCAGGCGTTGGCCGCGTTG (EQ-Type pLRxx) (配列番号50)
 
これにより変異を導入したプラスミド
pLR-NN, pLR-NG, pLR-NI, pLR-HD
1-3. Construction of EQ-type pLR-xx vector In the TALE-DNA binding motif, a mutation was introduced into the C-TAL part of the pLR vector encoding the last half-repeat and part of C-TAL, and the EQ-type C- A pLR vector encoding TAL was constructed. Specifically, the codon corresponding to the third amino acid residue from the C-TAL N-terminal is changed from GTG (valine) to TTC (phenylalanine), and the codon corresponding to the 11th amino acid residue is changed from CCG (proline) to CAG. All changed to (Glutamine).

Primers used
GCGCTCGAAAGCATTTTCGCCCAGCTGAGCCGGCCTGATCAGGCGTTGGCCGCGTTG (EQ-Type pLRxx) (SEQ ID NO: 50)

Plasmids introduced with mutations
pLR-NN, pLR-NG, pLR-NI, pLR-HD
2. dTALE構築
 実施例1の手法に基づき、pCS2-TALE-VP48ベクター、pCS2-TALE(citri)-VP48ベクターおよびpCS2-TALE(EQ)-VP48ベクターを用いて以下のdTALEベクターを構築した。
EQ-: pCS2-TALE(EQ)-VP48ベクターを用いて構築したEQ型dTALE
citri-: pCS2-TALE(citri)-VP48ベクターを用いて構築したcitri型dTALE
 
EQ-CG16798F: DD(NN) DD(NN) DD(HD) DD(HD) DD(NG) DD(NN) DD(NG) DD(HD) DD(NI) DD(NN) DD(HD) DD(NN) DD(NI) DD(HD) DD(NI) DD(NI)
EQ-CG16798mF: EA(NN) EA(NN) EA(HD) EA(HD) EA(NG) EA(NN) EA(NG) EA(HD) EA(NI) EA(NN) EA(HD) EA(NN) EA(NI) EA(HD) EA(NI) EA(NI)
EQ-CG16798m2F: QA(NN) QA(NN) QA(HD) QA(HD) QA(NG) QA(NN) QA(NG) QA(HD) QA(NI) QA(NN) QA(HD) QA(NN) QA(NI) QA(HD) QA(NI) QA(NI)
EQ-CG16798R: DD(NG) DD(NG) DD(HD) DD(NI) DD(HD) DD(NI) DD(NI) DD(NN) DD(NG) DD(NG) DD(NG) DD(NI) DD(NG) DD(NN) DD(NN) DD(NN) DD(HD) DD(NI)
EQ-CG16798mR: EA(NG) EA(NG) EA(HD) EA(NI) EA(HD) EA(NI) EA(NI) EA(NN) EA(NG) EA(NG) EA(NG) EA(NI) EA(NG) EA(NN) EA(NN) EA(NN) EA(HD) EA(NI)
EQ-CG16798m2R: QA(NG) QA(NG) QA(HD) QA(NI) QA(HD) QA(NI) QA(NI) QA(NN) QA(NG) QA(NG) QA(NG) QA(NI) QA(NG) QA(NN) QA(NN) QA(NN) QA(HD) QA(NI)
EQ-SphkF: DD(HD) DD(NI) DD(NN) DD(NI) DD(NI) DD(NG) DD(HD) DD(NI) DD(HD) DD(NN) DD(HD) DD(HD) DD(HD) DD(NN) DD(NI) DD(NN) (EQ型N-TAL, C-TAL)
EQ-SphkmF: EA(HD) EA(NI) EA(NN) EA(NI) EA(NI) EA(NG) EA(HD) EA(NI) EA(HD) EA(NN) EA(HD) EA(HD) EA(HD) EA(NN) EA(NI) EA(NN)
EQ-Sphkm2F: QA(HD) QA(NI) QA(NN) QA(NI) QA(NI) QA(NG) QA(HD) QA(NI) QA(HD) QA(NN) QA(HD) QA(HD) QA(HD) QA(NN) QA(NI) QA(NN)
EQ-SphkR: DD(HD) DD(HD) DD(HD) DD(NI) DD(HD) DD(NG) DD(NN) DD(HD) DD(NN) DD(NI) DD(HD) DD(NI) DD(NN) DD(NN) DD(NG) DD(HD) DD(NG) DD(NN)
EQ-SphkmR: EA(HD) EA(HD) EA(HD) EA(NI) EA(HD) EA(NG) EA(NN) EA(HD) EA(NN) EA(NI) EA(HD) EA(NI) EA(NN) EA(NN) EA(NG) EA(HD) EA(NG) EA(NN)
EQ-Sphkm2R: QA(HD) QA(HD) QA(HD) QA(NI) QA(HD) QA(NG) QA(NN) QA(HD) QA(NN) QA(NI) QA(HD) QA(NI) QA(NN) QA(NN) QA(NG) QA(HD) QA(NG) QA(NN)
EQ-85mR: EA(NN) EA(HD) EA(NG) EA(NG) EA(NN) EA(NG) EA(NN) EA(NG) EA(HD) EA(HD) EA(HD) EA(NI) EA(NG) EA(NG)
citri-85mR: EA(NN) EA(HD) EA(NG) EA(NG) EA(NN) EA(NG) EA(NN) EA(NG) EA(HD) EA(HD) EA(HD) EA(NI) EA(NG) EA(NG)
EQ-85m2R: QA(NN) QA(HD) QA(NG) QA(NG) QA(NN) QA(NG) QA(NN) QA(NG) QA(HD) QA(HD) QA(HD) QA(NI) QA(NG) QA(NG)
citri-85m2R: QA(NN) QA(HD) QA(NG) QA(NG) QA(NN) QA(NG) QA(NN) QA(NG) QA(HD) QA(HD) QA(HD) QA(NI) QA(NG) QA(NG)
EQ-209m2R: QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NG) QA(HD) QA(HD) QA(NI) QA(NN) QA(HD) QA(NG) QA(NN) QA(NG) QA(NG)
citri-209m2R: QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NG) QA(HD) QA(HD) QA(NI) QA(NN) QA(HD) QA(NG) QA(NN) QA(NG) QA(NG)
 
 また、pCS2-TALE-VP48ベクター、pCS2-TALE(citri)-VP48ベクターおよびpCS2-TALE(EQ)-VP48ベクターと従来型pLRベクター、EQ型pLRベクターを用い、混合型C-TAL配列を持つ以下のdTALEベクターを構築した。
 
oryzae-EQLR-209m2R: QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NG) QA(HD) QA(HD) QA(NI) QA(NN) QA(HD) QA(NG) QA(NN) QA(NG) QA(NG) (従来型(oryzae型)N-TAL, C-TAL (N末の一部がEQ型))
citri-EQLR-209m2R: QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NG) QA(HD) QA(HD) QA(NI) QA(NN) QA(HD) QA(NG) QA(NN) QA(NG) QA(NG) (citri型N-TAL, C-TAL (N末の一部がEQ型))
EQ-oryzaeLR-209m2R: QA(NI) QA(HD) QA(NI) QA(HD) QA(NI) QA(NG) QA(HD) QA(HD) QA(NI) QA(NN) QA(HD) QA(NG) QA(NN) QA(NG) QA(NG) (EQ型N-TAL, C-TAL (N末の一部が従来型(oryzae型))
2. Construction of dTALE The following dTALE vector was constructed using the pCS2-TALE-VP48 vector, pCS2-TALE (citri) -VP48 vector, and pCS2-TALE (EQ) -VP48 vector based on the method of Example 1.
EQ-: EQ type dTALE constructed using pCS2-TALE (EQ) -VP48 vector
citri-: citri-type dTALE constructed using pCS2-TALE (citri) -VP48 vector

EQ-CG16798F: DD (NN) DD (NN) DD (HD) DD (HD) DD (NG) DD (NN) DD (NG) DD (HD) DD (NI) DD (NN) DD (HD) DD ( NN) DD (NI) DD (HD) DD (NI) DD (NI)
EQ-CG16798mF: EA (NN) EA (NN) EA (HD) EA (HD) EA (NG) EA (NN) EA (NG) EA (HD) EA (NI) EA (NN) EA (HD) EA ( NN) EA (NI) EA (HD) EA (NI) EA (NI)
EQ-CG16798m2F: QA (NN) QA (NN) QA (HD) QA (HD) QA (NG) QA (NN) QA (NG) QA (HD) QA (NI) QA (NN) QA (HD) QA ( NN) QA (NI) QA (HD) QA (NI) QA (NI)
EQ-CG16798R: DD (NG) DD (NG) DD (HD) DD (NI) DD (HD) DD (NI) DD (NI) DD (NN) DD (NG) DD (NG) DD (NG) DD ( NI) DD (NG) DD (NN) DD (NN) DD (NN) DD (HD) DD (NI)
EQ-CG16798mR: EA (NG) EA (NG) EA (HD) EA (NI) EA (HD) EA (NI) EA (NI) EA (NN) EA (NG) EA (NG) EA (NG) EA ( NI) EA (NG) EA (NN) EA (NN) EA (NN) EA (HD) EA (NI)
EQ-CG16798m2R: QA (NG) QA (NG) QA (HD) QA (NI) QA (HD) QA (NI) QA (NI) QA (NN) QA (NG) QA (NG) QA (NG) QA ( NI) QA (NG) QA (NN) QA (NN) QA (NN) QA (HD) QA (NI)
EQ-SphkF: DD (HD) DD (NI) DD (NN) DD (NI) DD (NI) DD (NG) DD (HD) DD (NI) DD (HD) DD (NN) DD (HD) DD ( HD) DD (HD) DD (NN) DD (NI) DD (NN) (EQ type N-TAL, C-TAL)
EQ-SphkmF: EA (HD) EA (NI) EA (NN) EA (NI) EA (NI) EA (NG) EA (HD) EA (NI) EA (HD) EA (NN) EA (HD) EA ( HD) EA (HD) EA (NN) EA (NI) EA (NN)
EQ-Sphkm2F: QA (HD) QA (NI) QA (NN) QA (NI) QA (NI) QA (NG) QA (HD) QA (NI) QA (HD) QA (NN) QA (HD) QA ( HD) QA (HD) QA (NN) QA (NI) QA (NN)
EQ-SphkR: DD (HD) DD (HD) DD (HD) DD (NI) DD (HD) DD (NG) DD (NN) DD (HD) DD (NN) DD (NI) DD (HD) DD ( NI) DD (NN) DD (NN) DD (NG) DD (HD) DD (NG) DD (NN)
EQ-SphkmR: EA (HD) EA (HD) EA (HD) EA (NI) EA (HD) EA (NG) EA (NN) EA (HD) EA (NN) EA (NI) EA (HD) EA ( NI) EA (NN) EA (NN) EA (NG) EA (HD) EA (NG) EA (NN)
EQ-Sphkm2R: QA (HD) QA (HD) QA (HD) QA (NI) QA (HD) QA (NG) QA (NN) QA (HD) QA (NN) QA (NI) QA (HD) QA ( NI) QA (NN) QA (NN) QA (NG) QA (HD) QA (NG) QA (NN)
EQ-85mR: EA (NN) EA (HD) EA (NG) EA (NG) EA (NN) EA (NG) EA (NN) EA (NG) EA (HD) EA (HD) EA (HD) EA ( NI) EA (NG) EA (NG)
citri-85mR: EA (NN) EA (HD) EA (NG) EA (NG) EA (NN) EA (NG) EA (NN) EA (NG) EA (HD) EA (HD) EA (HD) EA ( NI) EA (NG) EA (NG)
EQ-85m2R: QA (NN) QA (HD) QA (NG) QA (NG) QA (NN) QA (NG) QA (NN) QA (NG) QA (HD) QA (HD) QA (HD) QA ( NI) QA (NG) QA (NG)
citri-85m2R: QA (NN) QA (HD) QA (NG) QA (NG) QA (NN) QA (NG) QA (NN) QA (NG) QA (HD) QA (HD) QA (HD) QA ( NI) QA (NG) QA (NG)
EQ-209m2R: QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NG) QA (HD) QA (HD) QA (NI) QA (NN) QA (HD) QA ( NG) QA (NN) QA (NG) QA (NG)
citri-209m2R: QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NG) QA (HD) QA (HD) QA (NI) QA (NN) QA (HD) QA ( NG) QA (NN) QA (NG) QA (NG)

In addition, using pCS2-TALE-VP48 vector, pCS2-TALE (citri) -VP48 vector, pCS2-TALE (EQ) -VP48 vector, conventional pLR vector, EQ-type pLR vector and having mixed C-TAL sequence A dTALE vector was constructed.

oryzae-EQLR-209m2R: QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NG) QA (HD) QA (HD) QA (NI) QA (NN) QA (HD) QA (NG) QA (NN) QA (NG) QA (NG) (conventional type (oryzae type) N-TAL, C-TAL (part of N end is EQ type))
citri-EQLR-209m2R: QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NG) QA (HD) QA (HD) QA (NI) QA (NN) QA (HD) QA (NG) QA (NN) QA (NG) QA (NG) (citri type N-TAL, C-TAL (N-terminal part is EQ type))
EQ-oryzaeLR-209m2R: QA (NI) QA (HD) QA (NI) QA (HD) QA (NI) QA (NG) QA (HD) QA (HD) QA (NI) QA (NN) QA (HD) QA (NG) QA (NN) QA (NG) QA (NG) (EQ type N-TAL, C-TAL (N-terminal part is conventional type (oryzae type))
 実施例4において構築したdTALEを一部用い、実施例1と同様の手法により、以下の測定を行った。使用したターゲット配列は前述の通りである。 The following measurements were performed by the same method as in Example 1 using a part of dTALE constructed in Example 4. The target sequence used is as described above.
3. 結果
 結果を図31-37に示す。図31-34ではリピート外DNA結合ドメインが従来型(oryzae型)とEQ型の2種類のそれぞれにおいて、リピートモジュールが従来型、改変型(EA型)および改変型(QA)の場合の特異的DNA結合活性を測定し、比較した(図31-34で4例の配列組み合わせ)。図35では、リピート外ドメインが従来型(oryzae型)とEQ型およびcitri型の3種類それぞれにおいて、リピートモジュールが改変型(EA型)、改変型(QA型)の場合の特異的DNA結合活性を比較した(1例)。図36-37では、リピート外ドメインとして従来型(oryzae型)、EQ型、citri型に加え、従来型+EQ型pLR、citri型+EQ型pLR、EQ型+従来型pLRの計6種類のdTALEを構築し、実施例5と同様の手法により段階的な非特異的DNA結合活性を比較した。
 上記のdTALEとDNAの結合活性の測定実験において、従来型(oryzae型)、citri型、EQ型の特異的DNA結合活性は、標的配列に依存し変動するが、ほぼ同程度であることが分かった。またoryzae-EQLR型のdTALEは標的特異性が低いことが認められた。
3. Results The results are shown in Figure 31-37. In Fig. 31-34, there are two types of non-repeat DNA binding domains: conventional (oryzae type) and EQ type, and specific when the repeat module is conventional, modified (EA type) and modified (QA). DNA binding activity was measured and compared (four sequence combinations in FIGS. 31-34). Figure 35 shows specific DNA binding activity when the nonrepeat domain is the conventional type (oryzae type), EQ type, and citri type, and the repeat module is the modified type (EA type) or the modified type (QA type). Were compared (1 case). In Figure 36-37, there are six types of non-repeat domains: conventional (oryzae type), EQ type, citri type, conventional type + EQ type pLR, citri type + EQ type pLR, EQ type + conventional type pLR. dTALE was constructed, and stepwise non-specific DNA binding activity was compared by the same method as in Example 5.
In the above experiment for measuring the binding activity between dTALE and DNA, it was found that the specific DNA binding activity of conventional (oryzae type), citri type, and EQ type varies depending on the target sequence, but is almost the same. It was. Oryzae-EQLR type dTALE was found to have low target specificity.
実施例7:RVDの配列がNNの場合に11番目のアミノ酸残基の改変が結合能および特異性に及ぼす影響の解析
 グアニン(G)とアデニン(A)を認識するRVD NNに着目し、従来型とN型のDNA結合活性を比較した。
 即ち、従来型TALENにおいては、各リピートモジュール中の11番目のアミノ酸残基(RVDの一つ手前)はセリン(S)であるが、天然TALEタンパク質の配列解析の結果、RVDがNNの場合には、11番目のアミノ酸残基は約60%の比率でアスパラギン(N)であることが示された。該残基をセリンからアスパラギンに改変した改変型NNリピートモジュールを作成し、11番目から13番目の配列がSNNとなる従来型NN(NN)と、11番目から13番目の配列がNNNとなるN型NN(3N)の各RVDのグアニン(G)およびアデニン(A)に対する結合能と特異性を測定・比較した。
Example 7: Analysis of the effect of modification of the 11th amino acid residue on binding ability and specificity when the sequence of RVD is NN Focusing on RVD NN that recognizes guanine (G) and adenine (A), The DNA binding activity of type N and type N was compared.
That is, in the conventional TALEN, the 11th amino acid residue (one before RVD) in each repeat module is serine (S), but the sequence analysis of natural TALE protein shows that RVD is NN. Showed that the 11th amino acid residue was asparagine (N) in a ratio of about 60%. A modified NN repeat module in which the residue is changed from serine to asparagine is created, and the conventional NN (NN) in which the 11th to 13th sequences are SNN and the 11th to 13th sequences are NNN The binding ability and specificity of each type of NN (3N) RVD for guanine (G) and adenine (A) were measured and compared.
1. 変異導入
 実施例1と同様の手法により、TALE-DNA結合モチーフの各リピートモジュールにおいて、11番目のアミノ酸残基に対応するコドンをAGC(セリン)からAAC(アスパラギン)に改変した。
 
11番目のアミノ酸の変異導入(アミノ酸をセリン(S)からアスパラギン(N)に改変)に用いたプライマー
GCTATCGCCAACAACAATGGCGGCAAG (11SN-F) (配列番号53)
 
このプライマーによって変異を導入したプラスミド
pNN1, pNN2, pNN3, pNN4, pNN5, pNN6, pLR-NN
1. Mutagenesis In the same manner as in Example 1, in each repeat module of the TALE-DNA binding motif, the codon corresponding to the 11th amino acid residue was changed from AGC (serine) to AAC (asparagine).

Primer used for mutagenesis of the 11th amino acid (amino acid changed from serine (S) to asparagine (N))
GCTATCGCCAACAACAATGGCGGCAAG (11SN-F) (SEQ ID NO: 53)

Plasmid with mutation introduced by this primer
pNN1, pNN2, pNN3, pNN4, pNN5, pNN6, pLR-NN
2. dTALE構築
 実施例1と同様の手法により構築したdTALEのリピートモジュールの構成を以下に示す。従来型NNをNN、N型NNを3Nと表記する。
 
TRE: DD(HD) DD(HD) DD(HD) DD(NG) DD(NI) DD(NG) DD(HD) DD(NI) DD(NN) DD(NG) DD(NN) DD(NI) DD(NG) DD(NI) DD(NN) DD(NI) DD(NN) 4D(NI)
TREn1: DD(HD) DD(HD) DD(HD) DD(NG) DD(NI) DD(NG) DD(HD) DD(NI) DD(NN) DD(NG) DD(NN) DD(NI) DD(3N) DD(3N) DD(3N) DD(3N) 4D(3N)
TREn2: DD(HD) DD(HD) DD(HD) DD(NG) DD(NI) DD(NG) DD(HD) DD(NI) DD(NN) DD(NG) DD(NN) DD(NI) DD(NN) DD(NN) DD(NN) DD(NN) 4D(NN)
TREn3: DD(HD) DD(HD) DD(HD) DD(NG) DD(NI) DD(NG) DD(HD) DD(NI) DD(NN) DD(NG) DD(NN) DD(NI) DD(3N) DD(NN) DD(3N) DD(NN) DD(3N) 4D(NN)
TREn4: DD(HD) DD(HD) DD(HD) DD(NG) DD(NI) DD(NG) DD(HD) DD(NI) DD(NN) DD(NG) DD(NN) DD(NI) DD(NN) DD(3N) DD(NN) DD(3N) DD(NN) 4D(3N)
TREn5: DD(HD) DD(HD) DD(HD) DD(NG) DD(NI) DD(NG) DD(3N) DD(3N) DD(3N) DD(NN) DD(NN) DD(NN) DD(NG) DD(NI) DD(NN) DD(NI) DD(NN) 4D(NI)
TREn6: DD(HD) DD(HD) DD(HD) DD(NG) DD(NI) DD(NG) DD(NN) DD(NN) DD(NN) DD(3N) DD(3N) DD(3N) DD(NG) DD(NI) DD(NN) DD(NI) DD(NN) 4D(NI)
2. dTALE Construction The configuration of a dTALE repeat module constructed by the same method as in Example 1 is shown below. Conventional NN is written as NN, and N-type NN is written as 3N.

TRE: DD (HD) DD (HD) DD (HD) DD (NG) DD (NI) DD (NG) DD (HD) DD (NI) DD (NN) DD (NG) DD (NN) DD (NI) DD (NG) DD (NI) DD (NN) DD (NI) DD (NN) 4D (NI)
TREn1: DD (HD) DD (HD) DD (HD) DD (NG) DD (NI) DD (NG) DD (HD) DD (NI) DD (NN) DD (NG) DD (NN) DD (NI) DD (3N) DD (3N) DD (3N) DD (3N) 4D (3N)
TREn2: DD (HD) DD (HD) DD (HD) DD (NG) DD (NI) DD (NG) DD (HD) DD (NI) DD (NN) DD (NG) DD (NN) DD (NI) DD (NN) DD (NN) DD (NN) DD (NN) 4D (NN)
TREn3: DD (HD) DD (HD) DD (HD) DD (NG) DD (NI) DD (NG) DD (HD) DD (NI) DD (NN) DD (NG) DD (NN) DD (NI) DD (3N) DD (NN) DD (3N) DD (NN) DD (3N) 4D (NN)
TREn4: DD (HD) DD (HD) DD (HD) DD (NG) DD (NI) DD (NG) DD (HD) DD (NI) DD (NN) DD (NG) DD (NN) DD (NI) DD (NN) DD (3N) DD (NN) DD (3N) DD (NN) 4D (3N)
TREn5: DD (HD) DD (HD) DD (HD) DD (NG) DD (NI) DD (NG) DD (3N) DD (3N) DD (3N) DD (NN) DD (NN) DD (NN) DD (NG) DD (NI) DD (NN) DD (NI) DD (NN) 4D (NI)
TREn6: DD (HD) DD (HD) DD (HD) DD (NG) DD (NI) DD (NG) DD (NN) DD (NN) DD (NN) DD (3N) DD (3N) DD (3N) DD (NG) DD (NI) DD (NN) DD (NI) DD (NN) 4D (NI)
3. ターゲットベクター構築
 実施例1と同様の手法によりターゲットベクターを構築した。ターゲット配列を以下に示す。
TRE: (T) CCCTATCAGTGATAGAGA (配列番号54)
TRE-G5: (T) CCCTATCAGTGAGGGGG (配列番号55)
TRE-A5: (T) CCCTATCAGTGAAAAAA (配列番号56)
TRE-GA3: (T) CCCTATCAGTGAGAGAGA (配列番号57)
TRE-G3A3-TRE: (T) CCCTATGGGAAATAGAGA (配列番号58)
Control: (T) TTATTCCCTGACAG (配列番号59)
 結合活性の測定についても実施例1と同様にして行った。
3. Target vector construction A target vector was constructed in the same manner as in Example 1. The target sequence is shown below.
TRE: (T) CCCTATCAGTGATAGAGA (SEQ ID NO: 54)
TRE-G5: (T) CCCTATCAGTGAGGGGG (SEQ ID NO: 55)
TRE-A5: (T) CCCTATCAGTGAAAAAA (SEQ ID NO: 56)
TRE-GA3: (T) CCCTATCAGTGAGAGAGA (SEQ ID NO: 57)
TRE-G3A3-TRE: (T) CCCTATGGGAAATAGAGA (SEQ ID NO: 58)
Control: (T) TTATTCCCTGACAG (SEQ ID NO: 59)
The binding activity was measured in the same manner as in Example 1.
4. 結果
 結果を図38-39に示す。上記のdTALEとDNAの結合活性の測定実験において、従来型NNとN型NNは共にグアニンとアデニンの両方に対して結合活性が認められた。しかしながら、5回の連続したアデニンへの結合能においては、N型NNは従来型NNの約1.3倍の結合活性を示した。N型NNを用いることでグアニンへの結合活性を低下させずにアデニンへの結合能を30%程度改善できることが示された。従って、N型NNはGまたはAを認識するRVDとして従来型NNより優れた代替RVDとして使用可能なことが分かった。
4. Results The results are shown in Figure 38-39. In the experiment for measuring the binding activity of dTALE and DNA as described above, both conventional NN and N-type NN were found to bind to both guanine and adenine. However, N-type NN showed about 1.3 times the binding activity of conventional NN in the ability to bind 5 consecutive adenines. It was shown that the ability to bind to adenine can be improved by about 30% without reducing the binding activity to guanine by using N-type NN. Therefore, it was found that N-type NN can be used as an RVD that recognizes G or A as an alternative RVD superior to conventional NN.
 本出願は日本で出願された特願2013-167144(出願日:2013年8月9日)を基礎としており、それらの内容は本明細書に全て包含されるものである。 This application is based on Japanese Patent Application No. 2013-167144 filed in Japan (filing date: August 9, 2013), the contents of which are incorporated in full herein.

Claims (25)

  1.  標的DNAに対する結合活性を有する単離された改変型タンパク質であって、
     前記改変型タンパク質は、複数のモジュールの繰返し構造を有するXanthomonas属細菌由来Transcription Activator-Like (TAL) Effector部分を含み、
     前記複数のモジュールの各々は、前記標的DNAの塩基配列を構成するそれぞれ1塩基を認識する標的塩基認識領域を有し、かつ、
     前記複数のモジュールのうちの少なくとも1つは、配列番号1で表されるアミノ酸配列において、2~6番目および30~34番目からなる群から選択される少なくとも1つのアミノ酸残基が人為的な変異を有するように改変されたアミノ酸配列を有する、
    前記改変型タンパク質。
    An isolated modified protein having a binding activity to a target DNA,
    The modified protein includes a Transcription Activator-Like (TAL) Effector portion derived from a genus Xanthomonas having a repeating structure of a plurality of modules,
    Each of the plurality of modules has a target base recognition region that recognizes one base constituting the base sequence of the target DNA, and
    In at least one of the plurality of modules, in the amino acid sequence represented by SEQ ID NO: 1, at least one amino acid residue selected from the group consisting of 2 to 6 and 30 to 34 is artificially mutated Having an amino acid sequence modified to have
    The modified protein.
  2.  前記人為的な変異を有するように改変されたアミノ酸配列を有するモジュールの少なくとも1つが、配列番号1で表されるアミノ酸配列において、2~6番目からなる群から選択される少なくとも1つのアミノ酸残基と30~34番目からなる群から選択される少なくとも1つのアミノ酸残基とが人為的な変異を有するように改変されたものである、請求項1に記載の改変型タンパク質。 Wherein at least one of the modules having an amino acid sequence modified so as to have an artificial mutation is at least one amino acid residue selected from the group consisting of 2 to 6 in the amino acid sequence represented by SEQ ID NO: 1 The modified protein according to claim 1, wherein at least one amino acid residue selected from the group consisting of and 30 to 34 is modified so as to have an artificial mutation.
  3.  前記複数のモジュールのうちの少なくとも1つが、配列番号1で表されるアミノ酸配列において、20~26番目からなる群から選択される少なくとも1つのアミノ酸残基が人為的な変異を有するように改変されたものである、請求項1または2に記載の改変型タンパク質。 At least one of the plurality of modules is modified so that at least one amino acid residue selected from the group consisting of the 20th to 26th amino acids has an artificial mutation in the amino acid sequence represented by SEQ ID NO: 1. The modified protein according to claim 1 or 2, wherein
  4.  前記複数のモジュールのうちの少なくとも1つが、配列番号1で表されるアミノ酸配列において11番目のアミノ酸残基がアスパラギンになるように人為的に改変されている、請求項1~3のいずれか1項に記載の改変型タンパク質。 At least one of the plurality of modules is artificially modified so that the 11th amino acid residue in the amino acid sequence represented by SEQ ID NO: 1 is asparagine. The modified protein according to Item.
  5.  前記人為的な変異を有するように改変されたアミノ酸配列を有するモジュールの少なくとも1つが、配列番号1で表されるアミノ酸配列と80%以上の相同性を有し、かつ、前記相同性を有するアミノ酸配列と配列番号1で表されるアミノ酸配列とをアライメントしたとき、配列番号1で表されるアミノ酸配列において4番目および/または32番目のアミノ酸残基が人為的な変異を有するように改変されたものである、請求項1~4のいずれか1項に記載の改変型タンパク質。 At least one of the modules having an amino acid sequence modified so as to have an artificial mutation has 80% or more homology with the amino acid sequence represented by SEQ ID NO: 1, and has the homology When the sequence and the amino acid sequence represented by SEQ ID NO: 1 were aligned, the amino acid sequence represented by SEQ ID NO: 1 was modified so that the 4th and / or 32nd amino acid residue had an artificial mutation The modified protein according to any one of claims 1 to 4, which is a protein.
  6.  前記配列番号1で表されるアミノ酸配列と80%以上の相同性を有するアミノ酸配列を有するモジュールの少なくとも1つが、前記相同性を有するアミノ酸配列と配列番号1で表されるアミノ酸配列とをアライメントしたとき、(i)配列番号1で表されるアミノ酸配列において4番目のアミノ酸残基がグルタミン酸となり、かつ32番目のアミノ酸残基がアラニンとなるように改変されたものであるか、または(ii)配列番号1で表されるアミノ酸配列において4番目のアミノ酸残基がグルタミンとなり、かつ32番目のアミノ酸残基がアラニンとなるように改変されたものである、請求項5に記載の改変型タンパク質。 At least one of the modules having an amino acid sequence having 80% or more homology with the amino acid sequence represented by SEQ ID NO: 1 aligned the amino acid sequence having the homology with the amino acid sequence represented by SEQ ID NO: 1. (I) the amino acid sequence represented by SEQ ID NO: 1 has been modified so that the fourth amino acid residue is glutamic acid and the 32nd amino acid residue is alanine, or (ii) The modified protein according to claim 5, which is modified so that the fourth amino acid residue is glutamine and the 32nd amino acid residue is alanine in the amino acid sequence represented by SEQ ID NO: 1.
  7.  前記複数のモジュールの全てにおいて、前記変異が同一のパターンである、請求項1~6のいずれか1項に記載の改変型タンパク質。 The modified protein according to any one of claims 1 to 6, wherein the mutation has the same pattern in all of the plurality of modules.
  8.  前記繰返し構造におけるモジュールの個数が、6~36個である、請求項1~7のいずれか1項に記載の改変型タンパク質。 The modified protein according to any one of claims 1 to 7, wherein the number of modules in the repeating structure is 6 to 36.
  9.  前記TAL Effector部分が由来するXanthomonas属細菌に由来しない機能ドメインを更に含む、請求項1~8のいずれか1項に記載の改変型タンパク質。 The modified protein according to any one of claims 1 to 8, further comprising a functional domain not derived from a bacterium belonging to the genus Xanthomonas from which the TAL Effector portion is derived.
  10.  前記機能ドメインが、核酸分解酵素または核酸転移酵素の全部もしくは一部分である、請求項9に記載の改変型タンパク質。 The modified protein according to claim 9, wherein the functional domain is all or a part of a nucleolytic enzyme or a nucleotransferase.
  11.  前記核酸分解酵素が、制限酵素FokIのDNA切断ドメインを含む、請求項10に記載の改変型タンパク質。 The modified protein according to claim 10, wherein the nucleolytic enzyme comprises a DNA cleavage domain of a restriction enzyme FokI.
  12.  前記機能ドメインが、転写活性化因子ドメイン、転写抑制因子ドメインまたはエピゲノム制御因子ドメインを含む、請求項9に記載の改変型タンパク質。 The modified protein according to claim 9, wherein the functional domain includes a transcription activator domain, a transcription repressor domain, or an epigenome regulator domain.
  13.  前記機能ドメインが、蛍光タンパク質、発光タンパク質、色素タンパク質の全体または一部分、あるいは、蛍光、発光または発色反応を触媒する酵素タンパク質の全体または一部分を含む、請求項9~12のいずれか1項に記載の改変型タンパク質。 The functional domain comprises all or part of a fluorescent protein, luminescent protein, chromoprotein, or all or part of an enzyme protein that catalyzes a fluorescence, luminescence or chromogenic reaction. Modified protein of
  14.  請求項1~13のいずれか1項に記載の改変型タンパク質のアミノ酸配列をコードする単離された核酸。 An isolated nucleic acid encoding the amino acid sequence of the modified protein according to any one of claims 1 to 13.
  15.  請求項14に記載の核酸を含む発現ベクター。 An expression vector comprising the nucleic acid according to claim 14.
  16.  請求項15に記載の発現ベクターが導入された形質転換体。 A transformant into which the expression vector according to claim 15 has been introduced.
  17.  請求項1~13のいずれか1項に記載の改変型タンパク質の製造方法であって、当該方法は、
     元となるタンパク質をコードする核酸において変異を導入する工程であって、該変異は、該変異した核酸がコードするタンパク質において、前記改変型タンパク質が有する前記人為的な変異を生じるようなものであり、該元となるタンパク質は、前記人為的な変異を導入されたタンパク質のアミノ酸配列が前記改変型タンパク質のアミノ酸配列となるようなものである、前記工程、
     前記変異した核酸を含む発現ベクターを調製し、該発現ベクターを宿主細胞に導入することにより形質転換体を取得する工程、および、
     前記形質転換体を培養し、培養物から前記改変型タンパク質を単離する工程
    を含む、前記方法。
    A method for producing the modified protein according to any one of claims 1 to 13, wherein the method comprises:
    A step of introducing a mutation in the nucleic acid encoding the original protein, wherein the mutation is such that the artificial mutation of the modified protein occurs in the protein encoded by the mutated nucleic acid; The original protein is such that the amino acid sequence of the protein into which the artificial mutation is introduced becomes the amino acid sequence of the modified protein,
    Preparing an expression vector containing the mutated nucleic acid and obtaining the transformant by introducing the expression vector into a host cell; and
    The method comprising culturing the transformant and isolating the modified protein from the culture.
  18.  請求項1~13のいずれか1項に記載の改変型タンパク質を細胞に導入するか、または、前記改変型タンパク質のアミノ酸配列をコードするRNAもしくは前記改変型タンパク質のアミノ酸配列をコードする核酸を含む発現ベクターを細胞に導入して前記細胞内で前記改変型タンパク質を発現させ、前記改変型タンパク質を標的遺伝子および/またはその周辺の領域に結合させることにより、(a)前記領域を切断するか、(b)前記領域を切断し、かつ切断された前記領域に相同組み換え修復または非相同末端連結修復を作用させることにより前記領域を改変するか、(c)前記領域を修飾するか、または、(d)前記領域周辺の遺伝子発現を変化させる工程を含む、前記細胞における前記領域の切断、改変または修飾方法。 The modified protein according to any one of claims 1 to 13 is introduced into a cell, or RNA encoding the amino acid sequence of the modified protein or a nucleic acid encoding the amino acid sequence of the modified protein is included. (A) cutting the region by introducing an expression vector into the cell, expressing the modified protein in the cell, and binding the modified protein to the target gene and / or its surrounding region; (B) modifying the region by cleaving the region and applying homologous recombination repair or non-homologous end-joining repair to the cleaved region, (c) modifying the region, or ( d) A method for cleaving, altering or modifying the region in the cell, comprising the step of changing gene expression around the region.
  19.  前記細胞が、動物の精子、未受精卵、受精卵、胎児もしくは成体を構成する細胞、もしくは、植物ないし動物の組織から採取した細胞、胚性幹細胞(ES細胞)または人工多能性幹細胞(iPS細胞)である、請求項18に記載の方法。 The cells are animal sperm, unfertilized eggs, fertilized eggs, fetal or adult cells, or cells collected from plant or animal tissues, embryonic stem cells (ES cells) or induced pluripotent stem cells (iPS) The method according to claim 18, which is a cell).
  20.  標的遺伝子および/またはその周辺の領域が切断、改変または修飾された変異生物の個体または系統を作製するための方法であって、前記方法は、
    (1)前記領域を含む前記生物の細胞を用意する工程と、
    (2)請求項1~13のいずれか1項に記載の改変型タンパク質を細胞に導入するか、または、前記改変型タンパク質のアミノ酸配列をコードするRNAもしくは前記改変型タンパク質のアミノ酸配列をコードする核酸を含む発現ベクターを細胞に導入して前記細胞内で前記改変型タンパク質を発現させ、前記改変型タンパク質を前記領域に結合させることにより、(a)前記領域を切断するか、(b)前記領域を切断し、かつ切断された前記領域に相同組み換え修復または非相同末端連結修復を作用させることにより前記領域を改変するか、(c)前記領域を修飾するか、または、(d)前記領域周辺の遺伝子発現を変化させる工程と、
    (3)工程(2)により得られた細胞から前記変異生物の個体または系統を作製する工程と
    を含む、前記方法。
    A method for producing an individual or strain of a mutant organism in which a target gene and / or its surrounding region is cleaved, altered or modified,
    (1) preparing a cell of the organism including the region;
    (2) The modified protein according to any one of claims 1 to 13 is introduced into a cell, or the RNA encoding the amino acid sequence of the modified protein or the amino acid sequence of the modified protein is encoded. An expression vector containing a nucleic acid is introduced into a cell, the modified protein is expressed in the cell, and the modified protein is bound to the region, thereby (a) cutting the region, or (b) Altering the region by cleaving the region and applying homologous recombination repair or non-homologous end-joining repair to the cleaved region, (c) modifying the region, or (d) the region Changing the surrounding gene expression;
    (3) The method including the step of producing an individual or strain of the mutant organism from the cells obtained in step (2).
  21.  請求項20に記載の方法により得られた、変異生物の個体または系統。 An individual or strain of a mutant organism obtained by the method according to claim 20.
  22.  標的DNAに対する結合活性が未改変型タンパク質と比較して変化した改変型タンパク質をスクリーニングするための方法であって、
    (1)請求項1~13のいずれか1項に記載の改変型タンパク質の、前記標的DNAに対する結合活性を測定する工程、
    (2)前記改変型タンパク質における前記人為的な変異を有しない未改変型タンパク質の、前記標的DNAに対する結合活性を測定する工程、
    (3)前記未改変型タンパク質が有する前記結合活性と比較して、前記改変型タンパク質が有する前記結合活性が変化している場合に、前記改変型タンパク質を、前記標的DNAに対する結合活性が前記未改変型タンパク質と比較して変化した改変型タンパク質として選択する工程
    を有する、前記方法。
    A method for screening a modified protein whose binding activity to a target DNA is changed compared to an unmodified protein,
    (1) a step of measuring the binding activity of the modified protein according to any one of claims 1 to 13 to the target DNA;
    (2) measuring the binding activity of the unmodified protein having no artificial mutation in the modified protein to the target DNA;
    (3) When the binding activity of the modified protein is changed as compared with the binding activity of the unmodified protein, the modified protein has a binding activity to the target DNA that is not The said method which has the process of selecting as a modified protein changed compared with the modified protein.
  23.  前記工程(1)の以前に、請求項17に記載の方法を用いて前記改変型タンパク質を調製する工程を更に含む、請求項22に記載の方法。 The method according to claim 22, further comprising the step of preparing the modified protein using the method according to claim 17 before the step (1).
  24.  標的DNAに対する切断活性が未改変型タンパク質と比較して変化した改変型タンパク質をスクリーニングするための方法であって、
    (1)請求項10または11に記載の改変型タンパク質の、該標的DNAに対する切断活性を測定する工程、
    (2)該改変型タンパク質における該人為的な変異を有しない未改変型タンパク質の、該標的DNAに対する切断活性を測定する工程、
    (3)該未改変型タンパク質が有する該切断活性と比較して、該改変型タンパク質が有する該切断活性が変化している場合に、該改変型タンパク質を、該標的DNAに対する切断活性が該未改変型タンパク質と比較して変化した改変型タンパク質として選択する工程
    を有する、前記方法。
    A method for screening a modified protein having altered cleavage activity against a target DNA compared to an unmodified protein,
    (1) a step of measuring the cleavage activity of the modified protein according to claim 10 or 11 against the target DNA;
    (2) a step of measuring the cleavage activity of the unmodified protein having no artificial mutation in the modified protein with respect to the target DNA;
    (3) When the cleavage activity of the modified protein is changed as compared to the cleavage activity of the unmodified protein, the modified protein has a cleavage activity against the target DNA. The said method which has the process of selecting as a modified protein changed compared with the modified protein.
  25.  前記工程(1)の以前に、請求項17に記載の方法を用いて前記改変型タンパク質を調製する工程を更に含む、請求項24に記載の方法。 The method according to claim 24, further comprising the step of preparing the modified protein using the method according to claim 17 before the step (1).
PCT/JP2014/071116 2013-08-09 2014-08-08 Highly-active tale protein by altering dna-bound protein domain WO2015020218A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013-167144 2013-08-09
JP2013167144 2013-08-09

Publications (1)

Publication Number Publication Date
WO2015020218A1 true WO2015020218A1 (en) 2015-02-12

Family

ID=52461541

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/071116 WO2015020218A1 (en) 2013-08-09 2014-08-08 Highly-active tale protein by altering dna-bound protein domain

Country Status (1)

Country Link
WO (1) WO2015020218A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020209332A1 (en) * 2019-04-09 2020-10-15 国立研究開発法人科学技術振興機構 Nucleic acid binding protein
US11479780B2 (en) 2019-02-21 2022-10-25 Kabushiki Kaisha Toyota Chuo Kenkyusho Fusion protein for controlling epigenomic state, and use thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012158986A2 (en) * 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms
JP2013529083A (en) * 2010-05-17 2013-07-18 サンガモ バイオサイエンシーズ, インコーポレイテッド Novel DNA binding protein and use thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013529083A (en) * 2010-05-17 2013-07-18 サンガモ バイオサイエンシーズ, インコーポレイテッド Novel DNA binding protein and use thereof
WO2012158986A2 (en) * 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11479780B2 (en) 2019-02-21 2022-10-25 Kabushiki Kaisha Toyota Chuo Kenkyusho Fusion protein for controlling epigenomic state, and use thereof
WO2020209332A1 (en) * 2019-04-09 2020-10-15 国立研究開発法人科学技術振興機構 Nucleic acid binding protein
JPWO2020209332A1 (en) * 2019-04-09 2021-12-02 国立研究開発法人科学技術振興機構 Nucleic acid binding protein
JP7356739B2 (en) 2019-04-09 2023-10-05 国立研究開発法人科学技術振興機構 Nucleic acid binding protein

Similar Documents

Publication Publication Date Title
AU2022200851B2 (en) Using nucleosome interacting protein domains to enhance targeted genome modification
CA2854819C (en) Modified dna-binding proteins and uses thereof
AU2011256838B2 (en) Novel DNA-binding proteins and uses thereof
US20140273230A1 (en) Crispr-based genome modification and regulation
US20110201118A1 (en) Nuclease activity of tal effector and foki fusion protein
KR20100080068A (en) A novel zinc finger nuclease and uses thereof
EP3011011A2 (en) Targeted integration
TW200815593A (en) Zinc finger nuclease-mediated homologous recombination
WO2014018601A2 (en) New modular base-specific nucleic acid binding domains from burkholderia rhizoxinica proteins
KR20200141472A (en) Engineered cells with modified host cell protein profile
AU2020221274B2 (en) Crispr/Cas fusion proteins and systems
WO2015020218A1 (en) Highly-active tale protein by altering dna-bound protein domain
JP2013094148A (en) Novel dna binding domain and novel dna breaking enzyme including the same
KR20200141473A (en) Production of recombinant proteins with reduced levels of host cell proteins
WO2020209332A1 (en) Nucleic acid binding protein
KR20120087860A (en) A novel zinc finger nuclease and uses thereof

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14833684

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14833684

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP