Nothing Special   »   [go: up one dir, main page]

TW202208626A - Rna引導核酸酶及其活性片段與變體,以及使用方法 - Google Patents

Rna引導核酸酶及其活性片段與變體,以及使用方法 Download PDF

Info

Publication number
TW202208626A
TW202208626A TW110113939A TW110113939A TW202208626A TW 202208626 A TW202208626 A TW 202208626A TW 110113939 A TW110113939 A TW 110113939A TW 110113939 A TW110113939 A TW 110113939A TW 202208626 A TW202208626 A TW 202208626A
Authority
TW
Taiwan
Prior art keywords
seq
sequence identity
sequence
tracrrna
rgn
Prior art date
Application number
TW110113939A
Other languages
English (en)
Inventor
泰森 D 伯恩
麥可 柯伊雷
亞歷山卓 布萊勒 克羅雷
泰德 D 艾力奇
Original Assignee
美商生命編輯公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商生命編輯公司 filed Critical 美商生命編輯公司
Publication of TW202208626A publication Critical patent/TW202208626A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

提供了用於結合所關注的標的序列的組成物及方法。該組成物可用於切割或修飾所關注的標的序列、所關注的標的序列的可視化、及修飾所關注的序列的表現。組成物包括RNA引導的核酸酶(RGN)多肽、CRISPR RNA、轉錄活化的CRISPR RNA、引導RNA、及編碼同者的核酸分子。還提供了包括該核酸分子的載體及宿主細胞。進一步提供了用於結合所關注的標的序列的RGN系統,其中該RGN系統包括RNA引導的核酸酶多肽及一或更多引導RNA。

Description

RNA引導核酸酶及其活性片段與變體,以及使用方法
關於序列表的聲明
本發明與分子生物學及基因編輯領域有關。
靶向基因體編輯或修飾正迅速成為基礎及應用研究的重要工具。最初的方法涉及例如大範圍核酸酶(meganuclease)、鋅指融合蛋白或TALEN之類的工程核酸酶,這需要產生具有對每一種特定標的序列專一性的工程化、可程式化、序列專一性的DNA結合域的嵌合核酸酶。RNA引導的核酸酶(例如,叢集有規律間隔的短迴文重複序列(Clustered Regularly Interspaced Short Palindromic Repeat)(CRISPR)-相關(cas)細菌系統的CRISPR-Cas蛋白)可以藉由將核酸酶與引導RNA(引導RNA與特定標的序列專一性雜交)複合以靶向特定序列。相較於為每一個標的序列產生嵌合核酸酶,產生靶專一性引導RNA的成本更低且效率更高。可選地,此類RNA引導的核酸酶可用於經由引入序列專一性、經由易錯的非同源末端連接(NHEJ)進行修復的雙股斷裂來編輯基因體,該斷裂經由易錯的非同源末端連接(NHEJ)被修復,以在特定基因體位置引入突變。或者,可經由同源性重組修復將異源DNA引入基因體位點。當與去胺酶融合時,RNA引導的核酸酶(RGN)亦可用於鹼基編輯。
提供了用於結合所關注的標的序列的組成物及方法。該組成物可用於切割或修飾所關注的標的序列、檢測所關注的標的序列、以及修飾所關注的序列的表現。組成物包括RNA引導的核酸酶(RGN)多肽、CRISPR RNA(crRNA)、轉錄活化的CRISPR RNA(tracrRNA)、引導RNA(gRNA)、編碼同者的核酸分子、以及包括核酸分子的載體及宿主細胞。還提供了用於結合所關注的標的序列的RGN系統,其中該RGN系統包括RNA引導的核酸酶多肽以及一或更多引導RNA。因此,將本文所揭露的方法描述為用於結合所關注的標的序列,並且在一些實施方式中,用於切割或修飾所關注的標的序列。所關注的標的序列可例如由於非同源末端連接、引入的供體序列的同源導向修復或鹼基編輯而被修飾。
受益於前述描述及相關圖式中呈現的教導,與這些發明有關領域中具有通常知識者將想到本文闡述的本發明的許多修改及其他實施方式。因此,應該理解,本發明不限於所揭露的特定實施方式,並且修改以及其他實施方式旨在被包括於所附實施方式的範圍內。雖然本文採用特定術語,但這些術語僅以一般性及描述性意義上使用,而非出於限制性目的。I .概述
RNA引導的核酸酶(RGN)允許對基因體內的(一或多個)特定位點的靶向操縱,並且在基因靶向的環境下有用於治療及研究應用。在各種生物體(包括哺乳動物)中,例如,藉由刺激非同源末端連接和同源重組,RNA引導的核酸酶已被用於基因體工程。本文所述的組成物及方法有用於在多核苷酸中產生單股或雙股斷裂、修飾多核苷酸、檢測多核苷酸內的特定位點、或修飾特定基因的表現。
本文所揭露的RNA引導的核酸酶可藉由修飾標的序列來改變基因表現。於特定實施方式中,RNA引導的核酸酶藉由引導RNA(gRNA)作為叢集有規律間隔的短迴文重複序列(CRISPR)RNA引導的核酸酶系統的一部分而被導向標的序列。RGN是所考慮「RNA引導」,因為引導RNA與RNA引導的核酸酶形成錯合物,以將RNA引導的核酸酶導向與標的序列結合,並且於一些實施方式中,在標的序列處引入單股或雙股斷裂。在標的序列已被切割後,斷裂可被修復,使得標的序列的DNA序列在修復過程期間被修飾。因此,本文提供了使用RNA引導的核酸酶修飾宿主細胞的DNA中的標的序列的方法。例如,RNA引導的核酸酶可用於修飾真核細胞或原核細胞的基因體基因座處的標的序列。II. RNA 引導的核酸酶
本文提供了RNA引導的核酸酶。術語「RNA引導的核酸酶(RGN)」是指以序列專一性方式與特定標的核苷酸序列結合且藉由與多肽錯合並與該標的序列雜交的引導RNA分子而被導向該標的核苷酸序列。雖然RNA引導的核酸酶能夠在結合時切割標的序列,但術語「RNA引導的核酸酶」還包括能夠結合至標的序列但不切割標的序列的無核酸酶活性的RNA引導的核酸酶。RNA引導的核酸酶對標的序列的切割可導致單股或雙股斷裂。僅能夠切割雙股核酸分子的單股的RNA引導的核酸酶在本文中被稱為切口酶。
本文揭露的RNA引導的核酸酶包括APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217及APG06657 RNA引導的核酸酶,其胺基酸序列分別如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579所示、且保留以RNA引導的序列專一性方式結合至標的核苷酸序列的能力的其活性片段或變異體。於這些實施方式中的一些實施方式中,APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217或APG06657 RGN的活性片段或變異體能夠切割單股或雙股標的序列。於一些實施方式中,APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217或APG06657 RGN的活性變異體包括與如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的胺基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性的胺基酸序列。於某些實施方式中,APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217或APG06657 RGN的活性片段包括如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的胺基酸序列的至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050個或更多個連續胺基酸殘基。本文提供的RNA引導的核酸酶可包括至少一核酸酶域(例如,DNase、RNase域)及至少一RNA識別及/或RNA結合域,以與引導RNA相互作用。可在本文提供的RNA引導的核酸酶中發現的其他域包括但不限於:DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域及二聚合域。於特定實施方式中,本文提供的RNA引導的核酸酶可包括對DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域及二聚合域中的一或更多者至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列一致性。
標的核苷酸序列與本文提供的RNA引導的核酸酶結合、並和與RNA引導的核酸酶相關的引導RNA雜交。然後,如果多肽具有核酸酶活性,則可由RNA引導的核酸酶隨後切割該標的序列。術語「切割(cleave)」或「切割(cleavage)」是指標的核苷酸序列的骨架內的至少一磷酸二酯鍵的水解,其可導致該標的序列內的單股或雙股斷裂。目前揭露的RGN可以作為核酸內切酶、或者可以是核酸外切酶(從多核苷酸的末端(5'端及/或3'端)去除連續的核苷酸)而切割多核苷酸內的核苷酸。於其他實施方式中,所揭露的RGN可在多核苷酸的任何位置內切割標的序列的核苷酸,且因此起核酸內切酶及核酸外切酶二者的作用。目前揭露的RGN對標的多核苷酸的切割可導致交錯的斷裂或鈍端。
目前揭露的RNA引導的核酸酶可以是衍生自細菌或古細菌物種的野生型序列。替代地,RNA引導的核酸酶可為野生型多肽的變異體或片段。例如,可修飾野生型RGN以改變核酸酶活性或改變PAM專一性。於一些實施方式中,RNA引導的核酸酶不是天然存在的。
於某些實施方式中,RNA引導的核酸酶僅作為切割標的核苷酸序列的單股的切口酶。此種RNA引導的核酸酶具有單一功能性核酸酶域。於特定實施方式中,切口酶能夠切割正股或負股。在這些實施方式中的一些實施方式中,另外的核酸酶域已經突變,使得核酸酶活性降低或消除。
於其他實施方式中,RNA引導的核酸酶完全缺少核酸酶活性、且在本文中被稱為無核酸酶活性(nuclease-dead)或核酸酶不活化(nuclease inactive)。用於將突變引入胺基酸序列的本領域已知的任何方法(例如PCR介導的誘變及定點誘變之類)可用於產生無切口酶或無核酸酶活性的RGN。參見例如美國公開號2014/0068797以及第9,790,490號美國專利;上述專利案中的每一者的全部內容藉由引用而被併入本文。
缺少核酸酶活性的RNA引導的核酸酶可用於將融合的多肽、多核苷酸或小分子負載遞送至特定基因體位置。於這些實施方式中的一些中,RGN多肽或引導RNA可與可檢測標記融合,以允許特定序列的檢測。作為非限制性範例,無核酸酶活性的RGN可與可檢測標記(例如,螢光蛋白)融合且靶向與疾病關聯的特定序列,以允許與疾病關聯序列的檢測。
可選地,可將無核酸酶活性的RGN靶向特定基因體位置,以改變期望序列的表現。於一些實施方式中,藉由干擾所靶向的基因體區域內的RNA聚合酶或轉錄因子的結合,無核酸酶活性的RNA引導的核酸酶與標的序列的結合導致降低了標的序列的或受標的序列的轉錄控制下的基因的表現。於其他實施方式中,RGN(例如,無核酸酶活性的RGN)或其錯合的引導RNA進一步包括表現調節子,其在與標的序列結合時用於壓抑或活化標的序列或受標的序列轉錄控制的基因的表現。於這些實施方式中的一些中,表現調節子經由表觀遺傳機制調節標的序列或受調節基因的表現。
於其他實施方式中,可以將無核酸酶活性的RGN或僅具有切口酶活性的RGN靶向特定基因體位置,以經由與鹼基編輯多肽(例如,去胺酶多肽、或其對核苷酸鹼基直接進行化學修飾(例如,去胺基)的活性變異體或片段)融合來修飾標的多核苷酸的序列,導致從一種核鹼基轉化為另一種核苷酸鹼基。該鹼基編輯多肽可在RGN的N端側或C端末端處與其融合。另外,可經由胜肽連接子將鹼基編輯多肽與RGN融合。有用於此類組成物及方法的去胺酶多肽的非限制性範例包括胞苷去胺酶或腺苷去胺酶(例如,Gaudelli等人(2017)Nature 551:464-471、美國公開號2017/0121693及2018/0073012、國際公開號WO/2018/027078中描述的腺嘌呤去胺酶鹼基編輯器,或者國際公開號WO 2020/139873及2020年9月11日提出的第63/077,089號、2021年2月8日提出的第63/146,840號以及2021年3月22日提出的第63/164,273號的美國臨時申請中揭露的去胺酶中任一者,上述的每一者的全部內容藉由引用而被併入本文)。此外,本領域已知的RGN與鹼基編輯酵素之間的某些融合蛋白亦可包括至少一尿嘧啶穩定多肽(uracil stabilizing polypeptide),其藉由去胺酶增加核酸分子中的胞苷、去氧胞苷或胞嘧啶與胸苷、去氧胸苷或胸腺嘧啶的突變率。尿嘧啶穩定多肽的非限制性範例包括2020年7月15日提出的第63/052,175號美國臨時申請揭露的尿嘧啶穩定多肽(包括USP2(SEQ ID NO:1089))及尿嘧啶醣苷酶抑制劑(UGI)域(SEQ ID NO:212),其可增加鹼基編輯效率。因此,融合蛋白可包括本文描述的RGN或其變異體、去胺酶、及可選地至少一尿嘧啶穩定多肽(例如,UGI或USP2)。於某些實施方式中,與該鹼基編輯多肽融合的RGN為切割該鹼基編輯多肽不發揮作用的DNA股的切口酶(例如,去胺酶)。
與多肽或域融合的RNA引導的核酸酶可藉由連接子而被連接或分開。本文使用的術語「連接子」指連接兩個分子或部分(例如,核酸酶的結合域及切割域)的化學基團或分子。於一些實施方式中,連接子將RNA引導的核酸酶的gRNA結合域與例如去胺酶的鹼基編輯多肽連接。於一些實施方式中,連接子連接無核酸酶活性的RGN與去胺酶。通常,連接子位於兩個基團、分子或其他部分之間或兩側,並經由共價鍵而被連接到每一基團、分子或其他部分,從而連接二者。於一些實施方式中,連接子為胺基酸或多個胺基酸(例如,胜肽或蛋白質)。於一些實施方式中,連接子為有機分子、基團、聚合物或化學部分。於一些實施方式中,連接子的長度為5-100個胺基酸,例如,長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200個胺基酸。也可考慮更長或更短的連接子。
目前揭露的RNA引導的核酸酶可包括至少一核定位訊號(NLS),以增強該RGN向細胞的核的輸送。核定位訊號為本領域已知的且通常包括一段鹼性胺基酸(參見,例如,Lange等人,J. Biol. Chem . (2007)282:5101-5105)。於特定實施方式中,RGN包括2、3、4、5、6或更多個核定位訊號。(一或多個)核定位訊號可為異源NLS。有用於目前揭露的RGN的核定位訊號的非限制性範例為SV40大T抗原、核質素及c-Myc的核定位訊號(參見,例如,Ray等人(2015)Bioconjug Chem 26(6):1004-7)。於特定實施方式中,RGN包括如SEQ ID NO:251或253所示的NLS序列。該RGN可在其N-端、C-端、或在N-端及C-端二者處包括一或更多NLS序列。例如,RGN可在N端區域處包括二個NLS序列,而在C端區域處包括四個NLS序列。
本領域已知將多肽定位於(多個)特定亞細胞位置的其他定位訊號序列亦可用於靶向RGN,包括但不限於質體定位序列、粒線體定位序列、及靶向質體及粒線體二者的雙靶向訊號序列(參見,例如,Nassoury及Morse (2005)Biochim Biophys Acta 1743:5-19;Kunze及Berger (2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;Herrmann及Neupert (2003)IUBMB Life 55:219-225;Soll (2002)Curr Opin Plant Biol 5:529-535;Carrie及Small (2013)Biochim Biophys Acta 1833:253-259;Carrie等人(2009)FEBS J 276:1187-1195;Silva-Filho (2003)Curr Opin Plant Biol 6:589-595;Peeters及Small (2001)Biochim Biophys Acta 1541:54-63;Murcha等人(2014)J Exp Bot 65:6301-6335;Mackenzie (2005)Trends Cell Biol 15:548-554;Glase等人(1998)Plant Mol Biol 38:311-338)。
於某些實施方式中,目前揭露的RNA引導的核酸酶包括促進該RGN的細胞攝取的至少一細胞穿透域。細胞穿透域為本領域已知的且通常包括數段帶正電荷的胺基酸殘基(亦即,聚陽離子細胞穿透域)、交替的極性胺基酸殘基及非極性胺基酸殘基(亦即,兩親性細胞穿透域)、或疏水性胺基酸殘基(亦即,疏水性細胞穿透域)(參見,例如,Milletti F.(2012)Drug Discov Today 17:850-860)。細胞穿透域的非限制性範例為來自人免疫不全病毒1的轉錄活化轉錄活化子(TAT)。
可將核定位訊號、質體定位訊號、粒線體定位訊號、雙靶向定位訊號、及/或細胞穿透域定位於RNA引導的核酸酶的胺端(N-端)、羧端(C-端)、或內部位置中。
目前揭露的RGN可經由連接子胜肽而直接或間接地與例如切割域、去胺酶域、或表現調節子域的效應子域融合。此域可被定位於RNA引導的核酸酶的N端、C端或內部位置處。於這些實施方式中的一些中,融合蛋白的RGN成分為無核酸酶活性的RGN。
於一些實施方式中,RGN融合蛋白包括切割域,該切割域為能夠切割多核苷酸(亦即,RNA、DNA或RNA/DNA雜交體)的任何域,並且包括但不限於限制性核酸內切酶及歸巢核酸內切酶(homing endonuclease),例如IIS型核酸內切酶(例如,Fok I)(參見,例如,Belfort等人(1997)Nucleic Acids Res. 25:3379-3388;Linn等人(編輯)Nucleases(核酸酶),冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press),1993)。
於其他實施方式中,RGN融合蛋白包括去胺酶域,該去胺酶域將核鹼基去胺,導致從一種核鹼基轉化為另一種核鹼基、並包括但不限於胞苷去胺酶或腺嘌呤去胺酶鹼基編輯器(參見,例如,Gaudelli等人(2017)Nature 551:464-471、美國公開號2017/0121693及2018/0073012、第9,840,699號美國專利及國際公開號WO/2018/027078)。
於一些實施方式中,RGN融合蛋白的效應子域可為表現調節子域,該表現調節子域為用來調升或調降轉錄的域。該表現調節子域可為表觀遺傳修飾域、轉錄抑制子域或轉錄活化域。
於這些實施方式中的一些中,RGN融合蛋白的表現調節子包括表觀遺傳修飾域,該表觀遺傳修飾域共價地修飾DNA或組蛋白以改變組蛋白結構及/或染色體結構,而不改變DNA序列,導致基因表現的變化(亦即,調升或調降)。表觀遺傳修飾的非限制性範例包括離胺酸殘基的乙醯化或甲基化、精胺酸甲基化、絲胺酸及蘇胺酸磷酸化、及組蛋白的離胺酸泛素化及類泛素化(sumoylation)、及DNA中胞嘧啶殘基的甲基化及羥甲基化。表觀遺傳修飾域的非限制性範例包括組蛋白乙醯基轉移酶域、組蛋白去乙醯基酶域、組蛋白甲基轉移酶域、組蛋白去甲基酶域、DNA甲基轉移酶域及DNA去甲基酶域。
於其他實施方式中,融合蛋白的表現調節子包括轉錄抑制子域,該轉錄抑制子域與例如RNA聚合酶及轉錄因子的轉錄控制元素及/或轉錄調節蛋白相互作用,以減少或終止至少一基因的轉錄。轉錄抑制子域為本領域已知的且包括但不限於類Sp1抑制子、IκB及Krüppel相關盒(KRAB)域。
於又一些其他實施方式中,融合蛋白的表現調節子包括轉錄活化域,該轉錄活化域與例如RNA聚合酶及轉錄因子的轉錄控制元素及/或轉錄調節蛋白相互作用,以增加或活化至少一基因的轉錄。轉錄活化域為本領域已知的且包括但不限於單純皰疹病毒VP16活化域及NFAT活化域。
目前揭露的RGN多肽可包括可檢測標記或純化標籤。可檢測標記或純化標籤可直接地或經由連接子胜肽間接地被定位於RNA引導的核酸酶的N-端、C-端或內部位置處。於這些實施方式中的一些中,融合蛋白的RGN成分為無核酸酶活性RGN。於其他實施方式中,融合蛋白的RGN成分為具切口酶活性RGN。
可檢測標記為可以看得見的或可以其他方式觀察到的分子。可檢測標記可與RGN融合為融合蛋白(例如,螢光蛋白),或者可為與RGN多肽耦合的、可視覺上檢測或以其他方式檢測的小分子。可與目前揭露的RGN融合為融合蛋白的可檢測標記包括任何可檢測的蛋白域,包括但不限於可用專一性抗體檢測的蛋白域或螢光蛋白。螢光蛋白的非限制性範例包括綠色螢光蛋白(例如,GFP、EGFP、ZsGreen1)及黃色螢光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可檢測標記的非限制性範例包括放射性標記,例如,3 H以及35 S。
RGN多肽亦可包括純化標籤,該純化標籤為從混合物(例如,生物樣品、培養基)中分離蛋白質或融合蛋白可使用的任何分子。純化標籤的非限制性範例包括生物素、myc、麥芽糖結合蛋白(MBP)、麩胱甘肽-S-轉移酶(GST)及3X FLAG標籤。III. 引導 RNA
本揭露內容提供引導RNA及編碼引導RNA的多核苷酸。術語「引導RNA」是指與標的核苷酸序列具有足夠互補性以與標的序列雜交並引導相關聯的RNA引導的核酸酶與標的核苷酸序列的序列專一性結合的核苷酸序列。因此,RGN各自的引導RNA為一或更多RNA分子(通常是一或二個),其可與RGN結合且引導RGN與特定標的核苷酸序列結合,且在RGN具有切口酶或核酸酶活性的那些實施方式中,還切割標的核苷酸序列。一般來說,引導RNA包括CRISPR RNA(crRNA)及轉錄活化CRISPR RNA(tracrRNA)。包括crRNA及tracrRNA二者的天然引導RNA通常包括二個單獨的RNA分子,這些RNA分子經由crRNA的重複序列及tracrRNA的抗重複序列彼此雜交。
CRISPR陣列內的天然直接重複序列的長度通常在28至37個鹼基對的範圍內,但該長度可在約23 bp至約55 bp之間變化。CRISPR陣列內的間隔序列的長度通常在約32至約38bp的範圍內。但長度可在約21 bp至約72 bp之間。每一個CRISPR陣列通常包括少於50個單位的CRISPR重複-間隔序列。CRISPR被轉錄為被稱為初級CRISPR轉錄本的長轉錄本的一部分,其包括CRISPR陣列的大部分。初級CRISPR轉錄本被Cas蛋白切割,以產生crRNA,或者在一些情況中,產生前驅crRNA(pre-crRNA),這些pre-crRNA被其他Cas蛋白進一步處理為成熟的crRNA。成熟的crRNA包括間隔序列及CRISPR重複序列。在前驅crRNA被處理為成熟(或經處理的)crRNA的一些實施方式中,成熟涉及去除約1至約6個或更多個5'、3'或5'及3'核苷酸。為了基因體編輯或靶向所關注的特定標的核苷酸序列的目的,在前驅crRNA分子成熟期間被去除的這些核苷酸對於產生或設計引導RNA不是必需的。
CRISPR RNA(crRNA)包括間隔序列及CRISPR重複序列。「間隔序列」為與所關注的標的核苷酸序列直接雜交的核苷酸序列。該間隔序列被工程化為與所關注的標的序列完全地或部分地互補。於各種實施方式中,間隔序列可包括約8個核苷酸至約30個核苷酸或更多個核苷酸。例如,該間隔序列的長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於一些實施方式中,間隔序列的長度為8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。於一些實施方式中,間隔序列的長度為約10至約26個核苷酸、或長度為約12至約30個核苷酸。於特定實施方式中,間隔序列的長度為約30個核苷酸。於一些實施方式中,間隔序列的長度為30個核苷酸。於一些實施方式中,當使用適合的比對演算法進行最佳比對時,間隔序列與其對應的標的序列之間的互補性程度為介於50%與99%之間或更高,包括但不限於包括約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,當使用適合的比對演算法進行最佳比對時,間隔序列與其對應的標的序列之間的互補性程度為50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。於特定實施方式中,間隔序列不含使用本領域已知的任何適合的多核苷酸折疊演算法可預測的二級結構,多核苷酸折疊演算法包括但不限於mFold(參見,例如Zuker及Stiegler(1981)Nucleic Acids Res . 9:133-148)及RNAfold(參見,例如Gruber等人(2008)Cell 106(1):23-24)。
CRISPR RNA重複序列包括核苷酸序列,該核苷酸序列或者獨自地或者與所雜交tracrRNA配合形成藉由該RGN分子識別的結構。於各種實施方式中,CRISPR RNA重複序列可包括約8個核苷酸至約30個核苷酸或更多個核苷酸。例如,CRISPR重複序列的長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於特定實施方式中,CRISPR重複序列的長度為8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。於一些實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA序列之間的互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA序列之間的互補性程度為50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
於特定實施方式中,CRISPR重複序列包括SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠引導本文所提供的關聯的RNA引導的核酸酶與所關注的標的序列的序列專一性結合。於某些實施方式中,野生型序列的活性CRISPR重複序列變異體包括與如SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性的核苷酸序列。於某些實施方式中,野生型序列的活性CRISPR重複序列片段包括如SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的核苷酸序列的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22個連續核苷酸。
於某些實施方式中,crRNA不是天然存在的。於這些實施方式中的一些中,特定的CRISPR重複序列在本質上不與工程化間隔序列連接,且該CRISPR重複序列被認為與間隔序列是異源的。於某些實施方式中,間隔序列為非天然存在的工程化序列。
轉錄活化的CRISPR RNA或tracrRNA分子包括核苷酸序列,該核苷酸序列包括具有與crRNA的CRISPR重複序列雜交的足夠互補性的區域,其在本文中被稱為抗重複區。於一些實施方式中,tracrRNA分子進一步包括具二級結構(例如,莖環)的區域、或在與其對應的crRNA雜交時形成二級結構。於特定實施方式中,tracrRNA的與CRISPR重複序列完全地或部分地互補的區域在分子的5'端,且該tracrRNA的3'端包括二級結構。此二級結構區域通常包括若干髮夾結構,包括被發現與抗重複序列相鄰的連接(nexus)髮夾。該連接在引導RNA與RGN之間形成相互作用的核心、並處於引導RNA、RGN與標的DNA之間的相交處。連接髮夾通常在髮夾莖的鹼基中具有保留的核苷酸序列,而且模體UNANNC (SEQ ID NO:132)存在於tracrRNA中的許多連接髮夾中。有趣的是,本發明的若干RGN使用在其連接髮夾的髮夾莖的鹼基中包括非典型序列的tracrRNA,其包括UNANNA、UNANNU、UNANNG及CNANNC(SEQ ID NO分別為:129、130、131及133)。該tracrRNA的3'端處常常存在端髮夾,其結構及數量可有所不同,但通常包括富含GC的Rho獨立轉錄終止子髮夾,其後在3'端處具有一串U。參見,例如Briner等人(2014)Molecular Cell 56:333-339、Briner及Barrangou(2016)Cold Spring Harb Protoc ;doi:10.1101/pdb.top090902及美國專利公開號2017/0275648,其每一者的全部內容藉由引用併入本文。
於各種實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的抗重複區包括約8個核苷酸至約30個核苷酸或更多個核苷酸。例如,tracrRNA抗重複序列與該CRISPR重複序列之間的鹼基配對區域的長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於特定實施方式中,tracrRNA抗重複序列與該CRISPR重複序列之間的鹼基配對區域的長度可為6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。於一些實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間的互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間的互補性程度為約或大於50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
於各種實施方式中,整個tracrRNA可包括約60個核苷酸至多於約210個核苷酸。例如,tracrRNA的長度可為約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約150、約160、約170、約180、約190、約200、約210或更多個核苷酸。於特定實施方式中,tracrRNA的長度為60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、150、160、170、180、190、200、210或更多個核苷酸。於特定實施方式中,tracrRNA的長度為約80至約90個核苷酸,長度為包括約80、約81、約82、約83、約84、約85、約86、約87、約88、約89及約90個核苷酸。於特定實施方式中,tracrRNA的長度為80至90個核苷酸,長度為包括80、81、82、83、84、85、86、87、88、89及90個核苷酸。
於特定實施方式中,tracrRNA包括SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠引導本文提供的相關聯RNA引導的核酸酶與所關注的標的序列的序列專一性結合。於某些實施方式中,野生型序列的活性tracrRNA序列變異體包括與如SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性的核苷酸序列。於某些實施方式中,野生型序列的活性tracrRNA序列片段包括如SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所示的核苷酸序列的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80或更多個連續核苷酸。
當二個序列在嚴格條件下彼此雜交時,可認為該二個多核苷酸序列基本上互補。同樣地,如果與RGN結合的引導RNA在嚴格條件下與標的序列結合,則認為RGN以序列專一性方式與特定標的序列結合。「嚴格條件」或「嚴格雜交條件」意指在該條件下二個多核苷酸序列彼此雜交的程度比與其他序列的雜交程度可檢測程度較大(例如,比背景至少高2倍)。嚴格條件為序列相依的、且在不同環境下將會不同。典型地,嚴格條件將是這樣的條件,其中:在pH 7.0至8.3,鹽類濃度小於約1.5 M Na離子,典型地約0.01至1.0 M Na離子濃度(或其它鹽類),且對於短序列(例如,10至50個核苷酸),溫度為至少約30 ℃,而對於長序列(例如,大於50個核苷酸),溫度為至少約60 ℃。藉由添加例如甲醯胺的去穩定劑亦可達到嚴格條件。範例性的低嚴格條件包括在37℃下以30至35%甲醯胺、1 M NaCl、1% SDS(十二基硫酸鈉)的緩衝溶液雜交並在50至55℃下以1X至2X SSC(20X SSC = 3.0 M NaCl/0.3 M檸檬酸三鈉)洗滌。範例性的中等嚴格條件包括在37℃下於40至45%甲醯胺、1.0 M NaCl、1% SDS中雜交並在55至60℃下在0.5X至1X SSC中洗滌。範例性的高嚴格條件包括在37℃下於50%甲醯胺、1 M NaCl、1% SDS中雜交及在60至65℃下在0.1X SSC中洗滌。可選地,洗滌緩衝液可包括約0.1%至約1%的SDS。雜交持續時間通常小於約24小時,通常約4至約12小時。洗滌時間的持續時間將至少為足以達到平衡的時間長度。
Tm為50%的互補標的序列與完全匹配的序列雜交的溫度(於所限界的離子強度及pH下)。對於DNA-DNA雜交體,Tm可以從Meinkoth及Wahl(1984)Anal. Biochem. 138:267-284的等式:Tm = 81.5℃ + 16.6 (log M) + 0.41 (%GC) - 0.61 (% form) - 500/L大致估計;其中M為單價陽離子的莫耳濃度,%GC為DNA中鳥苷和胞嘧啶核苷酸的百分比,%形式為雜交溶液中甲醯胺的百分比,以及L為鹼基對中的雜交體的長度。通常,嚴格條件被選擇為比在限定的離子強度和pH下比專一性序列及其互補序列的熱熔點(Tm)低約5℃。然而,極度嚴格條件可以在比熱熔點(Tm)低1、2、3或4℃下進行雜交及/或洗滌;中等嚴格條件可以在比熱熔點(Tm)低6、7、8、9或10℃下進行雜交及/或洗滌;低嚴格條件可在比熱熔點(Tm)低11、12、13、14、15或20℃下進行雜交及/或洗滌。本領域具有通常知識者將明白,使用該等式、雜交及洗滌組成物以及所需的Tm,雜交及/或洗滌溶液的嚴格性的變化被固有地描述。核酸雜交的廣泛指南可在Tijssen(1993)《生物化學和分子生物學實驗室技術—以核酸探針進行雜交》第I部分,第2章(Elsevier,紐約)(Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes, Part I, Chapter 2(Elsevier,New York));及Ausubel等人編輯(1995) Current Protocols in Molecular Biology,第2章(Greene Publishing and Wiley-Interscience,紐約)中得到。參見Sambrook等人(1989)《分子選殖:實驗室手冊》(第二版,冷泉港實驗室出版社,Plainview,紐約)(Molecular Cloning:A Laboratory Manual。
術語「序列專一性」亦可指,相較於與隨機化背景序列的結合,以更高頻率與標的序列結合。
引導RNA可為單引導RNA或雙引導RNA系統。單引導RNA包括單RNA分子上的crRNA及tracrRNA,而雙引導RNA系統包括存在於二個不同RNA分子上的crRNA及tracrRNA,其經由crRNA的CRISPR重複序列的至少一部分及tracrRNA的至少一部分而彼此雜交,其可與該crRNA的CRISPR重複序列完全地或部分地互補。於其中引導RNA為單引導RNA的那些實施方式中的一些實施方式中,crRNA與tracrRNA被連接子核苷酸序列分開。一般來說,為避免二級結構於連接子核苷酸序列的核苷酸內的形成或避免包括該核苷酸的二級結構的形成,連接子核苷酸序列為不包括互補鹼基的核苷酸序列。於一些實施方式中,crRNA與tracrRNA之間的連接子核苷酸序列的長度為至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12個或更多個核苷酸。於特定實施方式中,單引導RNA的連接子核苷酸序列的長度為至少4個核苷酸。於某些實施方式中,連接子核苷酸序列為如SEQ ID NO:249所示的核苷酸序列。
單引導RNA或雙引導RNA可被化學合成或經由體外轉錄合成。用於確定RGN與引導RNA之間的序列專一性結合的測定法為本領域已知的、並且包括但不限於表現的RGN與引導RNA之間的體外結合測定法,其可用可檢測的標記(如生物素)標記並用於下拉檢測測定法,其中,引導RNA:RGN錯合物是經由可檢測標記(例如,利用鏈黴親和磁珠)捕獲的。具與引導RNA無關的序列或結構的對照引導RNA可作為RGN與RNA的非專一性結合的陰性對照。於某些實施方式中,引導RNA為SEQ ID NO:4、11、18、25、32、39、46、53、59、66、73、79、86、92、99、106、113、120或126,其中該間隔序列可為任何序列且以多-N(poly-N)序列表示。
於某些實施方式中,引導RNA可作為RNA分子而被引入標的細胞、胞器或胚胎中。引導RNA可以在體外被轉錄或被化學合成。於其他實施方式中,將編碼引導RNA的核苷酸序列引入細胞、胞器或胚胎中。於這些實施方式中的一些中,編碼引導RNA的核苷酸序列可操作地被連接至啟動子(例如,RNA聚合酶III啟動子)。該啟動子可為天然啟動子或與編碼引導RNA的核苷酸序列異源。
於各種實施方式中,如本文所述,可以將引導RNA作為核糖核蛋白錯合物引入標的細胞、胞器或胚胎中,其中引導RNA與RNA引導的核酸酶多肽結合。
引導RNA經由該引導RNA與標的核苷酸序列的雜交而將關聯的RNA引導的核酸酶引導至所關注的特定標的核苷酸序列。標的核苷酸序列可包括DNA、RNA或二者的組合、且可為單股或雙股的。標的核苷酸序列可為基因體DNA(亦即,染色體DNA)、質體DNA、或RNA分子(例如,訊息RNA、核醣體RNA、轉移RNA、微RNA、小干擾RNA)。標的核苷酸序列可在體外或在細胞中被RNA引導的核酸酶結合(而於一些實施方式中被切割)。RGN靶向的染色體序列可為核、質體或粒線體的染色體序列。於一些實施方式中,標的核苷酸序列於標的基因體中是獨特的。
標的核苷酸序列與前間隔序列鄰近模體(PAM)相鄰。前間隔序列鄰近模體通常在距該標的核苷酸序列約1至約10個核苷酸內,包括距標的核苷酸序列約1、約2、約3、約4、約5、約6、約7、約8、約9或約10個核苷酸。於特定實施方式中,PAM在距離標的核苷酸序列1至10個核苷酸內,包括距標的核苷酸序列1、2、3、4、5、6、7、8、9或10個核苷酸。PAM可為標的序列的5'或3'。於一些實施方式中,PAM為目前揭露的RGN的標的序列的3'。通常,該PAM是約3-4個核苷酸的共通序列,但於特定實施方式中,PAM的長度可為2、3、4、5、6、7、8、9或更多個核苷酸。於各種實施方式中,目前揭露的RGN識別的PAM序列包括如SEQ ID NO:7、14、21、28、35、42、49、62、69、79、82、95、102、109或116所示的共通序列。
於特定實施方式中,具有SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的RNA引導的核酸酶或其變異體或片段結合與SEQ ID NO:7、14、21、28、35、42、49、62、69、79、82、95、102、109或116所示的PAM序列相鄰的標的核苷酸序列。於這些實施方式中的一些中,RNG與包括SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124分別所示的CRISPR重複序列或其活性變異體或片段及SEQ ID NO:120至128、140、142、145、147及148分別所示的tracrRNA序列或其活性變異體或片段的引導序列結合。該RGN系統被進一步描述於本說明書的範例1-3及表1及2中。
RGN APG05586(SEQ ID NO:63)的變異體被產生且具有SEQ ID NO:570-579的胺基酸序列。具有SEQ ID NO:63及570-579中任一者的RGN可結合與SEQ ID NO:79所示的PAM序列相鄰的標的核苷酸序列。於一些實施方式中,RGN APG05586的變異體與包括SEQ ID NO:64所示的CRISPR重複序列的引導序列結合且亦可包括SEQ ID NO:65所示的tracrRNA序列。這些RGN系統被進一步描述於本說明書的範例5中。
本領域中眾所周知,對於給定核酸酶酵素的PAM序列專一性受酵素濃度的影響(參見,例如,Karvelis等人(2015)Genome Biol 16:253),其可藉由改變用於表現RGN的啟動子或被遞送至細胞、胞器或胚胎的核糖核蛋白錯合物的量而被修飾。
在識別其對應的PAM序列時,RGN可在專一性切割位點切割標的核苷酸序列。如本文所使用的,切割位點是由標的核苷酸序列內的二個特定核苷酸組成,其之間的核苷酸序列被RGN切割。該切割位點可包括在5'或3'方向上自該PAM起的第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第7和第8、或第8和第9個核苷酸。於一些實施方式中,切割位點可在5'或3'方向上自該PAM起的10、11、12、13、14、15、16、17、18、19或20個以上的核苷酸。因RGN可切割標的核苷酸序列,導致交錯的末端,所以於一些實施方式中,基於該多核苷酸的正(+)股上的二個核苷酸與該PAM的距離及該多核苷酸的負(-)股上的二個核苷酸與該PAM的距離來界定該切割位點。III .編碼 RNA 引導的核酸酶、 CRISPR RNA / tracrRNA 的核苷酸
本揭露內容提供包括目前揭露的CRISPR RNA、tracrRNA及/或sgRNA的多核苷酸及包括編碼目前揭露的RNA引導的核酸酶、CRISPR RNA、tracrRNA及/或sgRNA的核苷酸序列的多核苷酸。本發明揭露的多核苷酸包括了包括或編碼CRISPR重複序列的那些多核苷酸,該CRISPR重複序列包括SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠引導關聯的RNA引導的核酸酶與所關注的標的序列的序列專一性結合。亦揭露包括或編碼tracrRNA的多核苷酸,該tracrRNA包括SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠將關聯RNA引導的核酸酶的序列專一性結合導向所關注的標的序列。還提供編碼RNA引導的核酸酶的多核苷酸,該RNA引導的核酸酶包括如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的胺基酸序列及其活性片段或變異體,其保持以RNA引導的序列專一性方式結合至標的核苷酸序列的能力。
術語「多核苷酸」或「核酸分子」的使用不旨在將本揭露內容限制於包括DNA的多核苷酸。本領域中具有通常知識者將認識到多核苷酸可包括核糖核苷酸(RNA)及核糖核苷酸與去氧核糖核苷酸的組合。此種去氧核糖核苷酸和核糖核苷酸包括天然存在的分子及合成類似物二者。這些包括胜肽核酸(PNA)、PNA-DNA嵌合體(chimer)、鎖核酸(LNA)及硫代磷酸酯連接的序列。本文所揭露的多核苷酸還包含所有形式的序列,包括但不限於單股形式、雙股形式、DNA-RNA雜交體、三股體結構(triplex structure)、莖環結構等等。
編碼RGN的核酸分子可針對於所關注的生物體中的表現而被密碼子最佳化。「密碼子最佳化的」編碼序列為使其密碼子使用頻率設計成模擬較佳密碼子使用頻率或特定宿主細胞的轉錄條件的多核苷酸編碼序列。由於核酸層次上的一或更多密碼子的改變使得轉譯的胺基酸序列未改變,所以該特定宿主細胞或生物體中的表現被增強。核酸分子可以全部或部分地被密碼子最佳化。密碼子表及提供一大範圍生物體的偏好資訊的其他參考文獻在本領域中是可得的(參見,例如,Campbell及Gowri(1990)Plant Physiol . 92:1-11,有關植物較佳密碼子使用的討論)。本領域中用於合成植物較佳基因或哺乳動物(例如,人類)密碼子最佳化的編碼序列的方法是可得的。參見,例如,第5,380,831號和第5,436,391號美國專利及Murray等人(1989)Nucleic Acids Res . 17:477-498,彼等藉由引用併入本文。
編碼本文中提供的RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸可在表現匣中提供,以用於在體外表現或在所關注的細胞、胞器、胚胎或生物體中表現。該匣可包括5'及3'調節序列,該5'及3'調節序列可操作地連接至編碼本文中提供的允許多核苷酸表現的RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸。該匣可額外含有至少一種額外基因或基因元素,以共轉化至該生物體內。如果包括額外基因或元素,則該組成被可操作地連接。術語「可操作地連接」旨在表達二個或更多個元素之間的功能性連接。例如,啟動子與所關注的編碼區域(例如,對RGN、crRNA、tracrRNA及/或sgRNA編碼的區域)之間的可操作地連接為允許所關注的編碼區域表現的功能性連接。可操作地連接的元素可為連續的或非連續的。當用於指二個蛋白質編碼區域的連結時,藉由可操作地連接意指該編碼區域在相同的閱讀框(reading frame)中。或者,可在多個表現匣上提供(一或多個)額外基因或元素。例如,編碼本發明揭露的RGN的核苷酸序列可存在於一個表現匣上,而編碼crRNA、tracrRNA或完整引導RNA的核苷酸序列可在各別表現匣上。此表現匣被提供有複數個限制性位點及/或重組位點,以使該多核苷酸的插入受調節區域的轉錄調節。該表現匣可額外含有選擇性標記基因。
表現匣於轉錄的5'-3'方向上可包括轉錄(而於一些實施方式中為轉譯)起始區域(亦即,啟動子)、本發明的RGN-、crRNA-、tracrRNA-及/或sgRNA-編碼多核苷酸、及於所關注的生物體中起作用的轉錄(而於一些實施方式中為轉譯)終止區域(亦即,終止區域)。本發明的啟動子能夠在宿主細胞中引導或驅動編碼序列的表現。調節區域(例如,啟動子、轉錄調節區域及轉譯終止區域)可與宿主細胞為內源或異源、或彼此為內源的或異源的。如本文所使用的,關於序列的「異源」為源自外來物種的序列,或者,如果來自相同物種,則為藉由蓄意的人為干預從其在組成及/或基因體位點上實質上被修飾的序列。如本文中所使用的,嵌合基因包括與轉錄起始區域可操作地連接的編碼序列,該轉錄起始區域與該編碼序列是異源的。
合宜的終止區域可從農桿菌A. tumefaciens )的Ti質體獲得,例如章魚肉鹼合成酶及胭脂鹼(nopaline)合成酶終止區域。亦參見Guerineau等人(1991)Mol. Gen. Genet. 262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人(1991)Genes Dev. 5:141-149;Mogen等人(1990)Plant Cell 2:1261-1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989)Nucleic Acids Res . 17:7891-7903;及Joshi等人(1987)Nucleic Acids Res. 15:9627-9639。
另外的調節訊號包括但不限於轉錄起始開始位點、操作子、活化子、增強子、其他調節元素、核醣體結合位點、起始密碼子、終止訊號等等。參見,例如, 第5,039,523號和第4,853,331號美國專利;EPO 0480762A2;Sambrook等人(1992),Molecular Cloning:A Laboratory Manual, Maniatis等人編輯(冷泉港實驗室出版社,冷泉港,紐約),以下稱「Sambrook 11」;Davis等人編輯(1980)Advanced Bacterial Genetics(冷泉港實驗室出版社,冷泉港,紐約)以及其中引用的參考文獻。
在製備表現匣時,可操縱各種DNA片段,以便在適宜的方向上及恰當的情況下於適宜閱讀框中提供DNA序列。為此,可以運用銜接子或連接子來結和DNA片段,或者可涉及其他操縱以提供合宜的限制位點、移除多餘的DNA、移除限制位點等。為此目的,可涉及體外誘變、引子修復、限制、貼合(annealing)、重新取代,例如,轉換和置換(transversion)。
很多啟動子可用於本發明的實施。可基於期望的結果來選擇啟動子。該核酸可以與持續型、誘導型、生長階段特定、細胞類型特定、組織偏好、組織特定的啟動子或其他啟動子結合,以用於所關注的生物體中表現。參見,例如WO 99/43838中及第8,575,425號;第7,790,846號;第8,147,856號;第8,586832號;第7,772,369號;第7,534,939號;第6,072,050號;第5,659,026號;第5,608,149號;第5,608,144號;第5,604,121號;第5,569,597號;第5,466,785號;第5,399,680號;第5,268,463號;第5,608,142號;以及第6,177,611號美國專利中所示的啟動子;其藉由引用併入本文。
為了在植物中表現,持續型啟動子亦包括CaMV 35S啟動子(Odell等人(1985)Nature 313:810-812);水稻肌動蛋白(McElroy等人(1990)Plant Cell 2:163-171);泛素(Christensen等人(1989)Plant Mol. Biol. 12:619-632及Christensen等人(1992)Plant Mol. Biol. 18:675-689);pEMU(Last等人(1991)Theor. Appl. Genet. 81:581-588);及MAS(Velten等人(1984)EMBO J. 3:2723-2730)。
誘導型啟動子的範例為可藉由缺氧或冷逆境誘導的Adh1啟動子、可藉由熱逆境誘導的Hsp70啟動子、可由光誘導的PPDK啟動子及磷酸稀醇丙酮酸羧化酶(pepcarboxylase)啟動子。化學誘導的啟動子也是有用的,例如保護劑誘導的In2-2啟動子(第5,364,780號美國專利)、生長素誘導的且是絨氈層特定的但在癒傷組織中亦有活性的Axig1啟動子(PCT US01/22169)、類固醇反應性啟動子(參見,例如,Schena等人(1991)Proc. Natl. Acad. Sci. USA 88:10421-10425及McNellis等人(1998)Plant J . 14(2):247-257中的雌激素誘導的ERE啟動子及糖皮質激素誘導型啟動子)、及四環素誘導型和四環素抑制型啟動子(參見,例如Gatz等人(1991)Mol. Gen. Genet . 227:229-237及第5,814,618號及第5,789,156號美國專利),其藉由引用併入本文。
組織特定或組織偏好的啟動子來靶向特定組織內的表現構築體的表現。於某些實施方式中,組織特定或組織較佳的啟動子在植物組織中是有活性的。在植物中受發育控制的啟動子的範例包括在例如葉、根、果實、種子或花的某些組織中優先地起始轉錄的啟動子。「組織特定」啟動子為僅在某些組織中起動轉錄的啟動子。與基因的持續型表現不同,組織特定的表現是幾種水準的基因調節相互作用的結果。這樣,來自同源或密切相關的植物物種的啟動子可較佳地用於在特定組織中實現轉基因的有效且可靠的表現。於一些實施方式中,表現包括組織偏好的啟動子。「組織偏好的」啟動子是較佳地在、但不一定完全在或僅在某些組織中起始轉錄的啟動子。
於一些實施方式中,編碼RGN、crRNA及/或tracrRNA的核酸分子包括細胞類型特定啟動子。「細胞類型特定」啟動子為主要在一或更多器官中的某些細胞類型中驅動表現的啟動子。例如,其中在植物中起作用的細胞類型特定啟動子可為主要具有活性的植物細胞的一些範例包括BETL細胞、根、葉中的維管細胞、柄細胞及幹細胞(stem cell)。核酸分子還可包括細胞類型偏好的啟動子。「細胞類型偏好的」啟動子為主要驅動大部分在、但不一定完全在或僅在一或更多器官中的某些細胞類型中的表現的啟動子。例如,其中在植物中起作用的細胞類型偏好的啟動子可優先具有活性的植物細胞的一些範例包括BETL細胞、根、葉中的維管細胞、柄細胞及幹細胞。
編碼該RGN、crRNA、tracrRNA及/或sgRNA的核酸序列可與例如藉由用於體外mRNA合成的噬菌體RNA聚合酶識別的啟動子序列可操作地連接。於此類實施方式中,可純化體外轉錄的RNA,以用於本文所述的方法。例如,該啟動子序列可為T7、T3或SP6啟動子序列、或T7、T3或SP6啟動子序列的變異體。於此類實施方式中,可純化表現的蛋白及/或RNA,以用於本文所述的基因體修飾的方法。
於某些實施方式中,編碼RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸亦可與多腺苷酸化訊號(例如,SV40 polyA訊號及植物中起作用的其他訊號)及/或至少一轉錄終止序列連接。另外,編碼RGN的序列亦可與編碼至少一核定位訊號、至少一細胞穿透域及/或能夠將蛋白質運輸至特定亞細胞部分的至少一訊號胜肽的(一或多個)序列連接,如本文中別處所述。
編碼該RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸可存在於載體或多個載體中。「載體」指用於將核酸轉移、遞送或引入宿主細胞內的多核苷酸組成物。適合的載體包括質體載體、噬菌粒、黏接質體、人工/微型染色體、轉位子及病毒載體(例如,慢病毒載體、腺關聯病毒載體、桿狀病毒載體)。該載體可包括額外的表現控制序列(例如,增強子序列、Kozak序列、聚腺苷酸化序列、轉錄終止序列)、選擇性標記序列(例如,抗生素抗性基因)、複製起點等等。額外資訊可在「Current Protocols in Molecular Biology」Ausubel等人、John Wiley & Sons,紐約,2003;或 「Molecular Cloning:A Laboratory Manual」Sambrook & Russell,Cold Spring Harbor Press, Cold Spring Harbor, N.Y., 3rd edition, 2001中找到。
該載體亦可包括用於選擇轉化細胞的選擇性標記基因。使用選擇性標記基因以用於轉化的細胞或組織的選擇。標記基因包括:編碼抗生素抗性的基因,例如,編碼新黴素磷酸轉移酶II(NEO)和潮黴素磷酸轉移酶(HPT)的基因;以及對例如草銨膦、溴苯腈、咪唑啉酮及2,4-二氯苯氧乙酸鹽(2,4-D)之類的除草性化合物賦予抗性的基因。
於一些實施方式中,包括編碼RGN多肽的序列的表現匣或載體可進一步包括編碼crRNA及/或tracrRNA或者被組合以創建引導RNA的crRNA及tracrRNA的序列。編碼crRNA及/或tracrRNA的(一或多個)序列可與至少一轉錄控制序列可操作地連接,用於在所關注的生物體或宿主細胞中表現crRNA及/或tracrRNA。例如,編碼crRNA及/或tracrRNA的多核苷酸可與由RNA聚合酶III(Pol III)識別的啟動子序列可操作地連接。適合的Pol III啟動子的範例包括但不限於哺乳動物U6、U3、H1及7SL RNA啟動子及水稻U6及U3啟動子。
如所指出的,包括編碼RGN、crRNA、tracrRNA及/或sgRNA的核苷酸序列的表現構築體可用於轉化所關注的生物體。用於轉化的方法涉及將核苷酸構築體引入所關注的生物體內。藉由「引入」旨在以使得構築體能夠進入宿主細胞內部的方式將核苷酸構築體引至宿主細胞。本發明的方法不需要將核苷酸構築體引至宿主生物體的特定方法,僅在於核苷酸構築體能夠進入宿主生物體的至少一細胞內部。宿主細胞可為真核細胞或原核細胞。於特定實施方式中,真核宿主細胞為植物細胞、哺乳動物細胞、鳥類細胞或昆蟲細胞。於一些實施方式中,包括或表現目前揭露的RGN或已由目前揭露的RGN修飾的真核細胞為人細胞。於一些實施方式中,包括或表現本發明揭露的RGN或已藉由本發明揭露的RGN修飾的真核細胞為造血源的細胞,例如,免疫細胞(亦即,先天或適應性免疫系統的細胞),包括括但不限於:B細胞、T細胞、自然殺手(NK)細胞、富潛能幹細胞、經誘導的多潛能幹細胞、嵌合抗原受體T(CAR-T)細胞、單核球、巨噬細胞及樹突細胞。
用於將核苷酸構築體引入植物及其他宿主細胞內的方法為本領域已知的,其包括但不限於穩定轉化方法、短暫轉化方法及病毒介導方法。
這些方法得到轉化的生物體,例如植物,包括整株植物以及植物器官(例如,葉、莖、根等)、種子、植物細胞、繁殖體、胚胎及其後代。植物細胞可以是分化的或未分化的(例如,癒傷組織、懸浮培養細胞、原生質體、葉細胞、根細胞、韌皮部細胞、花粉)。
「轉基因生物」或「轉化生物」或「穩定轉化的」生物或細胞或組織指已併入或整合了編碼本發明的RGN、crRNA及/或tracrRNA的多核苷酸的生物。應當認識到,其他外源或內源核酸序列或DNA片段亦可被併入該宿主細胞內。農桿菌 及基因槍介導的轉化仍然為用於植物細胞轉化的兩種主要採用的方法。然而,宿主細胞的轉化可藉由感染、轉染、顯微注射、電穿孔、微噴射、基因槍或粒子轟擊、電穿孔、二氧化矽/碳纖維、超音波介導、PEG介導、磷酸鈣共沉澱、聚陽離子DMSO技術、DEAE葡聚醣(dextran)程序、及病毒介導的、脂質體介導的之類的來進行。編碼RGN、crRNA及/或tracrRNA的多核苷酸的病毒介導的引入包括反轉錄病毒、慢病毒、腺病毒及腺關聯病毒介導的引入及表現、以及花椰菜嵌紋病毒、雙生病毒及RNA植物病毒的使用。
轉化操作流程以及用於將多肽或多核苷酸序列引入植物內的操作流程可根據針對轉化所靶向的宿主細胞的類型(例如,單子葉植物或雙子葉植物細胞)而不同。用於轉化的方法為本領域已知的,且包括第8,575,425號、第7,692,068號、第8,802,934號、第7,541,517號美國專利中闡述的那些方法,這些專利中的每一者都藉由引用併入本文。亦參見Rakoczy-Trojanowska, M.(2002)Cell Mol Biol Lett. 7:849-858;Jones等人(2005)Plant Methods 1:5;Rivera等人(2012)Physics of Life Reviews 9:308-345;Bartlett等人(2008)Plant Methods 4:1-12;Bates, G.W.(1999)Methods in Molecular Biology 111:359-366;Binns及Thomashow(1988),Microbiology 42:575-606中的Annual Reviews ;Christou, P.(1992)The Plant Journal 2:275-281;Christou, P.(1995)Euphytica 85:13-27;Tzfira等人(2004)TRENDS in Genetics 20:375-383;Yao等人(2006)Journal of Experimental Botany 57:3737-3746;Zupan及Zambryski(1995)Plant Physiology 107:1041-1047;Jones等人(2005)Plant Methods 1:5。
轉化可導致核酸穩定或短暫併入細胞內。「穩定轉化」噬指引入宿主細胞的核苷酸構築體整合至該宿主細胞的基因體內、且能夠被其子代遺傳。「短暫轉化」是指將多核苷酸引入宿主細胞內,並且不整合至該宿主細胞的基因體中。
用於葉綠體轉化的方法為本領域已知的,參見,例如,Svab等人(1990)Proc. Nail. Acad. Sci. USA 87:8526-8530;Svab及Maliga (1993)Proc. Natl. Acad. Sci. USA 90:913-917;Svab及Maliga(1993)EMBO J. 12:601-606。該方法取決於含有選擇性標記的DNA的粒子槍遞送及經由同源重組將該DNA靶向該質體基因體。另外,質體轉化可藉由核編碼的及質體導向的RNA聚合酶的組織偏好表現來轉錄活化沉默的質體攜帶轉基因來實現。McBride等人(1994)在Proc. Natl. Acad. Sci. USA 91:7301-7305已報導了這樣的系統。
根據傳統方式,已轉化的細胞可生長成轉基因生物,例如,植物。參見,例如,McCormick等人(1986)Plant Cell Reports 5:81-84。然後,可以使這些植物生長,並用相同轉化株或不同株進行授粉,並鑑定出具有期望表現型特徵的持續型表現的所得雜交體。可生長二代或更多代,以確保穩定維持並遺傳期望表現型特徵的表現,然後,收穫種子,以確保已經達成期望表現型特徵的表現。以此方式,本發明提供具有穩定地併入其基因體內的本發明的核苷酸構築體(例如,本發明的表現匣)的轉化種子(亦稱為「轉基因種子」)。
或者,可將已轉化的細胞引入生物內。這些細胞可源自該生物,其中該細胞以離體方法被轉化。
本文提供的序列可用於轉化任何植物物種,包括但不限於單子葉植物及雙子葉植物。所關注的植物的範例包括但不限於:玉蜀黍(玉米)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥及油菜、甘藍型油菜(Brassica sp.)、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包括但不限於番茄、萵苣、綠豆、皇帝豆、豌豆、及例如黃瓜、哈密瓜及洋香瓜之類的甜瓜(Curcumis)屬的成員。觀賞植物包括但不限於:杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、耶誕紅及菊花。較佳地,本發明的植物為農作物(例如,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
如本文所使用的,術語「植物」包括植物細胞、植物原生質體、可從其再生植物的植物細胞組織培養物、植物愈傷組織、植物叢、及在植物或植物的部分中完整的植物細胞(例如胚胎、花粉、胚珠、種子、葉子、花、枝、果實、仁、穗、玉米穗軸、殼、莖、根、根尖、花藥等)。穀物意指由商業種植者出於生長或繁殖物種以外的目的而生產的成熟種子。再生植物的子代、變異體及突變體亦包括於本發明的範圍內,前提條件是這些部分包括所引入的多核苷酸。進一步提供了保留本文揭露的序列的經處理的植物產品或副產物,包括例如豆粕。
編碼RGN、crRNA及/或tracrRNA的多核苷酸亦可用於轉化任何原核物種,包括但不限於古菌和細菌(例如,芽孢桿菌克雷伯菌屬Klebsiella sp. )、鏈黴菌屬根瘤菌屬埃希氏菌屬Escherichia sp. )、假單胞菌屬沙門氏菌屬志賀氏桿菌屬弧菌屬耶爾森氏菌屬黴漿菌 農桿菌屬乳酸桿菌屬
編碼RGN、crRNA及/或tracrRNA的多核苷酸可用於轉化任何真核物種,包括但不限於動物(例如,哺乳動物、昆蟲、魚類、鳥類及爬蟲類物)、真菌、變形蟲、藻類及酵母。
傳統的基於病毒和非病毒的基因轉移方法可用於將核酸引入哺乳動物、昆蟲或鳥類細胞或標的組織中。此種方法可用於將編碼RGN系統組成的核酸投予培養物中的細胞或宿主生物中的細胞。非病毒載體遞送系統包括DNA質體、RNA(例如,本文描述的載體的轉錄本)、裸核酸、及與例如脂質體的遞送載體錯合的核酸。病毒載體遞送系統包括DNA及RNA病毒,其在遞送至細胞後具有附加型或整合的基因體。有關基因治療程序的綜述,參見Anderson,Science 256:808- 813 (1992);Nabel & Feigner,TIBTECH 11:211-217 (1993);Mitani & Caskey,TIBTECH 11:162-166 (1993);Dillon,TIBTECH 11:167-175 (1993);Miller,Nature 357:455-460 (1992);Van Brunt,Biotechnology 6(10):1149-1154 (1988);Vigne,Restorative Neurology and Neuroscience 8:35-36 (1995);Kremer & Perricaudet,British Medical Bulletin 51(1):31-44 (1995);Haddada等人,於Current Topics in Microbiology and Immunology, Doerfler及Bohm(編輯)(1995);及Yu等人,Gene Therapy 1:13-26 (1994)。
核酸的非病毒遞送方法包括脂質體轉染、核轉染、顯微注射、基因槍、病毒體、脂質體、免疫脂質體、聚陽離子或脂質:核酸共軛物、裸DNA、人工病毒粒子及DNA的藥劑增強攝取。例如,第5,049,386號、第4,946,787號及第4,897,355號美國專利中描述了脂質體轉染,且脂質體轉染試劑是市售的(例如,Transfectam ™及Lipofectin™)。適合用於多核苷酸的有效受體識別脂質體轉染的陽離子及中性脂質包括Feigner的WO 91/17424;WO 91/16024中的那些陽離子和中性脂質。遞送可為至細胞(例如,在體外或離體地投予)或標的組織(例如,體內投予)。脂質:核酸錯合物(包括靶向的脂質體,例如免疫脂質錯合物)的製備為本領域中具有通常知識者所熟知(參見,例如,Crystal,Science 270:404-410(1995);Blaese等人,Cancer Gene Ther. 2:291- 297(1995);Behr等人,Bioconjugate Chem. 5:382-389(1994);Remy等人,Bioconjugate Chem. 5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res. 52:4817-4820(1992);第4,186,183號、第4,217,344號、第4,235,871號、第4,261,975號、第4,485,054號、第4,501,728號、第4,774,085號、第4,837,028號及第4,946,787號美國專利)。
使用基於RNA或DNA病毒的系統來遞送核酸利用高度進化的過程將病毒靶向體內的特定細胞且將病毒負載運輸至該細胞核。病毒載體可被直接投予患者(體內),或者該病毒載體可用於體外處理細胞,並且可視情況將經修飾的細胞投予患者(離體)。傳統的基於病毒的系統可包括用於基因轉移的反轉錄病毒、慢病毒、腺病毒、腺關聯及單純皰疹病毒載體。用反轉錄病毒、慢病毒及腺關聯病毒基因轉移方法,在宿主基因體中的整合是可能的,常常導致所插入的轉基因的長期表現。另外,在許多不同細胞類型及標的組織中已經觀察到高轉導效率。
反轉錄病毒的向性(tropism)可藉由併入外來套膜蛋白而被改變,從而擴大標的細胞的潛在標的族群。慢病毒載體為能夠轉導或感染非分裂細胞並且通常情況下產生高病毒力價的反轉錄病毒載體。因此,反轉錄病毒基因轉移系統的選擇將取決於該標的組織。反轉錄病毒載體由順式作用長端重複序列構成,該順式作用長端重複序列具有達到6-10 kb的外來序列的包裝能力。最小順式作用LTR足以複製及包裝載體,然後,使用其將治療性基因整合至標的細胞內,以提供永久性轉基因表現。廣泛使用的反轉錄病毒載體包括基於小鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猿猴免疫不全病毒(SIV)、人免疫不全病毒(HIV)及其組合的那些載體(參見,例如,Buchscher等人,J. Viral. 66:2731-2739(1992);Johann等人,J. Viral. 66:1635-1640(1992);Sommnerfelt等人,Viral. 176:58-59(1990);Wilson等人,J. Viral. 63:2374-2378(1989);Miller 等人,1 . Viral. 65:2220-2224(1991);PCT/US94/05700)。
在偏好短暫表現的應用中,可使用基於腺病毒的系統。基於腺病毒的載體在許多細胞類型中能夠有非常高的轉導效率,並且不需要細胞分裂。使用這樣的載體,已經獲得了高力價及高表現水準。此載體可在相對簡單的系統中大量產生。腺關聯病毒(“AAV”)載體亦可例如在核酸及胜肽的體外生產中用於轉導具有標的核酸的細胞、且用於體內及離體基因治療程序(參見,例如,West 等人,Virology 160:38-47(1987); 第4,797,368號美國專利;WO 93/24641;Katin,Human Gene Therapy 5:793-801(1994);Muzyczka,1 . Clin. Invest. 94:1351(1994))。重組AAV載體的構築描述於很多出版物中,包括第5,173,414號美國專利;Tratschin等人,Mol. Cell. Biol. 5:3251-3260(1985);Tratschin等人,Mol. Cell. Biol. 4:2072-2081(1984);Hermonat & Muzyczka,PNAS 81:6466-6470(1984);及Samulski等人,1 . Viral. 63:03822-3828(1989)。包裝細胞通常用於形成能夠感染宿主細胞的病毒顆粒。此種細胞包括包裝腺病毒的293細胞和包裝反轉錄病毒的ψJ2細胞或PA317細胞。
基因療法中使用的病毒載體通常藉由產生將核酸載體包裝於病毒顆粒中的細胞株而被產生。該載體通常含有用於包裝且隨後整合至宿主中所需的最小病毒序列,其他病毒序列被用於要表現的多核苷酸的表現匣替代。缺失的病毒功能通常由包裝細胞株以反式提供。例如,基因治療中使用的AAV載體通常僅具有包裝及整合至宿主基因體中所需的來自AAV基因體的ITR序列。病毒DNA被包裝於細胞株中,該細胞株含有編碼其他AAV基因的輔助質體,即rep及cap,但缺少ITR序列。
亦可用腺病毒作為輔助體(helper)來感染細胞株。輔助病毒促進AAV載體的複製及來自輔助質體中的AAV基因的表現。由於缺少ITR序列,沒有大量包裝該輔助質體。腺病毒的污染可藉由例如熱處理來降低,腺病毒對熱處理比對AAV更敏感。用於將核酸遞送至細胞的其他方法為本領域中具有通常知識者已知的。參見,例如,US20030087817,其藉由引用併入本文。
於一些實施方式中,用本文描述的一或更多載體短暫地或非短暫地轉染宿主細胞。於一些實施方式中,細胞在其天然存在於個體中時被轉染。於一些實施方式中,被轉染的細胞取自個體。於一些實施方式中,細胞取得自取自個體的細胞,例如細胞株。於一些實施方式中,細胞株可為哺乳動物、昆蟲或鳥類細胞。用於組織培養的多種細胞株為本領域已知的。細胞株的範例包括但不限於:C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01 、 LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4. COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚胎纖維母細胞、3T3 Swiss、3T3-Ll、132-d5人胎兒纖維母細胞;10.1小鼠纖維母細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I 細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/ R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY 細胞、K562細胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-lA/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THPl細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR及其轉基因品種。細胞株可從本領域中具有通常知識者已知的多種來源獲得(參見,例如,美國菌種保存中心(American Type Culture Collection)(ATCC)(馬納沙斯,維吉尼亞州))。
於一些實施方式中,使用用本文描述的一或更多載體轉染的細胞用於建立包括一或更多載體衍生序列的新細胞株。於一些實施方式中,使用如本文描述的RGN系統的組成短暫轉染的(例如,藉由一或更多載體的短暫轉染,或用RNA轉染)並經由RGN系統的活性修飾的細胞建立包括含有該修飾但缺少任何其他外源序列的細胞的新細胞株。於一些實施方式中,使用用本文描述的一或更多載體暫時或非暫時轉染的細胞或自此種細胞取得的細胞株來評估一或更多測試化合物。
於一些實施方式中,使用本文描述的一或更多載體來產生非人的轉基因動物或轉基因植物。於一些實施方式中,轉基因動物為哺乳動物,例如,小鼠、大鼠、倉鼠、兔子、母牛或豬。於一些實施方式中,轉基因動物為鳥,例如,雞或鴨。於一些實施方式中,轉基因動物為昆蟲,例如,蚊子或蜱。IV. 多肽及多核苷酸的變異體及片段
本揭露內容提供:天然存在的(即,野生型)RNA引導的核酸酶的活性變異體及片段,其胺基酸序列如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示;以及天然存在的CRISPR重複子的活性變異體和片段,例如,SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的序列;以及天然存在的tracrRNA的活性變異體和片段,例如,SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所列的序列;以及編碼該些序列的多核苷酸。
儘管與所關注的多核苷酸或多肽相較下,可以改變變異體或片段的活性,但該變異體及片段應保留所關注的多核苷酸或多肽的功能性。例如,當與所關注的多核苷酸或多肽相較時,變異體或片段可具有增加的活性、降低的活性、不同的活性譜或活性的任何其他改變。
例如本文所揭露的天然存在的RGN多肽的片段及變異體將保留序列專一性的RNA引導的DNA結合活性。於特定實施方式中,例如本文所揭露的天然存在的RGN多肽的片段及變異體將保留核酸酶活性(單股或雙股)。
例如本文所揭露的天然存在的CRISPR重複子的片段及變異體當作為引導RNA(包括tracrRNA)的一部分時,將保留以序列專一性方式結合並將RNA引導的核酸酶(與引導RNA錯合)引導至標的核苷酸序列的能力。
例如本文所揭露的天然存在的tracrRNA的片段及變異體為引導RNA(包括CRISPR RNA)的一部分時,將保留以序列專一性方式將RNA引導的核酸酶(與該引導RNA錯合)引導至標的核苷酸序列的能力。
術語「片段」指本發明的多核苷酸或多肽序列的一部分。「片段」或「生物活性部分」包括多核苷酸,該多核苷酸包括足夠數量的連續核苷酸,以保留該生物活性(亦即,當包括於引導RNA中時,以序列專一性方式結合RNA至並將RGN引導至標的核苷酸序列)。「片段」或「生物活性部分」包括多肽,該多肽包括足夠數量的連續胺基酸殘基,以保留生物活性(亦即,當與引導RNA錯合時,以序列專一性方式與標的核苷酸序列結合)。RGN蛋白的片段包括由於使用替代的下游開始位點而比全長序列短的那些片段。RGN蛋白的生物活性部分可為包括例如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的10、25、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700或更多個連續胺基酸殘基的多肽。此類生物活性部分可藉由重組技術而被製備並針對序列專一性的RNA引導的DNA結合活性而被評估。CRISPR重複序列的生物活性片段可包括SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的至少8個連續胺基酸。CRISPR重複序列的生物活性部分可為包括例如SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的8、9、10、11、12、13、14、15、16、17、18、19、20、21或22個連續核苷酸的多核苷酸。tracrRNA的生物活性部分可為包括例如SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110或更多個連續核苷酸的多核苷酸。
一般來說,「變異體」旨在意指基本上相似的序列。對於多核苷酸,變異體包括天然多核苷酸中的一或更多內部位點處的一或更多核苷酸的缺失及/或添加及/或於天然多核苷酸中的一或更多位點處的一或更多核苷酸的取代。如本文所使用的,「天然」或「野生型」多核苷酸或多肽分別包括天然存在的核苷酸序列或胺基酸序列。對於多核苷酸,保留式(conservative)變異體包括因為遺傳密碼的簡併(degeneracy)而編碼所關注基因的天然胺基酸序列的那些序列。例如可使用眾所周知的分子生物學技術鑑定(例如,利用如以下概述的聚合酶連鎖反應(PCR)及雜交技術)的天然存在的對偶變異體。變異體多核苷酸亦包括合成衍生的多核苷酸,例如那些例如藉由使用定點誘變產生的但其仍然編碼所關注的多肽或多核苷酸。通常,與如藉由本文別處描述的序列比對程式及參數所確定的,本文所揭露的特定多核苷酸的變異體將與如藉由本文別處描述的序列比對程式及參數所確定的那個特定多核苷酸具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性。
本文所揭露的特定多核苷酸的變異體(亦即,該參考多核苷酸)亦可藉由比較由變異體多核苷酸所編碼的多肽與由該參考多核苷酸所編碼的多肽之間的序列一致性百分比來評估。可使用本文別處描述的序列比對程式及參數來計算任何二個多肽之間的序列一致性百分比。當藉由比較本文揭露的任何給定的多核苷酸對所編碼的兩個多肽共同的序列一致性百分比來評估本文揭露的任何給定的多核苷酸對時,該二個經編碼的多肽之間的序列一致性百分比為至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性。
於特定實施方式中,本發明揭露的多核苷酸編碼RNA引導的核酸酶多肽,該RNA引導的核酸酶多肽包括的胺基酸序列與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的胺基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性。於一些實施方式中,SEQ ID NO:63的變異體維持在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。與第二胺基酸序列的特定位置「對應」的第一胺基酸序列的胺基酸位置指:當第一及第二胺基酸序列被最佳比對時,第一胺基酸序列中與該第二序列中的指定的胺基酸殘基位置對齊的位置。於特定實施方式中,SEQ ID NO:63的變異體與SEQ ID NO:63保持的這些胺基酸殘基(亦即,I305、V328、L366、T368及V405)外的SEQ ID NO:63具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高一致性。
本發明的RGN多肽的生物活性變異體可相差少至約1-15個胺基酸殘基、少至約1-10個(例如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個胺基酸殘基。於具體實施方式中,多肽可包括N端或C端截斷(truncation),該截斷可至少包括從該多肽的N端或C端缺失10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700個或更多個胺基酸。
於某些實施方式中,本發明揭露的多核苷酸包括或編碼CRISPR重複子,該CRISPR重複子包括與SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性的核苷酸序列。
本發明揭露的多核苷酸包括或編碼tracrRNA,該tracrRNA包括與SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性的核苷酸序列。
本發明的CRISPR重複子或tracrRNA的生物活性變異體可相差少至約1-15個胺基酸殘基、少至約1-10個(例如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個核苷酸。於具體實施方式中,多核苷酸可包括5'或3'截斷,其可至少包括從該多核苷酸的5'或3'端缺失10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、95、100、105、110個或更多個核苷酸。
應當認識到,可對本文提供的RGN多肽、CRISPR重複子及tracrRNA進行修飾,從而產生變異體蛋白及多核苷酸。人為設計的改變可經由定點誘變技術的應用而被引入。或者,在結構上及/或功能上與本文揭露的序列有關的天然的、未知的或尚未鑑定的多核苷酸及/或多肽亦可被認為落入本發明的範圍內。可在不改變該RGN蛋白功能的非保留區域中進行保留式胺基酸取代。或者,可進行改良RGN活性的修飾。
變異體多核苷酸和蛋白亦包括源自例如誘變及重組程序(例如DNA混排(DNA shuffling))取得的序列及蛋白。用這種程序,操縱本文所揭露的一或更多不同的RGN蛋白質(例如,SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579),以產生具有期望特性的新RGN蛋白。以這種方式,重組多核苷酸庫是從包括序列區域的相關序列多核苷酸的群體產生的,該序列區域具有基本序列一致性且可在體外或體內同源地重組。例如,使用這種方法,編碼所關注域的序列模體可在本文提供的RGN序列與其他已知RGN基因之間混排,以獲得對具有改良的所關注性質(例如在酵素的情況中,增加的Km )的蛋白質編碼的新基因。此種DNA混排的策略為本領域已知的。例如,參見Stemmer(1994)Proc. Natl. Acad. Sci. USA 91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri 等人(1997)Nature Biotech. 15:436-438;Moore等人(1997)J. Mol. Biol. 272:336-347;Zhang等人 1997 Proc. Natl. Acad. Sci. USA 94:4504-4509;Crameri等人(1998)Nature 391:288-291;及美國專利號5,605,793及5,837,458。「混排的」核酸為藉由混排程序(例如本文闡述的任何混排程序)產生的核酸。混排的核酸為藉由例如以人工方的及可選地遞迴的方式(物理地或虛擬地)重組二個或更多個核酸(或字符串)產生的。通常,混排過程中使用一或更多篩選步驟來識別所關注的核酸;此篩選步驟可在任何重組步驟之前或之後進行。在一些(但不是全部)混排實施方式中,期望在選擇之前執行多輪重組,以增加要篩選的池的多樣性。重組及選擇的整個過程可選地遞迴地重複。根據背景,混排可指重組及選擇的整個過程,或者可替代地,可僅指整個過程的重組部分。
如本文使用的,在二個多核苷酸或多肽序列的上下文中使用的「序列一致性」或「一致性」涉及到當在指定的比較窗上比對以獲得最大對應性時為相同的二個序列中的殘基。當使用與蛋白質有關的序列一致性百分比時,應當認識到,不同的殘基位置通常因保留式胺基酸取代而不同,其中胺基酸殘基被具有類似化學性質(例如,電荷或疏水性)的其他胺基酸殘基取代,且因此不會改變分子的功能特性。當序列在保留式取代方面不同時,可以向上調整序列一致性百分比,以校正取代的保留性質。藉由這種保留式取代而不同的序列被稱為具有「序列相似性」或「相似性」。用於進行此種調整的手段為本領域中具有通常知識者所熟知的。通常,此涉及將保留式取代計為部分誤配而非全部誤配,從而增加序列一致性百分比。因此,例如,在相同胺基酸的評分為1,且非保留式取代的評分為零的請況下,保留式取代的評分為0與1之間的計分。例如,以在程式PC/GENE(Intelligenetics,Mountain View,California)中實施的那樣,計算保留式取代的計分。
如本文所使用的,「序列一致性百分比」是指藉由在比較窗上比較二個最佳比對的序列所確定的值,其中比較窗中的多核苷酸序列的部位可包括相較於用於該二個序列的最佳比對的參考序列(不包括添加或缺失)的添加或缺失(亦即,缺口)。藉由確定在二個序列中出現相同核酸鹼基或胺基酸殘基的位置數以求得匹配位置數、將匹配位置數除以比較窗中的位置總數、以及將結果乘以100以求得序列一致性百分比,來計算該百分比。
除非另有說明,否則本文提供的序列一致性/相似性值指使用利用以下參數的GAP版本10獲得的值:使用GAP權重50及長度權重3以及nwsgapdna.cmp計分矩陣的核苷酸序列的%一致性及%相似性;使用GAP權重8及長度權重2以及BLOSUM62計分矩陣的胺基酸序列的%一致性及%相似性;或其任何等效程式。「等效程式」是指任何序列比較程式,當與GAP版本10產生的對應比對進行比較時,針對所涉及的任何二個序列,該序列比較程式產生具有相同核苷酸或胺基酸殘基匹配及相同序列一致性百分比的比對。
當使用所界定的胺基酸取代矩陣(例如,BLOSUM62)、缺口存在罰分(gap existence penalty)及缺口延伸罰分(gap extension penalty)比對二個序列,以達到該對序列可能的最高分數時,二個序列被「最佳比對」。胺基酸取代矩陣及其在量化該二個序列之間的相似性中的使用為在本領域所熟知的,並且被描述於例如Dayhoff等人(1978)「A model of evolutionary change in proteins(蛋白質演化變化的模型)」中;「Atlas of Protein Sequence and Structure(蛋白質序列及結構圖集)」,卷5, Suppl. 3(M. O. Dayhoff編輯),第345-352頁;Natl. Biomed. Res. Found.,華盛頓特區;及Henikoff等人(1992)Proc. Natl. Acad. Sci. USA 89:10915-10919中。BLOSUM62矩陣通常用作序列比對操作流程中的預設計分替換矩陣。缺口存在罰分實施於在其中一個比對序列中的引入單個胺基酸缺口,而缺口延伸罰分實施於插入已經打開的缺口中的每一個另外的空胺基酸位置。藉由比對開始和結束處的每一個序列的胺基酸位置、以及可選地藉由在一個或二個序列中插入一或多個缺口來達到最高可能計分來定義比對。儘管可以手動完成最佳比對和評分,但是該過程可藉由使用電腦實施的比對演算法(例如Altschul等人在(1997)Nucleic Acids Res . 25:3389-3402中所述、並且在國家生物技術資訊中心(National Center for Biotechnology Information)網站(www.ncbi.nlm.nih.gov)上向公眾開放的的有缺口BLAST 2.0)促進了該流程。可以使用例如經由www.ncbi.nlm.nih.gov可得的和Altschul等人在(1997)Nucleic Acids Res. 25:3389-3402中描述的PSI-BLAST來準備包括多重比對的最佳比對。
關於與參考序列最佳比對的胺基酸序列,胺基酸殘基「對應於」在該比對中的參考序列中該殘基與之配對的位置。該「位置」由數字表示,該數字基於其相對於N-端的位置依序識別該參考序列中的每一個胺基酸。由於在確定最佳比對時必須考慮的缺失、插入、截斷、融合等,通常藉由簡單地從N端計數即可確定的測試序列中的胺基酸殘基數目,不必與在該參考序列中其對應位置的數目相同。例如,在所比對的測試序列中存在缺失的情況中,將不存在與參考序列中缺失位點處的位置對應的胺基酸。在所比對的參考序列中有插入的情況下,該插入將不對應於該參考序列中的任何胺基酸位置。在截斷或融合的情況中,該參考序列或所比對的序列中可存在不對應於相應序列中的任何胺基酸的胺基酸段(stretch)。V. 抗體
亦包含針對本發明的RGN多肽或包括本發明的RGN多肽的核糖核蛋白,包括具有SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的胺基酸序列或其活性變異體或其片段的那些RGN多肽或核糖核蛋白。產生抗體的方法為本領域所熟知的(參見,例如,Harlow及Lane(1988)Antibodies:A Laboratory Manual,冷泉港實驗室,冷泉港,紐約(Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.);及第4,196,265號美國專利)。這些抗體可用於套組中,用於RGN多肽或核糖核蛋白的檢測及分離。因此,本揭露內容提供了包括專一性結合至本文描述的多肽或核糖核蛋白的抗體的套組,該多肽或核糖核蛋白包括例如具有SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的序列的多肽。VI. 用於結合所關注的標的序列的系統和核糖核蛋白錯合物及其製造方法
本揭露內容提供一種用於結合所關注的標的序列的系統,其中該系統包括至少一引導RNA或編碼該至少一引導RNA的核苷酸序列以及至少一RNA所引導的核酸酶或編碼該至少一RNA引導的核酸酶的核苷酸序列。該引導RNA與所關注的標的序列雜交、且亦與該RGN多肽形成錯合物,從而引導該RGN多肽與該標的序列結合。於這些實施方式中的一些中,RGN包括SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的胺基酸序列或其活性變異體或片段。於各種實施方式中,引導RNA包括CRISPR重複序列,該CRISPR重複序列包括SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性變異體或片段。於一些特定實施方式中,引導RNA包括tracrRNA,該tracrRNA包括SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性變異體或片段。該系統的引導RNA可為單引導RNA或雙引導RNA。於一些特定實施方式中,系統包括與該引導RNA異源的RNA所引導的核酸酶,其中該RGN與引導RNA在本質上不是彼此錯合(亦即,彼此結合)。
本文提供的用於結合所關注的標的序列的系統可為核糖核蛋白錯合物,其是與至少一蛋白質結合的RNA的至少一分子。本文提供的核糖核蛋白錯合物包括作為該RNA組成的至少一引導RNA及作為該蛋白質組成的RNA所引導的核酸酶。可從天然表現RGN多肽的細胞或生物體中純化此類核糖核蛋白錯合物,並且此類核糖核蛋白錯合物已經被工程化,以表現對所關注的標的序列專一的特定引導RNA。或者,可從已用對RGN多肽及引導RNA進行編碼的多核苷酸轉化且在允許該RGN多肽及引導RNA表現的條件下培養的細胞或生物體中純化核糖核蛋白錯合物。因此,提供用於製造RGN多肽或RGN核糖核蛋白錯合物的方法。此類方法包括:在RGN多肽(而於一些實施方式中,引導RNA)被表現的條件下,培養包括對RGN多肽進行編碼的核苷酸序列的細胞,而且於一些實施方式中,培養包括對引導RNA進行編碼的核苷酸序列的細胞。然後,可從所培養的細胞的裂解產物中純化RGN多肽或RGN核糖核蛋白。
從生物樣本的溶解產物中純化RGN多肽或RGN核糖核蛋白錯合物的方法是本領域已知的(例如,粒徑篩析及/或親和層析法、2D-PAGE、HPLC、逆相層析法、免疫沉澱法)。在一些特定方法中,RGN多肽為重組產生的且包括有助於其純化的純化標籤,其包括但不限於:麩胱甘肽-S-轉移酶(GST)、幾丁質結合蛋白(CBP)、麥芽糖結合蛋白、硫氧還蛋白(TRX)、聚(NANP)、串接親和純化(TAP)標籤、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu- Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基載體蛋白(BCCP)及鈣調蛋白。通常,所標記的RGN多肽或RGN核糖核蛋白錯合物是使用固定化金屬親和層析法純化的。應當理解,可單獨地或組合地使用本領域已知的其他類似方法,包括其他形式的層析法或例如免疫沉澱法。
「分離的」或「純化的」多肽或其生物活性部分基本上或實質上不含在其天然存在的環境中發現的、正常情況下與該多肽相伴或交互作用的組成。因此,分離的或純化的多肽當藉由重組技術被產生時基本上不含其他細胞物質或培養基,或當被化學合成時基本上不含化學前驅物或其他化學物質。基本上不含細胞物質的蛋白質包括具有少於約30%、20%、10%、5%或1%(以乾重計)的污染蛋白質的蛋白質製劑。當重組產生本發明的蛋白質或其生物活性部分時,最佳培養基呈現少於約30%、20%、10%、5%或1%(以乾重計)的化學前驅物或所關注的非蛋白質化學物質。
本文所提供的用於結合及/或切割所關注的標的序列的特定方法涉及使用體外組裝的RGN核糖核蛋白錯合物。RGN核糖核蛋白錯合物的體外組裝可使用本領域已知的方法進行,其中在允許RGN多肽與引導RNA結合的條件下使RGN多肽與引導RNA接觸。如本文中所使用的,「接觸(contact、contacting)」、「接觸的(contacted)」指在適合進行期望反應的條件下,將期望反應的組成放在一起。RGN多肽可從生物樣本、細胞裂解產物或培養基中純化、經由體外轉換產生、或被化學合成。引導RNA可從生物樣本、細胞裂解產物或培養基中純化、在體外被轉錄、或被化學合成。可使RGN多肽及引導RNA在溶液(例如,緩衝鹽溶液)中接觸以允許RGN核糖核蛋白錯合物的體外組裝。VII. 結合、切割或修飾標的序列的方法
本揭露內容提供用於結合、切割及/或修飾所關注的標的核苷酸序列的方法。該方法包括向該標的序列或包括該標的序列的細胞、胞器或胚胎,遞送包括至少一引導RNA或編碼該至少一引導RNA的多核苷酸、以及至少一RGN多肽或編碼該至少一RGN多肽的多核苷酸的系統。於這些實施方式中的一些中,RGN包括SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的胺基酸序列或其活性變異體或片段。於各種實施方式中,引導RNA包括CRISPR重複序列,該CRISPR重複序列包括SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性變異體或片段。於特定實施方式中,引導RNA包括tracrRNA,該tracrRNA包括SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性變異體或片段。該系統的引導RNA可為單引導RNA或雙引導RNA。該系統的RGN可為無核酸酶活性的RGN,具有切口酶活性、或者可為融合多肽。於一些實施方式中,融合多肽包括鹼基編輯多肽,例如,胞苷去胺酶或腺苷去胺酶。於其他實施方式中,RGN融合蛋白包括反轉錄酶。於其他實施方式中,RGN融合蛋白包括多肽,該多肽加入功能性核酸修復錯合物的成員,例如,核苷酸切除修復(NER)或轉錄耦合的-核苷酸切除修復(TC-NER)路徑的成員(Wei 等人,2015,PNAS USA 112(27):E3495-504;Troelstra等人,1992,Cell 71:939-953;Marnef等人,2017,J Mol Biol 429(9):1277-1288),如2020年1月27日申請的第62/966,203號美國臨時專利申請案中所描述的,且該美國臨時專利申請案的全部內容藉由引用併入本文。於一些實施方式中,RGN融合蛋白包括CSB(van den Boom等人,2004,J Cell Biol 166(1):27-36;van Gool等人,1997,EMBO J 16(19):5955-65;其範例如SEQ ID NO:608所示),CSB為TC-NER(核苷酸切除修復)路徑的成員且在加入其他成員中產生功用。於另外的實施方式中,RGN融合蛋白包括CSB的活性域,例如,包括SEQ ID NO:608的胺基酸殘基356-394的CSB的酸性域(Teng等人,2018,Nat Commun 9(1):4115)。
於特定實施方式中,RGN及/或引導RNA對於該RGN及/或引導RNA(或編碼該RGN及引導RNA中的至少一者的多核苷酸)被引入到的細胞、胞器或胚胎為異源的。
於其中該方法包括遞送編碼引導RNA及/或RGN多肽的多核苷酸的那些實施方式中,細胞或胚胎可接著在引導RNA及/或RGN多肽被表現的條件下培養。於各種實施方式中,該方法包括使標的序列與RGN核糖核蛋白錯合物接觸。該RGN核糖核蛋白錯合物可包括無核酸酶活性或具有切口酶活性的RGN。於一些實施方式中,核糖核蛋白錯合物的RGN為包括鹼基編輯多肽的融合多肽。於某些實施方式中,該方法包括將RGN核糖核蛋白錯合物引入包括標的序列的細胞、胞器或胚胎中。RGN核糖核蛋白錯合物可為已從生物樣本中被純化、重組產生並隨後純化、或如本文所描述的體外組裝的錯合物。於其中與標的序列或細胞、胞器或胚胎接觸的RGN核糖核蛋白錯合物已經在體外被組裝的那些實施方式中,該方法可進一步包括該錯合物在與該標的序列、細胞、胞器或胚胎接觸之前的體外組裝。
可使用本領域已知的、包括但不限於電穿孔的任何方法將純化的或體外組裝的RGN核糖核蛋白錯合物引入細胞、胞器或胚胎內。或者,可使用本領域已知的任何方法(例如,電穿孔)將編碼或包括引導RNA的RGN多肽及/或多核苷酸引入細胞、胞器或胚胎內。
在遞送至或接觸標的序列或包括標的序列的細胞、胞器或胚胎時,引導RNA引導RGN以序列專一性方式與標的序列結合。於其中RGN具有核酸酶活性的那些實施方式中,RGN多肽在結合時切割所關注的標的序列。標的序列隨後可經由例如非同源末端連接或用所提供的供體多核苷酸進行同源介導修復之類的內源修復機制而被修飾。
測量RGN多肽與標的序列的結合的方法為本領域已知的、且包括染色質免疫沉澱測定法、凝膠遷移位移測定、DNA下拉測定、報導子測定(reporter assay)、微量盤捕獲及檢測測定。同樣地,測量標的序列的切割或修飾的方法為本領域已知的、且包括體外或體內切割測定法,其中在在有或沒有適當標記物(例如,放射性同位素、螢光物質)附接至標的序列以方便檢測降解產物的情況下,使用PCR、定序或凝膠電泳來確認切割。或者,可使用切口觸發的指數擴增反應(NTEXPAR)測定法(參見,例如,Zhang等人(2016)Chem. Sci. 7:4951-4957)。可使用Surveyor測定法來評估體內切割(Guschin等人(2010)Methods Mol Biol 649:247-256)。
於一些實施方式中,方法涉及使用與一個以上的引導RNA錯合的單一類型RGN。該一個以上的引導RNA可靶向單一基因的不同區域、或者可靶向多個基因。
在其中未提供供體多核苷酸的那些實施方式中,可藉由非同源末端連接(NHEJ)修復過程來修復由RGN多肽引入的雙股斷裂。由於NHEJ的易錯性質,雙股斷裂的修復可導致對標的序列的修飾。如本文所使用的,關於核酸分子的「修飾」是指核酸分子的核苷酸序列的變化,其可為一或更多核苷酸的缺失、插入或取代或其組合。標的序列的修飾可導致改變的蛋白質產物的表現或編碼序列的失活。
在其中存在供體多核苷酸的那些實施方式中,在修復所引入的雙股斷裂的過程中,供體多核苷酸中的供體序列可被整合至標的核苷酸序列中或與標的核苷酸序列交換,導致外源供體序列的引入。因此,供體多核苷酸包括期望被引入所關注的標的序列中的供體序列。於一些實施方式中,供體序列改變原始標的核苷酸序列,使得新整合的供體序列將不被該RGN識別及切割。供體序列的整合可藉由在供體多核苷酸中包括毗鄰序列來增強,該毗鄰序列與標的核苷酸序列兩側的序列具有基本的序列一致性、本文中被稱為「同源臂」,以允許同源引導的修復過程。於一些實施方式中,同源臂具有至少50個鹼基對、至少100個鹼基對及多達2000個鹼基對或更多個鹼基對的長度、且與其在該標的核苷酸序列內的對應序列具有至少90%、至少95%或更高序列同源性。
於其中RGN多肽引入雙股交錯斷裂的那些實施方式中,供體多核苷酸可包括側翼為相容突出部的供體序列,以允許在雙股斷裂的修復期間藉由非同源修復過程將供體序列直接連接至包括突出部的經切割的標的核苷酸序列。
於其中該方法涉及使用為切口酶(亦即,僅能夠切割雙股多核苷酸中的單股)的RGN的那些實施方式中,該方法可包括引入靶向相同或重疊的標的序列並切割該多核苷酸的不同股的二個RGN切口酶。例如,可將僅切割雙股多核苷酸的正(+)股的RGN切口酶與僅切割雙股多核苷酸的負(-)股的第二RGN切口酶一起引入。
於各種實施方式中,提供一種用於結合標的核苷酸序列並檢測該標的序列的方法,其中該方法包括將至少一引導RNA或編碼該至少一引導RNA的多核苷酸、以及至少一RGN多肽或編碼該至少一RGN多肽的多核苷酸引入細胞、胞器或胚胎中;表現該引導RNA及/或RGN多肽(如果編碼序列被引入),其中該RGN多肽為無核酸酶活性的RGN且進一步包括可檢測標記,並且該方法進一步包括檢測該可檢測標記。該可檢測標記可與該RGN融合為融合蛋白(例如,螢光蛋白),或者可為與RGN多肽接合或被併入RGN多肽中、可以用視覺或藉由其他方式檢測的小分子。
本文亦提供用於在標的序列的調控下調控所關注的標的序列或基因的表現的方法。該方法包括將至少一引導RNA或編碼該至少一引導RNA的多核苷酸、以及至少一RGN多肽或編碼該至少一RGN多肽的多核苷酸引入細胞、胞器或胚胎中;表現引導RNA及/或RGN多肽(如果編碼序列被引入),其中RGN多肽為無核酸酶活性的RGN。於這些實施方式中的一些中,無核酸酶活性的RGN為包括如本文所描述的表現調節子域(亦即,表觀遺傳修飾域、轉錄活化域、或轉錄抑制子域)的融合蛋白。
本揭露內容還提供用於結合及/或修飾所關注的標的核苷酸序列的方法。該方法包括遞送一系統至該標的序列或包括該標的序列的細胞、胞器或胚胎,該系統包括至少一引導RNA或編碼該至少一引導RNA的多核苷酸、以及至少一融合多肽,該至少一融合多肽包括本發明的RGN及鹼基編輯多肽(例如,胞苷去胺酶或腺苷去胺酶)或編碼該融合多肽的多核苷酸。
本領域中具有通常知識者將理解,本發明揭露的任何方法可用於靶向單一標的序列或多個標的序列。因此,這些方法包括將單一RGN多肽與多個不同的引導RNA組合地使用,該引導RNA可靶向單一基因及/或多個基因內的多個不同序列。本文亦包括其中與多個不同的RGN多肽組合地引入多個不同的引導RNA的方法。這些引導RNA及引導RNA/RGN多肽系統可靶向單一基因及/或多個基因內的多個不同序列。
於一個態樣中,本發明提供包含上述方法及組成物中所揭露的任何一或更多元素的套組。於一些實施方式中,該套組包括載體系統及使用套組的說明。於一些實施方式中,載體系統包括(a)第一調節元素,該第一調節元素與編碼crRNA序列的DNA系列及用於在經編碼的crRNA序列的上游插入引導序列的一或更多插入位點可操作地連接,其中當被表現時,該引導序列在真核細胞中引導RGN複合物與標的序列的序列專一性結合,其中RGN錯合物包括與引導RNA多核苷酸錯合的RGN酵素;及/或(b)第二調節元素,該第二調節元素與酵素編碼序列可操作地連結,該酵素編碼序列編碼包括核定位序列的該RGN酵素。這些元素可個別地或組合地被提供、且可以被提供在任何適合的容器中,例如,小瓶、瓶子或管子。
於一些實施方式中,套組包括一種或多種語言的說明。於一些實施方式中,套組包括在利用本文所述的一或更多元件的方法中使用的一種或更多種試劑。試劑可被提供於任何適合的容器中。例如,套組可以提供一或更多種反應或儲存緩衝液。試劑可為以可用於特別測定的形式、或以在使用前需要添加一或更多種其他成分的形式(例如,以濃縮或冷凍乾燥形式)被提供。緩衝液可以是任何緩衝液,包括但不限於碳酸鈉緩衝液、碳酸氫鈉緩衝液、硼酸鹽緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液及其組合。於一些實施方式中,緩衝劑為鹼性的。於一些實施方式中,緩衝液具有約7至約10的pH。
於一些實施方式中,套組包括與用於插入載體的引導序列對應的一或更多寡核苷酸,以便可操作地連接引導序列與調控元素。於一些實施方式中,套組包括同源重組模板多核苷酸。於一個態樣中,本發明提供用於使用RGN系統的一或更多元素的方法。本發明的RGN系統提供用於修飾標的多核苷酸的有效手段。本發明的RGN系統具有種類繁多的功用,包括在多種細胞類型中修飾(例如,缺失、插入、移位、失活、活化、鹼基編輯)標的多核苷酸。這樣,本發明的RGN系統在例如基因治療、藥物篩選、疾病診斷以及預後中具有廣泛的應用。範例性的RGN系統或RGN錯合物包括與引導序列錯合的RGN酵素,該引導序列與標的多核苷酸內的標的序列雜交。VIII. 標的多核苷酸
於一個態樣中,本發明提供修飾真核細胞中的標的多核苷酸的方法,其可為體內、離體或體外的。於一些實施方式中,該方法包括從人類或非人類動物或植物(包括微藻類)中取樣細胞或細胞群、以及修飾該細胞或該些細胞。培養可以在離體的任何階段發生。甚至可以將該細胞或該些細胞重新引入非類人動物或植物(包括微藻類)中。
使用自然變異性,植物育種者結合了大多數有用的基因以獲得所需的品質,例如產量、品質、均勻性、耐寒性以及抗害蟲性。這些所需的品質亦包括生長、日長偏好、溫度要求、花或生殖發育的起始日期、脂肪酸含量、抗蟲性、抗病性、線蟲抗性、真菌抗性、除草劑抗性、對各種環境因素(包括乾旱、熱、濕、冷、風及包括高鹽度的不利土壤條件)的耐受性。這些有用基因的來源包括天然或外來品種、原生種(heirloom variety)、野生植物近緣種、及例如以誘變劑處置植物材料的誘導突變。使用本發明,為植物育種者提供誘導突變的新工具。據此,本領域中具有通常知識者可以為有用基因來源而分析基因體,並且在具有所需特徵或性狀的品種中採用本發明以誘導有用基因的增加,而且比先前的誘變劑更精確,且因此加速並改良植物育種計劃。
RGN系統的標的多核苷酸可為對真核細胞是內源或外源的任何多核苷酸。例如,該標的多核苷酸可為存在於真核細胞的細胞核中的多核苷酸。標的多核苷酸可為編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節性多核苷酸或垃圾DNA(junk DNA))。不希望受理論的束縛,標的序列應該與PAM(前間隔序列鄰近模體)相關聯;亦即,該RGN系統識別的短序列。該PAM的精確序列和長度要求隨所使用的RGN而不同,但PAM通常是與前間隔序列(亦即,標的序列)相鄰的2-5個鹼基對序列。
RGN系統的標的多核苷酸可包括許多疾病關聯基因及多核苷酸以及與傳訊生化路徑關聯的基因及多核苷酸。標的多核苷酸的範例包括與傳訊生化路徑關聯的序列,例如,與傳訊生化路徑關聯的基因或多核苷酸。標的多核苷酸的範例包括與疾病關聯的基因或多核苷酸。「與疾病關聯的」基因或多核苷酸指:與非疾病控制的組織或細胞相較下,在從患病組織取得的細胞中以異常水準或以異常形式產出轉錄或轉譯產物的任何基因或多核苷酸。其可為一種變得以異常高水準表現的基因;其可為一種變得以異常低水準表現的基因,其中改變的表現與疾病的發生及/或進展相關。與疾病關聯的基因亦指具有突變或基因變異的基因,具有突變或基因變異的基因為直接造成疾病病因(例如,因果突變)、或為與造成疾病病因(例如,因果突變)的基因呈連鎖不平衡。轉錄或轉譯的產物可為已知的或未知的、且還可能處於正常或異常水準。於一些實施方式中,疾病可為動物疾病。於一些實施方式中,該疾病可為鳥類疾病。與其他實施方式中,疾病可為哺乳動物疾病。於進一步實施方式中,疾病可為人類疾病。人類的疾病關聯基因及多核苷酸的範例可從全球資訊網上可得的國家醫學圖書館(National Library of Medicine(Bethesda, Md.))國家生物技術資訊中心(National Center for Biotechnology Information)(馬里蘭州貝塞斯達)以及約翰霍普金斯大學(馬裡蘭州巴爾的摩)麥考斯克–納森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine)獲得。
雖然RGN系統因其相對容易靶向所關注的基因體序列方面格外有用,但仍然存在該RGN如何解決因果突變的問題。一種方法為在RGN(較佳地,RGN的無活性或切口酶變異體)與鹼基編輯酵素或鹼基編輯酵素(例如,胞苷去胺酶或腺苷去胺酶鹼基編輯器)的活性域之間產生融合蛋白(第9,840,699號美國專利,藉由引用併入本文)。於一些實施方式中,該些方法包括使DNA分子與(a)包括本發明的RGN及例如去胺酶之類的鹼基編輯多肽的融合蛋白接觸;以及(b)將(a)的融合蛋白靶向DNA股的標的核苷酸序列的gRNA接觸;其中該DNA分子以有效量並且在適於核鹼基去胺作用的條件下與融合蛋白及gRNA接觸。於一些實施方式中,該標的DNA序列包括與疾病或病症關聯的序列,並且其中該核鹼基的去胺作用導致與疾病或病症無關聯的序列。於一些實施方式中,該標的DNA序列位於農作物的對偶基因中,其中所關注的性狀的特定對偶基因導致農藝價值較低的植物。該核鹼基的去胺作用導致改善了植物的性狀並增加植物的農藝價值的對偶基因。
於一些實施方式中,DNA序列包括與疾病或病症關聯的TàC或AàG點突變,並且其中突變體C或G鹼基的去胺作用導致與疾病或病症無關聯的序列。於一些實施方式中,去胺作用校正與該疾病或病症關聯的序列中的點突變。
於一些實施方式中,與該疾病或病症關聯的序列編碼蛋白質,且其中該去胺作用將終止密碼子引入與疾病或病症關聯的序列中,導致編碼的蛋白質被截斷。於一些實施方式中,接觸是在易患有、患有或被診斷患有疾病或病症的個體體內進行。於一些實施方式中,疾病或病症為與基因體中的點突變或單鹼基突變關聯的疾病。於一些實施方式中,該疾病為遺傳性疾病、癌症、代謝疾病或溶體儲積症。IX. 醫藥組成物及治療方法
提供醫藥組成物,該醫藥組成物包括:本發明揭露的RGN多肽及其活性變異體或片段以及編碼該RGN多肽及其活性變異體或片段的多核苷酸、本發明揭露的gRNA或編碼該gRNA的多核苷酸、本發明揭露的系統、或包括該RGN多肽或RGN編碼多核苷酸、gRNA或gRNA編碼多核苷酸、或該RGN系統中任一者的細胞及藥學上可接受的載體。
醫藥組成物為被用於防止、降低程度、治癒或治療標的病症或疾病的組成物,該組成物包括活性成分(亦即,RGN多肽、RGN編碼多核苷酸、gRNA、gRNA編碼多核苷酸、RGN系統、或包括這些中任一者的細胞)及藥學上可接受的載體。
如本文中使用的,「藥學上可接受的載體」指不對生物體引起明顯刺激且不消除該活性成分(亦即,RGN多肽、RGN編碼多核苷酸、gRNA、gRNA編碼多核苷酸、RGN系統、或包括這些中任一者的細胞)的活性及特性的材料。載體必須具有足夠高的純度及足夠低的毒性,以使其適合投予正被治療的個體。該載體可為惰性的,或其可具有醫藥效益。於一些實施方式中,藥學上可接受的載體包括合適對人或其他脊椎動物投予的一或更多相容固體或液體填充劑、稀釋劑或封裝物質。於一些實施方式中,藥學上可接受的載體不為天然發生的。於一些實施方式中,未發現該藥學上可接受的載體在本質上與該活性成分在一起。
本發明揭露的方法中使用的藥學組成物可由提供合適轉移、遞送、耐受性等等的合適載體、賦形劑及其他藥劑調配。眾多恰當調配物為本領域中的通常知識者所知。參見,例如,Remington,The Science and Practice of Pharmacy (21st ed. 2005)。合適的調配物例如包括:粉劑、糊劑、膏劑、膠凍、蠟、油類、脂質、含脂質(陽離子或陰離子)的囊泡(例如,LIPOFECTIN囊泡)、脂質奈米粒子、DNA共軛物、無水吸收糊劑、水油乳及水油乳、乳液卡波蠟(emulsions carbowax)(各種分子量的聚乙二醇)、半固體凝膠(semi-solid gel)及含有卡波蠟的半固體混合物。經口或非口服使用的藥學組成物可被製備為適於適應活性成分劑量的單位劑量的劑型。這些單位劑量的劑型例如包括錠劑、丸劑、膠囊、注射劑(安瓿)、栓劑等。
在其中包括或以本發明揭露的RGN、gRNA、RGN系統或編碼該RGN、gRNA、RGN系統的多核苷酸的細胞被投予個體的一些實施方式中,這些細胞與藥學上可接受的載體一起作為懸浮劑被投予。本領域中具有通常知識者將認識到將被用於細胞組成物中的藥學上可接受的載體將不包括實質上干擾將被遞送至該個體的細胞的生存力的量的緩衝液、化合物、冷凍保存劑、保存劑、或其他製劑。包括細胞的調配物可包括例如允許細胞膜保持完整性的滲透壓緩衝液、且可選地包括在投予時保持細胞生存力或增強植入的營養素。這樣的調配物及懸浮劑為本領域中具有通常知識者所知、且/或使用例行實驗可被調適成與本文揭露的細胞一起使用。
細胞組成物亦可被乳化為或呈現為核糖體組成物,前提條件為該乳化程序不會不利地影響細胞生存力。該細胞及任何其他活性成分可以與藥學上可接受且與該活性成分相容的賦形劑、且以適合在本文揭露的治療方法中使用的量混合。
細胞組成物中包括的額外劑可包括其內的組成的藥學上可接受的鹽。藥學上可接受的鹽包括例如與例如鹽酸或磷酸的無機酸、或與例如醋酸、酒石酸、苯乙醇酸等等的有機酸形成的酸加成鹽(與多肽的自由胺基基團形成)。與自由羧基基團形成的鹽亦可例如衍生自例如鈉、鉀、銨、鈣或鐵的氫氧化物的無機鹼、及例如異丙胺、三甲胺、2-乙胺乙醇、組胺酸、普魯卡因等等的有機鹼。
生理學上可耐受且藥學上可接受的載體為本領域已知的。示例性液體載體為無菌水溶液,其除了活性成分及水外不含有其他材料,或其含有例如在生理pH值的磷酸鈉、生理食鹽水或二者的緩衝液(例如,磷酸鹽緩衝食鹽水)。又此外,水性載體可含有一種以上的緩衝鹽以及例如氯化鈉及氯化鉀、葡萄糖、聚乙二醇及其他溶質之類的鹽。液體組成物亦可含有除了水及排除水的液相。此類額外液相的示例為甘油、例如棉花籽油之類的植物油及水油乳液。在特定失調或病症的治療中有效的細胞組成物中使用的活性化合物的量可取決於該失調或病症的本質、且可由標準臨床技術確定。
本發明揭露的RGN多肽、引導RNA、RGN系統、或編碼該RGN多肽、引導RNA、RGN系統的多核苷酸可取決於投予的特定方式及劑型而以例如載體、溶劑、穩定劑、佐劑、稀釋劑等的藥學上可接受的賦形劑調配。於一些實施方式中,這些藥學組成物被調配以達成生理學上相容的pH;且依賴於調配物及投予途徑,其範圍為約3的pH至約11的pH、約pH 3至約pH 7。於一些實施方式中,可將pH調整至約pH 5.0至約pH 8的範圍。於一些實施方式中,組成物可包括本文描述的治療有效量的至少一化合物,連同一或更多藥學上可接受的賦形劑。於一些實施方式中,組成物包括本文描述的化合物的組合、或包括治療或防止細菌生長中有用的第二活性成分(例如而不限於,抗菌或抗微生物藥劑)、或包括本揭露內容的試劑的組合。
例如,適合的賦形劑包括載體分子,該載體分子包括大型、緩慢代謝的巨分子,例如,蛋白質、多醣、聚乳酸、聚乙醇酸、聚合的胺基酸、胺基酸共聚物及非活性的病毒粒子。其他示例性賦形劑可包括抗氧化劑(例如而不限於,抗壞血酸)、螯合劑(例如而不限於,EDTA)、碳水化合物(例如而不限於,糊精、羥烷基纖維素及羥烷基甲基纖維素)、硬脂酸、液體(例如而不限於,油、水、食鹽水、甘油及乙醇)、潤濕或乳化劑、pH緩衝物質等等。
於一些實施方式中,調配物以單位劑量或多劑量容器(例如,密封安瓿及小瓶(vial))被提供、且可被儲存於凍乾(冷凍乾燥)條件下,需要在立即使用之前,添加無菌液體載體(例如,食鹽水、注射用水、半液體泡沫或凝膠)。即時注射溶液及懸浮劑可自前面描述種類的無菌粉劑、顆粒及錠劑製備。於一些實施方式中,活性成分溶解於緩衝液體溶液中,其以單位劑量或多劑量容器被冷凍、且之後被解凍用於注射或被保持/穩定在冷凍下直到使用。
該一或多個治療劑可被包含於受控的釋放系統中。為了延長藥物的作用,常常期望從皮下、鞘內腔、或肌肉內注射以減緩藥物的吸收。這可藉由使用具有水難溶性的結晶或非結晶材料的液體懸浮劑來完成。然後,藥物的吸收速率取決於其溶解速率,而其溶解速率又可取決於結晶大小及結晶的形式。或者,非經口投予藥物的延遲吸收藉由該藥物溶解或懸浮於油媒介中被完成。於一些實施方式中,長期持續釋放的植入劑的使用特別適合用於慢性病症的治療。長期持續釋放的植入劑為本領域中具有通常知識者所知。 本文提供為了在需要其的個體中治療疾病的方法。該方法包括將有效量的本發明揭露的RGN多肽或其活性變異體或片段或編碼該RGN多肽或其活性變異體或片段的多核苷酸、本發明揭露的gRNA或編碼該gRNA的多核苷酸、本發明揭露的RGN系統、或由這些組成物中任一者修飾的或包括這些組成物中任一者的細胞投予需要其的個體。
於一些實施方式中,治療包括藉由投予本發明揭露的RGN多肽、gRNA、或RGN系統、或編碼該RGN多肽、gRNA、或RGN系統的(一或多個)多核苷酸的體內基因編輯。於一些實施方式中,治療包括體外基因編輯,其細胞是以本發明揭露的RGN多肽、gRNA、或RGN系統、或編碼該RGN多肽、gRNA、或RGN系統的(一或多個)多核苷酸體外基因修飾、且然後將經修飾細胞投予至個體。於一些實施方式中,經基因修飾細胞源自之後被投予該修飾細胞的個體,且所移植細胞在本文中被稱為自體的。於一些實施方式中,經基因修飾細胞源自與被投予該經修飾細胞的個體(亦即,接受者)同種內的不同個體(亦即,供體),且該所移植細胞在本文中被稱為異體的。於本文描述的一些範例中,該細胞可在對需要其的個體投予之前於培養中被擴大。
於一些實施方式中,要用本發明揭露的組成物治療的疾病為可用免疫療法(例如,用嵌合抗原受體(CAR)T細胞)治療的疾病。此類疾病包括但不限於癌症。於一些實施方式中,要用本發明揭露的組成物治療的疾病與因果突變關聯。如本文中使用的,「因果突變」指對個體中的疾病或失調的嚴重程度或存在有貢獻的基因體中的特定核苷酸、多個核苷酸或核苷酸序列。因果突變的校正引致由疾病或失調導致的至少一個症狀改善。於一些實施方式中,因果突變與本文揭露的RGN所辨識的PAM位點相鄰。該因果突變可用本發明揭露的RGN或包括本發明揭露的RGN及鹼基編輯的多肽(亦即,鹼基編輯器)的融合多肽來校正。與因果突變關聯的疾病的非限制性範例包括囊腫纖維化、賀勒(Hurler)氏症候群、弗里德里希運動失調(Friedreich’s Ataxia)、亨汀頓氏舞蹈症(Huntington’s Disease)及鐮形細胞疾病。於一些實施方式中,要用本揭露的RGN治療的疾病為列於表11中的疾病。疾病關聯基因及突變的額外非限制性範例可從在全球資訊網上取得的約翰•霍普金斯大學(麻省巴爾的摩)麥庫席克–內森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, Md.))和美國國家醫學圖書館(馬里蘭州貝賽斯達)的國家生物技術資訊中心(National Center for Biotechnology Information, National Library of Medicine (Bethesda, Md.) )取得。
如本文中使用的,「治療」或「處理」、或「緩和」或「改善」可被互換地使用。這些術語指用於獲得有益或期望結果的方法,有益結果或期望結果包括但不限於治療性益處及/或預防性益處。藉由治療性益處意味著對治療中的一或更多疾病、病症或症狀中的任何治療相關改善或對治療中的一或更多疾病、病症或症狀上的效果。對於預防性益處,組成物可被投予處於特定疾病、病症或症狀的發展風險中的個體、或被投予報告疾病的一或更多生理症狀的個體,即使該疾病、病症或症狀可能尚未呈現徵兆。
術語「有效量」或「治療有效量」指足以達到有益或期望結果的藥劑量。治療有效量可取決於下列中的一或更多者而變化:被治療的個體及疾病病症、個體的重量及年齡、疾病病症的嚴重性、投予方式等等,本領域中具有通常知識者可容易地對此做出確定。特定劑量可取決於下列中的一或更多者而變化:所選的特定藥劑、要遵循的給藥方案、是否與其他化合物組合地投予、投予時機及其被運載的遞送系統。
術語「投予」指藉由導致所引入的活性成分至少部分地定位於期望位點(例如,受傷或修復的位點)處的方法或途徑以將活性成分置於個體內,使得產生(一或多個)期望效用。於其中細胞被投予的那些實施方式中,可藉由導致遞送至個體中的期望位置的任何恰當途徑投予該細胞,其中至少一部分所移植的細胞或該細胞的組成維持存活。投予至個體後的細胞的存活期可短至幾小時(例如,二十四小時)、至幾天、至長至若干年、甚或患者的生命期,亦即,長期植入。例如,於本文描述的一些態樣中,光受體細胞或視網膜前驅細胞的有效量是經由系統投予途徑(例如腹膜內或靜脈內途徑)投予。
於一些實施方式中,投予包括藉由病毒遞送的投予。於一些實施方式中,投予包括藉由電穿孔的投予。於一些實施方式中,投予包括藉由奈米粒子遞送的投予。於一些實施方式中,投予包括藉由核糖體遞送的投予。投予的任何有效途徑可用於投予有效量的本文描述的醫藥組成物。於一些實施方式中,投予包括由選自由下列所組成的群組的方法的投予:靜脈內地、皮下地、肌肉內地、口服地、經直腸地、藉由氣溶膠、非經口地、經眼地、經肺地、經皮地、經陰道地、經耳地、經鼻地及藉由外部投予、或其任何組合。於一些實施方式中,對於細胞的遞送,使用藉由注射或灌注的投予。
如本文中使用的,術語「個體」指期望對其進行診斷、治療或療法的任何個體。於一些實施方式中,個體為動物。於一些實施方式中,個體為哺乳動物。於一些實施方式中,個體為人類。
治療效力可由熟練的臨床醫師確定。然而,如果疾病或失調的症候或症狀的任何一個或全部是以有益方式被改變(例如,至少減少10%)、或其他臨床上接受的疾病的症狀或標記被改良或改善,則該治療被認為「有效治療」。亦可藉由個體未發生如藉由住院評估的惡化、或不需要醫學介入(例如,疾病的進展被停止或至少減慢)來測量效力。測量這些指標的方法為本領域中具有通常知識者所知。治療包括:(1)抑制疾病,例如,遏止或減慢症狀的進展;或(2)減緩疾病,例如,引起症狀消退;以及(3)預防或降低症狀發展的可能性。A. 使用鹼基編輯修飾因果突變
可使用取決於本發明的RGN-鹼基編輯器融合蛋白的方法來校正的遺傳性疾病的範例是賀勒(Hurler)氏症。賀勒氏症(亦稱為MPS-1)為α-L-艾杜糖醛酸酶(IDUA)缺乏的結果,導致在分子層次上由溶體中硫酸乙醯肝素及硫酸皮膚素的累積表徵的溶體儲積症。此疾病通常是由編碼α-L-艾杜糖醛酸酶的IDUA基因中的突變引起的遺傳性基因病症。常見的IDUA突變是W402X及Q70X,兩者都是導致轉譯過早終止的無意義突變。藉由精確的基因體編輯(PGE)方法很好地解決了這種突變,由於單一核苷酸的回復(例如,藉由鹼基編輯方法)將恢復野生型編碼序列並導致受遺傳基因座的內源性調控機制控制的蛋白質表現。另外,由於已知異型合子是無症狀的,所以靶向這些突變中的一者的PGE療法對於大部分患有此疾病的患者是有用的,因為僅需要校正其中一個突變的對偶基因(Bunge等人(1994) Hum. Mol. Genet. 3(6):861-866,藉由引用併入本文)。
對賀勒氏症候群的目前治療包括酵素替代療法及骨髓移植(Vellodi等人((1997)) Arch. Dis. Child. 76(2):92-99;Peters等人((1998)) Blood 91(7):2601-2608,藉由引用併入本文)。儘管酵素替代療法對賀勒氏症候群患者的存活和生活品質產生了顯著影響,但這種方法需要每週進行昂貴且耗時的輸注。另外的方法包括遞送表現載體上的IDUA基因或將該基因插入高度表現的基因座中,例如,血清白蛋白的基因座中(美國專利號9,956,247,藉由引用併入本文)。然而,這些方法不能將原始IDUA基因座恢復至正確的編碼序列。基因體編輯策略可具有很多優點,最顯著的是基因表現的調控將受健康個體中存在的天然機制的控制。另外,使用鹼基編輯不一定引起雙股DNA斷裂,這可能由腫瘤抑制機制的破壞引致大規模染色體重排、細胞死亡或致癌。一般策略可被指向為使用本發明的RGN鹼基編輯器融合蛋白來靶向並校正人類基因體中的某些致病的突變。應理解,亦可尋求類似方法來靶向可由鹼基編輯校正的疾病。亦應進一步理解,亦可使用本發明的RGN採用類似的方法來靶向其他物種(特別是一般的家庭寵物或家畜)中致病突變。一般的家庭寵物和家畜包括狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、魚(包括鮭魚)和蝦。B. 藉由靶向缺失修飾因果突變
本發明的RGN在因果突變更複雜的人類治療方法中也有用。例如,例如弗里德里希運動失調和亨汀頓氏舞蹈症的一些疾病是在基因特定區域處的三個核苷酸模體的重複顯著增加的結果,這會影響表現的蛋白起作用或被表現的能力。弗里德里希運動失調(FRDA)為一種導致脊髓神經組織進行性退化的體染色體隱性疾病。粒線體中的共濟蛋白(frataxin,FXN)蛋白質的降低水準引起細胞層次的氧化損傷及鐵缺乏。降低的FXN表現已與體細胞和生殖系列FXN基因的內含子1內的GAA三聯體擴增有關。在FRDA患者中,GAA重複通常由超過70個,有時甚至超過1000個(最常見的是600-900個)三聯體組成,而未受影響的個體具有約40個或更少的重複(Pandolfo等人(2012)Handbook of Clinical Neurology 103:275-294;Campuzano等人(1996)Science 271:1423-1427;Pandolfo(2002)Adv. Exp. Med. Biol. 516:99-118;全部藉由引用併入本文)。
引起弗里德里希運動失調(FRDA)的三核苷酸重複序列的擴增發生在FXN基因內界定的基因基因座中,被稱為FRDA不穩定性區域。RNA引導的核酸酶(RGN)可用於切除FRDA患者細胞中的不穩定性區域。此方法需要:1)可被程式化以靶向人類基因體中的對偶基因的引導RNA序列以及RGN;以及2)用於RGN及引導序列的遞送方法。特別是,當除了功能性表現匣所需的其他遺傳元素之外,還要考慮到SpCas9基因及引導RNA的長度時,用於基因體編輯的許多核酸酶(例如,來自化膿性鏈球菌的常用Cas9核酸酶(SpyCas9))太大而無法包裝到腺相關病毒(AAV)載體內。這使得使用SpCas9的方法更加困難。
本發明的某些RNA引導的核酸酶極適合隨引導RNA一起被包裝至AAV載體內。包裝兩個引導RNA可能需要第二載體,但此種方法仍然比可能需要例如SpCas9之類的較大核酸酶的方法有利,這可能需要在兩個載體之間拆開蛋白質序列。本發明包含使用本發明的RGN的策略,其中去除了基因體不穩定性的區域。這種策略適用於具有類似遺傳基礎的其他疾病及病症,例如亨汀頓氏舞蹈症。使用本發明的RGN的類似策略亦可適用於具有農藝或經濟重要性的非人類動物(包括狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、以及包括鮭魚的魚和蝦)的類似疾病及病症。C. 藉由靶向誘變修飾因果突變
本發明的RGN也可引入可導致有益效果的破壞性突變。編碼血紅素的基因(特別是β球蛋白鏈(HBB基因))中的基因缺陷可能是許多稱為血紅素病的疾病(包括鐮狀細胞貧血症和地中海貧血症)的原因。
在成年人中,血紅素為包括二條α類球蛋白鏈及二個β類球蛋白鏈及4個血基質(heme)基團的異源四聚體。在成人中,α2β2四聚體被稱為血紅素A(HbA)或成人血紅素。通常情況下,α及β球蛋白鏈以大約1:1的比例合成,且此比例就血紅素及紅血球(RBC)穩定性而言似乎是至關重要的。在發育中的胎兒中,產生了不同形式的血紅素(胎兒血紅素(HbF)),其對氧的結合親和力高於血紅素A,使得氧可經由母親的血流遞送至嬰兒的系統。胎兒血紅素亦含有二條α球蛋白鏈,但是代替成人β-球蛋白鏈,其具有二條胎兒γ-球蛋白鏈(亦即,胎兒血紅素為α2γ2)。從產生γ-球蛋白轉換為產生β-球蛋白的調控相當複雜、且主要涉及γ球蛋白轉錄的調降與β球蛋白轉錄的同時調升。在妊娠約30週時,胎兒中γ球蛋白的合成開始下降,而β球蛋白的產量增加。到約10個月齡時,新生兒的血紅素幾乎都是α2β2,雖然一些HbF持續到成年(約為總血紅素的1-3%)。在大多數具有血紅素病的患者中,編碼γ球蛋白的基因仍然存在,但由於如上所述在臨近分娩時發生正常的基因抑制,表現相對較低。
鐮狀細胞疾病是由β球蛋白基因(HBB)中的V6E突變(DNA層次的GAG至GTG)引起的,其中產生的血紅素被稱為「血紅素S」或「HbS」。在低氧條件下,HbS分子聚集並形成纖維狀沉澱。這些聚集體引起RBC異常或「形成鐮狀」,導致細胞的柔韌性喪失。形成鐮狀的RBC不再能夠擠入微血管床、且可能導致鐮狀細胞患者發生血管閉塞性危機。此外,鐮狀的RBC比正常RBC更脆弱,且傾向於溶血,最終導致患者貧血。
鐮狀細胞患者的治療及管理是終生的課題,其涉及抗生素治療、疼痛管理及急性發作期間的輸液。一種方法為使用羥基脲,其藉由增加γ球蛋白的產生來部分地發揮其效應。然而,慢性羥基脲療法的長期副作用仍然是未知的,而且治療會產生不良副作用且可能在患者之間具有不同的效果。儘管鐮狀細胞治療的功效有所提高,但患者的預期壽命仍然僅在50歲中期至晚期,並且疾病的相關發病率對患者的生活品質具有深遠的影響。
地中海貧血症(α地中海貧血症及β地中海貧血症)也是與血紅素有關的疾病,並且通常涉及球蛋白鏈表現降低。這可以經由基因調控區域中的突變或從球蛋白編碼序列中的突變發生,該突變導致表現降低或減少的水準或功能性球蛋白。地中海貧血症的治療通常涉及輸血及鐵螯合療法。如果可以找到合適的捐贈者,則骨髓移植也可以用於治療重度地中海貧血症的人,但這種方法可能具有重大風險。
已經提出用於治療鐮狀細胞病(SCD)及β地中海貧血症的一種方法為增加γ球蛋白的表現,使得HbF在功能上取代異常的成人血紅素。如上所述,用羥基脲治療SCD患者由於其在增加γ球蛋白表現上的效果而被認為是部分成功的(DeSimone(1982)Proc Nat'l Acad Sci USA 79(14):4428-31;Ley等人(1982)N. Engl. J. Medicine, 307:1469-1475;Ley等人(1983)Blood 62:370-380;Constantoulakis等人(1988)Blood 72(6):1961-1967,全部藉由引用併入本文)。增加HbF的表現涉及鑑定其產物在γ球蛋白表現的調控中起作用的基因。一種這樣的基因為BCL11A。BCL11A編碼在成人類紅血球前驅細胞中表現的鋅指蛋白,且其表現的調降導致γ球蛋白表現增加(Sankaran等人(2008)Science 322:1839,藉由引用併入本文)。已經提出使用靶向BCL11A基因的抑制性RNA(例如,美國專利公開號2011/0182867,藉由引用併入本文),但此技術具有若干潛在的缺點,包括可能無法實現完全減量(knock down),這種RNA的遞送可能是有問題的,且RNA必須連續存在且終生需要多次治療。
本發明的RGN可用於靶向BCL11A增強子區域,以破壞BCL11A的表現,從而增加γ球蛋白表現。這種靶向的破壞可藉由非同源末端連接(NHEJ)來實現,由此本發明的RGN靶向BCL11A增強子區域內的特定序列、使雙股斷裂,且細胞的機械修復該斷裂,通常同時引入有害突變。類似於針對其他疾病標的所描述的,本發明的RGN由於其相對小的尺寸,使得能夠將RGN及其引導RNA的表現匣包裝至單一AAV載體中以用於體內遞送,從而具有優於其他已知RGN的優點。使用本發明的RGN的類似策略亦可應用於人類和具有農藝或經濟重要性的非人類動物中的類似疾病和病症。X. 包括多核苷酸基因 修飾的細胞
本文提供了包括已使用如本文所描述的RGN、crRNA及/或tracrRNA介導的過程修飾的所關注的標的序列的細胞和生物體。於這些實施方式中的一些中,RGN包括SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的胺基酸序列、或其活性變異體或片段。於各種實施方式中,引導RNA包括CRISPR重複序列,該CRISPR重複序列包括SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列、或其活性變異體或片段。於特殊實施方式中,引導RNA包括tracrRNA,該tracrRNA包括SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列、或其活性變異體或片段。該系統的引導RNA可為單引導RNA或雙引導RNA。
經修飾的細胞可為真核的(例如,哺乳動物、植物、昆蟲細胞)或原核的。亦提供包括至少一種核苷酸序列的胞器及胚胎,該核苷酸序列已藉由利用如本文所描述的RGN、crRNA及/或tracrRNA的方法進行了修飾。經基因修飾的細胞、生物體、胞器及胚胎對於經修飾的核苷酸序列可為異型接合的或同型接合的。
該細胞、生物體、胞器或胚胎的染色體修飾可導致表現改變(調升或調降)、失活、或改變的蛋白質產物或整合序列的表現。於其中染色體修飾導致基因失活或非功能性蛋白質產物表現的那些實施方式中,經基因修飾的細胞、生物體、胞器或胚胎被稱為「剔除(knock out)」。剔除表型可為缺失突變(亦即,至少一核苷酸的缺失)、插入突變(亦即,至少一核苷酸的插入)、或無意義突變(亦即,至少一核苷酸的取代,使得終止密碼子被引入)的結果。
或者,細胞、生物體、胞器或胚胎的染色體修飾可產生「嵌入(knock in)」,這是由編碼蛋白質的核苷酸序列的染色體整合導致的。於這些實施方式中的一些中,編碼序列被整合至該染色體中,使得編碼野生型蛋白質的染色體序列失去活性,但表現出外源引入的蛋白。
於一些實施方式中,染色體修飾導致變異體蛋白質產物的產生。表現的變異體蛋白質產物可具有至少一胺基酸取代及/或至少一胺基酸的添加或缺失。當與野生型蛋白質比較時,由改變的染色體序列所編碼的變異體蛋白質產物可呈現出經修飾的特徵或活性,包括但不限於改變的酵素活性或受質專一性。
於又一些其他實施方式中,染色體修飾可導致改變的蛋白質表現模式。作為非限制性範例,控制蛋白質產物表現的調控區域中的染色體改變可導致蛋白質產物過度表現或調降或改變的組織或暫時表現模式。
已經被修飾的細胞可根據傳統方式生長成生物體,例如,植物。參見,例如,McCormick等人(1986)Plant Cell Reports 5:81-84。然後,可使這些植物生長,且用相同修飾株或不同株授粉,且所得雜交體具有基因修飾。本發明提供基因修飾種子。再生植物的子代、變異體及突變體亦包括於本發明的範圍內,前提條件是這些部分包括基因修飾。進一步提供了保持了基因修飾的經加工的植物產物或副產物,例如,包括豆粕。
本文提供的方法可用於修飾任何植物物種,包括但不限於單子葉植物及雙子葉植物。所關注的植物的範例包括但不限於玉米(玉蜀黍)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥及油菜、甘藍型油菜、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包括但不限於番茄、萵苣、綠豆、皇帝豆、豌豆、及例如黃瓜、哈密瓜及洋香瓜之類的甜瓜屬的成員。觀賞植物包括但不限於杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、耶誕紅及菊花。較佳地,本發明的植物為農作物(例如,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
本文提供的方法亦可用於基因修飾任何原核物種,包括但不限於:古菌及細菌(例如,芽孢桿菌克雷伯氏菌鏈黴菌根瘤菌埃希氏菌假單胞菌沙門氏菌志賀氏桿菌弧菌耶爾森氏菌黴漿菌農桿菌乳酸桿菌
本文提供的方法可用於基因修飾任何真核物種或來自於其的細胞,包括但不限於:動物(例如,哺乳動物、昆蟲、魚類、鳥類及爬蟲類物)、真菌、變形蟲、藻類及酵母。於一些實施方式中,由本發明揭露的方法修飾的細胞包括造血源的細胞,例如,免疫系統的細胞,包括但不限於:B細胞、T細胞、自然殺手(NK)細胞、富潛能幹細胞、經誘導的多潛能幹細胞、嵌合抗原受體T(CAR-T)細胞、單核球、巨噬細胞及樹突細胞。
已修飾的細胞可被引入生物體內。在自體細胞移植的情況中,這些細胞可源自同一個生物體(例如,人),其中該細胞以離體方法被修飾。或者,在異體細胞移植的情況中,該細胞源自相同物種中的另一生物體(例如,另一個人)。
冠詞「一(a)」和「一(an)」在本文中用於指該冠詞的一或一個以上(亦即,至少一)的語法對象。作為範例,「多肽」意指一或更多多肽。
說明書中提及的所有出版物及專利申請案表示本揭露內容所屬領域中具有通常知識者的層次。所有出版物及專利申請案藉由引用併入本文,如同每一個單獨出版物或專利申請案被具體且單獨地指示藉由引用而被併入本文。
雖然為了清楚理解的目的已經以說明及範例頗詳細地描述了前述發明,但顯然可在所附實施方式的範圍內實施某些改變及修飾。 非限制性實施方式包括:
1. 一種核酸分子,包括編碼RNA引導的核酸酶(RGN)多肽的多核苷酸,其中該多核苷酸包括編碼RGN多肽的核苷酸序列,該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的胺基酸序列; 其中,當與能夠與該標的DNA序列雜交的引導RNA(gRNA)結合時,該RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列,以及 其中編碼RGN多肽的該多核苷酸可操作地連接至與該多核苷酸異源的啟動子。
2. 如實施方式1的核酸分子,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的胺基酸序列。
3. 如實施方式1的核酸分子,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的胺基酸序列。
4. 如實施方式1的核酸分子,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。
5. 如實施方式1-4中任一實施方式的核酸分子,其中該RGN多肽能夠於結合時切割該標的DNA序列。
6. 如實施方式5的核酸分子,其中該RGN多肽能夠產生雙股斷裂。
7. 如實施方式5的核酸分子,其中該RGN多肽能夠產生單股斷裂。
8. 如實施方式1-4中任一實施方式的核酸分子,其中該RGN多肽為核酸酶不活化或為切口酶。
9. 如實施方式1-8中任一實施方式的核酸分子,其中該RGN多肽與鹼基編輯多肽可操作地融合。
10. 如實施方式9的核酸分子,其中該鹼基編輯多肽為去胺酶。
11. 如實施方式10的核酸分子,其中該去胺酶為胞苷去胺酶或腺嘌呤去胺酶。
12. 如實施方式1-11中任一實施方式的核酸分子,其中該RGN多肽包括一或更多核定位訊號。
13. 如實施方式1-12中任一實施方式的核酸分子,其中該RGN多肽是針對於真核細胞中的表現而被密碼子最佳化。
14. 如實施方式1-13中任一實施方式的核酸分子,其中該標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
15. 一種包括實施方式1-14中任一實施方式的核酸分子的載體。
16. 如實施方式15的載體,進一步包括編碼該gRNA的至少一核苷酸序列,該gRNA能夠與該標的DNA序列雜交。
17. 如實施方式16的載體,其中該引導RNA選自由下列所組成的群組: a)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:2具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:3具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:9具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:10具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; c)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:17具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列; d)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:24具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:22具有至少90%序列一致性的胺基酸序列; e)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:30具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:31具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:29具有至少90%序列一致性的胺基酸序列; f)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:37具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:38具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:36具有至少90%序列一致性的胺基酸序列; g)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:44具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:45具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:43具有至少90%序列一致性的胺基酸序列; h)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:51具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:52具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:50具有至少90%序列一致性的胺基酸序列; i)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:57具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:58具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:56具有至少90%序列一致性的胺基酸序列; j)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:64具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:65具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的胺基酸序列; k)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:71具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:72具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:70具有至少90%序列一致性的胺基酸序列; l)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:77具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:78具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:76具有至少90%序列一致性的胺基酸序列; m)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:85具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列; n)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:90具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:91具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:89具有至少90%序列一致性的胺基酸序列; o)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:97具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:98具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:96具有至少90%序列一致性的胺基酸序列; p)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:104具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:105具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:103具有至少90%序列一致性的胺基酸序列; q)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:112具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:110具有至少90%序列一致性的胺基酸序列; r)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:119具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:117具有至少90%序列一致性的胺基酸序列; s)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:124具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:125具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:123具有至少90%序列一致性的胺基酸序列;以及 t)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:78具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列。
18. 如實施方式16的載體,其中該引導RNA選自由下列所組成的群組: a)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:2具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:3具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:9具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:10具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; c)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:17具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列; d)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:24具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:22具有至少95%序列一致性的胺基酸序列; e)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:30具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:31具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:29具有至少95%序列一致性的胺基酸序列; f)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:37具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:38具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:36具有至少95%序列一致性的胺基酸序列; g)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:44具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:45具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:43具有至少95%序列一致性的胺基酸序列; h)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:51具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:52具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:50具有至少95%序列一致性的胺基酸序列; i)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:57具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:58具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:56具有至少95%序列一致性的胺基酸序列; j)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:64具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:65具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的胺基酸序列; k)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:71具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:72具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:70具有至少95%序列一致性的胺基酸序列; l)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:77具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:78具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:76具有至少95%序列一致性的胺基酸序列; m)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:85具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列; n)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:90具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:91具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:89具有至少95%序列一致性的胺基酸序列; o)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:97具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:98具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:96具有至少95%序列一致性的胺基酸序列; p)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:104具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:105具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:103具有至少95%序列一致性的胺基酸序列; q)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:112具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:110具有至少95%序列一致性的胺基酸序列; r)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:119具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:117具有至少95%序列一致性的胺基酸序列; s)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:124具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:125具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:123具有至少95%序列一致性的胺基酸序列;以及 t)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:78具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列。
19. 如實施方式16的載體,其中該引導RNA選自由下列所組成的群組: a)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:2具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:3具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:9具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:10具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有100%序列一致性的胺基酸序列; c)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:17具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:15具有100%序列一致性的胺基酸序列; d)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:24具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:22具有100%序列一致性的胺基酸序列; e)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:30具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:31具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:29具有100%序列一致性的胺基酸序列; f)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:37具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:38具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:36具有100%序列一致性的胺基酸序列; g)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:44具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:45具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:43具有100%序列一致性的胺基酸序列; h)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:51具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:52具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:50具有100%序列一致性的胺基酸序列; i)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:57具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:58具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:56具有100%序列一致性的胺基酸序列; j)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:64具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:65具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有100%序列一致性的胺基酸序列; k)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:71具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:72具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:70具有100%序列一致性的胺基酸序列; l)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:77具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:78具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:76具有100%序列一致性的胺基酸序列; m)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:85具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的胺基酸序列; n)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:90具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:91具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:89具有100%序列一致性的胺基酸序列; o)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:97具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:98具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:96具有100%序列一致性的胺基酸序列; p)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:104具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:105具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:103具有100%序列一致性的胺基酸序列; q)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:112具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:110具有100%序列一致性的胺基酸序列; r)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:119具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:117具有100%序列一致性的胺基酸序列; s)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:124具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:125具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:123具有100%序列一致性的胺基酸序列;以及 t)引導RNA,包括: i)CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列;以及 ii)tracrRNA,該tracrRNA與SEQ ID NO:78具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的胺基酸序列。
20. 如實施方式16-19中任一實施方式的載體,其中該gRNA為單引導RNA。
21. 如實施方式16-19中任一實施方式的載體,其中該gRNA為雙引導RNA。
22. 一種包括如實施方式1-14中任一實施方式的核酸分子或如實施方式15-21中任一實施方式的載體的細胞。
23. 一種製造RGN多肽的方法,包括:在該RGN多肽被表現的條件下,培養實施方式22的細胞。
24. 一種製造RGN多肽的方法,包括將異源核酸分子引入細胞中,該異源核酸分子包括編碼RNA引導的核酸酶(RGN)多肽的核苷酸序列,該RNA引導的核酸酶(RGN)多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的胺基酸序列; 其中當與能夠與該標的DNA序列雜交的引導RNA(gRNA)結合時,該RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列; 且在該RGN多肽被表現的條件下,培養該細胞。
25. 如實施方式24的方法,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的胺基酸序列。
26. 如實施方式24的方法,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的胺基酸序列。
27. 如實施方式24的方法,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。
28. 如實施方式23-27中任一實施方式的方法,進一步包括純化該RGN多肽。
29. 如實施方式23-27中任一實施方式的方法,其中該細胞進一步表現一或更多引導RNA,該一或更多引導RNA能夠與該RGN多肽結合,以形成RGN核糖核蛋白錯合物。
30. 如實施方式29的方法,進一步包括純化該RGN核糖核蛋白錯合物。
31. 一種分離的RNA引導的核酸酶(RGN)多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的胺基酸序列;以及 其中當與能夠與該標的DNA序列雜交的引導RNA(gRNA)結合時,該RGN多肽能夠以RNA引導的序列專一性方式結合DNA分子的標的DNA序列。
32. 如實施方式31的分離的RGN多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的胺基酸序列。
33. 如實施方式31的分離的RGN多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的胺基酸序列。
34. 如實施方式31的分離的RGN多肽,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。
35. 如實施方式31-34中任一實施方式的分離的RGN多肽,其中該RGN多肽能夠於結合時切割該標的DNA序列。
36. 如實施方式35的分離的RGN多肽,其中藉由該RGN多肽的切割產生雙股斷裂。
37. 如實施方式35的分離的RGN多肽,其中藉由該RGN多肽的切割產生單股斷裂。
38. 如實施方式31-34中任一實施方式的分離的RGN多肽,其中該RGN多肽為核酸酶不活化或為切口酶。
39. 如實施方式31-38中任一實施方式的分離的RGN多肽,其中該RGN多肽與鹼基編輯多肽可操作地融合。
40. 如實施方式39的分離的RGN多肽,其中該鹼基編輯多肽為去胺酶。
41. 如實施方式31-40中任一實施方式的分離的RGN多肽,其中該標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
42. 如實施方式31-41中任一實施方式的分離的RGN多肽,其中該RGN多肽包括一或更多核定位訊號。
43. 一種包括編碼CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中該crRNA包括間隔序列及CRISPR重複序列,其中該CRISPR重複序列包括與SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118及124中任一者具有至少90%序列一致性的核苷酸序列; 其中引導RNA包括: a)該crRNA;以及 b)轉錄活化的CRISPR RNA(tracrRNA),該轉錄活化的CRISPR RNA(tracrRNA)與該crRNA的該CRISPR重複序列雜交; 當該引導RNA與RNA引導的核酸酶(RGN)多肽結合時,經由該crRNA的間隔序列,能夠以序列專一性方式與標的DNA序列雜交,以及 其中編碼crRNA的該多核苷酸被可操作地連接至與該多核苷酸異源的啟動子。
44. 如實施方式43的核酸分子,其中該CRISPR重複序列包括與SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118及124中任一者具有至少95%序列一致性的核苷酸序列。
45. 如實施方式43的核酸分子,其中該CRISPR重複序列包括與SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118及124中任一者具有100%序列一致性的核苷酸序列。
46. 一種包括實施方式43-45中任一實施方式的核酸分子的載體。
47. 如實施方式46的載體,其中該載體進一步包括編碼該tracrRNA的多核苷酸。
48. 如實施方式47的載體,其中該tracrRNA選自由下列所組成的群組: a)與SEQ ID NO:3具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:2具有至少90%序列一致性; b)與SEQ ID NO:10具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:9具有至少90%序列一致性; c)與SEQ ID NO:17具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性; d)與SEQ ID NO:24具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性; e)與SEQ ID NO:31具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:30具有至少90%序列一致性; f)與SEQ ID NO:38具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:37具有至少90%序列一致性; g)與SEQ ID NO:45具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:44具有至少90%序列一致性; h)與SEQ ID NO:52具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:51具有至少90%序列一致性; i)與SEQ ID NO:58具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:57具有至少90%序列一致性; j)與SEQ ID NO:65具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:64具有至少90%序列一致性; k)與SEQ ID NO:72具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:71具有至少90%序列一致性; l)與SEQ ID NO:78具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:77具有至少90%序列一致性; m)與SEQ ID NO:85具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:84具有至少90%序列一致性; n)與SEQ ID NO:91具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:90具有至少90%序列一致性; o)與SEQ ID NO:98具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:97具有至少90%序列一致性; p)與SEQ ID NO:105具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:104具有至少90%序列一致性; q)與SEQ ID NO:112具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:111具有至少90%序列一致性; r)與SEQ ID NO:119具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:118具有至少90%序列一致性;以及 s)與SEQ ID NO:125具有至少90%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:124具有至少90%序列一致性。
49. 如實施方式47的載體,其中該tracrRNA選自由下列所組成的群組: a)與SEQ ID NO:3具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:2具有至少95%序列一致性; b)與SEQ ID NO:10具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:9具有至少95%序列一致性; c)與SEQ ID NO:17具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:16具有至少95%序列一致性; d)與SEQ ID NO:24具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:23具有至少95%序列一致性; e)與SEQ ID NO:31具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:30具有至少95%序列一致性; f)與SEQ ID NO:38具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:37具有至少95%序列一致性; g)與SEQ ID NO:45具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:44具有至少95%序列一致性; h)與SEQ ID NO:52具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:51具有至少95%序列一致性; i)與SEQ ID NO:58具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:57具有至少95%序列一致性; j)與SEQ ID NO:65具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:64具有至少95%序列一致性; k)與SEQ ID NO:72具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:71具有至少95%序列一致性; l)與SEQ ID NO:78具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:77具有至少95%序列一致性; m)與SEQ ID NO:85具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:84具有至少95%序列一致性; n)與SEQ ID NO:91具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:90具有至少95%序列一致性; o)與SEQ ID NO:98具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:97具有至少95%序列一致性; p)與SEQ ID NO:105具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:104具有至少95%序列一致性; q)與SEQ ID NO:112具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:111具有至少95%序列一致性; r)與SEQ ID NO:119具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:118具有至少95%序列一致性;以及 s)與SEQ ID NO:125具有至少95%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:124具有至少95%序列一致性。
50. 如實施方式47的載體,其中該tracrRNA選自由下列所組成的群組: a)與SEQ ID NO:3具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:2具有100%序列一致性; b)與SEQ ID NO:10具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:9具有100%序列一致性; c)與SEQ ID NO:17具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:16具有100%序列一致性; d)與SEQ ID NO:24具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:23具有100%序列一致性; e)與SEQ ID NO:31具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:30具有100%序列一致性; f)與SEQ ID NO:38具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:37具有100%序列一致性; g)與SEQ ID NO:45具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:44具有100%序列一致性; h)與SEQ ID NO:52具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:51具有100%序列一致性; i)與SEQ ID NO:58具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:57具有100%序列一致性; j)與SEQ ID NO:65具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:64具有100%序列一致性; k)與SEQ ID NO:72具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:71具有100%序列一致性; l)與SEQ ID NO:78具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:77具有100%序列一致性; m)與SEQ ID NO:85具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:84具有100%序列一致性; n)與SEQ ID NO:91具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:90具有100%序列一致性; o)與SEQ ID NO:98具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:97具有100%序列一致性; p)與SEQ ID NO:105具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:104具有100%序列一致性; q)與SEQ ID NO:112具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:111具有100%序列一致性; r)與SEQ ID NO:119具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:118具有100%序列一致性;以及 s)與SEQ ID NO:125具有100%序列一致性的tracrRNA,其中該CRISPR重複序列與SEQ ID NO:124具有100%序列一致性。
51. 如實施方式47-50中任一實施方式的載體,其中編碼該crRNA的該多核苷酸及編碼該tracrRNA的該多核苷酸可操作地連接至相同啟動子、且被編碼為單引導RNA。
52. 如實施方式47-50中任一實施方式的載體,其中編碼該crRNA的該多核苷酸以及編碼該tracrRNA的該多核苷酸可操作地連接至單獨的啟動子。
53. 如實施方式46-52中任一實施方式的載體,其中該載體進一步包括編碼該RGN多肽的多核苷酸。
54. 如實施方式53的載體,其中該RGN多肽選自由下列所組成的群組: a)與SEQ ID NO:1具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:2具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:3具有至少90%序列一致性; b)與SEQ ID NO:8具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:9具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:10具有至少90%序列一致性; c)與SEQ ID NO:15具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:17具有至少90%序列一致性; d)與SEQ ID NO:22具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:24具有至少90%序列一致性; e)與SEQ ID NO:29具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:30具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:31具有至少90%序列一致性; f)與SEQ ID NO:36具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:37具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:38具有至少90%序列一致性; g)與SEQ ID NO:43具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:44具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:45具有至少90%序列一致性; h)與SEQ ID NO:50具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:51具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:52具有至少90%序列一致性; i)與SEQ ID NO:56具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:57具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:58具有至少90%序列一致性; j)與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:64具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:65具有至少90%序列一致性; k)與SEQ ID NO:70具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:71具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:72具有至少90%序列一致性; l)與SEQ ID NO:76具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:77具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少90%序列一致性; m)與SEQ ID NO:83具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:84具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:85具有至少90%序列一致性; n)與SEQ ID NO:89具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:90具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:91具有至少90%序列一致性; o)與SEQ ID NO:96具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:97具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:98具有至少90%序列一致性; p)與SEQ ID NO:103具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:104具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:105具有至少90%序列一致性; q)與SEQ ID NO:110具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:111具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:112具有至少90%序列一致性; r)與SEQ ID NO:117具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:118具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:119具有至少90%序列一致性; s)與SEQ ID NO:123具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:124具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:125具有至少90%序列一致性;以及 t)與SEQ ID NO:83具有至少90%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:84具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少90%序列一致性。
55. 如實施方式53的載體,其中該RGN多肽選自由下列所組成的群組: a)與SEQ ID NO:1具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:2具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:3具有至少95%序列一致性; b)與SEQ ID NO:8具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:9具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:10具有至少95%序列一致性; c)與SEQ ID NO:15具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:16具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:17具有至少95%序列一致性; d)與SEQ ID NO:22具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:23具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:24具有至少95%序列一致性; e)與SEQ ID NO:29具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:30具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:31具有至少95%序列一致性; f)與SEQ ID NO:36具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:37具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:38具有至少95%序列一致性; g)與SEQ ID NO:43具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:44具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:45具有至少95%序列一致性; h)與SEQ ID NO:50具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:51具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:52具有至少95%序列一致性; i)與SEQ ID NO:56具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:57具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:58具有至少95%序列一致性; j)與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:64具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:65具有至少95%序列一致性; k)與SEQ ID NO:70具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:71具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:72具有至少95%序列一致性; l)與SEQ ID NO:76具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:77具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少95%序列一致性; m)與SEQ ID NO:83具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:84具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:85具有至少95%序列一致性; n)與SEQ ID NO:89具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:90具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:91具有至少95%序列一致性; o)與SEQ ID NO:96具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:97具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:98具有至少95%序列一致性; p)與SEQ ID NO:103具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:104具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:105具有至少95%序列一致性; q)與SEQ ID NO:110具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:111具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:112具有至少95%序列一致性; r)與SEQ ID NO:117具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:118具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:119具有至少95%序列一致性; s)與SEQ ID NO:123具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:124具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:125具有至少95%序列一致性;以及 t)與SEQ ID NO:83具有至少95%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:84具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少95%序列一致性。
56. 如實施方式53的載體,其中該RGN多肽選自由下列所組成的群組: a)與SEQ ID NO:1具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:2具有100%序列一致性,且該tracrRNA與SEQ ID NO:3具有100%序列一致性; b)與SEQ ID NO:8具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:9具有100%序列一致性,且該tracrRNA與SEQ ID NO:10具有100%序列一致性; c)與SEQ ID NO:15具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:16具有100%序列一致性,且該tracrRNA與SEQ ID NO:17具有100%序列一致性; d)與SEQ ID NO:22具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:23具有100%序列一致性,且該tracrRNA與SEQ ID NO:24具有100%序列一致性; e)與SEQ ID NO:29具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:30具有100%序列一致性,且該tracrRNA與SEQ ID NO:31具有100%序列一致性; f)與SEQ ID NO:36具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:37具有100%序列一致性,且該tracrRNA與SEQ ID NO:38具有100%序列一致性; g)與SEQ ID NO:43具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:44具有100%序列一致性,且該tracrRNA與SEQ ID NO:45具有100%序列一致性; h)與SEQ ID NO:50具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:51具有100%序列一致性,且該tracrRNA與SEQ ID NO:52具有100%序列一致性; i)與SEQ ID NO:56具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:57具有100%序列一致性,且該tracrRNA與SEQ ID NO:58具有100%序列一致性; j)與SEQ ID NO:63及570-579中任一者具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:64具有100%序列一致性,且該tracrRNA與SEQ ID NO:65具有100%序列一致性; k)與SEQ ID NO:70具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:71具有100%序列一致性,且該tracrRNA與SEQ ID NO:72具有100%序列一致性; l)與SEQ ID NO:76具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:77具有100%序列一致性,且該tracrRNA與SEQ ID NO:78具有100%序列一致性; m)與SEQ ID NO:83具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:84具有100%序列一致性,且該tracrRNA與SEQ ID NO:85具有100%序列一致性; n)與SEQ ID NO:89具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:90具有100%序列一致性,且該tracrRNA與SEQ ID NO:91具有100%序列一致性; o)與SEQ ID NO:96具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:97具有100%序列一致性,且該tracrRNA與SEQ ID NO:98具有100%序列一致性; p)與SEQ ID NO:103具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:104具有100%序列一致性,且該tracrRNA與SEQ ID NO:105具有100%序列一致性; q)與SEQ ID NO:110具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:111具有100%序列一致性,且該tracrRNA與SEQ ID NO:112具有100%序列一致性; r)與SEQ ID NO:117具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:118具有100%序列一致性,且該tracrRNA與SEQ ID NO:119具有100%序列一致性; s)與SEQ ID NO:123具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:124具有100%序列一致性,且該tracrRNA與SEQ ID NO:125具有100%序列一致性;以及 t)與SEQ ID NO:83具有100%序列一致性的RGN多肽,其中該CRISPR重複序列與SEQ ID NO:84具有100%序列一致性,且該tracrRNA與SEQ ID NO:78具有100%序列一致性。
57. 一種包括編碼轉錄活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,該轉錄活化的CRISPR RNA(tracrRNA)包括與SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125具有至少90%序列一致性的核苷酸序列; 其中引導RNA包括: a)該tracrRNA;以及 b)crRNA,該crRNA包括間隔序列及CRISPR重複序列,其中該tracrRNA與該crRNA的該CRISPR重複序列雜交; 當該引導RNA與RNA引導的核酸酶(RGN)多肽結合時,經由該crRNA的間隔序列,能夠以序列專一性方式與標的DNA序列雜交,以及 其中編碼tracrRNA的該多核苷酸被可操作地連接至與該多核苷酸異源的啟動子。
58. 如實施方式57的核酸分子,其中該tracrRNA包括與SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125具有至少95%序列一致性的核苷酸序列。
59. 如實施方式57的核酸分子,其中該tracrRNA包括與SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125具有100%序列一致性的核苷酸序列。
60. 一種包括實施方式57-59中任一實施方式的核酸分子的載體。
61. 如實施方式60的載體,其中該載體進一步包括編碼該crRNA的多核苷酸。
62. 如實施方式61的載體,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列選自由下列所組成的群組: a)與SEQ ID NO:2具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:3具有至少90%序列一致性; b)與SEQ ID NO:9具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:10具有至少90%序列一致性; c)與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:17具有至少90%序列一致性; d)與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:24具有至少90%序列一致性; e)與SEQ ID NO:30具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:31具有至少90%序列一致性; f)與SEQ ID NO:37具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:38具有至少90%序列一致性; g)與SEQ ID NO:44具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:45具有至少90%序列一致性; h)與SEQ ID NO:51具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:52具有至少90%序列一致性; i)與SEQ ID NO:57具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:58具有至少90%序列一致性; j)與SEQ ID NO:64具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:65具有至少90%序列一致性; k)與SEQ ID NO:71具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:72具有至少90%序列一致性; l)與SEQ ID NO:77具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:78具有至少90%序列一致性; m)與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:85具有至少90%序列一致性; n)與SEQ ID NO:90具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:91具有至少90%序列一致性; o)與SEQ ID NO:97具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:98具有至少90%序列一致性; p)與SEQ ID NO:104具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:105具有至少90%序列一致性; q)與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:112具有至少90%序列一致性; r)與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:119具有至少90%序列一致性;以及 s)與SEQ ID NO:124具有至少90%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:125具有至少90%序列一致性。
63. 如實施方式61的載體,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列選自由下列所組成的群組: a)與SEQ ID NO:2具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:3具有至少95%序列一致性; b)與SEQ ID NO:9具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:10具有至少95%序列一致性; c)與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:17具有至少95%序列一致性; d)與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:24具有至少95%序列一致性; e)與SEQ ID NO:30具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:31具有至少95%序列一致性; f)與SEQ ID NO:37具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:38具有至少95%序列一致性; g)與SEQ ID NO:44具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:45具有至少95%序列一致性; h)與SEQ ID NO:51具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:52具有至少95%序列一致性; i)與SEQ ID NO:57具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:58具有至少95%序列一致性; j)與SEQ ID NO:64具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:65具有至少95%序列一致性; k)與SEQ ID NO:71具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:72具有至少95%序列一致性; l)與SEQ ID NO:77具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:78具有至少95%序列一致性; m)與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:85具有至少95%序列一致性; n)與SEQ ID NO:90具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:91具有至少95%序列一致性; o)與SEQ ID NO:97具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:98具有至少95%序列一致性; p)與SEQ ID NO:104具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:105具有至少95%序列一致性; q)與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:112具有至少95%序列一致性; r)與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:119具有至少95%序列一致性;以及 s)與SEQ ID NO:124具有至少95%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:125具有至少95%序列一致性。
64. 如實施方式61的載體,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列選自由下列所組成的群組: a)與SEQ ID NO:2具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:3具有100%序列一致性; b)與SEQ ID NO:9具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:10具有100%序列一致性; c)與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:17具有100%序列一致性; d)與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:24具有100%序列一致性; e)與SEQ ID NO:30具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:31具有100%序列一致性; f)與SEQ ID NO:37具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:38具有100%序列一致性; g)與SEQ ID NO:44具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:45具有100%序列一致性; h)與SEQ ID NO:51具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:52具有100%序列一致性; i)與SEQ ID NO:57具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:58具有100%序列一致性; j)與SEQ ID NO:64具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:65具有100%序列一致性; k)與SEQ ID NO:71具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:72具有100%序列一致性; l)與SEQ ID NO:77具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:78具有100%序列一致性; m)與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:85具有100%序列一致性; n)與SEQ ID NO:90具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:91具有100%序列一致性; o)與SEQ ID NO:97具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:98具有100%序列一致性; p)與SEQ ID NO:104具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:105具有100%序列一致性; q)與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:112具有100%序列一致性; r)與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:119具有100%序列一致性;以及 s)與SEQ ID NO:124具有100%序列一致性的CRISPR重複序列,其中該tracrRNA與SEQ ID NO:125具有100%序列一致性。
65. 如實施方式61-64中任一實施方式的載體,其中編碼該crRNA的該多核苷酸及編碼該tracrRNA的該多核苷酸可操作地連接至相同啟動子、且被編碼為單引導RNA。
66. 如實施方式61-64中任一實施方式的載體,其中編碼該crRNA的該多核苷酸及編碼該tracrRNA的該多核苷酸可操作地連接至單獨的啟動子。
67. 如實施方式60-66中任一實施方式的載體,其中該載體進一步包括編碼該RGN多肽的多核苷酸。
68. 如實施方式67的載體,其中該RGN多肽選自由下列所組成的群組: a)與SEQ ID NO:1具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:2具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:3具有至少90%序列一致性; b)與SEQ ID NO:8具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:9具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:10具有至少90%序列一致性; c)與SEQ ID NO:15具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:17具有至少90%序列一致性; d)與SEQ ID NO:22具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:24具有至少90%序列一致性; e)與SEQ ID NO:29具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:30具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:31具有至少90%序列一致性; f)與SEQ ID NO:36具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:37具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:38具有至少90%序列一致性; g)與SEQ ID NO:43具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:44具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:45具有至少90%序列一致性; h)與SEQ ID NO:50具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:51具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:52具有至少90%序列一致性; i)與SEQ ID NO:56具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:57具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:58具有至少90%序列一致性; j)與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:64具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:65具有至少90%序列一致性; k)與SEQ ID NO:70具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:71具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:72具有至少90%序列一致性; l)與SEQ ID NO:76具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:77具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少90%序列一致性; m)與SEQ ID NO:83具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:84具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:85具有至少90%序列一致性; n)與SEQ ID NO:89具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:90具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:91具有至少90%序列一致性; o)與SEQ ID NO:96具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:97具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:98具有至少90%序列一致性; p)與SEQ ID NO:103具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:104具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:105具有至少90%序列一致性; q)與SEQ ID NO:110具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:111具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:112具有至少90%序列一致性; r)與SEQ ID NO:117具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:118具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:119具有至少90%序列一致性; s)與SEQ ID NO:123具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:124具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:125具有至少90%序列一致性;以及 t)與SEQ ID NO:83具有至少90%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:84具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少90%序列一致性。
69. 如實施方式67的載體,其中該RGN多肽選自由下列所組成的群組: a)與SEQ ID NO:1具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:2具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:3具有至少95%序列一致性; b)與SEQ ID NO:8具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:9具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:10具有至少95%序列一致性; c)與SEQ ID NO:15具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:16具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:17具有至少95%序列一致性; d)與SEQ ID NO:22具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:23具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:24具有至少95%序列一致性; e)與SEQ ID NO:29具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:30具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:31具有至少95%序列一致性; f)與SEQ ID NO:36具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:37具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:38具有至少95%序列一致性; g)與SEQ ID NO:43具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:44具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:45具有至少95%序列一致性; h)與SEQ ID NO:50具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:51具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:52具有至少95%序列一致性; i)與SEQ ID NO:56具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:57具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:58具有至少95%序列一致性; j)與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:64具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:65具有至少95%序列一致性; k)與SEQ ID NO:70具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:71具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:72具有至少95%序列一致性; l)與SEQ ID NO:76具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:77具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少95%序列一致性; m)與SEQ ID NO:83具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:84具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:85具有至少95%序列一致性; n)與SEQ ID NO:89具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:90具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:91具有至少95%序列一致性; o)與SEQ ID NO:96具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:97具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:98具有至少95%序列一致性; p)與SEQ ID NO:103具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:104具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:105具有至少95%序列一致性; q)與SEQ ID NO:110具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:111具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:112具有至少95%序列一致性; r)與SEQ ID NO:117具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:118具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:119具有至少95%序列一致性; s)與SEQ ID NO:123具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:124具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:125具有至少95%序列一致性;以及 t)與SEQ ID NO:83具有至少95%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:84具有至少95%序列一致性,且該tracrRNA與SEQ ID NO:78具有至少95%序列一致性。
70. 如實施方式67的載體,其中該RGN多肽選自由下列所組成的群組: a)與SEQ ID NO:1具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:2具有100%序列一致性,且該tracrRNA與SEQ ID NO:3具有100%序列一致性; b)與SEQ ID NO:8具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:9具有100%序列一致性,且該tracrRNA與SEQ ID NO:10具有100%序列一致性; c)與SEQ ID NO:15具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:16具有100%序列一致性,且該tracrRNA與SEQ ID NO:17具有100%序列一致性; d)與SEQ ID NO:22具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:23具有100%序列一致性,且該tracrRNA與SEQ ID NO:24具有100%序列一致性; e)與SEQ ID NO:29具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:30具有100%序列一致性,且該tracrRNA與SEQ ID NO:31具有100%序列一致性; f)與SEQ ID NO:36具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:37具有100%序列一致性,且該tracrRNA與SEQ ID NO:38具有100%序列一致性; g)與SEQ ID NO:43具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:44具有100%序列一致性,且該tracrRNA與SEQ ID NO:45具有100%序列一致性; h)與SEQ ID NO:50具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:51具有100%序列一致性,且該tracrRNA與SEQ ID NO:52具有100%序列一致性; i)與SEQ ID NO:56具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:57具有100%序列一致性,且該tracrRNA與SEQ ID NO:58具有100%序列一致性; j)與SEQ ID NO:63及570-579中任一者具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:64具有100%序列一致性,且該tracrRNA與SEQ ID NO:65具有100%序列一致性; k)與SEQ ID NO:70具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:71具有100%序列一致性,且該tracrRNA與SEQ ID NO:72具有100%序列一致性; l)與SEQ ID NO:76具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:77具有100%序列一致性,且該tracrRNA與SEQ ID NO:78具有100%序列一致性; m)與SEQ ID NO:83具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:84具有100%序列一致性,且該tracrRNA與SEQ ID NO:85具有100%序列一致性; n)與SEQ ID NO:89具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:90具有100%序列一致性,且該tracrRNA與SEQ ID NO:91具有100%序列一致性; o)與SEQ ID NO:96具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:97具有100%序列一致性,且該tracrRNA與SEQ ID NO:98具有100%序列一致性; p)與SEQ ID NO:103具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:104具有100%序列一致性,且該tracrRNA與SEQ ID NO:105具有100%序列一致性; q)與SEQ ID NO:110具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:111具有100%序列一致性,且該tracrRNA與SEQ ID NO:112具有100%序列一致性; r)與SEQ ID NO:117具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:118具有100%序列一致性,且該tracrRNA與SEQ ID NO:119具有100%序列一致性; s)與SEQ ID NO:123具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:124具有100%序列一致性,且該tracrRNA與SEQ ID NO:125具有100%序列一致性;以及 t)與SEQ ID NO:83具有100%序列一致性的RGN多肽,其中該crRNA包括CRISPR重複序列,該CRISPR重複序列與SEQ ID NO:84具有100%序列一致性,且該tracrRNA與SEQ ID NO:78具有100%序列一致性。
71. 一種用於結合DNA分子的標的DNA序列的系統,該系統包括: a)能夠與該標的DNA序列雜交的一或更多引導RNA、或包括編碼該一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b)包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽、或包括編碼該RGN多肽的核苷酸序列的多核苷酸; 其中編碼該RGN多肽的該核苷酸序列以及編碼該一或更多引導RNA的該核苷酸序列中的至少一者可操作地連接至與該核苷酸序列異源的啟動子; 其中該一或更多引導RNA能夠與該標的DNA序列雜交,以及 其中該一或更多引導RNA能夠與該RGN多肽形成錯合物,以便引導該RGN多肽與該DNA分子的該標的DNA序列結合。
72. 一種用於結合DNA分子的標的DNA序列的系統,該系統包括: a)能夠與該標的DNA序列雜交的一或更多引導RNA、或包括編碼該一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b)包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽; 其中該一或更多引導RNA能夠與該標的DNA序列雜交,以及 其中該一或更多引導RNA能夠與該RGN多肽形成錯合物,以便引導該RGN多肽與該DNA分子的該標的DNA序列結合。
73. 如實施方式71或72的系統,其中編碼該一或更多引導RNA的至少一個該核苷酸序列可操作地連接至與該核苷酸序列異源的啟動子。
74. 如實施方式71-73中任一實施方式的系統,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的胺基酸序列。
75. 如實施方式71-73中任一實施方式的系統,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的胺基酸序列。
76. 如實施方式71-73中任一實施方式的系統,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。
77. 如實施方式71-76中任一實施方式的系統,其中未發現該RGN多肽與該一或更多引導RNA在本質上彼此錯合。
78. 如實施方式71-77中任一實施方式的系統,其中該標的DNA序列為真核標的DNA序列。
79. 如實施方式71-78中任一實施方式的系統,其中該gRNA為單引導RNA(sgRNA)。
80. 如實施方式71-78中任一實施方式的系統,其中該gRNA為雙引導RNA。
81. 如實施方式71-80中任一實施方式的系統,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:22具有至少90%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:29具有至少90%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:36具有至少90%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:43具有至少90%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:50具有至少90%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:56具有至少90%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:70具有至少90%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:76具有至少90%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:89具有至少90%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:96具有至少90%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:103具有至少90%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:110具有至少90%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:117具有至少90%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:123具有至少90%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列。
82. 如實施方式71-80中任一實施方式的系統,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:22具有至少95%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:29具有至少95%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:36具有至少95%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:43具有至少95%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:50具有至少95%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:56具有至少95%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:70具有至少95%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:76具有至少95%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:89具有至少95%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:96具有至少95%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:103具有至少95%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:110具有至少95%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:117具有至少95%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:123具有至少95%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列。
83. 如實施方式71-80中任一實施方式的系統,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:8具有100%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:15具有100%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:22具有100%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:29具有100%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:36具有100%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:43具有100%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:50具有100%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:56具有100%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有100%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:70具有100%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:76具有100%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:89具有100%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:96具有100%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:103具有100%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:110具有100%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:117具有100%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:123具有100%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的胺基酸序列。
84. 如實施方式71-83中任一實施方式的系統,其中該標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
85. 如實施方式71-84中任一實施方式的系統,其中該標的DNA序列在細胞內。
86. 如實施方式85的系統,其中該細胞為真核細胞。
87. 如實施方式86的系統,其中該真核細胞為植物細胞。
88. 如實施方式86的系統,其中該真核細胞為哺乳動物細胞。
89. 如實施方式88的系統,其中該哺乳動物細胞為人類細胞。
90. 如實施方式89的系統,其中該人類細胞為免疫細胞。
91. 如實施方式90的系統,其中該免疫細胞為幹細胞。
92. 如實施方式91的系統,其中該幹細胞為經誘導的多潛能幹細胞。
93. 如實施方式86的系統,其中該真核細胞為昆蟲細胞。
94. 如實施方式85的系統,其中該細胞為原核細胞。
95. 如實施方式71-94中任一實施方式的系統,其中,當被轉錄時,該一或更多引導RNA能夠與該標的DNA序列雜交,且該引導RNA能夠與該RGN多肽形成錯合物,以導向該標的DNA序列的切割。
96. 如實施方式95的系統,其中該切割產生雙股斷裂。
97. 如實施方式95的系統,其中該切割產生單股斷裂。
98. 如實施方式71-94中任一實施方式的系統,其中該RGN多肽為核酸酶不活化或為切口酶。
99. 如實施方式71-98中任一實施方式的系統,其中該RGN多肽可操作地連接至鹼基編輯多肽。
100. 如實施方式99的系統,其中該鹼基編輯多肽為去胺酶。
101. 如實施方式100的系統,其中該去胺酶為胞苷去胺酶或腺嘌呤去胺酶。
102. 如實施方式71-101中任一實施方式的系統,其中該RGN多肽包括一或更多核定位訊號。
103. 如實施方式71-102中任一實施方式的系統,其中該RGN多肽針對於真核細胞中的表現而被密碼子最佳化。
104. 如實施方式71-103中任一實施方式的系統,其中編碼一或更多引導RNA的核苷酸序列及編碼RGN多肽的核苷酸序列被定位於一個載體上。
105. 如實施方式71-104中任一實施方式的系統,其中該系統進一步包括一或更多供體多核苷酸或編碼該一或更多供體多核苷酸的一或更多核苷酸序列。
106. 一種醫藥組成物,包括實施方式1-14、43-45及57-59中任一實施方式的核酸分子、實施方式15-21、46-56及60-70中任一實施方式的載體、實施方式22的細胞、實施方式31-42中任一實施方式的分離的RGN多肽、或實施方式71-105中任一實施方式的系統、及藥學上可接受的載體。
107. 一種用於結合DNA分子的標的DNA序列的方法,包括將根據實施方式71-105中任一實施方式的系統遞送至該標的DNA序列或包括該標的DNA序列的細胞。
108. 如實施方式107的方法,其中該RGN多肽或該引導RNA進一步包括可檢測標記,從而允許用於該標的DNA序列的檢測。
109. 如實施方式107的方法,其中該引導RNA或該RGN多肽進一步包括表現調節子,從而調節該標的DNA序列的表現或由該標的DNA序列的轉錄控制下的基因的表現。
110. 一種用於切割或修飾DNA分子的標的DNA序列的方法,包括將根據實施方式71-105中任一實施方式的系統遞送至該標的DNA序列或包括該DNA分子的細胞,且發生該標的DNA序列的切割或修飾。
111. 如實施方式110的方法,其中該經修飾的標的DNA序列包括異源DNA於該標的DNA序列中的插入。
112. 如實施方式110的方法,其中該經修飾的標的DNA序列包括至少一核苷酸自該標的DNA序列的缺失。
113. 如實施方式110的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的突變。
114. 一種用於結合DNA分子的標的DNA序列的方法,包括: a)在適合形成RGN核糖核苷酸錯合物的條件下,藉由組合下列,以在體外組裝RNA引導的核酸酶(RGN)核糖核苷酸錯合物: i)能夠與該標的DNA序列雜交的一或更多引導RNA;以及 ii)RGN多肽,該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的胺基酸序列;以及 b)使該標的DNA序列或包括該標的DNA序列的細胞與該在體外組裝的RGN核糖核苷酸錯合物接觸; 其中該一或更多引導RNA與該標的DNA序列雜交,從而將該RGN多肽導向與該標的DNA序列結合。
115. 如實施方式114的方法,其中該RGN多肽或該引導RNA進一步包括可檢測標記,從而允許用於該標的DNA序列的檢測。
116. 如實施方式114的方法,其中該引導RNA或該RGN多肽進一步包括表現調節子,從而允許對該標的DNA序列的表現的調節。
117. 一種用於切割及/或修飾DNA分子的標的DNA序列的方法,包括使該DNA分子與下列接觸: a)RNA引導的核酸酶(RGN)多肽,其中該RGN包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的胺基酸序列;以及 b)能夠將(a)的RGN靶向該標的DNA序列的一或更多引導RNA; 其中該一或更多引導RNA與該標的DNA序列雜交,從而將該RGN多肽導向與該標的DNA序列結合,並且發生該標的DNA序列的切割及/或修飾。
118. 如實施方式117的方法,其中藉由該RGN多肽的切割產生雙股斷裂。
119. 如實施方式117的方法,其中藉由該RGN多肽的切割產生單股斷裂。
120. 如實施方式117的方法,其中該RGN多肽為核酸酶不活化或為切口酶、且與鹼基編輯多肽可操作地融合。
121. 如實施方式120的方法,其中該鹼基編輯多肽為去胺酶。
122. 如實施方式121的方法,其中該去胺酶為胞苷去胺酶或腺嘌呤去胺酶。
123. 如實施方式117的方法,其中該經修飾的標的DNA序列包括異源DNA於該標的DNA序列中的插入。
124. 如實施方式117的方法,其中該經修飾的標的DNA序列包括至少一核苷酸自該標的DNA序列的缺失。
125. 如實施方式117的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的突變。
126. 如實施方式114-125中任一實施方式的方法,其中該標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
127. 如實施方式114-126中任一實施方式的方法,其中該標的DNA序列為真核標的DNA序列。
128. 如實施方式114-127中任一實施方式的方法,其中該gRNA為單引導RNA(gRNA)。
129. 如實施方式114-127中任一實施方式的方法,其中該gRNA為雙引導RNA。
130. 如實施方式114-129中任一實施方式的方法,其中該RGN包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的胺基酸序列。
131. 如實施方式114-129中任一實施方式的方法,其中該RGN包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的胺基酸序列。
132. 如實施方式114-129中任一實施方式的方法,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。
133. 如實施方式114-129中任一實施方式的方法,其中: a)該RGN與SEQ ID NO:1具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:2具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:3具有至少90%序列一致性的tracrRNA; b)該RGN與SEQ ID NO:8具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:9具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:10具有至少90%序列一致性的tracrRNA; c)該RGN與SEQ ID NO:15具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:16具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:17具有至少90%序列一致性的tracrRNA; d)該RGN與SEQ ID NO:22具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:23具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:24具有至少90%序列一致性的tracrRNA; e)該RGN與SEQ ID NO:29具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:30具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA; f)該RGN與SEQ ID NO:36具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:37具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:38具有至少90%序列一致性的tracrRNA; g)該RGN與SEQ ID NO:43具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:44具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:45具有至少90%序列一致性的tracrRNA; h)該RGN與SEQ ID NO:50具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:51具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:52具有至少90%序列一致性的tracrRNA; i)該RGN與SEQ ID NO:56具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:57具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:58具有至少90%序列一致性的tracrRNA; j)該RGN與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:64具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:65具有至少90%序列一致性的tracrRNA; k)該RGN與SEQ ID NO:70具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:71具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:72具有至少90%序列一致性的tracrRNA; l)該RGN與SEQ ID NO:76具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:77具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA; m)該RGN與SEQ ID NO:83具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:85具有至少90%序列一致性的tracrRNA; n)該RGN與SEQ ID NO:89具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:90具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:91具有至少90%序列一致性的tracrRNA; o)該RGN與SEQ ID NO:96具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:97具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:98具有至少90%序列一致性的tracrRNA; p)該RGN與SEQ ID NO:103具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:104具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:105具有至少90%序列一致性的tracrRNA; q)該RGN與SEQ ID NO:110具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:111具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:112具有至少90%序列一致性的tracrRNA; r)該RGN與SEQ ID NO:117具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:118具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:119具有至少90%序列一致性的tracrRNA; s)該RGN與SEQ ID NO:123具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:124具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:125具有至少90%序列一致性的tracrRNA;或 t)該RGN與SEQ ID NO:83具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少90%序列一致性的crRNA重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA。
134. 如實施方式114-129中任一實施方式的方法,其中: a)該RGN與SEQ ID NO:1具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:2具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:3具有至少95%序列一致性的tracrRNA; b)該RGN與SEQ ID NO:8具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:9具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:10具有至少95%序列一致性的tracrRNA; c)該RGN與SEQ ID NO:15具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:16具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:17具有至少95%序列一致性的tracrRNA; d)該RGN與SEQ ID NO:22具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:23具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:24具有至少95%序列一致性的tracrRNA; e)該RGN與SEQ ID NO:29具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:30具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA; f)該RGN與SEQ ID NO:36具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:37具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:38具有至少95%序列一致性的tracrRNA; g)該RGN與SEQ ID NO:43具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:44具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:45具有至少95%序列一致性的tracrRNA; h)該RGN與SEQ ID NO:50具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:51具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:52具有至少95%序列一致性的tracrRNA; i)該RGN與SEQ ID NO:56具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:57具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:58具有至少95%序列一致性的tracrRNA; j)該RGN與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:64具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:65具有至少95%序列一致性的tracrRNA; k)該RGN與SEQ ID NO:70具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:71具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:72具有至少95%序列一致性的tracrRNA; l)該RGN與SEQ ID NO:76具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:77具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA; m)該RGN與SEQ ID NO:83具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:85具有至少95%序列一致性的tracrRNA; n)該RGN與SEQ ID NO:89具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:90具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:91具有至少95%序列一致性的tracrRNA; o)該RGN與SEQ ID NO:96具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:97具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:98具有至少95%序列一致性的tracrRNA; p)該RGN與SEQ ID NO:103具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:104具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:105具有至少95%序列一致性的tracrRNA; q)該RGN與SEQ ID NO:110具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:111具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:112具有至少95%序列一致性的tracrRNA; r)該RGN與SEQ ID NO:117具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:118具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:119具有至少95%序列一致性的tracrRNA; s)該RGN與SEQ ID NO:123具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:124具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:125具有至少95%序列一致性的tracrRNA;或 t)該RGN與SEQ ID NO:83具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少95%序列一致性的crRNA重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA。
135. 如實施方式114-129中任一實施方式的方法,其中: a)該RGN與SEQ ID NO:1具有100%序列一致性,該引導RNA包括與SEQ ID NO:2具有100%序列一致性的crRNA重複序列及與SEQ ID NO:3具有100%序列一致性的tracrRNA; b)該RGN與SEQ ID NO:8具有100%序列一致性,該引導RNA包括與SEQ ID NO:9具有100%序列一致性的crRNA重複序列及與SEQ ID NO:10具有100%序列一致性的tracrRNA; c)該RGN與SEQ ID NO:15具有100%序列一致性,該引導RNA包括與SEQ ID NO:16具有100%序列一致性的crRNA重複序列及與SEQ ID NO:17具有100%序列一致性的tracrRNA; d)該RGN與SEQ ID NO:22具有100%序列一致性,該引導RNA包括與SEQ ID NO:23具有100%序列一致性的crRNA重複序列及與SEQ ID NO:24具有100%序列一致性的tracrRNA; e)該RGN與SEQ ID NO:29具有100%序列一致性,該引導RNA包括與SEQ ID NO:30具有100%序列一致性的crRNA重複序列及與SEQ ID NO:31具有100%序列一致性的tracrRNA; f)該RGN與SEQ ID NO:36具有100%序列一致性,該引導RNA包括與SEQ ID NO:37具有100%序列一致性的crRNA重複序列及與SEQ ID NO:38具有100%序列一致性的tracrRNA; g)該RGN與SEQ ID NO:43具有100%序列一致性,該引導RNA包括與SEQ ID NO:44具有100%序列一致性的crRNA重複序列及與SEQ ID NO:45具有100%序列一致性的tracrRNA; h)該RGN與SEQ ID NO:50具有100%序列一致性,該引導RNA包括與SEQ ID NO:51具有100%序列一致性的crRNA重複序列及與SEQ ID NO:52具有100%序列一致性的tracrRNA; i)該RGN與SEQ ID NO:56具有100%序列一致性,該引導RNA包括與SEQ ID NO:57具有100%序列一致性的crRNA重複序列及與SEQ ID NO:58具有100%序列一致性的tracrRNA; j)該RGN與SEQ ID NO:63及570-579中任一者具有100%序列一致性,該引導RNA包括與SEQ ID NO:64具有100%序列一致性的crRNA重複序列及與SEQ ID NO:65具有100%序列一致性的tracrRNA; k)該RGN與SEQ ID NO:70具有100%序列一致性,該引導RNA包括與SEQ ID NO:71具有100%序列一致性的crRNA重複序列及與SEQ ID NO:72具有100%序列一致性的tracrRNA; l)該RGN與SEQ ID NO:76具有100%序列一致性,該引導RNA包括與SEQ ID NO:77具有100%序列一致性的crRNA重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA; m)該RGN與SEQ ID NO:83具有100%序列一致性,該引導RNA包括與SEQ ID NO:84具有100%序列一致性的crRNA重複序列及與SEQ ID NO:85具有100%序列一致性的tracrRNA; n)該RGN與SEQ ID NO:89具有100%序列一致性,該引導RNA包括與SEQ ID NO:90具有100%序列一致性的crRNA重複序列及與SEQ ID NO:91具有100%序列一致性的tracrRNA; o)該RGN與SEQ ID NO:96具有100%序列一致性,該引導RNA包括與SEQ ID NO:97具有100%序列一致性的crRNA重複序列及與SEQ ID NO:98具有100%序列一致性的tracrRNA; p)該RGN與SEQ ID NO:103具有100%序列一致性,該引導RNA包括與SEQ ID NO:104具有100%序列一致性的crRNA重複序列及與SEQ ID NO:105具有100%序列一致性的tracrRNA; q)該RGN與SEQ ID NO:110具有100%序列一致性,該引導RNA包括與SEQ ID NO:111具有100%序列一致性的crRNA重複序列及與SEQ ID NO:112具有100%序列一致性的tracrRNA; r)該RGN與SEQ ID NO:117具有100%序列一致性,該引導RNA包括與SEQ ID NO:118具有100%序列一致性的crRNA重複序列及與SEQ ID NO:119具有100%序列一致性的tracrRNA; s)該RGN與SEQ ID NO:123具有100%序列一致性,該引導RNA包括與SEQ ID NO:124具有100%序列一致性的crRNA重複序列及與SEQ ID NO:125具有100%序列一致性的tracrRNA;或 t)該RGN與SEQ ID NO:83具有100%序列一致性,該引導RNA包括與SEQ ID NO:84具有100%序列一致性的crRNA重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA。
136. 如實施方式107-135中任一實施方式的方法,其中該標的DNA序列在細胞內。
137. 如實施方式136的方法,其中該細胞為真核細胞。
138. 如實施方式137的方法,其中該真核細胞為植物細胞。
139. 如實施方式137的方法,其中該真核細胞為哺乳動物細胞。
140. 如實施方式139的方法,其中該哺乳動物細胞為人類細胞。
141. 如實施方式140的方法,其中該人類細胞為免疫細胞。
142. 如實施方式141的方法,其中該免疫細胞為幹細胞。
143. 如實施方式142的方法,其中該幹細胞為經誘導的多潛能幹細胞。
144. 如實施方式137的方法,其中該真核細胞為昆蟲細胞。
145. 如實施方式136的方法,其中該細胞為原核細胞。
146. 如實施方式136-145中任一實施方式的方法,進一步包括:在該RGN多肽被表現且切割標的DNA序列以產生包括經修飾的DNA序列的DNA分子的條件下,培養該細胞;以及選擇包括該經修飾的標的DNA序列的細胞。
147. 一種包括根據實施方式146的方法的經修飾的標的DNA序列的細胞。
148. 如實施方式147的細胞,其中該細胞為真核細胞。
149. 如實施方式148的細胞,其中該真核細胞為植物細胞。
150. 一種包括實施方式149的細胞的植物。
151. 一種包括實施方式149的細胞的種子。
152. 如實施方式148的細胞,其中該真核細胞為哺乳動物細胞。
153. 如實施方式152的細胞,其中該哺乳動物細胞為人類細胞。
154. 如實施方式153的細胞,其中該人類細胞為免疫細胞。
155. 如實施方式154的細胞,其中該免疫細胞為幹細胞。
156. 如實施方式155的細胞,其中該幹細胞為經誘導的多潛能幹細胞。
157. 如實施方式148的細胞,其中該真核細胞為昆蟲細胞。
158. 如實施方式147的細胞,其中該細胞為原核細胞。
159. 一種包括實施方式148及152-156中任一實施方式的細胞的醫藥組成物及藥學上可接受的載體。
160. 一種用於利用針對遺傳性疾病的因果突變(causal mutation)的校正來產生基因修飾細胞的方法,該方法包括將下列引入該細胞內: a)RNA引導的核酸酶(RGN)多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579具有至少90%序列一致性的胺基酸序列;或編碼該RGN多肽的多核苷酸,其中編碼該RGN多肽的該多核苷酸可操作地連接至啟動子,以賦能在該細胞中該RGN多肽的表現;以及 b)引導RNA(gRNA)或編碼該gRNA的多核苷酸,其中編碼該gRNA的該多核苷酸可操作地連接至啟動子,以賦能在該細胞中該gRNA的表現, 藉以,該RGN及gRNA靶向該因果突變的基因體位置且修飾該基因體序列以移除該因果突變。
161. 如實施方式160的方法,其中該RGN為核酸酶不活化或為切口酶、且與具有鹼基編輯活性的多肽融合。
162. 如實施方式161的方法,其中該鹼基編輯多肽為去胺酶。
163. 如實施方式162的方法,其中具鹼基編輯活性的多肽為胞苷去胺酶或腺嘌呤去胺酶。
164. 如實施方式160-163中任一實施方式的方法,其中該遺傳性疾病是由單一核苷酸多型性引起的。
165. 如實施方式160-163中任一實施方式的方法,其中該遺傳性疾病為Hurler氏症候群。
166. 如實施方式160-163中任一實施方式的方法,其中該gRNA進一步包括靶向靠近該因果單一核苷酸多型性的區域的間隔序列。
167. 一種用於利用引起疾病的不穩定基因體區域中的缺失來產生基因修飾細胞的方法,該方法包括將下列引入該細胞內: a)RNA引導的核酸酶(RGN)多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579具有至少90%序列一致性的胺基酸序列;或編碼該RGN多肽的多核苷酸,其中編碼該RGN多肽的該多核苷酸可操作地連接至啟動子,以賦能在該細胞中該RGN多肽的表現;以及 b)第一引導RNA(gRNA)或編碼該gRNA的多核苷酸,其中編碼該gRNA的該多核苷酸可操作地連接至啟動子,以賦能在該細胞中該gRNA的表現,且進一步地其中該gRNA包括靶向該不穩定基因體區域的5'側翼的間隔序列;以及 c)第二引導RNA(gRNA)或編碼該gRNA的多核苷酸,其中編碼該gRNA的該多核苷酸可操作地連接至啟動子,以賦能在該細胞中該gRNA的表現,並且進一步地其中該gRNA包括靶向該不穩定基因體區域的3'側翼的間隔序列; 藉以,該RGN及該二gRNA靶向該不穩定基因體區域,且該不穩定基因體區域的至少一部分被移除。
168. 如實施方式167的方法,其中該遺傳性疾病為弗里德里希運動失調或亨汀頓氏舞蹈症。
169. 如實施方式167的方法,其中該第一gRNA進一步包括靶向該不穩定基因體區域內的或靠近該不穩定基因體區域的區域的間隔序列。
170. 如實施方式169的方法,其中該第二gRNA進一步包括靶向該不穩定基因體區域內的或靠近該不穩定基因體區域的區域的間隔序列。
171. 如實施方式160-170中任一實施方式的方法,其中該RGN多肽與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一者具有至少95%序列一致性。
172. 如實施方式160-170中任一實施方式的方法,其中該RGN多肽與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一者具有100%序列一致性。
173. 如實施方式160-170中任一實施方式的方法,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。
174. 如實施方式160-170中任一實施方式的方法,其中該gRNA、該第一gRNA、該第二gRNA、或該第一gRNA及該第二gRNA從選自由下列所組成的群組的gRNA選出: a)包括與SEQ ID NO:2具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:22具有至少90%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:29具有至少90%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:36具有至少90%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:43具有至少90%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:50具有至少90%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:56具有至少90%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:70具有至少90%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:76具有至少90%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:89具有至少90%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:96具有至少90%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:103具有至少90%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:110具有至少90%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:117具有至少90%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:123具有至少90%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列。
175. 如實施方式160-170中任一實施方式的方法,其中該gRNA、該第一gRNA、該第二gRNA、或該第一gRNA及該第二gRNA從選自由下列所組成的群組的gRNA選出: a)包括與SEQ ID NO:2具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:22具有至少95%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:29具有至少95%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:36具有至少95%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:43具有至少95%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:50具有至少95%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:56具有至少95%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:70具有至少95%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:76具有至少95%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:89具有至少95%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:96具有至少95%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:103具有至少95%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:110具有至少95%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:117具有至少95%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:123具有至少95%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列。
176. 如實施方式160-170中任一實施方式的方法,其中該gRNA、該第一gRNA、該第二gRNA、或該第一gRNA及該第二gRNA選自從由下列組成的群組選出的gRNA: a)包括與SEQ ID NO:2具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:8具有100%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:15具有100%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:22具有100%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:29具有100%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:36具有100%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:43具有100%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:50具有100%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:56具有100%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:63及570-579中任一者具有100%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:70具有100%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:76具有100%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有100%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:89具有100%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:96具有100%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:103具有100%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:110具有100%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:117具有100%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:123具有100%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有100%序列一致性的胺基酸序列。
177. 如實施方式160-176中任一實施方式的方法,其中該細胞為動物細胞。
178. 如實施方式177的方法,其中該動物細胞為哺乳動物細胞。
179. 如實施方式177的方法,其中該細胞為從狗、貓、小鼠、大鼠、兔、馬、牛、豬或人取得的。
180. 一種用於產生具有降低的BCL11A mRNA及蛋白質表現的基因修飾的哺乳動物造血前驅細胞的方法,該方法包括將下列引入分離的人造血前驅細胞內: a)RNA引導的核酸酶(RGN)多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579具有至少90%序列一致性的胺基酸序列;或編碼該RGN多肽的多核苷酸,其中編碼該RGN多肽的該多核苷酸可操作地連接至啟動子,以賦能在該細胞中該RGN多肽的表現;以及 b)引導RNA(gRNA)或編碼該gRNA的多核苷酸,其中編碼該gRNA的該多核苷酸可操作地連接至啟動子,以賦能在該細胞中該gRNA的表現, 藉以,該RGN和gRNA在細胞中表現、並在BCL11A增強子區域處切割,導致該人造血前驅細胞的基因修飾且降低BCL11A的mRNA及/或蛋白質表現。
181. 如實施方式180的方法,其中該RGN多肽與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一者具有至少95%序列一致性。
182. 如實施方式180的方法,其中該RGN多肽與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一者具有100%序列一致性。
183. 如實施方式180的方法,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的胺基酸位置處的異白胺酸、在與SEQ ID NO:63的328對應的胺基酸位置處的纈胺酸、在與SEQ ID NO:63的366對應的胺基酸位置處的白胺酸、在與SEQ ID NO:63的368對應的胺基酸位置處的蘇胺酸、及在與SEQ ID NO:63的405對應的胺基酸位置處的纈胺酸。
184. 如實施方式180的方法,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:22具有至少90%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:29具有至少90%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:36具有至少90%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:43具有至少90%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:50具有至少90%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:56具有至少90%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:70具有至少90%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:76具有至少90%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:89具有至少90%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:96具有至少90%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:103具有至少90%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:110具有至少90%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:117具有至少90%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:123具有至少90%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少90%序列一致性的胺基酸序列。
185. 如實施方式180的方法,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:22具有至少95%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:29具有至少95%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:36具有至少95%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:43具有至少95%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:50具有至少95%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:56具有至少95%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:70具有至少95%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:76具有至少95%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:89具有至少95%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:96具有至少95%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:103具有至少95%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:110具有至少95%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:117具有至少95%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:123具有至少95%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有至少95%序列一致性的胺基酸序列。
186. 如實施方式180的方法,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:3具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)包括與SEQ ID NO:9具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:10具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:8具有100%序列一致性的胺基酸序列; c)包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:17具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:15具有100%序列一致性的胺基酸序列; d)包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:24具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:22具有100%序列一致性的胺基酸序列; e)包括與SEQ ID NO:30具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:29具有100%序列一致性的胺基酸序列; f)包括與SEQ ID NO:37具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:38具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:36具有100%序列一致性的胺基酸序列; g)包括與SEQ ID NO:44具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:45具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:43具有100%序列一致性的胺基酸序列; h)包括與SEQ ID NO:51具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:52具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:50具有100%序列一致性的胺基酸序列; i)包括與SEQ ID NO:57具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:58具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:56具有100%序列一致性的胺基酸序列; j)包括與SEQ ID NO:64具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:65具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:63及570-579中任一者具有100%序列一致性的胺基酸序列; k)包括與SEQ ID NO:71具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:72具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:70具有100%序列一致性的胺基酸序列; l)包括與SEQ ID NO:77具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:76具有100%序列一致性的胺基酸序列; m)包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:85具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有100%序列一致性的胺基酸序列; n)包括與SEQ ID NO:90具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:91具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:89具有100%序列一致性的胺基酸序列; o)包括與SEQ ID NO:97具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:98具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:96具有100%序列一致性的胺基酸序列; p)包括與SEQ ID NO:104具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:105具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:103具有100%序列一致性的胺基酸序列; q)包括與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:112具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:110具有100%序列一致性的胺基酸序列; r)包括與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:119具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:117具有100%序列一致性的胺基酸序列; s)包括與SEQ ID NO:124具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:125具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:123具有100%序列一致性的胺基酸序列;以及 t)包括與SEQ ID NO:84具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的tracrRNA的gRNA,其中該RGN多肽具有與SEQ ID NO:83具有100%序列一致性的胺基酸序列。
187. 如實施方式180-186中任一實施方式的方法,其中該gRNA進一步包括靶向在該BCL11A增強子區域內的或靠近該BCL11A增強子區域的區域的間隔序列。
188. 一種治療疾病的方法,該方法包括對需要治療的個體投予有效量的實施方式106或159的醫藥組成物。
189. 如實施方式188的方法,其中該疾病與因果突變關聯,且該有效量的該醫藥組成物校正該基因突變。
190. 一種實施方式1-14、43-45及57-59中任一實施方式的核酸分子、實施方式15-21、46-56及60-70中任一實施方式的載體、實施方式22、147、148及152-156中任一實施方式的細胞、實施方式31-42中任一實施方式的分離的RGN多肽、或實施方式71-105中任一實施方式的系統用於治療個體的疾病的用途。
191. 如實施方式190的用途,其中該疾病與因果突變關聯,且該治療包括校正該因果突變。
192. 一種實施方式1-14、43-45及57-59中任一實施方式的核酸分子、實施方式15-21、46-56及60-70中任一實施方式的載體、實施方式22、147、148及152-156中任一實施方式的細胞、實施方式31-42中任一實施方式的分離的RGN多肽、或實施方式71-105中任一實施方式的系統用於製造有用於治療疾病的藥劑的用途。
193. 如實施方式192的用途,其中該疾病與因果突變關聯,且有效量的該藥劑校正該因果突變。
提供以下範例為示例而非為限制。 實驗範例 1. RNA 引導的核酸酶的鑑定
鑑定出19種不同的CRISPR關聯的RNA引導的核酸酶(RGN)並描述於下表1中。表1提供每一個RGN的名稱、其胺基酸序列、其取得來源、及經處理的crRNA及tracrRNA序列(見鑑定方法的範例2)。表1還提供通用單引導RNA(sgRNA)序列,其中poly-N指出確定sgRNA的核酸標的序列的間隔序列的位置。對於RGN系統APG06622、APG02787及APG06248,tracrRNA的髮夾莖的鹼基中的保留序列為UNANNA(SEQ ID NO: 129)。對於APG06007、APG09344及APG07991,相同位置中的序列為UNANNU(SEQ ID NO: 130)。對於APG02874、APG03850及APG07553,相同位置中的序列為UNANNG (SEQ ID NO: 131)。對於RGN系統APG03031、APG09208、APG05586、APG08770、APG03021、APG06015、APG01868及APG02998,tracrRNA的髮夾莖的鹼基中的保留序列為UNANNC(SEQ ID NO: 132)。對於APG08167及APG01604,相同位置中的序列為CNANNC(SEQ ID NO: 133)。 1 SEQ ID CRISPR 關聯系統的彙總
RGN ID SEQ ID NO. 來源 crRNA 重複序列 (SEQ ID NO.) tracrRNA (SEQ ID NO.) sgRNA 骨架 (SEQ ID NO)
APG06622 1 土地桿菌屬( Pedobacter sp. 2 3 4
APG02787 8 噬幾丁質菌屬 ( Chitinophaga sp.) 9 10 11
APG06248 15 黏液桿菌屬 ( Mucilaginibacter sp.) 16 17 18
APG06007 22 食酸菌屬 Acidovorax sp. 23 24 25
APG02874 29 芽孢桿菌屬 30 31 32
APG03850 36 芽孢桿菌屬 37 38 39
APG07553 43 芽孢桿菌屬 44 45 46
APG03031 50 金黃桿菌屬 51 52 53
APG09208 56 芽孢桿菌屬 57 58 59
APG05586 63 腸球菌屬 64 65 66
APG08770 70 腸球菌屬 71 72 73
APG08167 76 葡萄球菌屬 77 78 79
APG01604 83 葡萄球菌屬 84 85 86
APG03021 89 鏈球菌 90 91 92  
APG06015 96 片球菌屬( Pediococcus sp. 97 98 99
APG09344 103 魏斯氏菌屬 104 105 106
APG07991 110 腸球菌屬 111 112 113
APG01868 117 腸球菌屬 118 119 120
APG02998 123 腸球菌屬 124 125 126
範例 2 :引導 RNA 鑑定及 sgRNA 構築
使天然表現了調查中的RNA引導的核酸酶系統的細菌培養物生長至對數中期(~0.600的OD600)、沉澱並快速冷凍。使用mirVANA miRNA分離套組(Life Technologies,Carlsbad,CA)自沉澱物中分離RNA,並使用NEBNext Small RNA Library Prep套組(NEB,Beverly,MA)從分離的RNA製備定序庫。將庫製備物在6%聚丙烯醯胺凝膠上分劃,以捕獲小於200nt的RNA物種,以分別檢測crRNA和tracrRNA。在服務提供者(MoGene,St.Louis,MO)在Next Seq 500(高輸出套組)上進行深度定序(75 bp配對末端)。使用Cutadapt對讀數進行品質修整、並使用Bowtie2將讀數映射到參考基因體。用python編寫定制RNAseq管線來檢測crRNA和tracrRNA轉錄本。藉由天然重複間隔陣列的序列覆蓋來確定經處理的crRNA邊界。使用容許的BLASTn參數鑑定tracrRNA的抗重複部分。藉由鑑定含有抗重複的轉錄本,RNA定序深度確認經處理的tracrRNA的邊界。使用NUPACK(RNA折疊軟體)進行的二級結構預測來進行RNA的手動整理(manual curation)。sgRNA匣是藉由DNA合成而被製備的,且通常被如下設計(5'->3'):20-30 bp間隔序列,在其3’端可操作地連接至crRNA的經處理的重複部分、可操作地連接至4 bp非互補連接子(AAAG;SEQ ID NO:249)、在其3’端可操作地連接至經處理的tracrRNA。也可以使用其他4 bp非互補連接子。
對於體外測定,藉由用GeneArt™精確gRNA合成套組(GeneArt™ Precision gRNA Synthesis Kit)(ThermoFisher)的sgRNA匣的體外轉錄來合成sgRNA。RGN多肽的每一者的經處理的crRNA及tracrRNA序列被辨別且被列於表1中。關於對PAM庫1及2構築的sgRNA,見下面。範例 3 :每一個 RGN PAM 要求的確定
使用基本上改編自Kleinstiver等人(2015)Nature 523:481-485及Zetsche等人(2015)Cell 163:759-771的PAM缺乏測定法,確定每一個RGN的PAM要求。簡言之,在pUC18(ampR)中產生二個質體庫(L1及L2),而且每一個質體庫都含有側翼為8隨機核苷酸(亦即,PAM區域)的不同的30bp前間隔序列(標的)序列。每一個RGN的庫1及庫2的標的序列及側翼PAM區域列於表2中。
將庫分別電穿孔至帶有pRSF-1b表現載體的大腸桿菌BL21(DE3)細胞中,該載體含有本發明的RGN的pRSF-1b表現載體(針對於大腸桿菌而被密碼子最佳化)以及含有對應於L1或L2庫中的前間隔序列的間隔序列的同源sgRNA。將足夠的庫質體用於轉化反應中,以獲得>106 CFU。pRSF-1b骨架中的RGN及sgRNA二者都在T7啟動子的控制下。使轉化反應物恢復1小時,然後將其稀釋到含有卡本西林(carbenicillin)及康黴素(kanamycin)的LB培養基中且生長過夜。第二天,將混合物稀釋到自誘導過夜Express™即時TB培養基(Overnight Express™ Instant TB Medium)(Millipore Sigma)中,以允許RGN及sgRNA的表現,並另外生長4小時或20小時,然後離心分離細胞,並用Mini-prep套組(Qiagen, Germantown, MD)分離質體DNA。在適當的sgRNA存在下,含有可以被RGN識別的PAM的質體將被切割,導致其從族群中移出。含有RGN無法識別的或被轉化為不含有適當的sgRNA的細菌的PAM的質體將存活並複製。按照公開的操作流程(16S環境基因體庫製備指南(16s-metagenomic library prep guide)15044223B, Illumina, San Diego, CA),PCR擴增並製備未切割質體的PAM和前間隔區域以進行定序。在服務提供者(MoGene,St.Louis,MO)的MiSeq (Illumina)上進行深度定序(75 bp單末端讀數)。通常,獲得每擴增子1-4M讀數。對於每一個樣本,PAM區域被取出、計數、且被標準化至總讀數。當與對照組相較時(亦即,將庫轉化至含有RGN但缺少適合的sgRNA的大腸桿菌中時),導致質體切割的PAM被鑑定為代表性不足。為呈現新型RGN的PAM要求,利用以2為底的負對數轉換,將所涉及的區域中的全部序列的缺乏率(樣本中的頻率/對照組中的頻率)轉換為富集值。足夠的PAM被定義為富集值>2.3的PAM(對應於缺乏率< ~0.2)。二個庫中大於此臨界值的PAM被收集、且被用於產生網站標誌(web logo),例如,在網際網路上使用被稱為「網站標誌」的基於網路的服務,可產生網站標誌。當最富含PAM中存在一致的模式時,PAM序列被鑑定和報告。每一個RGN的共有PAM(具有富集因子(EF)>2.3)被提供於表2中。PAM方向亦在表2中表明。 2 PAM 或類 PAM 確定
RGN ID sgRNA L1 (SEQ ID NO.) sgRNA L2 (SEQ ID NO.) PAM (SEQ ID NO.) PAM 方向
APG06622 5 6 7 5'-標的-PAM-3'
APG02787 12 13 14 5'-標的-PAM-3'
APG06248 19 20 21 5'-標的-PAM-3'
APG06007 26 27 28 5'-標的-PAM-3'
APG02874 33 34 35 5'-標的-PAM-3'
APG03850 40 41 42 5'-標的-PAM-3'
APG07553 47 48 49 5'-標的-PAM-3'
APG03031 54 55 35 5'-標的-PAM-3'
APG09208 60 61 62 5'-標的-PAM-3'
APG05586 67 68 69 5'-標的-PAM-3'
APG08770 74 75 69 5'-標的-PAM-3'
APG08167 80 81 82 5'-標的-PAM-3'
APG01604 87 88 82 5'-標的-PAM-3'
APG03021 93 94 95 5'-標的-PAM-3'
APG06015 100 101 102 5'-標的-PAM-3'
APG09344 107 108 109 5'-標的-PAM-3'
APG07991 114 115 116 5'-標的-PAM-3'
APG01868 121 122 116 5'-標的-PAM-3'
APG02998 127 128 116 5'-標的-PAM-3'
範例 4 :哺乳動物細胞中的基因編輯活性的證明
產生RGN表現匣並將其引入載體中以進行哺乳動物表現。每一個RGN都針對人類表現(SEQ ID NO:134-152)而被密碼子最佳化、且於5’端處與SV40核定位序列(NLS;SEQ ID NO:251)及3xFLAG標籤(SEQ ID NO: 252)可操作地融合、且於3’端處與核質素NLS序列(SEQ ID NO:253)可操作地融合。NLS序列的二個拷貝被使用、被可操作地串接融合。每一個表現匣都在巨細胞病毒(CMV)啟動子(SEQ ID NO:258)的控制下。本領域中已知CMB轉錄增強子(SEQ ID NO:259)亦可被包括於包括CMV啟動子的構築體中。每一個都在人類RNA聚合酶III U6啟動子(SEQ ID NO:260)控制下編碼單一gRNA的引導RNA表現構築體被產生且被引入pTwist高拷貝擴增(pTwist High Copy Amp)載體中。針對每一個引導的標的序列的序列列於表3中。
將上述的若干構築體引入哺乳動物細胞中。轉染前一天,將1x105 個HEK293T細胞(Sigma)塗抹在Dulbecco的改良Eagle培養基(DMEM)加10%(vol/vol)胎牛血清(Gibco)及1%青黴素-鏈黴素(Gibco)的24孔培養皿中。當細胞達到50-60%融合度(confluency)時的第二天,按照製造商的使用說明,使用每孔1.5 μL的Lipofectamine 3000(Thermo Scientific)共轉染500 ng RGN表現質體加500 ng 單一gRNA表現質體。生長48小時後,按照製造商的使用說明,使用基因體DNA分離套組(Machery-Nagel)來收穫總基因體DNA。
然後,對總基因體DNA進行分析,以確定每一個RGN對每一個基因體標的的編輯率。首先,產生寡核苷酸,以用於PCR擴增及經擴增的基因體目標位點的後續分析。所使用的寡核苷酸序列列於表4中。
全部PCR反應都是在20 μL反應(包括每一引子0.5 μM)中使用10 μL的2X Master Mix Phusion高保真DNA聚合酶(Thermo Scientific)進行的。首先,使用PCR#1引子並使用以下程序擴增包含每一個標的基因的大基因體區域:98℃,1分鐘;[98℃,10秒;62℃,15秒;72℃,5分鐘] 的30次循環;72 ℃,5分鐘;12 ℃,永遠。然後,使用對每一個導引專一的引子(PCR#2引子)並使用以下程序進一步擴增1微升的此PCR反應:98 ℃,1分鐘; [98 ℃,10秒;67 ℃,15秒;72 ℃,30秒] 的35個循環;72 ℃,5分鐘;12 ℃,永遠。PCR#2的引子包括用於Illumina定序的Nextera讀數1和讀數2轉位酶轉接子突出序列。
對於RGN APG02874、APG03850及APG09208,進行如上所述的方法。針對RNA引導的切割,靶向人類基因體中許多不同的基因。這些基因座連同sgRNA的SEQ ID NO被包括在下面的表3中。為RGN活性的指示的插入或缺失(Indel)百分比亦被顯示。 3 :用於測試哺乳動物細胞中的基因編輯活性的引導 RNA 的標的序列及 sgRNA 序列
RGN ID 基因 引導 ID 標的序列 (SEQ ID NO.) sgRNA (SEQ ID NO.)
APG02874, APG09208  RelA SGN000973, SGN000778 153 188, 206
APG02874 RelA SGN000974 154 189
APG02874 RelA SGN000975, SGN000780 155 190, 208
APG02874, APG09208  AurkB SGN000976, SGN000775 156 191, 204
APG02874, APG09208  AurkB SGN000977, SGN000776 157 192, 205
APG02874 AurkB SGN000978 158 193
APG02874 VEGFA SGN000979 159 194
APG02874 VEGFA SGN000981 160 195
APG03850  RelA SGN000982 161 196
APG03850  RelA SGN000983 162 197
APG03850  RelA SGN000984 163 198
APG03850  AurkB SGN000985 164 199
APG03850  AurkB SGN000986 165 200
APG03850  AurkB SGN000987 166 201
APG03850  VEGFA SGN000988 167 202
APG03850  VEGFA SGN000990 168 203
APG09208  RelA SGN000779 169 207
APG09208  AurkB SGN000793 170 209
APG09208  AurkB SGN000794 171 210
APG05586 TRA SGN001163 553 557
APG05586 TRA SGN001164 554 558
APG05586 VEGFA SGN001165 555 559
APG05586 VEGFA SGN001166 556 560
APG09208 RelA SGN000778 153 206
APG09208 AurkB SGN000793 609 811
APG05586, APG08770, APG09298 EMX1 SGN001159 610 812
APG05586, APG08770, APG09298 TRA SGN001162 611 813
APG05586, APG08770, APG09298 TRA SGN001163 612 814
APG05586, APG08770, APG09298 TRA SGN001164 613 815
APG05586, APG08770, APG09298 VEGFA SGN001165 614 816
APG05586, APG08770, APG09298 VEGFA SGN001166 615 817
APG05586, APG09298 VEGFA SGN001167 616 818
APG09208 RelA SGN001213 617 819
APG08167, APG01604 VEGFA SGN001245 618 820
APG08167, APG01604 VEGFA SGN001246 619 821
APG08167, APG01604 VEGFA SGN001247 620 822
APG08167, APG01604 RelA SGN001248 621 823
APG08167, APG01604 RelA SGN001249 622 824
APG08167, APG01604 RelA SGN001250 623 825
APG08167, APG01604 AurkB SGN001251 624 826
APG08167, APG01604 AurkB SGN001252 625 827
APG08167, APG01604 AurkB SGN001253 626 828
APG07991 RelA SGN001312 627 829
APG07991 RelA SGN001313 628 830
APG07991 RelA SGN001314 629 831
APG01868 RelA SGN001315 630 832
APG01868 RelA SGN001316 631 833
APG01868 RelA SGN001317 632 834
APG02998 RelA SGN001318 633 835
APG02998 RelA SGN001319 634 836
APG02998 RelA SGN001320 635 837
APG09344 RelA SGN001321 636 838
APG06015 RelA SGN001322 637 839
APG03021 RelA SGN001323 638 840
APG09344 RelA SGN001324 639 841
APG06015 RelA SGN001325 640 842
APG03021 RelA SGN001326 641 843
APG06015 RelA SGN001327 642 844
APG03021 RelA SGN001328 643 845
APG09344 RelA SGN001329 644 846
APG03021 TRA SGN001330 645 847
APG03021 TRA SGN001331 646 848
APG03021 TRA SGN001332 647 849
APG06015 TRA SGN001333 648 850
APG06015 TRA SGN001334 649 851
APG06015 TRA SGN001335 650 852
APG09344 TRA SGN001336 651 853
APG09344 TRA SGN001337 652 854
APG09344 TRA SGN001338 653 855
APG07991 TRA SGN001339 654 856
APG07991 TRA SGN001340 655 857
APG07991 TRA SGN001341 656 858
APG01868 TRA SGN001342 657 859
APG01868 TRA SGN001343 658 860
APG01868 TRA SGN001344 659 861
APG01868 TRA SGN001692 660 862
APG02998 TRA SGN001345 661 863
APG02998 TRA SGN001346 662 864
APG02998 TRA SGN001347 663 865
APG03021 HAO1 SGN001348 664 866
APG03021 HAO1 SGN001349 665 867
APG03021 HAO1 SGN001350 666 868
APG06015 HAO1 SGN001351 667 869
APG06015 HAO1 SGN001352 668 870
APG06015 HAO1 SGN001353 669 871
APG09344 HAO1 SGN001354 670 872
APG09344 HAO1 SGN001355 671 873
APG09344 HAO1 SGN001356 672 874
APG07991 HAO1 SGN001357 673 875
APG07991 HAO1 SGN001358 674 876
APG07991 HAO1 SGN001359 675 877
APG01868 HAO1 SGN001360 676 878
APG01868 HAO1 SGN001361 677 879
APG01868 HAO1 SGN001362 678 880
APG02998 HAO1 SGN001363 679 881
APG02998 HAO1 SGN001364 680 882
APG02998 HAO1 SGN001365 681 883
APG05586, APG09298 TRA SGN001371 682 884
APG05586, APG09298 TRA SGN001372 683 885
APG05586, APG09298 TRA SGN001373 684 886
APG05586, APG09298 TRA SGN001374 685 887
APG05586, APG09298 TRA SGN001375 686 888
APG05586, APG09298 TRA SGN001376 687 889
APG05586, APG09298 TRA SGN001377 688 890
APG05586, APG09298 TRA SGN001378 689 891
APG05586, APG09298 TRA SGN001379 690 892
APG05586, APG09298 TRA SGN001380 691 893
APG05586, APG09298 TRA SGN001381 692 894
APG05586, APG09298 TRA SGN001382 693 895
APG05586, APG09298 B2M SGN001383 694 896
APG05586, APG09298 B2M SGN001384 695 897
APG05586, APG09298 B2M SGN001385 696 898
APG05586, APG09298 B2M SGN001386 697 899
APG05586, APG09298 B2M SGN001387 698 900
APG05586, APG09298 B2M SGN001388 699 901
APG05586, APG09298 B2M SGN001389 700 902
APG05586, APG09298 B2M SGN001390 701 903
APG05586, APG09298 B2M SGN001391 702 904
APG05586, APG09298 B2M SGN001392 703 905
APG05586, APG09298 B2M SGN001393 704 906
APG05586, APG09298 B2M SGN001394 705 907
APG05586, APG09298 LDHA SGN001395 706 908
APG05586, APG09298 LDHA SGN001396 707 909
APG05586, APG09298 LDHA SGN001397 708 910
APG05586, APG09298 LDHA SGN001399 709 911
APG05586, APG09298 LDHA SGN001400 710 912
APG05586, APG09298 LDHA SGN001401 711 913
APG05586, APG09298 LDHA SGN001402 712 914
APG05586, APG09298 LDHA SGN001403 713 915
APG05586, APG09298 LDHA SGN001404 714 916
APG05586, APG09298 LDHA SGN001405 715 917
APG05586, APG09298 HAO1 SGN001406 716 918
APG05586, APG09298 HAO1 SGN001407 717 919
APG05586, APG09298 HAO1 SGN001408 718 920
APG05586, APG09298 HAO1 SGN001409 719 921
APG05586, APG09298 HAO1 SGN001410 720 922
APG05586, APG09298 HAO1 SGN001411 721 923
APG05586, APG09298 HAO1 SGN001412 722 924
APG05586, APG09298 HAO1 SGN001413 723 925
APG05586, APG09298 HAO1 SGN001414 724 926
APG05586, APG09298 HAO1 SGN001415 725 927
APG05586, APG09298 HAO1 SGN001416 726 928
APG01604 B2M SGN001592 727 929
APG01604 B2M SGN001593 728 930
APG01604 B2M SGN001594 729 931
APG01604 B2M SGN001595 730 932
APG01604 B2M SGN001596 731 933
APG01604 B2M SGN001597 732 934
APG01604 B2M SGN001598 733 935
APG01604 B2M SGN001599 734 936
APG01604 B2M SGN001600 735 937
APG01604 B2M SGN001601 736 938
APG01604 B2M SGN001602 737 939
APG01604 B2M SGN001603 738 940
APG01604 HAO1 SGN001616 739 941
APG01604 HAO1 SGN001617 740 942
APG01604 HAO1 SGN001618 741 943
APG01604 HAO1 SGN001619 742 944
APG01604 HAO1 SGN001620 743 945
APG01604 HAO1 SGN001621 744 946
APG01604 HAO1 SGN001622 745 947
APG01604 HAO1 SGN001623 746 948
APG01604 HAO1 SGN001624 747 949
APG01604 HAO1 SGN001625 748 950
APG01604 HAO1 SGN001626 749 951
APG01604 HAO1 SGN001627 750 952
APG01604 LDHA SGN001640 751 953
APG01604 LDHA SGN001641 752 954
APG01604 LDHA SGN001642 753 955
APG01604 LDHA SGN001643 754 956
APG01604 LDHA SGN001644 755 957
APG01604 LDHA SGN001645 756 958
APG01604 LDHA SGN001646 757 959
APG01604 LDHA SGN001647 758 960
APG01604 LDHA SGN001648 759 961
APG01604 LDHA SGN001649 760 962
APG01604 LDHA SGN001650 761 963
APG01604 LDHA SGN001651 762 964
APG01604 TRA SGN001664 763 965
APG01604 TRA SGN001665 764 966
APG01604 TRA SGN001666 765 967
APG01604 TRA SGN001667 766 968
APG01604 TRA SGN001668 767 969
APG01604 TRA SGN001669 768 970
APG01604 TRA SGN001670 769 971
APG01604 TRA SGN001671 770 972
APG01604 TRA SGN001672 771 973
APG01604 TRA SGN001673 772 974
APG01604 TRA SGN001674 773 975
APG01604 TRA SGN001675 774 976
APG01868 TRA SGN001684 775 977
APG01868 TRA SGN001685 776 978
APG01868 TRA SGN001686 777 979
APG01868 TRA SGN001687 778 980
APG01868 TRA SGN001688 779 981
APG01868 TRA SGN001689 780 982
APG01868 TRA SGN001690 781 983
APG01868 TRA SGN001691 782 984
APG01868 EMX1 SGN001697 783 985
APG01868 EMX1 SGN001698 784 986
APG01868 EMX1 SGN001699 785 987
APG01868 EMX1 SGN001700 786 988
APG01868 EMX1 SGN001701 787 989
APG01868 EMX1 SGN001702 788 990
APG01868 EMX1 SGN001703 789 991
APG01868 EMX1 SGN001704 1176 992
APG01868 EMX1 SGN001705 1177 993
APG01868 EMX1 SGN001706 1178 994
APG01868 EMX1 SGN001707 1179 995
APG01868 EMX1 SGN001708 1180 996
APG01868 EMX1 SGN001709 1181 997
APG01868 EMX1 SGN001710 1182 998
APG01868 EMX1 SGN001711 1183 999
APG01868 HAO1 SGN001713 1184 1000
APG01868 HAO1 SGN001714 1185 1001
APG01868 HAO1 SGN001715 790 1002
APG01868 HAO1 SGN001716 791 1003
APG01868 HAO1 SGN001717 792 1004
APG01868 HAO1 SGN001718 793 1005
APG01868 HAO1 SGN001719 794 1006
APG01868 HAO1 SGN001721 795 1007
APG01868 HAO1 SGN001722 796 1008
APG01868 HAO1 SGN001723 797 1009
APG01868 HAO1 SGN001724 798 1010
APG01868 LDHA SGN001725 799 1011
APG01868 LDHA SGN001726 800 1012
APG01868 LDHA SGN001727 801 1013
APG01868 LDHA SGN001728 802 1014
APG01868 LDHA SGN001729 803 1015
APG01868 LDHA SGN001730 804 1016
APG01868 LDHA SGN001731 805 1017
APG01868 LDHA SGN001732 806 1018
APG01868 LDHA SGN001733 807 1019
APG01868 LDHA SGN001734 808 1020
APG01868 LDHA SGN001735 809 1021
APG01868 VEGFA SGN001785 810 1022
4 :用於檢測哺乳動物細胞中的基因編輯活性的 寡核苷酸
描述 引子序列 SEQ ID NO
SGN000977 FWD CTTGTAGCTGGAGGTCCATC 172
SGN000977 REV TGTTGGCAAATCTAGTCTCG 173
SGN000978 FWD ACATTTGACGAGCAGCGAA 174
SGN000978 REV GGCCCCTGGAGAGGTTTTAA 175
SGN000979, SGN000982, SGN000988, SGN000990 FWD ACACAGCTTCCCGTTCTCAG 176
SGN000979, SGN000982, SGN000988, SGN000990 REV ATTCACCCAGCTTCCCTGTG 177
SGN000981 FWD GGCGTCGCACTGAAACTTTT 178
SGN000981 REV AGTTCATGGTTTCGGAGGCC 179
SGN000983 FWD CGACCAAACAAGTGCAAAGG 180
SGN000983 REV GGGTTGTTGTTGGTCTGGAT 181
SGN000775, SGN000776, SGN000793, SGN000794, SGN000976, SGN000985, SGN000986, SGN000987 FWD ACTGCCATGGGAAGAAGGTG 182
SGN000775, SGN000776, SGN000793, SGN000794, SGN000976, SGN000985, SGN000986, SGN000987 REV ACAATTCTCCTGCCTCAGCC 183
SGN000778, SGN000973, SGN000984 FWD TGGCCCCTATGTGGAGATCA 184
SGN000778, SGN000973, SGN000984 REV GGCAGAGCTCAGCCTCATAG 185
SGN000779, SGN000780, SGN000974, SGN000975 FWD ATATCCCCACTTCCCCTGCT 186
SGN000779, SGN000780, SGN000974, SGN000975 REV CACCTCAAGGACAGCTCTGG 187
SGN001163, SGN001164 FWD TTGATAGCTTGTGCCTGTCC 561
SGN01163, SGN001164 REV AGAGTCTCTCAGCTGGTACA 562
SGN001165, SGN001166 FWD GCGACAGGGGCAAAGTGAGT 563
SGN001165, SGN001166 REV CTAGCACTTCTCGCGGCTCC 564
SGN001382 FWD AACTCATGCCTGCTGCTCTT 1023
SGN001382 REV CAGTCTCACGCAGTCACTCA 1024
SGN001371,SGN001372,SGN001373,SGN001689,SGN001690 FWD AACTGAGGCGGCTGAAATGA 1025
SGN001371,SGN001372,SGN001373,SGN001689,SGN001690 REV TGGGACATGCAAGCCCATAA 1026
SGN001730 FWD AAGATGTTGACATGCTCTTCC 1027
SGN001730 REV TATGCAGTCAAAAGCCTCA 1028
SGN001353,SGN001356,SGN001359,SGN001362,SGN001365,SGN001406,SGN001407,SGN001412,SGN001413,SGN001414,SGN001622,SGN001623,SGN001624,SGN001625,SGN001626,SGN001627 FWD AAGTCATTTGCTTGTTTGGA 1029
SGN001353,SGN001356,SGN001359,SGN001362,SGN001365,SGN001406,SGN001407,SGN001412,SGN001413,SGN001414,SGN001622,SGN001623,SGN001624,SGN001625,SGN001626,SGN001627 REV TGGTGCATTCAGAGAAGGAG 1030
SGN001375,SGN001376,SGN001377 FWD AATGAAGCCAGGCAAGAGCA 1031
SGN001375,SGN001376,SGN001377 REV CTGTGCAAACCCAGGCTAGA 1032
SGN001251,SGN001252 FWD ACATTTGACGAGCAGCGAA 1033
SGN001251,SGN001252 REV GGCCCCTGGAGAGGTTTTAA 1034
SGN001380 FWD ACCCGGCCTGCTTTTCTTAA 1035
SGN001380 REV GGCAGCGAGGCATACATAGT 1036
SGN001731,SGN001732,SGN001733,SGN001734,SGN001735 FWD ACCCTGCTTTTTCTGCCTTT 1037
SGN001731,SGN001732,SGN001733,SGN001734,SGN001735 REV CAGGCCTAATGGACATTAATCCT 1038
SGN001374,SGN001688 FWD ACTCACTAAGGGGCCCATCT 1039
SGN001374,SGN001688 REV CAGGAGGAGGATTCGGAACC 1040
SGN001726,SGN001727,SGN001728,SGN001729 FWD AGGAAAATGAATCACAATTACT 1041
SGN001726,SGN001727,SGN001728,SGN001729 REV GTGCGAAAGGGCAAGATTCT 1042
SGN001397 FWD AGGCCTTTCAACTCTCTTTTGGCA 1043
SGN001397 REV GGATGGGGTCAAGGTATGGGC 1044
SGN001213,SGN001248,SGN001249,SGN001321,SGN001322,SGN001323 FWD ATGACATTCAGGCCACAGTG 1045
SGN001213,SGN001248,SGN001249,SGN001321,SGN001322,SGN001323 REV CTTCCTCCTATTCAGGCCCA 1046
SGN001725 FWD CAGCTTTTGAAATGGGGTGC 1047
SGN001725 REV CAACAAATGGAGACCATCTGGA 1048
SGN001381 FWD CAGTATTCTAAGGACGCCAGAAA 1049
SGN001381 REV GCACTTTGGGAGGCTGAA 1050
SGN001390,SGN001391,SGN001392,SGN001393,SGN001394,SGN001592,SGN001593,SGN001594,SGN001595,SGN001596,SGN001597,SGN001598,SGN001599,SGN001600,SGN001601,SGN001602,SGN001603 FWD CGGGCATTCCTGAAGCTG 1051
SGN001390,SGN001391,SGN001392,SGN001393,SGN001394,SGN001592,SGN001593,SGN001594,SGN001595,SGN001596,SGN001597,SGN001598,SGN001599,SGN001600,SGN001601,SGN001602,SGN001603 REV GTAGGCCAAAGGTCTCCCC 1052
SGN001383,SGN001384,SGN001385,SGN001386,SGN001387,SGN001388,SGN001389 FWD CTTGACACCAAGTTAGCCCC 1053
SGN001383,SGN001384,SGN001385,SGN001386,SGN001387,SGN001388,SGN001389 REV TCATACACAACTTTCAGCAGC 1054
SGN000793,SGN001253 FWD CTTGTAGCTGGAGGTCCATC 1055
SGN000793,SGN001253 REV TGTTGGCAAATCTAGTCTCG 1056
SGN001379 FWD GAGCAGCTGAGTCAATGATAGT 1057
SGN001379 REV GGAGAGATCTGGAGGGAACTTA 1058
SGN001165,SGN001166,SGN001245 FWD GCAAAGTGAGTGACCTGCTT 1059
SGN001165,SGN001166,SGN001245 REV GAGCTAGCACTTCTCGCG 1060
SGN001738 FWD GCTGTTTGGGAGGTCAGAAA 1061
SGN001738 REV GAATATTGAAGGGGGCAGGG 1062
SGN001167,SGN001246,SGN001247,SGN001785 FWD GGACACTTCCCAAAGGACC 1063
SGN001167,SGN001246,SGN001247,SGN001785 REV CACGTCCTCACTCTCGAAGA 1064
SGN001399,SGN001402,SGN001403,SGN001646,SGN001647,SGN001648,SGN001649,SGN001650,SGN001651 FWD GGCCTTCACTCTTCACAGACCC 1065
SGN001399,SGN001402,SGN001403,SGN001646,SGN001647,SGN001648,SGN001649,SGN001650,SGN001651 REV GGATGGGGTCAAGGTATGGGC 1066
SGN001162,SGN001163,SGN001164,SGN001330,SGN001331,SGN001332,SGN001333,SGN001334,SGN001335,SGN001336,SGN001337,SGN001338,SGN001339,SGN001340,SGN001341,SGN001342,SGN001343,SGN001344,SGN001345,SGN001346,SGN001347,SGN001664,SGN001665,SGN001666,SGN001667,SGN001668,SGN001669,SGN001670,SGN001671,SGN001672,SGN001673,SGN001674,SGN001675,SGN001684,SGN001685,SGN001686,SGN001687,SGN001691,SGN001692 FWD GGGCAAAGAGGGAAATGAGA 1067
SGN001162,SGN001163,SGN001164,SGN001330,SGN001331,SGN001332,SGN001333,SGN001334,SGN001335,SGN001336,SGN001337,SGN001338,SGN001339,SGN001340,SGN001341,SGN001342,SGN001343,SGN001344,SGN001345,SGN001346,SGN001347,SGN001664,SGN001665,SGN001666,SGN001667,SGN001668,SGN001669,SGN001670,SGN001671,SGN001672,SGN001673,SGN001674,SGN001675,SGN001684,SGN001685,SGN001686,SGN001687,SGN001691,SGN001692 REV GAACCTGGCCATTCCTGAAG 1068
SGN001714,SGN001722 FWD GGTTTTTGGAGGTGGAGTTGA 1069
SGN001714,SGN001722 REV CCCCCTAACCAAGTGAAAAGA 1070
SGN001716,SGN001717,SGN001721 FWD TAGATAAATGAGCAGTGAACAGCC 1071
SGN001716,SGN001717,SGN001721 REV TCCACAAAGGATCACAAAGTCA 1072
SGN001313,SGN001316,SGN001319 FWD TGAGAGACAGTGGGACAGAC 1073
SGN001313,SGN001316,SGN001319 REV AGTCCTAGAGGAGGCAGAAC 1074
SGN001702,SGN001703,SGN001707,SGN001709,SGN001710,SGN001711 FWD TGAGTCCGAGCAGAAGAAGA 1075
SGN001702,SGN001703,SGN001707,SGN001709,SGN001710,SGN001711 REV GGAGATTGGAGACACGGAGA 1076
SGN001723 FWD TGGAGGTGGAGTTGAATAACA 1077
SGN001723 REV CTTTCTCCCCCTAACCAAGTG 1078
SGN001395,SGN001396 FWD TGGATCTCCAACATGGCAGCC 1079
SGN001395,SGN001396 REV CGGAAGGCTAAGGAGGGAGGA 1080
SGN000778,SGN001250,SGN001312,SGN001314,SGN001315,SGN001317,SGN001318,SGN001320,SGN001324,SGN001325,SGN001326,SGN001327,SGN001328,SGN001329 FWD TGGCCCCTATGTGGAGATCA 1081
SGN000778,SGN001250,SGN001312,SGN001314,SGN001315,SGN001317,SGN001318,SGN001320,SGN001324,SGN001325,SGN001326,SGN001327,SGN001328,SGN001329 REV GGCAGAGCTCAGCCTCATAG 1082
SGN001159,SGN001697,SGN001698,SGN001699,SGN001700,SGN001701,SGN001704,SGN001705,SGN001706,SGN001708 FWD TGTTAGACCCATGGGAGCAG 1083
SGN001159,SGN001697,SGN001698,SGN001699,SGN001700,SGN001701,SGN001704,SGN001705,SGN001706,SGN001708 REV GTTGCCCACCCTAGTCATT 1084
SGN001400,SGN001401,SGN001404,SGN001405,SGN001640,SGN001641,SGN001642,SGN001643,SGN001644,SGN001645 FWD TTCCACGCTAAGGTATGGGCC 1085
SGN001400,SGN001401,SGN001404,SGN001405,SGN001640,SGN001641,SGN001642,SGN001643,SGN001644,SGN001645 REV GCCAACAGCACCAACCCCAA 1086
SGN001348,SGN001349,SGN001350,SGN001351,SGN001352,SGN001354,SGN001355,SGN001357,SGN001358,SGN001360,SGN001361,SGN001363,SGN001364,SGN001408,SGN001409,SGN001410,SGN001411,SGN001415,SGN001416,SGN001616,SGN001617,SGN001618,SGN001619,SGN001620,SGN001621,SGN001713,SGN001715,SGN001718,SGN001719,SGN001724 FWD TTGCTCACTTGATGTAAGCAA 1087
SGN001348,SGN001349,SGN001350,SGN001351,SGN001352,SGN001354,SGN001355,SGN001357,SGN001358,SGN001360,SGN001361,SGN001363,SGN001364,SGN001408,SGN001409,SGN001410,SGN001411,SGN001415,SGN001416,SGN001616,SGN001617,SGN001618,SGN001619,SGN001620,SGN001621,SGN001713,SGN001715,SGN001718,SGN001719,SGN001724 REV TTTTGGTACGGTCTTTGTGT 1088
對經純化的基因體DNA進行如上所述的PCR#1及PCR#2。在第二次PCR擴增後,根據製造商的使用說明,使用PCR淨化套組(Zymo)清洗DNA,並在水中洗滌。將200-500 ng純化的PCR#2產物與2 μL的10X NEB緩衝液2與水在20 μL反應中合併、並使用程序:95 ℃,5分鐘;95-85 ℃,以2 ℃/秒的速率冷卻;85-25℃,以0.1 ℃/秒的速率冷卻;12 ℃,永遠,進行貼合,以形成異源雙股DNA。貼合後,移除5 μL的DNA,以作為無酵素對照,並且加入1 μL的T7核酸內切酶I(NEB),並使反應在37 ℃下培育1小時。培育後,加入5x FlashGel裝載染料(Lonza),並使用凝膠電泳以藉由2.2%瓊脂糖FlashGel(Lonza)分析5 μL的每一個反應及對照。在凝膠可視化之後,使用以下公式來確定非同源末端連接(NHEJ)的百分比:%NHEJ事件= 100 x [1-(1-所切割的分數)^(½)],其中(所切割的分數(fraction))被定義為:(分解產物的密度)/(分解產物的密度+未分解的親本帶的密度)。
對於一些樣本,使用SURVEYOR®分析在哺乳動物細胞中表現後的結果。在基因體DNA萃取前,將細胞在37℃下培養,以進行72小時的後轉染。按照製造商的操作流程,使用QuickExtract DNA萃取溶液(Epicentre)來萃取基因體DNA。對RGN目標位點側翼的基因體區域進行PCR擴增,並按照製造商的操作流程,使用QiaQuick Spin Column(Qiagen)來純化產物。總計200-500 ng的純化PCR產物與1 μl 10×Taq DNA聚合酶PCR緩衝液(酵素Enzymatics)和超純水混合至10 μl的最終體積,並進行重貼合過程,以使異源雙股形成:95 ℃ 10分鐘;以-2 ℃/s從 95 ℃降至85 ℃;以-0.25 ℃/s從 85 ℃降至25 ℃;並在25 ℃下保持1分鐘。
於重貼合後,按照製造商建議的操作流程,用SURVEYOR®核酸酶和SURVEYOR®增強劑S(集成DNA技術)處理產物、並在4-20%的Novex TBE聚丙烯醯胺凝膠(Life Technologies)上進行分析。用SYBR Gold DNA染料(Life Technologies)將凝膠染色10分鐘,並用Gel Doc凝膠成像系統(Bio-rad)將凝膠成像。定量是基於相對譜帶強度。插入缺失(Indel)百分比由公式100×(1−(1−(b+c)/(a+b+c))½)確定,其中a是未分解的PCR產物的累積強度,b和c是每種切割產物的累積強度。
另外,按照Illumina 16S總基因體定序文庫(Metagenomic Sequencing Library)操作流程,對含有Illumina突出序列的PCR#2的產物進行文庫製備。深度定序在服務提供者(MOGene)的Illumina Mi-Seq平臺上進行。通常,產生每擴增子200,000個250bp的配對末端讀數(2 x 100,000個讀數)。使用CRISPResso(Pinello等人,2016,Nature Biotech 34:695-697)分析讀數,以計算編輯率。手動整理輸出比對,以確認插入和缺失位點並鑑定重組位點處的微同源位點。編輯率顯示於表5中。所有實驗均在人類細胞中實行。「標的序列」是基因標的內的靶向序列。對於每一個標的序列,依據所使用的RGN,引導RNA包括互補RNA標的序列以及適合的sgRNA。藉由引導RNA選擇的實驗分析顯示於表6.1-6.3中。 5 :哺乳動物細胞中的 RGN 活性
RGN 引導 ID 基因標的 總編輯率 樣本中的缺失率 樣本中的插入率
APG02874 SGN000973 RelA N.D.      
APG02874 SGN000974 RelA 0.10% 37.23% 62.77%
APG02874 SGN000975 RelA N.D.      
APG02874 SGN000976 AurkB 0.56% 35.17% 64.84%
APG02874 SGN000977 AurkB 0.30% 76.34% 23.65%
APG02874 SGN000978 AurkB N.D.      
APG02874 SGN000979 VEGFA 0.17% 13.95% 86.05%
APG02874 SGN000981 VEGFA N.D.      
APG03850 SGN000982 RelA 0.19% 40.55% 59.45%
APG03850 SGN000983 RelA N.D.      
APG03850 SGN000984 RelA 0.05% 72.17% 27.84%
APG03850 SGN000985 AurkB 0.37% 66.62% 33.37%
APG03850 SGN000986 AurkB N.D.      
APG03850 SGN000987 AurkB N.D.      
APG03850 SGN000988 VEGFA N.D.      
APG03850 SGN000990 VEGFA N.D.      
APG09208 SGN000775 AurkB N.D.      
APG09208 SGN000776 AurkB N.D.      
APG09208 SGN000778 RelA N.D.      
APG09208 SGN000779 RelA N.D.      
APG09208 SGN000780 RelA N.D.      
APG09208 SGN000793 AurkB 1.18% 59.97% 40.02%
APG09208 SGN000794 AurkB N.D.      
APG05586 SGN001163 TRA 23.49% 95.03% 5.41%
APG05586 SGN001164 TRA 1.37% 95.65% 4.36%
APG05586 SGN001165 VEGFA 65.59% 98.58% 2.03%
APG05586 SGN001166 VEGFA 10.48% 94.98% 5.02%
APG06015 SGN001322 RelA N.D.      
APG06015 SGN001325 RelA N.D.      
APG06015 SGN001327 RelA N.D.      
APG06015 SGN001333 TRA N.D.      
APG06015 SGN001334 TRA 0.03 100% 0%
APG06015 SGN001335 TRA N.D.      
APG06015 SGN001351 HAO1 N.D.      
APG06015 SGN001352 HAO1 N.D.      
APG06015 SGN001353 HAO1 N.D.      
APG09344 SGN001321 RelA 0.02 0% 100%
APG09344 SGN001324 RelA N.D.      
APG09344 SGN001329 RelA N.D.      
APG09344 SGN001336 TRA N.D.      
APG09344 SGN001337 TRA N.D.      
APG09344 SGN001338 TRA N.D.      
APG09344 SGN001354 HAO1 N.D.      
APG09344 SGN001355 HAO1 N.D.      
APG09344 SGN001356 HAO1 N.D.      
APG07991 SGN001312 RelA 2.16 56.61% 43.39%
APG07991 SGN001313 RelA 2.64 80.6% 19.39%
APG07991 SGN001314 RelA 2.49 32.48% 67.51%
APG07991 SGN001339 TRA 6.75 76.47% 27.42%
APG07991 SGN001340 TRA 6.66 69.19% 33.89%
APG07991 SGN001341 TRA 2.84 60.63% 39.38%
APG07991 SGN001357 HAO1 13.34 79.66% 21.31%
APG07991 SGN001358 HAO1 0.05 60.78% 39.22%
APG07991 SGN001359 HAO1 0.21 80.53% 19.48%
APG01868 SGN001315 RelA 10.78 64.07% 36.36%
APG01868 SGN001316 RelA 6.26 87.09% 13.73%
APG01868 SGN001317 RelA 19.42 62.57% 38.11%
APG01868 SGN001342 TRA 4.66 39.32% 60.68%
APG01868 SGN001343 TRA 41.39 60.13% 41.39%
APG01868 SGN001344 TRA 5.42 60.46% 39.53%
APG01868 SGN001360 HAO1 0.38 69.28% 30.72%
APG01868 SGN001361 HAO1 9.48 84.92% 17.07%
APG01868 SGN001362 HAO1 0.32 28.97% 71.03%
APG02998 SGN001318 RelA 1.13 72.78% 27.22%
APG02998 SGN001319 RelA 2.55 91.76% 8.22%
APG02998 SGN001320 RelA 3.48 43.97% 56.04%
APG02998 SGN001345 TRA 2.01 79.92% 26.06%
APG02998 SGN001346 TRA 5.87 40.14% 61.02%
APG02998 SGN001347 TRA 2.26 59.08% 40.89%
APG02998 SGN001363 HAO1 0.4 16.34% 83.66%
APG02998 SGN001364 HAO1 N.D.      
APG02998 SGN001365 HAO1 1.14 65.98% 34.02%
APG09208 SGN000778 RelA 0.26 0% 100.00%
APG09208 SGN000793 AurkB 1.64 50.94% 49.06%
APG09208 SGN001213 RelA 0.05 100% 0.00%
APG05586 SGN001159 EMX1 40.13 83.86% 16.13%
APG05586 SGN001162 TRA 46.12 86.07% 14.45%
APG05586 SGN001163 TRA 43.77 93.38% 7.58%
APG05586 SGN001164 TRA 8 95.23% 4.80%
APG05586 SGN001165 VEGFA 65.59 98.58% 2.03%
APG05586 SGN001166 VEGFA 10.48 94.98% 5.02%
APG05586 SGN001167 VEGFA 43.8 92.97% 7.35%
APG08770 SGN001159 EMX1 11.9 80.98% 20.13%
APG08770 SGN001162 TRA 14.57 90.2% 10.24%
APG08770 SGN001163 TRA 12.78 95.47% 5.49%
APG08770 SGN001164 TRA 3.09 92.84% 9.00%
APG08770 SGN001165 VEGFA 23.12 92.75% 8.00%
APG08770 SGN001166 VEGFA 10.52 93.45% 6.92%
APG08167 SGN001245 VEGFA N.D.      
APG08167 SGN001246 VEGFA N.D.      
APG08167 SGN001247 VEGFA N.D.      
APG08167 SGN001248 RelA N.D.      
APG08167 SGN001249 RelA N.D.      
APG08167 SGN001250 RelA N.D.      
APG08167 SGN001251 AurkB N.D.      
APG08167 SGN001252 AurkB N.D.      
APG08167 SGN001253 AurkB N.D.      
APG01604 SGN001245 VEGFA 69.13 96.82% 7.23%
APG01604 SGN001246 VEGFA 4.57 79.07% 24.78%
APG01604 SGN001247 VEGFA 18.49 96.17% 5.09%
APG01604 SGN001248 RelA 17.04 94.78% 5.61%
APG01604 SGN001249 RelA 5.53 87.88% 14.96%
APG01604 SGN001250 RelA 21.18 81.7% 19.19%
APG01604 SGN001251 AurkB 8.38 84.67% 15.34%
APG01604 SGN001252 AurkB 24.74 90.49% 10.22%
APG01604 SGN001253 AurkB 0.32 86.44% 13.56%
APG03021 SGN001323 RelA 13.73 87.67% 12.31%
APG03021 SGN001326 RelA 1.03 78.9% 21.11%
APG03021 SGN001328 RelA 7.12 92.18% 9.68%
APG03021 SGN001330 TRA N.D.      
APG03021 SGN001331 TRA 0.45 23.15% 76.85%
APG03021 SGN001332 TRA 0.25 49.44% 50.57%
APG03021 SGN001348 HAO1 0.08 30.16% 69.84%
APG03021 SGN001349 HAO1 0.03 58.33% 41.67%
APG03021 SGN001350 HAO1 0.36 70.53% 29.48%
各自的引導的特定插入和缺失顯示於表6.1-6.3中。在這些表中,標的序列由粗體大寫字母標出。8mer PAM區域用雙底線標出,主要識別的核苷酸以粗體顯示。插入由小寫字母標出。缺失用破折線(---)表示。插入或缺失(INDEL)位置是自標的序列的PAM近端邊緣計算的,而且邊緣是位置0。如果位置是在邊緣的標的側,則該位置為正(+);如果位置是在邊緣的PAM側,則該位置為負(-)。 6.1 :使用 RGN APG02874 的引導 977 的特定插入及缺失
引導 SGN000977 (SEQ ID NO: 157) # 讀數 % 讀數 INDEL% 類型 INDEL 位置 大小
GGAGAGGTTTTAATGGCCCAGCCT CACACC CA GG 218651 99.7
GGAGAGGTTTTAATGGCCCAG---- ACACC CA GG 161 0.07 24.88 缺失 -1 4
GGAGAGGTTTTAATGGCCCAG tacCCT CACACC CA GG 153 0.07 23.65 插入 +3 3
GGAGAGGTTTTAATGGCCCAG--- ------ -- -G 137 0.06 21.17 缺失 -9 12
GGAGAGGTTTTAATGGCCCAGC----- ACC CA GG 130 0.06 20.09 缺失 -3 5
GGAGAGGTTT-AATGGCCCAGCCT CACACC CA GG 33 0.02 5.1 缺失 +13 1
GGAGAGGTTTTAATGGCC-AGCCT CACACC CA GG 33 0.02 5.1 缺失 +5 1
6.2 :使用 RGN APG03850 的引導 985 的特定插入及缺失
引導 SGN000985 (SEQ ID NO: 164) # 讀數 % 讀數 INDEL% 類型 INDEL 位置 大小
AGGCTGGGCCATTAAAACCTCTCCAGG GGCCG TG 218367 99.63
AGGCTGGGCCATTAAAACCTCTCC aAGG GGCCG TG 268 0.12 33.37 插入 3 1
AGGCTGGGCCATTAAAACCTCT-CAGG GGCCG TG 204 0.09 25.4 缺失 4 1
AGGCTGGGCCATTAAAACCTCT----- --CCG TG 140 0.06 17.43 缺失 -2 7
AGGCTGGGCCATTAAAACCTCTCC-GG GGCCG TG 137 0.06 17.06 缺失 2 1
AGGCT-GGCCATTAAAACCTCTCCAGG GGCCG TG 28 0.01 3.49 缺失 21 1
C------------------------------------------------- -------- -------------------------------T 26 0.01 3.24 缺失 -39 88
6.3 :使用 RGN APG09208 的引導 793 的特定插入及缺失
引導 SGN000793 (SEQ ID NO: 170) # 讀數 % 讀數 INDEL% 類型 INDEL 位置 大小
AGGTTTTAATGGCCCAGCCTCACACCC AGGTC TG 169578 98.82
C--------------------------------------------------------------------------------G 471 0.27 23.25 缺失 -17 80
TGGAGAGGTTTTAATGGCCCAGCCTCACA aCCC AGGTC TGG CCTCCC 398 0.23 19.64 插入 +3 1
CTGGAGAGGTTTTAATGGCCCAGCCTCACA--- -------- -------G 190 0.11 9.38 缺失 -15 18
CTGGAGAGGTTTTAATGGCCCAGCCTCACAC-- -------- --TCCC 133 0.08 6.56 缺失 -10 12
CTGGAGAGGTTTTAATGGCCCAGCCTCACACC- AGGTC TGG CCTCCC 110 0.06 5.43 缺失 0 1
CTGGAGAGGTTTTAATGGCCCAG---------- --GTC TGG CCTCCC 106 0.06 5.23 缺失 -2 12
CTGGAGAGGTTTTAATGGCCCAGCCTCACA ggCCC AGGTC TGG CCTCCC 102 0.06 5.03 插入 +3 2
CTGGAGAGGTTTTAATGGCCCAGCC-------C AGGTCTGG CCTCCC 92 0.05 4.54 缺失 +1 7
CTGGAGAGGTTTTAATGGCCCAGCCTCACA cCCC AGGTC TGG CCTCCC 82 0.05 4.05 插入 0 1
CTGGAGAGGTTTTAATGGCCCAGCCTCACAC tgtttgacctggagccactctctgcaccccgctgaccCCC AGGTC TGG CCTCCC 61 0.04 3.01 插入 +3 38
C------------------------------------------ --TCCC 50 0.03 2.47 缺失 -10 44
CTGGAGAGGTTTTAATGGCCCAGCCTCACA actaggtgtattataagaatcttataaacCCC AGGTC TGG CCTCCC 48 0.03 2.37 插入 +3 29
CTGGAGAGGTTTTAATGGCCCAGCCTCACA ccagctttcgttcgcaactcgagtggaagattggacttgcctgCCC AGGTC TGG CCTCCC 39 0.02 1.92 插入 +3 43
CTGGAGAGGTTTTAATGGCCCAGCCTC------ ---------- --CC 36 0.02 1.78 缺失 -12 18
CTGGAGAGGTTTTAATGTCCCAGCCTCACA gcactgttcacgtggctgatcatacactgatcacgtgattgatcatCCC AGGTC TGG CCTCCC 34 0.02 1.68 插入 +3 46
CTGGAGAGGTTTTAATGGCCCA---- -------- ----------------------T 27 0.02 1.33 缺失 -23 34
CTGGAGAGGTTTTAATGGCCCAGCCTCACA gatgcgacgctgcgcgtcttatactcccacatatgccagattcagcaacggatacCCC AGGTC TGG CCTCCC 24 0.01 1.18 插入 +3 55
CTGGAGAGGTTTTAATGGCCC agcctcacaggtagctggactatgcatgtgatggctggtgctcaagcagccatcttgccctaagaagtgagagccaggagccaaggatagCCC AGGTC TGG CCTCCC 23 0.01 1.14 插入 +3 81
6.4 :使用 RGN APG005586 的引導 1166 的特定插入及缺失
引導 SGN001166 (SEQ ID NO: 556) # 讀數 % 讀數 INDEL% 類型 INDEL 位置 大小
CGCGCGGACCACGGCTCCTCCGAAGCGA GAACA GCCCAGAAG 197148 89.52
CGCGCGGACCACGGCTCCTCCGA----- GAACA GCCCAGAAG 3829 1.74 16.59 缺失 5 0
CGCGCGGACCACGGCTCCTCCGAAG--- -AACA GCCCAGAAG 1985 0.9 8.6 缺失 4 -1
CGCGCGGACCACGGCTCCTCCGAA---- ---CA GCCCAGAAG 1300 0.59 5.63 缺失 7 -3
CGCGCGGACCACGGCTCCTCCGAA-CGA GAACA GCCCAGAAG 1223 0.56 5.3 缺失 1 3
CGCGCGGACCACGGCTCCTCCGAAG—A GAACA GCCCAGAAG 1221 0.55 5.29 缺失 2 1
CGCGCGGACCACGGCTCCTCCGAA----- --- -------------------------------- -------------------------------- -------------------------------- -------------C 936 0.43 4.06 缺失 117 -113
CGCGCGGACCACGGCTCCTCCGAAGC- ----- ---CCAGAAG 845 0.38 3.66 缺失 9 -7
CGCGCGGACCACGGCTCCTCC----- ------ -------------------------------- ---------------------T 715 0.32 3.1 缺失 64 -57
CGCGCGGACCACGGCTCCTCCGAAG---- --- -------------------------------- -------------------------------- -------------------------------- -------------------------------- -----G 615 0.28 2.66 缺失 140 -137
CGCGCGGACCACGG---------------- -- -------------------------------- -------------------------------- -------------------------------- ------------------T 610 0.28 2.64 缺失 132 -118
CGCGCGGACCACGGCTCCTCC----CGA GAACA GCCCAGAAG 551 0.25 2.39 缺失 4 3
CGCGCGGACCACGGCTCCTCCGA—CGA GAACA GCCCAGAAG 497 0.23 2.15 缺失 2 3
GCGCGGAC cACGGCTCCTCCGAAGTCGA GAACA GCCCAGAAG 438 0.2 1.9 插入 1 3
CGCGCGGACCACGGCTCCTCCGAAG-GA GAACA GCCCAGAAG 381 0.17 1.65 缺失 1 2
G-------------------gaGGC gg------ ------------------------G 334 0.15 1.45 缺失 49 -13
CGCGCGGACCACGGCTCCTCCGAA---- ----- ------------------A 328 0.15 1.42 缺失 27 -23
CGCGGACCACGGCTCCTCCGAAGG agGA GAACA GCCCAGAAG 326 0.15 1.41 插入 2 2
CGCGCGGACCACGGCTCCTCCGAAGC-- ----- ----AGAAG 321 0.15 1.39 缺失 11 -9
CGCGCGGACCACGGCTCCTCCGAAGAG- ----- ------------G 301 0.14 1.3 缺失 18 -17
CGCGCGGACCACGGCTCCTCCGAAG-- ------ ------AAG 290 0.13 1.26 缺失 14 -11
CGCGCGGACCACGGCTCC--------GA GAACA GCCCAGAAG 266 0.12 1.15 缺失 8 2
CGCGCGGACCACGGCTCCTC------GA GAACA GCCCAGAAG 265 0.12 1.15 缺失 6 2
CGCGCGGACCACGGCTC---------GA GAACA GCCCAGAAG 232 0.11 1.01 缺失 9 2
GCGCGGACCACGGCTCCTCCGAAG cCGA GAACA GCCCAGAAG 217 0.1 0.94 插入 1 2
CGCGCGGACCACGGCTCC-------CGA GAACA GCCCAGAAG 199 0.09 0.86 缺失 7 3
CGCGCGGACCACGGCTCCTCCGAAG--- ----- ---------T 192 0.09 0.83 缺失 17 -14
CGCGCGGACCACGGCTCCTCC------- ----- ---CAGAAG 177 0.08 0.77 缺失 15 -8
CGCGCGGACCACGGC-----------GA GAACA GCCCAGAAG 158 0.07 0.68 缺失 11 2
CGCGCGGACCACGGCTCCTCC------- ----- --------------------------------- --------------------------------- -------------------T 149 0.07 0.65 缺失 97 -90
CGCGCGGACCACGGC----------CGA GAACA GCCCAGAAG 147 0.07 0.64 缺失 10 3
CGCGCGGACCACGGCTCC---------- ----- ---CAGAAG 131 0.06 0.57 缺失 18 -8
CGCGCGGACCACGGCTCCTCCGAAGC-- ----- ---CAGAAG 127 0.06 0.55 缺失 10 -8
CGCGCGGACCACGGCTCCTCCGAAG--- ----- --------------------------------- ------------G 124 0.06 0.54 缺失 53 -50
CGCGCGGACCACGGCCCCTCCGA----- GAACA GCCCAGAAG 113 0.05 0.49 缺失 5 0
CGCGCGGACCACGGCTCCTCC------- ----- ----AGAAG 112 0.05 0.49 缺失 16 -9
CGCGCGGACCACGGCTCC---------- ----A GCCCAGAAG 104 0.05 0.45 缺失 14 -4
CGCGCGGA--------------------GAACA GCCCAGAAG 102 0.05 0.44 缺失 20 0
CGCGCGGACCACGGC------------- ----- --CCAGAAG 101 0.05 0.44 缺失 20 -7
CGCGCG---------------------A GAACA GCCCAGAAG 98 0.04 0.42 缺失 21 1
CGCGCGGACCACGGCTCCTCCG---CGA GAACA GCCCAGAAG 97 0.04 0.42 缺失 3 3
CGCGCGGACCACGGCTCCTCCG------ ----- --------------------------------- --------------------------------- -G 94 0.04 0.41 缺失 78 -72
CGCGCGGACCACGGCTCCTCCGAAG--- GAACA GCCCAGAAG 91 0.04 0.39 缺失 3 0
CGCGCGGACCACGGCTCCTCCGAAG--- ----- ----AGAAG 90 0.04 0.39 缺失 12 -9
CGCGC---------------------------- --CCAGAAG 80 0.04 0.35 缺失 30 -7
GCGCGGACCACGGCTCCTCCGAAG cCCA GAACA GCCCAGAAG 74 0.03 0.32 插入 1 1
C-------------------------------- ------------------------AGAAG 73 0.03 0.32 缺失 56 -9
CGCGCGGACCACGGCTCCTCCGAAG--- ----- --------------------------------- ------A 67 0.03 0.29 缺失 47 -44
CGCGCGGACCACGGCTCCTCCGAA-CGA GAACA GCCCAGACG 66 0.03 0.29 缺失 1 3
CGCGCGGACCACGGCTC----------- ----- ----AGAAG 63 0.03 0.27 缺失 20 -9
CGCGCGGACC------------------ ---- ----CAGAAG 63 0.03 0.27 缺失 26 -8
CGCGCGGACCACGGCTCCTCCG----- ------ --------------------------------- --------------------------------- --------------------------------- --------------------------------- --------------------------------- ---T 62 0.03 0.27 缺失 179 -173
C-------------------------------- -------------------AGAAG 60 0.03 0.26 缺失 51 -9
CGCGCGGACCACGGCTCCTCC------ -----A GCCCAGAAG 59 0.03 0.26 缺失 11 -4
CGCGCGGACCAC--------------- ------ ----AGAAG 56 0.03 0.24 缺失 25 -9
CGCGCGGAC-----------------GA GAACA GCCCAGAAG 55 0.02 0.24 缺失 17 2
CGCGCGGACCACGGCTCCTCT----CGA GAACA GCCCAGAAG 54 0.02 0.23 缺失 4 3
CGCGCGGACCACGGCTCCTCCGAAG--- ----- GCCCAGAAG 54 0.02 0.23 缺失 8 -5
G-------------------------------- -------A GAACA GCCCAGAAG 53 0.02 0.23 缺失 39 1
CGCGCGGACCA------------------ ---- -----GAAG 52 0.02 0.23 缺失 27 -10
CGCGCGGACCACGGCTCC----------- ---- ----AGAAG 52 0.02 0.23 缺失 19 -9
CGCGCGGACCACGGCTCCTCCG----GA GAACA GCCCAGAAG 50 0.02 0.22 缺失 4 2
CGCGCGGACCACGGCTCC---------- ----- -CCCAGAAG 48 0.02 0.21 缺失 16 -6
CGCGCGGACCACGGCTCCTCCGA----- ----- -----GAAG 48 0.02 0.21 缺失 15 -10
CGCGCGGA----------------------ACA GCCCAGAAG 47 0.02 0.2 缺失 22 -2
CGCGCGGACCACGGCTCCTCCGAAG-----ACA GCCCAGAAG 46 0.02 0.2 缺失 5 -2
CGCGCGGACCACGGCTCCT-----GCGA GAACA GCCCAGAAG 45 0.02 0.19 缺失 5 4
CGCGCGGACC---------------CGA GAACA GCCCAGAAG 45 0.02 0.19 缺失 15 3
CGCG-----------------------A GAACA GCCCAGAAG 44 0.02 0.19 缺失 23 1
CGCGCGGACCA----------------- GAACA GCCCAGAAG 44 0.02 0.19 缺失 17 0
CG------------------------------A GCCCAGAAG 44 0.02 0.19 缺失 30 -4
CGCGCGGACCACGGCTCCTCCGA----- GAACA GCCCAGACG 44 0.02 0.19 缺失 5 0
CGCGCGGACCACGGCTCCTCGGA----- GAACA GCCCAGAAG 42 0.02 0.18 缺失 5 0
CGCGCGGACCACGGCTCCTCCTC—CGA GAACA GCCCAGAAG 42 0.02 0.18 缺失 2 3
CGCGCGG-----------------GGAA GAACA GCCCAGAAG 41 0.02 0.18 缺失 17 4
CGCGCGGACCACGGCTCCTCCGAAG--- ----- -----GAAG 39 0.02 0.17 缺失 13 -10
CGCGCGGACC----------------GA GAACA GCCCAGAAG 39 0.02 0.17 缺失 16 2
CGCGCGGACCACGGCTCCTCCGAAG--- ----- -----GA----G 39 0.02 0.17 缺失 17 -16
GCGGACCACGGCTCCTCCGAAG aagCGA GAACA GCCCAGAAG 38 0.02 0.16 插入 3 3
GGACCACGGCTCCTCCGAAGGAGG agGA GAACA GCCCAGAAG 38 0.02 0.16 插入 5 2
CGCGCGGACCAC---------------- ----- ------AAG 38 0.02 0.16 缺失 27 -11
CGCGCGGACCACGGCTCCTCCGAAGC------A GCCCAGAAG 38 0.02 0.16 缺失 6 -4
T-------------------------------- ---------------T 37 0.02 0.16 缺失 47 -15
CGCGCGGACCACGGCTGTTCTGA----- GAACA GCCCAGAAG 37 0.02 0.16 缺失 5 0
C-------------------------------CGA GAACA GCCCAGAAG 36 0.02 0.16 缺失 31 3
CGCGCGGACCACGGC-------- --------- ------GAAG 36 0.02 0.16 缺失 23 -10
CGCGCGGA------------------------- -------AG 35 0.02 0.15 缺失 32 -12
CGCGCGGACCACGG-------------- -AACA GCCCAGAAG 34 0.02 0.15 缺失 15 -1
CGCGCGGACCACGGCTC----------- -AACA GCCCAGAAG 34 0.02 0.15 缺失 12 -1
CGCGCGGACCACGGCCCCTCC----CGA GAACA GCCCAGAAG 33 0.01 0.14 缺失 4 3
G-------------------------------- -------------------------A 33 0.01 0.14 缺失 57 -21
CGCGCGGACCACGGCTCCTCCGA-GCGA GAACA GCCCAGAAG 32 0.01 0.14 缺失 1 4
CGCGCGGACCACGTT----------CGA GAACA GCCCAGAAG 32 0.01 0.14 缺失 10 3
CGCGA----------------------A GAACA GCCCAGAAG 31 0.01 0.13 缺失 22 1
CGCGCGGACCACGG-------------- ----- ------AAG 31 0.01 0.13 缺失 25 -11
CGCG-------------------------AACA GCCC-----------G 30 0.01 0.13 缺失 36 -20
CGCGCGGACCACGGCTCCTCCGAAG--- -AACA GCCCAGCAG 30 0.01 0.13 缺失 4 -1
CGCGCGGACCACGGCTCCT--------- GAACA GCCCAGAAG 30 0.01 0.13 缺失 9 0
CGCGGACCACGGCTCCTCCGAAG cGCGA GAACA GCCCAGAAG 30 0.01 0.13 插入 2 1
CG-------------------------A GAACA GCCCAGAAG 29 0.01 0.13 缺失 25 1
CGCGCGGACCACGGCCCCTCCGAAG--- -AACA GCCCAGAAG 29 0.01 0.13 缺失 4 -1
CGCGCGGACCAC---------------- ----A GCCCAGAAG 29 0.01 0.13 缺失 20 -4
CGCGCGGACCACGG----------------ACA GCCCAGAAG 29 0.01 0.13 缺失 16 -2
CGCGCGGACCACGGCTCCTC-------- ---- -----AGAAG 28 0.01 0.12 缺失 17 -9
藉由測定若干核酸酶在橫跨若干基因的許多不同目標位點處編輯的能力以測試這些核酸酶的強健性。在擴大的引導組(guide panel)中測試40個以上的標的。所有的測試蛋白質在多樣位點都顯示強健編輯。結果顯示於表7中。 7 :選擇 RNA 引導的核酸酶的強健性
RGN 基因 SGN 編號 總編輯率 (%)
APG01868 TRA SGN001684 42.62
SGN001685 1.43
SGN001686 8.19
SGN001687 8.83
SGN001688 0.21
SGN001689 0
SGN001690 0
SGN001691 20.86
EMX1 SGN001697 0.93
SGN001698 0
SGN001699 18.84
SGN001700 21.8
SGN001701 39.94
SGN001702 2.16
SGN001703 0.79
SGN001704 3.49
SGN001705 14.49
SGN001706 1.04
SGN001707 2.51
SGN001708 1.75
SGN001709 3.62
SGN001710 0
SGN001711 13.39
HAO1 SGN001713 22.29
SGN001714 0.67
SGN001715 0.23
SGN001716 7.1
SGN001717 0.68
SGN001718 0.21
SGN001719 0
SGN001721 0.17
SGN001722 1.36
SGN001723 24.16
SGN001724 0.2
LDHA SGN001725 4.92
SGN001726 0
SGN001727 1.32
SGN001728 0.28
SGN001729 1.94
SGN001730 5.2
SGN001731 11.28
SGN001732 6.04
SGN001733 1.12
SGN001734 2.11
SGN001735 7
APG05586 TRA SGN001371 30.52
SGN001372 26.01
SGN001373 26.67
SGN001374 22.94
SGN001375 21.17
SGN001376 0
SGN001377 0
SGN001378 30.04
SGN001379 39.13
SGN001380 4.93
SGN001381 17.14
SGN001382 5.6
B2M SGN001383 36.23
SGN001384 44.28
SGN001385 6.33
SGN001386 5.55
SGN001387 48.71
SGN001388 31.78
SGN001389 41
SGN001390 48.15
SGN001391 46.19
SGN001392 37.22
SGN001393 31.62
SGN001394 29.72
LDHA SGN001396 32.88
SGN001397 41.45
SGN001399 43.28
SGN001400 2.52
SGN001401 37.52
SGN001402 0.37
SGN001403 53.13
SGN001404 44.06
SGN001405 1.46
HAO1 SGN001406 21.98
SGN001407 9.13
SGN001408 25.06
SGN001409 43.81
SGN001410 37.6
SGN001411 40.75
SGN001412 18.2
SGN001413 28.44
SGN001414 29.39
SGN001415 0.39
SGN001416 43.59
APG01604 B2M SGN001592 23.77
SGN001593 22.7
SGN001594 23.6
SGN001595 33.23
SGN001596 20.88
SGN001597 1.26
SGN001598 26.7
SGN001599 9.41
SGN001600 28.88
SGN001601 7.39
SGN001602 27.8
SGN001603 6.93
HAO1 SGN001616 0
SGN001617 2.55
SGN001618 0.6
SGN001619 6.29
SGN001620 7.92
SGN001621 13.03
SGN001622 5.32
SGN001623 18.58
SGN001624 20.03
SGN001625 1.65
SGN001626 0.18
SGN001627 0.73
LDHA SGN001640 3.75
SGN001641 1.13
SGN001642 14.2
SGN001643 12.16
SGN001644 4.9
SGN001645 4.78
SGN001646 0.74
SGN001647 2.89
SGN001648 0
SGN001649 0.15
SGN001650 4.4
SGN001651 7.26
TRA SGN001664 0.44
SGN001665 3.4
SGN001666 17.24
SGN001667 2.33
SGN001668 0.3
SGN001669 13.68
SGN001670 0.54
SGN001671 5.09
SGN001672 0.22
SGN001673 12.22
SGN001674 17.33
SGN001675 11.69
APG09298 B2M SGN001383 22.25
SGN001384 9.5
SGN001385 2.37
SGN001386 0.4
SGN001387 38.03
SGN001388 17.66
SGN001389 42.03
SGN001390 42.88
SGN001391 16.31
SGN001392 16.5
SGN001393 6.27
SGN001394 17.15
HAO1 SGN001406 3.46
SGN001407 1.87
SGN001408 10.71
SGN001409 18.79
SGN001410 15.09
SGN001411 14.81
SGN001412 0.63
SGN001413 5.92
SGN001414 5.24
SGN001415 0.03
SGN001416 15.41
LDHA SGN001395 3.15
SGN001396 28.53
SGN001397 11.69
SGN001399 23.92
SGN001400 0.89
SGN001401 33.97
SGN001402 0
SGN001403 25.62
SGN001404 16.96
SGN001405 0.11
TRA SGN001162 44.26
SGN001163 42.06
SGN001164 8.1
SGN001371 21.05
SGN001372 3.95
SGN001373 7.8
SGN001374 9.04
SGN001375 2.94
SGN001376 0
SGN001377 0
SGN001378 22.14
SGN001379 27.43
SGN001380 0.16
SGN001381 14.18
SGN001382 2.78
範例 5 APG05586 的蛋白質工程
藉由將APG05586與包括APG08770(SEQ ID NO:70)、APG09882(如SEQ ID NO:568所示的且被描述於國際專利申請案No. PCT/US2020/045759中,其藉由引用整體併入本文中)、及APG01658(如SEQ ID NO:569所示、且被描述於國際專利申請案No. PCT/US2020/045759中)的密切相關的同源物相較,辨別APG05586的保留的可變殘基。產生在非保留位置處含有突變的若干變異體,以辨別APG05586蛋白質中的關鍵殘基。總起來,在10個APG05586工程化變異體RGN(SEQ ID NO:570-579)中132個殘基被改變。然後,測定此10個APG05586變異體及野生型APG05586在哺乳動物細胞中的活性。按照範例4描述的方法,使用APG05586(SEQ ID NO:66)的引導RNA骨架,測試RGN在六個靶向的基因體位置(表8)處的活性。每一個變異體的哺乳動物密碼子最佳化的編碼序列被提供為SEQ ID NO:580-589。有用於檢測基因編輯活性的5'及3'引子核苷酸序列亦被提供於表8中。編輯率顯示於表9中。 8 :標的序列
引導 ID 基因 標的序列 (SEQ ID NO.) sgRNA (SEQ ID NO.) 用於擴增的 5' 引子 用於擴增的 3' 引子
SGN001159 EMX1 590 591 592 593
SGN001162 TRA 594 595 596 597
SGN001163 TRA 598 599 596 597
SGN001164 TRA 600 601 596 597
SGN001165 VEGFA 602 603 604 605
SGN001166 VEGFA 606 607 604 605
9 APG05586 及其變異體的編輯率
RGN ID RGN SEQ ID NO. SGN001159 SGN001162 SGN001163 SGN001164 SGN001165 SGN001166
APG09298 570 33.40% 44.26% 42.06% 8.10% 33.94% 46.19%
APG06251 571 0% 43.59% 48.82% 5.90% 25.07% 35.08%
APG03066 572 0% 0% 0% 0% 0% 0%
APG01560 573 15.12% 16.38% 17.59% 2.52% 44.99% 20.68%
APG02777 574 0% 0.08% 0% 0% 0% 0%
APG05761 575 24.25% 21.95% 21.86% 10.45% 23.72% 20.17%
APG02479 576 5.61% 9.25% 11.00% 1.45% 4.53% 6.34%
APG08385 577 31.16% 39.95% 35.42% 2.37% 31.41% 26.65%
APG09217 578 29.43% 41.12% 44.71% 4.79% 38.16% 31.76%
APG06657 579 36.81% 44.20% 41.54% 4.44% 16.29% 21.86%
APG05586 63 40.13% 46.12% 43.77% 8.00% 96.76% 77.38%
變異體的相對活性表明蛋白質中的哪個位置耐受突變。下面顯示的表10為與APG005586相較被引入一些突變的變異體RGN的活性的彙總。“-”為無活性;“+”為6個標的中至少4個有1-15%編輯;“++”為6個標的中至少4個有10-25%編輯;及“+++”為6個標的中至少4個有20-50%編輯。 10 :蛋白質工程化變化及編輯率的彙總
蛋白質 活性結果 突變數目
APG09298 +++ 10
APG06251 +++ 12
APG03066 - 87
APG01560 ++ 10
APG02777 - 37
APG05761 ++ 10
APG02479 + 12
APG08385 +++ 12
APG09217 +++ 14
APG06657 +++ 14
APG05586 +++ 0
變異體APG03066及APG02777含有太多突變,以致不能辨別對功能重要的專一性殘基,然而,這些變異體的低活性表明在此蛋白質中不耐受橋式螺旋及識別域的廣泛變化。全部其他變異體含有14個或更少的突變,這樣賦能對活性重要的專一性殘基的辨別。基於這些結果,若干殘基被辨別為對蛋白質的功能重要。I305L、V328A、L366I、T368S及V405A突變導致所測定的變異體中的活性降低。所有這些突變被預測將位於蛋白質的識別域中。APG01560的活性的降低是被定位至該蛋白質內的專一性區域中的多個變化的結果。範例 6 :疾病標的的鑑定
從經由在NCBI ClinVar網站的全球資訊網可得的NCBI ClinVar資料庫獲得臨床變異體的資料庫。從此列表鑑定出致病性單一核苷酸多型性(SNP)。使用基因體基因座資訊,鑑定出在與每一個SNP重疊且在每一個SNP周圍的區域中的CRIgvSPR標的。表11中列出了為靶向因果突變(「Casl Mut.」)可使用鹼基編輯、結合本發明的RGN來校正的SNP的選擇。在表11中,僅列出了每一種疾病的一個別名。「RS#」對應於經由NCBI網站上的NP資料庫獲得的RS登錄號。對偶基因ID對應於因果對偶基因登錄號,且染色體登錄號亦提供經由NCBI網站找到的登錄參考資訊。表11還提供了適合於針對每一種疾病所列的RGN的基因體標的序列資訊。標的序列資訊還提供前間隔序列,用於產生本發明的對應RGN所需的sgRNA。
Figure 02_image001
Figure 02_image003
Figure 02_image005
Figure 02_image007
Figure 02_image009
Figure 02_image011
Figure 02_image013
Figure 02_image015
Figure 02_image017
Figure 02_image019
Figure 02_image021
Figure 02_image023
Figure 02_image025
Figure 02_image027
Figure 02_image029
Figure 02_image031
Figure 02_image033
Figure 02_image035
Figure 02_image037
Figure 02_image039
Figure 02_image041
Figure 02_image043
Figure 02_image045
範例 7 賀勒氏 症候群 起因 的靶向突變
下面描述使用RNA引導的鹼基編輯系統對賀勒氏症候群(亦稱為MPS-1)的可能治療,該RNA引導的鹼基編輯系統校正在患有該疾病的大部分患者中造成賀勒氏症候群的突變。此方法採用了是RNA引導的且可被包裝於單一AAV載體中以遞送至大範圍組織類型的鹼基編輯融合蛋白。依據確切的調控元素及所使用的鹼基編輯器域,亦可能設計出對鹼基編輯融合蛋白及單引導RNA二者編碼以靶向患病基因座的單一載體。範例 7.1 :用理想的 PAM 辨別 RGN
遺傳性疾病MPS-1為在分子層次上由溶體中硫酸乙醯肝素及硫酸皮膚素的累積表徵的溶體儲積症。此疾病通常是由編碼α-L-艾杜糖醛酸酶的IDUA基因(NCBI參考序列NG_008103.1)中的突變引起的遺傳性基因病症。該疾病是α-L-艾杜糖醛酸酶缺乏的結果。在北歐背景個體的研究中發現的最常見的IDUA突變為W402X及Q70X,兩者都是無意義突變,導致轉譯的過早終止(Bunge等人(1994),Hum. Mol. Genet,3(6):861-866,藉由引用併入本文)。單一核苷酸的反轉將恢復野生型編碼序列並導致由遺傳基因座的內源性調控機制控制的蛋白質表現。
人類Idua基因的W402X突變是大多數MPS-1H病例的原因。相對於引導RNA的前間隔序列組成的結合位點,鹼基編輯器可靶向窄序列視窗,且因此PAM序列距標的基因座特定距離的存在對於策略的成功是必要的。假若存在在鹼基編輯蛋白質的相互作用期間標的突變必須位於暴露的非標的股(NTS)上且RGN域的足跡將阻擋進入進入PAM的區域的限制,則認為可及的基因座距PAM是10-30 bp。為避免在此視窗中的其他鄰近腺苷鹼基的編輯及誘變,應篩選不同的連接子。理想視窗為距PAM 12-16 bp。
與APG02874、APG09208及APG05586相容的PAM序列在基因基因座中是明顯的。這些核酸酶分別具有5’-nnnnCC-3’的PAM序列(SEQ ID NO:35)、5’-nnnnC-3’的PAM序列(SEQ ID NO:62)及5’-nnRYA-3’的PAM序列(SEQ ID NO:69),且大小緊密-可能允許經由單一AAV載體遞送。相對於例如進入大範圍組織(肝臟、肌肉、CNS)的其他遞送方法,此遞送方法給予了多種優勢及完善建立的安全性和製造技術。
來自化膿性鏈球菌的Cas9(SpyCas9)需要接近W402X基因座出現的NGG的PAM序列(SEQ ID NO: 256),但SpyCas9的大小阻止了包裝到單一AAV載體中,且因此放棄了此方法的上述優點。儘管可採用雙遞送策略(例如,Ryu等人(2018),Nat. Biotechnol., 36(6): 536-539,藉由引用併入本文中),但這將顯著增加製造複雜性及成本。另外,由於給定細胞中的成功編輯需要與二個載體的感染以及在該細胞中組裝融合蛋白,所以雙病毒載體遞送顯著降低基因校正的效率。
相對於SpyCas9,來自金黃色葡萄球菌的常用Cas9e異種同源物(SauCas9)的大小相當地較小,但具有更複雜的PAM要求- NGRRT(SEQ ID NO:257)。此序列不在預期對致病基因座的鹼基編輯有用的範圍內。範例 7.2 RGN 融合構築體及 sgRNA 序列
使用標準的分子生物學技術產生編碼具有以下域的融合蛋白的DNA序列:1)具有使DNA切割活性不活化的(「無活性」或「切口酶」)、具有突變的RGN域;2)有用於鹼基編輯的腺苷去胺酶。下表中描述的全部構築體都包括具有鹼基編輯活性域的融合蛋白,於此範例中為與無活性的RGN APG02874(SEQ ID NO: 214)、APG09208(SEQ ID NO: 216)及APG005586(SEQ ID NO: 567)的N端末端可操作地融合的ADAT(SEQ ID NO: 211)。亦可使用有用於鹼基編輯DNA的其他腺苷去胺酶(見例如PCT申請案PCT/US2019/068079)。本領域中已知融合蛋白也可用RGN的C端末端處的鹼基編輯酵素製成。另外,融合蛋白的鹼基編輯器與RGN典型地被連接子胺基酸序列分開。本領域中已知標準連接子的長度範圍是15-30個胺基酸。此外,本領域中已知RGN與鹼基編輯酵素之間的某些融合蛋白亦可包括至少一尿嘧啶醣苷酶抑制劑(UGI)域(SEQ ID NO:22),該尿嘧啶醣苷酶抑制劑(UGI)域可增加鹼基編輯效率(第10,167, 457號美國專利,藉由引用併入本文中)。因此,融合蛋白可包括RGN APG02874、APG09208、或其變異體、腺苷去胺酶及可選地至少一UGI。 12 :用於 RNA 靶向的鹼基編輯的構築體
SEQ ID NO. 構築體 RGN 無活性 (D) 或切口酶 (N) 鹼基編輯器
213 Nuc-ADAT-連接子-d APG02874 -Linker-SV40 APG02874 D ADAT
215 Nuc-ADAT-連接子-d APG09208-連接子SV40 APG09208 D ADAT
565 Nuc-ADAT-連接子-d APG05586-連接子-SV40 APG05586 D ADAT
RGN的可及編輯位點由PAM序列確定。當使RGN與鹼基編輯域結合時,因為NTS是單股的,而RGN與基因座相關聯,所以用於編輯的標的殘基必須位於非標的股(NTS)上。評估若干核酸酶及對應引導RNA可以為此特定基因座選擇最適合的基因編輯工具。在人類Idua基因中的上述構築體可靶向的若干潛在PAM序列位於造成W402X突變的突變核苷酸附近。還產生了編碼引導RNA轉錄本的序列,引導RNA轉錄本包含1)與疾病基因座處的非編碼DNA股互補的「間隔體」;及2)引導RNA與RGN締合所需的RNA序列。這樣的sgRNA可以由APG02874 RGN的SEQ ID NO:217、APG09208 RGN系統的SEQ ID NO:218或APG005586 RGN系統的SEQ ID NO:566編碼。可對這些sgRNA分子及本領域中的通常知識者可想到的類似sgRNA可就其在將上述鹼基編輯器導向所關注的基因座的效能而被評估。範例 7.3 :來自 Hurler 氏病患者的細胞中活性的測定
為驗證基因型策略並評估上述構築體,使用來自Hurler氏病患者的纖維母細胞。與範例4中描述的那些載體類似,設計了在融合蛋白編碼序列及sgRNA編碼序列的上游含有適合的啟動子的載體,用於在人類細胞中的表現這些序列。認識到,亦可使用已知在人類細胞中有高層級表現或在纖維母細胞中可很好地專一性地表現的啟動子及其他DNA元素(例如,增強子或終止子)。使用標準技術,例如,與範例4中描述的轉染類似的轉染,將載體轉染至纖維母細胞中。或者,可使用電穿孔。將細胞培養1-3天。使用標準技術分離基因體DNA(gDNA)。如下所述,藉由對經純化的gDNA進行qPCR基因分型測定及/或次世代定序,確定編輯效能。
Taqman™ qPCR分析採用對野生型及突變體對偶基因專用的探針。這些探針攜帶螢光體,使用qPCR儀器、藉由這些螢光體的光譜激發及/或發射特性來解析這些螢光體。含有PCR引子及探針的基因分型套組可在市場上獲得(亦即,SNP ID rs121965019的Thermo Fisher Taqman™ SNP基因分型分析ID C__27862753_10)或經設計的。所設計的引子及探針組的範例顯示於表13中。 13 RT-PCR 引子及探針
描述 序列 SEQ ID NO.
正向擴增引子 5’-GACTCCTTCACCAAG-3’ 219
反向擴增引子 5’-GTAGATCAGCACCG-3’ 220
野生型探針 5’-CTCT G GGCCGAAGT-3’ 221
W402X探針 5’-CTCT A GGCCGAAGT-3’ 222
編輯實驗之後,使用標準方法及上面描述的引子及探針,對gDNA進行qPCR分析。預期結果顯示於表14中。可使用此體外系統方便地評估構築體以及選取具高編輯效率的構築體用於進一步研究。與具有或不具有W402X突變的細胞及較佳地與對該突變為異型接合的一些細胞進行比較來評估該系統。使用例如Sybr綠色之類的染料,將Ct值與基因體的總擴增或參考基因進行比較。 14 :預期的 qPCR 結果
基因型 用鹼基編輯器轉染 預期的 PCR 結果
IduaWT/WT 同型接合的WT
IduaWT/W402X 異型接合的:50% WT,50% W402X
IduaW402X/W402X 異型接合的W402X
IduaW402X/W402X 可變
還可藉由次世代定序來分析組織。可使用例如下面(表15)顯示的引子結合位點的引子結合位點或可以由本領域中具有通常知識者辨識的其他適合的引子結合位點。PCR擴增之後,按照Illumina 16S總基因體定序文庫( Metagenomic Sequencing Library)操作流程對含有Illumina Nextera XT突出序列的產物進行文庫製備。深度定序在Illumina Mi-Seq平臺上進行。通常,每擴增子產生200,000個250 bp的配對末端讀數(2×100,000個讀數)。使用CRISPResso(Pinello等人,2016)分析讀數以計算編輯率。手工整理輸出比對,以確認插入及缺失位點以及辨識重組位點處的微同源位點。 15 NGS 引子結合位點
方向 序列 SEQ ID NO.
正向 5’-ACTTCCTCCAGCC-3’ 223
反向 5’-GAACCCCGGCTTA-3’ 224
使用抗IDUA抗體對被轉染細胞及對照組細胞的細胞裂解產物進行西方墨點轉漬法(western blotting),以驗證全長蛋白質的表現,並使用受質4-甲基傘形酮基α-L-艾杜糖醛酸苷(4-methylumbelliferyl a-L-iduronide)對細胞裂解產物進行的酵素活性測定驗證該酵素是否有催化活性(Hopwood等人,Clin.Chim. ACta (1979), 92(2): 257-265,藉由引用併入本文)。這些實驗是與原始的IduaW402X/W402X 細胞株(未轉染)、用鹼基編輯構築體及隨機的引導序列轉染的IduaW402X/W402X 細胞株及表現野生型IDUA的細胞株比較而進行。範例 7.4 :鼠模型中的疾病治療確效
為驗證此治療方法的功效,使用在同功胺基酸中具有無意義突變的小鼠模型。小鼠品系在其Idua基因(基因ID: 15932)中帶有W392X突變,該W392X突變對應於賀勒氏症候群患者中的同源突變(Bunge等人,(1994), Hum. Mol. Genet. 3(6): 861-866,藉由引用併入本文)。此基因座包括相對於人類核苷酸序列的獨特核苷酸序列,該核苷酸序列缺少用前面的範例中描述的鹼基編輯器進行校正所需的PAM序列,且因此,需要設計獨特的融合蛋白來進行核苷酸校正。此動物疾病的改善可驗證校正基因遞送載體可及的組織中的突變的治療方法有效。
對此突變同型接合的小鼠表示出與賀勒氏症候群患者類似的若干表現型特徵。如上所述的鹼基編輯RGN融合蛋白(表12)連同RNG引導序列被併入表現載體,該表現載體允許在小鼠中的蛋白質表現及RNA轉錄。研究設計顯示於下面的表16中。該研究包括用包括鹼基編輯融合蛋白及RNA引導序列的高劑量表現載體、低劑量的相同表現載體治療的群組、為用不包括鹼基編輯融合蛋白或引導RNA的表現載體處理的模型小鼠的對照組及為用相同空載體處理的野生型小鼠的第二對照組。 16 :小鼠模型中的基因體編輯實驗
群組 小鼠品系 N 處理
1 Idua-W392X1 ≥ 5 低劑量載體
2 Idua-W392X ≥ 5 高劑量載體
3 Idua-W392X ≥ 5 媒介物(Vehicle)
4 129/Sv (WT) 5 媒介物
評估的結果變數包括體重、尿液GAG排泄、血清IDUA酵素活性、所關注的組織中的IDUA活性、組織病理、為驗證SNP的校正而對所關注組織的基因分型及行為和神經評估。由於一些結果變數是最終的,所以在研究結束之前,可增加額外群組以用於評估例如組織病理及組織IDUA活性。結果變數的其他範例可見於建立賀勒氏症候群動物模型的已發表論文(Shull等人(1994), Proc. Natl. Acad. Sci. U.S.A., 91(26): 12937-12941;Wang等人(2010), Mol. Genet. Metab., 99(1): 62-71;Hartung等人(2004), Mol. Ther., 9(6): 866-875;Liu等人(2005), Mol. Ther., 11(1): 35-47;Clarke等人(1997), Hum. Mol. Genet. 6(4): 503-511;全部藉由引用併入本文)。
一種可能的遞送載體採用腺關聯病毒(adeno associated virus,AAV)。產生載體,以包括鹼基編輯器dRGN融合蛋白編碼序列(例如,Nuc-ADAT-Linker-dAPG19748-Linker-SV40,如上所述),該鹼基編輯器dRGN融合蛋白編碼序列的前面為CMV增強子(SEQ ID NO:259)及啟動子(SEQ ID NO:258)或其他適合的增強子及啟動子組合、可選地Kozak序列,且其於3’端處與終止子序列及聚腺苷酸化序列(例如Levitt, N.; Briggs, D.;Gil, A.;Proudfoot, N. J. Definition of an Efficient Synthetic Poly(A) Site. Genes Dev. 1989, 3 (7), 1019–1025中描述的最小序列)可操作地融合。該載體可進一步包括表現匣,該表現匣對其5’端處可操作地連接至人類U6啟動子(SEQ ID NO:260)或適合產生小非編碼RNA的另一個啟動子的單一引導RNA進行編碼,且該表現匣進一步包括包裝至AAV殻體中所必需以及本領域中眾所周知的反向末端重複(ITR)序列。藉由標準方法(例如,第9,587,250號美國專利中描述的那些方法,藉由引用併入本文)進行產生及病毒包裝。
其他可能的病毒載體包括腺病毒及慢病毒載體,腺病毒及慢病毒載體被共同使用、且可含有類似元素、而且具有不同的包裝能力及要求。也可使用非病毒遞送方法,例如,脂質奈米粒子包裹的mRNA及sgRNA(Cullis, P. R.及Allen, T. M. (2013), Adv. Drug Deliv. Rev. 65(1): 36-48;Finn等人(2018),Cell Rep. 22(9):2227-2235,二者均藉由引用併入)、質體DNA的流體動力進樣(Suda T及Liu D, (2007) Mol. Ther. 15(12): 2063-2069,藉由引用併入本文)、或與金奈米粒子關聯的sgRNA的核糖核蛋白錯合物(Lee, K.;Conboy, M.;Park, H. M.;Jiang, F.;Kim, H. J.;Dewitt, M. A.;Mackley, V. A.;Chang, K.;Rao, A.;Skinner, C.;等人,Nanoparticle Delivery of Cas9 Ribonucleoprotein and Donor DNA in Vivo Induces Homology-Directed DNA Repair. Nat. Biomed. Eng. 2017, 1 (11), 889–90)。範例 7.5 :具有人源化基因座的小鼠模型中的疾病校正
為了評估與用於人類治療的相同鹼基編輯器構築體的功效,需要一種小鼠模型,其中W392附近的核苷酸被改變以與人類的W402附近的序列匹配。這可藉由各種技術實現,包括使用RGN及HDR模板切斷及取代小鼠胚胎中的基因座。
由於胺基酸的高度保留性,小鼠基因座中的大多數核苷酸可被改變至具有如表17所顯示的緘默突變的人類序列的核苷酸。導致所得的工程化小鼠基因體中編碼序列改變的唯一鹼基變化發生在引入的終止密碼子之後。 17 :產生人源化小鼠基因座的核苷酸突變
人類 (W402X) 小鼠 (W392X) 人源化小鼠
特徵 核苷酸 (SEQ ID NO: 225) 編碼的 AA 核苷酸 (SEQ ID NO: 226) 編碼的 AA 核苷酸 (SEQ ID NO: 227) 編碼的 AA
前間隔序列 G E A G G G
G E G E G E
A A A
G A G
C Q C Q C Q
A A A
G A G
C L C L C L
T T T
C C C
T 終止 T 終止 T 終止
A A A
G G G
G A G A G A
C C C
C A C
G E G E G E
A A A
A G A
G V G V G V
T T T
G C G
T S T S T S
C C C
G A G
PAM ,非關鍵性 C Q A K C Q
A A A
G G G
G A G A G A
PAM ,關鍵性 C C C
C T C
工程化此小鼠品系後,將進行如範例7.4中描述的類似實驗。範例 8 :靶向造成弗里德里希運動失調的突變
引起弗里德里希運動失調(FRDA)的三核苷酸重複序列的擴增發生在FXN基因內、被稱為FRDA不穩定性區域的經確定的遺傳基因座中。RNA引導的核酸酶(RGN)可用於切除FRDA患者細胞中的不穩定性區域。此方法需要1)RGN及引導RNA序列,其可被編程,以靶向人類基因體中的對偶基因;以及2)RGN及引導序列的遞送方法。特別是當除了功能性表現匣所需的其他遺傳元素外還要考慮到引導RNA及SpCas9基因的長度時,用於基因體編輯的許多核酸酶(例如來自化膿性鏈球菌的常用Cas9核酸酶(SpyCas9))太大而無法被包裝於腺關聯病毒(AAV)載體內。這使得不太可能存在使用SpCas9的可行方法。
本發明的緊密RNA引導的核酸酶(例如,APG03850)相當適合於FRDA不穩定性區域的切除。APG03850具有在FRDA不穩定性區域附近的PAM需求。另外,APG03850可與引導RNA一起包裝於AAV載體內。包裝兩個引導RNA可能需要第二載體,但是與需要在兩個載體之間切割蛋白質序列的較大的核酸酶(例如SpCas9)所需的相比,這種方法仍然具有優勢。
表18顯示了適合將APG03850靶向FRDA不穩定性區域的5'和3'側翼的基因體標的序列的部位以及用於基因體標的的sgRNA的序列。一旦在基因座,RGN將切除FA不穩定性區域。可用基因座的Illumina定序來驗證區域的切除。 18 RGN 系統的基因體標的序列
引導 No. 相對於 FRDA 不穩定性區域的位置 基因體標的序列 (SEQ ID NO.) sgRNA (SEQ ID NO.)
1 5' 228 229
2 5' 230 231
3 3' 232 233
4 3' 234 235
範例 9 :靶向造成鐮狀細胞疾病的突變
靶向BCL11A增強子區域內的序列(SEQ ID NO:236)可提供用於增加胎兒血紅素(HbF)以治癒或減輕鐮狀細胞疾病的症狀的機制。例如,基因體廣泛關聯研究已經確認了在BCL11A處的一組基因變異與增加的HbF水準相關聯。這些變異是在BCL11A中發現的SNP的集合,這些SNP作用為階段專一性、譜系限制的增強子區域的非編碼區。進一步的調研顯示,在類紅血球中BCL11A增強子是BCL11A表現所必需的(Bauer等人(2013)Science 343:253-257,藉由引用併入本文)。在BCL11A基因的內含子2內發現了增強子區域、並辨識出在內含子2中的DNAseI過敏反應的三個區域(通常表示與調節潛能關聯的染色質狀態)。根據自BCL11A的轉錄起始位點的距離(以千鹼基為單位),將這三個區域確定為「+62」、「+58」以及「+55」。這些增強子區域的長度大約為350(+55);550(+58);以及350(+62)個核苷酸(Bauer等人,2013)。範例 9.1 :確定較佳的 RGN 系統
於此描述了使用RGN系統對β-血紅素病變的潛在治療,該RGN系統破壞BCL11A與其在HBB基因座內的結合位點的結合,HBB基因座是負責製造成人血紅素中的β-球蛋白的基因。此方法使用了在哺乳動物細胞中更有效的NHEJ。此外,此方法使用可以被包裝於單一AAV載體中以用於體內遞送的足夠小尺寸的核酸酶。
人類BCL11A增強子區域中的GATA1增強子模體(SEQ ID NO:236)是用於使用RNA引導的核酸酶(RGN)的破壞以降低成人紅血球中的HbF同時重新表現以及BCL11A表現的理想標的(Wu 等人(2019)Nat Med 387:2554)。與APG03850或APG09208相容的若干PAM序列在此GATA1位點周圍的遺傳基因座處是非常表觀的。這些核酸酶分別具有5’-nnnnG-3’(SEQ ID NO:42)及5’-nnnnC-3’(SEQ ID NO:62)的PAM序列、並且大小緊密,潛在地允許這些核酸酶在單一AAV或腺病毒載體中與適當的引導RNA一起遞送。相對於其他方法,例如,獲得造血幹細胞以及完善的安全性和製造技術,這種遞送方法具有多種優勢。
來自化膿性鏈球菌的常用Cas9核酸酶(SpyCas9)需要5'-NGG-3'的PAM序列(SEQ ID NO:256),其中一些存在於GATA1模體附近。然而,SpyCas9的大小妨礙了包裝到單一AAV或腺病毒載體中、並因此放棄了此方法的上述優點。儘管可以採用雙遞送策略,但這樣會增加顯著的製造複雜性和成本。另外,雙病毒載體遞送明顯降低了基因校正的效能,由於給定細胞中的成功編輯需要用二個載體來感染。
產生了編碼人類密碼子最佳化的APG03850或APG09208的表現匣,類似於範例4中描述的那些。還產生了針對RGN APG03850或APG09208表現引導RNA的表現匣。這些引導RNA包括:1)前間隔序列,其與BCL11A增強子基因座(標的序列)內的非編碼或編碼DNA股互補;及2)引導RNA與RGN締合所需的RNA序列。因為藉由APG03850或APG09208靶向的若干潛在PAM序列圍繞BCL11A GATA1增強子模體,所以產生了若干潛在的引導RNA構築體,以確定產生BCL11A GATA1增強子序列的NHEJ介導的破壞以及強健切割的最佳前間隔序列。使用表19中提供的sgRNA評估表19中的標的基因體序列,以將RGN引導至此基因座。 19 :使用 APG03850 APG09208 BCL11A GATA1 增強子基因座的標的序列
引導 RGN 標的基因體序列 (SEQ ID NO.) sgRNA (SEQ ID NO.)
1 APG03850 237 238
2 APG03850 239 240
3 APG03850 241 242
4 APG09208 243 244
5 APG09208 245 246
6 APG09208 247 248
為了評估APG03850或APG09208產生破壞BCL11A增強子區域的插入或缺失的效率,使用人細胞株,例如,人類胚胎腎細胞(HEK細胞)。產生包括RGN表現匣的DNA載體(例如,如在範例4中所述)。還產生包括表現匣的單獨載體,該表現匣包括表16的引導RNA序列的編碼序列。如在範例4中所描述,這種表現匣可更包括人類RNA聚合酶III U6啟動子(SEQ ID NO:260)。或者,可使用包括RGN及引導RNA二者的表現匣的單一載體。使用標準技術,例如,在範例4中所描述的那些技術,將載體引入HEK細胞中,並將細胞培養1-3天。在此培養期後,分離基因體DNA,並使用T7核酸內切酶I分解及/或直接DNA定序來確定插入或缺失頻率,如在範例4中所描述的。
用含有Illumina Nextera XT突出序列的引子,藉由PCR來擴增包含標的BCL11A區域的DNA的區域。使用T7核酸內切酶I分解以針對NHEJ形成來檢查這些PCR擴增子,或者這些PCR擴增子按照Illumina 16S總基因體定序文庫操作流程或類似的次世代定序(NGS)文庫製備進行文庫製備。在深度定序後,藉由CRISPResso分析產生的讀數,以計算編輯率。手工整理輸出比對,以確認插入和缺失位點。此分析辨識出較佳RGN及對應的較佳引導RNA(sgRNA)。該分析可得出的結果是APG03850及APG09208是同樣較佳的。另外,該分析可確定存在一個以上的較佳引導RNA,或者表16中的所有標的基因體序列是同樣較佳的。範例 9.2 :胎 兒血紅素表現的測定
在此範例中,測定APG03850或APG09208產生的破壞BCL11A增強子區域的插入或缺失是否有胎兒血紅素的表現。使用健康人類供體CD34+ 造血幹細胞(HSC)。培養這些HSC,並使用與在範例8.1中描述的方法類似的方法,引入包括表現匣的(各)載體,該表現匣包括較佳RGN及較佳sgRNA的編碼區域。在電穿孔後,使用已建立的操作流程將這些細胞在體外分化為紅血球(例如,Giarratana等人(2004)Nat Biotechnology 23:69-74,藉由引用併入本文中)。然後,使用西方墨點轉漬法,用抗人類HbF抗體來測量HbF的表現,或經由高效液相層析法(HPLC)定量HbF的表現。當與僅用RGN電穿孔而沒有引導的HSC相較時,預期BCL11A增強子基因座的成功破壞將引起HbF產生的增加。範例 9.3 :鐮狀細胞形成減少的測定
在此範例中,針對鐮狀細胞形成減少,測定了破壞BCL11A增強子區域的APG03850或APG09208產生的插入或缺失。使用來自患有鐮狀細胞疾病的患者的供體CD34+ 造血幹細胞(HSC)。培養這些HSC,並使用與在範例8.1中描述的方法類似的方法引入包括表現匣的載體,該表現匣包括較佳RGN的及較佳sgRNA的編碼區域。在電穿孔後,使用已建立的操作流程(Giarratana等人(2004)Nat Biotechnology 23:69-74)將這些細胞在體外分化成紅血球。然後,使用西方墨點轉漬法、利用抗人類HbF抗體來測量HbF的表現,或經由高效液相層析法(HPLC)定量HbF的表現。當與僅用RGN但沒有引導進行電穿孔的HSC相較時,預期BCL11A增強子基因座的成功破壞將引起HbF產生的增加。
藉由加入焦亞硫酸鹽(metabisulfite),在這些分化的紅血球中誘導鐮狀細胞形成。使用顯微鏡對鐮狀紅血球與正常紅血球的數量進行計數。預期在用APG03850或APG09208加sgRNA處置的細胞中,鐮狀細胞的數目少於在未經處理的或僅用RGN處理的細胞的數目。範例 9.4 :鼠模型中的疾病治療驗證
為評估使用APG03850或APG09208破壞BCL11A基因座的功效,使用適合的鐮狀細胞貧血症的人源化小鼠模型。將對較佳RGN及較佳sgRNA編碼的表現匣包裝於AAV載體或腺病毒載體中。尤其是,腺病毒Ad5/35型可有效靶向HSC。選用含有具有鐮狀細胞對偶基因的人源化HBB基因座的適合的小鼠模型,例如,B6;FVB-Tg(LCR-HBA2、LCR-HBB*E26K)53Hhb/J或B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ。單獨用顆粒球群落刺激因子(granulocyte colony-stimulating factor)或與普樂沙福(plerixafor)組合治療這些小鼠,以使HSC進入循環。然後,靜脈注射攜帶RGN及引導質體的AAV或腺病毒,並使小鼠恢復一週。在體外鐮狀細胞形成測定(sickling assay)中使用焦亞硫酸鹽測試從這些小鼠獲得的血液,並連續追蹤小鼠,以監測死亡率及造血功能。當與用缺少RGN以及引導RNA表現匣的病毒或用僅攜帶RGN表現匣的病毒處理的小鼠相較時,預期用攜帶RGN及引導RNA的AAV或腺病毒的治療將降低鐮狀細胞形成、死亡率且改善造血功能。範例 10 :測試不同遞送格式
為確定RGN是否能夠以不同形式遞送,用主T細胞測試mRNA及RNP核轉染遞送。經純化的CD3+ T-細胞或周邊血液單核細胞(PBMC)被解凍、使用CD3/CD28球粒(ThermoFisher)被活化3天、然後使用Lonza 4D-Nucleofector X單元及Nucleocuvette試驗片(strip)被核轉染。P3主細胞套組用於mRNA及RNP二者的遞送。使用EO-115及EH-115程式轉染細胞以分別用於mRNA及RNP遞送。細胞在含有IL-2、IL-7及IL-15(Miltenyi Biotec)的CTS OpTimizer T細胞擴展培養基(ThermoFisher)中培養,以在使用Nucleospin Tissue基因體DNA分離套組(Machery Nagel)收穫前進行4天後轉染。
使用表4中辨識的引子以藉由PCR產生編輯位點周圍的擴增子,並按照範例4中的方法使用Illumina Nextera平臺且使用2x250bp雙側定序進行NGS定序。 20 :主 T 細胞中的 RGN mRNA RNP 遞送
RGN 遞送方法 SGN 編輯 %
APG01604 mRNA,核轉染 SGN001671 1.18
APG01604 mRNA,核轉染 SGN001673 22.7
APG01604 RNP,核轉染 SGN001673 0.56
APG01604 mRNA,核轉染 SGN001674 0.63
APG01604 RNP,核轉染 SGN001674 0.77
APG01868 mRNA,核轉染 SGN001684 77.85
APG01868 RNP,核轉染 SGN001684 83.73
APG01868 mRNA,核轉染 SGN001691 82.53
APG01868 RNP,核轉染 SGN001691 80.7
APG01868 mRNA,核轉染 SGN001692 76.84
APG01868 RNP,核轉染 SGN001692 86.06
APG01868 mRNA,核轉染 SGN001785 0.22
APG01868 RNP,核轉染 SGN001785 0.43
mRNA及RNP二者的遞送顯示與APG01868成功編輯。APG01868顯示於若干基因體標的處與RNP成功編輯。用APG01604限制RNP遞送,但RNP遞送與mRNA遞送顯示相等的編輯率。範例 11 :鹼基編輯器測試
為確定APG09298及APG01604是否可在哺乳動物細胞中進行胞嘧啶鹼基編輯,將胞嘧啶去胺酶與每一個RGN的切口酶版本可操作地融合,以產生融合蛋白。去活化RGN APG09298及APG01604的RuvC域所預測的殘基被辨識出,且RGN被修飾成切口酶變異體。RGN的切口酶變異體在本文中被稱為“nRGN”。應當明白,RGN的任一切口酶變異體可用於產生本發明的融合蛋白。
去胺酶及針對哺乳動物表現被密碼子最佳化的nRGN核苷酸序列與N端核定位標籤合成為融合蛋白、且被選殖至pTwist CMV(Twist Biosciences)表現質體內。每一個融合蛋白在胺基端處開始包括於C端末端處可操作地連接至3X FLAG標籤(SEQ ID NO:252)、於C端末端處可操作地連接至去胺酶(APG05840)、於C端末端處可操作地連接至胜肽連接子、於C端末端可操作地連接至nRGN(nAPG09298或nAPG01604)、於C端末端可操作地連接至胜肽連接子、於C端末端可操作地連接至尿嘧啶穩定蛋白(USP2被示為SEQ ID NO: 1089)、最後於C端末端可操作地連接至核質素NLS(SEQ ID NO:253)的SV40 NLS(SEQ ID NO:251)。APG05840-nAPG09298-USP2及APG05840-nAPG01604-USP2融合蛋白的胺基酸序列被分別示為SEQ ID NO:1090及1091。
亦產生包括編碼sgRNA的表現匣的表現質體。人類基因體標的序列及用於將融合蛋白引導至基因體標的的sgRNA序列被示於表3中,及用於基因體區域的擴增的引子列於表4中。當被限制在胞嘧啶去胺酶時,使用範例4中將質體遞送至哺乳動物細胞及擴增子定序的相同方法來測試這些RGN的鹼基編輯能力。 21 :針對所測試的每一個 RGN 估計的鹼基編輯率
構築體 標的 突變的讀數 %
APG05840-nAPG09298-USP2 SGN001159 6.96
APG05840-nAPG09298-USP2 SGN001159 9.91
APG05840-nAPG09298-USP2 SGN001162 21.59
APG05840-nAPG09298-USP2 SGN001162 27.05
APG05840-nAPG09298-USP2 SGN001163 17.85
APG05840-nAPG09298-USP2 SGN001163 20.74
APG05840-nAPG09298-USP2 SGN001164 4.74
APG05840-nAPG09298-USP2 SGN001164 7.89
APG05840-nAPG09298-USP2 SGN001165 31.99
APG05840-nAPG09298-USP2 SGN001165 62.47
APG05840-nAPG09298-USP2 SGN001166 23.49
APG05840-nAPG09298-USP2 SGN001166 29.56
APG05840-nAPG01604-USP2 SGN001245 9.67
APG05840-nAPG01604-USP2 SGN001246 1.4
APG05840-nAPG01604-USP2 SGN001249 1.72
APG05840-nAPG01604-USP2 SGN001250 13.41
APG05840-nAPG01604-USP2 SGN001251 0.87
APG05840-nAPG01604-USP2 SGN001252 4.28
範例 12 :脫靶分析
為評估核酸酶的專一性,於經由生物資訊辨識的潛在位點處確定脫靶編輯。APG01604的潛在脫靶位點藉由標的序列中具有少於5個誤配及PAM序列中具有至少一殘基匹配的標的辨識。
使用與範例4中描述的將質體遞送至哺乳動物細胞及擴增子定序的方法相同的方法來測試APG01604的專一性及脫靶編輯。從針對在標的編輯上測試表22中的SGN的相同實驗,針對潛在編輯,測定表23中的潛在脫靶位置。表24中的引子用於擴增與目標位點上的序列具有序列相似度的潛在脫靶位點,以查找脫靶編輯。 22 :用於查找脫靶編輯的 SGN
SGN 基因 標的正向引子上 (SEQ ID NO) 標的反向引子上 (SEQ ID NO)
SGN001675 TRA CCCTTGTCCATCACTGGCAT (1096) ACCAAAGCTGCCCTTACCTG (1097)
SGN001594 B2M CCTTAATGTGCCTCCAGCCT (1092) AGGAGAGACTCACGCTGGAT (1093)
SGN001674 TRA CCCTTGTCCATCACTGGCAT (1094) ACCAAAGCTGCCCTTACCTG (1095)
23 :被測定的脫靶序列
SGN 脫靶號 脫靶基因座序列 SEQ ID NO
SGN001594 1594-2 AGCACAGCTAAGGCCTAAAGTTGAA 1098
SGN001594 1594-3 AGCACAGCTAAGGCACCGGATTGGA 1099
SGN001594 1594-4 AGCACAGCCAAGGCCAAGGGCTGAC 1100
SGN001594 1594-5 AGCAGAGCTAAGGCCAAGGCAGGTG 1101
SGN001594 1594-6 GGCACAGCTAAGGCCAGCAGTGGCC 1102
SGN001674 1674-2 GTCTCTGAGCTGGTACATGGCAGAG 1103
SGN001674 1674-3 GTCTTTTAGCTGGTACACGTGTGTC 1104
SGN001675 1675-2 AGAAGATTTGTCACTGGATTCTGAG 1105
SGN001675 1675-3 AGGACACTTGTCACTGGATTTAGGA 1106
SGN001675 1675-4 AGGACACTTGTCACTGGATTTAGGA 1107
SGN001675 1675-5 TGAGGACTTGTCACTGGATTCAGGG 1108
SGN001675 1675-6 AGGAGACTTTTCACTGGATTTAGGG 1109
SGN001675 1675-7 TGGACACTTGTCACTGGATTTAGGG 1110
SGN001675 1675-8 CACAGACTTGTCACTGGATGTGGGG 1111
SGN001675 1675-9 TACAGACATGTCACTGGATCTGGAA 1112
SGN001675 1675-10 AACACACTTGTCATTGGATTTAGGG 1113
SGN001675 1675-11 TACAGACTGGTCACTGGATGCTGGT 1114
SGN001675 1675-12 AGGACACTTGTCACTGGATTTAGCA 1115
SGN001675 1675-13 CTAAGACTTGTTACTGGATTGTGTG 1116
SGN001675 1675-14 CTCAGACTGGTCACTGGATAATGTA 1117
24 :用於擴增脫靶區域的引子
描述 引子序列 SEQ ID NO
1594-2 FWD CCAGAAGCCAGCAGATGACA 1118
1594-2 REV GAGTGGTGGGCTCTCAATCC 1119
1594-3 FWD AGCAACACCATCCAAAGGTT 1120
1594-3 REV GGGAGTGATGATAATGCGGG 1121
1594-4 FWD TGGACTAGAGAGGGTTGGGG 1122
1594-4 REV TCTCTTTCCACGAGCAGCAG 1123
1594-5 FWD GCCTTTGACCTTCCCAGATT 1124
1594-5 REV ACCATTGGAAAGGTGGATGC 1125
1594-6 FWD GGCTTCAGGCTTTCCTCTGT 1126
1594-6 REV AGCATGCTGGCCTAAAGTGA 1127
1674-2 FWD ACCATTGGTCTGCTCAGGTG 1128
1674-2 REV CCAAAACCTGCAGTGGCTTC 1129
1674-3 FWD GGAGAGGAACTGGGCATGAG 1130
1674-3 REV TCCGTCTCTCCTAGGTCTGC 1131
1675-2 FWD CCATGACTGGCCCTTCTGTT 1132
1675-2 REV GGGTAGAGTACATGGCGACG 1133
1675-3 FWD CCCTCCCACCAGAAGCTCTA 1134
1675-3 REV GATAAGAGGCCCAAGGACCG 1135
1675-4 FWD CACTTGACACGTGAGCCTCT 1136
1675-4 REV CCTCTTTCAGCCTCTGGTGG 1137
1675-5 FWD GACAGACTTGGTTCTGCCCT 1138
1675-5 REV CCTCCCCTCCTTCCTAGCTT 1139
1675-6 FWD TGCTGTAGTGGGTCGAACAG 1140
1675-6 REV TTTCACCATGCTGGCTAGGC 1141
1675-7 FWD CCCAGCCACATGGAACTAAG 1142
1675-7 REV GGACCCTAGGAGTTCCTTGT 1143
1675-8 FWD GCAGGTTGATAGGGAAGAGC 1144
1675-8 REV TCATCTCCCAGCTGATGACA 1145
1675-9 FWD CCACCTGTTGCACAAATCCG 1146
1675-9 REV TCCTCCCCTGGGAACATGAT 1147
1675-10 FWD GAGGTACTGGGAGTGGGGAT 1148
1675-10 REV CTTCCTGCCTCTTCCAGCTC 1149
1675-11 FWD GCACAGCTTTTGTCATGGGG 1150
1675-11 REV GGGGATGAGAAAACAGAGCCA 1151
1675-12 FWD CCATGCCCCATTCTGAAGGT 1152
1675-12 REV TTCCCCTCCTCTAGACTGCC 1153
1675-13 FWD CTTGAGCCCAGGAGTTTGAG 1154
1675-13 REV TGCATTCTTGGGATGACCTC 1155
1675-14 FWD ACTGCTTTTCCCTGGACACA 1156
1675-14 REV GGTCACAAGTCCCACTGGTC 1157
使用質體遞送,於所測試的三個引導中的二個處不存在可檢測的脫靶編輯。SGN001675、1675-8的一個脫靶位點於脫靶基因座處顯示2%編輯。在NGS讀數中的切斷位點處存在132bp的基因體區域的複本。由於不良的引子擴增,二個脫靶位點1675-7及1675-13不能被定序。 25 SGN001594 APG08167 的脫靶編輯
脫靶編號 標的中的總誤配 種子中的總誤配 PAM 中的總誤配 編輯 %
SGN001594 0 0 3 42.79
1594-2 2 2 3 0
1594-3 2 2 3 0.01
1594-4 2 1 2 0
1594-5 3 2 2 0
1594-6 2 1 1 0
26 SGN001675 APG08167 的脫靶編輯
脫靶編號 標的中的總誤配 種子中的總誤配 PAM 中的總誤配 編輯 %
SGN001675 0 0 3 33.115
1675-8 2 1 3 2.02
1675-5 4 0 3 0.06
1675-10 3 1 3 0.03
1675-12 4 0 2 0.02
1675-6 4 0 3 0
1675-2 4 0 3 0
1675-3 4 0 3 0
1675-4 4 0 3 0
1675-9 3 1 3 0
1675-11 2 0 2 0
1675-14 4 1 2 0
1675-13 4 0 2 問題定序
1675-7 4 0 3 問題定序
27 SGN001674 APG08167 的脫靶編輯
脫靶編號 標的中的總誤配 種子中的總誤配 PAM 中的總誤配 % 編輯
SGN001674 0 0 3 52.17
1674-2 2 1 3 0
1674-3 2 0 1 0.03
範例 13 :引導 RNA 骨架變異體測試
APG08167與APG01604具有接近62.72%的一致性,但識別相同PAM、共有相同crRNA及具有密切相關的tracrRNA序列。因為引導RNA序列的相似度,所以先前對APG01604產生的所有資料都使用APG08167 tracrRNA骨架。進行這些研究,以確認APG01604蛋白與APG08167基因體中所編碼的tracrRNA(原生APG08167 tracrRNA)一起更具活性。亦測試crRNA中的不同間隔體長度,以確定APG01604蛋白是否以20或25鹼基對間隔序列為佳。
為此,產生具有含有20或25鹼基對標的的六個不同標的序列的合成crRNA。以組合式方式將不同crRNA與來自APG08167或APG01604基因體的合成tracrRNA組合。形成RNP,且RNP錯合物被核轉染至HEK293T細胞內。 範例4中的標準方法用於確定細胞中的編輯率。 28 crRNA 序列
基因 間隔體 間隔體長度 SEQ ID NO
B2M A 20 1158
B 20 1159
C 20 1160
D 20 1161
A 25 1162
B 25 1163
C 25 1164
D 25 1165
TRA E 20 1166
F 20 1167
E 25 1168
F 25 1169
29 tracrRNA 序列
tracrRNA SEQ ID NO
APG08167 tracrRNA 1170
APG01604 tracrRNA 1171
30 :定序引子序列
引子 SEQ ID NO
TRAC左引子 1170
TRAC右引子 1171
B2M左引子 1172
B2M右引子 1173
31 APG01604 骨架的編輯結果及標的長度測試
基因 間隔體 間隔體長度 骨架 編輯效率 (%)
B2M A 20 APG01604 tr 0.21
B 20 APG01604 tr 0.08
C 20 APG01604 tr 0.27
D 20 APG01604 tr 0.17
A 25 APG01604 tr 0.15
B 25 APG01604 tr 0
C 25 APG01604 tr 1.33
D 25 APG01604 tr 0.31
A 20 APG08167 tr 6.58
B 20 APG08167 tr 1.75
C 20 APG08167 tr 6.99
D 20 APG08167 tr 64.6
A 25 APG08167 tr 22.7
B 25 APG08167 tr 2.36
C 25 APG08167 tr 52.51
D 25 APG08167 tr 82.58
TRA E 20 APG01604 tr 0.05
F 20 APG01604 tr 0.01
E 25 APG01604 tr 0.02
F 25 APG01604 tr 0.01
E 20 APG08167 tr 0
F 20 APG08167 tr 0.29
E 25 APG08167 tr 2.64
F 25 APG08167 tr 1.13
哺乳動物細胞中的編輯率說明,當使用原生APG01604 tracrRNA序列時,不存在強健的編輯。當使用APG08167 tracrRNA序列時,APG01604 RNP顯示以非常高的編輯率編輯。另外,當與相同標的相較時,於標的A、C、D、E及F處,相較於具有20 bp間隔體長度的crRNA,25鹼基對間隔體長度顯示較高的編輯。結合這些結果說明了相較於APG01604 tracrRNA,APG08167 tracrRNA呈現較高的編輯。另外,相較於20bp間隔序列,APG01604 RNP與25bp間隔序列一起的作用更佳。
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032
Figure 12_A0101_SEQ_0033
Figure 12_A0101_SEQ_0034
Figure 12_A0101_SEQ_0035
Figure 12_A0101_SEQ_0036
Figure 12_A0101_SEQ_0037
Figure 12_A0101_SEQ_0038
Figure 12_A0101_SEQ_0039
Figure 12_A0101_SEQ_0040
Figure 12_A0101_SEQ_0041
Figure 12_A0101_SEQ_0042
Figure 12_A0101_SEQ_0043
Figure 12_A0101_SEQ_0044
Figure 12_A0101_SEQ_0045
Figure 12_A0101_SEQ_0046
Figure 12_A0101_SEQ_0047
Figure 12_A0101_SEQ_0048
Figure 12_A0101_SEQ_0049
Figure 12_A0101_SEQ_0050
Figure 12_A0101_SEQ_0051
Figure 12_A0101_SEQ_0052
Figure 12_A0101_SEQ_0053
Figure 12_A0101_SEQ_0054
Figure 12_A0101_SEQ_0055
Figure 12_A0101_SEQ_0056
Figure 12_A0101_SEQ_0057
Figure 12_A0101_SEQ_0058
Figure 12_A0101_SEQ_0059
Figure 12_A0101_SEQ_0060
Figure 12_A0101_SEQ_0061
Figure 12_A0101_SEQ_0062
Figure 12_A0101_SEQ_0063
Figure 12_A0101_SEQ_0064
Figure 12_A0101_SEQ_0065
Figure 12_A0101_SEQ_0066
Figure 12_A0101_SEQ_0067
Figure 12_A0101_SEQ_0068
Figure 12_A0101_SEQ_0069
Figure 12_A0101_SEQ_0070
Figure 12_A0101_SEQ_0071
Figure 12_A0101_SEQ_0072
Figure 12_A0101_SEQ_0073
Figure 12_A0101_SEQ_0074
Figure 12_A0101_SEQ_0075
Figure 12_A0101_SEQ_0076
Figure 12_A0101_SEQ_0077
Figure 12_A0101_SEQ_0078
Figure 12_A0101_SEQ_0079
Figure 12_A0101_SEQ_0080
Figure 12_A0101_SEQ_0081
Figure 12_A0101_SEQ_0082
Figure 12_A0101_SEQ_0083
Figure 12_A0101_SEQ_0084
Figure 12_A0101_SEQ_0085
Figure 12_A0101_SEQ_0086
Figure 12_A0101_SEQ_0087
Figure 12_A0101_SEQ_0088
Figure 12_A0101_SEQ_0089
Figure 12_A0101_SEQ_0090
Figure 12_A0101_SEQ_0091
Figure 12_A0101_SEQ_0092
Figure 12_A0101_SEQ_0093
Figure 12_A0101_SEQ_0094
Figure 12_A0101_SEQ_0095
Figure 12_A0101_SEQ_0096
Figure 12_A0101_SEQ_0097
Figure 12_A0101_SEQ_0098
Figure 12_A0101_SEQ_0099
Figure 12_A0101_SEQ_0100
Figure 12_A0101_SEQ_0101
Figure 12_A0101_SEQ_0102
Figure 12_A0101_SEQ_0103
Figure 12_A0101_SEQ_0104
Figure 12_A0101_SEQ_0105
Figure 12_A0101_SEQ_0106
Figure 12_A0101_SEQ_0107
Figure 12_A0101_SEQ_0108
Figure 12_A0101_SEQ_0109
Figure 12_A0101_SEQ_0110
Figure 12_A0101_SEQ_0111
Figure 12_A0101_SEQ_0112
Figure 12_A0101_SEQ_0113
Figure 12_A0101_SEQ_0114
Figure 12_A0101_SEQ_0115
Figure 12_A0101_SEQ_0116
Figure 12_A0101_SEQ_0117
Figure 12_A0101_SEQ_0118
Figure 12_A0101_SEQ_0119
Figure 12_A0101_SEQ_0120
Figure 12_A0101_SEQ_0121
Figure 12_A0101_SEQ_0122
Figure 12_A0101_SEQ_0123
Figure 12_A0101_SEQ_0124
Figure 12_A0101_SEQ_0125
Figure 12_A0101_SEQ_0126
Figure 12_A0101_SEQ_0127
Figure 12_A0101_SEQ_0128
Figure 12_A0101_SEQ_0129
Figure 12_A0101_SEQ_0130
Figure 12_A0101_SEQ_0131
Figure 12_A0101_SEQ_0132
Figure 12_A0101_SEQ_0133
Figure 12_A0101_SEQ_0134
Figure 12_A0101_SEQ_0135
Figure 12_A0101_SEQ_0136
Figure 12_A0101_SEQ_0137
Figure 12_A0101_SEQ_0138
Figure 12_A0101_SEQ_0139
Figure 12_A0101_SEQ_0140
Figure 12_A0101_SEQ_0141
Figure 12_A0101_SEQ_0142
Figure 12_A0101_SEQ_0143
Figure 12_A0101_SEQ_0144
Figure 12_A0101_SEQ_0145
Figure 12_A0101_SEQ_0146
Figure 12_A0101_SEQ_0147
Figure 12_A0101_SEQ_0148
Figure 12_A0101_SEQ_0149
Figure 12_A0101_SEQ_0150
Figure 12_A0101_SEQ_0151
Figure 12_A0101_SEQ_0152
Figure 12_A0101_SEQ_0153
Figure 12_A0101_SEQ_0154
Figure 12_A0101_SEQ_0155
Figure 12_A0101_SEQ_0156
Figure 12_A0101_SEQ_0157
Figure 12_A0101_SEQ_0158
Figure 12_A0101_SEQ_0159
Figure 12_A0101_SEQ_0160
Figure 12_A0101_SEQ_0161
Figure 12_A0101_SEQ_0162
Figure 12_A0101_SEQ_0163
Figure 12_A0101_SEQ_0164
Figure 12_A0101_SEQ_0165
Figure 12_A0101_SEQ_0166
Figure 12_A0101_SEQ_0167
Figure 12_A0101_SEQ_0168
Figure 12_A0101_SEQ_0169
Figure 12_A0101_SEQ_0170
Figure 12_A0101_SEQ_0171
Figure 12_A0101_SEQ_0172
Figure 12_A0101_SEQ_0173
Figure 12_A0101_SEQ_0174
Figure 12_A0101_SEQ_0175
Figure 12_A0101_SEQ_0176
Figure 12_A0101_SEQ_0177
Figure 12_A0101_SEQ_0178
Figure 12_A0101_SEQ_0179
Figure 12_A0101_SEQ_0180
Figure 12_A0101_SEQ_0181
Figure 12_A0101_SEQ_0182
Figure 12_A0101_SEQ_0183
Figure 12_A0101_SEQ_0184
Figure 12_A0101_SEQ_0185
Figure 12_A0101_SEQ_0186
Figure 12_A0101_SEQ_0187
Figure 12_A0101_SEQ_0188
Figure 12_A0101_SEQ_0189
Figure 12_A0101_SEQ_0190
Figure 12_A0101_SEQ_0191
Figure 12_A0101_SEQ_0192
Figure 12_A0101_SEQ_0193
Figure 12_A0101_SEQ_0194
Figure 12_A0101_SEQ_0195
Figure 12_A0101_SEQ_0196
Figure 12_A0101_SEQ_0197
Figure 12_A0101_SEQ_0198
Figure 12_A0101_SEQ_0199
Figure 12_A0101_SEQ_0200
Figure 12_A0101_SEQ_0201
Figure 12_A0101_SEQ_0202
Figure 12_A0101_SEQ_0203
Figure 12_A0101_SEQ_0204
Figure 12_A0101_SEQ_0205
Figure 12_A0101_SEQ_0206
Figure 12_A0101_SEQ_0207
Figure 12_A0101_SEQ_0208
Figure 12_A0101_SEQ_0209
Figure 12_A0101_SEQ_0210
Figure 12_A0101_SEQ_0211
Figure 12_A0101_SEQ_0212
Figure 12_A0101_SEQ_0213
Figure 12_A0101_SEQ_0214
Figure 12_A0101_SEQ_0215
Figure 12_A0101_SEQ_0216
Figure 12_A0101_SEQ_0217
Figure 12_A0101_SEQ_0218
Figure 12_A0101_SEQ_0219
Figure 12_A0101_SEQ_0220
Figure 12_A0101_SEQ_0221
Figure 12_A0101_SEQ_0222
Figure 12_A0101_SEQ_0223
Figure 12_A0101_SEQ_0224
Figure 12_A0101_SEQ_0225
Figure 12_A0101_SEQ_0226
Figure 12_A0101_SEQ_0227
Figure 12_A0101_SEQ_0228
Figure 12_A0101_SEQ_0229
Figure 12_A0101_SEQ_0230
Figure 12_A0101_SEQ_0231
Figure 12_A0101_SEQ_0232
Figure 12_A0101_SEQ_0233
Figure 12_A0101_SEQ_0234
Figure 12_A0101_SEQ_0235
Figure 12_A0101_SEQ_0236
Figure 12_A0101_SEQ_0237
Figure 12_A0101_SEQ_0238
Figure 12_A0101_SEQ_0239
Figure 12_A0101_SEQ_0240
Figure 12_A0101_SEQ_0241
Figure 12_A0101_SEQ_0242
Figure 12_A0101_SEQ_0243
Figure 12_A0101_SEQ_0244
Figure 12_A0101_SEQ_0245
Figure 12_A0101_SEQ_0246
Figure 12_A0101_SEQ_0247
Figure 12_A0101_SEQ_0248
Figure 12_A0101_SEQ_0249
Figure 12_A0101_SEQ_0250
Figure 12_A0101_SEQ_0251
Figure 12_A0101_SEQ_0252
Figure 12_A0101_SEQ_0253
Figure 12_A0101_SEQ_0254
Figure 12_A0101_SEQ_0255
Figure 12_A0101_SEQ_0256
Figure 12_A0101_SEQ_0257
Figure 12_A0101_SEQ_0258
Figure 12_A0101_SEQ_0259
Figure 12_A0101_SEQ_0260
Figure 12_A0101_SEQ_0261
Figure 12_A0101_SEQ_0262
Figure 12_A0101_SEQ_0263
Figure 12_A0101_SEQ_0264
Figure 12_A0101_SEQ_0265
Figure 12_A0101_SEQ_0266
Figure 12_A0101_SEQ_0267
Figure 12_A0101_SEQ_0268
Figure 12_A0101_SEQ_0269
Figure 12_A0101_SEQ_0270
Figure 12_A0101_SEQ_0271
Figure 12_A0101_SEQ_0272
Figure 12_A0101_SEQ_0273
Figure 12_A0101_SEQ_0274
Figure 12_A0101_SEQ_0275
Figure 12_A0101_SEQ_0276
Figure 12_A0101_SEQ_0277
Figure 12_A0101_SEQ_0278
Figure 12_A0101_SEQ_0279
Figure 12_A0101_SEQ_0280
Figure 12_A0101_SEQ_0281
Figure 12_A0101_SEQ_0282
Figure 12_A0101_SEQ_0283
Figure 12_A0101_SEQ_0284
Figure 12_A0101_SEQ_0285
Figure 12_A0101_SEQ_0286
Figure 12_A0101_SEQ_0287
Figure 12_A0101_SEQ_0288
Figure 12_A0101_SEQ_0289
Figure 12_A0101_SEQ_0290
Figure 12_A0101_SEQ_0291
Figure 12_A0101_SEQ_0292
Figure 12_A0101_SEQ_0293
Figure 12_A0101_SEQ_0294
Figure 12_A0101_SEQ_0295
Figure 12_A0101_SEQ_0296
Figure 12_A0101_SEQ_0297
Figure 12_A0101_SEQ_0298
Figure 12_A0101_SEQ_0299
Figure 12_A0101_SEQ_0300
Figure 12_A0101_SEQ_0301
Figure 12_A0101_SEQ_0302
Figure 12_A0101_SEQ_0303
Figure 12_A0101_SEQ_0304
Figure 12_A0101_SEQ_0305
Figure 12_A0101_SEQ_0306
Figure 12_A0101_SEQ_0307
Figure 12_A0101_SEQ_0308
Figure 12_A0101_SEQ_0309
Figure 12_A0101_SEQ_0310
Figure 12_A0101_SEQ_0311
Figure 12_A0101_SEQ_0312
Figure 12_A0101_SEQ_0313
Figure 12_A0101_SEQ_0314
Figure 12_A0101_SEQ_0315
Figure 12_A0101_SEQ_0316
Figure 12_A0101_SEQ_0317
Figure 12_A0101_SEQ_0318
Figure 12_A0101_SEQ_0319
Figure 12_A0101_SEQ_0320
Figure 12_A0101_SEQ_0321
Figure 12_A0101_SEQ_0322
Figure 12_A0101_SEQ_0323
Figure 12_A0101_SEQ_0324
Figure 12_A0101_SEQ_0325
Figure 12_A0101_SEQ_0326
Figure 12_A0101_SEQ_0327
Figure 12_A0101_SEQ_0328
Figure 12_A0101_SEQ_0329
Figure 12_A0101_SEQ_0330
Figure 12_A0101_SEQ_0331
Figure 12_A0101_SEQ_0332
Figure 12_A0101_SEQ_0333
Figure 12_A0101_SEQ_0334
Figure 12_A0101_SEQ_0335
Figure 12_A0101_SEQ_0336
Figure 12_A0101_SEQ_0337
Figure 12_A0101_SEQ_0338
Figure 12_A0101_SEQ_0339
Figure 12_A0101_SEQ_0340
Figure 12_A0101_SEQ_0341
Figure 12_A0101_SEQ_0342
Figure 12_A0101_SEQ_0343
Figure 12_A0101_SEQ_0344
Figure 12_A0101_SEQ_0345
Figure 12_A0101_SEQ_0346
Figure 12_A0101_SEQ_0347
Figure 12_A0101_SEQ_0348
Figure 12_A0101_SEQ_0349
Figure 12_A0101_SEQ_0350
Figure 12_A0101_SEQ_0351
Figure 12_A0101_SEQ_0352
Figure 12_A0101_SEQ_0353
Figure 12_A0101_SEQ_0354
Figure 12_A0101_SEQ_0355
Figure 12_A0101_SEQ_0356
Figure 12_A0101_SEQ_0357
Figure 12_A0101_SEQ_0358
Figure 12_A0101_SEQ_0359
Figure 12_A0101_SEQ_0360
Figure 12_A0101_SEQ_0361
Figure 12_A0101_SEQ_0362
Figure 12_A0101_SEQ_0363
Figure 12_A0101_SEQ_0364
Figure 12_A0101_SEQ_0365
Figure 12_A0101_SEQ_0366
Figure 12_A0101_SEQ_0367
Figure 12_A0101_SEQ_0368
Figure 12_A0101_SEQ_0369
Figure 12_A0101_SEQ_0370
Figure 12_A0101_SEQ_0371
Figure 12_A0101_SEQ_0372
Figure 12_A0101_SEQ_0373
Figure 12_A0101_SEQ_0374
Figure 12_A0101_SEQ_0375
Figure 12_A0101_SEQ_0376
Figure 12_A0101_SEQ_0377
Figure 12_A0101_SEQ_0378
Figure 12_A0101_SEQ_0379
Figure 12_A0101_SEQ_0380
Figure 12_A0101_SEQ_0381
Figure 12_A0101_SEQ_0382
Figure 12_A0101_SEQ_0383
Figure 12_A0101_SEQ_0384
Figure 12_A0101_SEQ_0385
Figure 12_A0101_SEQ_0386
Figure 12_A0101_SEQ_0387
Figure 12_A0101_SEQ_0388
Figure 12_A0101_SEQ_0389
Figure 12_A0101_SEQ_0390
Figure 12_A0101_SEQ_0391
Figure 12_A0101_SEQ_0392
Figure 12_A0101_SEQ_0393
Figure 12_A0101_SEQ_0394
Figure 12_A0101_SEQ_0395
Figure 12_A0101_SEQ_0396
Figure 12_A0101_SEQ_0397
Figure 12_A0101_SEQ_0398
Figure 12_A0101_SEQ_0399
Figure 12_A0101_SEQ_0400
Figure 12_A0101_SEQ_0401
Figure 12_A0101_SEQ_0402
Figure 12_A0101_SEQ_0403
Figure 12_A0101_SEQ_0404
Figure 12_A0101_SEQ_0405
Figure 12_A0101_SEQ_0406
Figure 12_A0101_SEQ_0407
Figure 12_A0101_SEQ_0408
Figure 12_A0101_SEQ_0409
Figure 12_A0101_SEQ_0410
Figure 12_A0101_SEQ_0411
Figure 12_A0101_SEQ_0412
Figure 12_A0101_SEQ_0413
Figure 12_A0101_SEQ_0414
Figure 12_A0101_SEQ_0415
Figure 12_A0101_SEQ_0416
Figure 12_A0101_SEQ_0417
Figure 12_A0101_SEQ_0418
Figure 12_A0101_SEQ_0419
Figure 12_A0101_SEQ_0420
Figure 12_A0101_SEQ_0421
Figure 12_A0101_SEQ_0422
Figure 12_A0101_SEQ_0423
Figure 12_A0101_SEQ_0424
Figure 12_A0101_SEQ_0425
Figure 12_A0101_SEQ_0426
Figure 12_A0101_SEQ_0427
Figure 12_A0101_SEQ_0428
Figure 12_A0101_SEQ_0429
Figure 12_A0101_SEQ_0430
Figure 12_A0101_SEQ_0431
Figure 12_A0101_SEQ_0432
Figure 12_A0101_SEQ_0433
Figure 12_A0101_SEQ_0434
Figure 12_A0101_SEQ_0435
Figure 12_A0101_SEQ_0436
Figure 12_A0101_SEQ_0437
Figure 12_A0101_SEQ_0438
Figure 12_A0101_SEQ_0439
Figure 12_A0101_SEQ_0440
Figure 12_A0101_SEQ_0441
Figure 12_A0101_SEQ_0442
Figure 12_A0101_SEQ_0443
Figure 12_A0101_SEQ_0444
Figure 12_A0101_SEQ_0445
Figure 12_A0101_SEQ_0446
Figure 12_A0101_SEQ_0447
Figure 12_A0101_SEQ_0448
Figure 12_A0101_SEQ_0449
Figure 12_A0101_SEQ_0450
Figure 12_A0101_SEQ_0451
Figure 12_A0101_SEQ_0452
Figure 12_A0101_SEQ_0453
Figure 12_A0101_SEQ_0454
Figure 12_A0101_SEQ_0455
Figure 12_A0101_SEQ_0456
Figure 12_A0101_SEQ_0457
Figure 12_A0101_SEQ_0458
Figure 12_A0101_SEQ_0459
Figure 12_A0101_SEQ_0460
Figure 12_A0101_SEQ_0461
Figure 12_A0101_SEQ_0462
Figure 12_A0101_SEQ_0463
Figure 12_A0101_SEQ_0464
Figure 12_A0101_SEQ_0465
Figure 12_A0101_SEQ_0466
Figure 12_A0101_SEQ_0467
Figure 12_A0101_SEQ_0468
Figure 12_A0101_SEQ_0469
Figure 12_A0101_SEQ_0470
Figure 12_A0101_SEQ_0471
Figure 12_A0101_SEQ_0472
Figure 12_A0101_SEQ_0473
Figure 12_A0101_SEQ_0474
Figure 12_A0101_SEQ_0475
Figure 12_A0101_SEQ_0476
Figure 12_A0101_SEQ_0477
Figure 12_A0101_SEQ_0478
Figure 12_A0101_SEQ_0479
Figure 12_A0101_SEQ_0480
Figure 12_A0101_SEQ_0481
Figure 12_A0101_SEQ_0482
Figure 12_A0101_SEQ_0483
Figure 12_A0101_SEQ_0484
Figure 12_A0101_SEQ_0485
Figure 12_A0101_SEQ_0486
Figure 12_A0101_SEQ_0487
Figure 12_A0101_SEQ_0488
Figure 12_A0101_SEQ_0489
Figure 12_A0101_SEQ_0490
Figure 12_A0101_SEQ_0491
Figure 12_A0101_SEQ_0492
Figure 12_A0101_SEQ_0493
Figure 12_A0101_SEQ_0494
Figure 12_A0101_SEQ_0495
Figure 12_A0101_SEQ_0496
Figure 12_A0101_SEQ_0497
Figure 12_A0101_SEQ_0498
Figure 12_A0101_SEQ_0499
Figure 12_A0101_SEQ_0500
Figure 12_A0101_SEQ_0501
Figure 12_A0101_SEQ_0502
Figure 12_A0101_SEQ_0503
Figure 12_A0101_SEQ_0504
Figure 12_A0101_SEQ_0505
Figure 12_A0101_SEQ_0506
Figure 12_A0101_SEQ_0507
Figure 12_A0101_SEQ_0508
Figure 12_A0101_SEQ_0509
Figure 12_A0101_SEQ_0510
Figure 12_A0101_SEQ_0511
Figure 12_A0101_SEQ_0512
Figure 12_A0101_SEQ_0513
Figure 12_A0101_SEQ_0514
Figure 12_A0101_SEQ_0515
Figure 12_A0101_SEQ_0516
Figure 12_A0101_SEQ_0517
Figure 12_A0101_SEQ_0518
Figure 12_A0101_SEQ_0519
Figure 12_A0101_SEQ_0520
Figure 12_A0101_SEQ_0521
Figure 12_A0101_SEQ_0522
Figure 12_A0101_SEQ_0523
Figure 12_A0101_SEQ_0524
Figure 12_A0101_SEQ_0525
Figure 12_A0101_SEQ_0526
Figure 12_A0101_SEQ_0527
Figure 12_A0101_SEQ_0528
Figure 12_A0101_SEQ_0529
Figure 12_A0101_SEQ_0530
Figure 12_A0101_SEQ_0531
Figure 12_A0101_SEQ_0532
Figure 12_A0101_SEQ_0533
Figure 12_A0101_SEQ_0534
Figure 12_A0101_SEQ_0535
Figure 12_A0101_SEQ_0536
Figure 12_A0101_SEQ_0537
Figure 12_A0101_SEQ_0538
Figure 12_A0101_SEQ_0539
Figure 12_A0101_SEQ_0540
Figure 12_A0101_SEQ_0541
Figure 12_A0101_SEQ_0542
Figure 12_A0101_SEQ_0543
Figure 12_A0101_SEQ_0544
Figure 12_A0101_SEQ_0545
Figure 12_A0101_SEQ_0546
Figure 12_A0101_SEQ_0547
Figure 12_A0101_SEQ_0548
Figure 12_A0101_SEQ_0549
Figure 12_A0101_SEQ_0550
Figure 12_A0101_SEQ_0551
Figure 12_A0101_SEQ_0552
Figure 12_A0101_SEQ_0553
Figure 12_A0101_SEQ_0554
Figure 12_A0101_SEQ_0555
Figure 12_A0101_SEQ_0556
Figure 12_A0101_SEQ_0557
Figure 12_A0101_SEQ_0558
Figure 12_A0101_SEQ_0559
Figure 12_A0101_SEQ_0560
Figure 12_A0101_SEQ_0561
Figure 12_A0101_SEQ_0562
Figure 12_A0101_SEQ_0563
Figure 12_A0101_SEQ_0564
Figure 12_A0101_SEQ_0565

Claims (122)

  1. 一種核酸分子,包括編碼一RNA引導的核酸酶(RGN)多肽的一多核苷酸,其中該多核苷酸包括編碼一RGN多肽的一核苷酸序列,該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的一胺基酸序列; 其中,當與能夠與一標的DNA序列雜交的一引導RNA(gRNA)結合時,該RGN多肽能夠以一RNA引導的序列專一性方式結合該標的DNA序列,以及 其中編碼一RGN多肽的該多核苷酸可操作地連接至與該多核苷酸異源的一啟動子。
  2. 如請求項1所述的核酸分子,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的一胺基酸序列。
  3. 如請求項1所述的核酸分子,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的一胺基酸序列。
  4. 如請求項1所述的核酸分子,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的一胺基酸位置處的一異白胺酸、在與SEQ ID NO:63的328對應的一胺基酸位置處的一纈胺酸、在與SEQ ID NO:63的366對應的一胺基酸位置處的一白胺酸、在與SEQ ID NO:63的368對應的一胺基酸位置處的一蘇胺酸、及在與SEQ ID NO:63的405對應的一胺基酸位置處的一纈胺酸。
  5. 如請求項1至請求項4中任一項所述的核酸分子,其中該RGN多肽能夠於結合時切割該標的DNA序列。
  6. 如請求項5所述的核酸分子,其中該RGN多肽能夠產生一雙股斷裂。
  7. 如請求項5所述的核酸分子,其中該RGN多肽能夠產生一單股斷裂。
  8. 如請求項1至請求項4中任一項所述的核酸分子,其中該RGN多肽為核酸酶不活化或為一切口酶。
  9. 如請求項1至請求項8中任一項所述的核酸分子,其中該RGN多肽與一鹼基編輯多肽可操作地融合。
  10. 如請求項9所述的核酸分子,其中該鹼基編輯多肽為一去胺酶。
  11. 如請求項1至請求項10中任一項所述的核酸分子,其中該RGN多肽包括一或更多核定位訊號。
  12. 如請求項1至請求項11中任一項所述的核酸分子,其中該RGN多肽針對於一真核細胞中的表現而被密碼子最佳化。
  13. 如請求項1至請求項2中任一項所述的核酸分子,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  14. 一種包括如請求項1至請求項13中任一項所述的核酸分子的載體。
  15. 如請求項14所述的的載體,進一步包括編碼該gRNA的至少一核苷酸序列,該gRNA能夠與該標的DNA序列雜交。
  16. 如請求項15所述的的載體,其中該引導RNA選自由下列所組成的群組: a)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:2具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:3具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; b)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:9具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:10具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的一胺基酸序列; c)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:16具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:17具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:15具有至少90%序列一致性的一胺基酸序列; d)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:23具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:24具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:22具有至少90%序列一致性的一胺基酸序列; e)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:30具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:31具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:29具有至少90%序列一致性的一胺基酸序列; f)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:37具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:38具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:36具有至少90%序列一致性的一胺基酸序列; g)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:44具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:45具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:43具有至少90%序列一致性的一胺基酸序列; h)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:51具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:52具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:50具有至少90%序列一致性的一胺基酸序列; i)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:57具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:58具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:56具有至少90%序列一致性的一胺基酸序列; j)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:64具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:65具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的一胺基酸序列; k)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:71具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:72具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:70具有至少90%序列一致性的一胺基酸序列; l)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:77具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:78具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:76具有至少90%序列一致性的一胺基酸序列; m)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:85具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的一胺基酸序列; n)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:90具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:91具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:89具有至少90%序列一致性的一胺基酸序列; o)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:97具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:98具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:96具有至少90%序列一致性的一胺基酸序列; p)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:104具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:105具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:103具有至少90%序列一致性的一胺基酸序列; q)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:111具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:112具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:110具有至少90%序列一致性的一胺基酸序列; r)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:118具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:119具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:117具有至少90%序列一致性的一胺基酸序列; s)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:124具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:125具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:123具有至少90%序列一致性的一胺基酸序列;以及 t)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少90%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:78具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的一胺基酸序列。
  17. 如請求項15所述的載體,其中該引導RNA選自由下列所組成的群組: a)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:2具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:3具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有至少95%序列一致性的一胺基酸序列; b)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:9具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:10具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有至少95%序列一致性的一胺基酸序列; c)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:16具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:17具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:15具有至少95%序列一致性的一胺基酸序列; d)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:23具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:24具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:22具有至少95%序列一致性的一胺基酸序列; e)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:30具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:31具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:29具有至少95%序列一致性的一胺基酸序列; f)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:37具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:38具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:36具有至少95%序列一致性的一胺基酸序列; g)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:44具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:45具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:43具有至少95%序列一致性的一胺基酸序列; h)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:51具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:52具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:50具有至少95%序列一致性的一胺基酸序列; i)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:57具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:58具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:56具有至少95%序列一致性的一胺基酸序列; j)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:64具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:65具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的一胺基酸序列; k)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:71具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:72具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:70具有至少95%序列一致性的一胺基酸序列; l)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:77具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:78具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:76具有至少95%序列一致性的一胺基酸序列; m)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:85具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的一胺基酸序列; n)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:90具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:91具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:89具有至少95%序列一致性的一胺基酸序列; o)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:97具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:98具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:96具有至少95%序列一致性的一胺基酸序列; p)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:104具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:105具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:103具有至少95%序列一致性的一胺基酸序列; q)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:111具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:112具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:110具有至少95%序列一致性的一胺基酸序列; r)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:118具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:119具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:117具有至少95%序列一致性的一胺基酸序列; s)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:124具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:125具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:123具有至少95%序列一致性的一胺基酸序列;以及 t)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有至少95%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:78具有至少95%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的一胺基酸序列。
  18. 如請求項15所述的載體,其中該引導RNA選自由下列所組成的群組: a)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:2具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:3具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有100%序列一致性的一胺基酸序列; b)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:9具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:10具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有100%序列一致性的一胺基酸序列; c)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:16具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:17具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:15具有100%序列一致性的一胺基酸序列; d)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:23具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:24具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:22具有100%序列一致性的一胺基酸序列; e)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:30具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:31具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:29具有100%序列一致性的一胺基酸序列; f)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:37具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:38具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:36具有100%序列一致性的一胺基酸序列; g)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:44具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:45具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:43具有100%序列一致性的一胺基酸序列; h)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:51具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:52具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:50具有100%序列一致性的一胺基酸序列; i)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:57具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:58具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:56具有100%序列一致性的一胺基酸序列; j)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:64具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:65具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有100%序列一致性的一胺基酸序列; k)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:71具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:72具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:70具有100%序列一致性的一胺基酸序列; l)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:77具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:78具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:76具有100%序列一致性的一胺基酸序列; m)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:85具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的一胺基酸序列; n)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:90具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:91具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:89具有100%序列一致性的一胺基酸序列; o)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:97具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:98具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:96具有100%序列一致性的一胺基酸序列; p)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:104具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:105具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:103具有100%序列一致性的一胺基酸序列; q)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:111具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:112具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:110具有100%序列一致性的一胺基酸序列; r)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:118具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:119具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:117具有100%序列一致性的一胺基酸序列; s)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:124具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:125具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:123具有100%序列一致性的一胺基酸序列;以及 t)一引導RNA,包括: i)一CRISPR RNA,該CRISPR RNA包括與SEQ ID NO:84具有100%序列一致性的一CRISPR重複序列;以及 ii)一tracrRNA,該tracrRNA與SEQ ID NO:78具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的一胺基酸序列。
  19. 如請求項15至請求項18中任一項所述的載體,其中該gRNA為一單引導RNA。
  20. 如請求項15至請求項18中任一項所述的載體,其中該gRNA為一雙引導RNA。
  21. 一種包括如請求項1至請求項13中任一項所述的的核酸分子或如請求項14至請求項20中任一項所述的載體的細胞。
  22. 一種用於製造一RGN多肽的方法,包括:在該RGN多肽被表現的條件下,培養如請求項21所述的細胞。
  23. 一種用於製造一RGN多肽的方法,包括將一異源核酸分子引入一細胞內,該異源核酸分子包括編碼一RNA引導的核酸酶(RGN)多肽的一核苷酸序列,該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的一胺基酸序列; 其中,當與能夠與一標的DNA序列雜交的一引導RNA(gRNA)結合時,該RGN多肽能夠以一RNA引導的序列專一性方式結合該標的DNA序列; 且在該RGN多肽被表現的條件下,培養該細胞。
  24. 如請求項23所述的方法,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的一胺基酸序列。
  25. 如請求項23所述的方法,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的一胺基酸序列。
  26. 如請求項23所述的方法,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的一胺基酸位置處的一異白胺酸、在與SEQ ID NO:63的328對應的一胺基酸位置處的一纈胺酸、在與SEQ ID NO:63的366對應的一胺基酸位置處的一白胺酸、在與SEQ ID NO:63的368對應的一胺基酸位置處的一蘇胺酸、及在與SEQ ID NO:63的405對應的一胺基酸位置處的一纈胺酸。
  27. 如請求項22至請求項26中任一項所述的方法,進一步包括純化該RGN多肽。
  28. 如請求項22至請求項26中任一項所述的方法,其中該細胞進一步表現一或更多引導RNA,該一或更多引導RNA能夠與該RGN多肽結合,以形成一RGN核糖核蛋白錯合物。
  29. 如請求項28所述的方法,進一步包括純化該RGN核糖核蛋白錯合物。
  30. 一種分離的RNA引導的核酸酶(RGN)多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的一胺基酸序列;以及 其中,當與能夠與一標的DNA序列雜交的一引導RNA(gRNA)結合時,該RGN多肽能夠以一RNA引導的序列專一性方式結合一DNA分子的該標的DNA序列。
  31. 如請求項30所述的分離的RGN多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的一胺基酸序列。
  32. 如請求項30所述的分離的RGN多肽,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的一胺基酸序列。
  33. 如請求項30所述的分離的RGN多肽,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的一胺基酸位置處的一異白胺酸、在與SEQ ID NO:63的328對應的一胺基酸位置處的一纈胺酸、在與SEQ ID NO:63的366對應的一胺基酸位置處的一白胺酸、在與SEQ ID NO:63的368對應的一胺基酸位置處的一蘇胺酸、及在與SEQ ID NO:63的405對應的一胺基酸位置處的一纈胺酸。
  34. 如請求項30至請求項33中任一項所述的分離的RGN多肽,其中該RGN多肽能夠於結合時切割該標的DNA序列。
  35. 如請求項34所述的分離的RGN多肽,其中藉由該RGN多肽的切割產生一雙股斷裂。
  36. 如請求項34所述的分離的RGN多肽,其中藉由該RGN多肽的切割產生一單股斷裂。
  37. 如請求項30至請求項33中任一項所述的分離的RGN多肽,其中該RGN多肽為核酸酶不活化或為一切口酶。
  38. 如請求項30至請求項37中任一項所述的分離的RGN多肽,其中該RGN多肽與一鹼基編輯多肽可操作地融合。
  39. 如請求項38所述的分離的RGN多肽,其中該鹼基編輯多肽為一去胺酶。
  40. 如請求項30至請求項39中任一項所述的分離的RGN多肽,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  41. 如請求項30至請求項40中任一項所述的分離的RGN多肽,其中該RGN多肽包括一或更多核定位訊號。
  42. 一種用於結合一DNA分子的一標的DNA序列的系統,該系統包括: a)能夠與該標的DNA序列雜交的一或更多引導RNA、或包括編碼該一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b)包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的一胺基酸序列的一RNA引導的核酸酶(RGN)多肽、或包括編碼該RGN多肽的一核苷酸序列的一多核苷酸; 其中編碼該RGN多肽的該核苷酸序列以及編碼該一或更多引導RNA的該核苷酸序列中的至少一者可操作地連接至與該核苷酸序列異源的一啟動子; 其中該一或更多引導RNA能夠與該標的DNA序列雜交,以及 其中該一或更多引導RNA能夠與該RGN多肽形成一錯合物,以便將該RGN多肽導向與該DNA分子的該標的DNA序列結合。
  43. 一種用於結合一DNA分子的一標的DNA序列的系統,該系統包括: a)能夠與該標的DNA序列雜交的一或更多引導RNA、或包括編碼該一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b)包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的一胺基酸序列的一RNA引導的核酸酶(RGN)多肽; 其中該一或更多引導RNA能夠與該標的DNA序列雜交,以及 其中該一或更多引導RNA能夠與該RGN多肽形成錯合物,以便將該RGN多肽導向與該DNA分子的該標的DNA序列結合。
  44. 如請求項42或請求項43所述的系統,其中編碼該一或更多引導RNA的至少一個該核苷酸序列可操作地連接至與該核苷酸序列異源的一啟動子。
  45. 如請求項42至請求項44中任一項所述的系統,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的一胺基酸序列。
  46. 如請求項42至請求項44中任一項所述的系統,其中該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的一胺基酸序列。
  47. 如請求項42至請求項44中任一項所述的系統,其中該RGN多肽與SEQ ID NO:63具有至少95%序列一致性、且具有在與SEQ ID NO:63的305對應的一胺基酸位置處的一異白胺酸、在與SEQ ID NO:63的328的一胺基酸位置處的一纈胺酸、在與SEQ ID NO:63的366對應的一胺基酸位置處的一白胺酸、在與SEQ ID NO:63的368對應的一胺基酸位置處的一蘇胺酸、及在與SEQ ID NO:63的405對應的一胺基酸位置處的一纈胺酸。
  48. 如請求項42至請求項47中任一項所述的系統,其中未發現該RGN多肽與該一或更多引導RNA在本質上彼此錯合。
  49. 如請求項42至請求項48中任一項所述的系統,其中該標的DNA序列為一真核標的DNA序列。
  50. 如請求項42至請求項49中任一項所述的系統,其中該gRNA為一單引導RNA(sgRNA)。
  51. 如請求項42至請求項49中任一項所述的系統,其中該gRNA為一雙引導RNA。
  52. 如請求項42至請求項51中任一項所述的系統,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:3具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; b)包括與SEQ ID NO:9具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:10具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的一胺基酸序列; c)包括與SEQ ID NO:16具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:17具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:15具有至少90%序列一致性的一胺基酸序列; d)包括與SEQ ID NO:23具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:24具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:22具有至少90%序列一致性的一胺基酸序列; e)包括與SEQ ID NO:30具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:31具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:29具有至少90%序列一致性的一胺基酸序列; f)包括與SEQ ID NO:37具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:38具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:36具有至少90%序列一致性的一胺基酸序列; g)包括與SEQ ID NO:44具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:45具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:43具有至少90%序列一致性的一胺基酸序列; h)包括與SEQ ID NO:51具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:52具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:50具有至少90%序列一致性的一胺基酸序列; i)包括與SEQ ID NO:57具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:58具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:56具有至少90%序列一致性的一胺基酸序列; j)包括與SEQ ID NO:64具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:65具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性的一胺基酸序列; k)包括與SEQ ID NO:71具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:72具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:70具有至少90%序列一致性的一胺基酸序列; l)包括與SEQ ID NO:77具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:76具有至少90%序列一致性的一胺基酸序列; m)包括與SEQ ID NO:84具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:85具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的一胺基酸序列; n)包括與SEQ ID NO:90具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:91具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:89具有至少90%序列一致性的一胺基酸序列; o)包括與SEQ ID NO:97具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:98具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:96具有至少90%序列一致性的一胺基酸序列; p)包括與SEQ ID NO:104具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:105具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:103具有至少90%序列一致性的一胺基酸序列; q)包括與SEQ ID NO:111具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:112具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:110具有至少90%序列一致性的一胺基酸序列; r)包括與SEQ ID NO:118具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:119具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:117具有至少90%序列一致性的一胺基酸序列; s)包括與SEQ ID NO:124具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:125具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:123具有至少90%序列一致性的一胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少90%序列一致性的一CRISPR重複序列及與SEQ ID NO:78具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少90%序列一致性的一胺基酸序列。
  53. 如請求項42至請求項51中任一項所述的系統,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:3具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:1具有至少95%序列一致性的一胺基酸序列; b)包括與SEQ ID NO:9具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:10具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:8具有至少95%序列一致性的一胺基酸序列; c)包括與SEQ ID NO:16具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:17具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:15具有至少95%序列一致性的一胺基酸序列; d)包括與SEQ ID NO:23具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:24具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:22具有至少95%序列一致性的一胺基酸序列; e)包括與SEQ ID NO:30具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:31具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:29具有至少95%序列一致性的一胺基酸序列; f)包括與SEQ ID NO:37具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:38具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:36具有至少95%序列一致性的一胺基酸序列; g)包括與SEQ ID NO:44具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:45具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:43具有至少95%序列一致性的一胺基酸序列; h)包括與SEQ ID NO:51具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:52具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:50具有至少95%序列一致性的一胺基酸序列; i)包括與SEQ ID NO:57具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:58具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:56具有至少95%序列一致性的一胺基酸序列; j)包括與SEQ ID NO:64具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:65具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性的一胺基酸序列; k)包括與SEQ ID NO:71具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:72具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:70具有至少95%序列一致性的一胺基酸序列; l)包括與SEQ ID NO:77具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:76具有至少95%序列一致性的一胺基酸序列; m)包括與SEQ ID NO:84具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:85具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的一胺基酸序列; n)包括與SEQ ID NO:90具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:91具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:89具有至少95%序列一致性的一胺基酸序列; o)包括與SEQ ID NO:97具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:98具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:96具有至少95%序列一致性的一胺基酸序列; p)包括與SEQ ID NO:104具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:105具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:103具有至少95%序列一致性的一胺基酸序列; q)包括與SEQ ID NO:111具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:112具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:110具有至少95%序列一致性的一胺基酸序列; r)包括與SEQ ID NO:118具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:119具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:117具有至少95%序列一致性的一胺基酸序列; s)包括與SEQ ID NO:124具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:125具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:123具有至少95%序列一致性的一胺基酸序列;以及 t)包括與SEQ ID NO:84具有至少95%序列一致性的一CRISPR重複序列及與SEQ ID NO:78具有至少95%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:83具有至少95%序列一致性的一胺基酸序列。
  54. 如請求項42至請求項51中任一項所述的系統,其中該gRNA選自由下列所組成的群組: a)包括與SEQ ID NO:2具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:3具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:1具有100%序列一致性的一胺基酸序列; b)包括與SEQ ID NO:9具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:10具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:8具有100%序列一致性的一胺基酸序列; c)包括與SEQ ID NO:16具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:17具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:15具有100%序列一致性的一胺基酸序列; d)包括與SEQ ID NO:23具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:24具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:22具有100%序列一致性的一胺基酸序列; e)包括與SEQ ID NO:30具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:31具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:29具有100%序列一致性的一胺基酸序列; f)包括與SEQ ID NO:37具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:38具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:36具有100%序列一致性的一胺基酸序列; g)包括與SEQ ID NO:44具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:45具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:43具有100%序列一致性的一胺基酸序列; h)包括與SEQ ID NO:51具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:52具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:50具有100%序列一致性的一胺基酸序列; i)包括與SEQ ID NO:57具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:58具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:56具有100%序列一致性的一胺基酸序列; j)包括與SEQ ID NO:64具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:65具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:63及570-579中任一者具有100%序列一致性的一胺基酸序列; k)包括與SEQ ID NO:71具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:72具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:70具有100%序列一致性的一胺基酸序列; l)包括與SEQ ID NO:77具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:76具有100%序列一致性的一胺基酸序列; m)包括與SEQ ID NO:84具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:85具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的一胺基酸序列; n)包括與SEQ ID NO:90具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:91具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:89具有100%序列一致性的一胺基酸序列; o)包括與SEQ ID NO:97具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:98具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:96具有100%序列一致性的一胺基酸序列; p)包括與SEQ ID NO:104具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:105具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:103具有100%序列一致性的一胺基酸序列; q)包括與SEQ ID NO:111具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:112具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:110具有100%序列一致性的一胺基酸序列; r)包括與SEQ ID NO:118具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:119具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:117具有100%序列一致性的一胺基酸序列; s)包括與SEQ ID NO:124具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:125具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:123具有100%序列一致性的一胺基酸序列;以及 t)包括與SEQ ID NO:84具有100%序列一致性的一CRISPR重複序列及與SEQ ID NO:78具有100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:83具有100%序列一致性的一胺基酸序列。
  55. 如請求項42至請求項54中任一項所述的系統,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  56. 如請求項42至請求項55中任一項所述的系統,其中該標的DNA序列在一細胞內。
  57. 如請求項56所述的系統,其中該細胞為一真核細胞。
  58. 如請求項57所述的系統,其中該真核細胞為一植物細胞。
  59. 如請求項57所述的系統,其中該真核細胞為一哺乳動物細胞。
  60. 如請求項57所述的系統,其中該真核細胞為一昆蟲細胞。
  61. 如請求項56所述的系統,其中該細胞為一原核細胞。
  62. 如請求項42至請求項61中任一項所述的系統,其中,當被轉錄時,該一或更多引導RNA能夠與該標的DNA序列雜交,且該引導RNA能夠與該RGN多肽形成一錯合物,以導向該標的DNA序列的切割。
  63. 如請求項62所述的系統,其中該切割產生一雙股斷裂。
  64. 如請求項62所述的系統,其中該切割產生一單股斷裂。
  65. 如請求項42至請求項61中任一項所述的系統,其中該RGN多肽為核酸酶不活化或為一切口酶。
  66. 如請求項42至請求項65中任一項所述的系統,其中該RGN多肽可操作地連接至一鹼基編輯多肽。
  67. 如請求項66所述的系統,其中該鹼基編輯多肽為一去胺酶。
  68. 如請求項42至請求項67中任一項所述的系統,其中該RGN多肽包括一或更多核定位訊號。
  69. 如請求項42至請求項68中任一項所述的系統,其中該RGN多肽針對於一真核細胞中的表現而被密碼子最佳化。
  70. 如請求項42至請求項69中任一項所述的系統,其中編碼該一或更多引導RNA的核苷酸序列及編碼一RGN多肽的該核苷酸序列被定位於一個載體上。
  71. 如請求項42至請求項70中任一項所述的系統,其中該系統進一步包括一或更多供體多核苷酸或編碼該一或更多供體多核苷酸的一或更多核苷酸序列。
  72. 一種醫藥組成物,包括如請求項1至請求項13中任一項所述的核酸分子、如請求項14至請求項20中任一項所述的載體、如請求項21所述的細胞、如請求項30至請求項41中任一項所述的分離的RGN多肽、或如請求項42至請求項71中任一項所述的系統、及一藥學上可接受的載體。
  73. 一種用於結合一DNA分子的一標的DNA序列的方法,包括將根據請求項42至請求項31中任一項所述的一系統遞送至該標的DNA序列或包括該標的DNA序列的一細胞。
  74. 如請求項73所述的方法,其中該RGN多肽或該引導RNA進一步包括一可檢測標記,從而允許用於該標的DNA序列的檢測。
  75. 如請求項73所述的方法,其中該引導RNA或該RGN多肽進一步包括一表現調節子,從而調節該標的DNA序列的或由該標的DNA序列的轉錄控制下的一基因的表現。
  76. 一種用於切割或修飾一DNA分子的一標的DNA序列的方法,包括將根據請求項42至請求項71中任一項所述的一系統遞送至該標的DNA序列或包括該DNA分子的一細胞,且發生該標的DNA序列的切割或修飾。
  77. 如請求項76所述的方法,其中該經修飾的標的DNA序列包括於該標的DNA序列內異源DNA的插入。
  78. 如請求項76所述的方法,其中該經修飾的標的DNA序列包括至少一核苷酸自該標的DNA序列的缺失。
  79. 如請求項76所述的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的突變。
  80. 一種用於結合一DNA分子的一標的DNA序列的方法,包括: a)在適合形成該RGN核糖核苷酸錯合物的條件下,藉由組合下列,以在體外組裝一RNA引導的核酸酶(RGN)核糖核苷酸錯合物: i)能夠與該標的DNA序列雜交的一或更多引導RNA;以及 ii)一RGN多肽,該RGN多肽包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的一胺基酸序列;以及 b)使該標的DNA序列或包括該標的DNA序列的一細胞與該在體外組裝的RGN核糖核苷酸錯合物接觸; 其中該一或更多引導RNA與該標的DNA序列雜交,從而將該RGN多肽導向與該標的DNA序列結合。
  81. 如請求項80所述的方法,其中該RGN多肽或該引導RNA進一步包括一可檢測標記,從而允許用於該標的DNA序列的檢測。
  82. 如請求項80所述的方法,其中該引導RNA或該RGN多肽進一步包括一表現調節子,從而允許用於該標的DNA序列的表現的調節。
  83. 一種用於切割及/或修飾一DNA分子的一標的DNA序列的方法,包括使該DNA分子與下列接觸: a)一RNA引導的核酸酶(RGN)多肽,其中該RGN包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少90%序列一致性的一胺基酸序列;以及 b)能夠將(a)的該RGN靶向該標的DNA序列的一或更多引導RNA; 其中該一或更多引導RNA與該標的DNA序列雜交,從而將該RGN多肽導向與該標的DNA序列結合,且發生該標的DNA序列的切割及/或修飾。
  84. 如請求項83所述的方法,其中藉由該RGN多肽的切割產生一雙股斷裂。
  85. 如請求項83所述的方法,其中藉由該RGN多肽的切割產生一單股斷裂。
  86. 如請求項83所述的方法,其中該RGN多肽為核酸酶不活化或為一切口酶、且與一鹼基編輯多肽可操作地連接。
  87. 如請求項86所述的方法,其中該鹼基編輯多肽包括一去胺酶。
  88. 如請求項83所述的方法,其中該經修飾的標的DNA序列包括於該標的DNA序列內異源DNA的插入。
  89. 如請求項83所述的方法,其中該經修飾的標的DNA序列包括至少一核苷酸自該標的DNA序列的缺失。
  90. 如請求項83所述的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的突變。
  91. 如請求項80至請求項90中任一項所述的方法,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  92. 如請求項80至請求項91中任一項所述的方法,其中該標的DNA序列為一真核標的DNA序列。
  93. 如請求項80至請求項92中任一項所述的方法,其中該gRNA為一單引導RNA(gRNA)。
  94. 如請求項80至請求項92中任一項所述的方法,其中該gRNA為一雙引導RNA。
  95. 如請求項80至請求項94中任一項所述的方法,其中該RGN包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有至少95%序列一致性的一胺基酸序列。
  96. 如請求項80至請求項94中任一項所述的方法,其中該RGN包括與SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123及570-579中任一者具有100%序列一致性的一胺基酸序列。
  97. 如請求項80至請求項94中任一項所述的方法,其中該RGN多肽與SEQ ID NO:63具有至少90%序列一致性、且具有在與SEQ ID NO:63的305對應的一胺基酸位置處的一異白胺酸、在與SEQ ID NO:63的328對應的一胺基酸位置處的一纈胺酸、在與SEQ ID NO:63的366對應的一胺基酸位置處的一白胺酸、在與SEQ ID NO:63的368對應的一胺基酸位置處的一蘇胺酸、及在與SEQ ID NO:63的405對應的一胺基酸位置處的一纈胺酸。
  98. 如請求項80至請求項94中任一項所述的方法,其中: a)該RGN與SEQ ID NO:1具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:2具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:3具有至少90%序列一致性的一tracrRNA; b)該RGN與SEQ ID NO:8具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:9具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:10具有至少90%序列一致性的一tracrRNA; c)該RGN與SEQ ID NO:15具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:16具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:17具有至少90%序列一致性的一tracrRNA; d)該RGN與SEQ ID NO:22具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:23具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:24具有至少90%序列一致性的一tracrRNA; e)該RGN與SEQ ID NO:29具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:30具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:31具有至少90%序列一致性的一tracrRNA; f)該RGN與SEQ ID NO:36具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:37具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:38具有至少90%序列一致性的一tracrRNA; g)該RGN與SEQ ID NO:43具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:44具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:45具有至少90%序列一致性的一tracrRNA; h)該RGN與SEQ ID NO:50具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:51具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:52具有至少90%序列一致性的一tracrRNA; i)該RGN與SEQ ID NO:56具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:57具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:58具有至少90%序列一致性的一tracrRNA; j)該RGN與SEQ ID NO:63及570-579中任一者具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:64具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:65具有至少90%序列一致性的一tracrRNA; k)該RGN與SEQ ID NO:70具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:71具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:72具有至少90%序列一致性的一tracrRNA; l)該RGN與SEQ ID NO:76具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:77具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:78具有至少90%序列一致性的一tracrRNA; m)該RGN與SEQ ID NO:83具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:85具有至少90%序列一致性的一tracrRNA; n)該RGN與SEQ ID NO:89具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:90具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:91具有至少90%序列一致性的一tracrRNA; o)該RGN與SEQ ID NO:96具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:97具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:98具有至少90%序列一致性的一tracrRNA; p)該RGN與SEQ ID NO:103具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:104具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:105具有至少90%序列一致性的一tracrRNA; q)該RGN與SEQ ID NO:110具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:111具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:112具有至少90%序列一致性的一tracrRNA; r)該RGN與SEQ ID NO:117具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:118具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:119具有至少90%序列一致性的一tracrRNA; s)該RGN與SEQ ID NO:123具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:124具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:125具有至少90%序列一致性的一tracrRNA;或 t)該RGN與SEQ ID NO:83具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少90%序列一致性的一crRNA重複序列及與SEQ ID NO:78具有至少90%序列一致性的一tracrRNA。
  99. 如請求項80至請求項94中任一項所述的方法,其中: a)該RGN與SEQ ID NO:1具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:2具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:3具有至少95%序列一致性的一tracrRNA; b)該RGN與SEQ ID NO:8具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:9具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:10具有至少95%序列一致性的一tracrRNA; c)該RGN與SEQ ID NO:15具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:16具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:17具有至少95%序列一致性的一tracrRNA; d)該RGN與SEQ ID NO:22具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:23具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:24具有至少95%序列一致性的一tracrRNA; e)該RGN與SEQ ID NO:29具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:30具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:31具有至少95%序列一致性的一tracrRNA; f)該RGN與SEQ ID NO:36具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:37具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:38具有至少95%序列一致性的一tracrRNA; g)該RGN與SEQ ID NO:43具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:44具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:45具有至少95%序列一致性的一tracrRNA; h)該RGN與SEQ ID NO:50具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:51具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:52具有至少95%序列一致性的一tracrRNA; i)該RGN與SEQ ID NO:56具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:57具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:58具有至少95%序列一致性的一tracrRNA; j)該RGN與SEQ ID NO:63及570-579中任一者具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:64具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:65具有至少95%序列一致性的一tracrRNA; k)該RGN與SEQ ID NO:70具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:71具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:72具有至少95%序列一致性的一tracrRNA; l)該RGN與SEQ ID NO:76具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:77具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:78具有至少95%序列一致性的一tracrRNA; m)該RGN與SEQ ID NO:83具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:85具有至少95%序列一致性的一tracrRNA; n)該RGN與SEQ ID NO:89具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:90具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:91具有至少95%序列一致性的一tracrRNA; o)該RGN與SEQ ID NO:96具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:97具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:98具有至少95%序列一致性的一tracrRNA; p)該RGN與SEQ ID NO:103具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:104具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:105具有至少95%序列一致性的一tracrRNA; q)該RGN與SEQ ID NO:110具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:111具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:112具有至少95%序列一致性的一tracrRNA; r)該RGN與SEQ ID NO:117具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:118具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:119具有至少95%序列一致性的一tracrRNA; s)該RGN與SEQ ID NO:123具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:124具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:125具有至少95%序列一致性的一tracrRNA;或 t)該RGN與SEQ ID NO:83具有至少95%序列一致性,該引導RNA包括與SEQ ID NO:84具有至少95%序列一致性的一crRNA重複序列及與SEQ ID NO:78具有至少95%序列一致性的一tracrRNA。
  100. 如請求項80至請求項94中任一項所述的方法,其中: a)該RGN與SEQ ID NO:1具有100%序列一致性,該引導RNA包括與SEQ ID NO:2具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:3具有100%序列一致性的一tracrRNA; b)該RGN與SEQ ID NO:8具有100%序列一致性,該引導RNA包括與SEQ ID NO:9具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:10具有100%序列一致性的一tracrRNA; c)該RGN與SEQ ID NO:15具有100%序列一致性,該引導RNA包括與SEQ ID NO:16具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:17具有100%序列一致性的一tracrRNA; d)該RGN與SEQ ID NO:22具有100%序列一致性,該引導RNA包括與SEQ ID NO:23具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:24具有100%序列一致性的一tracrRNA; e)該RGN與SEQ ID NO:29具有100%序列一致性,該引導RNA包括與SEQ ID NO:30具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:31具有100%序列一致性的一tracrRNA; f)該RGN與SEQ ID NO:36具有100%序列一致性,該引導RNA包括與SEQ ID NO:37具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:38具有100%序列一致性的一tracrRNA; g)該RGN與SEQ ID NO:43具有100%序列一致性,該引導RNA包括與SEQ ID NO:44具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:45具有100%序列一致性的一tracrRNA; h)該RGN與SEQ ID NO:50具有100%序列一致性,該引導RNA包括與SEQ ID NO:51具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:52具有100%序列一致性的一tracrRNA; i)該RGN與SEQ ID NO:56具有100%序列一致性,該引導RNA包括與SEQ ID NO:57具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:58具有100%序列一致性的一tracrRNA; j)該RGN與SEQ ID NO:63及570-579中任一者具有100%序列一致性,該引導RNA包括與SEQ ID NO:64具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:65具有100%序列一致性的一tracrRNA; k)該RGN與SEQ ID NO:70具有100%序列一致性,該引導RNA包括與SEQ ID NO:71具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:72具有100%序列一致性的一tracrRNA; l)該RGN與SEQ ID NO:76具有100%序列一致性,該引導RNA包括與SEQ ID NO:77具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:78具有100%序列一致性的一tracrRNA; m)該RGN與SEQ ID NO:83具有100%序列一致性,該引導RNA包括與SEQ ID NO:84具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:85具有100%序列一致性的一tracrRNA; n)該RGN與SEQ ID NO:89具有100%序列一致性,該引導RNA包括與SEQ ID NO:90具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:91具有100%序列一致性的一tracrRNA; o)該RGN與SEQ ID NO:96具有100%序列一致性,該引導RNA包括與SEQ ID NO:97具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:98具有100%序列一致性的一tracrRNA; p)該RGN與SEQ ID NO:103具有100%序列一致性,該引導RNA包括與SEQ ID NO:104具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:105具有100%序列一致性的一tracrRNA; q)該RGN與SEQ ID NO:110具有100%序列一致性,該引導RNA包括與SEQ ID NO:111具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:112具有100%序列一致性的一tracrRNA; r)該RGN與SEQ ID NO:117具有100%序列一致性,該引導RNA包括與SEQ ID NO:118具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:119具有100%序列一致性的一tracrRNA; s)該RGN與SEQ ID NO:123具有100%序列一致性,該引導RNA包括與SEQ ID NO:124具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:125具有100%序列一致性的一tracrRNA;或 t)該RGN與SEQ ID NO:83具有100%序列一致性,該引導RNA包括與SEQ ID NO:84具有100%序列一致性的一crRNA重複序列及與SEQ ID NO:78具有100%序列一致性的一tracrRNA。
  101. 如請求項73至請求項100中任一項所述的方法,其中該標的DNA序列在一細胞內。
  102. 如請求項101所述的方法,其中該細胞為一真核細胞。
  103. 如請求項102所述的方法,其中該真核細胞為一植物細胞。
  104. 如請求項102所述的方法,其中該真核細胞為一哺乳動物細胞。
  105. 如請求項102所述的方法,其中該真核細胞為一昆蟲細胞。
  106. 如請求項101所述的方法,其中該細胞為一原核細胞。
  107. 如請求項101至請求項106中任一項所述的方法,進一步包括:在該RGN多肽被表現且切割該標的DNA序列以產生包括一經修飾的DNA序列的一DNA分子的條件下,培養該細胞;以及選擇包括該經修飾的標的DNA序列的細胞。
  108. 一種包括如請求項107所述的方法的經修飾的標的DNA序列的細胞。
  109. 如請求項108所述的細胞,其中該細胞為一真核細胞。
  110. 如請求項109所述的細胞,其中該真核細胞為一植物細胞。
  111. 一種包括如請求項110所述的細胞的植物。
  112. 一種包括如請求項110所述的細胞的種子。
  113. 如請求項109所述的細胞,其中該真核細胞為一哺乳動物細胞。
  114. 如請求項113所述的細胞,其中該哺乳動物細胞為一人類細胞。
  115. 如請求項114所述的細胞,其中該人類細胞為一免疫細胞。
  116. 如請求項115所述的細胞,其中該免疫細胞為一幹細胞。
  117. 如請求項116所述的細胞,其中該幹細胞為一經誘導的多潛能幹細胞。
  118. 如請求項109所述的細胞,其中該真核細胞為一昆蟲細胞。
  119. 如請求項108所述的細胞,其中該細胞為一原核細胞。
  120. 一種包括如請求項108、請求項109及請求項113至請求項117中任一項所述的細胞的醫藥組成物及一藥學上可接受的載體。
  121. 一種治療一疾病的方法,該方法包括對需要治療的一個體投予一有效量的如請求項72或請求項120所述的醫藥組成物。
  122. 如請求項121所述的方法,其中該疾病與一因果突變關聯,且該有效量的該醫藥組成物校正該基因突變。
TW110113939A 2020-04-24 2021-04-19 Rna引導核酸酶及其活性片段與變體,以及使用方法 TW202208626A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202063014970P 2020-04-24 2020-04-24
US63/014,970 2020-04-24
US202063077211P 2020-09-11 2020-09-11
US63/077,211 2020-09-11

Publications (1)

Publication Number Publication Date
TW202208626A true TW202208626A (zh) 2022-03-01

Family

ID=75919401

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110113939A TW202208626A (zh) 2020-04-24 2021-04-19 Rna引導核酸酶及其活性片段與變體,以及使用方法

Country Status (12)

Country Link
US (5) US20230175018A1 (zh)
EP (2) EP4118198A1 (zh)
JP (1) JP2023516226A (zh)
KR (1) KR20230014700A (zh)
CN (1) CN116096879A (zh)
AU (1) AU2021258273A1 (zh)
BR (1) BR112022021459A2 (zh)
CA (1) CA3174124A1 (zh)
IL (1) IL297500A (zh)
MX (1) MX2022013187A (zh)
TW (1) TW202208626A (zh)
WO (1) WO2021217002A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202208626A (zh) * 2020-04-24 2022-03-01 美商生命編輯公司 Rna引導核酸酶及其活性片段與變體,以及使用方法
TW202300649A (zh) 2021-03-22 2023-01-01 美商生命編輯治療學公司 Dna修飾酶及活性片段及其變體及使用方法
CA3173953A1 (en) 2021-06-11 2023-12-10 Tyson D. BOWEN Rna polymerase iii promoters and methods of use
WO2024033901A1 (en) 2022-08-12 2024-02-15 LifeEDIT Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use
WO2024127370A1 (en) 2022-12-16 2024-06-20 LifeEDIT Therapeutics, Inc. Guide rnas that target trac gene and methods of use
WO2024127369A1 (en) 2022-12-16 2024-06-20 LifeEDIT Therapeutics, Inc. Guide rnas that target foxp3 gene and methods of use
WO2024178397A2 (en) 2023-02-24 2024-08-29 Elevatebio Technologies, Inc. Modified immune effector cells and methods of use
WO2024214071A1 (en) * 2023-04-12 2024-10-17 LifeEDIT Therapeutics, Inc. Compositions and methods for the treatment of huntington's disease by editing the mutant huntingtin gene

Family Cites Families (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10167A (en) 1853-10-25 Soda-jountaiet
US457A (en) 1837-11-11 Caleb slade
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4853331A (en) 1985-08-16 1989-08-01 Mycogen Corporation Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US5039523A (en) 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
WO1990011361A1 (en) 1989-03-17 1990-10-04 E.I. Du Pont De Nemours And Company External regulation of gene expression
DE69133128T2 (de) 1990-04-12 2003-06-18 Syngenta Participations Ag, Basel Gewebe-spezifische Promotoren
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
CA2051562C (en) 1990-10-12 2003-12-02 Jewel M. Payne Bacillus thuringiensis isolates active against dipteran pests
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
EP0600993B1 (en) 1991-08-27 1999-11-10 Novartis AG Proteins with insecticidal properties against homopteran insects and their use in plant protection
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
DE69920879T2 (de) 1998-02-26 2005-10-13 Pioneer Hi-Bred International, Inc. Konstitutive maispromotoren
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
CA2371442A1 (en) 1999-05-04 2000-11-09 Monsanto Technology Llc Coleopteran-toxic polypeptide compositions and insect-resistant transgenic plants
BR0014516A (pt) 1999-09-15 2002-07-02 Monsanto Technology Llc Composições e métodos de uso de delta-endotoxina do bacilo thuringiensis ativo de lepidopteran
US6521901B1 (en) 1999-09-20 2003-02-18 Applied Materials, Inc. System to reduce heat-induced distortion of photomasks during lithography
WO2003052051A2 (en) 2001-12-17 2003-06-26 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences
US20050183161A1 (en) 2003-10-14 2005-08-18 Athenix Corporation AXMI-010, a delta-endotoxin gene and methods for its use
US7629504B2 (en) 2003-12-22 2009-12-08 Pioneer Hi-Bred International, Inc. Bacillus thuringiensis cry9 nucleic acids
EP2032598B1 (en) 2006-06-14 2012-10-17 Athenix Corporation Axmi-031, axmi-039, axmi-040 and axmi-049, a family of delta-endotoxin genes and methods for their use
ES2615829T3 (es) 2008-09-15 2017-06-08 The Children's Medical Center Corporation Modulación de BCL11A para el tratamiento de hemoglobinopatías
WO2011002992A1 (en) 2009-07-02 2011-01-06 Athenix Corp. Axmi-205 pesticidal gene and methods for its use
US8586832B2 (en) 2009-12-21 2013-11-19 Pioneer Hi Bred International Inc Bacillus thuringiensis gene with Lepidopteran activity
CA2807375A1 (en) 2010-08-19 2012-02-23 Pioneer Hi-Bred International, Inc. Novel bacillus thuringiensis gene with lepidopteran activity
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
ES2636902T3 (es) * 2012-05-25 2017-10-10 The Regents Of The University Of California Métodos y composiciones para la modificación de ADN objetivo dirigida por ARN y para la modulación de la transcripción dirigida por ARN
JP6225182B2 (ja) 2012-07-11 2017-11-01 サンガモ セラピューティクス, インコーポレイテッド リソソーム貯蔵疾患の処置のための方法および組成物
US11773400B2 (en) * 2013-08-22 2023-10-03 E.I. Du Pont De Nemours And Company Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
EP3186375A4 (en) 2014-08-28 2019-03-13 North Carolina State University NEW CAS9 PROTEINS AND GUIDING ELEMENTS FOR DNA TARGETING AND THE GENOME EDITION
US20190136248A1 (en) * 2015-05-15 2019-05-09 Pioneer Hi-Bred International, Inc. Novel guide rna/cas endonuclease systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US10526590B2 (en) * 2015-08-31 2020-01-07 Agilent Technologies, Inc. Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
IL310721A (en) 2015-10-23 2024-04-01 Harvard College Nucleobase editors and their uses
WO2017155717A1 (en) * 2016-03-11 2017-09-14 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
JP7548696B2 (ja) * 2016-07-06 2024-09-10 バーテックス ファーマシューティカルズ インコーポレイテッド 疼痛関連障害を処置するための物質及び方法
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
KR20190133699A (ko) * 2017-03-24 2019-12-03 큐어백 아게 Crispr-연관 단백질을 암호화하는 핵산 및 이의 용도
CN111801417B (zh) * 2017-12-14 2024-10-29 克里斯珀医疗股份公司 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途
EP3755792A4 (en) * 2018-02-23 2021-12-08 Pioneer Hi-Bred International, Inc. NEW CAS9 ORTHOLOGIST
WO2019195379A1 (en) * 2018-04-04 2019-10-10 Lifeedit, Inc. Methods and compositions to identify novel crispr systems
AU2019282149A1 (en) * 2018-06-05 2021-01-21 LifeEDIT Therapeutics, Inc. RNA-guided nucleases and active fragments and variants thereof and methods of use
US20210395730A1 (en) * 2018-10-10 2021-12-23 The General Hospital Corporation Selective Curbing of Unwanted RNA Editing (SECURE) DNA Base Editor Variants
WO2020139873A1 (en) 2018-12-24 2020-07-02 Virginia Polytechnic Institute And State University Tollip deficient neutrophils and uses thereof
MX2021007835A (es) * 2018-12-27 2021-08-11 Lifeedit Therapeutics Inc Polipeptidos utiles para edicion de genes y metodos de uso.
CN110551762B (zh) * 2019-08-08 2023-03-10 复旦大学 CRISPR/ShaCas9基因编辑系统及其应用
CA3147783A1 (en) * 2019-08-12 2021-02-18 Tyson D. BOWEN Rna-guided nucleases and active fragments and variants thereof and methods of use
TW202208626A (zh) * 2020-04-24 2022-03-01 美商生命編輯公司 Rna引導核酸酶及其活性片段與變體,以及使用方法

Also Published As

Publication number Publication date
US20230175018A1 (en) 2023-06-08
US11981916B2 (en) 2024-05-14
EP4118198A1 (en) 2023-01-18
AU2021258273A1 (en) 2022-12-01
WO2021217002A1 (en) 2021-10-28
US20240294947A1 (en) 2024-09-05
IL297500A (en) 2022-12-01
US20240026384A1 (en) 2024-01-25
CN116096879A (zh) 2023-05-09
MX2022013187A (es) 2022-11-14
BR112022021459A2 (pt) 2023-01-17
KR20230014700A (ko) 2023-01-30
US20230235360A1 (en) 2023-07-27
CA3174124A1 (en) 2021-10-28
EP4242306A2 (en) 2023-09-13
EP4242306A3 (en) 2023-10-18
US20230257742A1 (en) 2023-08-17
US11859181B2 (en) 2024-01-02
JP2023516226A (ja) 2023-04-18

Similar Documents

Publication Publication Date Title
US11926843B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
JP7572360B2 (ja) 遺伝子編集に有用なポリペプチドと利用方法
US11981916B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
CA3147783A1 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use
TW202346583A (zh) Rna引導核酸酶、其活性片段與變體,及使用方法
WO2021231437A1 (en) Rna-guided nucleic acid binding proteins and active fragments and variants thereof and methods of use
EA046542B1 (ru) Рнк-управляемые нуклеазы и активные фрагменты, и их варианты и способы применения