CN116286742B - CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用 - Google Patents
CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用 Download PDFInfo
- Publication number
- CN116286742B CN116286742B CN202310237362.1A CN202310237362A CN116286742B CN 116286742 B CN116286742 B CN 116286742B CN 202310237362 A CN202310237362 A CN 202310237362A CN 116286742 B CN116286742 B CN 116286742B
- Authority
- CN
- China
- Prior art keywords
- casd
- protein
- gene
- sequence
- plant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 201
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 135
- 238000010362 genome editing Methods 0.000 title claims abstract description 56
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 47
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract description 30
- 108700001094 Plant Genes Proteins 0.000 title claims abstract description 10
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 36
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 34
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 27
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 27
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 10
- 235000018102 proteins Nutrition 0.000 claims description 129
- 210000004027 cell Anatomy 0.000 claims description 51
- 241000196324 Embryophyta Species 0.000 claims description 43
- 125000003729 nucleotide group Chemical group 0.000 claims description 32
- 239000002773 nucleotide Substances 0.000 claims description 31
- 108020001507 fusion proteins Proteins 0.000 claims description 26
- 102000037865 fusion proteins Human genes 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 26
- 239000013604 expression vector Substances 0.000 claims description 25
- 239000013612 plasmid Substances 0.000 claims description 23
- 235000007164 Oryza sativa Nutrition 0.000 claims description 21
- 235000009566 rice Nutrition 0.000 claims description 21
- 239000000203 mixture Substances 0.000 claims description 16
- 241000589158 Agrobacterium Species 0.000 claims description 11
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 10
- 241000219194 Arabidopsis Species 0.000 claims description 9
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 7
- 230000002068 genetic effect Effects 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 108700008625 Reporter Genes Proteins 0.000 claims description 6
- 230000027455 binding Effects 0.000 claims description 6
- 238000010367 cloning Methods 0.000 claims description 5
- 244000061176 Nicotiana tabacum Species 0.000 claims description 4
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 4
- 240000008042 Zea mays Species 0.000 claims description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 4
- 235000005822 corn Nutrition 0.000 claims description 4
- 235000004252 protein component Nutrition 0.000 claims description 4
- 244000068988 Glycine max Species 0.000 claims description 3
- 235000010469 Glycine max Nutrition 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- 230000001404 mediated effect Effects 0.000 claims description 3
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 3
- 238000011426 transformation method Methods 0.000 claims description 3
- 229920000742 Cotton Polymers 0.000 claims description 2
- 241000219146 Gossypium Species 0.000 claims description 2
- 241000209510 Liliopsida Species 0.000 claims description 2
- 240000003183 Manihot esculenta Species 0.000 claims description 2
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 claims description 2
- 240000006394 Sorghum bicolor Species 0.000 claims description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 2
- 230000004071 biological effect Effects 0.000 claims description 2
- 241001233957 eudicotyledons Species 0.000 claims description 2
- 210000005253 yeast cell Anatomy 0.000 claims description 2
- 240000007594 Oryza sativa Species 0.000 claims 3
- 244000098338 Triticum aestivum Species 0.000 claims 1
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 12
- 230000005782 double-strand break Effects 0.000 abstract description 10
- 238000005520 cutting process Methods 0.000 abstract description 7
- 230000008439 repair process Effects 0.000 abstract description 6
- 230000009437 off-target effect Effects 0.000 abstract description 3
- 241000203069 Archaea Species 0.000 abstract description 2
- 241000192091 Deinococcus radiodurans Species 0.000 abstract description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 abstract 1
- 102000011931 Nucleoproteins Human genes 0.000 abstract 1
- 108010061100 Nucleoproteins Proteins 0.000 abstract 1
- 102000040430 polynucleotide Human genes 0.000 description 22
- 108091033319 polynucleotide Proteins 0.000 description 22
- 239000002157 polynucleotide Substances 0.000 description 22
- 239000013598 vector Substances 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 21
- 241000209094 Oryza Species 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 19
- 239000002609 medium Substances 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 14
- 238000010453 CRISPR/Cas method Methods 0.000 description 13
- 239000007788 liquid Substances 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 210000001938 protoplast Anatomy 0.000 description 13
- 229920001184 polypeptide Polymers 0.000 description 12
- 102000004196 processed proteins & peptides Human genes 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 10
- 238000003776 cleavage reaction Methods 0.000 description 10
- 239000001963 growth medium Substances 0.000 description 10
- 229930027917 kanamycin Natural products 0.000 description 10
- 229960000318 kanamycin Drugs 0.000 description 10
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 10
- 229930182823 kanamycin A Natural products 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 101150082422 CML18 gene Proteins 0.000 description 9
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 9
- 239000000306 component Substances 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- 239000012636 effector Substances 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 125000006850 spacer group Chemical group 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 5
- 102000004533 Endonucleases Human genes 0.000 description 5
- 238000010521 absorption reaction Methods 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- -1 host cells Substances 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 244000005700 microbiome Species 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 230000006780 non-homologous end joining Effects 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 229920002148 Gellan gum Polymers 0.000 description 4
- 101710163270 Nuclease Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 3
- 108091079001 CRISPR RNA Proteins 0.000 description 3
- 229930186147 Cephalosporin Natural products 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 229940124587 cephalosporin Drugs 0.000 description 3
- 150000001780 cephalosporins Chemical class 0.000 description 3
- 238000003501 co-culture Methods 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 210000003463 organelle Anatomy 0.000 description 3
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 3
- 229960001225 rifampicin Drugs 0.000 description 3
- 238000002791 soaking Methods 0.000 description 3
- 239000008223 sterile water Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 108700004991 Cas12a Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 229930182566 Gentamicin Natural products 0.000 description 2
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 229930195725 Mannitol Natural products 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 102000004389 Ribonucleoproteins Human genes 0.000 description 2
- 108010081734 Ribonucleoproteins Proteins 0.000 description 2
- 101150076211 TH gene Proteins 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 239000002250 absorbent Substances 0.000 description 2
- 230000002745 absorbent Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 229960002518 gentamicin Drugs 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000014075 nitrogen utilization Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000012882 rooting medium Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 101150082072 14 gene Proteins 0.000 description 1
- 101150094083 24 gene Proteins 0.000 description 1
- 101150055869 25 gene Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 101710117451 Calmodulin-like protein Proteins 0.000 description 1
- 102100035023 Carboxypeptidase B2 Human genes 0.000 description 1
- 108090000201 Carboxypeptidase B2 Proteins 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 101100382541 Escherichia coli (strain K12) casD gene Proteins 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241001524679 Escherichia virus M13 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- WOWHHFRSBJGXCM-UHFFFAOYSA-M cetyltrimethylammonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCC[N+](C)(C)C WOWHHFRSBJGXCM-UHFFFAOYSA-M 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000003141 isotope labeling method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000010496 root system development Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8202—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
- C12N15/8205—Agrobacterium mediated transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Nutrition Science (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明属于植物基因编辑技术领域,具体涉及CasD蛋白、CRISPR/CasD基因编辑系统及其应用。本发明基因编辑系统的Cas基因来自耐辐射奇球菌与极端古菌,经过人工改造形成编码CasD蛋白,与gRNA形成的核酸核蛋白复合体,能精确靶向目标基因序列并产生切割,使所述靶基因DNA序列发生双链断裂(DSB),DSB激活植物细胞的内源修复途径,造成靶标基因序列的改变,从而造成基因编辑。本发明的CasD蛋白具有特定的氨基酸序列,并且本发明的CRISPR/CasD基因编辑系统能够识别更广泛的PAM序列,且切割效率高、脱靶性低,在基因编辑领域中具有广泛的应用前景。
Description
技术领域
本发明涉及基因编辑技术领域,具体涉及CasD蛋白、CRISPR/CasD基因编辑系统及其应用。
背景技术
基因编辑技术
早期的基因工程技术只能将外源或内源遗传物质随机插入宿主基因组,基因编辑则能定点编辑想要编辑的基因。基因编辑依赖于经过基因工程改造的核酸酶,也称“分子剪刀”,在基因组中特定位置产生位点特异性双链断裂(DSB),诱导生物体通过非同源末端连接(NHEJ)或同源重组(HR)来修复DSB。CRISPR/Cas系统,是原核生物的一种获得性免疫系统,用于抵抗存在于噬菌体或质粒的外源遗传元件的入侵,存在于大多数细菌与所有的古菌中的一种防御机制,以消灭外来的质体或者噬菌体的DNA。CRISPR/Cas基因编辑技术凭借其操作方便、价格低廉,对基因位点进行精确性编辑的应用已经远超锌指核酸酶(ZFN)和转录激活因子效应类似物核酸酶(TALEN)技术,是近年来应用最为广泛使用的第3代基因编辑技术。
目前最为常用的编辑系统是CRISPR/Cas9系统,它识别NGG的PAM,该特征序列位于spacer的下游,对靶标序列进行平末端切割。Cas9是一种由crRNA和反式激活crRNA(Trans-activating crRNA,tracrRNA)引导的DNA核酸内切酶,能对基因进行精确性敲除、敲入或替换等,从而对靶基因表达水平进行有效的控制、或者改变靶基因所编码蛋白序列的目的。与通过蛋白定位目标序列的ZFN和TALEN技术相比,CRISPR/Cas9技术通过RNA碱基互补配对识别DNA,指导Cas9核酸酶切割识别的双链DNA,然后在特定的碱基之间产生DSB,DSB可以激活细胞内源的修复系统,包括非同源末端连接修复(NHEJ,non-homologous end-joining)和同源重组修复(HDR,homologous directed repair),从而在靶标序列产生定向编辑,进而造成基因失活或者所编码产物的改变,该技术广泛用于基因功能研究以及植物基因定向突变育种工作。
用于基因组编辑的CRISPR/Cas9系统主要组成包括核酸内切酶Cas9、crRNA(CRISPR RNA)和反式激活CRISPR RNA(trans-activating crRNA,tracrRNA)所组成。成熟的crRNA单元是由DR(Direct Repeat)序列和间隔序列(spacer)组成。实际应用中crRNA和tracrRNA形成一条嵌合的单分子向导RNA(single guide RNA,sgRNA),Cas9和sgRNA在细胞中形成二元复合体进行基因编辑。在基因编辑的过程中,该二元复合体首先在基因组中寻找PAM序列NGG,然后通过sgRNA中的~20nt的特异序列进行目标识别,一旦确定目标序列,Cas9蛋白会在PAM上游的第三和第四个核苷酸处介导生成双链断裂(DSB)(Jinek et al.,2012)。这些双链断裂导致宿主细胞中DNA修复系统的激活,通常通过非同源末端连接途径、或者同源重组的方式进行修复,在修复过程中将引入小的缺失或插入,从而产生定向突变(Voytas 2013)。
CRISPR/Cas12a属于V-A型系统,是继Cas9系统后发现的另一种类型的CRISPR系统,它识别TTTV的PAM,该基序位于spacer的5’端,对靶标序列切割后产生4-5bp的5’突出末端。该系统不包括tracrRNA,只需要Cas12a蛋白和crRNA就可以产生特定位点的切割,同时Cas12a蛋白除了核酸内切酶功能,还具有RNA酶的活性,可以将前体crRNA(pre-crRNA)处理成单个的成熟crRNA用于基因编辑,因此在多基因编辑设计中更为方便。两类CRISPR/Cas系统具有不同的优势,目前均被广泛应用于不同的基因编辑研究之中。
尽管CRISPR/Cas系统应用非常广泛,但在植物基因编辑的应用中仍存在一些问题。首先,不同类型的系统需要不同的PAM,PAM的识别序列限制了gRNA的设计。其次,CRISPR/Cas系统的编辑效率有待进一步提高,影响编辑效率的因素很多,包括Cas基因的表达,导向RNA的表达,核定位信号NLS的数量和位置等。此外,目前报道的系统脱靶性相对较高,因此,我们希望通过对Cas基因的序列进行定向改造,开发一种识别更为广泛的PAM,切割效率更高、脱靶性低、具有多方面良好性能的新型CRISPR/Cas系统。
发明内容
本发明的目的在于提供CasD蛋白、编码该蛋白的核苷酸序列、CRISPR/CasD系统以及基于该系统的基因编辑方法及其在植物基因编辑中的应用。发明人经过大量实验和反复探索,证实来自于耐辐射球菌(Deinococcus radiodurans,Dr)的Cas核酸酶结构区域序列可以用于Cas9蛋白的改造,改造后Cas蛋白的核酸切割效率非常高。基于此,本发明提供了一种DNA切割活性高、脱靶率低以及PAM识别广泛的复合新型RNA指导的DNA核酸内切酶——CasD系统,可用于水稻、玉米、小麦等禾本植物和双子叶植物的特异性位点诱变。
本发明提供的技术方案如下:
CasD蛋白
本发明的第一方面,提供了一种CasD蛋白,所述CasD蛋白的氨基酸序列如SEQIDNo:1所示;或与SEQ ID No.1所示的序列相比具有一个或多个氨基酸的置换、缺失或添加,且具有相同或相似生物学功能;或与SEQ ID No.1所示的序列相比具有至少90%的同一性,且具有相同或相似生物学功能。编码所述CasD蛋白的基因的核苷酸序列如SEQ ID No:2所示。
在某些实施方案中,所述CasD蛋白与SEQ ID No:1有90%,91%,92%,93%,94%,95%,96%,97%,98%,99%的同源性。
在某些实施方案中,所述CasD蛋白大小为1058个氨基酸。其结构域包含McrA/HNH、RuvC-like结构域以及WED结构域。
在本发明中,上述序列的生物学功能包括但不限于,与导向RNA结合的活性、核酸内切酶活性、在导向RNA引导下与靶序列特定位点结合并切割的活性。
衍生的蛋白
本发明的第二方面,提供了一种衍生蛋白,所述衍生蛋白包含本发明第一方面提供的CasD蛋白和其他多肽,所述其他多肽与所述CasD蛋白连接的方式包括化学偶合、基因融合、非共价连接,所述其他多肽包括核定位信号(NLS)序列、信号肽、蛋白标签。
在某些实施方案中,将本发明的CasD蛋白与核定位信号(NLS)序列连接,以赋予本发明的CasD蛋白进入细胞核的能力。
在某些实施方案中,将本发明的CasD蛋白与信号肽相互连接,以使得本发明的CasD蛋白具有细胞器的靶向性。
在某些实施方案中,将本发明的CasD蛋白与蛋白标签连接,以便于本发明的CasD蛋白的表达、检测、示踪和纯化。
需要说明的是,本发明的衍生蛋白不会影响CasD蛋白的期望活性(例如,与向导RNA结合的活性、核酸内切酶活性、在向导RNA引导下与靶序列特定位点结合并切割的活性)。
融合蛋白
本发明的第三方面,提供了一种融合蛋白,所述融合蛋白包含本发明第一方面提供的CasD蛋白和修饰部分,所述修饰部分直接连接于CasD蛋白的N端或C端;所述修饰部分包含蛋白标签和/或报告基因序列;
在某些实施方案中,本发明的修饰部分包含蛋白标签(protein tag),这类蛋白标签是本领域技术人员熟知的,包括但不限于His、FLAG、Myc、MBP等,并且本领域技术人员已知如何根据期望目的(例如,纯化、检测或示踪)选择合适的蛋白标签。
在某些实施方案中,本发明的修饰部分包含报告基因序列,这类报告基因是本领域技术人员熟知的,包括但不限于GST、GFP、CFP、YFP等。
在某些实施方案中,本发明的融合蛋白编码如SEQ ID No:4所示的核苷酸序列。
需要说明的是,本发明的蛋白、融合蛋白不受其产生方式的限定,例如,其可以通过基因工程方法(重组技术)产生,也可以通过化学合成方法产生。
CRISPR/CasD复合物
本发明的第四方面,提供了一种复合物,其包含:(i)蛋白组分,选自本发明第一方面所述的CasD蛋白、本发明第二方面所述的衍生蛋白、本发明第三方面所述的融合蛋白及其任意组合,和(ii)核酸组分,所述核酸组分从5’至3’方向包含编码本发明第一方面提供的CasD蛋白的核酸分子和能够与靶序列杂交的导向序列,所述蛋白组分与所述核酸组分相互结合形成复合物。
在某些实施方案中,所述导向序列包含所述靶序列的互补序列。在某些实施方案中,所述核酸组分是gRNA,所述gRNA具有20-70个核苷酸。
在具体的实施方式中,本发明提供了一种CRISPR-CasD系统,包含CasD蛋白;所述gRNA与所述CasD蛋白形成二元复合物,其中所述CasD蛋白大小为1058个氨基酸,其结构域包含McrA/HNH、RuvC-like结构域以及WED结构域。
表达载体、宿主细胞、组合物
另一方面,本发明还提供了一种表达载体,所述载体包含以下任一种:本发明第一方面提供的CasD蛋白的核苷酸序列、表达本发明第一方面所述的CasD蛋白、表达本发明第二方面所述的衍生蛋白、表达本发明第三方面所述的融合蛋白。
在某些实施方案中,所述表达载体具有如SEQ ID No:3所示的核苷酸序列。
另一方面,本发明还提供了包含或表达前述CasD蛋白、编码CasD蛋白的核苷酸、衍生蛋白、融合蛋白、表达载体中的一种或多种的宿主细胞。
另一方面,本发明还提供了一种组合物,包含:(i)第一组分,选自前述宿主细胞、CasD蛋白、编码CasD蛋白的核苷酸、衍生蛋白、融合蛋白、表达载体中的一种或多种,和(ii)第二组分,包含gRNA核苷酸序列,或者编码所述gRNA核苷酸序列的脱氧核糖核苷酸序列。
在某些实施方案中,所述组合物不包含tracrRNA,只需要人工合成的gRNA。在某些实施方案中,所述组合物是非天然存在的或经修饰的。在某些实施方案中,所述组合物中的至少一个组分是非天然存在的或经修饰的。在某些实施方案中,所述第一组分是非天然存在的或经修饰的;和/或,所述第二组分是非天然存在的或经修饰的。
在某些实施方案中,当所述靶序列为DNA时,所述靶序列位于原间隔序列临近基序(PAM)的3’端,并且所述PAM具有5’-TNN所示的序列,其中,N选自A、G、T、C。
在某些实施方案中,所述靶序列存在于细胞内。在某些实施方案中,所述靶序列存在于细胞核内或细胞质(例如,细胞器)内。在某些实施方案中,所述细胞是真核细胞。
在某些实施方案中,所述CasD蛋白连接有一个或多个细胞核定位信号(NLS)序列。在某些实施方案中,所述NLS序列连接至所述CasD蛋白的N端或C端。在某些实施方案中,所述NLS序列融合至所述CasD蛋白的N端或C端。
基因编辑系统
另一方面,本发明还提供了一种CRISPR/CasD基因编辑系统,所述基因编辑系统包含前述CasD蛋白、衍生蛋白、融合蛋白、表达前述CasD蛋白的质粒、表达前述衍生蛋白的质粒、表达前述融合蛋白的质粒中的任一种或多种;所述基因编辑系统还包含gRNA或表达所述gRNA的质粒。
方法
另一方面,本发明还提供了一种编辑植物基因的方法,所述方法包括:(1)根据前述CasD蛋白的PAM识别位点确定待编辑基因的gRNA;(2)将所述CasD蛋白的基因序列和相应的gRNA克隆到表达载体中;(3)将所述表达载体转化到农杆菌中,通过农杆菌介导的遗传转化方法,将所述表达载体导入目标植物,获得定向基因编辑植株。
在某些实施方案中,所述植物为单子叶植物或双子叶植物;在某些实施方案中,所述植物选自玉米、高粱、小麦,水稻、木薯、大豆、棉花、拟南芥、烟草的任一种;在具体实施方式中,所述植物为水稻。
在某些实施方案中,所述靶基因存在于体外的核酸分子(例如,质粒)中。在某些实施方案中,所述靶基因存在于质粒中。所述修饰是指所述靶序列的断裂,如DNA的双链断裂或RNA的单链断裂。
在某些实施方案中,所述方法还包括:将编辑模板与所述靶基因接触,或者递送至包含所述靶基因的细胞中。在此类实施方案中,所述方法通过与外源模板多核苷酸同源重组修复所述断裂的靶基因,其中所述修复导致一种突变,包括所述靶基因的一个或多个核苷酸的插入、缺失、或取代。在某些实施方案中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。
应用
另一方面,本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在植物基因编辑中的应用。
另一方面,本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在离体单链DNA检测中的应用。
另一方面,本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在改变植物生物学特性中的应用。
另一方面,本发明还提供了前述CasD蛋白、核苷酸、衍生蛋白、融合蛋白、复合物、权表达载体、宿主细胞、或组合物在调控水稻对NO3 -吸收中的应用。
术语定义
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学、化学、分子生物学、生物化学、细胞培养、微生物学、细胞生物学、基因组学和重组DNA等操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
术语“CasD”是指,本发明人首次发现并鉴定的一种Cas效应蛋白,其具有选自下列的氨基酸序列:(i)SEQ ID No:1所示的序列;(ii)与SEQ ID No:1所示的序列相比具有一个或多个氨基酸的置换、缺失或添加(例如2个-10个氨基酸的置换、缺失或添加)的序列;或(iii)与SEQ ID No:1所示的序列具有至少80%的序列同一性的序列。
本发明的CasD是一种在导向RNA引导下与靶序列特定位点结合并切割的核酸内切酶,同时具有DNA和RNA内切酶活性。
如本文中所使用的,术语“规律成簇的间隔短回文重复(Clustered RegularlyInterspersed Short Palindromic Repeats)-关联(associated)系统(CRISPR-Cas系统)”或“CRISPR系统”可互换地使用并且具有本领域技术人员通常理解的含义,其通常包含与CRISPR相关基因(Cas)的表达有关的转录产物或其他元件,或者能够指导所述Cas基因活性的转录产物或其他元件。此类转录产物或其他元件可以包含编码Cas效应蛋白的序列和包含CRISPR RNA(crRNA)的导向RNA,以及在CRISPR-Cas9系统中所含有的反式激活CRISPRRNA(tracrRNA),或来自CRISPR基因座的其他序列或转录产物。在本发明所述的基于CasD的CRISPR系统中,不需要tracrRNA序列。
如本文中所使用的,术语“Cas效应蛋白”、“Cas效应酶”可互换地使用并且是指,CRISPR-Cas系统中呈现的任一种大于长度900个氨基酸的蛋白质。在某些情况下,这类蛋白是指从Cas基因座中鉴定的蛋白。
如本文中所使用的,术语“向导RNA(guide RNA)”、“成熟crRNA”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言,向导RNA可以包含同向重复序列(directrepeat)和间隔序列(spacer),或者基本上由或由同向重复序列和导向序列(在内源性CRISPR系统背景下也称为间隔序列(spacer)组成。在某些情况下,导向序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在某些实施方案中,当最佳比对时,导向序列与其相应靶序列之间的互补程度为至少50%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商业的比对算法和程序,诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。在某些情况下,所述导向序列(gRNA)在长度上为至少15个核苷酸。
如本文中所使用的,术语“CRISPR/Cas复合物”是指,导向RNA(guide RNA)或成熟crRNA与Cas蛋白结合所形成的核糖核蛋白复合体,其包含杂交到靶序列上并且与Cas蛋白结合的导向序列。该核糖核蛋白复合体能够识别并切割能与该导向RNA或成熟crRNA杂交的多核苷酸。
因此,在形成CRISPR/Cas复合物的情况下,“靶序列”是指被设计为具有靶向性的导向序列所靶向的多核苷酸,例如与该导向序列具有互补性的序列,其中靶序列与导向序列之间的杂交将促进CRISPR/Cas复合物的形成。完全互补性不是必需的,只要存在足够互补性以引起杂交并且促进一种CRISPR/Cas复合物的形成即可。靶序列可以包含任何多核苷酸,如DNA或RNA。在某些情况下,所述靶序列位于细胞的细胞核或细胞质中。在某些情况下,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包含该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在某些实施方案中,所述编辑模板为外源核酸。在某些实施方案中,该重组是同源重组。
本发明中,表述“靶序列”或“靶多核苷酸”可以是对细胞(例如,真核细胞)而言任何内源或外源的多核苷酸。例如,该靶多核苷酸可以是一种存在于真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用DNA)。在某些情况下,该靶序列应该与原间隔序列临近基序(PAM)相关。对PAM的精确序列和长度要求取决于使用的Cas效应酶而不同,但是PAM典型地是临近原间隔序列(也即靶序列)的2-5个碱基对序列。本领域技术人员能够鉴定与给定的Cas效应蛋白一起使用的PAM序列。
在某些情况下,靶序列或靶多核苷酸的实例包括产量、品质与抗逆性等相关基因或核苷酸。在改变的表达与产量、品质与抗逆性等相关基因相关的情况下,它可以是一个以异常高的水平被表达的基因;或者,它可以是一个以异常低的水平被表达的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
如本文中所使用的,术语“野生型”具有本领域技术人员通常理解的含义,其表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征,其可从自然中的来源分离并且没有被人为有意地修饰。
如本文中所使用的,术语“非天然存在的”或“工程化的”可互换地使用并且表示人工的参与。当这些术语用于描述核酸分子或多肽时,其表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。
如本文中所使用的,术语“直系同源物(orthologue,ortholog)”具有本领域技术人员通常理解的含义。作为进一步指导,如本文中所述的蛋白质的“直系同源物”是指属于不同物种的蛋白质,该蛋白质执行与作为其直系同源物的蛋白相同或相似的功能。
如本文中所使用的,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如Align程序方便地进行的Needleman等人(1970)J.Mol.Biol.48:443-453的方法来实现。
如本文中所使用的,术语“载体”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及动物病毒等。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。
如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等原核细胞,如酵母细胞或曲霉菌等真菌细胞、以及各种植物细胞。
本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的蛋白、融合蛋白、分离的核酸分子等(例如,CRISPR转录物,如核酸转录物、蛋白质、或酶)。
如本文中所使用的,术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制元件(例如转录终止信号),这些数据可以在相关的专业网站上进行检索。在某些情况下,调节元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导基因在感兴趣的期望组织中的表达,所述组织例如根、茎秆、叶片、花序等类型的细胞。
如本文中所使用的,术语“启动子”具有本领域技术人员公知的含义,其是指一段位于基因的上游能启动下游基因表达的非编码核苷酸序列。组成型(constitutive)启动子核苷酸与编码或者限定基因产物的多核苷酸可操作地相连时,在细胞的大多数或者所有生理条件下,其导致细胞中基因产物的产生。诱导型启动子是这样的核苷酸序列,当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当对应于所述启动子的诱导物在细胞中存在时,其导致所述基因产物在细胞内产生。组织特异性启动子是这样的核苷酸序列:当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当细胞是该启动子对应的组织类型的细胞时,其才导致在细胞中产生基因产物。
如本文中所使用的,术语“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。
如本文中所使用的,术语“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有70%以上互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。
如本文中所使用的,对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。
如本文中所使用的,术语“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应,该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成一个更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的一个步骤。能够与一个给定序列杂交的序列被称为该给定序列的“互补物”。
如本文中所使用的,术语“表达”是指,藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA,表达可以包括真核细胞中mRNA的剪接。
如本文中所使用的,术语“接头”是指,由多个氨基酸残基通过肽键连接形成的线性多肽。本发明的接头可以为人工合成的氨基酸序列,或天然存在的多肽序列,例如具有铰链区功能的多肽。
如本文中所使用的,术语“含有”、“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”和“由……构成”。
有益效果
(1)本发明提供了一种新的CasD蛋白和一种高效、稳定的CasD介导的基因编辑系统,可以在植物细胞中稳定、高效的表达,从而更好的调控靶基因的表达。CasD蛋白氨基酸数目少,CasD体积小为传递进入植物细胞中提供了优势(便于包装和递送),且CasD使用单一活性位点进行crRNA处理和对DNA序列的切割。
(2)本发明CasD蛋白的PAM结构域具有较强的宽泛性5’-TNN结构,即具有广泛的PAM识别位点,提高了gRNA设计的多样性,可以构建多个基因编辑位点载体,实现对更多的基因进行敲除。
(3)本发明的CasD蛋白及CRISPR/CasD基因编辑系统可用于真核生物(如拟南芥、烟草、大豆、玉米等)中DNA序列的基因编辑,且DNA的切割效率更高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是pCPB-CasD载体的结构示意图;其中,LB、RB指左、右边界序列,pZmU6为启动子,gRNA为向导RNA,FLAG为蛋白标签,KanR为卡那霉素抗性基因,Bar为筛选标记基因;tNOS为终止子。
图2是水稻CML18基因编辑植株的CasD基因扩增的琼脂糖凝胶电泳图;M:marker,WT:野生型(日本晴),NC为水对照;#3、#8、#12、#14、#19、#21、#24:编号为3、8、12、14、19、21、24的转基因阳性植株。
图3是水稻CML18基因编辑植株的靶点碱基序列和序列比对图,红色高亮为PAM识别位点;WT:野生型(日本晴),#14、#24:编号为14和24的基因编辑植株。
图4是不同NO3 -浓度下野生型和基因编辑植株的N吸收差异;LN:0.3Mm NO3 -浓度;HN:3mM;NO3 -浓度误差线为标准误差(n=3,每个重复包含20-25株幼苗)(*,P<0.05,**,P<0.01)。
具体实施方式
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
实施例1:CasD基因的获得
1、极端微生物中所有Cas蛋白的检索:
从NCBI、TAIR、Enzyme等网站下载已报道的Cas9、Cas12等蛋白的氨基酸序列。使用Prodigal对NCBI和JGI数据库的微生物基因组和宏基因组数据进行基因注释得到所有蛋白。利用所有氨基酸序列建立本地Blast数据库,利用Gene Edit软件本地Blast功能,检索极端微生物中所有的Cas蛋白以及与Cas9功能有关的结构域。
2、蛋白质比对:
使用BLASTP对CRISPR相关蛋白质家族的蛋白比对,获得去除CRISPR相关蛋白的非冗余大分子蛋白数据库,输出E value<1e-10的比对结果。如果一个非CRISPR相关蛋白数据库发现的同源蛋白小于100%,那么则说明这个家族的蛋白在CRISPR区域是富集的,通过这种方法我们对CRISPR富集大分子蛋白质家族进行鉴定。
3、蛋白质的过滤:
通过序列一致性对所有注释蛋白去冗余,去除序列完全一致的蛋白,同时将长度大于800个氨基酸的蛋白划分为大分子蛋白。由于目前发现的所有第二类CRISPR/Cas系统的效应蛋白长度多数大于900个氨基酸,所以为了降低计算复杂度,我们在挖掘CRISPR效应蛋白的时候只对大分子蛋白进行考虑。
4、CasD基因及蛋白的获得:
对所获得Cas家族氨基酸序列,利用Mega X软件绘制系统进化树。获得与哺乳动物乳球菌(Mammaliicoccus fleurettii)、化脓链球菌Cas9蛋白关系较近的极端微生物的Cas蛋白。进一步利用TAIL-PCR方法,根据推测的序列获得CasD基因5’端序列,以收集的极端环境(沙漠、土壤环境的)混合DNA为模板,经过2轮扩增以后最终获得CasD全长核苷酸序列。
5、CasD核酸序列优化:
考虑到极端微生物基因与植物之间的进化关系比较远,核酸的密码子偏好性有较大的差异,我们根据单子叶、双子叶共有的密码子偏好性对极端微生物CasD基因的核酸序列进行密码子优化,最终优化后得到的CasD核酸序列如SEQ ID No.2所示,CasD蛋白的氨基酸序列如SEQ ID No.1所示,克隆后连接于PUC19载体,转化Top10菌株保存。
实施例2:利用拟南芥原生质体鉴定CRISPR-CasD的所识别的PAM结构
1、实验方法
(1)CasD基因表达质粒的构建:
将CasD基因构建到CPB载体上,通过测序鉴定基因已经插入到多克隆位点之中。同时构建编辑GFP基因的CRISPR-CasD/GFP表达载体。构建好的载体可以通过gRNA引导作用,对GFP基因进行编辑,影响GFP基因的正常表达。
(2)PAM文库的构建:
人工合成4个随机碱基的序列,并通过PCR扩增在5’、3’端加上NcoI的接头。将随机碱基的片段分别引入到pCAMBIA1301-GFP载体中GFP靶序列位置前后,构建PAM打靶文库质粒。
(3)原生质体制备:
选取长势较好的3-4周龄的拟南芥幼苗,取0.1g左右的拟南芥叶片(约10~15叶片),用刀片去除叶片的尖端与基部,并将其切成0.5-1mm左右的小条,用平头镊子将切好的小条放入准备好的细胞壁消化液中并使其完全浸入。使用玻璃真空干燥器室温避光条件下抽真空30min,以使细胞壁消化液更好地进入细胞间隙。在室温条件下,酶消化3h。细胞壁消化液(0.4M甘露醇,1%cellulose RS,0.1% Macenzyme,5mM MES,0.1%果胶酶,0.15%BSA,8mM CaCl2)在缓慢旋转后变成绿色,表示已有原生质体释放。显微镜下观察和检查原生质体的释放情况,拟南芥原生质体大小约为30-50μM。
(4)遗传转化:
取适量5×Dilution Buffer(0.4M甘露醇,0.1% MgCl2,4mM MES),用水稀释至1×,用等体积的1×Dilution Buffer稀释原生质体,70μm细胞过滤器(FSTR070)或者75μm孔径的尼龙筛网(约200目)过滤去除未消化的叶片组织。收集滤液于50mL离心管,室温100g离心1-2min,尽量去除上清,用5mL 1×Dilution Buffer重新悬浮原生质体,室温静置30min。室温100g离心1-2min),加入约1.5-2.5mL或更小体积的Resuspension Buffer,将原生质体以2×105/mL的密度或更高密度悬浮于重悬液中,即为原生质体悬液。制备好的原生质体可以在4℃或冰浴保存至少24h。待使用前,向制备好的原生质体中加入等体积的40% PEG,利用PEG转化方法将实验组(CRISPR-CasD/GFP、PAM的打靶文库质粒)以及对照组(CRISPR-CasD/GFP、pCAMBIA1301载体质粒)分别转化到拟南芥原生质体中。
(5)PCR扩增与测序:
原生质体文库过夜培养以后,利用流式细胞仪分离荧光减弱的细胞并提取DNA,并对PAM区域序列进行PCR扩增和测序。
2、实验结果
分别统计实验组(同时转化CRISPR-CasD/GFP、PAM打靶文库质粒)和对照组(同时转化CRISPR-CasD/GFP、pCAMBIA1301载体质粒)中组合的PAM序列出现次数,总共得到了2100条显著可以被CRISPR/CasD系统识别的PAM序列。对被切割GFP序列的PAM序列进行测序和Alignment比对分析,发现CRISPR-CasD/GFP系统只能对带有5’-TTA、5’-TAT、5’-TAC和5’-TTG的PAM靶标序列进行有效地编辑,说明CRISPR/CasD系统对5’-TW(A/T)N具有高编辑活性。
实施例3:CasD表达载体的构建
1、实验目的
以pCPB载体为基础构建带有通用接头的pCPB-GT载体,如图1所示为pCPB-CasD(CRISPR/CasD)基因编辑载体的结构示意图,其序列如SEQ No:3所示,其中gRNA为非固定序列。
OsCML18(基因号:Os05g0223000)所编码的蛋白是与Ca2+结合的类钙调素蛋白。CML18蛋白的功能主要是通过与受体蛋白结合负向调控植物的氮素利用效率、抗逆境水平以及根系发育。本发明以水稻CML18基因为目的基因,利用CRISPR/CasD定向编辑水稻CML18基因从而实现改善水稻的氮素利用效率以及增强抗逆性。
2、实验方法
(1)合成引物序列
CasD-attBF:5’-GGGGACAAGTTTGTACAAAAAAGCAGGCTTCATGAAAAACAG CTAC ATCCTGG-3’;
CasD-attBR:5’-GGGGACCACTTTGTACAAGAAAGCTGGGTCCAGCACGCCTCTT TT GAAGATCAG-3’。
(2)PCR扩增CasD基因
以合成的基因CasD-pUC19为模板,PCR扩增CasD基因。PCR扩增体系如下表所示。
将上述体系按照3步法进行反应,35个循环后,72℃延伸10min,反应程序如下:
对获得的PCR产物进行1%琼脂糖凝胶电泳,获得单一明亮的3200bp左右的条带,对该条带进行切胶回收,然后利用Axygen DNA胶回收试剂盒离心回收PCR产物。
(3)CasD-pDONR质粒的构建
将纯化后的DNA分子pCasD-attB进行BP克隆反应连入中间载体pDONR,反应体系如下:CasD-attB:3μL,pDONR质粒:1μL,BP克隆酶:1μL。
在上述体系中25℃反应1小时后全部转化大肠杆菌DH5α。转化子在抗性平板上进行筛选,在37℃倒置平板培养14小时后,挑取单克隆进行摇菌在LB+博来霉素25mg/L的培养基中进行培养4-6h。然后对培养物进行PCR检测。PCR表现为阳性的克隆进行测序验证。
(4)pCPB-CasD质粒的构建
选择2个合适的靶位点。在目标基因编码区上游选取靶序列(PAM序列前20bp,PAM序列为TNN),合成靶序列的正义链和反义链并退火合成靶序列dsDNA;
根据CasD识别的PAM序列,选择水稻CML18基因的特异序列作为gRNA靶点,其靶标核苷酸序列如下:
靶序列:5’-TGGAGCAGGTGTTCCGGCGG-3’
已测序验证的CasD-pDONR质粒进行LR克隆反应,连接入植物表达载体pCPB-CasD,反应体系如下表。
在上述反应体系中25℃反应1小时后全部转化大肠杆菌DH5α,37℃倒置平板培养14h后挑取单克隆进行培养。在液体LB(卡那霉素100mg/L)培养4-6h后PCR检测,阳性克隆进行测序验证。
(5)pCPB-CasD质粒转化农杆菌
已测序验证的pCPB-CasD质粒转化农杆菌GV3101。转化后的农杆菌平板在28℃倒置培养48h。挑单克隆摇菌在液体LB(卡那霉素100mg/L,庆大霉素50mg/L,利福平50mg/L)培养基中培养4-6h后进行PCR检测。
阳性克隆继续扩大培养,10μL菌液,10mL液体LB(卡那霉素100mg/L,庆大霉素50mg/L,利福平50mg/L)培养,28℃,220rpm培养过夜后,5000rpm离心菌体,10mM MgCl2重悬菌体,OD600约0.6-0.8,10mM MES,200μM AS,黑暗诱导3小时,用于遗传转化。
实施例4:CasD表达载体的遗传转化
1、培养基
本实验所用的培养基如下(具体成分见下表):
(1)诱导培养基(MS2):MS0+2,4-D 2ppm(mg/l);
(2)共培养基(MSCO):MS2+AS 100μmol(液体培养基不加phytagel);
(3)选择培养基(S1):MS2+Kan(卡那霉素)75ppm+Cef(头孢霉素)250ppm;
(4)选择培养基(S2):MS2+Kan(卡那霉素)75ppm 50ppm+Cef(头孢霉素)250ppm;
(5)预分化培养基:MS0+KT 2ppm+NAA 0.2ppm+6-BA 2ppm+Kan(卡那霉素)75ppm+phytagel 5g/L+麦芽糖30g/L;
(6)分化培养基:MS0+KT 2ppm+NAA 0.2ppm+6-BA 2ppm+Kan(卡那霉素)75ppm+phytagel 5g/L+麦芽糖30g/l;
(7)生根培养基:1/2MS0+Kan(卡那霉素)75ppm+NAA 0.5ppm+phytagel 2.5g/l+蔗糖20g/l。
表4-1水稻遗传转化MS0培养基组分以及配方
配制基本培养基MS0作为后续培养基的基础使用,后续培养基在基础培养基的基础添加不同的化合物和抗生素。在121℃条件下,培养基灭菌20分钟。如果添加麦芽糖的要求的培养基,灭菌温度在115℃保持15分钟。
2、实验方法
(1)外植体消毒:
在无菌器皿中,水稻品种日本晴成熟胚或幼胚经过以下洗涤:75%酒精浸1-2min—无菌水洗2次—25%的次氯酸钠浸30min(期间要摇动几次,或放在摇床上摇动)—无菌水洗4-5次—将种子移到无菌滤纸上,吸干水分接到MS2上,每皿25粒、27℃暗培养。
(2)继代:
将水稻长出的黄色愈伤转到新鲜的MS2上继续培养,以后每2周继代一次。经2次继代后即可选择嫩黄、颗粒状的胚性愈伤准备与农杆菌进行共培养。
(3)农杆菌的活化:
取用甘油保存于-80℃的农杆菌(实施例3中得到的pCPB-CasD质粒转化的农杆菌)50-100μl于2mL的LB液体培养基中(酵母粉:5g;蛋白胨:10g;NaCl:10g;琼脂:7g;Ph=7.0;总体积1L。需要高压灭菌),并加入相应的抗生素(例如:利福平,20-50ppm;链霉素,50-100ppm;卡那霉素,50ppm;壮观霉素,50-100ppm;氯霉素,20-50ppm),在摇床上以250rpm转速左右,27℃摇菌24-36h至OD600=0.5。再取新摇菌100-200μL于30mL的LB液体培养基中,并加入相应的抗生素(浓度、条件同上),经过12小时左右生长,菌液达到OD600=0.5时,即可以用来转化。
(4)共培养:
菌液在无菌的50mL的离心管中5000rpm,离心5min,去上清,再用30mL的共培养液体培养基重悬。将预先挑好的愈伤浸在菌液中20-30min后,再用无菌滤纸或吸水纸洗去多余的菌液(无须进一步吸干),置于共培养液体培养基(MSCO)固体培养基(可覆盖一层无菌滤纸)上,27℃条件下暗培养3d。
(5)愈伤选择:
共培养的愈伤先用无菌水冲洗3次,再浸于含头孢霉素的MSCO液体培养基中20-30分钟,将愈伤组织用无菌滤纸或吸水纸洗干后,接种于选择培养基S1上,培养3周。挑选新长出的愈伤接种于选择培养基S2上,培养3周。
(6)分化与生根:
将经过2次选择得到的抗性愈伤接种到预分化培养基上,然后进行暗培养10天左右,再转到分化培养基上进行光照培养。约1-2个月,将2cm左右高的幼苗转到生根培养基上。当苗长至10cm高时,先要少量透气,并在培养基上加水,防止杂菌生长。待苗适应后,完全置于空气中。当可移栽于温室中时,先要洗净根部的培养基,再移入土中。实施例5:CasD在水稻中的基因编辑效果分析
1、PCR鉴定
筛选实施例4中正常生长的幼苗,提取单株扩增植株中的CasD基因。以DNA或菌液为模板,利用2×HieffTMPCR Master Mix酶进行扩增,PCR反应体系如下。
将上述体系按照3步法进行反应,35个循环后,72℃延伸10min,4℃终止反应,反应程序如下:
利用1%琼脂糖凝胶电泳成像拍照。
经过PCR检测,共获得阳性植株85株。编号#3、#8、#12、#14、#19、#21、#24的7株基因编辑阳性植株的琼脂糖凝胶电泳图(图2)。
2、25株阳性植株的测序分析
在上述阳性植株的基础上筛选25株基因编辑植株进行测序分析,PAM序列(TNN)前20bp设置为检测序列(实施例3中的靶序列),与靶序列(5’-TGGAGCAGGTGTTCCGGCGG-3’)进行比对,经过显示靶标基因发生编辑的植株为24株,基因编辑效率为96%。
为了显示基因编辑效果,对其中14号基因编辑植株、24号基因编辑植株靶标基因进行进一步比较。如图3所示,与靶序列进行比对,14号基因编辑植株发生了碱基缺失突变,缺失了碱基G,而24号基因编辑植株发生了碱基增加情况,增加了一个A碱基。
3、基因功能缺失分析
为了检测水稻CML18基因被编辑后是否影响水稻对NO3 -的吸收,利用15N同位素标记法测定一定时间内水稻根部吸收的NO3 -的量。将在无NO3 -培养基中生长的水稻植株和对照植株用CaSO4进行清洗,然后转移到含有0.2mM K15NO3(15N:99%)的培养基中培养5min;
在0.1mM CaSO4中再次冲洗植株根系1min,然后收集根,在80℃烘箱中干燥4天后,称重。使用超高效液相色谱-三重四极杆质谱仪(UPLC-3Q-MS,Sciex Quadrupole 5500)对样品进行15N含量分析。根据根的全N和15N含量计算15NO3 -的吸收量。
结果如图4所示,与野生型相比,cml18突变体植株14和24对NO3 -的吸收能力显著上调。由于有碱基的增加与缺失造成移码突变,基因编辑植株的碱基序列发生了复杂的变异,可能导致CML18完全丧失其功能,进而导致植株对NO3 -的吸收能力发生显著提高。以上结果表明CML18可能负调控水稻对NO3 -的吸收。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (13)
1.CasD蛋白,其特征在于,所述CasD蛋白的氨基酸序列如SEQ ID NO:1所示。
2.一种融合蛋白,其特征在于,所述融合蛋白包含权利要求1所述的CasD蛋白和修饰部分,所述修饰部分直接连接于CasD蛋白的N端或C端;
所述修饰部分选自蛋白标签和/或报告基因;
所述蛋白标签选自His、FLAG、Myc或MBP;
所述报告基因选自GST、GFP、CFP或YFP;
所述融合蛋白由如SEQ ID NO:4所示的核酸编码。
3.一种复合物,其特征在于,所述复合物包含:(i)蛋白组分,选自权利要求1所述的CasD蛋白或权利要求2所述的融合蛋白中的任意一种,和(ii)核酸组分,所述蛋白组分与所述核酸组分相互结合形成复合物;所述核酸组分为gRNA,所述gRNA具有20-70个核苷酸。
4.一种表达载体,其特征在于,所述载体包含权利要求2所述的融合蛋白的编码核酸。
5.根据权利要求4所述的表达载体,其特征在于,所述表达载体的核苷酸序列如SEQ IDNO:3所示。
6.一种宿主细胞,其特征在于,所述宿主细胞中包括权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白或权利要求4所述的表达载体中的任意一种;
所述宿主细胞是原核细胞或真核细胞;
所述原核细胞是农杆菌;
所述真核细胞是酵母细胞或植物细胞;
所述植物细胞是水稻细胞、拟南芥细胞或烟草细胞。
7.一种组合物,其特征在于,所述组合物包含:(i)第一组分,选自权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、编码权利要求1所述CasD蛋白的核酸或编码权利要求2所述的融合蛋白的核酸中的任意一种;和(ii)第二组分,包含gRNA;
所述组合物不包含tracrRNA。
8.一种CRISPR/CasD基因编辑系统,其特征在于,所述基因编辑系统包含以下任意一种:权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、表达权利要求1所述的CasD蛋白的质粒、表达权利要求2所述的融合蛋白的质粒;
所述基因编辑系统还包含gRNA或表达所述gRNA的质粒。
9.一种编辑植物基因的方法,其特征在于,所述方法包括:
(1)根据权利要求1所述的CasD蛋白的PAM识别位点确定待编辑基因的gRNA;
(2)将权利要求1所述的CasD蛋白的编码基因和步骤(1)所述的gRNA克隆到表达载体中;
(3)将所述表达载体转化到农杆菌中,通过农杆菌介导的遗传转化方法,将所述表达载体导入目标植物,获得定向基因编辑植株。
10.根据权利要求9所述的方法,其特征在于,所述植物为单子叶植物或双子叶植物。
11.根据权利要求10所述的方法,其特征在于,所述植物选自玉米、高粱、小麦,水稻、木薯、大豆、棉花、拟南芥、烟草的任一种。
12.根据权利要求11所述的方法,其特征在于,所述植物为水稻。
13.一种应用,其特征在于,所述应用包括以下任一项:
1)权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、权利要求3所述的复合物、权利要求4所述的表达载体、权利要求6所述的宿主细胞、或权利要求7所述的组合物在植物基因编辑中的应用;
2)权利要求1所述的CasD蛋白、权利要求2所述的融合蛋白、权利要求4所述的表达载体、权利要求6所述的宿主细胞、或权利要求7所述的组合物在改变植物生物学特性中的应用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211201756 | 2022-09-29 | ||
CN2022112017563 | 2022-09-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116286742A CN116286742A (zh) | 2023-06-23 |
CN116286742B true CN116286742B (zh) | 2023-11-17 |
Family
ID=86820192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310237362.1A Active CN116286742B (zh) | 2022-09-29 | 2023-03-13 | CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116286742B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117327742B (zh) * | 2023-10-12 | 2024-06-28 | 深圳大学 | 一种促进衣藻叶绿体基因组高效替换与同质化的技术方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020098793A1 (zh) * | 2018-11-15 | 2020-05-22 | 中国农业大学 | CRISPR-Cas12a酶和系统 |
CN112105728A (zh) * | 2018-05-07 | 2020-12-18 | 中国农业大学 | CRISPR/Cas效应蛋白及系统 |
CA3170123A1 (en) * | 2020-02-24 | 2021-09-02 | Pioneer Hi-Bred International, Inc. | Novel crispr-cas systems for genome editing |
CN113373130A (zh) * | 2021-05-31 | 2021-09-10 | 复旦大学 | Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用 |
CN113583999A (zh) * | 2021-07-06 | 2021-11-02 | 复旦大学 | Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用 |
WO2022166895A1 (zh) * | 2021-02-05 | 2022-08-11 | 山东舜丰生物科技有限公司 | Crispr酶和系统以及应用 |
-
2023
- 2023-03-13 CN CN202310237362.1A patent/CN116286742B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112105728A (zh) * | 2018-05-07 | 2020-12-18 | 中国农业大学 | CRISPR/Cas效应蛋白及系统 |
WO2020098793A1 (zh) * | 2018-11-15 | 2020-05-22 | 中国农业大学 | CRISPR-Cas12a酶和系统 |
CA3170123A1 (en) * | 2020-02-24 | 2021-09-02 | Pioneer Hi-Bred International, Inc. | Novel crispr-cas systems for genome editing |
WO2022166895A1 (zh) * | 2021-02-05 | 2022-08-11 | 山东舜丰生物科技有限公司 | Crispr酶和系统以及应用 |
CN113373130A (zh) * | 2021-05-31 | 2021-09-10 | 复旦大学 | Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用 |
CN113583999A (zh) * | 2021-07-06 | 2021-11-02 | 复旦大学 | Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用 |
Non-Patent Citations (2)
Title |
---|
Crystal structure of the RNA-guided immune surveillance Cascade complex in Escherichia coli;Hongtu Zhao等;Nature;第515卷(第7525期);第147-150页,参见全文 * |
StpA represses CRISPR-Cas immunity in H-NS deficient Escherichia coli;Damjan Mitić等;Biochimie;第174卷;第136-143页,参加全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116286742A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107027313B (zh) | 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物 | |
EP3601579B1 (en) | Expression modulating elements and use thereof | |
US12098374B2 (en) | Optimized plant CRISPR/CPF1 systems | |
CA2891956A1 (en) | Tal-mediated transfer dna insertion | |
US20200407738A1 (en) | Targeted endonuclease activity of the rna-guided endonuclease casx in eukaryotes | |
EP3775223A1 (en) | Method for increasing the expression level of a nucleic acid molecule of interest in a cell | |
JP2021510069A (ja) | 遺伝子改変された植物体の再生 | |
WO2020260682A1 (en) | Enhanced plant regeneration and transformation by using grf1 booster gene | |
CN111116725B (zh) | 基因Os11g0682000及其编码的蛋白在调控水稻白叶枯病抗性中的应用 | |
CN116286742B (zh) | CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用 | |
CN112585274A (zh) | 用于在稻植物中改变成熟的组合物和方法 | |
CN106978438B (zh) | 提高同源重组效率的方法 | |
CN105585623A (zh) | 抗病转TaMYB-KW基因小麦的培育方法及相关生物材料与应用 | |
KR102516522B1 (ko) | 반수체 식물을 유도하는 pPLAⅡη 유전자 및 이의 용도 | |
CN114340656A (zh) | 使用huh内切核酸酶促进靶向基因组修饰的方法和组合物 | |
CA3190625A1 (en) | Increasing gene editing and site-directed integration events utilizing meiotic and germline promoters | |
CN112522299A (zh) | 一种利用OsTNC1基因突变获得分蘖增加的水稻的方法 | |
US20240167046A1 (en) | Inducible mosaicism | |
US20230392160A1 (en) | Compositions and methods for increasing genome editing efficiency | |
WO2024158857A2 (en) | Mb2cas12a variants with flexible pam spectrum | |
EP0288547A1 (en) | Plant transformation | |
CN118421710A (zh) | LDH-sgRNA生物偶联物介导的基因编辑方法及应用 | |
CN112105732A (zh) | 用于多核苷酸的靶向编辑的方法和组合物 | |
JP2002543782A (ja) | 新規なトウモロコシrad51様遺伝子およびその使用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |