CN115335392A - 植物避荫反应的抑制 - Google Patents
植物避荫反应的抑制 Download PDFInfo
- Publication number
- CN115335392A CN115335392A CN202180011481.4A CN202180011481A CN115335392A CN 115335392 A CN115335392 A CN 115335392A CN 202180011481 A CN202180011481 A CN 202180011481A CN 115335392 A CN115335392 A CN 115335392A
- Authority
- CN
- China
- Prior art keywords
- sequence
- seq
- amino acid
- plant
- polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8262—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Botany (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Cultivation Of Plants (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Fertilizers (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及用于修饰植物中的同源结构域‑亮氨酸拉链(HD‑Zip)转录因子以抑制植物中的避荫反应的组合物和方法。本发明还涉及使用本发明的方法和组合物产生的植物。
Description
关于序列表的电子提交的声明
根据37 C.F.R.§1.821提交的ASCII文本格式的序列列表,标题为1499.17.WO_ST25.txt,大小为465,868字节,于2021年1月28日生成,并通过EFS网站提交,以替代纸质副本。该序列表据此通过引用并入其公开内容的说明书。
优先权声明
本申请根据35 U.S.C.§119(e)要求2020年1月31日提交的美国临时申请第62/968,596号的权益,其全部内容通过引用并入本文。
技术领域
本发明涉及用于修饰同源结构域-亮氨酸拉链(HD-Zip)转录因子以抑制植物中避荫反应的组合物和方法。本发明还涉及使用本发明的方法和组合物产生的植物。
技术背景
避荫反应(SAR)是对可用光的质量或数量下降的反应(Kebrom和Brutnell,J ExpBot58:3079–3089(2007)),其中植物试图通过向资源(主要是光)生长来胜过邻近的植物。植物过度拥挤会导致其中植物缺乏活力并产量下降的避荫综合症(SAS)。避光涉及植物环境中红光与远红光的相对比例(Ballare等人Science,247:329-332(1990))。植物吸收大部分它们可利用的红光,但反射远红光,包括将这种光反射到附近的植物上。当植物在其环境中检测到持续的远红光时,其将经历形态学和生理学反应。这些反应包括分枝减少、植株高度增加、叶片面积减小、生长素重新分配、乙烯产生增加以及开花加速。SAS的特征是根冠比增加,株高增加,单株产量降低。在典型的单作作物环境中,通过避荫进行的植物间竞争被认为是一种浪费的生存机制。
发明内容
本发明的一个方面提供了在内源同源结构域-亮氨酸拉链(HD-Zip)转录因子中包含至少一个非天然突变的植物或其植物部分,其中该突变破坏了HD-Zip转录因子与DNA的结合。
本发明的另一方面提供了包含编辑系统的植物细胞,所述编辑系统包含:(a)CRISPR相关效应蛋白;和(b)具有与编码HD-Zip转录因子的内源靶基因互补的间隔子序列的引导核酸(gRNA、gDNA、crRNA、crDNA)。
本发明的另一方面提供了植物细胞,其包含在HD-Zip转录因子基因的DNA结合位点内的非天然突变,该突变防止或减少HD-Zip转录因子与DNA的结合,其中该突变是使用编辑系统引入的取代、插入和/或缺失,该编辑系统包含与HD-Zip转录因子基因中的靶位点结合的核酸结合结构域,其中HD-Zip转录因子基因编码:(a)包含与SEQ ID NO:38或SEQ IDNO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与以下氨基酸序列具有至少80%序列同一性的序列的多肽:RKKLRLSKDQSAVLEDSFREHPTLNPRQKAALAQQLGLRPRQVEVWFQNRRARTKLKQTEVDCEYLKRCCETLTEENRRLQKEVQELRALKLVSPHLYMHMSPPTTLTMCPSCERV(SEQID NO:1)(玉蜀黍HB53)或RKKLRLSKDQAAVLEESFKEHNTLNPKQKAALAKQLNLKPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTEENRRLQREVAELRVLKLVAPHHYARMPPPTTLTMCPSCERL(SEQ ID NO:2)(玉蜀黍HB78);(c)包含与氨基酸序列LAKQLNLKPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTEENRRLQREV(SEQ ID NO:3)具有至少80%序列同一性的序列的多肽;(d)包含与核苷酸序列RQVEVWFQNRRARTKLKQTEVDCE(SEQ ID No:4)具有至少95%序列同一性的序列的多肽;(e)包含具有氨基酸序列RQVEVWFQNRRARTKXKQTEVDCE(SEQ ID NO:5)的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列KKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,以及X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,以及X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,以及X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有VWFQNRRA(SEQ ID NO:9)所示氨基酸序列的序列的多肽。
本发明的另一方面提供了在内源HD-Zip转录因子中包含突变(例如,至少一个突变)的植物或其部分,该突变降低了内源HD-Zip转录因子对DNA的结合,其中内源HD-Zip转录因子包含多肽,所述多肽包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列;其中所述突变是SEQ ID NO:1或SEQ ID NO:2的氨基酸序列的氨基酸残基45-52(VWFQNRRA(SEQ ID NO:9))的至少一个氨基酸残基的缺失、取代和/或插入,任选地其中所述突变是非天然突变。
本发明的另一方面提供了包含HD-Zip转录因子基因的植物或其部分,所述基因编码SEQ ID NO:201的氨基酸序列。
本发明的另一方面提供了包含HD-Zip转录因子基因的玉米植物,所述基因包含SEQ ID NO:201的氨基酸序列。
本发明的另一方面提供了包含HD-Zip转录因子基因的植物或其部分,所述基因包含SEQ ID NO:202的核苷酸序列。
本发明的另一方面提供了包含HD-Zip转录因子基因的玉米植物,所述基因包含SEQ ID NO:202的核苷酸序列。
本发明还提供了生产/培育无转基因的基因组编辑的植物的方法,其包括:(a)将本发明的植物与无转基因的植物杂交,从而将本发明植物中存在的突变引入无转基因的植物中;以及(b)选择包含突变但无转基因的子代植物,从而产生无转基因的基因组编辑的植物。
本发明的另一方面提供了编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中内源HD-Zip转录因子基因内的靶位点,所述内源HD-Zip转录因子基因编码:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID NO:2具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而在植物细胞的内源HD-Zip转录因子基因中产生编辑。
本发明的另一方面提供了制造植物的方法,其包括:(a)将包含编码HD-Zip转录因子的野生型内源基因的植物细胞群与靶向该野生型内源基因的核酸酶接触,其中该核酸酶与DNA结合结构域连接,所述结合结构域与编码以下序列的核酸序列结合:(i)包含与SEQID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(ii)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(iii)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(iv)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(v)包含具有SEQ IDNO:5所示氨基酸序列的序列的多肽,其中X是L或S;(vi)多肽,其包含:(1)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(2)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(3)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(4)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(vii)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽;(b)从所述群体中选择包含编码HD-Zip转录因子的野生型内源基因的突变的植物细胞,其中所述突变是(i)-(v)中任一项的多肽中至少一个氨基酸残基的取代和/或缺失,其中所述突变降低或消除了HD-Zip转录因子结合DNA的能力;以及(c)使选择的植物细胞生长成植物。
在一些方面,本发明提供了用于减少植物中的避荫反应的方法,其包括(a)将包含编码HD-Zip转录因子的野生型内源基因的植物细胞与靶向野生型内源基因的核酸酶接触,其中核酸酶与结合野生型内源基因中的靶位点的DNA结合结构域连接,所述野生型内源基因编码:(i)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(ii)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(iii)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(iv)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(v)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(vi)多肽,其包含:(1)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(2)具有PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)所示氨基酸序列的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(3)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(4)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(vii)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生包含编码HD-Zip转录因子的野生型内源基因的突变的植物细胞;以及(b)使植物细胞生长成植物,从而减少避荫反应。
另一方面,提供了用于产生包含至少一个具有突变的内源HD-Zip转录因子基因的细胞的植物或其部分的方法,所述方法包括将所述植物或植物部分中HD-Zip转录因子基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中DNA结合结构域与HD-Zip转录因子基因中的靶位点结合,其中HD-Zip转录因子基因编码:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID No:2具有至少80%序列同一性的序列的多肽;(c)包含与SEQID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID No:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生包含至少一个在内源HD-Zip转录因子基因中具有突变的细胞的植物或其部分。
在又一方面,提供了产生包含具有降低的DNA结合的突变型内源HD-Zip转录因子的植物或其部分的方法,所述方法包括将植物或植物部分中的内源HD-Zip转录因子基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中DNA结合结构域与HD-Zip转录因子基因中的靶位点结合,其中HD-Zip转录因子基因编码:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID NO:2具有至少80%序列同一性的序列的多肽;(c)包含与SEQ IDNO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ IDNO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生具有DNA结合减少的突变内源HD-Zip转录因子的植物或其部分。
本发明的另外方面提供了与HD-Zip转录因子基因中靶位点结合的引导核酸,该靶位点包含编码以下序列的核苷酸序列:(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ IDNO:9)的序列;和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
本发明的另外方面提供了系统,其包含本发明的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白。
本发明的另一方面提供了基因编辑系统,其包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中引导核酸包含与HD-Zip转录因子基因结合的间隔子序列。
本发明的另一方面提供了包含CRISPR-Cas效应蛋白的复合物,所述CRISPR-Cas效应蛋白包含切割结构域和引导核酸,其中所述引导核酸与HD-Zip转录因子基因中的靶位点结合,所述基因编码(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,其中切割结构域切割HD-Zip转录因子基因中的靶链。
本发明的另外方面提供了编码具有突变的DNA结合位点的HD-Zip转录因子的核酸,其中突变的DNA结合位点包含破坏DNA结合的突变。
还提供了在其基因组中包含一种或多种突变的HD-Zip转录因子的植物以及用于制备本发明植物的多肽、多核苷酸、核酸构建体、表达盒和载体,所述转录因子与通过本发明方法产生的DNA结合的能力降低。
在下面的发明描述中更详细地阐述本发明的这些和其他方面将。
序列的简要描述
SEQ ID NO:1显示了玉蜀黍HB 53转录因子的一部分(SEQ ID NO:38的氨基酸残基173-288)。
SEQ ID NO:2显示了玉蜀黍HB 78转录因子的一部分(SEQ ID NO:83的氨基酸残基76-191)。
SEQ ID NO:3-9是HD-zip转录因子的部分序列。
SEQ ID NO:10-54是来自多种不同植物物种的HB53转录因子的实例。
SEQ ID NO:55-98和303是来自多种不同植物物种的HB78转录因子的实例。
SEQ ID NO:99-134是来自多种不同植物物种的HB53转录因子的cDNA序列。
SEQ ID NO:135-174是来自多种不同植物物种的HB78转录因子的cDNA序列。
SEQ ID NO:175-182显示了用于引导核酸靶向HB78和HB53转录因子的示例性间隔子序列。
SEQ ID NO:183-194是可用于本发明的示例性胞嘧啶脱氨酶氨基酸序列。
SEQ ID NO:195是可用于本发明的示例性尿嘧啶-DNA糖基化酶抑制剂(UGI)。
SEQ ID NO:196-197是编码启动子和内含子的示例性调控序列。
SEQ ID NO:198-200提供了V型CRISPR-Cas12a核酸酶的前间隔子相邻基序位置的实例。
SEQ ID NO:201提供了使用本发明的方法和组合物产生的示例性HB78突变氨基酸序列。
SEQ ID NO:202提供了使用本发明的方法和组合物产生的示例性HB78突变核苷酸序列。SEQ ID NO:202编码SEQ ID NO:201的氨基酸序列。
SEQ ID NO:203-246和302是图1A-1B中比对中所示的不同植物物种的HB78氨基酸序列的部分。
SEQ ID No:247-291是图2A-2D中比对中所示的不同植物物种的HB53氨基酸序列的部分。
SEQ ID NO:292-294是图6所示的HB53序列。
SEQ ID NO:295-297是图8所示的HB78序列。
SEQ ID NO:298-301是图9所示的HB78序列。
SEQ ID NO:304和SEQ ID NO:305分别提供了来自玉蜀黍的野生型HB78基因组序列和cDNA(对应于SEQ ID NO:83的WT HB78氨基酸序列和SEQ ID NO:171的WT HB78编码序列)。
SEQ ID NO:306-309分别提供了具有17个碱基对缺失的编辑的HB78的蛋白质序列、基因组序列、编码序列和cDNA。
SEQ ID NO:310和SEQ ID NO:311分别提供了来自玉蜀黍的野生型HB53基因组序列和cDNA(对应于SEQ ID NO:38的WT HB53氨基酸序列和SEQ ID NO:132的WT HB53编码序列)。
SEQ ID NO:312-315分别提供了具有11个碱基对缺失的编辑的HB53的蛋白质序列、基因组序列、编码序列和cDNA。
SEQ ID NO:316-319分别提供了具有8个碱基对缺失的编辑的HB53的蛋白质序列、基因组序列、编码序列和cDNA。
SEQ ID No:320-329是图10-图12中所示的序列。
附图说明
图1提供了来自44种不同植物物种的HD-Zip(HB78)氨基酸序列的比对。所述序列是来自全长HB78序列的连续氨基酸(53个氨基酸残基)的一部分。
图2提供了来自45种不同植物物种的HD-Zip(HB53)氨基酸序列的比对。所述序列是来自全长HB53序列的连续氨基酸残基的一部分(例如,约116个氨基酸残基)。
图3提供了说明玉米种植密度与产量之间关系的实例。增加种植密度会增加植物产量,直至出现拐点(箭头-最佳经济播种率)。遮荫减弱的变体在较高的种植密度下会有拐点。
图4提供了说明显性失活策略(dominant negative strategy)的实例。通过去除双功能蛋白的DNA结合能力,二聚化复合物将不会激活基因表达。
图5显示了HDLZ II类蛋白之间的关系。
图6提供了玉蜀黍中HB53的DNA结合结构域的编辑的实例,并在方框中显示了用于修饰的目标示例性氨基酸残基。显示了编码SEQ ID NO:292)链和非编码链(SEQ ID NO:293)以及HB53氨基酸序列(SEQ ID NO:294)。
图7提供了具有示例性引导核酸的注释的HB78基因。
图8提供了HB78基因(SEQ ID No:295)中缺失的实例,显示了例如外显子2中的缺失(SEQ ID No:297)导致删除外显子3、外显子4和DNA结合结构域的截短。还显示了缺失位点处的蛋白质序列(SEQ ID NO:296)。
图9提供了编辑的植物的代表性基因组序列(编码链(SEQ ID NO:298)和非编码链(SEQ ID NO:299)),显示了HB78 DNA结合结构域上游的提前终止。显示了由该提前终止产生的蛋白质序列(SEQ ID NO:300和SEQ ID NO:301)。
图10提供了显示引导PWsp227以及在玉蜀黍HB53中得到的编辑(共有序列SEQ IDNO:320;玉蜀黍SEQ ID NO:321;CE28392、CE28403、CE28409、CE28382、CE28390 SEQ ID NO:322;CE28492、CE28505、CE28514、CE28517、CE28522、CE28534、CE28544、CE28547SEQ ID NO:320);CE28456、CE28477、CE28483 SEQ ID NO:323)的位置的比对。
图11提供了显示引导PWsp227和PWsp225以及在玉蜀黍HB53中得到的编辑(共有(共有序列SEQ ID NO:324;玉蜀黍SEQ ID NO:325;CE28330…8D SEQ ID NO:326;CE28350…11D SEQ ID NO:327)的位置的比对。
图12提供了显示引导PWsp230和PWsp232以及在玉蜀黍HB78中得到的编辑(共有序列SEQ ID NO:328;Z.maysSEQ ID NO:329;CE28330 SEQ ID NO:328;CE28350 SEQ ID No:328)的位置的比对。
图13提供了靶向HB53(上图)和HB78(下图)的实例。质粒pWISE443和pWISE444经显示了具有相应的间隔子。质粒pWISE445含有对于HB53所示的所有4个间隔子。质粒pWISE446和pWISE447经显示具有相应的间隔子。质粒pWISE448包含对于HB78显示的所有4个间隔子。质粒pWISE451包含所有8个间隔子(4个用于HB53,4个用于HB78,如图13所示)。
图14提供了HB53敲除和HB53/HB78敲除的示例性E2避荫测定的结果,其显示当在荫蔽中生长时,在编辑的品系中没有茎伸长。
图15提供了异型分析(off-type analysis),没有显示编辑的植物中形态学异型或发育延迟的任何证据。
具体实施方式
现在将在下文中参考附图和示例来描述本发明,在所述附图和示例中示出了本发明的实施方案。该描述并不旨在成为其中可实施本发明的所有不同方式或者可以添加到本发明中的所有特征的详细目录。例如,关于一个实施方案说明的特征可被并入其他实施方案,并且关于特定实施方案说明的特征可以从该实施方案中删除。因此,本发明设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。另外,对于本领域技术人员来说,根据本公开内容,对本文提出的各种实施方案的许多变化和添加将是显而易见的,所述变化和添加不偏离本发明。因此,以下描述旨在说明本发明的一些特定实施方案,而不是详尽地说明其所有排列、组合和变化。
除非另有定义,否则本文使用的所有技术和科学术语都具有与本发明所属领域的普通技术人员通常理解的相同的含义。在本发明的描述中使用的术语仅仅是为了描述特定的实施方案,而不是为了限制本发明。
本文引用的所有公布、专利申请、专利和其他参考文献通过引用以其整体并入,以用于与其中呈现该引用的句子和/或段落相关的教导。
除非上下文中另有说明,否则本文描述的本发明的各种特征可以以任意组合使用。此外,本发明还设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。为了说明,如果说明书陈述了组合物包含组分A、B和C,则特别意图是A、B或C中的任一个或其组合可以被省略,并且单独地或以任意组合的形式被放弃。
如在本发明的描述和所附权利要求中所使用的,除非上下文清楚地另外指出,否则单数形式“一个/种(a)”、“一个/种(an)”和“该(the)”也旨在包括复数形式。
此外,如本文中所用,“和/或”是指并包含一个或多个相关列出项的任何和所有可能的组合,以及当以替代(“或”)解释时不存在组合。
如本文中所用,术语“约”,当指可测量的值诸如量或浓度等时,意味着包括指定值的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化以及指定值。例如,“约X”(其中X是可测量的值)意味着包括X以及X的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。本文提供的可测量值的范围可以包括任何其它范围和/或其中的单个值。
如本文中所用,诸如“在X与Y之间”和“在约X与Y之间”等短语应该解释为包括X和Y。如本文中所用,诸如“在约X与Y之间”的短语意指“在约X与约Y之间”,而诸如“从约X到Y”的短语意指“从约X至约Y”。
除非本文中另有说明,否则本文中数值范围的叙述仅旨在用作单独提及落入该范围内的每个单独数值的速记方法,并且每个单独数值都被并入说明书中,如同其在本文中被单独叙述一样。例如,如果公开了范围10至15,那么也公开了11、12、13和14。
如本文中所用,术语“包含(comprise)”、“包含(comprises)”和“包含(comprising)”指定所述特征、整数、步骤、操作、元件和/或组件的存在,但是不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。
如本文中所用,过渡短语“基本上由......组成”意指权利要求的范围应被解释为包括权利要求中所述的特定材料或步骤,以及那些不会实质上影响所要求保护的发明的一个或多个基本和新颖特征的材料或步骤。因此,当在本发明的权利要求中使用时,术语“基本上由.......组成”不旨在解释为等同于“包含”。
如本文中所用,术语“增加(increase)”、“增加(increasing)”、“增加(increased)”、“增强(enhance)”、“增强(enhanced)”、“增强(enhancing)”和“增强(enhancement)”(及其语法变型)描述与对照相比,至少约15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。
如本文中所用,术语“降低(reduce)”、“降低(reduced)”、“降低(reducing)”、“降低(reduction)”、“减小(diminish)”和“减少(decrease)”(及其语法变型)描述例如与对照相比,减少至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%。在特定的实施方案中,所述减少可导致没有或基本上没有(即,可忽略的量,例如,小于约10%或甚至5%)可检测的活性或量。
如本文中所用,关于核酸分子和/或核苷酸序列(例如,RNA或DNA)的术语“表达(express)”、“表达(expresses)”、“表达(expressed)”或“表达(expression)”等表示核酸分子和/或核苷酸序列被转录,以及任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达目标多肽,或者例如功能性非翻译RNA。
“异源的”或“重组的”核苷酸序列是不与其所被引入的宿主细胞天然相关联的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。
“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在或内源的核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于参考生物体中的mRNA或是参考生物体的内源mRNA。
如本文中所用,术语“杂合的”是指其中不同的等位基因位于同源染色体上的相应基因座的遗传状态。
如本文中所用,术语“纯合的”是指其中相同的等位基因位于同源染色体上的相应基因座的遗传状态。
如本文中所用,术语“等位基因”是指在特定基因座处出现的两种或更多种不同核苷酸或核苷酸序列之一。
“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方案中,基因座可包含一个或多个核苷酸。
如本文中所用,术语“所需等位基因”、“靶等位基因”和/或“目标等位基因”可以互换使用,是指与所需性状相关联的等位基因。在一些实施方案中,根据所需表型的性质,所需等位基因可以与给定性状的或给定性状中的增加或减少(相对于对照)相关联。在本发明的一些实施方案中,短语“所需等位基因”、“靶等位基因”或“目标等位基因”是指相对于不具有一个或多个靶等位基因的对照植物,在非水胁迫条件下与植物产量增加相关联的一个或多个等位基因。
当性状与标记连锁时,并且当该标记的存在是包含该标记的植物/种质中所需性状或性状形式是否会出现和/或出现到何种程度的指标时,所述标记与所述性状“相关联”。类似地,当标记与等位基因或染色体间隔连锁时,并且当所述标记的存在是等位基因或染色体间隔是否存在于包含所述标记的植物/种质中的指标时,所述标记与所述等位基因或染色体间隔“相关联”。
如本文中所用,术语“回交(backcross)”和“回交(backcrossing)”是指子代植物与其亲本之一回交一次或多次(例如,1次、2次、3次、4次、5次、6次、7次、8次等)的过程。在回交方案中,“供体”亲本是指具有待渗入的所需基因或基因座的亲本植物。“供体”亲本是指具有待渐渗入的所需基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座渐渗入其中的亲本植物。例如,参见Ragot,M.等人Marker-assisted Backcrossing:A Practical Example,inTechniques etUtilisations des Marqueurs Moleculaires Les Colloques,第72卷,第45-56页(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding,inProceedingsof the Symposium"Analysis of Molecular Marker Data,”第41-43页(1994)。最初的杂交产生了F1代。术语“BC1”是指循环亲代的第二次使用,“BC2”是指循环亲代的第三次使用,依此类推。
如本文中所用,术语“杂交(cross)”或“杂交(crossed)”是指配子通过授粉融合产生后代(例如细胞、种子或植物)。该术语包括有性杂交(一株植物对另一株植物的授粉)和自交(自花授粉,例如当花粉和胚珠来自同一株植物时)。术语“杂交”是指通过授粉融合配子产生后代的行为。
如本文中所用,术语“渐渗(introgression)”、“渐渗(introgressing)”和“渐渗(introgressed)”是指一个或多个基因座的所需等位基因或所需等位基因的组合从一个遗传背景到另一个遗传背景的自然和人工传递。例如,特定基因座的所需等位基因可以通过同一物种的两个亲本间的有性杂交传递给至少一个后代,其中至少一个亲本在其基因组中具有所需等位基因。或者,例如,等位基因的传递可以例如在融合的原生质体中通过两个供体基因组之间的重组发生,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的后代可以与具有所需遗传背景的品系回交一次或多次(例如,1次、2次、3次、4次或更多次),选择所需等位基因,结果是所需等位基因变成固定在所需遗传背景中。例如,与非水胁迫条件下产量增加相关联的标记可从供体渐渗入不包含该标记且在非水胁迫条件下不显示产量增加的轮回亲本。然后可以将得到的后代回交一次或多次,并进行选择,直至后代具有与在轮回亲本背景下非水分胁迫条件下产量增加相关联的遗传标记。
“遗传图谱”是对给定物种中一条或多条染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格的形式描述。对于每个遗传图谱,基因座之间的距离通过它们之间的重组频率来测量。可以使用多种标记检测基因座之间的重组。遗传图谱是作图群体、所用标记类型和不同群体间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离可以因遗传图谱的不同而不同。
如本文中所用,术语“基因型”是指如与可观察和/或可检测和/或表现的性状(表型)形成对比的个体(或个体群体)在一个或多个基因座的遗传组成。基因型由个体从其亲本遗传的一个或多个已知基因座的一个或多个等位基因定义。术语基因型可用于指个体在单个基因座、多个基因座的遗传组成,或者更一般地,术语基因型可用于指个体基因组中所有基因的个体遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。
如本文中所用,术语“种质”指个体(例如,植物)、个体群(例如,植物品系、品种或家族)或源自品系、品种、物种或培养物的克隆的遗传物质,或来自其的遗传物质。种质可以是生物体或细胞的一部分,或者可以与生物体或细胞分离。一般来说,种质提供了具有特定遗传组成的遗传物质,所述遗传物质为生物体或细胞培养物的一些或全部遗传性质提供了基础。如本文中所用,种质包括可从其生长出新植物的细胞、种子或组织,以及可培养成完整植物的植物部分(例如,叶、茎、芽、根、花粉、细胞等)。
如本文中所用,术语“栽培品种”和“品种”是指一组相似的植物,它们通过结构或遗传特征和/或性能可以与同一物种内的其它品种相区别。
如本文中所用,术语“外来的”、“外来品系”和“外来种质”是指任何非优良的植物、品系或种质。一般来说,外来植物/种质不源自任何已知的优良植物或种质,而是被选择来将一种或多种所需遗传元件引入育种程序(例如,以将新颖等位基因引入育种程序)。
如本文中所用,植物育种上下文中的术语“杂种”是指通过不同品系或品种或物种的植物杂交(包括但不限于两个近交系之间的杂交)产生的遗传上相异的亲本的后代。
如本文中所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种,或者就特别感兴趣的基因组部分而言基本上纯合的植物或植物品种。
“单倍型”是个体在多个基因座的基因型,即等位基因的组合。通常,定义单倍型的遗传基因座是物理和遗传连锁的,即在同一染色体片段上。术语“单倍型”可以指特定基因座处的多态性,诸如单个标记基因座,或沿染色体区段的多个基因座处的多态性。
如本文中所用,术语“异源的”是指源自外来物种的核苷酸/多肽,或者,如果源自同一物种,则是通过有意的人为干预,在组成和/或基因组基因座上对其天然形式进行了实质性的修饰。
如本文中所用,“避荫反应”被定义为植物响应低红光∶远红光(R∶FR)比率的生长。对避荫的抑制是指对响应低R:FR光比率的生长变化的抑制。一方面,可以通过测量包含本发明性状(例如,如本文所述的HD-Zip的突变)的植物和不含该性状的同基因植物在低R∶FR光比率的受控环境中的高度来显示对避荫反应的抑制。当在R∶FR比为0.16的相同条件下生长时,包含本发明性状的植物将比不包含该性状的等基因植物矮(例如,在胚芽鞘、V1鞘或V2鞘处测量的高度)至少5%(例如,矮约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%或更多,或其中的任何范围或值;例如约矮5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%至约26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%或更多)(例如,矮约5%至约10%、矮5%至约15%、矮5%至约20%、矮5%至约25%、矮5%至约30%、矮5%至约40%、矮5%至约50%、矮10%至约20%、矮10%至约30%、矮10%至约50%、矮10%至约70%、矮15%至约20%、矮15%至约30%、矮15%至约50%、矮20%至约30%、矮20%至约50%、矮20%至约70%、矮40%至约50%、矮40%至约60%、矮40%至约80%、矮40%至约100%、矮50%至约70%、矮50%至约100%、矮50%至约125%、矮75%至约100%、矮75%至约120%、矮75%至约140%等)。
显示SAR的植物表现出下胚轴和节间的过度伸长、更长的叶子、受损的根生长、提早开花和降低的结实、低光合作用效率、增强的绿抽梢、高的倒伏率、加速的衰老、降低的籽粒灌浆;以及疾病的主动抑制和草食反应机制。
与不包含SAR的降低的植物相比,其中SAR如本文所述降低的植物可具有增加的产量。如本文中所用,“增加的产量”是指与生长相关联的任何植物性状,例如,生物量、产量、氮利用效率(NUE)、花序尺寸/重量、果实产量、果实质量、果实尺寸、种子尺寸、种子数量、叶组织重量、结瘤数、结瘤质量、结瘤活性、种子头数、分蘖数、花数、块茎数、块茎质量、球茎质量、种子数、总种子质量、出叶率、分蘖出苗率(rate of tiller emergence)、出苗率、根的长度、根的数量、根团的尺寸和/或重量,或其任意组合。因此,在一些方面,“增加的产量”可包括但不限于与对照植物或其部分(例如,不包含编码如本文所述的HD-Zip转录因子的突变内源核酸的植物,其在具有低R:FR光比率的环境(例如,遮蔽环境;例如,约0.16的R:FR比率)中生长,包括当与其它植物紧邻生长时)相比,增加的花序产生,增加的果实产生(例如,增加的果实的数量、重量和/或尺寸;例如,增加的例如玉米的穗的数量、重量和/或尺寸)、增加的果实品质、增加的根的数量、尺寸和/或重量、增加的分生组织尺寸、增加的种子尺寸、增加的生物量、增加的叶尺寸、增加的氮利用效率、增加的高度和/或增加的节间长度。在一些方面,增加的产量可以表示为单位土地面积上生产的谷物数量(例如,每英亩土地的蒲式耳数)。
“种子重量”由籽粒形态性状诸如种子长度、种子宽度和种子厚度以及籽粒灌浆共同决定,这些性状都受数量遗传学控制。
如本文中所用,“降低的高度”意指响应富集的远红光而抑制茎伸长。
如本文中所用,“降低的茎:根比率”是指地上生物量相对于地下生物量的比例降低。
如本文中所用,术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”指线性或分支的、单链或双链的RNA或DNA,或其杂交体。该术语还包括RNA/DNA杂交体。当合成产生dsRNA时,不太常见的碱基,诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如,含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已经显示出以高亲和力结合RNA,并且是基因表达的强效反义抑制剂。也可以进行其他修饰,诸如对磷酸二酯骨架或RNA的核糖基团中的2’-羟基的修饰。
如本文中所用,术语“核苷酸序列”是指核苷酸的杂聚物或这些核苷酸从核酸分子的5’末端至3'末端的序列,包括DNA或RNA分子,包括cDNA、DNA片段或部分、基因组DNA、合成的(例如,化学合成的)DNA、质粒DNA、mRNA和反义RNA,其中任一种都可以是单链或双链的。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用,是指核苷酸的杂多聚体。本文提供的核酸分子和/或核苷酸序列在本文中以从左至右的5’至3’方向呈现,并且使用美国测序规则37 CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中阐述的用于表示核苷酸特征的标准代码来表示。如本文中所用,“5’区”可以指多核苷酸的最靠近多核苷酸5’末端的区域。因此,例如,多核苷酸的5’区中的元件可以位于从位于多核苷酸的5’末端的第一个核苷酸至位于多核苷酸中间的核苷酸的任何位置。如本文中所用,“3’区”可以指多核苷酸的最靠近多核苷酸3’末端的区域。因此,例如,多核苷酸的3’区中的元件可以位于从位于多核苷酸的3’末端的第一个核苷酸至位于多核苷酸中间的核苷酸的任何位置。
如本文中关于核酸所使用的,术语“片段”或“部分”是指相对于参考核酸长度缩短(例如,缩短1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个核苷酸)的核酸,并且其包含与参考核酸的相应部分相同或几乎相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列、基本上由所述核苷酸序列组成和/或由所述核苷酸序列组成。如果合适,这种核酸片段可以包含在其为其组分的更大的多核苷酸中。例如,本发明的引导核酸的重复序列可以包含野生型CRISPR-Cas重复序列(例如,野生型CRISR-Cas重复序列;例如,来自例如Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等的CRISPR Cas系统的重复)的一部分。在一些实施方案中,核酸片段可以包含编码HD-Zip转录因子的核苷酸序列的约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、125个、150个、175个、200个、225个、250个、300个、350个、400个、450个、500个、550个、600个、660个、700个、750个、800个、850个、900个、950个、1000个、1050个、1100个、1150个、1200个、1250个、1300个、1350个、1400个、1450个、1500个、1550个、1600个、1650个、1700个、1750个、1800个、1850个、1900个、1950个、2000个或更多个连续核苷酸,基本由所述连续核苷酸组成或由所述连续核苷酸组成,所述HD-Zip转录因子的活性降低(例如,DNA结合的降低)可导致植物中避荫反应的降低。
在一些实施方案中,片段或部分可以是HD-Zip转录因子的片段或部分。在一些实施方案中,核酸的片段或部分可以是编码以下任一氨基酸序列的核酸片段或其部分:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID NO:2具有至少80%序列同一性的序列的多肽:(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ IDNO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID No:9)的序列的多肽,其中所述片段或部分包含编码上述(a)-(g)的多肽中的任一种的核酸的约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、130个、140个、150个、175个、200个、225个、250个、300个、350个或更多个连续核苷酸或其中的任何范围或值的连续核苷酸。在一些实施方案中,“部分”可以与从多肽中删除的氨基酸数量相关。因此,例如,HD-Zip转录因子的一部分的缺失可以包含编码包含SEQ ID NO:9(VWFQNRRA)的氨基酸序列的HD-Zip转录因子多肽的核苷酸序列的至少两个连续核苷酸(例如,2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个)的缺失。在一些实施方案中,缺失可包含HD-Zip转录因子的一部分,该部分包含外显子3和外显子4,其中外显子3编码HD-Zip DNA结合区。在一些实施方案中,缺失可包含HD-Zip转录因子的一部分,其中该部分包含外显子3和外显子4的全部,以及任选地,外显子2的一部分。在一些实施方案中,缺失可包含编码HD-Zip多肽的C-末端部分约最后96至125个连续氨基酸残基的HD-Zip多核苷酸的部分。
在一些实施方案中,“序列特异性DNA结合结构域”可与编码本文所述的HD-Zip转录因子的核苷酸序列的一个或多个片段或部分结合。
如本文关于多肽所使用的,术语“片段”或“部分”可指相对于参考多肽长度缩短的多肽,其包与参考多肽的相应部分相同或几乎相同(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列或基本上由所述氨基酸序列组成或由所述氨基酸序列组成。在适当的情况下,这种多肽片段可以包含在其为其构成部分的更大的多肽中。在一些实施方案中,多肽片段包含参考多肽的至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、125个、150个、175个、200个、225个、250个、300个、350个、400个或更多个连续氨基酸,基本上由所述连续氨基酸组成或由所述连续氨基酸组成。在一些实施方案中,多肽片段可包含HD-Zip转录因子的约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、125个、150个、175个、200个、225个、250个、300个、350个、400个、450个、500个、550个、600个、660个、700个或更多个连续氨基酸残基,基本上由所述连续氨基酸残基组成或由所述连续氨基酸残基组成,所述连续氨基酸残基是例如(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
在一些实施方案中,片段或部分可以是HD-Zip转录因子的片段或部分。在一些实施方案中,片段或部分可以是以下任一种的氨基酸序列的片段或部分:(a)包含与上述(a)至(g)的氨基酸序列具有至少80%序列同一性的序列的多肽,其中所述片段或部分包含(a)含有与上述(a)至(g)的氨基酸序列具有至少80%序列同一性的序列的多肽的约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、140个、150个、175个、200个、225个、250个、300个、350个或更多个连续氨基酸,或其中的任何范围或值的连续氨基酸。在一些实施方案中,“部分”可以与从多肽中删除的氨基酸数量相关。因此,例如,HD-Zip转录因子的删除的“部分”可包含本文所述的任何HD-Zip转录因子的SEQ ID NO:9的氨基酸序列(VWFQNRRA)的至少一个氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个、8个氨基酸残基),和/或至少两个氨基酸残基(例如,至少2个、3个、4个、5个、6个、7个、8个氨基酸残基)。在一些实施方案中,HD-Zip转录因子的一部分的缺失可包含SEQ ID NO:9的一部分连续氨基酸残基(例如,至少2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)。在一些实施方案中,缺失包括SEQ ID No:9的至少一部分连续氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个或8个连续氨基酸残基),其中缺失长度可以是HD-Zip转录因子的至少1个氨基酸残基至约120个氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个或更多个连续氨基酸残基长至HD-Zip转录因子的全长,以及其中的任何范围或值的连续氨基酸残基),并且其中至少1个删除的氨基酸残基来自HD-Zip转录因子的DNA结合区。在一些实施方案中,缺失可以是包括SEQ ID NO:9的至少一部分连续氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)的截短。在一些实施方案中,截短可以是C-末端截短,并且包含至少96个连续氨基酸残基的长度。在一些实施方案中,截短可以是C-末端截短,并且包含约96个氨基酸残基至约125个氨基酸残基(例如,HD-Zip转录因子的至少96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个或更多个连续氨基酸残基长至全长,以及其中的任何范围或值的连续氨基酸残基)的长度,并且其中至少1个被截短的氨基酸残基来自HD-Zip转录因子的DNA结合区。在一些实施方案中,缺失可以包括外显子3的缺失,其包含HD-Zip转录因子的DNA结合区(例如,HD-Zip转录因子的被删除的部分长度可以是约27个氨基酸残基)。在一些实施方案中,截断可以是外显子2(例如,外显子2的一部分)中的缺失的结果,所述缺失导致外显子2编码的氨基酸残基的一部分和缺失后的所有剩余氨基酸被截断,从而,例如,截断外显子3和外显子4编码的所有氨基酸。因此,在一些实施方案中,缺失可导致HD-Zip转录因子多肽的C-末端区域的截短,所述C-末端区域包括DNA结合区或至少一部分DNA结合区。
在一些实施方案中,缺失可引起移码突变,导致终止密码子和HD-Zip转录因子多肽的C末端的截短。在一些实施方案中,C-末端截短可导致包含207个氨基酸的多肽(例如,删除或截短的部分包括氨基酸残基207之后的所有氨基酸残基;参见,例如,玉米HD-Zip编辑的多肽SEQ ID NO:201)。
在一些实施方案中,“序列特异性DNA结合结构域”可与编码本文所述的HD-Zip转录因子的核苷酸序列的一个或多个片段或部分结合。
如本文关于核酸所使用的,术语“功能性片段”是指编码多肽的功能性片段的核酸。
如本文中所用,术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗微小RNA反义寡脱氧核糖核苷酸(AMO)等的核酸分子。基因可以用于或可以不用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如,内含子、调控元件、启动子、增强子、终止序列和/或5’和3’非翻译区)。基因可以是“分离的”,其是指核酸大体上或基本上不含通常被发现与以其天然状态存在的所述核酸结合的组分。此类组分包括来自重组生产的其他细胞材料、培养基和/或用于化学合成核酸的各种化学物质。
术语“突变”是指点突变(例如,错义或无义,或导致移码的单个碱基对的插入或缺失)、插入、缺失和/或截短。当突变是氨基酸序列中的残基被另一个残基取代,或者序列中一个或多个残基的缺失或插入时,通常通过鉴定原始残基,随后鉴定该残基在序列中的位置以及新取代的残基的身份来描述突变。在一些实施方案中,缺失可导致移码突变,产生提前终止密码子,从而截短蛋白质。
如本文中所用,术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如,序列“A-G-T”(5’至3’)与互补序列“T-C-A”(3’至5’)结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补性时,互补性可以是完全的。核酸链之间的互补程度对核酸链之间杂交的效率和强度有显著影响。
如本文中所用,“互补”可以指与比较核苷酸序列的100%互补性,或者其可以指与比较核苷酸序列的小于100%互补性(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性)。
具有同源性的不同核酸或蛋白质在本文中被称为“同源物”。术语同源物包括来自相同物种和其他物种的同源序列以及来自相同物种和其他物种的直向同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间以位置同一性百分比(即,序列相似性或同一性)表示的相似性水平。同源性也指不同核酸或蛋白质之间相似功能特性的概念。因此,本发明的组合物和方法还包含与本发明核苷酸序列和多肽序列的同源物。如本文中所用,“直向同源”是指在物种形成期间从共同的祖先基因产生的不同物种中的同源核苷酸序列和/或氨基酸序列。本发明核苷酸序列的同源物与本发明的所述核苷酸具有基本序列同一性(例如,至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
如本文中所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在整个组分(例如,核苷酸或氨基酸)比对窗口中不变的程度。“同一性”可以通过已知的方法容易地计算,所述方法包括但不限于在以下文献中描述的方法:Computational MolecularBiology(Lesk,A.M.,编辑)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,编辑)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.,编辑)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(vonHeinje,G.,编辑)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.,编辑)Stockton Press,New York(1991)。
如本文中所用,术语“序列同一性百分比”或“同一性百分比”是指当两个序列最佳比对时,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列与测试(“受试”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“同一性百分比”可以指与参照多肽相比,氨基酸序列中相同氨基酸的百分比。
如本文中所用,在两个核酸分子、核苷酸序列或多肽序列的上下文中,短语“基本同一的”或“基本同一性”是指两个或更多个序列或亚序列在就最大对应性进行比较和比对时,具有如使用以下序列比较算法之一或通过目测检查所测量的至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%核苷酸或氨基酸残基同一性。在本发明的一些实施方案中,基本同一性存在于本发明核苷酸序列的连续核苷酸区域中,所述连续核苷酸区域的长度为约10个核苷酸至约20个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸、约15个核苷酸至约25个核苷酸、约30个核苷酸至约40个核苷酸、约50个核苷酸至约60个核苷酸、约70个核苷酸至约80个核苷酸、约90个核苷酸至约100个核苷酸或更多个核苷酸,以及其中的任何范围,直至序列的全长。在一些实施方案中,核苷酸序列可以在至少约20个核苷酸(例如,约20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个核苷酸)上基本相同。在本发明的一些实施方案中,大体同一性存在于本发明多肽的连续氨基酸残基区域,其为长度为约3个氨基酸残基至约20个氨基酸残基、约5个氨基酸残基至约25个氨基酸残基、约7个氨基酸残基至约30个氨基酸残基、约10个氨基酸残基至约25个氨基酸残基、约15个氨基酸残基至约30个氨基酸残基、约20个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约50个氨基酸残基、约30个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约70个氨基酸残基、约50个氨基酸残基至约70个氨基酸残基、约60个氨基酸残基至约80个氨基酸残基、约70个氨基酸残基至约80个氨基酸残基、约90个氨基酸残基至约100个氨基酸残基,或更多个氨基酸残基,以及其中的任何范围,直至序列的全长。在一些实施方案中,多肽序列可以在至少约8个连续的氨基酸残基(例如,长度约8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、130个、140个、150个、175个、200个、225个、250个、275个、300个、325个、350个或更多个氨基酸,或更多连续氨基酸残基)上彼此大体相同。在一些实施方案中,两种或更多种HD-Zip转录因子可以在至少约8个连续氨基酸残基(例如,SEQ ID NO:9)、至少约9个连续氨基酸残基(例如,SEQ ID NO:7)、至少约11个连续氨基酸残基(例如,SEQ ID NO:6)、至少约13个连续氨基酸残基(例如,SEQ IDNO:8)、至少约24个连续氨基酸残基(例如,SEQ ID NO:4-5)、至少约53个连续氨基酸残基(例如,SEQ ID NO:3)、至少约116个连续氨基酸残基(例如,SEQ ID No:1-2)等或其组合上彼此大体相同。在一些实施方案中,大体相同的核苷酸或蛋白质序列与与其大体相同的核苷酸(或编码的蛋白质序列)执行大体相同的功能。
对于序列比较,通常一个序列作为与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法基于指定的程序参数,计算一个或多个测试序列相对于参考序列的序列同一性百分比。
用于比对比较窗口的序列的最佳比对是本领域技术人员公知的,并且可以通过诸如以下的工具进行:Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法,以及任选地通过这些算法的计算机化实现(诸如GAP、BESTFIT、FASTA和TFASTA(可作为Wisconsin(AccelrysInc.,San Diego,Ca)的一部分获得))进行。测试序列和参考序列的比对区段的“同一性分数”是两个比对的序列共有的相同组分的数量除以参考序列区段(例如,整个参考序列或参考序列的较小确定部分)中组分的总数。序列同一性百分比表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是与全长多核苷酸序列或其一部分的比较,或者是与更长的多核苷酸序列的比较。出于本发明的目的,对于翻译的核苷酸序列,也可以使用BLASTX2.0版,对于多核苷酸序列,使用BLASTN 2.0版来确定“同一性百分比”。
当两个核苷酸序列在严格条件下相互杂交时,也可以认为这两个序列是大体互补的。在一些实施方案中,被认为大体互补的两个核苷酸序列在高度严格条件下相互杂交。
核酸杂交实验如Southern和Northern杂交上下文中的“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。核酸杂交的详细指南可见于Laboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes第I部分第2章"Overview of principles of hybridizationand the strategy of nucleic acid probe assays”,Elsevier,New York(1993)。通常,在确定的离子强度和pH下,高度严格的杂交和洗涤条件被选择为比特定序列的热熔点(Tm)低约5℃。
Tm是50%的靶序列与完全匹配的探针杂交时的温度(在确定的离子强度和pH下)。选择非常严格的条件,使其等于特定探针的Tm。在Southern或northern印迹中,用于具有超过100个互补残基的互补核苷酸序列在滤膜上杂交的严格杂交条件的实例是42℃下的50%甲酰胺和1mg肝素,其中杂交进行过夜。高度严格的洗涤条件的实例是在72℃下用0.1 5MNaCl洗涤约15分钟。严格洗涤条件的实例是在65℃下用0.2x SSC洗涤15分钟(关于SSC缓冲液的描述,参见Sambrook,同下)。通常,高严格性洗涤之前是低严格性洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体,中等严格度洗涤的实例是在45℃下用1x SSC洗涤15分钟。对于例如超过100个核苷酸的双链体,低严格性洗涤的实例是在40℃下用4-6xSSC洗涤15分钟。对于短探针(例如,约10至50个核苷酸),严格条件通常涉及小于约1.0M Na离子的盐浓度,在pH 7.0至8.3下通常为约0.01至1.0M Na离子浓度(或其他盐),并且温度通常为至少约30℃。还可通过加入诸如甲酰胺等去稳定剂来达到严格条件。一般来说,在特定的杂交测定中,信噪比为对于无关探针观察的信噪比的2倍(或更高)表明检测到了特异性杂交。如果在严格条件下不相互杂交的核苷酸序列编码的蛋白质大体上相同,则所述核苷酸序列仍然是大体上相同的。例如,当使用遗传密码所允许的最大密码子简并性产生核苷酸序列的拷贝时,这可以发生。
可为了表达对本发明的多核苷酸和/或重组核酸构建体(例如,表达盒和/或载体)进行密码子优化。在一些实施方案中,可为了在植物中表达对本发明编辑系统的多核苷酸、核酸构建体、表达盒和/或载体(例如,包含/编码序列特异性DNA结合结构域(例如,来自多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)(例如,I型CRISPR-Cas效应蛋白、II型CRISPR-Cas效应蛋白、III型CRISPR-Cas效应蛋白、IV型CRISPR-Cas效应蛋白、V型CRISPR-Cas效应蛋白或VI型CRISPR-Cas效应蛋白)、核酸酶(例如,核酸内切酶(例如,Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN))、脱氨酶蛋白/结构域(例如腺嘌呤脱氨酶、胞嘧啶脱氨酶)、编码逆转录酶或结构域的多核苷酸、编码5'-3’核酸外切酶多肽的多核苷酸和/或亲和多肽、肽标签等)进行密码子优化。在一些实施方案中,本发明的经密码子优化的核酸、多核苷酸、表达盒和/或载体与未经密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)同一性或更高高一性。
在本文所述的任何实施方案中,本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调控元件可操作地连接,用于在植物和/或植物细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体还可包含与一个或多个核苷酸序列可操作地连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子(例如,Ubi1启动子和内含子)可操作地相关联。在一些实施方案中,与内含子相关联的启动子可被称为“启动子区”(例如,Ubi1启动子和内含子)。
如本文中提及多核苷酸时使用的“可操作地连接”或“可操作地相关联的”是指所示元件在功能上彼此相关,并且通常在物理上也相关。因此,如本文中所用,术语“可操作地连接”或“可操作地相关联的”是指单个核酸分子上功能上相关联的核苷酸序列。因此,与第二核苷酸序列可操作连接的第一核苷酸序列意指第一核苷酸序列被放置成与第二核苷酸序列处于功能关系中时的情况。例如,如果启动子影响所述核苷酸序列的转录或表达,则所述启动子与所述核苷酸序列可操作地相关联。本领域技术人员将会理解,控制序列(例如,启动子)不需要与与其可操作地相关联的核苷酸序列连续,只要控制序列能够指导其表达即可。因此,例如,居间非翻译但仍可转录的核酸序列可存在于启动子与核苷酸序列之间,并且启动子仍然可以被认为是可与核苷酸序列“可操作地连接”。
如本文中所用,涉及多肽时,术语“连接的”是指一种多肽与另一种多肽的附接。多肽可以直接(例如,通过肽键)或通过接头与另一种多肽(在N-末端或C-末端)连接。
术语“接头”是本领域公认的,并且是指连接两个分子或部分(例如,融合蛋白的两个结构域,例如DNA结合多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽;或DNA核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽)的化学基团或分子。接头可以由单个连接分子组成,或者可以包含不止一个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。在一些实施方案中,接头可以是氨基酸或者其可以是肽。在一些实施方案中,接头是肽。
在一些实施方案中,可用于本发明的肽接头的长度可为约2至约100个或更多个氨基酸,例如,约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个氨基酸(例如,长度为约2至约40个、约2至约50个、约2至约60个、约4至约40个、约4至约50个、约4至约60个、约5至约40个、约5至约50个、约5至约60个、约9至约40个、约9至约50个、约9至约60个、约10至约40个、约10至约50个、约10至约60,或长度为约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个氨基酸至约26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个氨基酸(例如,长度为约105个、110个、115个、120个、130个、140个、150个或更多个氨基酸))。在一些实施方案中,肽接头可以是GS接头。
如本文中所用,关于多核苷酸的术语“连接的”或“融合的”是指一个多核苷酸与另一个多核苷酸的附接。在一些实施方案中,两个或更多个多核苷酸分子可以通过接头连接,所述接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。多核苷酸可以通过共价或非共价键联或结合(包括例如Watson-Crick碱基配对)或通过一个或多个连接核苷酸与另一个多核苷酸(在5’末端或3’末端)连接或融合。在一些实施方案中,某一结构的多核苷酸基序可插入另一多核苷酸序列中(例如,引导RNA中发夹结构的延伸)。在一些实施方案中,连接核苷酸可以是天然存在的核苷酸。在一些实施方案中,连接核苷酸可以是非天然存在的核苷酸。
“启动子”是控制或调节与启动子可操作地相关联的核苷酸序列(例如,编码序列)的转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常,“启动子”是指含有RNA聚合酶II结合位点并指导转录起始的核苷酸序列。通常,相对于相应编码序列的编码区的起始,启动子位于5’或上游。启动子可包含其它作为基因表达的调控子的元件;例如启动子区域。这些包括TATA盒共有序列,并且通常是CAAT盒共有序列(Breathnach和Chambon,(1981)Annu.Rev.Biochem.50:349)。在植物中,CAAT盒可用AGGA盒代替(Messing等,(1983)于Genetic Engineering of Plants,T.Kosuge,C.Meredith和A.Hollaender(编辑),Plenum Press,第211-227页中)。
可用于本发明的启动子可包括例如组成型、诱导型、时间调控型、发育调控型、化学调控型、组织优先型和/或组织特异性启动子,用于制备重组核酸分子,例如“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。
启动子的选择可以根据表达的时间和空间要求而变化,也可以根据待转化的宿主细胞而变化。许多不同生物体的启动子是本领域公知的。基于本领域的广泛知识,可以为特定目标宿主生物选择合适的启动子。因此,例如,对模式生物中高度组成型表达的基因上游的启动子了解很多,并且此类知识可以容易地访问并在适当的情况下于其它系统中实现。
在一些实施方案中,在植物中有功能的启动子可以与本发明的构建体一起使用。用于在植物中驱动表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和复制碳酸酐酶基因1的启动子(Pdca1)(参见,Walker等人Plant Cell Rep.23:727-735(2005);Li等人Gene 403:132-142(2007);Li等人Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成型启动子,Pnr和Pdca1是诱导型启动子。Pnr受硝酸盐诱导,受铵抑制(Li等人Gene403:132-142(2007))并且Pdca1受盐诱导(Li等人Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是RNA聚合酶II(Pol II)启动子。在一些实施方案中,来自玉蜀黍的U6启动子或7SL启动子可用于本发明的构建体。在一些实施方案中,来自玉蜀黍的U6c启动子和/或7SL启动子可用于驱动引导核酸的表达。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于驱动引导核酸的表达。
用于植物的组成型启动子的实例包括但不限于,cestrum病毒启动子(cmp)(美国专利第7,166,770号)、水稻肌动蛋白1启动子(Wang等人(1992)Mol.Cell.Biol.12:3399-3406;以及美国专利第5,641,876号)、CaMV 35S启动子(Odell等人(1985)Nature 313:810-812)、CaMV 19S启动子(Lawton等人(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和遍在蛋白启动子。来源于遍在蛋白的组成型启动子在许多细胞类型中积累已经从几种植物物种中克隆了遍在蛋白启动子用于转基因植物,例如向日葵(Binet等人,1991.Plant Science 79:87-94)、玉米(Christensen等人,1989.Plant Molec.Biol.12:619-632)和拟南芥(Norris等人1993.Plant Molec.Biol.21:895-906)。已经在转基因单子叶植物系统中开发了玉米遍在蛋白启动子(UbiP),并且在专利公布EP 0 342 926中公开了其序列和构建用于单子叶植物转化的载体。遍在蛋白启动子适用于在转基因植物,尤其是单子叶植物中表达本发明的核苷酸序列。另外,由McElroy等人描述的启动子表达盒(Mol.Gen.Genet.231:150-160(1991))可被容易地修饰以表达本发明的核苷酸序列,并且特别适用于单子叶宿主。
在一些实施方案中,组织特异性/组织优先启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或优先表达模式包括但不限于绿色组织特异性或优先、根特异性或优先、茎特异性或优先、花特异性或优先或花粉特异性或优先表达模式。适于在绿色组织中表达的启动子包括许多调节参与光合作用的基因的启动子,这些启动子中的许多启动子已被从单子叶植物和双子叶植物中克隆出来。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula,Plant Molec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括那些与编码种子贮藏蛋白(诸如β-伴大豆球蛋白、十字花科蛋白(cruciferin)、油菜籽蛋白(napin)和菜豆蛋白)、玉米蛋白或油体蛋白(诸如油质蛋白)、或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因相关联的启动子,以及在胚胎发育期间表达的其它核酸(诸如Bce4,参见,例如,Kridl等人(1991)Seed Sci.Res.1:209-219;以及欧洲专利第255378号)。用于在植物,特别是玉米中表达本发明核苷酸序列的组织特异性或组织优先启动子包括但不限于在根、髓、叶或花粉中指导表达的启动子。此类启动子公开于例如WO 93/07278(过引用以其整体并入本文)中。可用于本发明的组织特异性或组织优先启动子的其它非限制性实例:美国专利6,040,504中公开的棉花rubisco启动子;美国专利5,604,121中公开的水稻蔗糖合酶启动子;de Framond(FEBS 290:103-106(1991);属于Ciba-Geigy的EP 0 452 269)描述的根特异性启动子;美国专利5,625,136(属于Ciba-Geigy)中描述的茎特异性启动子,其驱动玉米trpA基因的表达;WO 01/73087中公开的洋丁香属黄叶卷曲病毒启动子;和花粉特异性或优先启动子,包括但不限于来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人Plant Biotechnol.Reports 9(5):297-306(2015))、来自玉米的ZmSTK2_USP(Wang等人Genome 60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人Development 109(3):705-713(1990))、Zm13(美国专利第10,421,972号)、来自拟南芥的PLA2-δ启动子(美国专利第7,141,424号)和/或来自玉米的ZmC5启动子(国际PCT公布第WO1999/042587号)。
植物组织特异性/组织优先启动子的其他实例包括但不限于根毛特异性顺式元件(RHE)(Kim等人The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人Plant Physiol.153:185-197(2010))和RB7(美国专利第5459252号)、植物凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167;和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98)、玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcids Res.12:3983-4000)、S-腺苷-L-甲硫氨酸合成酶(SAMS)(Vander Mijnsbrugge等人(1996)Plant and Cell Physiology,37(8):1108-1115)、玉米光收获复合物启动子(Bansal等人(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人(1985)EMBO J.5:451-458;和Rochester等人(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore,"Nuclear genes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase”第29-39页In:Genetic Engineering ofPlants(Hollaender编辑,Plenum Press 1983;和Poulsen等人(1986)Mol.Gen.Genet.205:193-200)、Ti质粒甘露碱合酶启动子(Langridge等人(1989)Proc.Natl.Acad.Sci.USA 86:3219-3223)、Ti质粒胭脂氨酸合酶启动子(Langridge等人(1989),同上),矮牵牛查尔酮异构酶启动子(van Tunen等人(1988)EMBO J.7:1257-1263)、大豆富含甘氨酸蛋白1启动子(Keller等人(1989)Genes Dev.3:1639-1646)、截短的CaMV 35S启动子(O'Dell等人(1985)Nature313:810-812)、马铃薯块茎储藏蛋白(patatin)启动子(Wenzler等人(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人(1990)Nucleic Acids Res.18:7449)、玉米醇溶蛋白启动子(Kriz等人(1987)Mol.Gen.Genet.207:90-98;Langridge等人(1983)Cell 34:1015-1022;Reina等人(1990)Nucleic Acids Res.18:6425;Reina等人(1990)Nucleic Acids Res.18:7449;和Wandelt等人(1989)Nucleic Acids Res.17:2354)、球蛋白-1启动子(Belanger等人(1991)Genetics129:863-872)、α-微管蛋白cab启动子(Sullivan等人(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人(1989)Plant Cell 1:1175-1183)和查尔酮合酶启动子(Franken等人(1991)EMBO J.10:2605-2612)。
对种子特异性表达有用的是豌豆的豌豆球蛋白启动子(Czako等人(1992)Mol.Gen.Genet.235:33-40);以及美国专利第5,625,136号中公开的种子特异性启动子。用于在成熟叶中表达的有用启动子是那些在衰老开始时被转换的启动子,诸如来自拟南芥的SAG启动子(Gan等人(1995)Science 270:1986-1988)。
另外,可以使用在叶绿体中有功能的启动子。此类启动子的非限制性实例包括噬菌体T3基因9的5’UTR和美国专利第7,579,516号中公开的其他启动子。可用于本发明的其它启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。
可用于本发明的其它调控元件包括但不限于内含子、增强子、终止序列和/或5’和3’非翻译区。
可用于本发明的内含子可以是从植物中鉴定和分离的内含子,然后被插入到用于植物转化的表达盒。如本领域技术人员所理解的,内含子可以包含自我切除所需的序列,并被框内整合到核酸构建体/表达盒中。内含子可以用作间隔子来分隔一个核酸构建体中的多个蛋白质编码序列,或者可在一个蛋白质编码序列内部使用内含子来例如稳定mRNA。如果它们被用在蛋白质编码序列中,则它们被插入“框内”,其中包括切除位点。还可将内含子与启动子结合以改善或修饰表达。例如,可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的组合(参见,例如,SEQ ID NO:196和SEQ ID NO:197)。
可用于本发明的内含子的非限制性实例包括来自ADHI基因(例如,Adh1-S内含子1、2和6)、遍在蛋白基因(Ubi1)、RuBisCO小亚基(rbcS)基因、RuBisCO大亚基(rbcL)基因、肌动蛋白基因(例如,肌动蛋白-1内含子)、丙酮酸脱氢酶激酶基因(pdk)、硝酸还原酶基因(nr)、复制碳酸酐酶基因1(Tdca1)、psbA基因、atpA基因或其任意组合的内含子。
在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”或可以包含在表达盒内。如本文中所用,“表达盒”意指包含例如一种或多种本发明的多核苷酸的重组核酸分子(例如,编码序列特异性DNA结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5’-3’核酸外切酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(RT)模板),其中一种或多种多核苷酸与一种或多种控制序列(例如,启动子、终止子等)可操作地相关联。因此,在一些实施方案中,可以提供一种或多种表达盒,其被设计成表达例如本发明的核酸构建体(例如,编码序列特异性DNA结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5’-3’核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或者包含引导核酸、延伸的引导核酸和/或RT模板等)。当本发明的表达盒包含不止一个多核苷酸时,多核苷酸可以与驱动所有多核苷酸表达的单个启动子可操作地连接,或者多核苷酸可以与一个或多个单独的启动子可操作地连接(例如,三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两种或更多种不同的启动子时,所述启动子可以是相同的启动子,也可以是不同的启动子。因此,当包含在单个表达盒中时,编码序列特异性DNA结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如,RNA依赖性DNA聚合酶)、和/或编码5’-3’核酸外切酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或RT模板可以各自与单个启动子或任意组合的独立启动子可操作地连接。
包含本发明的核酸构建体的表达盒可以是嵌合的,意味着其至少一个组分相对于其至少一个其它组分是异源的(例如,来自宿主生物的启动子可操作地连接到将在宿主生物中表达的目标多核苷酸,其中所述目标多核苷酸来自不同于宿主的生物体,或者通常被发现不与该启动子相关联)。表达盒也可以是天然存在的,但已经以用于异源表达的重组形式获得的表达盒。
表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在所选宿主细胞中有功能的增强子区。多种转录终止子和增强子是本领域已知的,并且可获得用于表达盒中。转录终止子负责转录的终止和正确的mRNA多聚腺苷酸化。终止区和/或增强子区可以原产于转录起始区,可以原产于例如编码序列特异性DNA结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或者可以原产于宿主细胞,或者可以原产于另一来源(例如,对于例如启动子、编码序列特异性DNA结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对于宿主细胞或其任意组合是外来的或异源的)。
本发明的表达盒还可包括编码选择标记的多核苷酸,其可用于选择转化的宿主细胞。如本文中所用,“选择标记”是指这样的多核苷酸序列,当其被表达时,赋予表达该标记的宿主细胞独特的表型,从而使此类转化的细胞与那些不该标记的细胞相区别。这种多核苷酸序列可以编码选择标记或可筛选的标记,这取决于该标记是否赋予可通过化学手段,诸如通过使用选择剂(例如,抗生素等)选择的性状,或者取决于该标记是否仅仅是可通过观察或测试,诸如通过筛选(例如,荧光)鉴定的性状。合适的选择性标记的许多实例是本领域已知的,并且可用于本文所述的表达盒中。
除了表达盒之外,本文所述的核酸分子/构建体和多核苷酸序列也可与载体结合使用。术语“载体”是指用于将核酸(或多种核酸)转移、递送或引入细胞的组合物。载体包含含有待转移、递送或引入的一种或多种核苷酸序列的核酸构建体(例如一种或多种表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别的载体的非限制性实例包括呈双链或单链线性或环状形式的病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或土壤杆菌(Agrobacterium)二元载体,其可以是或可以不是自我传递的或可移动的。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合入细胞基因组或存在于染色体外(例如具有复制起点的自主复制质粒)来转化原核或真核宿主。另外还包括穿梭载体,所述穿梭载体是指能够天然地或通过设计在两种不同的宿主生物体中复制的DNA媒介物,所述宿主生物体可选自放线菌(actinomycetes)和相关物种、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中,载体中的核酸处于合适的启动子或用于在宿主细胞中转录的其他调控元件的控制之下,并与其可操作地连接。载体可以是在多种宿主中起作用的双功能表达载体。在基因组DNA的情况下,这可能包含其自身的启动子和/或其它调控元件,而在cDNA的情况下,这可能处于合适的启动子和/或其它调控元件的控制之下,以便在宿主细胞中表达。因此,本发明的核酸或多核苷酸和/或包含其的表达盒可以包含在本文所述和本领域已知的载体中。
如本文中所用,“接触(contact)”、“接触(contacting)”、“接触(contacted)”及其语法变型是指在适于进行所需反应(例如,转化、转录控制、基因组编辑、产生切口和/或切割)的条件下,将所需反应的组分放置在一起。例如,可在序列特异性DNA结合蛋白、逆转录酶和脱氨酶被表达并且序列特异性DNA结合蛋白与靶核酸结合的条件下,将靶核酸与序列特异性DNA结合蛋白(例如,多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码其的核酸构建体接触,并且可将逆转录酶和/或脱氨酶与序列特异性DNA结合蛋白融合,或者募集到序列特异性DNA结合蛋白(例如,通过与序列特异性DNA结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此,脱氨酶和/或逆转录酶位于靶核酸附近,从而修饰所述靶核酸。可以使用利用其他蛋白质-蛋白质相互作用募集逆转录酶和/或脱氨酶的其他方法,并且还可将RNA-蛋白质相互作用和化学相互作用于蛋白质-蛋白质和蛋白质-核酸募集。
如本文中所用,涉及靶核酸的“修饰(modifying)”、“修饰(modification)”、“突变(mutating)”或“突变(mutation)”(所述术语在本文中可互换使用)包括编辑(例如,突变)、共价修饰、交换/取代核酸/核苷酸碱基、删除、切割、切刻和/或改变靶核酸的转录控制。在一些实施方案中,修饰可以包括一个或多个任何类型的单碱基改变(SNP)。
在目标多核苷酸的上下文中,“引入(Introducing)”、“引入(introduce)”、“引入(introduced)”(及其语法变型)是指将目标核苷酸序列(例如,多核苷酸、RT模板、核酸构建体和/或引导核酸)以使得该核苷酸序列能够进入细胞内部的方式呈递至植物、其植物部分或其细胞。
术语“转化”或“转染”可以互换使用,并且如本文中所用,是指将异源核酸导入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,可用本发明的多核苷酸/核酸分子稳定转化宿主细胞或宿主生物体(例如,植物)。在一些实施方案中,可用本发明的多核苷酸/核酸分子瞬时转化宿主细胞或宿主生物体。
多核苷酸上下文中的“瞬时转化”意指多核苷酸被引入细胞,但不整合到细胞的基因组中。
在引入细胞的多核苷酸的上下文中,“稳定地引入(stably introducing)”或“稳定地引入(stably introduced)”旨在指引入的多核苷酸被稳定整合到细胞的基因组中,因此细胞被多核苷酸稳定地转化。
如本文中所用,“稳定的转化”或“稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此,整合的核酸分子能够被其子代遗传,更具体地,被多个连续世代的子代遗传。如本文中所用,“基因组”包括细胞核和质体基因组,因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文中所用,稳定的转化也可指保持在染色体外的转基因(例如,作为微小染色体或质粒)。
瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹来检测,所述测定或蛋白质印迹可以检测由引入生物体的一种或多种转基因编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列的Southern印迹杂交分析来检测,所述核酸序列与导入生物体(例如,植物)的转基因的核苷酸序列特异性杂交。细胞的稳定转化可以通过例如细胞的RNA与核酸序列的Northern印迹杂交测定来检测,所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域公知的其它扩增反应来检测,所述聚合酶链式反应或其它扩增反应使用与转基因的一个或多个靶序列杂交的特异性引物序列,导致转基因序列的扩增,这可以根据标准方法来检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。
因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以瞬时表达并且/或者它们可被稳定地整合到宿主生物体的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如,一个或多个包含如本文所述用于编辑的多核苷酸的表达盒)可被瞬时引入具有引导核酸的细胞中,因此,细胞中不保留DNA。
可以通过本领域技术人员已知的任何方法将本发明的核酸构建体引入植物细胞。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如,通过封杆菌)、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、PEG介导的核酸摄取以及导致核酸引入植物细胞的任何其他电、化学、物理(机械)和/或生物机制(包括其任意组合)的转化。转化真核生物体和原核生物体的方法是本领域公知的常规方法,并在整个文献中有描述(参见,例如,Jiang等人2013.Nat.Biotechnol.31:233-239;Ran等人Nature Protocols 8:2281–2308(2013))。本领域已知的各种植物转化方法的一般指南包括Miki等人("Procedures for Introducing Foreign DNA into Plants"inMethods inPlant Molecular Biology and Biotechnology,Glick,B.R.和Thompson,J.E.,编辑(CRC Press,Inc.,Boca Raton,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。
在本发明的一些实施方案中,细胞的转化可以包括核转化。在其他实施方案中,细胞的转化可以包括质体转化(例如,叶绿体转化)。在又一另外的实施方案中,可以通过常规育种技术将本发明的核酸引入细胞。在一些实施方案中,可以通过土壤杆菌转化将多核苷酸、表达盒和/或载体中的一种或多种引入植物细胞。
因此,可以以本领域公知的许多方式将多核苷酸引入植物、植物部分、植物细胞。本发明的方法不依赖于将一种或多种核苷酸序列引入植物的特定方法,仅依赖于它们进入细胞内部。当要引入水止一种多核苷酸时,它们可以作为单个核酸构建体的一部分装配,或者作为单独的核酸构建体装配,并且可以位于同一或不同的核酸构建体上。因此,多核苷酸可以在单个转化事件中或在单独的转化事件中被引入目标细胞中,或者,多核苷酸可以作为育种方案的一部分被整合到植物中。
例如,玉米的产量(蒲式耳/英亩)通过高强度育种稳步增加。然而,产量的增量增加最近已经开始达到平台期,并且需要在田间评价和育种方面进行大量投资以清楚地证明遗传增益。需要新的遗传修饰方法来显著提高产量,这是通过常规方法不可能实现的。农作物产量可以以两种截然不同的方法来提高:1)产量本身的提高,其中工程改造的植物获得了优势,诸如改善的光合作用或优化的碳水化合物分配,或2)消除了与高产农业不一致的残留存活机制。避荫反应(SAR)或避荫综合征(SAS)就是这样一种生存机制。SAS/SAR的特征在于根冠比增加,株高增加,单株产量降低,在典型的单作作物环境中,这种对竞争的反应是一种浪费的生存机制。
因此,本发明解决了与增加的种植密度耐受性(参见,图3)和由于种植可变性引起的产量损失(以英亩为基础)减少相关联的问题。本发明描述了基因编辑修饰触发作物避荫的关键调节因子(例如,显性失活突变)的用途(参见,例如,图4)。具有此类编辑过的基因组的植物将具有降低的避荫能力。用于解决(例如,减少/减弱)SAR/SAS的突变的实例可以是去除二聚化为有功能的转录因子的DNA结合功能的突变。在一些情况下,这种突变可以是显性失活突变(参见例如,图4)。
HD(同源结构域)-LZ(亮氨酸拉链)(HD-Zip)类转录因子在植物中具有多种功能。II型种类与光感和避荫相关联。一个特定的HD-LZ II类成员(HB53)已被证明是由遮荫处理诱导的。在玉米中,ZmHB53是ATHB2(与拟南芥中的避荫反应密切相关的一种HDLZ)的最接近的玉米同源物(Carabelli等人,1996;Steindler等人,1999)(参见例如,图5)。密切相关的HDLZ蛋白ZmHB78已被鉴定为用于减弱避荫作用的另一个靶标。一种减弱可用于本发明的转录因子(例如HB53、HB78)的DNA结合能力的方法可以包括修饰单个氨基酸(缺失、插入或取代)或通过框内缺失去除全部或部分DNA结合结构域。
图1提供了来自44种不同植物物种的HD-Zip(HB78)氨基酸序列的比对。图1所示的序列是来自全长HB78序列的一部分连续氨基酸(53个氨基酸残基)。还提供了来自45种不同植物物种的HD-Zip(HB53)氨基酸序列的比对(图2)。图2所示的序列是来自全长HB53序列的一部分连续氨基酸残基(例如,约116个氨基酸残基)。这些比对表明在这两个基因的靶向区域中存在实质的保守性,并证明靶向内源同源结构域-亮氨酸拉链(HD-Zip)转录因子的本发明(其中突变破坏了HD-Zip转录因子与DNA的结合)将被预测在不同的植物物种中起作用,以产生具有减弱的避荫反应的植物。
这些基因的可能编辑的实例提供于图6、图7、图8和图9中。图6提供了玉蜀黍中HB53的DNA结合结构域的编辑的实例,并在方框中显示了用于修饰的目标示例性氨基酸残基。图7提供了具有示例引导核酸的注释的HB78基因,图8提供了HB78基因(SEQ ID NO:295)中缺失的示例,显示了例如外显子2中的缺失(SEQ ID NO:297)导致删除外显子3、外显子4和DNA结合结构域的截短,从而导致蛋白质序列中的缺失(SEQ ID NO:296)。图9提供了编辑的植物的代表性基因组序列(编码链(SEQ ID NO:298)和非编码链(SEQ ID NO:299)),显示了HB78 DNA结合结构域上游的提前终止。图13提供了使用质粒pWISE443、pWISE444、pWISE446和pWISE447及其相应间隔子示例性靶向HB53(上图)和HB78(下图)的示意图。质粒pWISE448包含对于HB78所显示的所有四个间隔子,质粒pWISE445包含对于HB53所显示的所有四个间隔子,而质粒pWISE451包含所有八个间隔子(HB53有四个,HB78有四个,如图13所示)。
在一些实施方案中,本发明提供了在内源同源结构域-亮氨酸拉链(HD-Zip)转录因子中包含至少一个非天然突变的植物或其植物部分,其中所述突变破坏了HD-Zip转录因子与DNA的结合。在一些实施方案中,HD-Zip转录因子可以是HD-Zip II型(HD-Zip II)转录因子,其中HD-Zip II转录因子能够调节植物对光照的反应(例如,调节避荫反应(SAR))。在一些实施方案中,可用于本发明的HD-Zip II转录因子可包括但不限于AtHB2、HB53和/或HB78的直向同源物。在一些实施方案中,可用于本发明的HD-Zip Ii转录因子可以是同源异型框蛋白53(HB53)或同源异型框蛋白78(HB78)。可用于本发明的HD-Zip转录因子是包含以下序列的HD-Zip转录因子:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(b)包含与以下氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽:RKKLRLSKDQSAVLEDSFREHPTLNPRQKAALAQQLGLRPRQVEVWFQNRRARTKLKQTEVDCEYLKRCCETLTEENRRLQKEVQELRALKLVSPHLYMHMSPPTTLTMCPSCERV(SEQ ID NO:1)(玉蜀黍HB53)或RKKLRLSKDQAAVLEESFKEHNTLNPKQKAALAKQLNLKPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTEENRRLQREVAELRVLKLVAPHHYARMPPPTTLTMCPSCERL SEQ IDNO:2)(玉蜀黍HB78);(c)包含与氨基酸序列LAKQLNLKPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTEENRRLQREV(SEQ ID NO:3)具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(d)包含与核苷酸序列RQVEVWFQNRRARTKLKQTEVDCE(SEQ ID NO:4)具有至少95%序列同一性(例如,至少约95%、96%、97%、99%、99.5%或100%序列同一性)的序列的多肽;(e)包含具有氨基酸序列RQVEVWFQNRRARTKXKQTEVDCE(SEQ ID NO:5)的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
在一些实施方案中,本发明的植物或植物部分包含HD-Zip转录因子,所述HD-Zip转录因子包含:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(b)包含与以下氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽:RKKLRLSKDQSAVLEDSFREHPTLNPRQKAALAQQLGLRPRQVEVWFQNRRARTKLKQTEVDCEYLKRCCETLTEENRRLQKEVQELRALKLVSPHLYMHMSPPTTLTMCPSCERV(SEQ ID NO:1)(玉蜀黍HB53)或RKKLRLSKDQAAVLEESFKEHNTLNPKQKAALAKQLNLKPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTEENRRLQREVAELRVLKLVAPHHYARMPPPTTLTMCPSCERL SEQ ID NO:2)(玉蜀黍HB78);(c)包含与氨基酸序列LAKQLNLKPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTEENRRLQREV(SEQ ID NO:3)具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(d)包含与核苷酸序列RQVEVWFQNRRARTKLKQTEVDCE(SEQ IDNO:4)具有至少95%序列同一性(例如,至少约95%、96%、97%、99%、99.5%或100%序列同一性)的序列的多肽;(e)包含具有氨基酸序列RQVEVWFQNRRARTKXKQTEVDCE(SEQ ID NO:5)的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。因此,用于本发明的HD-Zip转录因子可以包含SEQ ID NO:1-8或10-98中的任一个的氨基酸序列,其包含含有氨基酸序列VWFQNRRA(SEQID NO:9)的DNA结合结构域。例如,包含SEQ ID NO:38的氨基酸序列的HD-Zip转录因子的残基173-288包含SEQ ID NO:9的氨基酸序列。作为另一个实例,包含SEQ ID NO:83的氨基酸序列的HD-Zip转录因子的残基76-191包含SEQ ID NO:9的氨基酸序列。除了SEQ ID NO:9之外,用于本发明的HD-Zip转录因子中鉴定的其它多肽结构域包括与SEQ ID NO:1和/或SEQID NO:2的氨基酸序列包含至少80%序列同一性的多肽,包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽,包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽,包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S,包含具有SEQ ID NO:6所示氨基酸序列的序列的多肽,其中X1是S或T,X2是D或E,X3是S或A,包含具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列的多肽,其中X1是Q或H,X2是R或K,X3是V或L,和/或包含具有SEQ ID NO:8所示氨基酸序列的序列的多肽,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N。
在一些实施方案中,植物中内源同源结构域-亮氨酸拉链(HD-Zip)转录因子中的至少一个非天然突变可以是破坏HD-Zip转录因子与DNA结合的取代、缺失和/或插入。例如,突变可以是转录因子的一个或多个氨基酸残基的取代、缺失和/或插入。所述至少一个非天然突变可包含对A、T、G或C的碱基取代,这导致氨基酸取代,从而破坏HD-Zip转录因子与DNA的结合。在一些实施方案中,编码HD-Zip转录因子的内源基因中的至少一个非天然突变可包括缺失。这种缺失可以包括,例如,HD-Zip转录因子的DNA结合结构域的全部或部分的缺失(例如,SEQ ID NO:9(VWFQNRRA)的至少1个、2个、3个、4个、5个、6个、7个或8个氨基酸残基的缺失)。在一些实施方案中,缺失可以是包括SEQ ID NO:9的连续氨基酸残基的部分(例如,至少2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)的截短。在一些实施方案中,缺失可以是包括SEQ ID NO:9的至少一部分连续氨基酸残基(例如,至少2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)的截短。因此,缺失的长度可以是HD-Zip多肽的约1个氨基酸残基至约120个氨基酸残基,或长度(例如,至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个或更多个连续氨基酸残基)直至HD-Zip多肽的全长,其中缺失包括SEQ ID NO:9的至少一部分连续氨基酸残基。在一些实施方案中,缺失产生截短的HD-Zip转录因子,其包含SEQ ID NO:9的至少一部分连续氨基酸残基的缺失。在一些实施方案中,HD-Zip转录因子多核苷酸中的缺失可导致产生截短的HD-Zip转录因子的提前终止密码子,任选地在HD-Zip转录因子的C末端处截短,其中SEQ ID NO:9的至少一部分连续氨基酸残基被删除。
用于本发明的编码HD-Zip转录因子突变的内源基因中的非天然突变可以是显性隐性突变。显性失活可以去除二聚化为有功能的转录因子的DNA结合功能。转录因子仍可二聚化,但将失去与下游基因调控区结合的能力,因此将失去功能。因此,通过去除双功能蛋白的DNA结合能力,二聚化的复合物将不会激活基因表达(参见,例如,图5)。
在一些实施方案中,提供了包含编辑系统的植物细胞,所述编辑系统包含:(a)CRISPR相关效应蛋白;和(c)具有与编码野生型HD-Zip转录因子的内源靶基因互补的间隔子序列的引导核酸(gRNA、gDNA、crRNA、crDNA)。野生型HD-Zip转录因子可以是任何参与避荫反应的HD-Zip转录因子。在一些实施方案中,HD-Zip转录因子可以是HD-Zip II型转录因子,任选地是HB53转录因子或HB78转录因子。在一些实施方案中,与引导核酸的间隔子序列共享互补性的HD-Zip转录因子基因可以编码(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。在一些实施方案中,本发明的编辑系统的引导核酸的间隔子序列可包含SEQ ID NO:175-182中的任一个的核苷酸序列。在一些实施方案中,可用于本发明的编辑系统的核酸结合结构域可来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,如本文所述编辑的植物细胞可再生为植物,从而提供具有参与避荫反应的HD-Zip转录因子的突变,并具有减弱的避荫反应的植物。
在一些实施方案中,本发明提供了植物细胞,其包含对HD-Zip转录因子基因的DNA结合位点的至少一个非天然发生的突变(例如,1个、2个、3个、4个、5个或更多个突变),所述突变防止或降低编码的HD-Zip转录因子与DNA的结合,其中突变是使用编辑系统引入的取代、插入和/或缺失,所述编辑系统包含与HD-Zip转录因子基因中的靶位点结合的核酸结合结构域,并且其中HD-Zip转录因子基因编码:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID NO:2具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,
在一些实施方案中,提供了植物或其部分,所述植物或其部分包含内源HD-Zip转录因子的突变,所述突变减少了内源HD-Zip转录因子的DNA结合,其中内源HD-Zip转录因子包含多肽,所述多肽包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列;其中所述突变是SEQ ID NO:1或SEQ ID NO:2的氨基酸序列的氨基酸残基45-52(VWFQNRRA)(SEQ ID NO:9)的至少一个氨基酸残基的缺失、取代和/或插入。在一些实施方案中,SEQ ID NO:1或SEQ ID No:2的氨基酸序列的氨基酸残基45-52的至少一个氨基酸残基的突变是在核酸酶切割后产生的,所述核酸酶包含与靶核酸内的靶位点结合的DNA结合结构域,所述靶核酸编码与SEQ ID NO:1)(玉米HB53)或SEQ ID NO:2)(玉米HB78)的氨基酸序列具有至少80%序列同一性的序列。
植物或其部分中内源HD-Zip转录因子的突变可以是至少一个氨基酸的插入、取代和/或缺失。在一些实施方案中,突变可包括内源HD-Zip转录因子内DNA结合结构域的全部或部分的缺失(例如,SEQ ID NO:9(VWFQNRRA)的至少1个、2个、3个、4个、5个、6个、7个或8个氨基酸残基的缺失)。
在一些实施方案中,植物或其部分的非限制性实例包括玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑树莓或芸苔属某些种。在一些实施方案中,植物部分可以是来自植物的细胞,所述植物包括但不限于玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑树莓或芸苔属某些种。在一些实施方案中,植物可由本发明的细胞或植物部分再生。在HD-Zip转录因子中包含至少一个突变的本发明植物包含减弱的避荫反应(SAR)。
在一些实施方案中,本发明提供了包含HD-Zip转录因子基因的植物或其植物部分,所述HD-Zip转录因子基因包含SEQ ID NO:202的核苷酸序列并且/或者编码SEQ ID NO:201的任一个的氨基酸序列。在一些实施方案中,本发明提供了包含HD-Zip转录因子基因的玉米植物或其植物部分,所述HD-Zip转录因子基因包含SEQ ID No:202的核苷酸序列并且/或者编码SEQ ID No:201中的任一个的氨基酸序列。
本发明还提供了生产/培育无转基因的基因组编辑的(例如,碱基编辑的)植物的方法,其包括:(a)将本发明的植物与无转基因的植物杂交,从而将来自本发明植物的突变或修饰引入无转基因的植物中;以及(b)选择包含突变或修饰但无转基因的后代植物,从而产生无转基因的基因组编辑的(例如,碱基编辑的)植物。
在一些实施方案中,提供了当多株植物中的每株植物彼此紧邻种植时提供具有增加的产量的多株植物的方法,所述方法包括彼此紧邻种植两株或更多株本发明的植物,从而提供与彼此紧邻种植的多株对照植物(例如,不具有编辑的HD-Zip转录因子基因和降低的SAR的植物)相比具有增加的产量的多株植物。
“紧邻”是指任何特定植物物种的高种植密度,其可导致SAR。例如,在一些实施方案中,“紧邻”包括以约6.1英寸或更小的间隔(例如,间隔约6.1英寸、6英寸、5.9英寸、5.8英寸、5.7英寸、5.6英寸、5.5英寸、5.4英寸、5.3英寸、5.2英寸、5.2英寸、5.1英寸、5英寸、4.9英寸、4.8英寸、4.7英寸、4.6英寸、4.5英寸、4.4英寸、4.3英寸、4.2英寸、4.1英寸、4 3.9英寸、3.8英寸、3.7英寸、3.6英寸、3.5英寸、3.4英寸、3.3英寸、3.2英寸、3.1英寸、3英寸、2.9英寸、2.8英寸、2.7英寸、2.6英寸、2.5英寸、2.4英寸、2.3英寸、2.2英寸、2.1英寸、2英寸、1.9英寸、1.8英寸、1.7英寸、1.6英寸、1.5英寸、1.4英寸、1.3英寸、1.2英寸、1.1英寸、1英寸、0.9英寸、0.8英寸、0.7英寸、0.6英寸、0.5英寸等或其中的任何范围或值)种植植物的种子而产生的植物的密度。在一些实施方案中,高密度种植包括在36英寸和38英寸行距下约35K粒种子/英亩;或者在30英寸或更大的行距下超过35K粒种子/英亩的任何密度。如本领域技术人员所理解的,为实现高密度种植,每英亩种植的种子数量将因植物物种而异。
在一些实施方案中,提供了编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中内源HD-Zip转录因子基因内的靶位点,所述内源HD-Zip转录因子基因编码:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID NO:2具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而在植物细胞的内源HD-Zip转录因子基因中产生编辑。编辑植物的方法还可包括从在内源HD-Zip转录因子基因中包含编辑的植物细胞再生植物,以产生在内源HD-Zip转录因子基因中包含编辑的植物。在一些实施方案中,编辑导致内源HD-Zip转录因子基因的非天然发生的突变,所述突变产生DNA结合减少的HD-Zip转录因子。
当与不包含编辑的内源HD-Zip转录因子基因的对照植物相比时,包含如本文所述编辑的内源HD-Zip转录因子基因、以提供具有减少的DNA结合的HD-Zip转录因子的植物具有减弱的避荫反应。可将包含如本文所述编辑的内源HD-Zip转录因子基因的植物与在相同环境条件下生长时未被如此编辑的植物进行比较,所述环境条件是例如具有低R∶FR光比率的环境,例如遮蔽条件(例如,为约0.16的R∶FR比率;或为约0.09至约0.7的R:FR比率范围(例如,约0.09、0.10、0.11、0.12、0.13、0.14、0.15、0.16、0.17.018、0.19、0.2、0.21、0.23、0.24、0.25至约0.26、0.27、0.28、0.29、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7或其中的任何范围或值))。
在一些实施方案中,提供了用于制造植物的方法,所述方法包括:(a)将包含编码HD-Zip转录因子的野生型内源基因的植物细胞群与靶向该野生型内源基因的核酸酶接触,其中该核酸酶与DNA结合结构域连接,所述结合结构域与编码以下序列的核酸序列结合:(i)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(ii)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(iii)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(iv)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(v)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(vi)多肽,其包含:(1)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(2)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(3)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(4)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(vii)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽;(b)从所述群体中选择包含编码HD-Zip转录因子的野生型内源基因的突变的植物细胞,其中所述突变是(i)-(v)中任一项的多肽中至少一个氨基酸残基的取代和/或缺失,其中所述突变降低或消除了HD-Zip转录因子结合DNA的能力;以及(c)使选择的植物细胞生长成植物。
在一些实施方案中,提供了用于降低植物中的避荫反应的方法,所述方法包括(a)将包含编码HD-Zip转录因子的野生型内源基因的植物细胞与靶向野生型内源基因的核酸酶接触,其中所述核酸酶与结合野生型内源基因中的靶位点的DNA结合结构域连接,所述野生型内源基因编码:(i)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(ii)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(iii)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(iv)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(v)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(vi)多肽,其包含:(1)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(2)具有PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)所示氨基酸序列的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(3)具有氨基酸序列ENRRLX1X2EX3(SEQ IDNO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(4)具有氨基酸序列VWFQNRRA(SEQ IDNO:9)的序列;和/或(vii)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生包含编码HD-Zip转录因子的野生型内源基因的突变的植物细胞;以及(b)使植物细胞生长成植物,从而减少植物中的避荫反应。
在一些实施方案中,提供了产生包含至少一个具有突变的内源HD-Zip转录因子基因的细胞的植物或其部分的方法,所述方法包括将植物或植物部分中的内源HD-Zip转录因子基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中DNA结合结构域与内源HD-Zip转录因子基因中的靶位点结合,其中所述内源HD-Zip转录因子基因编码:(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID NO:2具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生包含至少一个在内源HD-Zip转录因子基因中具有突变的细胞的植物或其部分。在一些实施方案中,具有突变的内源HD-Zip转录因子基因的植物或其部分中的至少一个细胞产生具有减少的DNA结合的HD-Zip转录因子。
在一些实施方案中,产生包含具有减少的DNA结合的突变的内源HD-Zip转录因子的植物或其部分的方法,所述方法包括将植物或植物部分中的内源HD-Zip转录因子基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中DNA结合结构域与HD-Zip转录因子基因中的靶位点结合,其中HD-Zip转录因子基因编码:
(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列SEQ ID NO:1或SEQ ID NO:2具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(f)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生具有减少DNA结合的突变的内源HD-Zip转录因子的植物或其部分。在一些实施方案中,内源HD-Zip转录因子基因编码内源HD-Zip转录因子,其包含SEQ ID NO:38或SEQ ID NO:83的氨基酸序列,其中SEQID NO:38或SEQ ID No:83的氨基酸序列包含氨基酸序列VWFQNRRA(SEQ ID NO:9),并且突变的内源HD-Zip转录因子在氨基酸序列VWFQNRRA(SEQ ID NO:9)中包含突变。在一些实施方案中,内源HD-Zip转录因子基因编码内源HD-Zip转录因子,其包含SEQ ID NO:10-98中的任一个的氨基酸序列,其中SEQ ID NO:10-98中的任一个的氨基酸序列包含氨基酸序列VWFQNRRA(SEQ ID NO:9),并且突变的内源HD-Zip转录因子在氨基酸序列VWFQNRRA(SEQ IDNO:9)中包含突变。
在一些实施方案中,与在内源HD-Zip转录因子基因中不包含突变的对照植物(例如植物或植物部分未曾与编辑系统接触)相比,包含本文所述的突变的内源HD-Zip转录因子的植物或其部分表现出减弱/降低的避荫反应。在一些实施方案中,当在相同的环境条件(例如,遮蔽环境,例如低R:FR比率环境)下生长时,可以在编辑植物与对照植物之间进行与对照植物的比较。包含导致植物中减弱的/降低的避荫反应的突变的内源HD-Zip转录因子的植物表现出包括、但不限于以下表型的表型:与和一株或多株其它植物紧邻种植的不包含导致减弱的/降低的避荫反应的突变的内源HD-Zip转录因子的植物相比,当与一株或多株其它植物紧邻种植时,其具有增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,具有降低的SAR的植物比在相同环境条件(例如,遮蔽环境,例如,低R:FR比率环境)下生长的对照植物短至少约5%(例如,或约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%或更短,或其中的任何范围或值)。
在一些实施方案中,接触植物细胞、植物细胞群和/或靶位点的核酸酶切割内源HD-Zip转录因子基因,并且突变被引入由内源HD-Zip转录因子基因编码的内源HD-Zip转录因子的DNA结合位点。
在一些实施方案中,内源HD-Zip转录因子基因中的突变可以是非天然发生的突变。在一些实施方案中,非天然发生的突变可以是取代、插入和/或缺失。在一些实施方案中,作为取代、插入和/或缺失的非天然发生的突变可导致由内源HD-Zip转录因子基因编码的内源HD-Zip转录因子中一个或多个氨基酸的取代、插入和/或缺失。可用于本发明的核酸酶包括但不限于锌指核酸酶、转录激活因子样效应核酸酶(TALEN)、核酸内切酶(例如,Fok1)或CRISPR-Cas效应蛋白。
在一些实施方案中,可用于本发明的HD-Zip转录因子可以是HD-Zip II型(HD-ZipII)转录因子,其中HD-Zip II转录因子能够调节植物对光照的反应(例如,避荫反应(SAR))。在一些实施方案中,HD-Zip II转录因子可包括但不限于AtHB2、HB53和/或HB78的直向同源物。在一些实施方案中,HD-Zip II转录因子可以是同源异型框蛋白53(HB53)或同源异型框蛋白78(HB78)。
在一些实施方案中,本发明提供了与HD-Zip转录因子基因中的靶位点结合的引导核酸(例如,gRNA、gDNA、crRNA、crDNA),所述靶位点包含核苷酸序列,所述核苷酸序列编码:((a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
本发明的引导核酸的间隔序列可以与核苷酸序列的片段或部分互补,所述核苷酸序列编码(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID No:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
在一些实施方案中,靶核酸是内源HD-Zip转录因子基因,其能够调节植物对光照的反应。在一些实施方案中,靶核酸中的靶位点可以编码(a)包含与SEQ ID NO:1或SEQ IDNO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ IDNO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
在一些实施方案中,引导核酸包含具有SEQ ID NO:175-182中的任一个的核苷酸序列的间隔子。在一些实施方案中,HD-Zip转录因子可以是HD-Zip II型(HD-Zip II)转录因子,任选地,其中HD-Zip II转录因子可以是HB53或HB78。
在一些实施方案中,提供了包含本发明的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白的系统。在一些实施方案中,所述系统还可包含与引导核酸和CRISPR-Cas效应蛋白相关联的tracr核酸,任选地其中tracr核酸和引导核酸共价连接。
在一些实施方案中,提供了基因编辑系统,所述基因编辑系统包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中引导核酸包含与HD-Zip转录因子基因结合的间隔子序列。在一些实施方案中,可用于基因编辑系统的HD-Zip转录因子基因编码:(a)包含与SEQ IDNO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID No:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。在一些实施方案中,HD-Zip转录因子可以是HD-ZipII型(HD-Zip II)转录因子,任选地,其中HD-Zip II转录因子可以是HB53或HB78。
在一些实施方案中,基因编辑系统的引导核酸可包含具有与编码以下多肽的核苷酸序列互补的核苷酸序列的间隔子序列:(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ IDNo:9)的)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。在一些实施方案中,基因编辑系统的引导核酸可以包含具有SEQ ID No:175-182中的任一个的核苷酸序列的间隔子序列。在一些实施方案中,基因编辑系统还可包含与引导核酸和CRISPR-Cas效应蛋白相关联的tracr核酸,任选地,其中tracr核酸与引导核酸共价连接。
本发明还提供了包含CRISPR-Cas效应蛋白的复合物,所述CRISPR-Cas效应蛋白包含切割结构域和引导核酸,其中所述引导核酸与HD-Zip转录因子基因中的靶位点结合,所述HD-Zip转录因子基因编码(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID No:9)的序列的多肽,其中切割结构域切割HD-Zip转录因子基因中的靶链。
本文还提供了表达盒,其包含(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与HD-Zip转录因子基因中的靶位点结合的引导核酸,其中所述引导核酸包含与编码以下多肽的核苷酸序列互补并结合的间隔子序列:(a)包含与SEQ ID NO:1或SEQID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。在一些实施方案中,HD-Zip转录因子是HD-Zip II型(HD-Zip II)转录因子,任选地其中HD-Zip II转录因子是HB53或HB78。
在一些实施方案中,提供了编码具有突变的DNA结合位点的HD-Zip转录因子(例如HD-Zip II,例如HB53或HB78)的核酸,其中HD-Zip转录因子的突变的DNA结合位点包含破坏HD-Zip转录因子的DNA结合的突变。在一些实施方案中,突变可以消除HD-Zip转录因子与DNA的结合,或者可以将HD-Zip转录因子与DNA结合的能力降低至少75%(例如,至少约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%%、100%)。本发明还提供了包含本发明的核酸的植物或其部分。在一些实施方案中,当植物是玉米植物时,玉米植物可以包含矮小/半矮化表型。在一些实施方案中,植物可以是小麦植物或其部分,任选地,其中核酸可以包含在A基因组、B基因组、D基因组或其任意组合中。在一些实施方案中,和与一种或多种其它植物紧邻种植、不包含编码具有突变的DNA结合位点的HD-Zip转录因子(例如,HD-Zip II,例如HB53或HB78)的核酸、从而不包含降低的避荫反应的对照植物相比,具有降低的SAR的本发明的植物、玉米植物和/或小麦植物在与一种或多种其它植物紧邻种植时可以表现出增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,当彼此紧密种植时,包含降低的SAR的本发明植物比在相同条件下(例如,遮荫环境,例如,低R:FR比环境)生长的对照植物矮至少约5%。
在一些实施方案中,本发明的方法还可包括从在内源同源结构域-亮氨酸拉链(HD-Zip)转录因子中包含至少一个非天然突变的植物细胞或植物部分再生植物,其中所述突变破坏HD-Zip转录因子与DNA的结合。在一些实施方案中,和与一种或多种其它植物紧邻种植、在内源同源结构域-亮氨酸拉链(HD-Zip)转录因子中不包含至少一个非天然突变、从而不包含降低的避荫反应的对照植物相比,,当它们与一种或多种其它植物紧邻种植时,在内源同源结构域-亮氨酸拉链(HD-Zip)转录因子中包含至少一个非天然突变的植物可具有增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,突变是非天然发生的突变。在一些实施方案中,突变是缺失。在一些实施方案中,缺失是显性隐性突变。
可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统,所述系统可以以靶特异性方式引入突变。例如,编辑系统(例如,位点特异性或序列特异性编辑系统)可以包括但不限于CRISPR-Cas编辑系统、大范围核酸酶编辑系统、锌指核酸酶(ZFN)编辑系统、转录激活因子样效应核酸酶(TALEN)编辑系统、碱基编辑系统和/或引物编辑系统,其中的每一种都可以包含一种或多种多肽和/或一种或多种多核苷酸,当它们在细胞中作为系统表达时,可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中,编辑系统(例如,位点特异性或序列特异性编辑系统)可以包含一种或多种多核苷酸和/或一种或多种多肽,包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶和/或其他多肽和/或多核苷酸。
在一些实施方案中,编辑系统可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域),其可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,编辑系统可包含一个或多个切割结构域(例如,核酸酶),包括但不限于核酸内切酶(例如,Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN)。在一些实施方案中,编辑系统可包含一种或多种多肽,所述多肽包括但不限于脱氨酶(例如,胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5’flap核酸内切酶(FEN)。在一些实施方案中,编辑系统可以包含一种或多种多核苷酸,包括但不限于CRISPR阵列(CRISPR引导)核酸、延伸的引导核酸和/或逆转录酶模板。
在一些实施方案中,修饰或编辑HD-Zip转录因子的方法可包括将靶核酸(例如,编码HD-Zip转录因子的核酸)与与脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)融合的碱基编辑融合蛋白(例如,序列特异性DNA结合蛋白(例如,CRISPR-Cas效应蛋白或结构域))和引导核酸接触,其中引导核酸能够将碱基编辑融合蛋白引导/靶向靶核酸,从而编码靶核酸内的基因座。在一些实施方案中,碱基编辑融合蛋白和引导核酸可以包含在一种或多种表达盒中。在一些实施方案中,可将靶核酸与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性DNA结合融合蛋白和引导核酸可以以核糖核蛋白(RNP)的形式提供。在一些实施方案中,可将细胞与不止一种碱基编辑融合蛋白和/或一种或多种引导核酸接触,所述引导核酸可以靶向细胞中的一种或多种靶核酸。
在一些实施方案中,修饰或编辑HD-Zip转录因子的方法可包括将靶核酸(例如,编码HD-Zip转录因子的核酸)与与肽标签融合的序列特异性DNA结合融合蛋白(例如,序列特异性DNA结合蛋白(例如,CRISPR-Cas效应蛋白或结构域)、脱氨酶融合蛋白(其包含与能够与肽标签结合的亲和多肽融合的脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶))和引导核酸接触,其中引导核酸能够将序列特异性DNA结合融合蛋白引导至/靶向靶核酸,序列特异性DNA结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集到靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,可将序列特异性DNA结合融合蛋白结合肽标签的亲和多肽融合,以及可将脱氨酶与肽标签融合,从而将脱氨酶募集到序列特异性DNA结合融合蛋白和靶核酸。在一些实施方案中,序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,可将靶核酸与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性DNA结合融合蛋白、脱氨酶融合蛋白和引导核酸可以以核糖核蛋白(RNP)的形式提供。
在一些实施方案中,诸如引物编辑等方法可用于在内源HD-Zip转录因子基因中产生突变。在引物编辑中,将RNA依赖性DNA聚合酶(逆转录酶,RT)和逆转录酶模板(RT模板)与序列特异性DNA结合结构域组合使用,所述序列特异性DNA结合结构域赋予以序列特异性方式识别并结合靶标的能力,并且也能够在靶标内引起含PAM链的切口。DNA结合结构域可以是CRISPR-Cas效应蛋白,并且在该情况下,CRISPR阵列或引导RNA可以是包含延伸部分的延伸的引导核酸,所述延伸部分包含引物结合位点(PSB)和待整合到基因组(模板)中的编辑。类似于碱基编辑,引物编辑可以利用各种将用于编辑的蛋白质募集到靶位点的方法,此类方法包括在基因组编辑的选定过程中使用的蛋白质与核酸之间的非共价和共价相互作用。
在一些实施方案中,HD-Zip转录因子基因的突变可以是插入、缺失和/或点突变,其产生具有减少的DNA结合的HD-Zip转录因子(例如,突变的HD-Zip转录因子)。在一些实施方案中,植物部分可以是细胞。在一些实施方案中,植物或其植物部分可以是本文所述的任何植物或其部分。在一些实施方案中,可用于本发明的植物可以是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、糖用甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕。芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属某些种。在一些实施方案中,和与一种或多种其它植物紧邻种植的、在内源同源结构域-亮氨酸拉链(HD-Zip)转录因子中不包含至少一个非天然突变、从而不包含降低的避荫反应的对照植物相比,包含具有DNA结合的突变的内源HD-Zip转录因子的植物与一种或多种其它植物紧邻种植时,可包含增加的产量、降低的高度、降低的茎根比、降低的叶长;增加茎的机械强度;倒伏率降低;延缓衰老;提高光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,植物可以是玉米植物,任选地,其中玉米植物包含矮小/半矮化表型。
在一些实施方案中,引入内源HD-Zip转录因子并导致减少的DNA结合的突变可以是非天然发生的突变。在一些实施方案中,引入内源HD-Zip转录因子并导致减少的DNA结合的突变可以是一个或多个氨基酸残基的取代、插入和/或缺失。在一些实施方案中,被引入内源HD-Zip转录因子基因中导致减少的DNA结合的突变可以是缺失,任选地是SEQ ID NO:9的全部或部分氨基酸序列(例如,SEQ ID NO:9的1个、2个、3个、4个、5个、6个、7个或8个氨基酸残基)的缺失。
在一些实施方案中,HD-Zip转录因子可以是HD-Zip II型(HD-Zip II)转录因子,任选地,其中HD-Zip II转录因子可以是同源异型框蛋白53(HB53)或同源异型框蛋白78(HB78)。
在一些实施方案中,可用于本发明的编辑系统的序列特异性核酸结合结构域(DNA结合结构域)可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白。
在一些实施方案中,序列特异性DNA结合结构域可以是CRISPR-Cas效应蛋白,任选地,其中CRISPR-Cas效应蛋白可以来自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统或VI型CRISPR-Cas系统。在一些实施方案中,本发明的CRISPR-Cas效应蛋白可以来自II型CRISPR-Cas系统或V型CRISPR-Cas系统。在一些实施方案中,CRISPR-Cas效应蛋白可以是II型CRISPR-Cas效应蛋白,例如Cas9效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白,例如Cas12效应蛋白。
在一些实施方案中,CRISPR-Cas效应蛋白可包括但不限于Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5核酸酶,任选地其中CRISPR-Cas效应蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c效应蛋白。
在一些实施方案中,用于本发明的CRISPR-Cas效应蛋白可在其核酸酶活性位点(例如,RuvC、HNH,例如,Cas12a核酸酶结构域的RuvC位点,例如,Cas9核酸酶结构域的RuvC位点和/或HNH位点)包含突变。在其核酸酶活性位点具有突变,因此不再包含核酸酶活性的CRISPR-Cas效应蛋白,通常被称为“无活力的(dead)”,例如dCas。在一些实施方案中,在其核酸酶活性位点中具有突变的CRISPR-Cas效应蛋白结构域或多肽,与无突变的相同CRISPR-Cas效应蛋白(例如,切口酶,例如Cas9切口酶、Cas12a切口酶)相比,可具有受损的活性或降低的活性。
可用于本发明的CRISPR Cas9效应蛋白或CRISPR Cas9效应结构域可以是任何已知的或以后鉴定的Cas9核酸酶。在一些实施方案中,CRISPR Cas9多肽可以是来自例如链球菌属某些种(Streptococcus spp.)(例如,化脓性链球菌(S.pyogenes)、嗜热链球菌(S.Thermophilus))、乳杆菌属某些种(Lactobacillus spp.)、双歧杆菌属某些种(Bifidobacterium spp.)、坎德勒氏菌某些种(Kandleria spp.)、明串珠菌属某些种(Leuconostoc spp.)、酒球菌属某些种(Oenococcus spp.)、片球菌属某些种(Pediococcusspp.)、魏斯氏菌属某些种(Weissella spp.)和/或欧陆森氏菌属某些种(Olsenella spp.)的Cas9多肽。
在一些实施方案中,CRISPR-Cas效应蛋白可以是源自化脓性链球菌的Cas9多肽,并识别PAM序列基序NGG、NAG、NGA(Mali等人,Science 2013;339(6121):823-826)。在一些实施方案中,CRISPR-Cas效应蛋白可以是来源于嗜热链球菌的Cas9多肽,并且识别PAM序列基序NGGNG和/或NNAGAAW(W=A或T)(参见,例如,Horvath等人,Science,2010;327(5962):167-170,以及Deveau等人,J Bacteriol 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自变形链球菌(Streptococcus mutans)的Cas9多肽,并识别PAM序列基序NGG和/或NAAR(R=A或G)(参见,例如,Deveau等人,J BACTERIOL 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌(Streptococcus aureus)的Cas9多肽,并识别PAM序列基序NNGRR(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌(S.aureus)的Cas9蛋白,其识别PAM序列基序NGRRT(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽,其识别PAM序列基序N GRRV(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是Cas9多肽,其源自脑膜炎奈瑟氏球菌(Neisseria meningitidis)并识别PAM序列基序N GATT或N GCTT(R=A或G,V=A、G或C)(参见,例如,Hou等人,2013,1-6)。在上述实施方案中,N可以是任何核苷酸残基,例如A、G、C或T中的任一个。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白,其识别单个3’A、U或C的原间隔区侧翼序列(PFS)(或RNA PAM(rPAM))序列基序,所述序列基序可以位于靶核酸内。
在一些实施方案中,CRISPR-Cas效应蛋白可源自Cas12a,其是V型成簇的规律间隔的短回文重复序列(CRISPR)-Cas核酸酶。Cas12a在几个方面不同于更广为人知的II型CRISPR Cas9核酸酶。例如,Cas9识别位于其引导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(原间隔区、靶核酸、靶DNA)3’的富含G的原间隔区邻近基序(PAM)(3’-NGG),而Cas12a识别位于靶核酸5’的富含T的PAM(5’-TTN、5’-TTTN)。事实上,Cas9和Cas12a结合其引导RNA的方向与它们的N和C末端几乎相反。此外,Cas12a酶使用单引导RNA(gRNA,CRISPR阵列,crRNA),而不是天然Cas9系统中发现的双引导RNA(sgRNA(例如,crRNA和tracrRNA)),并且Cas12a加工其自身的gRNA。另外,Cas12a核酸酶活性产生交错的DNA双链断裂,而不是由Cas9核酸酶活性产生的平端,并且Cas12a依赖于单个RuvC结构域来切割两条DNA链,而Cas9利用HNH结构域和RuvC结构域来切割。
可用于本发明的CRISPR Cas12a效应蛋白/结构域可以是任何已知或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见,例如,美国专利第9,790,490号,其就其Cpf1(Cas12a)序列的公开内容通过引用并入本文)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶,其包含Cas12a的引导核酸结合结构域和/或Cas12a的活性、无活性或部分活性的DNA切割结构域。在一些实施方案中,可用于本发明的Cas12a可在核酸酶活性部位(例如,Cas12a结构域的RuvC位点)中包含突变。在其核酸酶活性部位具有突变并因此不再包含核酸酶活性的Cas12a结构域或Cas12a多肽通常被称为deadCas12a(例如,dCas12a)。在一些实施方案中,在其核酸酶活性部位中具有突变的Cas12a结构域或Cas12a多肽可能具有受损的活性,例如,可能具有切口酶活性。
任何用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见,例如,美国专利第0,167,457号和Thuronyi等人Nat.Biotechnol.37:1070–1079(2019),其中每一篇都就其胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶(包括但不限于灵长类动物(例如,人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠)的变体。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶具有约70%至约100%同一性(例如,与天然存在的胞嘧啶脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或值)。
在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白B mRNA编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、人活化诱导脱氨酶(hAID)、rAPOBEC1、FERNY和/或CDA1,任选地是pmCDA1、atCDA1(例如,At2g 19570)及其进化形式。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:188的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:189的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是CDA1脱氨酶,任选地是具有SEQ ID NO:190的氨基酸序列的CDA1。在一些实施方案中,胞嘧啶脱氨酶可以是FERNY脱氨酶,任选地是具有SEQ ID NO:191的氨基酸序列的FERNY。在一些实施方案中,胞嘧啶脱氨酶可以是进化的脱氨酶,例如,SEQ ID NO:192、SEQ ID NO:193或SEQ ID NO:194。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如,进化的脱氨酶)的氨基酸序列具有约70%至约100%同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可与SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193或SEQ ID NO:194的氨基酸序列具有约70%至约99.5%同一性(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性)(例如,与SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193或SEQ ID NO:194的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)。在一些实施方案中,可以为了在植物中表达而对编码胞嘧啶脱氨酶的多核苷酸进行密码子优化,并且经密码子优化的多肽可与参考多核苷酸具有约70%至99.5%同一性。
在一些实施方案中,本发明的核酸构建体还可编码尿嘧啶糖基化酶抑制剂(UGI)(例如,尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此,在一些实施方案中,编码CRISPR-Cas效应蛋白和胞嘧啶脱氨酶结构域(例如,编码包含与胞嘧啶脱氨酶结构域融合的CRISPR-Cas效应蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的CRISPR-Cas效应蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的脱氨酶蛋白结构域的融合蛋白)的核酸构建体还可编码尿嘧啶-DNA糖基化酶抑制剂(UGI),任选地其中可以为了在植物中表达而对UGI进行密码子优化。在一些实施方案中,本发明提供了包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI和/或编码其的一种或多种多核苷酸的融合蛋白,任选地,其中可以为了在植物中表达而对所述一种或多种多核苷酸进行密码子优化。在一些实施方案中,本发明提供了融合蛋白,其中可将CRISPR-Cas效应多肽、脱氨酶结构域和UGI与本文所述的肽标签和亲和多肽的任意组合融合,从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中,可将引导核酸与募集RNA基序连接,并且可将一个或多个脱氨酶结构域和/或UGI与能够与募集RNA基序相互作用的亲和多肽融合,从而将脱氨酶结构域和UGI募集到靶核酸上。
可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基-切除修复酶的任何蛋白质。在一些实施方案中,UGI结构域包含野生型UGI或其片段。在一些实施方案中,可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列具有约70%至约100%同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性,以及其中的任何范围或值)。在一些实施方案中,UGI结构域可包含SEQ ID NO:195的氨基酸序列或与SEQ ID NO:195的氨基酸序列具有约70%至约99.5%序列同一性(例如,与SEQ ID NO:195的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)的多肽。例如,在一些实施方案中,UGI结构域可包含SEQ ID NO:195的氨基酸序列的片段,所述片段与SEQ ID NO:195的的氨基酸序列的一部分连续核苷酸(例如,10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个连续核苷酸;例如,约10个、15个、20个、25个、30个、35个、40个、45个至约50个、55个、60个、65个、70个、75个、80个连续核苷酸)具有100%同一性。在一些实施方案中,UGI结构域可以是已知UGI(例如,SEQ ID NO:195)的变体,其与已知UGI具有约70%至约99.5%序列同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%序列同一性,以及其中的任何范围或值)。在一些实施方案中,可以为了在植物(例如,植物)中表达而对编码UGI的多核苷酸进行密码子优化,并且经密码子优化的多肽可与参考多核苷酸具有约70%至约99.5%同一性。
可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是来自任何生物体的任何已知的或后来鉴定的腺嘌呤脱氨酶(参见,例如,美国专利第10,113,163号,其就其腺嘌呤脱氨酶的公开内容通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨。在一些实施方案中,腺嘌呤脱氨酶可以分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可在靶核酸的有意义(例如,“+”;模板)链中产生A→G转换或在靶核酸的反义(如“-”,互补)链中产生T→C转换。
在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶具有约70%至100%同一性(例如,与天然存在的腺嘌吟诵脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或值)。在一些实施方案中,一种或多种脱氨酶不是天然存在的,并且可以被称为工程化的、突变的或进化的腺苷脱氨酶。因此,例如,工程化的、突变的或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域具有约70%至99.9%同一性(例如,与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%同一性,以及其中的任何范围或值)。在一些实施方案中,腺苷脱氨酶可以来自细菌(例如,大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌(Haemophilus influenzae)、新月柄杆菌(Caulobacter crescentus)等)。在一些实施方案中,可以为了在植物中表达而对编码腺嘌呤脱氨酶多肽/结构域的多核苷酸进行密码子优化。
在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域,例如tRNA特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域,例如突变/进化的tRNA特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中,TadA结构域可来自大肠杆菌。在一些实施方案中,TadA可以被修饰,例如被截短,可以相对于全长TadA缺失一个或多个N-末端和/或C-末端氨基酸(例如,可以相对于全长TadA缺失1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、6个、17个、18个、19个或20个N-末端和/或C-末端氨基酸残基)。在一些实施方案中,TadA多肽或TadA结构域不包含N-末端甲硫氨酸。在一些实施方案中,野生型大肠杆菌TadA包含SEQ ID NO:183的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌TadA*包含SEQ ID NO:184-187(例如,SEQ ID NO:184、185、186或187)的氨基酸序列。在一些实施方案中,可为在植物中表达而对编码TadA/TadA*的多核苷酸而进行密码子优化。
胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),引起基因组中的互补链中C至T的转换或G至A的转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶在靶核酸的有意义(例如,“+”;模板)链中产生C→T的转换或在靶核酸的反义(如“-”,互补)链中产生G→A的转换。
在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶在靶核酸的有意义(例如,“+”;模板)链中产生A→G的转换或在靶核酸的反义(如“-”,互补)链中产生T→C的转换。
编码包含序列特异性DNA结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明核酸构建体,以及编码所述碱基编辑器的核酸构建体/表达盒/载体,可以与引导核酸组合使用,用于修饰靶核酸,包括但不限于在靶核酸中产生C→T或G→A突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生C→T或G→A突变以改变氨基酸同一性;在编码序列中产生C→T或G→A突变以产生终止密码子;在编码序列中产生C→T或G→A突变以破坏起始密码子;在基因组DNA中产生点突变以破坏转录因子结合;和/或在基因组DNA中产生点突变以破坏剪接点。
编码包含序列特异性DNA结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码所述碱基编辑器的表达盒和/或载体可以与引导核酸组合使用,用于修饰靶核酸,包括但不限于在靶核酸中产生A→G或T→C突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生A→G或T→C突变以改变氨基酸同一性;在编码序列中产生A→G或T→C突变以产生终止密码子;在编码序列中产生A→G或T→C突变以破坏起始密码子;在基因组DNA中产生点突变以破坏转录因子结合;和/或在基因组DNA中产生点突变以破坏剪接点。
包含CRISPR-Cas效应蛋白或其融合蛋白的本发明核酸构建体可与引导RNA(gRNA、CRISPR阵列、CRISPR RNA、crRNA)组合使用,以修饰靶核酸,所述引导RNA被设计成与编码的CRISPR-Cas效应蛋白或结构域一起发挥作用。可用于本发明的引导核酸包含至少一个间隔区序列和至少一个重复序列。引导核酸能够与由本发明的核酸构建体编码和表达的CRISPR-Cas核酸酶结构域形成复合物,并且间隔区序列能够与靶核酸杂交,从而将复合物(例如,CRISPR-Cas效应子融合蛋白(例如,募集脱氨酶结构域和任选的UGI的与脱氨酶结构域融合的CRISPR-Cas效应子结构域和/或与肽标签或亲和多肽融合的CRISPR-Cas效应子结构域)引导至靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如,切割或编辑)或调节(例如,调节转录)。
例如,编码与胞嘧啶脱氨酶结构域连接的Cas9结构域(例如,融合蛋白)的核酸构建体可与Cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域连接的Cas9结构域(例如,融合蛋白)的核酸构建体可与Cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨基,从而编辑靶核酸。
同样,编码与胞嘧啶脱氨酶结构域或腺嘌脱氨酶结构域连接的Cas12a结构域(或其他选定的CRISPR-Cas核酸酶,例如C2c1、C2c3、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5)(例如,融合蛋白)的核酸构建体,可与Cas12a引导核酸(或其它选定的CRISPR-Cas核酸酶的引导核酸)组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。
如本文中所用,“引导核酸”、“引导RNA”、“gRNA”、“CRISPR RNA/DNA”、“crRNA”或“crDNA”意指包含至少一个与靶DNA互补(并与之杂交)的间隔区序列(例如,原间隔区)和至少一个重复序列(例如,V型Cas12a CRISPR-Cas系统的重复序列,或其片段或部分;II型Cas9 CRISPR-Cas系统的重复序列,或其片段;V型C2c1 CRISPR Cas系统的重复序列或其片段;例如C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5的CRISPR-Cas系统的重复序列或其片段)的核酸,其中重复序列可与间隔区序列的5’末端和/或3’末端连接。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统。
在一些实施方案中,Cas12a gRNA可以从5’至3’包含重复序列(全长或其部分(“柄(handle)”);例如,假结样结构)和间隔区序列。
在一些实施方案中,引导核酸可包含不一个重复序列-间隔区序列(例如,2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个重复序列-间隔区序列)(例如,重复序列-间隔区序列-重复序列,例如,重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列,等等)。本发明的引导核酸是合成的、人造的且不是在自然界中发现的。gRNA可以相当长,可以用作适体(如在MS2募集策略中那样)或其他从间隔区垂悬的RNA结构。
如本文中所用,“重复序列”是指,例如,野生型CRISPR Cas基因座(例如,Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列或与本发明核酸构建体编码的CRISPR-Cas效应蛋白一起发挥功能的合成crRNA的重复序列。可用于本发明的重复序列可以是CRISPR-Cas基因座(例如,I型、II型、III型、IV型、V型或VI型)的任何已知或后来鉴定的重复序列,或者其可以是被设计成在I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5’末端形成假结样结构(即,“柄”)。因此,在一些实施方案中,重复序列可以与来自野生型I型CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或大体上相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法,诸如使用通过CRISPRdb提供的CRISPRfinder(参见,Grissa等人Nucleic Acids Res.35(WebServer issue):W52-7)来确定。在一些实施方案中,重复序列或其部分在其3’末端与间隔区序列的5’末端连接,从而形成重复序列-间隔区序列(例如,引导核酸、指导RNA/DNA、crRNA、crDNA)。
在一些实施方案中,重复序列包含至少10个核苷酸,或基本上由至少10个核苷酸组成,或由至少10个核苷酸组成,这取决于特定的重复序列和包含该重复序列的引导核酸被加工还是未被加工(例如,约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个至100个或更多个核苷酸,或其中的任何范围或值)。
在一些实施方案中,重复序列包含约10至约20个、约10至约30个、约10至约45个、约10至约50个、约15至约30个、约15至约40个、约15至约45个、约15至约50个、约20至约30个、约20至约40个、约20至约50个、约30至约40个、约40至约80个、约50至约100个或更多个核苷酸,基本由所述核苷酸组成,或由所述核苷酸组成。
与间隔区序列的5’末端连接的重复序列可以包含重复序列的一部分(例如,野生型重复序列的5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个或更多个连续核苷酸)。在一些实施方案中,与间隔区序列的5’末端连接的重复序列的一部分在长度上可以是野生型CRISPR Cas重复核苷酸序列的约5至约10个连续核苷酸(例如,约5个、6个、7个、8个、9个、10个核苷酸),并且与野生型CRISPR Cas重复核苷酸序列的相同区域(例如,5’末端)具有至少90%序列同一性(例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)。在一些实施方案中,重复序列的一部分可在其5’末端包含假结样结构(例如,“柄”)。
如本文中所用,“间隔区序列”是与靶核酸(例如靶DNA)(例如,原间隔区)(例如,SEQ ID NO:1-9中的任一个的连续核苷酸;例如,SEQ ID No:175-182)互补的核苷酸序列。间隔区序列可以与靶核酸完全互补或大体上互补(例如,至少约70%(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)互补)。因此,在一些实施方案中,与靶核酸相比,间隔区序列可具有一个、两个、三个、四个或五个错配,所述错配可以是连续的或不连续的。在一些实施方案中,间隔区序列可以与靶核酸具有70%的互补性。在其他实施方案中,间隔区核苷酸序列可以与靶核酸具有80%的互补性。在其他实施方案中,间隔区核苷酸序列可与靶核酸(原间隔区)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性等。在一些实施方案中,间隔区序列与靶核酸100%互补。间隔区序列可具有约15个核苷酸至约30个核苷酸(例如,15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸,或其中的任何范围或值)的长度。因此,在一些实施方案中,间隔区序列可以在靶核酸(例如原间隔区)的长度为至少约15个核苷酸至约30个核苷酸的区域上具有完全互补性或大体互补性。在一些实施方案中,间隔区长度约为20个核苷酸。在一些实施方案中,间隔区长度为约21个、22个或23个核苷酸。
在一些实施方案中,引导核酸的间隔区序列的5’区域可以与靶DNA相同,而间隔区的3’区域可以与靶DNA(例如,V型CRISPR-Cas)大体上互补,或者引导核酸的间隔区序列的3’区域可与靶DNA相同,而间隔区的5’区域可以与靶DNA(例如,II型CRISPR-Cas)大体上互补,因此,间隔区序列与靶DNA的总体互补性可以小于100%。因此,例如,在V型CRISPR-Cas系统的引导核酸中,例如20个核苷酸的间隔区序列的5’区域(即,种子区域)中的前1个、2个、3个、4个、5个、6个、7个、8个、9个、10个核苷酸可以与靶DNA 100%互补,而间隔区序列的3’区中的其余核苷酸与靶DNA大体上互补(例如,至少约70%互补)。在一些实施方案中,间隔区序列5’末端的前1至8个核苷酸(例如,前1个、2个、3个、4个、5个、6个、7个、8个核苷酸以及其中的任何范围)可以与靶DNA 100%互补,而间隔区序列3’区域的其余核苷酸与靶DNA大体上互补(例如,至少约50%(例如,50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)互补)。
作为另外的实例,在II型CRISPR-Cas系统的引导核酸中,例如20个核苷酸的间隔区序列的3’区域(即,种子区)中的前1个、2个、3个、4个、5个、6个、7个、8个、9个、10个核苷酸可以与靶DNA100%互补,而间隔区序列的5’区域中的其余核苷酸与靶DNA大体上互补(例如,至少约70%互补)。在一些实施方案中,间隔区序列3’端的前1至10个核苷酸(例如,前1个、2个、3个、4个、5个、6个、7个、8个、9个、10个核苷酸以及其中的任何范围)可以与靶DNA100%互补,而间隔区序列5’区中的其余核苷酸与靶DNA大体上互补(例如,至少约50%(例如,至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或其中的任何范围或值)互补)。
在一些实施方案中,间隔区的种子区长度可为约8至约10个核苷酸,长度可为约5至约6个核苷酸,或长度可为约6个核苷酸。
如本文中所用,“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区域”或“基因组中的靶区域”是指与本发明的引导核酸中的间隔区序列完全互补(100%互补)或大体上互补(例如,至少70%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)互补)。对CRISPR-Cas系统有用的靶区域可以紧邻生物体基因组(例如,植物基因组)中PAM序列的3’(例如,V型CRISPR-Cas系统)或5’(例如,II型CRISPR-Cas系统)。靶区域可以选自紧邻PAM序列定位的至少15个连续核苷酸(例如,16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸等)的任何区域。
“原间隔区序列”是指靶双链DNA,具体是指与CRISPR重复-间隔区序列(例如,引导核酸、CRISPR阵列、crRNA)的间隔区序列完全互补或大体上互补(并杂交)的靶DNA的部分(例如,或基因组中的靶区域)。
在V型CRISPR-Cas(例如,Cas12a)系统和II型CRISPR-Cas(Cas9)系统的情况下,原间隔区序列的两侧是(例如,紧邻)原间隔区邻近基序(PAM)。对于IV型CRISPR-Cas系统,PAM位于非靶链的5’末端和靶链的3’末端(例如,参见下文)。
3’AAANNNNNNNNNNNNNNNNNNN-5’靶链(SEQ ID NO:199)
||||
5’TTTNNNNNNNNNNNNNNNNNNN-3’非靶链(SEQ ID NO:199)
在II型CRISPR-Cas(例如,Cas9)系统的情况下,PAM紧邻靶区域的3’。I型CRISPR-Cas系统的PAM位于靶链的5’。没有已知的用于III型CRISPR-Cas系统的PAM。Makarova等人描述了CRISPR系统的所有类别、类型和亚型的命名法(Nature Reviews Microbiology 13:722-736(2015))。引导核酸结构和PAM由R.Barrangou(Genome Biol.16:247(2015))描述。
规范的Cas12a PAM富含T。在一些实施方案中,规范的Cas12a PAM序列可以是5’-TTN、5’-TTTN或5’TTTV。在一些实施方案中,典型的Cas9(例如,化脓性链球菌)PAM可以是5’-NGG-3’。在一些实施方案中,可以使用非规范的PAM,但是可能效率较低。
本领域技术人员可以通过已建立的实验和计算方法确定其他PAM序列。因此,例如,实验方法包括靶向两侧为所有可能的核苷酸序列的序列,并鉴定不经历靶向的序列成员,诸如通过靶质粒DNA的转化(Esvelt等人2013.Nat.Methods 10:1116-1121;Jiang等人2013.Nat.Biotechnol.31:233-239)。在一些方面,计算方法可包括对天然间隔区进行BLAST搜索以鉴定噬菌体或质粒中的原始靶DNA序列,并比对这些序列以确定邻近靶序列的保守序列(Briner和Barrangou 2014.Appl. Environ.Microbiol.80:994-1001;Mojica等人2009.Microbiology 155:733-740)。
在一些实施方案中,本发明提供了包含本发明核酸构建体的表达盒和/或载体(例如,本发明编辑系统的一个或多个组分)。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中,编码碱基编辑器的本发明的核酸构建体(例如,包含CRISPR-Cas效应蛋白和脱氨酶结构域的构建体(例如,融合蛋白))或用于碱基编辑的组分(例如,与肽标签或亲和多肽融合的CRISPR-Cas效应蛋白,与肽标签或亲和多肽融合的脱氨酶结构域,和/或与肽标签或亲和多肽融合的UGI),可以包含在与包含同一表达盒或载体上或者包含在与包含所述一种或多种引导核酸的表达盒或载体分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含引导核酸的一个或多个表达盒或一个或多个载体分开的一个或多个表达盒或一个或多个载体上时,可以例如在提供(例如,与靶核酸接触)包含引导核酸的表达盒之前、与之同时或之后,将靶核酸以彼此之间的任何顺序与编码碱基编辑器或用于碱基编辑的组分的一个或多个表达盒或一个或多个载体和引导核酸接触(例如,与其一起提供)。
如本领域已知的,本发明的融合蛋白可包含序列特异性DNA结合结构域、CRISPR-Cas多肽和/或与肽标签或与肽标签相互作用的亲和多肽融合的脱氨酶结构域,用于将脱氨酶募集到靶核酸。募集方法还可包括与RNA募集基序和脱氨酶(其与能够与RNA募集基序相互作用的亲和多肽融合)连接的引导核酸,从而将脱氨酶募集到靶核酸上。或者,化学相互作用可用于将多肽(例如,脱氨酶)募集到靶核酸上。
可用于本发明的肽标签(例如,表位)可包括但不限于GCN4肽标签(例如,Sun标签)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、甲硫氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签和/或VSV-G表位。可以与多肽连接的以及对于其存在可以与另一种多肽连接的相应的亲和多肽的任何表位,都可以在本发明中用作肽标签。在一些实施方案中,肽标签可包含1个或2个或更多个拷贝的肽标签(例如,重复单元、多聚化表位(例如,串联重复))(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个重复单元)。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,抗体可以是scFv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如,为亲和相互作用而进化的),包括但不限于亲和体、anticalin、单体(monobody)和/或DARPin(参见,例如,Sha等人,Protein Sci.26(5):910-924(2017));Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013)),美国专利第9,982,053号,所述专利中的每一篇均就与亲和体、抗anticalin、单体和/或DARPin相关的教导通过引用以其整体并入。
在一些实施方案中,引导核酸可与RNA募集基序连接,待募集的多肽(例如,脱氨酶)可与与RNA募集基序结合的亲和多肽融合,其中引导核酸与靶核酸结合,RNA募集基序与亲和多肽结合,从而将多肽募集到引导核酸,并使靶核酸与多肽(例如,脱氨酶)接触。在一些实施方案中,两种或更多种多肽可被募集到引导核酸,从而使靶核酸与两种或更多种多肽(例如,脱氨酶)接触。
在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶,引导核酸可以是与RNA募集基序连接的延伸的引导核酸。在一些实施方案中,RNA募集基序可以位于延伸的引导核酸的延伸部分的3’末端(例如,5’-3’,重复序列-间隔区-延伸的部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中,RNA募集基序可以嵌入延伸的部分。
在本发明的一些实施方案中,可将延伸的引导RNA和/或引导RNA与一个或两个或更多个RNA募集基序(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个基序,例如,至少10至约25个基序)连接,任选地,其中两个或更多个RNA募集基序可以是相同的RNA募集基序或不同的RNA募集基序。在一些实施方案中,RNA募集基序和相应的亲和多肽可以包括但不限于端粒酶Ku结合基序(例如,Ku结合发夹)和相应的亲和多肽Ku(例如,Ku异二聚体)、端粒酶Sm7结合基序和相应的亲和多肽Sm7、MS2噬菌体操纵子茎环和相应的亲和多肽MS2外壳蛋白(MCP)、PP7噬菌体操纵子茎环和相应的亲和多肽PP7外壳蛋白(PCP)、SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白、PUF结合位点(PBS)和亲和多肽Pumilio/fem-3 mRNA结合因子(PUF),和/或合成的RNA-适体和适体配体作为相应的亲和多肽。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2外壳蛋白(MCP)。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3 mRNA结合因子(PUF)。
在一些实施方案中,用于募集多肽和核酸的组分可以是通过化学相互作用起作用的那些组分,所述化学相互作用包括但不限于,雷帕霉素诱导的FRB–FKBP的二聚化;生物素-链霉抗生物素蛋白素;SNAP标签;Halo标签;CLIP标签;由化合物诱导的DmrA-DmrC异二聚体;双功能配体(例如,两种蛋白结合化学物质融合在一起,例如二氢叶酸还原酶(DHFR))。
在一些实施方案中,为了在植物中表达而优化的本发明的核酸构建体、表达盒或载体可以与包含一种或多种相同的多核苷酸(但其未为了在植物中表达而进行过密码子优化)的核酸构建体、表达盒或载体具有约70%至100%(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)同一性。
在一些实施方案中,本发明提供了包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。
在一些实施方案中,提供了编辑植物或植物部分中的内源HD-Zip转录因子基因的方法,所述方法包括将植物或植物部分中的HD-Zip转录因子基因中的靶位点与胞嘧啶碱基编辑系统接触,所述胞嘧啶碱基编辑系统包含胞嘧啶脱氨酶和与HD-Zip转录因子中的靶位点结合的核酸结合结构域,所述HD-Zip转录因子基因编码(a)包含与SEQ ID NO:1或SEQ IDNO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2X2LTX3CPX4CER(SEQ IDNO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而编辑植物或其部分中的内源HD-Zip转录因子基因,并产生包含至少一个在内源HD-Zip转录因子基因中具有突变的细胞的植物或其部分。
在一些实施方案中,提供了编辑植物或植物部分中的内源HD-Zip转录因子基因的方法,所述方法包括将植物或植物部分中的HD-Zip转录因子基因中的靶位点与腺苷碱基编辑系统接触,所述腺苷碱基编辑系统包含腺苷氨酶和与HD-Zip转录因子中的靶位点结合的核酸结合结构域,所述HD-Zip转录因子基因编码(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;(e)多肽,其包含:(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列和/或(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而编辑植物或其部分中的内源HD-Zip转录因子基因,并产生包含至少一个在内源HD-Zip转录因子基因中具有突变的细胞的植物或其部分。
在一些实施方案中,提供了检测突变型HD-Zip(内源HD-Zip转录因子基因中的突变)的方法,所述方法包括在植物基因组中检测编码SEQ ID NO:1-98中任一个的氨基酸序列的核酸中的缺失,其中SEQ ID NO:1-98中任一个的氨基酸序列包含SEQ ID NO:9的氨基酸序列,并且该缺失在编码SEQ ID NO:9的氨基酸序列的核苷酸序列中。
在一些实施方案中,本发明提供了检测内源HD-Zip基因中的突变的方法,其包括在植物基因组中检测编码SEQ ID NO:1-98中的任一多肽序列的至少一种的核苷酸序列。
在一些实施方案中,本发明提供了产生包含内源HD-Zip转录因子基因中的突变和至少一种目标多核苷酸的植物的方法,所述方法包括将包含内源HD-Zip转录因子基因中的至少一种突变的本发明植物(第一植物)与包含至少一种目标多核苷酸的第二植物杂交以产生后代植物;以及选择包含HD-Zip转录因子基因的至少一个突变和至少一种目标多核苷酸的后代植物,从而产生包含内源HD-Zip转录因子基因中的突变和至少一种目标多核苷酸中的植物。
本发明还提供了产生包含内源HD-Zip转录因子基因中的突变和至少一种目标多核苷酸的植物的方法,所述方法包括将至少一种目标多核苷酸引入本发明的包含HD-Zip转录因子基因中的至少一个突变的植物中,从而产生包含HD-Zip转录因子基因中的至少一个突变和至少一种目标多核苷酸的植物。
在一些实施方案中,本发明提供了产生包含内源HD-Zip转录因子基因中的突变和至少一种目标多核苷酸的植物的方法,所述方法包括将至少一种目标多核苷酸引入包含内源HD-Zip转录因子基因中的至少一个突变的本发明植物中,从而产生包含HD-Zip转录因子基因中的至少一个突变和至少一种目标多核苷酸的植物。
目标多核苷酸可以是能够赋予植物所需表型或以其它方式改变植物的表型或基因型的任何多核苷酸。在一些实施方案中,目标多核苷酸可以是赋予除草剂耐受性、昆虫抗性、疾病抗性、增加的产量、增加的养分利用效率或非生物胁迫抗性的多核苷酸。
在一些实施方案中,提供了产生包含内源HD-Zip转录因子基因中的突变并具有高度矮化或高度矮小表型的植物的方法,所述方法包括将在内源HD-Zip转录因子基因中具有至少一个突变的本发明植物(第一植物)与包含高度矮化或高度矮小表型的第二植物杂交以产生后代植物;以及选择包含HD-Zip转录因子基因中的至少一个突变和高度矮化或高度矮小表型的后代植物,从而产生具有高度矮化或高度矮小并包含内源HD-Zip转录因子基因中的至少一个突变的植物。
本发明还提供了控制包含一种或多种(多种)本发明植物的容器(例如,罐或种子托盘等)、生长室、温室、田地(例如,耕地)、休闲娱乐区、草坪和/或路边中的杂草的方法,其包括向生长在容器、生长室、田地或温室中的一种或多种(多种)本发明植物施用除草剂,从而控制其中一种或多种植物正在生长的容器、生长室、温室、田地、休闲娱乐区、草坪和/或路边的杂草。
在一些实施方案中,提供了减少植物(或多种植物)上的昆虫捕食的方法,其包括向本发明的一种或多种(多种)植物施用杀虫剂,从而减少一种或多种(多种)植物上的昆虫捕食。在一些实施方案中,一种或多种植物可以生长在容器、生长室、田地、休闲娱乐区(例如,运动场、高尔夫球场)、草坪、路边或温室中。
在一些实施方案中,本发明提供了减少植物上的真菌病害的方法,其包括向一种或多种(多种)本发明植物施用杀真菌剂,从而减少一种或多种(多种)植物上的真菌病害。在一些实施方案中,一种或多种植物可以生长在容器、生长室、田地、休闲娱乐区(例如,运动场、高尔夫球场)、草坪、路边或温室中。
本发明的核酸构建体(例如,包含序列特异性DNA结合结构域、CRISPR-Cas效应子结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)和包含其的表达盒/载体可用作本发明的编辑系统,用于修饰靶核酸和/或其表达。
可以使用本发明的多肽、多核苷酸、RNP、核酸构建体、表达盒和/或载体修饰(例如,突变,例如碱基编辑、切割、切刻等)任何植物或植物部分(或植物的分组,例如,分成属或更高级分类)的靶核酸,所述植物包括被子植物、裸子植物、单子叶植物、双子叶植物、C3植物、C4植物、CAM植物、苔藓植物、蕨类植物和/或拟蕨类植物、微藻和/或大型藻类。可以如本文所述进行修饰的植物和/或植物部分可以是任何植物物种/品种/栽培品种的植物和/或植物部分。在一些实施方案中,可以如本文所述进行修饰的植物是单子叶植物。在一些实施方案中,可以如本文所述进行修饰的植物是双子叶植物。
如本文中所用,术语“植物部分”包括但不限于生殖组织(例如,花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花芽、胚珠、种子、胚胎、坚果、果仁、穗、穗轴和外壳);营养组织(例如,叶柄、茎(stem)、根、根毛、根尖、髓、胚芽鞘、茎(stalk)、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如,韧皮部和木质部);特化细胞,诸如表皮细胞、薄壁细胞、厚角细胞、厚壁细胞、气孔、保卫细胞、角质层、叶肉细胞;愈伤组织;和插枝。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文中所用,“茎”是指包括叶和茎在内的地上部分。如本文中所用,术语“组织培养”包括组织、细胞、原生质体和愈伤组织的培养物。
如本文中所用,“植物细胞”是指植物的结构和生理单位,其通常包括细胞壁,但也包括原生质体。本发明的植物细胞可呈分离的单细胞形式,或者可以是培养的细胞,或者可以是更高组织单位的一部分,例如植物组织(包括愈伤组织)或植物器官。在一些实施方案中,植物细胞可以是藻类细胞。“原生质体”是没有细胞壁或只有部分细胞壁的分离的植物细胞。因此,在本发明的一些实施方案中,包含本发明核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的一些方面,植物部分可以是植物种质。在一些方面,植物细胞可以是不能再生为植物的非繁殖植物细胞。
“植物细胞培养物”意指植物单位例如原生质体、细胞培养细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、合子和不同发育阶段的胚胎的培养物。
如本文中所用,“植物器官”是植物的独特且明显结构化和分化的部分,例如根、茎、叶、花蕾或胚。
如本文中所用,“植物组织”是指组织成结构和功能单位的一群植物细胞。包括在植物中或培养中的任何植物组织。该术语包括但不限于完整植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单位的任何植物细胞群。该术语与上面列出的或原本由本定义包含的任何特定类型的植物组织结合使用,或者在所述任何特定类型的植物组织不存在时该术语的使用,并不排除任何其他类型的植物组织。
在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中所述转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,可以通过将转基因植物与非转基因植物交配,并在后代中选择包含所需基因编辑但不包含用于产生所述编辑的转基因的植物,从由转基因组织或细胞发育的植物中消除转基因。
任何包含能够调节植物避荫反应(SAR)的内源HD-Zip转录因子基因的植物都可以如本文所述进行修饰,以减少/减弱或消除植物中的SAR。在一些实施方案中,植物可以是单子叶植物。在一些实施方案中,植物可以是双子叶植物。
可以如本文所述进行修饰的植物的非限制性实例可包括但不限于草坪草(例如,早熟禾(bluegrass)、翦股颖、黑麦草、羊茅草)、羽状苇草(feather reed grass)、丛生毛草、芒草、芦竹、柳枝稷、蔬菜作物,包括洋蓟、大头菜、芝麻菜、韭菜、芦笋、莴苣(例如,头、叶、长叶莴苣)、暗绿叶黄体芋(malanga)、瓜类(例如,甜瓜、西瓜、克伦肖瓜(crenshaw)、白兰瓜、罗马甜瓜)、油菜作物(例如,球芽甘蓝、卷心菜、花椰菜、西兰花、羽衣甘蓝、无头甘蓝、大白菜、小白菜)、刺菜蓟、胡萝卜、纳帕(napa)、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲萝卜、菊苣、胡椒、马铃薯、葫芦科植物(例如,西葫芦、黄瓜、密生西葫芦、南瓜(pumpkin)、蜜瓜、西瓜、罗马甜瓜)、水萝卜、干球洋葱、芜菁甘蓝、茄子、婆罗门参、宽叶苦苣、青葱、菊苣、大蒜、菠菜、大葱、南瓜、绿叶蔬菜、甜菜(糖用甜菜和饲料用甜菜)、甘薯、牛皮菜、山葵、番茄、芜菁和香料;水果作物,诸如苹果、杏、樱桃、油桃、桃、梨、李子、梅子、樱桃、榅桲、无花果、坚果(例如,栗子、山核桃、开心果、榛子、开心果、花生、核桃、澳洲坚果、杏仁等)、柑橘(例如,克莱门氏小柑橘、金橘、橙子、葡萄柚、橘子、柑橘、柠檬、酸橙等)、蓝莓、黑树莓、波森莓、蔓越莓、醋栗果、醋栗、罗甘莓、覆盆子、草莓、黑莓、葡萄(葡萄酒和餐桌)、鳄梨、香蕉、奇异果、柿子、石榴、菠萝、热带水果、梨果、甜瓜、芒果、木瓜和荔枝,大田作物诸如三叶草、苜蓿、梯牧草、月见草、草地泡沫(meadow foam)、玉米/玉蜀黍(大田、甜玉米、爆米花)、啤酒花、霍霍巴、荞麦、红花、藜麦、小麦、水稻、大麦、黑麦、小米、高粱、燕麦、黑小麦、高粱、烟草、木棉、豆科植物(豆类(例如绿色和干燥的)、扁豆、豌豆、大豆)、油料植物(油菜(rape)、油菜(canola)、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生、油棕)、浮萍、拟南芥、纤维植物(棉花、亚麻、大麻、黄麻)、大麻(例如,大麻(Cannabis sativa)、印度大麻和莠草大麻)、樟科(肉桂、樟脑)或诸如咖啡、甘蔗、茶和天然橡胶植物等植物;和/或诸如开花植物、仙人掌、肉质植物和/或诸如开花植物、仙人掌、肉质植物等花坛植物和/或观赏植物(例如,玫瑰、郁金香、紫罗兰),以及诸如森林树木(阔叶树和常绿植物,诸如针叶树;例如,榆树、白蜡树、橡树、枫树、冷杉、云杉、雪松、松树、桦树、柏树、桉树、柳树)以及灌木和其他苗木等树木。在一些实施方案中,本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰玉米、大豆、小麦、芸苔、水稻、番茄、辣椒或向日葵。
在一些实施方案中,可以如本文所述进行修饰的植物可包括但不限于玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、糖用甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属某些种(例如,欧洲油菜、甘蓝、芜菁、芥菜型油菜和/或黑芥)。
在一些实施方案中,可以如本文所述进行修饰的植物是玉米(即,玉米、玉蜀黍),任选地,其中玉米植物包含高度矮小/半矮化表型。
在一些实施方案中,可以如本文所述进行修饰的植物是小麦(例如,普通小麦、硬粒小麦和/或密穗小麦(T.compactum))。在一些实施方案中,小麦植物可以在其A基因组、B基因组和/或D基因组中的内源HD-Zip转录因子中包含至少一个非天然突变。
因此,根据本发明优先处理的植物或植物栽培品种包括通过遗传修饰获得遗传物质的所有植物,所述遗传物质赋予这些植物特别有利的有用特性(“性状”)。此类特性的实例是更好的植物生长、活力、胁迫耐受性、站立能力、抗倒伏性、营养吸收、植物营养和/或产量,特别是改善的生长、对高温或低温的增强的耐受性、对干旱或水或土壤盐度水平的增强的耐受性、增强的开花性能、更容易收获、加速成熟、更高产量、收获产品的更高品质和/或更高营养价值、收获产品的更好储存寿命和/或可加工性。
此类性质的进一步和特别强调的实例是对动物和微生物害虫,诸如对昆虫、蛛形类、线虫类、螨虫类、蛞蝓和蜗牛的增强的抗性,这归因于例如植物中形成的毒素。在编码赋予对此类动物和微生物害虫(特别是昆虫)的耐受性的蛋白质的DNA序列中,将特别提及来自苏云金芽孢杆菌(Bacillus thuringiensis)的编码Bt蛋白质的遗传物质,其广泛描述于文献中并且为本领域技术人员所熟知。还将提及从细菌诸如发光杆菌属(Photorhabdus)中提取的蛋白质(WO97/17432和WO98/08932)。具体而言,将提及Bt Cry或VIP蛋白质,其包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段,以及还有其杂交体或组合,尤其是CrylF蛋白或衍生自CrylF蛋白质的杂交体(例如,杂交CrylA-CrylF蛋白或其毒性片段)、CrylA型蛋白或其毒性片段,优选地,CrylAc蛋白或衍生自CrylAc蛋白的杂交体(例如,杂交CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段、Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段、CrylA.105蛋白或其毒性片段、VIP3Aa19蛋白、VIP3Aa20蛋白、COT202或COT203棉花事件中产生的VIP3A蛋白、VIP3Aa蛋白或其毒性片段(如Estruch等人(1996),Proc Natl Acad Sci US A.28;93(11):5389-94中所描述的)、如WO2001/47952中所述的Cry蛋白、来自致病杆菌属(Xenorhabdus)(如WO98/50427中所述的)、沙雷氏菌属(Serratia)(特别是来自嗜虫沙雷氏菌(S.entomophila))或发光杆菌属(Photorhabdus)物种菌株的杀虫蛋白,诸如WO98/08932中所述的来自发光杆菌属的Tc蛋白。此外,在某些氨基酸(1-10个,优选1-5个)上不同于任何上述序列(特别是它们的毒性片段的序列)的或者与转运肽(诸如质体转运肽)或另一种蛋白质或肽融合的这些蛋白质中任一种的任何变体或突变体,也包括在本文中。
此类性质的另一个特别强调的实例是赋予对一种或多种除草剂(例如,咪唑啉酮类、磺酰脲类、草甘膦或草丁膦)的耐受性。在编码赋予转化的植物细胞和植物对某些除草剂的耐受性的蛋白质的DNA序列(即目标多核苷酸)中,将特别提及WO2009/152359中描述的bar或PAT基因或天蓝色链霉菌(Streptomyces coelicolor)基因(所述基因赋予对草铵膦除草剂的耐受性)、编码合适的EPSPS(5-烯醇丙酮酰莽草酸-3-磷酸合酶)的基因(其赋予对以EPSPS为靶标的除草剂,特别是诸如草甘膦及其盐等除草剂的耐受性)、编码草甘膦-n-乙酰基转移酶的基因或编码草甘膦氧化还原酶的基因。其他合适的除草剂耐受性性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如,WO2007/024782)、突变的拟南芥ALS/AHAS基因(例如,美国专利6,855,533)、编码赋予对2,4-D(2,4-二氯苯氧基乙酸)耐受性的2,4-D-单加氧酶的基因和编码赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性的麦草畏单加氧酶的基因。
此类性质的进一步特别强调的实例是对植物病原性真菌、细菌和/或病毒的增强的抗性,这归因于例如系统获得性抗性(SAR)、系统素、植物抗毒素、诱发剂(elicitor)以及还有抗性基因和相应地表达的蛋白质和毒素。
可以根据本发明优先处理的转基因植物或植物栽培品种中特别有用的转基因事件包括事件531/PV-GHBK04(棉花,昆虫控制,于WO2002/040677中描述的),事件1143-14A(棉花,昆虫控制,未保藏,于WO2006/128569中描述的);事件1143-51B(棉花,昆虫控制,未保藏,于WO2006/128570中描述的);事件1445(棉花,除草剂耐受性,未保藏,于US-A 2002-120964或WO2002/034946中描述);事件17053(水稻,除草剂耐受性,以PTA-9843保藏,于WO2010/117737中描述的);事件17314(水稻,除草剂耐受性,以PTA-9844保藏,于WO2010/117735中描述的);事件281-24-236(棉花,昆虫控制-除草剂耐受性,以PTA-6233保藏,于WO2005/103266或US-A 2005-216969中描述的);事件3006-210-23(棉花,昆虫控制-除草剂耐受性,以PTA-6233保藏,于US-A 2007-143876或WO2005/103266中描述的);事件3272(玉米,品质性状,以PTA-9972保藏,于WO2006/098952或US-A 2006-230473中描述的);事件33391(小麦,除草剂耐受性,以PTA-2347保藏,于WO2002/027004中描述的),事件40416(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-11508保藏,于WO 11/075593中描述的);事件43A47(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-11509保藏,于WO2011/075595中描述的);事件5307(玉米,昆虫控制,以ATCC PTA-9561保藏,于WO2010/077816中描述的);事件ASR-368(翦股颖,除草剂耐受性,以ATCC PTA-4816保藏,于US-A 2006-162007或WO2004/053062中描述的);事件B16(玉米,除草剂耐受性,未保藏,于US-A 2003-126634中描述的);事件BPS-CV127-9(大豆,除草剂耐受性,以NCIMB号41603保藏的,于WO2010/080829中描述的);事件BLRl(欧洲油菜,雄性不育的恢复,NCIMB 41193保藏,于WO2005/074671中描述的),事件CE43-67B(棉花,昆虫控制,以DSM ACC2724保藏的,于US-A 2009-217423或WO2006/128573中描述的);事件CE44-69D(棉花,昆虫控制,未保藏,于US-A 2010-0024077中描述的);事件CE44-69D(棉花,昆虫控制,未保藏,于WO2006/128571中描述的);事件CE46-02A(棉花,昆虫控制,未保藏,于WO2006/128572中描述的);事件COT102(棉花,昆虫控制,未保藏,于US-A 2006-130175或WO2004/039986中描述的);事件COT202(棉花,昆虫控制,未保藏,于US-A 2007-067868或WO2005/054479中描述的);事件COT203(棉花,昆虫控制,未保藏,于WO2005/054480中描述的);事件DAS21606-3/1606(大豆,除草剂耐受性,以PTA-11028保藏,于WO2012/033794中描述的),事件DAS40278(玉米,除草剂耐受性,以ATCCPTA-10244保藏,于WO2011/022469中描述的);事件DAS-44406-6/pDAB8264.44.06.l(大豆,除草剂耐受性,以PTA-11336保藏,于WO2012/075426中描述的),事件DAS-14536-7/pDAB8291.45.36.2(大豆,除草剂耐受性,以PTA-11335保藏,于WO2012/075429中描述的),事件DAS-59122-7(玉米,昆虫控制-除草剂耐受性,以ATCC PTA 11384保藏,于US-A2006-070139中描述的)、玉米事件DAS-59132(玉米,昆虫控制-除草剂耐受性,未保藏,于WO2009/100188中描述的);事件DAS68416(大豆,除草剂耐受性,以ATCC PTA-10442保藏,于WO2011/066384或WO2011/066360中描述的);事件DP-098140-6(玉米,除草剂耐受性,以ATCC PTA-8296保藏,于US-A 2009-137395或WO08/112019中描述的);事件DP-305423-1(大豆,质量性状,未保藏,于US-A 2008-312082或WO2008/054747中描述的);事件DP-32138-1(玉米,杂交系统,以ATCC PTA-9158保藏,于US-A 2009-0210970或WO2009/103049中描述的);事件DP-356043-5(大豆,除草剂耐受性,以ATCC PTA-8287保藏,于US-A 2010-0184079或WO2008/002872中描述的);事件EE-I(brinjal,昆虫控制,未保藏,于WO07/091277中描述的);事件Fil 17(玉米,除草剂耐受性,以ATCC 209031保藏,于US-A 2006-059581或WO98/044140中描述的);事件FG72(大豆,除草剂耐受性,以PTA-11041保藏,于WO2011/063413中描述的),事件GA21(玉米,除草剂耐受性,以ATCC 209033保藏,于US-A 2005-086719或WO98/044140中描述的);事件GG25(玉米,除草剂耐受性,以ATCC 209032保藏,于US-A 2005-188434或WO98/044140中描述的);事件GHB119(棉花,昆虫控制-除草剂耐受性,以ATCC PTA-8398保藏,于WO2008/151780中描述的);事件GHB614(棉花,除草剂耐受性,以ATCC PTA-6878保藏,于US-A 2010-050282或WO2007/017186中描述的);事件GJ11(玉米,除草剂耐受性,以ATCC209030保藏,于US-A 2005-188434或WO98/044140中描述的);事件GM RZ13(糖用甜菜,病毒抗性,以NCIMB-41601保藏,于WO2010/076212中描述的);事件H7-l(糖用甜菜,除草剂耐受性,以NCIMB 41158或NCIMB 41159保藏,于US-A 2004-172669或WO2004/074492中描述的);事件JOPLINl(小麦,疾病耐受性,未保藏,于US-A 2008-064032中描述的);事件LL27(大豆,除草剂耐受性,以NCIMB41658保藏,于WO2006/108674或US-A 2008-320616中描述的);事件LL55(大豆,除草剂耐受性,以NCIMB 41660保藏,于WO2006/108675或US-A 2008-196127中描述的);事件LLcotton25(棉花,除草剂耐受性,以ATCC PTA-3343保藏,于WO2003/013224或USA 2003-097687中描述的);事件LLRICE06(水稻,除草剂耐受性,以ATCC 203353保藏,于美国专利第6,468,747号或WO2000/026345中描述的);事件LLRice62(水稻,除草剂耐受性,以ATCC 20335保藏,于WO2000/026345中描述的),事件LLRICE601(水稻,除草剂耐受性,以ATCC PTA-2600保藏,于US-A 2008-2289060或WO2000/026356中描述的);事件LY038(玉米,品质性状,以ATCC PTA-5623保藏,于US-A 2007-028322或WO2005/061720中描述的);事件MIR162(玉米,昆虫控制,以PTA-8166保藏,于US-A 2009-300784或WO2007/142840中描述的);事件MIR604(玉米,昆虫控制,未保藏,于US-A 2008-167456或WO2005/103301中描述的);事件MON15985(棉花,昆虫控制,以ATCC PTA-2516保藏,于US-A 2004-250317或WO2002/100163中描述的);事件MON810(玉米,昆虫控制,未保藏,于US-A 2002-102582中描述的);事件MON863(玉米,昆虫控制,以ATCC PTA-2605保藏,于WO2004/011601或US-A2006-095986中描述的);事件MON87427(玉米,授粉控制,以ATCC PTA-7899保藏,于WO2011/062904中描述的);事件MON87460(玉米,胁迫耐受性,以ATCC PTA-8910保藏,于WO2009/111263或US-A 2011-0138504中描述的);事件MON87701(大豆,昆虫控制,以ATCC PTA-8194保藏,于US-A 2009-130071或WO2009/064652中描述的);事件MON87705(大豆,品质性状-除草剂耐受性,以ATCC PTA-9241保藏,于US-A 2010-0080887或WO2010/037016中描述的);事件MON87708(大豆,除草剂耐受性,以ATCC PTA-9670保藏,于WO2011/034704中描述的);事件MON87712(大豆,产量,以PTA-10296保藏,于WO2012/051199中描述的),事件MON87754(大豆,品质性状,以ATCC PTA-9385保藏,于WO2010/024976中描述的);事件MON87769(大豆,品质性状,以ATCC PTA-8911保藏,于US-A 2011-0067141或WO2009/102873中描述的);事件MON88017(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-5582保藏,于US-A 2008-028482或WO2005/059103中描述的);事件MON88913(棉花,除草剂耐受性,以ATCC PTA-4854保藏,于WO2004/072235或US-A 2006-059590中描述的);事件MON88302(欧洲油菜,除草剂耐受性,以PTA-10955保藏,于WO2011/153186中描述的),事件MON88701(棉花,除草剂耐受性,以PTA-11754保藏,于WO2012/134808中描述的),事件MON89034(玉米,昆虫控制,以ATCC PTA-7455保藏,于WO 07/140256或US-A 2008-260932中描述的);事件MON89788(大豆,除草剂耐受性,以ATCC PTA-6708保藏,于US-A 2006-282915或WO2006/130436中描述的);事件MSl 1(欧洲油菜,授粉控制-除草剂耐受性,以ATCC PTA-850或PTA-2485保藏号,于WO2001/031042中描述的);事件MS8(欧洲油菜,授粉控制-除草剂耐受性,以ATCC PTA-730保藏,于WO2001/041558或US-A 2003-188347中描述的);事件NK603(玉米,除草剂耐受性,以ATCCPTA-2478保藏,于US-A 2007-292854中描述的);事件PE-7(水稻,昆虫控制,未保藏,于WO2008/114282中描述的);事件RF3(欧洲油菜,授粉控制-除草剂耐受性,以ATCC PTA-730保藏,于WO2001/041558或US-A 2003-188347中描述的);事件RT73(欧洲油菜,除草剂耐受性,未保藏,于WO2002/036831或US-A 2008-070260中描述的);事件SYHT0H2/SYN-000H2-5(大豆,除草剂耐受性,以PTA-11226保藏,于WO2012/082548中描述的),事件T227-1(糖用甜菜,除草剂耐受性,未保藏,于WO2002/44407或US-A 2009-265817中描述的);事件T25(玉米,除草剂耐受性,未保藏,于US-A 2001-029014或WO2001/051654中描述的);事件T304-40(棉花,昆虫控制-除草剂耐受性,以ATCC PTA-8171保藏,于US-A 2010-077501或WO2008/122406中描述的);事件T342-142(棉花,昆虫控制,未保藏,于WO2006/128568中描述的);事件TC1507(玉米,昆虫控制-除草剂耐受性,未保藏,于US-A 2005-039226或WO2004/099447中描述的);事件VIP1034(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-3925保藏,于WO2003/052073中描述的),事件32316(玉米,昆虫控制-除草剂耐受性,以PTA-11507保藏,于WO2011/084632中描述的),事件4114(玉米,昆虫控制-除草剂耐受性,以PTA-11506保藏,于WO2011/084621中描述的),任选地与事件EE-GM1/LL27或事件EE-GM2/LL55(WO2011/063413A2)叠加的事件EE-GM3/FG72(大豆,除草剂耐受性,ATCC登录号PTA-11041),事件DAS-68416-4(大豆,除草剂耐受性,ATCC录号PTA-10442,WO2011/066360Al),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号PTA-10442,WO2011/066384Al),事件DP-040416-8(玉米,昆虫控制,ATCC登录号PTA-11508,WO2011/075593Al),事件DP-043A47-3(玉米,昆虫控制,ATCC登录号PTA-11509,WO2011/075595Al),事件DP-004114-3(玉米,昆虫控制,ATCC登录号PTA-11506,WO2011/084621Al),事件DP-032316-8(玉米,昆虫控制,ATCC登录号PTA-11507,WO2011/084632A1)、事件MON-88302-9(欧洲油菜,除草剂耐受性,ATCC登录号PTA-10955,WO2011/153186Al),事件DAS-21606-3(大豆,除草剂耐受性,ATCC登录号PTA-11028,WO2012/033794A2),事件MON-87712-4(大豆,品质性状,ATCC登录号PTA-10296,WO2012/051199A2),事件DAS-44406-6(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11336,WO2012/075426Al),事件DAS-14536-7(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11335,WO2012/075429Al),事件SYN-000H2-5(大豆,除草剂耐受性,ATCC登录号PTA-11226,WO2012/082548A2),事件DP-061061-7(欧洲油菜,除草剂耐受性,无保藏号可用,WO2012071039Al),事件DP-073496-4(欧洲油菜,除草剂耐受性,无保藏号可用,US2012131692),事件8264.44.06.1(大豆,叠加的除草剂耐受性,登录号PTA-11336,WO2012075426A2),事件8291.45.36.2(大豆,叠加的除草剂耐受性,登录号登录号PTA-11335,WO2012075429A2),事件SYHT0H2(大豆,ATCC登录号号PTA-11226,WO2012/082548A2),事件MON88701(棉花,ATCC登录号PTA-11754,WO2012/134808Al),事件KK179-2(苜蓿,ATCC登录号PTA-11833,WO2013/003558Al),事件pDAB8264.42.32.1(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11993,WO2013/010094Al),事件MZDT09Y(玉米,ATCC登录号PTA-13025,WO2013/012775Al)。
赋予所述所需性状的基因/事件(例如,目标多核苷酸)也可以在转基因植物中彼此组合存在。可以提及的转基因植物的实例是重要的作物植物,诸如谷类(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其他类型的蔬菜、棉花、烟草、欧洲油菜以及水果植物(诸如苹果、梨等水果、柑橘类水果和葡萄),其中特别强调的是玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和欧洲油菜。特别强调的性状是植物对昆虫、蛛形类、线虫类、蛞蝓和蜗牛的增强的抗性,以及植物对一种或多种除草剂的增强的抗性。
可根据本发明优先处理的此类植物、植物部分或植物种子的商购可得的实例包括以 RIBROUNDUPVT DOUBLEVT TRIPLEBOLLGARDROUNDUPREADY 2 ROUNDUP2 XTENDTM、INTACTA RR2VISTIVE和/或XTENDFLEXTM商品名销售或分销的商品,诸如植物种子。
现在将参考以下实施例描述本发明。应该理解的是,这些实施例并不旨在限制本发明的权利要求的范围,而是旨在作为某些实施方案的示例。技术人员想到的示例性方法的任何变化都落入本发明的范围内。
实施例
实施例1.HB53和HB78的基因组编辑构建体的设计
Zm00001d002754(HB53)和Zm00001d029934(HB78)(玉蜀黍)的基因组序列是从专有的玉米品系中鉴定的。从这条参考品系中,鉴定了间隔区序列SEQ ID NO:175-182。编辑构建体(靶向HB53的pWISE444和靶向HB53/HB78的pWISE451)包含CRISPR-Cas效应蛋白(图13,pWISE451包括来自所示pWISE的所有引导核酸)。CRISPR-Cas效应蛋白与对玉米的HB53/HB78转录因子的DNA序列特异的间隔区核酸缔合。使用Cpf1切割酶对基因靶标的DNA结合域进行独特的破坏。
实施例2.编辑的E0植物的转化和选择
使用土壤杆菌转化干燥的离体玉米胚以递送编辑构建体。选择健康的非嵌合植物(E0)并插在生长托盘中。进行E0植物的基因分型以评估转基因拷贝和编辑功效。将被鉴定为(1)健康的、非嵌合的和可育的,具有(2)低转基因拷贝和(3)被破坏的DNA结合结构域的植物了递进至下一代。将满足所有上述标准的E0植物自交以产生E1代。
对于pWISE444,110株E0植物源自单个转化实验。从这个E0植物库中,我们鉴定了具有导致HB53 DNA结合域破坏的框外缺失的植物。表1提供了植物标识符,鉴定的缺失和最终递进的E1等位基因。图10显示了来自递进的E0亲本的E1后代的基因型。
表1.HB53 E0亲本植物和鉴定的等位基因
E0亲本 | E0等位基因 | E1等位基因(递进的) |
CE-9775 | 杂合的(5bp和7bp缺失) | 纯合的5bp缺失 |
CE-9787 | 杂合的(11bp和14bp缺失) | 纯合的11bp缺失 |
CE-9778 | Het-WT(23bp缺失) | 纯合的23bp缺失 |
对于pWISE451,单个转化实验产生了44个E0事件。其中,对具有所需框外缺失的单一E0植物进行了改良。图11和图12分别显示了HB53和HB78 E1后代的编辑性质。
除了pWISE444和pWISE451之外,其他转化实验在HB78上产生了所需的编辑。图9显示了代表性编辑的植物的基因组序列。其表明靶DNA结合结构域上游的10bp框外缺失导致了提前终止密码子,因此丢失了DNA结合结构域。
实施例3.性状活动的表型评估
对于每个E1家庭,种植100粒种子并进行筛选。将被鉴定为(1)健康的、非嵌合的和可育的,(2)无转基因的,(3)具有被破坏的DNA结合结构域的植物推进到下一代。性状活性通常在E2阶段进行评估。为了评估递进的所需编辑的性状活性,将10日龄的幼苗暴露于模拟的遮荫环境中。定制的照明阵列由12个补充有超过330个带有Bluefish控制器的2.25VCREE远红LED(720-740)的CREE 6500k 36V COB构成。其他类似的照明可用来模拟遮荫环境。
编辑的玉米幼苗和对照(野生型和GUS对照)玉米幼苗生长在具有模拟遮荫环境的生长棚中,其中在400μmol m-2 s-1PAR(光合有效辐射)下,它们经历0.15的红光波长与远红光波长的比率。经编辑的玉米幼苗和对照玉米幼苗也在单独的生长棚中生长,在那里它们经历1.3的红光与远红光的比率和400μmol m-2 s-1PAR(无遮荫)。在三个高度标记(胚芽鞘、V1鞘、V2鞘)处测量植物高度,并在模拟遮荫和非遮荫环境中比较对照植物与经编辑的植物。当生长在模拟遮荫下的经编辑的植物比对照植物(野生型)矮5%、10%、15%(或更多)时,编辑事件被认为是性状活性的。
实施例4.内源玉米同源结构域-亮氨酸拉链(HD-Zip)转录因子的修饰抑制避荫反应。
HD-Zip转录因子的编辑抑制了茎在模拟遮荫条件下的过度伸长。HD-Zip转录因子HB53和HB53/HB78的纯合编辑表现出统计学上显著的受抑制的避荫反应,如V2阶段所示(图14),但没有显著的异型(图15)。相反,野生型植物(01DKD2对照)和用无引导核酸的载体转化的植物(GUS对照)显示出统计学上显著的避荫反应。除了从pWISE444(HB53)和pWISE451(HB53/HB78)产生的编辑的等位基因之外,还测试了纯合的HB78编辑(图8和图9)。我们的结果表明在E1阶段存在性状活性(即,无避荫反应),但是在E2阶段未编辑的HB78对比经编辑的HB78之间在植物高度上没有显著差异。由于两项测试(E1阶段对比E2阶段)在生长室位置上有所不同,因此需要进一步的测试。
综上所述,我们的结果表明HD-Zip转录因子是避荫反应的高效调节因子。此外,我们已经证明,编辑这些转录因子导致对遮荫的进化保守的过度反应的抑制。
前述内容是对本发明的说明,不应理解为对本发明的限制。本发明由以下权利要求限定,其中权利要求的等同物包括在其中。
序列表
<110> Pairwise Plants Services, Inc.
Bate, Nicholas
Kim, Yongjoo
Graham, Nathaniel
Mojica, Julius
<120> 植物避荫反应的抑制
<130> 1499.17.WO
<150> US 62/968,596
<151> 2020-01-31
<160> 329
<170> PatentIn version 3.5
<210> 1
<211> 116
<212> PRT
<213> 玉米 (Zea mays)
<400> 1
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 2
<211> 116
<212> PRT
<213> 玉米
<400> 2
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Arg Glu Val Ala Glu Leu Arg Val Leu Lys Leu Val Ala Pro His
85 90 95
His Tyr Ala Arg Met Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Leu
115
<210> 3
<211> 53
<212> PRT
<213> 人工序列
<220>
<223> 合成的HD-zip转录因子肽
<400> 3
Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Arg Glu Val
50
<210> 4
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 合成的HD-zip转录因子肽
<400> 4
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu
1 5 10 15
Lys Gln Thr Glu Val Asp Cys Glu
20
<210> 5
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 合成的HD-zip转录因子肽
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa代表 Leu或Ser
<400> 5
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Xaa
1 5 10 15
Lys Gln Thr Glu Val Asp Cys Glu
20
<210> 6
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 合成的HD-zip转录因子肽
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa代表 Ser或Thr
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa代表 Asp或Glu
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa代表 Ser或Ala
<400> 6
Arg Lys Lys Leu Arg Leu Xaa Lys Xaa Gln Xaa
1 5 10
<210> 7
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成的HD-zip转录因子肽
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa代表 Gln或His
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa代表 Arg或Lys
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa代表 Val或Leu
<400> 7
Glu Asn Arg Arg Leu Xaa Xaa Glu Xaa
1 5
<210> 8
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 合成的HD-zip转录因子肽
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa代表 Pro或Ala
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa代表 Thr或Ala
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa代表 Val或Met
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa代表 Gln, Ser或Asn
<400> 8
Pro Xaa Xaa Xaa Leu Thr Xaa Cys Pro Xaa Cys Glu Arg
1 5 10
<210> 9
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成的DNA结合结构域肽
<400> 9
Val Trp Phe Gln Asn Arg Arg Ala
1 5
<210> 10
<211> 287
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 10
Met Gly Glu Lys Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Cys
1 5 10 15
Ala Ala Arg Asn Glu Pro Ser Leu Arg Leu Asn His Met Pro Leu Ser
20 25 30
Ser Ser Gln Ser Met Gln Asn His His Lys Arg Ser Pro Trp Thr Glu
35 40 45
Leu Phe His Ser Ser Asp Arg Asn Ser Asp Thr Arg Ser Phe Leu Arg
50 55 60
Gly Ile Asp Val Asn Gln Ala Pro Thr Val Ala Asp Cys Glu Glu Glu
65 70 75 80
Asn Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Ile Ser Gly Lys
85 90 95
Arg Ser Glu Arg Glu Pro Ile Gly Asp Glu Thr Glu Ala Glu Arg Ala
100 105 110
Ser Cys Ser Arg Gly Ser Asp Asp Glu Asp Gly Gly Ala Gly Asp Ala
115 120 125
Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu
130 135 140
Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala
145 150 155 160
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
165 170 175
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
180 185 190
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
195 200 205
Leu Gln Lys Glu Val Gln Glu Leu Arg Ser Leu Lys Leu Ser Pro Gln
210 215 220
Leu Tyr Met Asn Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
225 230 235 240
Cys Glu Arg Val Ala Val Ser Ser Ser Ser Ser Ser Ser Ser Ala Ala
245 250 255
Ala Asn Gly Thr Thr Arg Leu Pro Ile Gly Pro Asn His Gln Arg Leu
260 265 270
Thr Pro Val Ser Pro Trp Ala Ala Leu Pro Ile His His Arg Ser
275 280 285
<210> 11
<211> 294
<212> PRT
<213> 可可树(Theobroma cacao)
<400> 11
Met Gly Ala Glu Lys Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly
1 5 10 15
Cys Ala Gln Asn His Pro Ser Leu Lys Leu Asn Leu Met Pro Leu Ala
20 25 30
Ser Pro Arg Met Gln Asn Leu Gln Gln Lys Asn Thr Trp Asn Glu Leu
35 40 45
Phe Gln Ser Ser Asp Arg Asn Leu Asp Thr Arg Ser Phe Leu Arg Gly
50 55 60
Ile Asp Val Asn Arg Ala Pro Ala Thr Val Asp Cys Glu Glu Glu Gly
65 70 75 80
Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly Lys Arg
85 90 95
Asn Glu Arg Asp Pro Val Gly Asp Glu Thr Glu Ala Glu Arg Ala Ser
100 105 110
Cys Ser Arg Ala Ser Asp Asp Glu Asp Gly Gly Ala Gly Gly Asp Ala
115 120 125
Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu
130 135 140
Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala
145 150 155 160
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
165 170 175
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
180 185 190
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
195 200 205
Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln
210 215 220
Leu Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
225 230 235 240
Cys Glu Arg Val Ala Val Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr
245 250 255
Ala Ser Ser Thr Pro Thr Ser Thr Val Pro Asn Arg His His Arg Thr
260 265 270
Ser Ser Val Ser Pro Trp Ala Ala Met Pro Ile Gly His Arg Pro Phe
275 280 285
His Ala Pro Ala Ser Arg
290
<210> 12
<211> 292
<212> PRT
<213> 甜瓜(Cucumis melo)
<400> 12
Met Gly Gly Arg Asp Asp Asp Leu Gly Leu Thr Leu Ser Leu Gly Phe
1 5 10 15
Gly Val Thr Thr Gln Pro Thr His Met Gln Arg Pro Ser Met His Asn
20 25 30
His Leu Arg Lys Thr Ser Trp Asn Glu Leu Phe Gln Phe Ser Asp Arg
35 40 45
Asn Ala Asp Ser Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Leu
50 55 60
Pro Thr Gly Val Asp Gly Glu Glu Glu Asn Gly Val Ser Ser Pro Asn
65 70 75 80
Ser Thr Ile Ser Ser Ile Ser Gly Lys Arg Ser Glu Arg Glu Ala Ala
85 90 95
Gly Asp Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala
100 105 110
Glu Ala Glu Ala Glu Arg Ala Ser Cys Ser Arg Gly Ser Asp Asp Glu
115 120 125
Asp Gly Gly Gly Gly Asp Gly Asp Ala Ser Arg Lys Lys Leu Arg Leu
130 135 140
Ser Lys Glu Gln Ser Met Val Leu Glu Glu Thr Phe Lys Glu His Asn
145 150 155 160
Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu
165 170 175
Thr Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr
180 185 190
Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys
195 200 205
Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu
210 215 220
Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met Asn Pro
225 230 235 240
Pro Thr Thr Leu Thr Met Cys Pro Gln Cys Glu Arg Val Ala Val Ser
245 250 255
Ser Ser Ser Ser Thr Ser Ala Ala Thr Thr Thr Arg His Pro Ala Ala
260 265 270
Ala Gly Val Gln Arg Thr Ser Met Ala Ile Asn Pro Trp Ala Val Leu
275 280 285
Pro Ile Gln Arg
290
<210> 13
<211> 294
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 13
Met Gly Gly Arg Asp Asp Asp Val Gly Leu Thr Leu Ser Leu Gly Phe
1 5 10 15
Gly Val Thr Thr Gln Ser Thr His Met Gln Arg Pro Ser Ser Met His
20 25 30
Asn His His Leu Arg Lys Thr His Trp Asn Glu Leu Phe Gln Phe Ser
35 40 45
Asp Arg Asn Ala Asp Ser Arg Ser Phe Leu Arg Gly Ile Asp Val Asn
50 55 60
Arg Leu Pro Thr Gly Val Asp Gly Glu Glu Glu Asn Gly Val Ser Ser
65 70 75 80
Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly Lys Arg Ser Glu Arg Glu
85 90 95
Ala Ala Gly Asp Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala
100 105 110
Glu Ala Glu Ala Glu Ala Glu Arg Ala Ser Cys Ser Arg Gly Ser Asp
115 120 125
Asp Glu Asp Gly Gly Gly Gly Asp Gly Asp Ala Ser Arg Lys Lys Leu
130 135 140
Arg Leu Ser Lys Glu Gln Ser Met Val Leu Glu Glu Thr Phe Lys Glu
145 150 155 160
His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu
165 170 175
Asn Leu Thr Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
180 185 190
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg
195 200 205
Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
210 215 220
Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met
225 230 235 240
Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Gln Cys Glu Arg Val Ala
245 250 255
Val Ser Ser Ser Ser Ser Thr Ser Ala Ala Thr Thr Thr Arg His Gln
260 265 270
Ala Ala Ala Gly Val Gln Arg Pro Ser Met Ala Ile Asn Pro Trp Ala
275 280 285
Val Leu Pro Ile Gln Arg
290
<210> 14
<211> 298
<212> PRT
<213> 毛果杨( Populus trichocarpa)
<400> 14
Met Gly Asp Lys Asn Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Phe
1 5 10 15
Asp Ala Thr Gln Gln Asn His Gln Gln Gln Pro Ser Leu Lys Leu Asn
20 25 30
Leu Met Pro Val Pro Ser Gln Asn Asn His Arg Lys Thr Ser Leu Thr
35 40 45
Asp Leu Phe Gln Ser Ser Asp Arg Ala Cys Gly Thr Arg Phe Phe Gln
50 55 60
Arg Gly Ile Asp Met Asn Arg Val Pro Ala Ala Val Thr Asp Cys Asp
65 70 75 80
Asp Glu Thr Gly Val Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu Ser
85 90 95
Gly Lys Arg Ser Glu Arg Glu Gln Ile Gly Glu Glu Thr Glu Ala Glu
100 105 110
Arg Ala Ser Cys Ser Arg Asp Ser Asp Asp Glu Asp Gly Ala Gly Gly
115 120 125
Asp Ala Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Val
130 135 140
Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Glu Lys
145 150 155 160
Leu Ala Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val
165 170 175
Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val
180 185 190
Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn
195 200 205
Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser
210 215 220
Pro Gln Leu Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys
225 230 235 240
Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ala Ser Ser Ser Ser Ala
245 250 255
Ala Ala Ala Ser Ser Ala Leu Ala Pro Thr Ala Ser Thr Arg Gln Pro
260 265 270
Gln Arg Pro Val Pro Ile Asn Pro Trp Ala Thr Met Pro Val His Gln
275 280 285
Arg Thr Phe Asp Ala Pro Ala Ser Arg Ser
290 295
<210> 15
<211> 318
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 15
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Asn
1 5 10 15
Ser Gln Gln Lys Glu Pro Ser Leu Arg Leu Asn Leu Met Pro Leu Thr
20 25 30
Thr Ser Ser Ser Ser Ser Ser Phe Gln His Met His Asn Gln Asn Asn
35 40 45
Asn Ser His Pro Gln Lys Ile His Asn Ile Ser Trp Thr His Leu Phe
50 55 60
Gln Ser Ser Gly Ile Lys Arg Thr Thr Ala Glu Arg Asn Ser Asp Ala
65 70 75 80
Gly Ser Phe Leu Arg Gly Phe Asn Val Asn Arg Ala Gln Ser Ser Val
85 90 95
Ala Val Val Asp Leu Glu Glu Glu Ala Ala Val Val Ser Ser Pro Asn
100 105 110
Ser Ala Val Ser Ser Leu Ser Gly Asn Lys Arg Asp Leu Ala Val Ala
115 120 125
Arg Gly Gly Asp Glu Asn Glu Ala Glu Arg Ala Ser Cys Ser Arg Gly
130 135 140
Gly Gly Ser Gly Gly Ser Asp Asp Glu Asp Gly Gly Asn Gly Asp Gly
145 150 155 160
Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Leu Val Leu Glu
165 170 175
Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala
180 185 190
Leu Ala Lys Gln Leu Asn Leu Arg Ala Arg Gln Val Glu Val Trp Phe
195 200 205
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
210 215 220
Glu Tyr Leu Lys Arg Cys Cys Asp Asn Leu Thr Glu Glu Asn Arg Arg
225 230 235 240
Leu Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His
245 250 255
Leu Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
260 265 270
Cys Glu Arg Val Ser Ser Ser Ala Ala Thr Val Thr Ala Ala Pro Ser
275 280 285
Thr Thr Thr Thr Pro Thr Val Val Gly Arg Pro Ser Pro Gln Arg Leu
290 295 300
Thr Pro Trp Thr Ala Ile Ser Leu Gln Gln Lys Ser Gly Arg
305 310 315
<210> 16
<211> 321
<212> PRT
<213> 白菜型油菜(Brassica campestris)
<400> 16
Met Gly Glu Ser Glu Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Leu
1 5 10 15
Ser Gln Leu Lys Glu Pro Ser Leu Gly Leu Gly Leu Asn Leu Leu Pro
20 25 30
Leu Arg Thr Ser Ser Ser Ser Phe Ser His Met His Asn His Asn Asn
35 40 45
Asn His Leu Gln Lys Lys Ile Asn His Asn Ser Trp Pro His Gln Phe
50 55 60
His Ser Ser Glu Arg Asn Ser Asp Val Gly Ser Leu Leu Arg Gly Leu
65 70 75 80
Glu Val Asn Arg Thr Pro Ser Ala Thr Val Val Ile Asn Leu Glu Glu
85 90 95
Asp Leu Ala Gly Val Ser Ser Pro Asn Ser Asn Ile Ser Ser Val Ser
100 105 110
Gly Asn Lys Arg Asp Leu Ala Ala Ala Arg Gly Asp Gly Gly Gly Asp
115 120 125
Glu Asn Glu Ala Glu Arg Ala Ser Cys Ser His Gly Gly Gly Ser Asp
130 135 140
Glu Glu Glu Gly Gly Asn Cys Glu Gly Thr Arg Lys Lys Leu Arg Leu
145 150 155 160
Ser Lys Glu Gln Ala Leu Val Leu Glu Asp Thr Phe Lys Glu His Ser
165 170 175
Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu
180 185 190
Arg Thr Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr
195 200 205
Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys
210 215 220
Asp Thr Leu Thr Glu Glu Asn Arg Arg Leu His Lys Glu Val Ala Glu
225 230 235 240
Leu Arg Ala Leu Lys Leu Ser Pro His Leu Tyr Met His Met Thr Pro
245 250 255
Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ser Ala Ser
260 265 270
Ser Ser Ser Ser Ala Met Ala Ala Ala Ala Pro Pro Ser Ser Ile Thr
275 280 285
Ser Gly Gly Gly Gly Arg Ile Pro Thr Val Val Gly Arg Pro Ser Pro
290 295 300
Gln Arg Pro Thr Pro Cys Ala Ala Ile Ser Leu Gln Ser Arg Leu Ala
305 310 315 320
His
<210> 17
<211> 318
<212> PRT
<213> 甘蓝(Brassica oleracea)
<400> 17
Met Gly Glu Ser Glu Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Leu
1 5 10 15
Ser Gln Leu Lys Glu Pro Ser Leu Gly Leu Gly Leu Asn Leu Leu Pro
20 25 30
Leu Arg Thr Ser Ser Phe Ser His Met His Asn His Asn Asn Asn His
35 40 45
Leu Gln Lys Lys Ile Tyr His Asn Ser Trp Pro His Gln Phe Gln Ser
50 55 60
Ser Glu Arg Asn Ser Asp Val Gly Ser Leu Leu Arg Gly Leu Glu Val
65 70 75 80
Asn Arg Thr Pro Ser Ala Thr Val Val Ile Asn Leu Glu Glu Asp Ala
85 90 95
Ala Gly Val Ser Ser Pro Asn Ser Asn Val Ser Ser Val Ser Gly Asn
100 105 110
Lys Arg Asp Leu Ala Ala Ala Arg Gly Asp Gly Gly Gly Asp Glu Asn
115 120 125
Glu Ala Glu Arg Ala Ser Cys Ser His Arg Gly Gly Ser Asp Glu Glu
130 135 140
Glu Gly Gly Asn Cys Glu Gly Thr Arg Lys Lys Leu Arg Leu Ser Lys
145 150 155 160
Glu Gln Ala Leu Val Leu Glu Glu Thr Phe Lys Glu His Ser Thr Leu
165 170 175
Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu Trp Thr
180 185 190
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu
195 200 205
Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Asp Thr
210 215 220
Leu Thr Glu Glu Asn Arg Arg Leu His Lys Glu Val Ser Glu Leu Arg
225 230 235 240
Ala Leu Lys Leu Ser Pro His Leu Tyr Met His Met Thr Pro Pro Thr
245 250 255
Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ser Ala Ser Ser Ser
260 265 270
Ser Ser Ala Met Ala Ala Ala Ala Pro Pro Ser Ser Thr Ala Ser Gly
275 280 285
Gly Gly Arg Ile Pro Thr Val Val Gly Arg Pro Ser Pro Gln Arg Pro
290 295 300
Thr Pro Cys Ala Ala Ile Ser Leu Gln Ser Arg Leu Ala His
305 310 315
<210> 18
<211> 319
<212> PRT
<213> 桃(Prunus persica)
<400> 18
Met Met Val Glu Arg Asp Gln Asp Leu Gly Leu Ser Leu Ser Leu Ser
1 5 10 15
Phe Pro Gln Thr His Asn His His Asn Asn Asn Asn Asn Asn Ser Ser
20 25 30
Ser Thr Thr Ser Thr Leu Gln Leu Asn Leu Met Pro Ser Leu Ala Pro
35 40 45
Thr Ser Ala Ser Ser Pro Ser Gly Phe Leu Pro Gln Lys Pro Ser Trp
50 55 60
Asn Glu Ala Leu Ile Ser Ser Asp Arg Asn Ser Asn Ser Glu Thr Phe
65 70 75 80
Arg Val Gly Pro Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Leu
85 90 95
Pro Ser Thr Gly Asp Cys Glu Asp Glu Ala Gly Val Ser Ser Pro Asn
100 105 110
Ser Thr Val Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Ala Asn
115 120 125
Gly Glu Asp Leu Asp Ile Glu Thr Arg Gly Ile Ser Asp Glu Glu Asp
130 135 140
Gly Glu Thr Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala
145 150 155 160
Ile Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln
165 170 175
Lys Leu Ala Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu
180 185 190
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
195 200 205
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu
210 215 220
Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu
225 230 235 240
Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met
245 250 255
Cys Pro Ser Cys Glu Arg Val Ala Val Pro Pro Asn Ser Ser Ser Ser
260 265 270
Thr Val Glu Pro Arg Pro His Pro His Pro His Pro Gln Met Gly Ser
275 280 285
Val Gln Thr Arg Pro Val Pro Ile Asn Pro Trp Ala Ser Ala Thr Pro
290 295 300
Ile Pro His Arg Pro Leu Pro Phe Glu Ala Phe His Thr Arg Thr
305 310 315
<210> 19
<211> 299
<212> PRT
<213> 鹰嘴豆(Cicer arietinum)
<400> 19
Met Gly Asp Lys Glu Asp Glu Leu Gly Leu Gly Leu Ser Leu Ser Leu
1 5 10 15
Ser Leu Gly Tyr Gly Ala Asn Ala Asn Asn Ala Pro Leu Lys Val Thr
20 25 30
His Met His Lys Pro Pro Gln Ser Val Pro Asn Gln Arg Val Ser Phe
35 40 45
Asn Asn Phe Phe His Phe His Asp Leu Ser Ser Glu Thr Arg Ser Phe
50 55 60
Ile Gly Gly Ile Asp Val Asn Ser Pro Ala Thr Ala Ala Cys Asp Asp
65 70 75 80
Glu Asn Gly Gly Ser Ser Pro Asn Ser Thr Val Ser Ser Ile Ser Gly
85 90 95
Lys Arg Ser Glu Arg Glu Gly Asn Gly Glu Glu Asn Asp Ala Val Glu
100 105 110
Arg Ala Ser Cys Ser Arg Gly Gly Ser Asp Asp Asp Asp Gly Gly Gly
115 120 125
Cys Gly Gly Asp Gly Asp Ser Ser Arg Lys Lys Leu Arg Leu Ser Lys
130 135 140
Glu Gln Ser Val Leu Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu
145 150 155 160
Asn Pro Lys Gln Lys Gln Ala Leu Ala Lys Gln Leu Asn Leu Met Pro
165 170 175
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu
180 185 190
Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Thr
195 200 205
Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg
210 215 220
Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met Asn Pro Pro Thr
225 230 235 240
Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ala
245 250 255
Ser Ser Ser Ser Ala Asn Val Pro Ser Ala Leu Ala Pro Ala Asn Arg
260 265 270
Asn Ser Ile Gly Pro Ser Val Gln Arg Pro Val Pro Leu Asn Pro Trp
275 280 285
Ala Ala Met Ser Ile Gln Asn Arg Ser Arg Pro
290 295
<210> 20
<211> 317
<212> PRT
<213> 大豆(Glycine max)
<400> 20
Met Gly Glu Lys Asp Asp Gly Leu Gly Leu Gly Leu Ser Leu Lys Leu
1 5 10 15
Gly Trp Gly Glu Asn Asn Asp Asn Asn Asn Asn Gln Gln Gln His Pro
20 25 30
Phe Asn Val His Lys Pro Pro Gln Ser Val Pro Asn Gln Arg Val Ser
35 40 45
Val Asn Ser Leu Phe His Phe His Asp Glu Asn His Ala Met Arg Asn
50 55 60
Thr Asp Arg Ser Ser Glu Met Arg Ser Phe Phe Arg Gly Ile Asp Val
65 70 75 80
Asn Leu Pro Pro Pro Pro Pro Ser Ala Ala Leu Ala Ala Phe Asp Asp
85 90 95
Glu Asn Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly
100 105 110
Lys Arg Ser Glu Arg Glu Gly Asn Gly Glu Glu Asn Glu Arg Thr Ser
115 120 125
Ser Ser Arg Gly Gly Gly Gly Ser Asp Asp Asp Glu Gly Gly Ala Cys
130 135 140
Gly Gly Asp Ala Asp Ala Asp Ala Ser Arg Lys Lys Leu Arg Leu Ser
145 150 155 160
Lys Glu Gln Ala Leu Val Leu Glu Glu Thr Phe Lys Glu His Asn Thr
165 170 175
Leu Asn Pro Lys Gln Lys Gln Ala Leu Ala Lys Gln Leu Asn Leu Met
180 185 190
Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys
195 200 205
Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu
210 215 220
Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu
225 230 235 240
Arg Ala Leu Lys Leu Ser Pro His Leu Tyr Met Gln Met Asn Pro Pro
245 250 255
Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Ser Ser
260 265 270
Ala Ser Ser Ser Ser Ser Ala Thr Met Pro Ser Ala Leu Pro Pro Ala
275 280 285
Asn Leu Asn Pro Val Gly Pro Thr Ile Gln Arg Pro Met Pro Val Asn
290 295 300
Pro Trp Ala Ala Met Leu Asn Gln His Arg Gly Arg Pro
305 310 315
<210> 21
<211> 296
<212> PRT
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 21
Met Ser Ile Glu Lys Glu Asp Phe Gly Leu Ser Leu Ser Leu Ser Phe
1 5 10 15
Pro Gln Asn Pro Pro Asn Pro Gln Tyr Leu Asn Leu Met Ser Ser Ser
20 25 30
Thr His Ser Tyr Ser Pro Ser Thr Phe Asn Pro Gln Lys Pro Ser Trp
35 40 45
Asn Asp Val Phe Thr Ser Ser Asp Arg Asp Ser Glu Thr Cys Arg Ile
50 55 60
Glu Glu Arg Pro Leu Ile Leu Arg Gly Ile Asp Val Asn Arg Leu Pro
65 70 75 80
Ser Gly Ala Asp Cys Glu Glu Glu Ala Gly Val Ser Ser Pro Asn Ser
85 90 95
Thr Val Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Val Thr Gly
100 105 110
Glu Asp Leu Asp Met Glu Arg Asp Cys Ser Arg Gly Ile Ser Asp Glu
115 120 125
Glu Asp Ala Glu Thr Ser Arg Lys Lys Leu Arg Leu Thr Lys Asp Gln
130 135 140
Ser Ile Ile Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro
145 150 155 160
Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Gly Leu Arg Ala Arg Gln
165 170 175
Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln
180 185 190
Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr
195 200 205
Asp Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu
210 215 220
Lys Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu
225 230 235 240
Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Pro Ser Ser Ala Val
245 250 255
Asp Ala Ala Thr Arg Arg His Pro Met Ala Ser Asn His Pro Arg Thr
260 265 270
Phe Ser Val Gly Pro Trp Ala Thr Ala Ala Pro Ile Gln His Arg Thr
275 280 285
Phe Asp Thr Leu Arg Pro Arg Ser
290 295
<210> 22
<211> 305
<212> PRT
<213> 菜豆(Phaseolus vulgaris)
<400> 22
Met Gly Glu Lys Asp Asp Gly Leu Gly Leu Arg Leu Ser Leu Arg Trp
1 5 10 15
Gly Glu Asn Asp Asp Asn Asn Met Asn Gln Gln His Pro Phe Asn Met
20 25 30
His Lys Pro Pro Gln Pro Val Pro Asn Gln Arg Thr Ser Phe Asn Asn
35 40 45
Leu Phe His Phe His Gly Ala Ser His Val Thr Asn Arg Asn Ser Glu
50 55 60
Pro Pro Pro Phe Phe Phe Gly Ile Asp Val Asn Leu Pro Pro Pro Pro
65 70 75 80
Thr Pro Thr Pro Ser Val Val Pro Cys Glu Glu Asp Asn Leu Val Ser
85 90 95
Ser Gln Asn Ser Ala Val Ser Ser Ile Ser Gly Lys Arg Ser Glu Arg
100 105 110
Glu Glu Asn Glu Arg Gly Ser Cys Ser His Gly Ser Glu Asp Glu Asp
115 120 125
Gly Gly Gly Phe Gly Gly Glu Gly Asp Gly Asp Met Ser Arg Lys Lys
130 135 140
Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu Thr Phe Lys
145 150 155 160
Glu His Asn Thr Leu Asn Pro Lys Gln Lys Gln Ala Leu Ala Lys Gln
165 170 175
Leu Asn Leu Ser Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg
180 185 190
Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys
195 200 205
Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu
210 215 220
Val Gln Glu Leu Arg Ala Leu Lys Phe Ser Pro Gln Leu Tyr Met His
225 230 235 240
Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val
245 250 255
Ala Val Ser Ser Ala Ser Ser Ser Ser Ser Ala Ala Met Pro Ser Val
260 265 270
Pro Pro Pro Ala Asn His Asn Pro Leu Gly Pro Thr Ile Gln Arg Pro
275 280 285
Val Pro Val Asn Pro Trp Ala Ala Met Ser Ile Gln Arg Pro Cys Arg
290 295 300
Asn
305
<210> 23
<211> 294
<212> PRT
<213> 蓖麻(Ricinus communis)
<400> 23
Met Glu Asp Lys Asp Asp Gly Leu Gly Leu Gly Leu Ser Leu Ser Leu
1 5 10 15
Gly Gly Gln Glu Lys His Gln Asn Gln Pro Ser Leu Lys Leu Asn Leu
20 25 30
Met Pro Phe Pro Ser Leu Phe Met Gln Asn Thr His His Ser Thr Ser
35 40 45
Leu Asn Asp Leu Phe Gln Ser Ser Asp Arg Asn Ala Asp Thr Arg Ser
50 55 60
Phe Gln Arg Gly Ile Asp Met Asn Arg Met Pro Leu Phe Ala Asp Cys
65 70 75 80
Asp Asp Glu Asn Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Leu
85 90 95
Ser Gly Lys Arg Ser Glu Arg Glu Gln Ile Gly Gly Glu Glu Met Glu
100 105 110
Ala Glu Arg Ala Ser Cys Ser Arg Gly Gly Ser Asp Asp Glu Asp Gly
115 120 125
Gly Ala Gly Gly Asp Asp Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys
130 135 140
Glu Gln Ser Leu Leu Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu
145 150 155 160
Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu Lys Pro
165 170 175
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Ser
180 185 190
Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn
195 200 205
Leu Thr Gln Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg
210 215 220
Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met Asn Pro Pro Thr
225 230 235 240
Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ser
245 250 255
Ala Ala Pro Ser Arg Gln Pro Pro Asn Ser Gln Pro Gln Arg Pro Val
260 265 270
Pro Val Lys Pro Trp Ala Ala Leu Pro Ile Gln His Arg Pro Phe Asp
275 280 285
Thr Pro Ala Ser Arg Ser
290
<210> 24
<211> 293
<212> PRT
<213> 美花烟草(Nicotiana sylvestris)
<400> 24
Met Gly Gly Glu Lys Glu Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly
1 5 10 15
Met Ser Cys Pro Gln Asn Asn Leu Lys Asn Asn Asp Phe Ile Ser Pro
20 25 30
Ser Thr Pro Pro Phe Leu Leu Pro Phe Met His Asn His Gln Ile Ser
35 40 45
Ala Glu Arg Asn Glu Glu Ala Arg Glu Phe Ile Arg Gly Glu Ile Asp
50 55 60
Met Asn Arg Pro Val Arg Met Ile Glu Ala Cys Asp Glu Glu Leu Glu
65 70 75 80
Asp Glu Ala Val Ile Met Val Ser Ser Pro Asn Asn Ser Thr Val Ser
85 90 95
Ser Val Ser Gly Lys Arg Ser His Asp Arg Glu Asp Asn Glu Gly Glu
100 105 110
Arg Pro Thr Ser Ser Leu Glu Asp Asp Gly Gly Asp Ala Ala Ala Arg
115 120 125
Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Ala Val Leu Glu Glu Thr
130 135 140
Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ser
145 150 155 160
Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn
165 170 175
Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr
180 185 190
Leu Arg Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln
195 200 205
Lys Glu Val Thr Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Met Tyr
210 215 220
Met Asn Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Gln Cys Glu
225 230 235 240
Arg Val Ala Val Ser Ser Ser Ser Ser Ser Val Thr Ser Ala Gly Val
245 250 255
Ser Arg Ser Asn His Pro Val Gly Ala Leu His Gln Pro Pro Val Pro
260 265 270
Leu Asn Lys Pro Trp Ala Ala Ile Phe Ser Pro Lys Thr Leu Asp Asp
275 280 285
Gln Arg Thr Gln Leu
290
<210> 25
<211> 275
<212> PRT
<213> 马铃薯(Solanum tuberosum)
<400> 25
Met Val Glu Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Phe Pro
1 5 10 15
Asp Asn Asn Asn Lys Lys Asn Thr Gln Leu Asn Leu Ser Pro Phe Asn
20 25 30
Leu Ile Gln Lys Thr Ser Trp Thr Asp Ser Leu Phe Pro Ser Ser Asp
35 40 45
Arg Asn Ile Glu Thr Cys Arg Val Glu Thr Arg Thr Phe Leu Lys Gly
50 55 60
Ile Asp Val Asn Arg Leu Pro Ala Thr Gly Glu Ala Asp Glu Glu Ala
65 70 75 80
Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Val Ser Gly Asn Lys
85 90 95
Arg Thr Glu Arg Glu Ala Asn Asn Cys Asp Gln Glu Glu His Glu Met
100 105 110
Glu Arg Gly Ser Asp Glu Glu Asp Gly Glu Thr Ser Arg Lys Lys Leu
115 120 125
Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu Ser Phe Lys Glu
130 135 140
His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Arg Leu
145 150 155 160
Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
165 170 175
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg
180 185 190
Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
195 200 205
Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe Tyr Met Gln Met
210 215 220
Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala
225 230 235 240
Gly Pro Pro Ser Ser Ser Ser Gly Pro Thr Ser Thr Pro Met Gly Gln
245 250 255
Ala Gln Pro Arg Pro Arg Pro Phe Asn Leu Trp Ala Asn Ala Leu His
260 265 270
Pro Arg Ser
275
<210> 26
<211> 323
<212> PRT
<213> 猴面花(Erythranthe guttata)
<400> 26
Met Met Thr Ala Gly Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Thr
1 5 10 15
Phe Pro Pro Glu Lys Lys Ala Val Ser Asn Ile Pro Ser Ser Leu His
20 25 30
Leu Asn Leu Met Pro Ser Ser Pro Ser Pro Asn Phe Thr Ile Phe Asn
35 40 45
Asn Asn Phe Asn Trp Thr Ser Thr Gln Gln Ala Ala Ala Ala Phe Pro
50 55 60
Phe Ser Asp Arg Ser Ser Glu Thr Cys Arg Val Glu Thr Thr Arg Ser
65 70 75 80
Phe Leu Lys Gly Ile Asp Val Asn Cys Leu Pro Ser Ala Ala Ala Ala
85 90 95
Glu Glu Glu Glu Glu Glu Glu Gly Gly Gly Val Ser Ser Pro Asn Ser
100 105 110
Thr Ile Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Asp Ala Thr
115 120 125
Glu Glu His Asp Gly Glu Arg Ala Cys Ser Arg Gly Ile Ser Asp Glu
130 135 140
Glu Asp Ala Glu Asn Ala Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln
145 150 155 160
Ser Ala Thr Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro
165 170 175
Lys Gln Lys Met Ala Leu Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln
180 185 190
Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln
195 200 205
Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr
210 215 220
Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu
225 230 235 240
Lys Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu
245 250 255
Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Pro Thr Met Gly Gly
260 265 270
Pro Pro Ser Asn Gly Gly Arg Ala Pro Pro Ala Ala Ser Ala Ala Ala
275 280 285
Ala Val Gln Pro Arg Pro Ile Thr Phe Asn Pro Trp Ala Ala Val Met
290 295 300
Pro Ser Gln Gln Gln Gln Gln Leu His Arg Pro Phe Asp Ala Ile Met
305 310 315 320
His Ser Arg
<210> 27
<211> 302
<212> PRT
<213> 莲(Nelumbo nucifera)
<400> 27
Met Met Val Glu Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Thr
1 5 10 15
Ala Asp Ser Arg His Ser Leu Gln Leu Asn Leu Met Pro Ser Ser Val
20 25 30
Ser Ser Ser Pro Ala Ser Pro Phe Val Ala Gln Lys Asn Thr Trp Asn
35 40 45
Glu Ala Phe Ala Ser Ser Asp Arg Asn Ser Asp Met Phe Arg Gly Glu
50 55 60
Thr Arg Thr Phe Leu Arg Gly Ile Asp Val Asn Arg Met Pro Ser Thr
65 70 75 80
Val Asp Cys Glu Glu Glu Ala Ala Val Ser Ser Pro Asn Ser Thr Ile
85 90 95
Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Asp Thr Asn Gly Glu Glu
100 105 110
His Glu Ile Glu Arg Ala Cys Ser Arg Gly Ile Ser Asp Glu Glu Asp
115 120 125
Gly Asp Met Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala
130 135 140
Val Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln
145 150 155 160
Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu
165 170 175
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
180 185 190
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu
195 200 205
Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu
210 215 220
Ser Pro Gln Phe Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met
225 230 235 240
Cys Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ser Ser Ser Ala Ala
245 250 255
Thr Ala Thr Val Ala Val Asp Ala Pro His His Pro Met Ala Met Ala
260 265 270
Gly Pro His His His Arg Pro Ile Ala Ile Asn Pro Trp Ala Ala Ala
275 280 285
Pro Ile His His Arg Pro Phe Asp Ala Pro Ala Pro Arg Ser
290 295 300
<210> 28
<211> 224
<212> PRT
<213> 大麦(Hordeum vulgare)
<400> 28
Met Met Glu Arg Ala Asp Asp Leu Gly Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ala Pro Arg Thr His His Val Ala Met Leu Leu His Ala Pro
20 25 30
Glu Arg Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Lys Arg Val Ser
35 40 45
Ala Val Ser Ala Asp Glu Glu Arg Ser Gly Gln Arg Gly Gly Gly Ser
50 55 60
Asp Asp Glu Asp Gly Gly Cys Gly Met Asp Gly Ser Arg Lys Lys Leu
65 70 75 80
Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg Glu
85 90 95
His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu Ala Gln Gln Leu
100 105 110
Gly Leu Arg Ser Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
115 120 125
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg
130 135 140
Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
145 150 155 160
Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His Gln Tyr Met His
165 170 175
Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val
180 185 190
Ser Asn Asn Asn Asn Thr Asn Thr Asn Phe Thr Gly Val Arg Arg Asn
195 200 205
Val Val Asp Gly Ala Ile Cys His Arg Pro Ile Ala Val Arg Pro Gln
210 215 220
<210> 29
<211> 247
<212> PRT
<213> 普通野生稻(Oryza rufipogon)
<400> 29
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Gly Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210> 30
<211> 247
<212> PRT
<213> 亚洲栽培稻(Oryza sativa)
<400> 30
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Gly Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210> 31
<211> 240
<212> PRT
<213> 短药野生稻(Oryza brachyantha)
<400> 31
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ala Pro Arg Thr His His Val Ala Ala Met Leu Phe His Ser
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Ala Ala Ala Asp Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys
65 70 75 80
Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe
85 90 95
Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu Ala Gln
100 105 110
Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg
115 120 125
Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu
130 135 140
Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys
145 150 155 160
Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His Leu Tyr
165 170 175
Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu
180 185 190
Arg Val Ser Asn Ala Asn Asn Ser Ser Ser Ala Ala Pro Asp Arg Arg
195 200 205
Gly Ala Gly Gly Val Thr Ala Ala Gly Gly Asn Asp Thr Ala Ala Asp
210 215 220
Gly Gly Ile Leu Cys His Arg Pro Ile Ala Val Arg Pro Gln Gln Ser
225 230 235 240
<210> 32
<211> 247
<212> PRT
<213> 泥瓦拉野生稻(Oryza nivara)
<400> 32
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Ala Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210> 33
<211> 242
<212> PRT
<213> 斑点野生稻(Oryza punctata)
<400> 33
Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser Pro
1 5 10 15
Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala Pro
20 25 30
Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys Arg
35 40 45
Ser Glu Val Val Ala Ala Asp Glu Glu Arg Ala Gly Leu Arg Gly Gly
50 55 60
Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys Lys
65 70 75 80
Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg
85 90 95
Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu Ala Gln Gln
100 105 110
Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg
115 120 125
Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys
130 135 140
Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu
145 150 155 160
Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His Leu Tyr Met
165 170 175
Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg
180 185 190
Val Ser Asn Thr Asn Asn Asn Ser Ser Ser Ala Ala Asp Arg Arg Gly
195 200 205
Ile Ser Thr Thr Thr Ala Ala Ala Thr Gly Gly Ser Ile Asp Thr Ala
210 215 220
Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile Ala Val Arg Pro Gln
225 230 235 240
Gln Ser
<210> 34
<211> 247
<212> PRT
<213> 非洲栽培稻(Oryza glaberrima)
<400> 34
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Ala Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210> 35
<211> 237
<212> PRT
<213> 粟(Setaria italica)
<400> 35
Met Met Glu Arg Ala Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Ser Leu Ala Ala Pro Arg Thr His His Val Ser Ala Met Leu Leu Arg
20 25 30
Ser Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Lys Arg
35 40 45
Ser Glu Val Thr Ala Glu Glu Gly Leu Leu Arg Gly Gly Ser Asp Glu
50 55 60
Glu Asp Gly Ser Cys Gly Ile Asp Gly Ser Arg Lys Lys Leu Arg Leu
65 70 75 80
Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg Glu His Pro
85 90 95
Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu Ala Gln Gln Leu Gly Leu
100 105 110
Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr
115 120 125
Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys
130 135 140
Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu
145 150 155 160
Leu Arg Ala Leu Lys Leu Val Ser Pro His Leu Tyr Met His Met Ser
165 170 175
Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ser Ser
180 185 190
Ser Gly Ala Asn Ser Thr Gly Ala Ala Ala Ser Ser Asp Arg Arg Ala
195 200 205
Gly Gly Ala Ile Ile Ser Thr Ala Ala Ala Ala Ala Glu Gly Ala Ala
210 215 220
Ile Cys His Arg Pro Ile Ala Val Arg Pro Gln Gln Ser
225 230 235
<210> 36
<211> 233
<212> PRT
<213> 双色高粱(Sorghum bicolor)
<400> 36
Met Met Glu Arg Val Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Ser Leu Ala Ser Pro Arg Thr His His Val Ala Thr Met Leu Leu Arg
20 25 30
Ala Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Leu Pro Ala
35 40 45
Lys Arg Ser Glu Leu Ala Thr Gly Glu Glu Gly Leu Arg Gly Gly Gly
50 55 60
Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys Lys
65 70 75 80
Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg
85 90 95
Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu Ala Gln Gln
100 105 110
Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg
115 120 125
Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys
130 135 140
Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu His Lys Glu
145 150 155 160
Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His Leu Tyr Met
165 170 175
His Met Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg
180 185 190
Val Ser Ser Ser Asn Ala Ser Asn Ala Asn Ser Ala Ala Ala Asp Arg
195 200 205
Lys Ala Gly Ala Gly Val Ala Asp Gly Gly Ala Ile Val Cys His Arg
210 215 220
Pro Ile Ala Val Arg Pro Gln Gln Ser
225 230
<210> 37
<211> 156
<212> PRT
<213> 乌拉尔图小麦(Triticum urartu)
<400> 37
Met Asp Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala
1 5 10 15
Val Leu Glu Asp Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln
20 25 30
Lys Ala Ala Leu Ala Gln Gln Leu Gly Leu Arg Ser Arg Gln Val Glu
35 40 45
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
50 55 60
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu
65 70 75 80
Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu
85 90 95
Val Ser Pro His His Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr
100 105 110
Met Cys Pro Ser Cys Glu Arg Val Ser Asn Asn Asn Asn Asn Asn Asn
115 120 125
Asn Asn Ser Thr Thr Ala Asp Arg Arg Asn Gly Val Glu Gly Ala Ile
130 135 140
Cys His Arg Pro Ile Ala Val Arg Pro Gln Gln Ser
145 150 155
<210> 38
<211> 227
<212> PRT
<213> 玉米
<400> 38
Met Met Glu Arg Val Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Ser Leu Ala Ser Pro Arg Thr His His Val Ala Thr Met Leu Leu Arg
20 25 30
Ala Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Leu Pro Ala Lys
35 40 45
Arg Thr Thr Glu Val Thr Gly Glu Asp Gly Leu Arg Gly Gly Ser Asp
50 55 60
Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys Lys Leu Arg
65 70 75 80
Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg Glu His
85 90 95
Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu Ala Gln Gln Leu Gly
100 105 110
Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg
115 120 125
Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys
130 135 140
Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln
145 150 155 160
Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His Leu Tyr Met His Met
165 170 175
Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ser
180 185 190
Ser Ser Asn Gly Asn Ser Ala Ala Ala Thr Ala Ala Ala Arg Ala Arg
195 200 205
Ala Gly Ala Gly Ala Gly Ala Ile Val Cys His Pro Ile Asp Arg Ala
210 215 220
Thr Ser Thr
225
<210> 39
<211> 279
<212> PRT
<213> 小果野蕉(Musa acuminata)
<400> 39
Met Leu Leu Glu Lys Glu Asp Leu Ala Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Ser Ala Asn Arg Phe Asp Arg Leu Gly Leu Val Pro Ser Ser Ser Ser
20 25 30
Ser Pro Ser Arg Ser Leu Pro Ser Ser Cys Gln Gln Trp Ser Arg Leu
35 40 45
Leu Leu Ala Arg Ser Ala Gly Glu Ala Arg Arg Gly Leu Arg Thr Ile
50 55 60
Asp Val Asn Gln Pro Pro Pro Ala Gly Ala Ala Ala Gly Arg Pro Asp
65 70 75 80
Ser Glu Glu Ala Asp Ala Ser Ser Pro Asn Ser Gly Val Ser Ser Val
85 90 95
Gly Gly Lys Arg Pro Ala Glu Arg Glu Ala Glu His Asp Ala Glu Pro
100 105 110
Ser Cys Ser Arg Gly Ala Ser Asp Glu Glu Glu Gly Asp Gly Asp Gly
115 120 125
Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu
130 135 140
Glu Ser Phe Lys Glu His Thr Thr Leu Ser Pro Lys Gln Lys Leu Ala
145 150 155 160
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
165 170 175
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
180 185 190
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
195 200 205
Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln
210 215 220
Leu Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
225 230 235 240
Cys Glu Arg Val Ser Lys Pro Ser Phe Ser Thr Thr Ser Thr Thr Asn
245 250 255
Pro Pro Pro Ser Glu Ala Ala Ala Pro Arg Ser Leu Arg Pro Pro Phe
260 265 270
Leu Asp Ala Pro Pro Gln Arg
275
<210> 40
<211> 266
<212> PRT
<213> 无油樟(Amborella trichopoda)
<400> 40
Met Asn Arg Glu Asp Leu Asn Leu Ser Leu Ser Leu Arg Arg Val Gly
1 5 10 15
Asp Phe Glu Leu Asn Leu Leu Pro Arg Asn Cys Arg Asn Asp Ser Ser
20 25 30
Ser Leu Asp Arg Ser Glu Thr Ala Arg Ser Ile Leu Lys Ser Phe Asp
35 40 45
Val Asn Arg Ile Gln Ala Thr Ser Asp Arg Ile Pro Thr Thr Thr Asp
50 55 60
Ala Ile Arg Ser Glu Ile Ser Arg Ile Pro Ala Thr Pro Asn Met Ala
65 70 75 80
Gly Phe Asp Val Asn Arg Ile Pro Val Ile Ser Glu Cys Glu Glu Glu
85 90 95
Ala Val Val Ser Ser Pro Met Ser Thr Val Ser Ser Leu Ser Met Ser
100 105 110
Gly Gly Lys Arg Asp Glu Pro Glu Gly Glu Arg Ala Ser Ser Arg Gly
115 120 125
Ser Ser Asp Glu Glu Asp Gly Gly Glu Ala Ala Arg Lys Lys Leu Arg
130 135 140
Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu Ser Phe Lys Glu His
145 150 155 160
Asn Thr Leu Asn Pro Lys Gln Lys Leu Thr Leu Ala Lys Gln Leu Asn
165 170 175
Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg
180 185 190
Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys
195 200 205
Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Met
210 215 220
Glu Leu Arg Ser Leu Lys Gln Thr Pro His Phe Tyr Met His Val Pro
225 230 235 240
Pro Ala Ala Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Ser
245 250 255
Glu Ser Gln Phe Arg Pro Gln Ile Arg Ser
260 265
<210> 41
<211> 225
<212> PRT
<213> 二穗短柄草(Brachypodium distachyon)
<400> 41
Met Met Glu Arg Ala Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Ser Leu Ala Pro Arg Thr His His Val Ser Lys Leu Phe His Ala Pro
20 25 30
Glu Arg Arg Phe Met Glu Met Pro Leu Leu Pro Ala Lys Arg Ser Ser
35 40 45
Glu Ala Ala Gly Asp Asp Ser Ser Leu Leu Gly Gly Ser Asp Glu Glu
50 55 60
Asp Gly Gly Cys Gly Val Asp Gly Ser Arg Lys Lys Leu Arg Leu Ser
65 70 75 80
Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg Glu His Pro Thr
85 90 95
Leu Asn Pro Arg Gln Lys Ala Ala Leu Ala Gln Gln Leu Gly Leu Arg
100 105 110
Ser Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys
115 120 125
Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu
130 135 140
Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu
145 150 155 160
Arg Ala Leu Lys Leu Val Ser Pro Arg His Tyr Met His Met Ser Pro
165 170 175
Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ser Asn Lys
180 185 190
Asn Asn Asn Asn Asn Asn Asn Asn Ser Ser Ala Ala Ala Asp Arg Arg
195 200 205
Gly Asp Val Ala Ile Cys His Arg Pro Ile Ala Val Arg Pro Gln Gln
210 215 220
Ser
225
<210> 42
<211> 301
<212> PRT
<213> 雷蒙德氏棉(Gossypium raimondii)
<400> 42
Met Met Val Gly Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Gly Phe
1 5 10 15
Pro Gln Asn His His Ser Leu Gln Leu Asn Leu Arg Pro Ser Leu Leu
20 25 30
Pro Ser Ser Val Asp Ser Cys Ser Ser Val Pro Ser Gly Phe Thr Ala
35 40 45
Phe His Lys Ser Ser Trp Asn Asp Val Ser Ala Pro Ser Asp Pro Asn
50 55 60
Ala Glu Ser Phe Arg Gly Glu Thr Arg Ser Phe Leu Arg Gly Ile Asp
65 70 75 80
Val Asn Arg Leu Pro Ser Thr Val Asp Cys Glu Glu Glu Ala Gly Val
85 90 95
Ser Ser Pro Asn Ser Thr Ile Ser Ser Val Ser Gly Lys Arg Ser Glu
100 105 110
Arg Glu Gly Thr Asn Gly Asp Glu Leu Asp Ile Glu Arg Ala Cys Ser
115 120 125
Arg Gly Ile Ser Asp Glu Glu Asp Gly Asp Ala Ser Arg Lys Lys Leu
130 135 140
Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu Ser Phe Lys Glu
145 150 155 160
His Asn Thr Leu Asn Pro Lys Gln Lys Met Ala Leu Ala Lys Gln Leu
165 170 175
Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
180 185 190
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg
195 200 205
Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
210 215 220
Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe Tyr Met Gln Met
225 230 235 240
Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Gly
245 250 255
Ala Ser Ser Thr Val Asp Pro Arg Ser His His Gln Leu Pro Gln Thr
260 265 270
His His Arg Ala Ile Pro Ile Asn Pro Trp Ala Pro Ala Ala Ala Pro
275 280 285
Ile Pro His Gly Pro Phe Asp Ala Leu Arg Pro Gln Ser
290 295 300
<210> 43
<211> 285
<212> PRT
<213> 葡萄( Vitis vinifera)
<400> 43
Met Val Asp Lys Asp Asp Asp Leu Gly Leu Ser Leu Ala Leu Lys Cys
1 5 10 15
Pro Glu Ala Leu Pro Gln Arg Pro Leu Asn Leu Phe Val Gln Lys Lys
20 25 30
Ala Leu Cys Ser Asp Ala Phe His Ala Ser Glu Thr Arg Ala Tyr Leu
35 40 45
Arg Gly Ile Asp Val Asn Arg Ala Pro Thr Met Ala Asp Cys Glu Asp
50 55 60
Val Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly Lys
65 70 75 80
Arg Asn Asp Arg Glu Thr Asn Glu Glu Glu Asn Glu Asn Glu Asn Glu
85 90 95
Ile Glu Ser Ser Glu Glu Asp Ala Gly Gly Thr Gly Asp Thr Val Arg
100 105 110
Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Ala Ile Leu Glu Glu Thr
115 120 125
Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala
130 135 140
Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn
145 150 155 160
Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr
165 170 175
Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln
180 185 190
Lys Glu Val Gln Glu Leu Arg Thr Leu Lys Leu Ser Pro Gln Leu Tyr
195 200 205
Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu
210 215 220
Arg Val Ala Val Ala Ser Ala Ser Ser Ser Ala Pro Ser Pro Ser Pro
225 230 235 240
Ala Ser Asn Pro Leu Ala Ala Ala Pro His Phe Pro Leu Gly Pro His
245 250 255
Gln His Arg Pro Met Pro Ile Ala Gly Pro Trp Ala Gly Ala Ala Ser
260 265 270
Met Arg His Arg Pro Phe Asp Ala His Gly Thr Arg Ser
275 280 285
<210> 44
<211> 247
<212> PRT
<213> 展颖野生稻(Oryza glumipatula)
<400> 44
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Ala Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210> 45
<211> 245
<212> PRT
<213> 南方野生稻(Oryza meridionalis)
<400> 45
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Asp
195 200 205
Arg Arg Gly Ile Ser Thr Ser Thr Ala Ala Ala Gly Ser Ser Val Val
210 215 220
Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile Ala Val
225 230 235 240
Arg Pro Gln Gln Ser
245
<210> 46
<211> 305
<212> PRT
<213> 高山南芥(Arabis alpina)
<400> 46
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Leu
1 5 10 15
Gly Phe Asn Gln Lys Glu Gln Ser Pro Arg Leu Asn Pro Met Gln Phe
20 25 30
Gly Ser Tyr Ser Ser Ser Ser Ser His Met His Met Gln Ser Asn His
35 40 45
Ile Asn His Ser Gln Lys Ile Gln Asn Ser Trp Thr His Met Phe Gln
50 55 60
Ser Ser Glu Arg Asn Ser Asp Val Arg Ser Phe Leu Arg Gly Ile Asp
65 70 75 80
Val Asn Arg Ala Pro Ser Thr Val Val Val Asp Val Glu Glu Asp Ala
85 90 95
Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Val Met Ser Gly Lys
100 105 110
Arg Asn Glu Arg Val Ala Thr Val Val Gly Gly Gly Gly Val Ile Glu
115 120 125
Asp His Asp Val Glu Arg Ala Ser Ser Ser Leu Gly Gly Gly Ser Asp
130 135 140
Asp Glu Asp Gly Gly Gly Asn Gly Asp Asp Gly Ser Arg Lys Lys Leu
145 150 155 160
Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu Thr Phe Lys Glu
165 170 175
His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu Ala Lys Gln Leu
180 185 190
Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
195 200 205
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg
210 215 220
Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
225 230 235 240
Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu Tyr Met His Met
245 250 255
Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala
260 265 270
Ala Thr Ser Ser Ser Ser Ser Val Ala Pro Pro Ala Met Asn Ser Ser
275 280 285
Ser Pro Trp Ala Ala Ile Pro Leu Arg Gln Arg Pro Ala Ala Gly Ser
290 295 300
His
305
<210> 47
<211> 315
<212> PRT
<213> 琴叶拟南芥(Arabidopsis lyrata)
<400> 47
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Asn
1 5 10 15
Ser Gln Gln Lys Glu Pro Ser Leu Arg Leu Asn Leu Met Pro Leu Thr
20 25 30
Thr Ser Ser Ser Ser Ser Phe Gln His Met His Asn Gln Asn Asn Asn
35 40 45
Ser His Pro Gln Lys Ile His His Asn Ser Trp Thr His Leu Phe Gln
50 55 60
Ser Ser Gly Ile Lys Arg Thr Thr Ala Glu Arg Asn Ser Asp Ala Gly
65 70 75 80
Ser Phe Leu Arg Gly Phe Asn Val Ser Arg Ala Pro Ser Ala Val Ala
85 90 95
Val Val Asp Leu Glu Glu Glu Ala Ala Val Val Ser Ser Pro Asn Ser
100 105 110
Thr Val Ser Ser Leu Ser Gly Asn Lys Arg Asp Leu Ala Val Ala Arg
115 120 125
Gly Gly Asp Glu Asn Glu Ala Glu Arg Ala Ser Cys Ser Arg Gly Gly
130 135 140
Gly Ser Gly Gly Ser Asp Asp Glu Glu Gly Gly Asn Gly Asp Gly Ser
145 150 155 160
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
165 170 175
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
180 185 190
Ala Lys Gln Leu Asn Leu Arg Ala Arg Gln Val Glu Val Trp Phe Gln
195 200 205
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
210 215 220
Tyr Leu Lys Arg Cys Cys Asp Ser Leu Thr Glu Glu Asn Arg Arg Leu
225 230 235 240
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
245 250 255
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
260 265 270
Glu Arg Val Ser Ser Ser Ala Ala Thr Val Thr Ala Ala Pro Pro Thr
275 280 285
Thr Pro Thr Val Val Gly Arg Pro Ser Pro Gln Arg Leu Thr Pro Trp
290 295 300
Thr Thr Ile Ser Leu Gln Gln Lys Ser Gly Arg
305 310 315
<210> 48
<211> 247
<212> PRT
<213> 短舌野生稻(Oryza barthii)
<400> 48
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Ala Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210> 49
<211> 287
<212> PRT
<213> 巨桉(Eucalyptus grandis)
<400> 49
Met Met Val Glu Arg Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Phe
1 5 10 15
Ser Asp Ser Ser Arg Pro Ser Gln Leu Gly Ala Ser Pro Phe Gly Phe
20 25 30
Asn Leu Tyr Lys Pro Ser His Arg Asp Cys Glu Thr Phe Ala Ser Leu
35 40 45
Asp Arg Ile Ser Glu Ala Asp Ala Arg Pro Ser Leu Arg Gly Ile Asp
50 55 60
Val Asn Arg Pro Pro Pro Ser Ala Ala Asp Cys Glu Glu Gln Glu Glu
65 70 75 80
Ala Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Val Ser Gly Lys
85 90 95
Arg Gly Glu Arg Glu Met Val Ser Gly Gly Glu Asp Asn Glu Ala Glu
100 105 110
Arg Asp Cys Ser Arg Gly Gly Ser Asp Glu Glu Asp Gly Glu Asn Ser
115 120 125
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu
130 135 140
Ser Phe Arg Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
145 150 155 160
Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
165 170 175
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Ile Asp Cys Glu
180 185 190
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
195 200 205
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
210 215 220
Tyr Met His Met Pro Pro Pro Thr Thr Leu Thr Val Cys Pro Asn Cys
225 230 235 240
Glu Arg Val Gly Ala Ala Ala Pro Pro Leu Pro Ser Ala Gly Gly Gly
245 250 255
Gly Arg Pro Ala His His Arg Glu Pro Val Pro Met Ile Pro Trp Ala
260 265 270
Ala Arg Pro Gly Pro Val Ser His Gly Ala Leu Arg Pro Arg Thr
275 280 285
<210> 50
<211> 323
<212> PRT
<213> 盐芥(Eutrema salsugineum)
<400> 50
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Phe
1 5 10 15
Ser Gln Gln Lys Glu Pro Cys Pro Arg Leu Asn Leu Leu Pro Leu Thr
20 25 30
Thr Ser Ser Ser Ser Ser Ser Phe His His Met His Asn His Asn Asn
35 40 45
Asn His Leu Gln Lys Lys Ile Gln His Asn Ser Trp Pro His Leu Phe
50 55 60
Gln Ser Ser Glu Lys Asn Pro Asp Ala Gly Ser Phe Gly Arg Gly Phe
65 70 75 80
Asp Val Asn Arg Ala Pro Ser Ala Ala Ala Val Val Asp Leu Glu Glu
85 90 95
Asp Gly Thr Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Val Ser
100 105 110
Gly Asn Lys Arg Asp Leu Ala Ala Ala Arg Gly Gly Gly Gly Asp Glu
115 120 125
Asn Glu Gly Glu Arg Ala Ser Cys Ser His Gly Gly Gly Ser Gly Gly
130 135 140
Ser Asp Asp Glu Asp Gly Gly Asn Gly Asp Gly Ser Arg Lys Lys Leu
145 150 155 160
Arg Leu Ser Lys Glu Gln Ala Val Val Leu Glu Glu Thr Phe Lys Glu
165 170 175
His Thr Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Arg Gln Leu
180 185 190
Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
195 200 205
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg
210 215 220
Cys Cys Asp Asn Leu Thr Glu Glu Asn Arg Arg Leu His Lys Glu Val
225 230 235 240
Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu Tyr Met His Met
245 250 255
Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ser
260 265 270
Ala Ser Ser Ser Ser Thr Ala Val Ala Ala Pro Pro Ser Ser Ser Ser
275 280 285
Ala Ala Ser Gly Gly Gly Gly Trp Ile Pro Thr Val Val Gly Arg Pro
290 295 300
Ser Pro Gln Arg Pro Thr Pro Cys Ala Ala Ile Ser Leu Gln Ser Arg
305 310 315 320
Leu Ala His
<210> 51
<211> 241
<212> PRT
<213> 假稻(Leersia perrieri)
<400> 51
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala Pro
20 25 30
Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys Arg
35 40 45
Ser Glu Val Val Val Ala Ala Asp Glu Gly Met Arg Gly Gly Gly Gly
50 55 60
Gly Ser Asp Glu Glu Glu Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys
65 70 75 80
Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe
85 90 95
Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu Ala Gln
100 105 110
Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg
115 120 125
Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu
130 135 140
Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys
145 150 155 160
Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His Leu Tyr
165 170 175
Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu
180 185 190
Arg Val Ser Asn Thr Asn Asn Ser Asn Ser Asn Ser Ser Ser Ser Ala
195 200 205
Ala Ala Ala Ala Ala Asp Arg Arg Gly Val Gly Ser Asp Thr Ala Ala
210 215 220
Glu Gly Gly Ile Leu Cys His Arg Pro Ile Ala Val Arg Pro Gln Gln
225 230 235 240
Ser
<210> 52
<211> 320
<212> PRT
<213> 荠菜(Capsella rubella)
<400> 52
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Asn
1 5 10 15
Ser Ser Gln Leu Lys Glu Pro Ser Leu Arg Leu Asn Leu Thr Pro Phe
20 25 30
Thr Ala Ser Thr Ser Ser Ser Phe Pro Pro His Met His Asn Gln Ile
35 40 45
Ile Asn Asn Asn Ser His Pro Gln Lys Ile His His Asn Ser Trp Thr
50 55 60
His Leu Phe Gln Ser Ser Gly Ile Lys Arg Thr Thr Ala Glu Arg Asn
65 70 75 80
Ser Asp Ala Gly Ser Phe Leu Arg Ser Phe Asp Val Asn Arg Ala Pro
85 90 95
Ser Ser Ser Val Ala Val Val Asn Leu Glu Glu Glu Ala Ala Val Val
100 105 110
Ser Ser Pro Asn Ser Thr Val Ser Ser Leu Ser Gly Asn Lys Arg Asp
115 120 125
Leu Ala Ala Ala Arg Gly Gly Asp Glu His Glu Ala Glu Arg Ala Ser
130 135 140
Cys Ser Arg Gly Gly Gly Ser Asp Asp Glu Asp Cys Gly Asn Gly Asp
145 150 155 160
Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu
165 170 175
Glu Glu Thr Phe Lys Val His Ser Thr Leu Asn Pro Lys Gln Lys Leu
180 185 190
Val Leu Ala Lys Gln Leu Asn Leu Arg Ala Arg Gln Val Glu Val Trp
195 200 205
Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp
210 215 220
Cys Glu Tyr Leu Lys Arg Cys Cys Asp Asn Leu Thr Glu Glu Asn Arg
225 230 235 240
Arg Leu Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro
245 250 255
His Leu Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro
260 265 270
Ser Cys Glu Arg Val Ser Ser Thr Ser Ser Ala Asn Ala Ser Ile Ala
275 280 285
Pro Pro Pro Pro Pro Ala Thr Ser Val Val Gly Arg Pro Ser Pro Gln
290 295 300
Arg Ser Thr His Trp Thr Ala Ile Ser Leu Gln Gln Arg Ser Gly Arg
305 310 315 320
<210> 53
<211> 287
<212> PRT
<213> 克莱门柚(Citrus clementina)
<400> 53
Met Gly Glu Lys Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Cys
1 5 10 15
Ala Ala Arg Asn Glu Pro Ser Leu Arg Leu Asn His Met Pro Leu Ser
20 25 30
Ser Ser Gln Ser Met Gln Asn His His Lys Arg Ser Pro Trp Thr Glu
35 40 45
Leu Phe His Ser Ser Asp Arg Asn Ser Asp Thr Arg Ser Phe Leu Arg
50 55 60
Gly Ile Asp Val Asn Gln Ala Pro Thr Val Ala Asp Cys Glu Glu Glu
65 70 75 80
Asn Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Ile Ser Gly Lys
85 90 95
Arg Ser Glu Arg Glu Pro Ile Gly Asp Glu Thr Glu Ala Glu Arg Ala
100 105 110
Ser Cys Ser Arg Gly Ser Asp Asp Glu Asp Gly Gly Ala Gly Asp Ala
115 120 125
Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu
130 135 140
Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala
145 150 155 160
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
165 170 175
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
180 185 190
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
195 200 205
Leu Gln Lys Glu Val Gln Glu Leu Arg Ser Leu Lys Leu Ser Pro Gln
210 215 220
Leu Tyr Met Asn Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
225 230 235 240
Cys Glu Arg Val Ala Val Ser Ser Ser Ser Ser Ser Ser Ser Ala Ala
245 250 255
Ala Asn Gly Thr Thr Arg Leu Pro Ile Gly Pro Asn His Gln Arg Leu
260 265 270
Thr Pro Val Ser Pro Trp Ala Ala Leu Pro Ile His His Arg Ser
275 280 285
<210> 54
<211> 333
<212> PRT
<213> 川桑(Morus notabilis)
<400> 54
Met Gly Glu Lys Asp Asp Asp Gly Leu Gly Leu Gly Leu Ser Leu Ser
1 5 10 15
Leu Gly Ile Phe Gly Gly Thr Thr Thr Thr Ala Thr Thr His Thr Thr
20 25 30
Thr His Gln Pro Gly Ser Ser Ser Ser Ser Ser Leu Lys Phe Asn Leu
35 40 45
Met Gln Lys Pro Ser Ser Ser Ser Met Gln Tyr Gln Gln Lys Thr Thr
50 55 60
Asn Thr Thr Ala Thr Pro Trp Asn Glu Ile Phe Gln Leu Ser Asp Arg
65 70 75 80
Asn Ser Asp Gly Arg Ser Phe Leu Arg Gly Leu Asp Val Asn Leu Thr
85 90 95
Pro Ser Phe Ala Ala Ala Ala Ala Ala Asp Tyr Asp Glu Glu Asn Gly
100 105 110
Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly Lys Lys Ser
115 120 125
Glu Arg Glu Ala Pro Gly Gly Glu Glu Ala Glu Glu Gly Asp Arg Asp
130 135 140
Ser Cys Ser Arg Gly Gly Gly Gly Ser Asp Asp Glu Asp Gly Gly Asn
145 150 155 160
Gly Gly Gly Asp Ala Ser Arg Lys Lys Leu Arg Leu Thr Lys Asp Gln
165 170 175
Ser Leu Ile Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu Asn Pro
180 185 190
Lys Gln Lys Leu Ala Leu Ala Lys Glu Leu Asn Leu Arg Pro Arg Gln
195 200 205
Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln
210 215 220
Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr
225 230 235 240
Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu
245 250 255
Lys Leu Ser Pro Gln Leu Tyr Met His Met Ser Pro Pro Thr Thr Leu
260 265 270
Thr Met Cys Pro Ser Cys Glu Arg Val Ala Ala Ser Ser Ser Leu Ser
275 280 285
Ser Thr Ala Ala Ala Ala Pro Asn Gly Ser Asn Arg Gln Pro Ala Val
290 295 300
Pro Ser Ile Pro Arg Pro Val Pro Ile Asn Pro Trp Ala Ala Leu Pro
305 310 315 320
Ile Pro His Arg Pro Leu Asp Thr Pro Ala Ser Arg Ser
325 330
<210> 55
<211> 287
<212> PRT
<213> 甜橙
<400> 55
Met Gly Glu Lys Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Cys
1 5 10 15
Ala Ala Arg Asn Glu Pro Ser Leu Arg Leu Asn His Met Pro Leu Ser
20 25 30
Ser Ser Gln Ser Met Gln Asn His His Lys Arg Ser Pro Trp Thr Glu
35 40 45
Leu Phe His Ser Ser Asp Arg Asn Ser Asp Thr Arg Ser Phe Leu Arg
50 55 60
Gly Ile Asp Val Asn Gln Ala Pro Thr Val Ala Asp Cys Glu Glu Glu
65 70 75 80
Asn Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Ile Ser Gly Lys
85 90 95
Arg Ser Glu Arg Glu Pro Ile Gly Asp Glu Thr Glu Ala Glu Arg Ala
100 105 110
Ser Cys Ser Arg Gly Ser Asp Asp Glu Asp Gly Gly Ala Gly Asp Ala
115 120 125
Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu
130 135 140
Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala
145 150 155 160
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
165 170 175
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
180 185 190
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
195 200 205
Leu Gln Lys Glu Val Gln Glu Leu Arg Ser Leu Lys Leu Ser Pro Gln
210 215 220
Leu Tyr Met Asn Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
225 230 235 240
Cys Glu Arg Val Ala Val Ser Ser Ser Ser Ser Ser Ser Ser Ala Ala
245 250 255
Ala Asn Gly Thr Thr Arg Leu Pro Ile Gly Pro Asn His Gln Arg Leu
260 265 270
Thr Pro Val Ser Pro Trp Ala Ala Leu Pro Ile His His Arg Ser
275 280 285
<210> 56
<211> 160
<212> PRT
<213> 小立碗藓小立亚种(Physcomitrella patens subsp. patens)
<400> 56
Met Ser Ser Arg Gly Gly Ser Asp Asp Glu Asp Glu Gly Thr Thr Arg
1 5 10 15
Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Ala Leu Leu Glu Glu Ser
20 25 30
Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Asn Ala Leu Ala
35 40 45
Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn
50 55 60
Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu
65 70 75 80
Leu Lys Arg Cys Cys Asp Ser Leu Lys Glu Glu Asn Arg Arg Leu Gln
85 90 95
Lys Glu Leu Leu Glu Leu Arg Ala Ile Lys Val Ala Pro Pro Cys Val
100 105 110
Ile Ser His Asp Tyr Tyr Met Pro Leu Pro Ala Ala Thr Leu Thr Met
115 120 125
Cys Pro Ser Cys Glu Arg Val Ala Thr Val Asp Asn Arg Ser Leu Thr
130 135 140
Phe Ala Lys Pro Gly Phe Ser His Leu Ser Gln Ser Ser Ala Ala Cys
145 150 155 160
<210> 57
<211> 295
<212> PRT
<213> 可可树
<400> 57
Met Gly Ala Glu Lys Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly
1 5 10 15
Cys Ala Gln Asn His Pro Ser Leu Lys Leu Asn Leu Met Pro Leu Ala
20 25 30
Ser Pro Arg Met Gln Asn Leu Gln Gln Lys Asn Thr Trp Asn Glu Leu
35 40 45
Phe Gln Ser Ser Asp Arg Asn Leu Asp Thr Arg Ser Phe Leu Arg Gly
50 55 60
Ile Asp Val Asn Arg Ala Pro Ala Thr Val Asp Cys Glu Glu Glu Gly
65 70 75 80
Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly Lys Arg
85 90 95
Asn Glu Arg Asp Pro Val Gly Asp Glu Thr Glu Ala Glu Arg Ala Ser
100 105 110
Cys Ser Arg Ala Ser Asp Asp Glu Asp Gly Gly Ala Gly Gly Asp Ala
115 120 125
Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu
130 135 140
Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala
145 150 155 160
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
165 170 175
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
180 185 190
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
195 200 205
Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln
210 215 220
Leu Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
225 230 235 240
Cys Glu Arg Val Ala Val Ser Ser Ser Ser Ser Ser Ala Ala Ala Thr
245 250 255
Ala Ser Ser Thr Pro Thr Ser Thr Val Pro Asn Arg His His Arg Thr
260 265 270
Ser Ser Val Ser Pro Trp Ala Ala Met Pro Ile Gly His Arg Pro Phe
275 280 285
His Ala Pro Ala Ser Arg Ser
290 295
<210> 58
<211> 292
<212> PRT
<213> 甜瓜
<400> 58
Met Gly Gly Arg Asp Asp Asp Leu Gly Leu Thr Leu Ser Leu Gly Phe
1 5 10 15
Gly Val Thr Thr Gln Pro Thr His Met Gln Arg Pro Ser Met His Asn
20 25 30
His Leu Arg Lys Thr Ser Trp Asn Glu Leu Phe Gln Phe Ser Asp Arg
35 40 45
Asn Ala Asp Ser Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Leu
50 55 60
Pro Thr Gly Val Asp Gly Glu Glu Glu Asn Gly Val Ser Ser Pro Asn
65 70 75 80
Ser Thr Ile Ser Ser Ile Ser Gly Lys Arg Ser Glu Arg Glu Ala Ala
85 90 95
Gly Asp Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala
100 105 110
Glu Ala Glu Ala Glu Arg Ala Ser Cys Ser Arg Gly Ser Asp Asp Glu
115 120 125
Asp Gly Gly Gly Gly Asp Gly Asp Ala Ser Arg Lys Lys Leu Arg Leu
130 135 140
Ser Lys Glu Gln Ser Met Val Leu Glu Glu Thr Phe Lys Glu His Asn
145 150 155 160
Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu
165 170 175
Thr Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr
180 185 190
Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys
195 200 205
Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu
210 215 220
Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met Asn Pro
225 230 235 240
Pro Thr Thr Leu Thr Met Cys Pro Gln Cys Glu Arg Val Ala Val Ser
245 250 255
Ser Ser Ser Ser Thr Ser Ala Ala Thr Thr Thr Arg His Pro Ala Ala
260 265 270
Ala Gly Val Gln Arg Thr Ser Met Ala Ile Asn Pro Trp Ala Val Leu
275 280 285
Pro Ile Gln Arg
290
<210> 59
<211> 294
<212> PRT
<213> 黄瓜
<400> 59
Met Gly Gly Arg Asp Asp Asp Val Gly Leu Thr Leu Ser Leu Gly Phe
1 5 10 15
Gly Val Thr Thr Gln Ser Thr His Met Gln Arg Pro Ser Ser Met His
20 25 30
Asn His His Leu Arg Lys Thr His Trp Asn Glu Leu Phe Gln Phe Ser
35 40 45
Asp Arg Asn Ala Asp Ser Arg Ser Phe Leu Arg Gly Ile Asp Val Asn
50 55 60
Arg Leu Pro Thr Gly Val Asp Gly Glu Glu Glu Asn Gly Val Ser Ser
65 70 75 80
Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly Lys Arg Ser Glu Arg Glu
85 90 95
Ala Ala Gly Asp Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala Glu Ala
100 105 110
Glu Ala Glu Ala Glu Ala Glu Arg Ala Ser Cys Ser Arg Gly Ser Asp
115 120 125
Asp Glu Asp Gly Gly Gly Gly Asp Gly Asp Ala Ser Arg Lys Lys Leu
130 135 140
Arg Leu Ser Lys Glu Gln Ser Met Val Leu Glu Glu Thr Phe Lys Glu
145 150 155 160
His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu
165 170 175
Asn Leu Thr Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
180 185 190
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg
195 200 205
Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
210 215 220
Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met
225 230 235 240
Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Gln Cys Glu Arg Val Ala
245 250 255
Val Ser Ser Ser Ser Ser Thr Ser Ala Ala Thr Thr Thr Arg His Gln
260 265 270
Ala Ala Ala Gly Val Gln Arg Pro Ser Met Ala Ile Asn Pro Trp Ala
275 280 285
Val Leu Pro Ile Gln Arg
290
<210> 60
<211> 298
<212> PRT
<213> 毛果杨
<400> 60
Met Gly Asp Lys Asn Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Phe
1 5 10 15
Asp Ala Thr Gln Gln Asn His Gln Gln Gln Pro Ser Leu Lys Leu Asn
20 25 30
Leu Met Pro Val Pro Ser Gln Asn Asn His Arg Lys Thr Ser Leu Thr
35 40 45
Asp Leu Phe Gln Ser Ser Asp Arg Ala Cys Gly Thr Arg Phe Phe Gln
50 55 60
Arg Gly Ile Asp Met Asn Arg Val Pro Ala Ala Val Thr Asp Cys Asp
65 70 75 80
Asp Glu Thr Gly Val Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu Ser
85 90 95
Gly Lys Arg Ser Glu Arg Glu Gln Ile Gly Glu Glu Thr Glu Ala Glu
100 105 110
Arg Ala Ser Cys Ser Arg Asp Ser Asp Asp Glu Asp Gly Ala Gly Gly
115 120 125
Asp Ala Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Val
130 135 140
Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Glu Lys
145 150 155 160
Leu Ala Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val
165 170 175
Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val
180 185 190
Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn
195 200 205
Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser
210 215 220
Pro Gln Leu Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys
225 230 235 240
Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ala Ser Ser Ser Ser Ala
245 250 255
Ala Ala Ala Ser Ser Ala Leu Ala Pro Thr Ala Ser Thr Arg Gln Pro
260 265 270
Gln Arg Pro Val Pro Ile Asn Pro Trp Ala Thr Met Pro Val His Gln
275 280 285
Arg Thr Phe Asp Ala Pro Ala Ser Arg Ser
290 295
<210> 61
<211> 315
<212> PRT
<213> 拟南芥
<400> 61
Met Ser Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Ser Leu
1 5 10 15
Gly Phe Asn Gln Lys Asp Pro Ser Ser Arg Leu Asn Pro Met Pro Leu
20 25 30
Ala Ser Tyr Ala Ser Ser Ser His Met Gln His Met Gln Gln Ser Asn
35 40 45
Tyr Asn His Pro Gln Lys Ile Gln Asn Thr Trp Ile Asn Met Phe Gln
50 55 60
Ser Ser Glu Arg Asn Ser Asp Met Arg Ser Phe Leu Arg Gly Ile Asp
65 70 75 80
Val Asn Arg Ala Pro Ser Thr Val Val Val Asp Val Glu Asp Glu Gly
85 90 95
Ala Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Val Met Ser Gly
100 105 110
Lys Lys Ser Glu Arg Glu Leu Met Ala Ala Ala Gly Ala Val Gly Gly
115 120 125
Gly Arg Val Glu Asp Asn Glu Ile Glu Arg Ala Ser Cys Ser Leu Gly
130 135 140
Gly Gly Ser Asp Asp Glu Asp Gly Ser Gly Asn Gly Asp Asp Ser Ser
145 150 155 160
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
165 170 175
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu
180 185 190
Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln
195 200 205
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
210 215 220
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Asp Glu Asn Arg Arg Leu
225 230 235 240
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
245 250 255
Tyr Met His Met Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
260 265 270
Glu Arg Val Ala Val Thr Ser Ser Ser Ser Ser Val Ala Pro Pro Val
275 280 285
Met Asn Ser Ser Ser Pro Met Gly Pro Met Ser Pro Trp Ala Ala Met
290 295 300
Pro Leu Arg Gln Arg Pro Ala Ala Gly Ser His
305 310 315
<210> 62
<211> 311
<212> PRT
<213> 白菜型油菜
<400> 62
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Ser Leu
1 5 10 15
Gly Leu Asn Gln Lys Glu Ser Ser Pro Arg Leu Asn Pro Met Pro Met
20 25 30
Ala Ser Tyr Ser Ser Ser Ser His Met His Met Gln Ser His Tyr Asn
35 40 45
His Pro Gln Lys Ile Gln Asn Ser Trp Ile Gln Met Phe Gln Ser Ser
50 55 60
Glu Arg Asn Ser Asp Val Gly Ser Phe Leu Arg Gly Leu Asp Val Asn
65 70 75 80
Arg Ala Pro Ser Arg Val Val Val Asp Val Glu Glu Asp Ala Gly Val
85 90 95
Ser Ser Pro Asn Ser Thr Val Ser Ser Val Met Ser Gly Lys Arg Asn
100 105 110
Glu Arg Glu Leu Val Ala Ala Ala Gly Thr Gly Gly Gly Arg Thr Ile
115 120 125
Glu Asp Asn Glu Ala Glu Arg Gly Ser Ser Ser Leu Gly Gly Gly Ser
130 135 140
Asp Asp Glu Asp Gly Gly Gly Asn Gly Asp Asp Gly Ser Arg Lys Lys
145 150 155 160
Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu Thr Phe Lys
165 170 175
Glu His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu Ala Lys Gln
180 185 190
Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg
195 200 205
Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys
210 215 220
Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu
225 230 235 240
Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His
245 250 255
Met Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val
260 265 270
Ala Val Ala Ser Ser Ser Val Ala Pro Ala Pro Val Met Ser Ser Ser
275 280 285
Ser Pro Met Gly Pro Met Ser Pro Trp Ala Ala Ile Pro Leu Arg Gln
290 295 300
Arg Pro Ala Ala Gly Ser Arg
305 310
<210> 63
<211> 301
<212> PRT
<213> 甘蓝
<400> 63
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Ser Leu
1 5 10 15
Gly Leu Asn Gln Lys Glu Ser Thr Pro Arg Leu Asn Pro Thr Pro Met
20 25 30
Ala Ser Tyr Ser Ser Ser Ser His Met His Met Gln Asn Ser Trp Ile
35 40 45
Gln Met Phe Gln Ser Ser Glu Arg Asn Ser Asp Val Gly Ser Phe Leu
50 55 60
Arg Gly Leu Asp Val Asn Arg Ala Pro Ser Arg Val Val Val Asp Val
65 70 75 80
Glu Glu Asp Ala Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Val
85 90 95
Met Ser Gly Lys Arg Asn Glu Arg Glu Leu Val Ala Ala Ala Gly Ala
100 105 110
Gly Gly Gly Arg Thr Ile Glu Asp Asn Glu Thr Glu Arg Gly Ser Ser
115 120 125
Ser Leu Gly Gly Gly Ser Asp Asp Glu Asp Gly Gly Gly Asn Gly Asp
130 135 140
Asp Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val
145 150 155 160
Leu Glu Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys
165 170 175
Met Ala Leu Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val
180 185 190
Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val
195 200 205
Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn
210 215 220
Arg Arg Leu Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser
225 230 235 240
Pro Gln Leu Tyr Met His Met Lys Pro Pro Thr Thr Leu Thr Met Cys
245 250 255
Pro Ser Cys Glu Arg Val Ala Val Ala Ser Ser Ser Val Ala Pro Ala
260 265 270
Pro Val Met Ser Ser Ser Ser Pro Met Gly Pro Met Ser Pro Trp Ala
275 280 285
Ala Ile Pro Leu Arg Gln Arg Pro Ala Ala Gly Ser Arg
290 295 300
<210> 64
<211> 319
<212> PRT
<213> 桃
<400> 64
Met Met Val Glu Arg Asp Gln Asp Leu Gly Leu Ser Leu Ser Leu Ser
1 5 10 15
Phe Pro Gln Thr His Asn His His Asn Asn Asn Asn Asn Asn Ser Ser
20 25 30
Ser Thr Thr Ser Thr Leu Gln Leu Asn Leu Met Pro Ser Leu Ala Pro
35 40 45
Thr Ser Ala Ser Ser Pro Ser Gly Phe Leu Pro Gln Lys Pro Ser Trp
50 55 60
Asn Glu Ala Leu Ile Ser Ser Asp Arg Asn Ser Asn Ser Glu Thr Phe
65 70 75 80
Arg Val Gly Pro Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Leu
85 90 95
Pro Ser Thr Gly Asp Cys Glu Asp Glu Ala Gly Val Ser Ser Pro Asn
100 105 110
Ser Thr Val Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Ala Asn
115 120 125
Gly Glu Asp Leu Asp Ile Glu Thr Arg Gly Ile Ser Asp Glu Glu Asp
130 135 140
Gly Glu Thr Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala
145 150 155 160
Ile Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln
165 170 175
Lys Leu Ala Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu
180 185 190
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
195 200 205
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu
210 215 220
Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu
225 230 235 240
Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met
245 250 255
Cys Pro Ser Cys Glu Arg Val Ala Val Pro Pro Asn Ser Ser Ser Ser
260 265 270
Thr Val Glu Pro Arg Pro His Pro His Pro His Pro Gln Met Gly Ser
275 280 285
Val Gln Thr Arg Pro Val Pro Ile Asn Pro Trp Ala Ser Ala Thr Pro
290 295 300
Ile Pro His Arg Pro Leu Pro Phe Glu Ala Phe His Thr Arg Thr
305 310 315
<210> 65
<211> 299
<212> PRT
<213> 鹰嘴豆
<400> 65
Met Gly Asp Lys Glu Asp Glu Leu Gly Leu Gly Leu Ser Leu Ser Leu
1 5 10 15
Ser Leu Gly Tyr Gly Ala Asn Ala Asn Asn Ala Pro Leu Lys Val Thr
20 25 30
His Met His Lys Pro Pro Gln Ser Val Pro Asn Gln Arg Val Ser Phe
35 40 45
Asn Asn Phe Phe His Phe His Asp Leu Ser Ser Glu Thr Arg Ser Phe
50 55 60
Ile Gly Gly Ile Asp Val Asn Ser Pro Ala Thr Ala Ala Cys Asp Asp
65 70 75 80
Glu Asn Gly Gly Ser Ser Pro Asn Ser Thr Val Ser Ser Ile Ser Gly
85 90 95
Lys Arg Ser Glu Arg Glu Gly Asn Gly Glu Glu Asn Asp Ala Val Glu
100 105 110
Arg Ala Ser Cys Ser Arg Gly Gly Ser Asp Asp Asp Asp Gly Gly Gly
115 120 125
Cys Gly Gly Asp Gly Asp Ser Ser Arg Lys Lys Leu Arg Leu Ser Lys
130 135 140
Glu Gln Ser Val Leu Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu
145 150 155 160
Asn Pro Lys Gln Lys Gln Ala Leu Ala Lys Gln Leu Asn Leu Met Pro
165 170 175
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu
180 185 190
Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Thr
195 200 205
Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg
210 215 220
Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met Asn Pro Pro Thr
225 230 235 240
Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ala
245 250 255
Ser Ser Ser Ser Ala Asn Val Pro Ser Ala Leu Ala Pro Ala Asn Arg
260 265 270
Asn Ser Ile Gly Pro Ser Val Gln Arg Pro Val Pro Leu Asn Pro Trp
275 280 285
Ala Ala Met Ser Ile Gln Asn Arg Ser Arg Pro
290 295
<210> 66
<211> 299
<212> PRT
<213> 大豆
<400> 66
Met Met Val Gln Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Asn Phe
1 5 10 15
Pro His His Asn Thr Pro Asn Pro Gln His Pro Ser Leu Met Ser Ser
20 25 30
Ser Thr His Ser Ser Ser Pro Ser Gly Cys Asn Pro Gln Lys Pro Ser
35 40 45
Trp Asn Glu Ala Phe Thr Ser Ser Asp Arg Asn Ser Asp Thr Cys Arg
50 55 60
Gly Glu Thr Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Leu Pro
65 70 75 80
Ser Ala Val Asp Thr Glu Glu Glu Thr Gly Val Ser Ser Pro Asn Ser
85 90 95
Thr Val Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Glu Pro Asn
100 105 110
Gly Glu Glu His Asp Met Asp Arg Ala Cys Ser Arg Gly Ile Ser Asp
115 120 125
Glu Glu Asp Ala Glu Thr Ala Arg Lys Lys Leu Arg Leu Ser Lys Asp
130 135 140
Gln Ser Ala Ile Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn
145 150 155 160
Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg
165 170 175
Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys
180 185 190
Gln Thr Glu Val Asp Cys Glu Val Leu Lys Arg Cys Cys Glu Asn Leu
195 200 205
Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala
210 215 220
Leu Lys Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr
225 230 235 240
Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Pro Ser Ser Ala
245 250 255
Val Asp Ala Ala Thr Arg His His Pro Met Ala Gln Ala Gln Ala Gln
260 265 270
Ala Gln Ile Arg His Arg Pro Ile Gly Pro Trp Ala Ser Ala Ser Pro
275 280 285
Ile Thr His Arg Pro Phe Asp Val Phe His His
290 295
<210> 67
<211> 296
<212> PRT
<213> 蒺藜苜蓿
<400> 67
Met Ser Ile Glu Lys Glu Asp Phe Gly Leu Ser Leu Ser Leu Ser Phe
1 5 10 15
Pro Gln Asn Pro Pro Asn Pro Gln Tyr Leu Asn Leu Met Ser Ser Ser
20 25 30
Thr His Ser Tyr Ser Pro Ser Thr Phe Asn Pro Gln Lys Pro Ser Trp
35 40 45
Asn Asp Val Phe Thr Ser Ser Asp Arg Asp Ser Glu Thr Cys Arg Ile
50 55 60
Glu Glu Arg Pro Leu Ile Leu Arg Gly Ile Asp Val Asn Arg Leu Pro
65 70 75 80
Ser Gly Ala Asp Cys Glu Glu Glu Ala Gly Val Ser Ser Pro Asn Ser
85 90 95
Thr Val Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Val Thr Gly
100 105 110
Glu Asp Leu Asp Met Glu Arg Asp Cys Ser Arg Gly Ile Ser Asp Glu
115 120 125
Glu Asp Ala Glu Thr Ser Arg Lys Lys Leu Arg Leu Thr Lys Asp Gln
130 135 140
Ser Ile Ile Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro
145 150 155 160
Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Gly Leu Arg Ala Arg Gln
165 170 175
Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln
180 185 190
Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr
195 200 205
Asp Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu
210 215 220
Lys Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu
225 230 235 240
Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Pro Ser Ser Ala Val
245 250 255
Asp Ala Ala Thr Arg Arg His Pro Met Ala Ser Asn His Pro Arg Thr
260 265 270
Phe Ser Val Gly Pro Trp Ala Thr Ala Ala Pro Ile Gln His Arg Thr
275 280 285
Phe Asp Thr Leu Arg Pro Arg Ser
290 295
<210> 68
<211> 295
<212> PRT
<213> 菜豆
<400> 68
Met Met Val Gln Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Asn Phe
1 5 10 15
Arg His Asn Ile Pro Asn Pro Gln His Leu Thr Leu Ile Ser Ser Ser
20 25 30
Thr His Ser Ser Ser Pro Ser Ala Ser Asn Pro Phe Lys Pro Ser Trp
35 40 45
Asn Asp Pro Phe Ala Ser Ser Asp Arg Asn Ser Asp Thr Cys Arg Gly
50 55 60
Glu Thr Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Leu Pro Ser
65 70 75 80
Ala Val Asp Met Glu Glu Glu Ala Gly Val Ser Ser Pro Asn Ser Thr
85 90 95
Val Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Pro Asn Gly Glu
100 105 110
Glu His Asp Met Asn Arg Ala Cys Ser Arg Gly Ile Ser Asp Glu Glu
115 120 125
Asp Gly Glu Thr Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser
130 135 140
Ala Ile Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys
145 150 155 160
Gln Lys Leu Ala Leu Ala Lys Gln Leu Gly Leu Leu Pro Arg Gln Val
165 170 175
Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr
180 185 190
Glu Val Asp Cys Glu Val Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu
195 200 205
Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys
210 215 220
Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr
225 230 235 240
Met Cys Pro Ser Cys Glu Arg Val Ala Val Pro Ser Ser Ala Val Asp
245 250 255
Ala Ala Thr Arg His His Pro Met Ala Gln Ala Gln Thr His Gly Arg
260 265 270
Pro Ile Pro Ile Gly Pro Trp Ala Ser Ala Gly Pro Ile Pro Gln Arg
275 280 285
Ala Phe Asp Gly Phe His Gln
290 295
<210> 69
<211> 294
<212> PRT
<213> 蓖麻
<400> 69
Met Glu Asp Lys Asp Asp Gly Leu Gly Leu Gly Leu Ser Leu Ser Leu
1 5 10 15
Gly Gly Gln Glu Lys His Gln Asn Gln Pro Ser Leu Lys Leu Asn Leu
20 25 30
Met Pro Phe Pro Ser Leu Phe Met Gln Asn Thr His His Ser Thr Ser
35 40 45
Leu Asn Asp Leu Phe Gln Ser Ser Asp Arg Asn Ala Asp Thr Arg Ser
50 55 60
Phe Gln Arg Gly Ile Asp Met Asn Arg Met Pro Leu Phe Ala Asp Cys
65 70 75 80
Asp Asp Glu Asn Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Leu
85 90 95
Ser Gly Lys Arg Ser Glu Arg Glu Gln Ile Gly Gly Glu Glu Met Glu
100 105 110
Ala Glu Arg Ala Ser Cys Ser Arg Gly Gly Ser Asp Asp Glu Asp Gly
115 120 125
Gly Ala Gly Gly Asp Asp Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys
130 135 140
Glu Gln Ser Leu Leu Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu
145 150 155 160
Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu Lys Pro
165 170 175
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Ser
180 185 190
Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn
195 200 205
Leu Thr Gln Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg
210 215 220
Ala Leu Lys Leu Ser Pro Gln Leu Tyr Met His Met Asn Pro Pro Thr
225 230 235 240
Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ser
245 250 255
Ala Ala Pro Ser Arg Gln Pro Pro Asn Ser Gln Pro Gln Arg Pro Val
260 265 270
Pro Val Lys Pro Trp Ala Ala Leu Pro Ile Gln His Arg Pro Phe Asp
275 280 285
Thr Pro Ala Ser Arg Ser
290
<210> 70
<211> 300
<212> PRT
<213> 美花烟草
<400> 70
Met Leu Glu Asn Gln Asp Leu Gly Leu Ser Leu Ser Leu Ser Phe Pro
1 5 10 15
Glu Asn Lys Thr Thr Asn Ser Leu Gln Leu Asn Leu Phe Ser Ser Leu
20 25 30
Ala Ser Ser Thr Ser Pro Ser Pro Ser Pro Ser Pro Phe Asn Leu Leu
35 40 45
Gln Lys Thr Cys Trp Thr Asp Ser Phe Pro Ser Ser Asp Arg Asn Leu
50 55 60
Glu Thr Cys Arg Thr Phe Leu Lys Gly Ile Asp Val Asn Arg Ile Pro
65 70 75 80
Thr Ile Thr Asp Thr Glu Glu Glu Glu Ala Gly Val Ser Ser Pro Asn
85 90 95
Ser Thr Ile Ser Ser Leu Ser Gly Asn Lys Arg Asn Glu Arg Glu Ile
100 105 110
Asn Cys Glu Glu Glu Leu Asp Cys Cys Arg Gly Ile Ser Asp Glu Glu
115 120 125
Asp Gly Glu Thr Cys Arg Lys Lys Leu Arg Leu Thr Lys Asp Gln Ser
130 135 140
Ala Val Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys
145 150 155 160
Gln Lys Gln Ala Leu Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln Val
165 170 175
Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr
180 185 190
Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu
195 200 205
Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Thr Leu Lys
210 215 220
Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr
225 230 235 240
Met Cys Pro Ser Cys Glu Gln Val Ala Gly Pro Pro Thr Pro Ser Pro
245 250 255
Pro Gly Pro Thr Asn Val Asp Pro Arg Ala His Gln Met Gly Leu Ala
260 265 270
Gln Gln Gln Arg Pro Met Pro Phe Asn Leu Trp Ala Thr Ser Pro Val
275 280 285
Pro His Arg Pro Ile Ser Ala Leu Asn Pro Arg Ser
290 295 300
<210> 71
<211> 275
<212> PRT
<213> 马铃薯
<400> 71
Met Val Glu Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Phe Pro
1 5 10 15
Asp Asn Asn Asn Lys Lys Asn Thr Gln Leu Asn Leu Ser Pro Phe Asn
20 25 30
Leu Ile Gln Lys Thr Ser Trp Thr Asp Ser Leu Phe Pro Ser Ser Asp
35 40 45
Arg Asn Ile Glu Thr Cys Arg Val Glu Thr Arg Thr Phe Leu Lys Gly
50 55 60
Ile Asp Val Asn Arg Leu Pro Ala Thr Gly Glu Ala Asp Glu Glu Ala
65 70 75 80
Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Val Ser Gly Asn Lys
85 90 95
Arg Thr Glu Arg Glu Ala Asn Asn Cys Asp Gln Glu Glu His Glu Met
100 105 110
Glu Arg Gly Ser Asp Glu Glu Asp Gly Glu Thr Ser Arg Lys Lys Leu
115 120 125
Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu Ser Phe Lys Glu
130 135 140
His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Arg Leu
145 150 155 160
Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
165 170 175
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg
180 185 190
Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
195 200 205
Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe Tyr Met Gln Met
210 215 220
Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala
225 230 235 240
Gly Pro Pro Ser Ser Ser Ser Gly Pro Thr Ser Thr Pro Met Gly Gln
245 250 255
Ala Gln Pro Arg Pro Arg Pro Phe Asn Leu Trp Ala Asn Ala Leu His
260 265 270
Pro Arg Ser
275
<210> 72
<211> 323
<212> PRT
<213> 猴面花
<400> 72
Met Met Thr Ala Gly Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Thr
1 5 10 15
Phe Pro Pro Glu Lys Lys Ala Val Ser Asn Ile Pro Ser Ser Leu His
20 25 30
Leu Asn Leu Met Pro Ser Ser Pro Ser Pro Asn Phe Thr Ile Phe Asn
35 40 45
Asn Asn Phe Asn Trp Thr Ser Thr Gln Gln Ala Ala Ala Ala Phe Pro
50 55 60
Phe Ser Asp Arg Ser Ser Glu Thr Cys Arg Val Glu Thr Thr Arg Ser
65 70 75 80
Phe Leu Lys Gly Ile Asp Val Asn Cys Leu Pro Ser Ala Ala Ala Ala
85 90 95
Glu Glu Glu Glu Glu Glu Glu Gly Gly Gly Val Ser Ser Pro Asn Ser
100 105 110
Thr Ile Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Asp Ala Thr
115 120 125
Glu Glu His Asp Gly Glu Arg Ala Cys Ser Arg Gly Ile Ser Asp Glu
130 135 140
Glu Asp Ala Glu Asn Ala Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln
145 150 155 160
Ser Ala Thr Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro
165 170 175
Lys Gln Lys Met Ala Leu Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln
180 185 190
Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln
195 200 205
Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr
210 215 220
Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu
225 230 235 240
Lys Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu
245 250 255
Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Pro Thr Met Gly Gly
260 265 270
Pro Pro Ser Asn Gly Gly Arg Ala Pro Pro Ala Ala Ser Ala Ala Ala
275 280 285
Ala Val Gln Pro Arg Pro Ile Thr Phe Asn Pro Trp Ala Ala Val Met
290 295 300
Pro Ser Gln Gln Gln Gln Gln Leu His Arg Pro Phe Asp Ala Ile Met
305 310 315 320
His Ser Arg
<210> 73
<211> 302
<212> PRT
<213> 莲
<400> 73
Met Met Val Glu Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Thr
1 5 10 15
Ala Asp Ser Arg His Ser Leu Gln Leu Asn Leu Met Pro Ser Ser Val
20 25 30
Ser Ser Ser Pro Ala Ser Pro Phe Val Ala Gln Lys Asn Thr Trp Asn
35 40 45
Glu Ala Phe Ala Ser Ser Asp Arg Asn Ser Asp Met Phe Arg Gly Glu
50 55 60
Thr Arg Thr Phe Leu Arg Gly Ile Asp Val Asn Arg Met Pro Ser Thr
65 70 75 80
Val Asp Cys Glu Glu Glu Ala Ala Val Ser Ser Pro Asn Ser Thr Ile
85 90 95
Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Asp Thr Asn Gly Glu Glu
100 105 110
His Glu Ile Glu Arg Ala Cys Ser Arg Gly Ile Ser Asp Glu Glu Asp
115 120 125
Gly Asp Met Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala
130 135 140
Val Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln
145 150 155 160
Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu
165 170 175
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
180 185 190
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu
195 200 205
Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu
210 215 220
Ser Pro Gln Phe Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met
225 230 235 240
Cys Pro Ser Cys Glu Arg Val Ala Val Ser Ser Ser Ser Ser Ala Ala
245 250 255
Thr Ala Thr Val Ala Val Asp Ala Pro His His Pro Met Ala Met Ala
260 265 270
Gly Pro His His His Arg Pro Ile Ala Ile Asn Pro Trp Ala Ala Ala
275 280 285
Pro Ile His His Arg Pro Phe Asp Ala Pro Ala Pro Arg Ser
290 295 300
<210> 74
<211> 361
<212> PRT
<213> 大麦
<400> 74
Met Glu Met Thr Val Asn Gly Arg Asp Thr Glu His His Leu Gly Leu
1 5 10 15
Gly Leu Gly Leu Gly Leu Ser Leu Gly Met Ala Gly Thr Thr Ser Pro
20 25 30
Val Glu Ala Ala Ala Pro Gln Arg Ala Leu Ala Ala Ala Ala Pro Val
35 40 45
Thr Leu Gly Arg Gln Gln Gln Leu Gln Gln Ser Trp Asn Gly Ala Gly
50 55 60
Leu Phe Phe Pro Ala Pro Ser Gly Glu Gln Arg Ser His Ala Asp Asp
65 70 75 80
Arg Arg Leu Ala Ala Leu Ala Cys His Glu Met Pro Phe Leu Arg Gly
85 90 95
Ile Asp Val Asn Arg Ala Pro Ala Thr Gly Gly Ala Ser Glu Asp Glu
100 105 110
Glu Pro Gly Ala Ser Ser Pro Asp Ser Thr Leu Ser Ser Leu Ser Gly
115 120 125
Lys Arg Arg Ala Pro Thr Arg Ser Gly Gly Gly Glu Gln Glu Arg Ala
130 135 140
Gly Ala Gly Ser Asp Asp Glu Asp Asp Ser Gly Ala Gly Gly Gly Gly
145 150 155 160
Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu
165 170 175
Glu Ser Phe Lys Glu His Ser Thr Leu Asn Pro Val Ser Ala Leu Thr
180 185 190
Lys Ser Thr Lys Val Lys Lys Lys Thr Lys Ile Pro Ile Phe Leu Leu
195 200 205
Pro Phe His Pro Ser Lys Phe Ala Leu Arg Thr Leu Met Asp Met Glu
210 215 220
Gln Lys Gln Lys Ala Ala Leu Ala Arg Gln Leu Arg Leu Arg Pro Arg
225 230 235 240
Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys
245 250 255
Gln Thr Glu Val Asp Cys Glu Ser Leu Lys Arg Cys Cys Glu Thr Leu
260 265 270
Thr Glu Glu Asn Arg Arg Leu Gln Arg Glu Val Gln Glu Leu Arg Ala
275 280 285
Leu Lys Leu Leu Ala Pro Pro Ala Pro His Leu Tyr Met Arg Ala Pro
290 295 300
Pro Pro Ala Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Pro
305 310 315 320
Ser Gly Lys Pro Ala Gly Asp Glu Ser Arg Ala Ala Thr Met Val Thr
325 330 335
Arg Pro Val Pro Thr Gly Pro Trp Gly Pro Val Pro Val Leu Pro Val
340 345 350
Phe Val Gly Arg Pro Ala Gln Arg Ser
355 360
<210> 75
<211> 247
<212> PRT
<213> 普通野生稻
<400> 75
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Gly Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210> 76
<211> 311
<212> PRT
<213> 亚洲栽培稻
<400> 76
Met Glu Met Met Val His Gly Arg Arg Asp Glu Gln Tyr Gly Gly Leu
1 5 10 15
Arg Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly Val Ala Gly Gly Ala
20 25 30
Ala Asp Asp Glu Gln Pro Pro Pro Arg Arg Gly Ala Ala Pro Pro Pro
35 40 45
Gln Gln Gln Leu Cys Gly Trp Asn Gly Gly Gly Leu Phe Ser Ser Ser
50 55 60
Ser Ser Asp His Arg Gly Arg Ser Ala Met Met Ala Cys His Asp Val
65 70 75 80
Ile Glu Met Pro Phe Leu Arg Gly Ile Asp Val Asn Arg Ala Pro Ala
85 90 95
Ala Glu Thr Thr Thr Thr Thr Ala Arg Gly Pro Ser Cys Ser Glu Glu
100 105 110
Asp Glu Glu Pro Gly Ala Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu
115 120 125
Ser Gly Lys Arg Gly Ala Pro Ser Ala Ala Thr Ala Ala Ala Ala Ala
130 135 140
Ala Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg Lys Lys Leu Arg
145 150 155 160
Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr Phe Lys Glu His
165 170 175
Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Arg Gln Leu Asn
180 185 190
Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg
195 200 205
Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu Leu Lys Arg Cys
210 215 220
Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg Leu His Arg Glu Leu Gln
225 230 235 240
Glu Leu Arg Ala Leu Lys Leu Ala Thr Ala Ala Ala Ala Pro His His
245 250 255
Leu Tyr Gly Ala Arg Val Pro Pro Pro Thr Thr Leu Thr Met Cys Pro
260 265 270
Ser Cys Glu Arg Val Ala Ser Ala Ala Thr Thr Thr Arg Asn Asn Ser
275 280 285
Gly Ala Ala Pro Ala Arg Pro Val Pro Thr Arg Pro Trp Pro Pro Ala
290 295 300
Ala Ala Gln Arg Ser Ser Ala
305 310
<210> 77
<211> 366
<212> PRT
<213> 泥瓦拉野生稻
<400> 77
Met Glu Leu Gly Leu Ser Leu Gly Glu Ala Met Ala Asp Ala Gly Arg
1 5 10 15
Glu Leu Val Leu Gly Leu Gly Met Gly Arg Arg Glu Glu Ala Ala Glu
20 25 30
Ala Gly Arg Arg Asp His Glu Val Arg Arg Glu Leu Glu Phe Gly Ser
35 40 45
Met Ser Ser Arg Cys Gly Gly Ser Ser Pro Glu Pro Thr Val Arg Leu
50 55 60
Thr Leu Leu Pro Met Val Pro Gly Leu Gly Leu Pro Trp Pro Pro Pro
65 70 75 80
Pro Pro Pro Pro Ser Ser Glu Ser Ser Glu Cys Gly Asp Gly His Leu
85 90 95
Glu Ala Ser Thr Arg Gly Phe Asp Val Asn Arg Pro Pro Ser Ser Gly
100 105 110
Gly Gly Gly Gly Gly Glu Glu Glu Gln Asp Asp Val Ala Gly Ala Ala
115 120 125
Leu Ser Ser Ser Pro Asn Asn Ser Ala Gly Ser Phe Pro Met Asp Asp
130 135 140
Phe Ser Gly His Gly Leu Gly Gly Asn Asp Ala Ala Pro Gly Gly Gly
145 150 155 160
Gly Gly Asp Arg Ser Cys Ser Arg Ala Ser Asp Glu Asp Asp Gly Gly
165 170 175
Ser Ala Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Ala Phe Leu
180 185 190
Glu Glu Ser Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu
195 200 205
Ala Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp
210 215 220
Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp
225 230 235 240
Cys Glu Tyr Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg
245 250 255
Arg Leu Gln Lys Glu Leu Ala Glu Leu Arg Ala Leu Lys Thr Val His
260 265 270
Pro Phe Tyr Met His Leu Pro Ala Thr Thr Leu Ser Met Cys Pro Ser
275 280 285
Cys Glu Arg Val Ala Ser Asn Ser Ala Pro Ala Thr Ala Ser Ser Ala
290 295 300
Ala Thr Ser Ser Thr Ala Ala Pro Pro Ala Ala Pro Ser Ser Gly Gly
305 310 315 320
Ile Ala Ala Thr Ser Ser Ser Ser Ala Ala Ala Ala Ala Ala Pro Asp
325 330 335
His Arg Pro Ser Ser Phe Ala Ala Leu Phe Ser Ser Pro Arg Gly Phe
340 345 350
Pro Leu Ser Val Ala Pro Gln Ala Gln Pro Pro Thr Ser Ser
355 360 365
<210> 78
<211> 297
<212> PRT
<213> 斑点野生稻
<400> 78
Met Glu Met Met Val His Gly Arg Arg Asp Glu Gln Tyr Gly Gln His
1 5 10 15
His His Leu Gly Leu Gly Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly
20 25 30
Val Ala Gly Gly Ala Ala Asp Glu Thr Pro Pro Pro Gln Gln Leu Cys
35 40 45
Gly Trp Asn Gly Ala Ala Gly Leu Phe Pro Ser Asp Arg Arg Thr Met
50 55 60
Met Ala Cys His Asp Val Glu Met Pro Leu Phe Leu Arg Gly Ile Asp
65 70 75 80
Val Asn Arg Thr Pro Val Ala Glu Thr Thr Thr Thr Val Arg Arg Ala
85 90 95
Pro Ser Cys Ser Asp Glu Glu Glu Pro Gly Ala Ser Ser Ser Pro Asn
100 105 110
Ser Thr Leu Ser Ser Leu Ser Gly Lys Arg Gly Ala Pro Ser Ala Ala
115 120 125
Thr Ala Ala Ala Gly Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg
130 135 140
Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr
145 150 155 160
Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala
165 170 175
Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn
180 185 190
Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu
195 200 205
Leu Lys Arg Cys Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg Leu His
210 215 220
Arg Glu Leu Gln Glu Leu Arg Ala Leu Lys Leu Ala Ala Ala Ala Pro
225 230 235 240
His His Leu Tyr Ala Arg Val Pro Pro Pro Thr Thr Leu Thr Met Cys
245 250 255
Pro Ser Cys Glu Arg Ile Ala Ser Thr Thr His Asn Ser Gly Ala Gly
260 265 270
Lys Val Val Asp Ala Pro Ala Arg Pro Val Pro Thr Arg Pro Trp Pro
275 280 285
Pro Ala Ala Ala Gln Arg Ser Ser Ala
290 295
<210> 79
<211> 310
<212> PRT
<213> 非洲栽培稻
<400> 79
Met Glu Met Met Val His Gly Arg Arg Asp Glu Gln Tyr Gly Gly Leu
1 5 10 15
Gly Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly Val Ala Gly Gly Ala
20 25 30
Ala Asp Asp Glu Gln Pro Pro Pro Arg Arg Gly Ala Ala Pro Pro Pro
35 40 45
Gln Gln Gln Leu Cys Gly Trp Asn Gly Gly Gly Leu Phe Ser Ser Ser
50 55 60
Ser Ser Asp His Arg Gly Arg Ser Ala Met Met Ala Cys His Asp Val
65 70 75 80
Ile Glu Met Pro Phe Leu Arg Gly Ile Asp Val Asn Arg Ala Pro Ala
85 90 95
Ala Glu Thr Thr Thr Thr Thr Ala Arg Gly Pro Ser Cys Ser Glu Glu
100 105 110
Asp Glu Glu Pro Gly Ala Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu
115 120 125
Ser Gly Lys Arg Gly Ala Pro Ser Ala Ala Thr Ala Ala Ala Ala Ala
130 135 140
Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg Lys Lys Leu Arg Leu
145 150 155 160
Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr Phe Lys Glu His Asn
165 170 175
Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Arg Gln Leu Asn Leu
180 185 190
Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr
195 200 205
Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu Leu Lys Arg Cys Cys
210 215 220
Glu Thr Leu Thr Asp Glu Asn Arg Arg Leu His Arg Glu Leu Gln Glu
225 230 235 240
Leu Arg Ala Leu Lys Leu Ala Thr Ala Ala Ala Ala Pro His His Leu
245 250 255
Tyr Gly Ala Arg Val Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
260 265 270
Cys Glu Arg Val Ala Ser Ala Ala Thr Thr Thr Arg Asn Asn Ser Gly
275 280 285
Ala Ala Pro Ala Arg Pro Val Pro Thr Arg Pro Trp Pro Pro Ala Ala
290 295 300
Ala Gln Arg Ser Ser Ala
305 310
<210> 80
<211> 352
<212> PRT
<213> 粟
<400> 80
Met Glu Met Ala Val Asn Ala Arg Asp Arg Glu Gln His Gly His Gly
1 5 10 15
Gly Leu Gly Leu Gly Leu Ser Leu Ser Leu Ser Ile Ala Thr Ala Ala
20 25 30
Pro Pro Pro Gln Gln Gln Arg Ala Ile Ser Val Ala Pro Ile Ser Ser
35 40 45
His Pro Ala Pro Pro Val Pro Pro Gln Pro Gln Trp Trp Asn Gly Gly
50 55 60
Ala Gly Leu Phe Phe Ser Pro Ser Ser Gly Met Val Asp Arg Ser Met
65 70 75 80
Glu Arg Lys Leu Gln Gln Gln Pro Ala Val Ala Ala Ala Cys His Gly
85 90 95
His Glu Met Pro Phe Leu Arg Gly Ile Asp Val Asn Arg Ala Pro Ala
100 105 110
Ala Gly Glu Ser Arg Arg Gly Cys Cys Ser Glu Asp Glu Glu Pro Ala
115 120 125
Ala Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu Ser Gly Lys Arg Pro
130 135 140
Ala Ala Thr Arg Ser Gly Asp Leu Glu Gly Asp His Thr Pro Arg Ala
145 150 155 160
Gly Gly Ala Ser Asp Asp Glu Asp Ser Gly Ala Gly Gly Gly Ser Arg
165 170 175
Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Glu Ser
180 185 190
Phe Lys Glu His Asn Thr Leu Asn Pro Val Arg Thr Leu Pro Lys Gln
195 200 205
Lys Ala Ala Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu
210 215 220
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
225 230 235 240
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu
245 250 255
Asn Arg Arg Leu Gln Arg Glu Val Ala Glu Leu Arg Ala Leu Lys Leu
260 265 270
Val Ala Pro His Gln Tyr Ala Arg Met Pro Pro Pro Thr Thr Leu Thr
275 280 285
Met Cys Pro Ser Cys Glu Arg Leu Ala Thr Ala Asp Glu Ala Gly Arg
290 295 300
Ala Ala Arg Pro Ala Ala Pro Thr Gly Pro Trp Gly Pro Val Pro Val
305 310 315 320
Arg Pro Val Phe Val Asp Gly Met Ile Ile Asp Ala Asp Ala Arg Pro
325 330 335
Glu His Pro Asn Ser Gly Gly Pro Val Val Val Glu Lys Lys Ser Trp
340 345 350
<210> 81
<211> 346
<212> PRT
<213> 双色高粱
<400> 81
Met Glu Met Ala Val Asn Ala Arg Asp Glu Glu Lys Lys Tyr Asp Gly
1 5 10 15
Asp Asp Asn His Leu Gly Leu Gly Leu Ser Leu Ser Leu Gly Ile Ala
20 25 30
Thr Thr Ala Ala Thr Pro Val Glu Val Asp Pro Pro Pro Arg Gln Gln
35 40 45
Gln Gln Gln Arg Ala Ile Ser Val Ala Pro Ile Ser Ser Leu Pro Ala
50 55 60
Pro Gln Trp Trp Asn Gly Pro Ala Gly Leu Phe Phe Ser Pro Ser Ser
65 70 75 80
Gly Met Lys Met Asp Pro Ser Leu Glu Arg Lys His Gln His Gln Gln
85 90 95
Gln Gln Gln Gln Gln Ala Ala Ala Thr Ser Tyr Ser His Asp Met Pro
100 105 110
Phe Leu Arg Gly Ile Asp Val Asn Arg Arg Ala Thr Ala Gly Glu Thr
115 120 125
Arg Arg Gly Arg Ser Cys Ser Glu Asp Glu Glu Pro Gly Ala Ser Ser
130 135 140
Pro Asn Ser Thr Leu Ser Ser Leu Ser Gly Lys Arg Ala Ala Pro Ala
145 150 155 160
Arg Ser Ser Gly Glu Val Asp Arg Glu Ala Asp Gly His Thr Pro Arg
165 170 175
Ala Gly Gly Gly Gly Ser Asp Asp Glu Asp Ser Gly Ala Gly Gly Gly
180 185 190
Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu
195 200 205
Asp Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala
210 215 220
Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
225 230 235 240
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
245 250 255
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
260 265 270
Leu Gln Arg Glu Val Ala Glu Leu Arg Ala Leu Lys Leu Val Ala Pro
275 280 285
His His Tyr Ala Arg Met Pro Pro Pro Thr Thr Leu Thr Met Cys Pro
290 295 300
Ser Cys Glu Arg Leu Ala Ser Ala Pro Ala Asp Glu Ala Val Ala Gly
305 310 315 320
Arg Thr Ala Ala Pro Thr Gly Pro Trp Gly Pro Leu Pro Val Arg Pro
325 330 335
Val Phe Val Asp Gly Pro Ala Arg Arg Ser
340 345
<210> 82
<211> 156
<212> PRT
<213> 乌拉尔图小麦
<400> 82
Met Asp Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala
1 5 10 15
Val Leu Glu Asp Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln
20 25 30
Lys Ala Ala Leu Ala Gln Gln Leu Gly Leu Arg Ser Arg Gln Val Glu
35 40 45
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
50 55 60
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu
65 70 75 80
Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu
85 90 95
Val Ser Pro His His Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr
100 105 110
Met Cys Pro Ser Cys Glu Arg Val Ser Asn Asn Asn Asn Asn Asn Asn
115 120 125
Asn Asn Ser Thr Thr Ala Asp Arg Arg Asn Gly Val Glu Gly Ala Ile
130 135 140
Cys His Arg Pro Ile Ala Val Arg Pro Gln Gln Ser
145 150 155
<210> 83
<211> 319
<212> PRT
<213> 玉米
<400> 83
Met Asp Ile Met Ala Leu Asn Ala Arg Asp Glu Glu Gln Tyr Gly Asn
1 5 10 15
Asn His Leu Gly Leu Gly Leu Ser Leu Ser Leu Gly Leu Gly Val Ala
20 25 30
Thr Ala Ala Pro Val Glu Val Glu Pro Pro Pro Pro Pro Arg Gln Gln
35 40 45
Gln Gln Arg Ala Ile Ser Val Ala Pro Ile Thr Ser Leu Pro Ala Pro
50 55 60
Gln Trp Trp Lys Trp Asn Gly Pro Gly Leu Phe Phe Gly Thr Thr Met
65 70 75 80
Asp Gln Gln Gln Gln Pro Ala Ala Ala Arg His Gly His Glu Met Pro
85 90 95
Phe Leu Arg Gly Val Asp Val Asn Arg Ala Pro Ala Gly Asp Thr Arg
100 105 110
Arg Gly Ser Cys Ser Glu Asp Asp Glu Glu Pro Gly Gly Ala Ser Ser
115 120 125
Ser Pro Asn Ser Thr Leu Ser Ser Ser Leu Ser Gly Lys Arg Ala Ala
130 135 140
Pro Ala Arg Ser Gly Gly Glu Val Ala Asp His Thr Pro Arg Ala Gly
145 150 155 160
Gly Gly Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg Lys Lys Leu
165 170 175
Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Glu Ser Phe Lys Glu
180 185 190
His Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Lys Gln Leu
195 200 205
Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
210 215 220
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg
225 230 235 240
Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Arg Glu Val
245 250 255
Ala Glu Leu Arg Val Leu Lys Leu Val Ala Pro His His Tyr Ala Arg
260 265 270
Met Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Leu
275 280 285
Ala Ser Ala Ser Ala Ser Ala Asp Gln Ala Gly Arg Ala Gly Pro Cys
290 295 300
Trp Gly Pro Leu Pro Val Phe Val Asp Gly Pro Ala Arg Arg Pro
305 310 315
<210> 84
<211> 312
<212> PRT
<213> 小果野蕉
<400> 84
Met Ala Arg Val Ala Ala Asn Arg Pro Ala Val Ser Ser Ala Cys Ser
1 5 10 15
His Val Pro Arg Gln Gly His Ala Arg Pro Arg Asp Gly Glu Leu Pro
20 25 30
Ser Pro Phe Leu Pro Arg Glu Ile Lys Pro His Pro Arg Arg Pro Thr
35 40 45
Trp His Ala Ser Ala Gln Met Asp Arg Arg Arg Asp Ser Thr Cys Arg
50 55 60
Thr Asp Pro Arg Pro Arg Pro Leu His Arg Gly Ile Asp Val Asn Gln
65 70 75 80
Glu Pro Pro Gly Ala Ala Glu Arg Asp Ser Glu Glu Asp Ala Gly Ala
85 90 95
Ser Ser Pro Asn Ser Thr Leu Ser Ser Ala Ser Gly Lys Arg Ala Glu
100 105 110
Arg Gly His His Leu Gly Val Asp Glu His Asp Thr Asp Arg Asp Cys
115 120 125
Ser Arg Gly Ile Ser Asp Glu Glu Asp Gly Glu Gly Ser Arg Lys Lys
130 135 140
Leu Arg Leu Ser Lys Asp Gln Ala Ala Ile Leu Glu Glu Ser Phe Lys
145 150 155 160
Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Arg
165 170 175
Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg
180 185 190
Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys
195 200 205
Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu
210 215 220
Val Gln Glu Leu Arg Ala Leu Lys Val Ser Pro Arg Leu Tyr Met His
225 230 235 240
Met Thr Pro Pro Thr Thr Leu Ser Met Cys Pro Ser Cys Glu Arg Val
245 250 255
Ser Asn Ala Ala Thr Thr Thr Thr Thr Ala Ala Ser Thr Pro Thr Pro
260 265 270
Glu Thr Asn Thr Pro His Pro Met Ser Gln His His Gln Phe Ile His
275 280 285
His Arg Pro Phe Pro Ala Pro Trp Ala Pro Ile Pro Leu Arg Pro Cys
290 295 300
Leu Lys Thr Pro Pro Gln Arg Ser
305 310
<210> 85
<211> 266
<212> PRT
<213> 无油樟
<400> 85
Met Asn Arg Glu Asp Leu Asn Leu Ser Leu Ser Leu Arg Arg Val Gly
1 5 10 15
Asp Phe Glu Leu Asn Leu Leu Pro Arg Asn Cys Arg Asn Asp Ser Ser
20 25 30
Ser Leu Asp Arg Ser Glu Thr Ala Arg Ser Ile Leu Lys Ser Phe Asp
35 40 45
Val Asn Arg Ile Gln Ala Thr Ser Asp Arg Ile Pro Thr Thr Thr Asp
50 55 60
Ala Ile Arg Ser Glu Ile Ser Arg Ile Pro Ala Thr Pro Asn Met Ala
65 70 75 80
Gly Phe Asp Val Asn Arg Ile Pro Val Ile Ser Glu Cys Glu Glu Glu
85 90 95
Ala Val Val Ser Ser Pro Met Ser Thr Val Ser Ser Leu Ser Met Ser
100 105 110
Gly Gly Lys Arg Asp Glu Pro Glu Gly Glu Arg Ala Ser Ser Arg Gly
115 120 125
Ser Ser Asp Glu Glu Asp Gly Gly Glu Ala Ala Arg Lys Lys Leu Arg
130 135 140
Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu Ser Phe Lys Glu His
145 150 155 160
Asn Thr Leu Asn Pro Lys Gln Lys Leu Thr Leu Ala Lys Gln Leu Asn
165 170 175
Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg
180 185 190
Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys
195 200 205
Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Met
210 215 220
Glu Leu Arg Ser Leu Lys Gln Thr Pro His Phe Tyr Met His Val Pro
225 230 235 240
Pro Ala Ala Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Ser
245 250 255
Glu Ser Gln Phe Arg Pro Gln Ile Arg Ser
260 265
<210> 86
<211> 291
<212> PRT
<213> 雷蒙德氏棉
<400> 86
Met Gly Asp Lys Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Cys
1 5 10 15
Gly Gln Asn Gln Pro Ser Ser Lys Leu Asn Phe Met Phe Leu Ala Ser
20 25 30
Asn Pro Leu Gln Asn Leu Gln Gln Asn Lys Thr Trp Asn Arg Leu Cys
35 40 45
Leu Ser Ser Asp Gly His Met Asp Thr Gly Ser Phe Leu Arg Gly Ile
50 55 60
Asp Val Asn Arg Ala Pro Ala Ala Thr Val Asp Cys Glu Glu Glu Gly
65 70 75 80
Gly Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Thr Ile Ser Gly Lys
85 90 95
Lys Asn Glu Arg Asp His Val Ala Asp Glu Thr Glu Ala Glu Arg Asp
100 105 110
Ser Cys Ser Arg Ala Ser Asp Asp Glu Asp Gly Gly Gly Asn Ala Gly
115 120 125
Gly Gly Asp Ala Ser Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser
130 135 140
Met Val Leu Glu Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys
145 150 155 160
Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val
165 170 175
Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr
180 185 190
Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu
195 200 205
Glu Asn Arg Arg Leu His Lys Glu Val Gln Glu Leu Arg Ala Leu Lys
210 215 220
Leu Ser Pro Gln Leu Tyr Met His Met Lys Pro Pro Thr Thr Leu Thr
225 230 235 240
Met Cys Pro Ser Cys Glu Arg Val Ala Ala Pro Gly Ser Ser Ala Val
245 250 255
Lys Arg Cys Gln Thr Ser Pro Asp Arg Gln Gln Pro Val Pro Val Asn
260 265 270
Pro Trp Ala Ala Met Pro Ile Thr His Gln Pro Phe Asn Ala Pro Ala
275 280 285
Ser Arg Ser
290
<210> 87
<211> 297
<212> PRT
<213> 葡萄
<400> 87
Met Met Val Asp Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Phe
1 5 10 15
Pro Gln Asp Ala His Arg Pro Leu Gln Leu Asn Leu Met Pro Ser Leu
20 25 30
Leu Pro Ala Ser Ser Ser Ser Pro Ser Pro Ser Pro Phe Ala Leu Gln
35 40 45
Lys Pro Ser Trp His Asp Ala Phe Pro Ser Ser Asp Arg Thr Ser Glu
50 55 60
Thr Cys Arg Gly Asp Ala Arg Ser Phe Leu Arg Gly Ile Asp Val Asn
65 70 75 80
Arg Leu Pro Ser Thr Ala Asp Cys Glu Glu Glu Ala Gly Val Ser Ser
85 90 95
Pro Asn Ser Thr Ile Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu
100 105 110
Ala Asn Gly Asp Glu His Glu Met Glu Arg Ala Cys Ser Arg Gly Ile
115 120 125
Ser Asp Glu Glu Asp Gly Asp Thr Ser Arg Lys Lys Leu Arg Leu Ser
130 135 140
Lys Asp Gln Ser Ala Ile Leu Glu Glu Asn Phe Lys Glu His Asn Thr
145 150 155 160
Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala Lys Gln Leu Asn Leu Arg
165 170 175
Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys
180 185 190
Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu
195 200 205
Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Asn Glu Leu
210 215 220
Arg Ala Leu Lys Leu Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro
225 230 235 240
Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Pro Pro
245 250 255
Pro Ser Ser Glu Ala Arg Ser His Gln Met Ala Thr Thr His His Arg
260 265 270
Pro Ile Pro Ile Asn Pro Trp Ala Thr Ala Thr Pro Ile Pro His Arg
275 280 285
Pro Phe Asp Ala Leu His Pro Arg Ser
290 295
<210> 88
<211> 310
<212> PRT
<213> 展颖野生稻
<400> 88
Met Glu Met Met Val His Gly Arg Arg Asp Glu Gln Tyr Gly Gly Leu
1 5 10 15
Gly Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly Val Ala Gly Gly Ala
20 25 30
Ala Asp Asp Glu Gln Pro Pro Pro Arg Arg Gly Ala Ala Pro Pro Pro
35 40 45
Gln Gln Gln Leu Cys Gly Trp Asn Gly Gly Gly Leu Phe Ser Ser Ser
50 55 60
Ser Ser Asp His Arg Gly Arg Ser Ala Met Met Ala Cys His Asp Val
65 70 75 80
Ile Glu Met Pro Phe Leu Arg Gly Ile Asp Val Asn Arg Ala Pro Ala
85 90 95
Ala Glu Thr Thr Thr Thr Thr Ala Arg Gly Pro Ser Cys Arg Glu Glu
100 105 110
Asp Glu Glu Pro Gly Ala Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu
115 120 125
Ser Gly Lys Arg Gly Ala Pro Ser Ala Ala Thr Ala Ala Ala Ala Ala
130 135 140
Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg Lys Lys Leu Arg Leu
145 150 155 160
Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr Phe Lys Glu His Asn
165 170 175
Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Arg Gln Leu Asn Leu
180 185 190
Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr
195 200 205
Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu Leu Lys Arg Cys Cys
210 215 220
Glu Thr Leu Thr Asp Glu Asn Arg Arg Leu His Arg Glu Leu Gln Glu
225 230 235 240
Leu Arg Ala Leu Lys Leu Ala Thr Ala Ala Ala Ala Pro His His Leu
245 250 255
Tyr Gly Ala Arg Val Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
260 265 270
Cys Glu Arg Val Ala Ser Ala Ala Thr Thr Thr Arg Asn Asn Ser Gly
275 280 285
Ala Ala Pro Ala Arg Pro Val Pro Thr Arg Pro Trp Pro Pro Ala Ala
290 295 300
Ala Gln Arg Ser Ser Ala
305 310
<210> 89
<211> 323
<212> PRT
<213> 南方野生稻
<400> 89
Met Glu Met Met Val His Gly Arg Arg Asp Glu Gln Tyr Gly Gly Leu
1 5 10 15
Gly Leu Gly Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly Val Ala Gly
20 25 30
Gly Ala Ala Asp Asp Glu Gln Pro Pro Arg Arg Gly Pro Ala Pro Pro
35 40 45
Pro Gln Gln Gln Gln Leu Cys Gly Trp Asn Gly Gly Gly Gly Gly Gly
50 55 60
Leu Phe Ser Ser Ser Ser Ser Ser Asp His Arg Gly Arg Arg Ser Ala
65 70 75 80
Met Met Ala Cys His Asp Val Val Glu Met Pro Phe Leu Arg Gly Ile
85 90 95
Asp Val Asn Arg Ala Pro Ala Ala Glu Thr Thr Thr Thr Thr Ala Arg
100 105 110
Gly Pro Ser Cys Ser Glu Glu Asp Glu Glu Pro Gly Ala Ser Ser Pro
115 120 125
Asn Ser Thr Leu Ser Ser Leu Ser Gly Lys Arg Gly Ala Pro Pro Ser
130 135 140
Ala Ala Thr Ala Ala Ile Ala Ala Ala Ala Ala Ser Asp Asp Glu Asp
145 150 155 160
Ser Gly Gly Gly Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln
165 170 175
Ala Ala Val Leu Glu Asp Thr Phe Lys Glu His Asn Thr Leu Asn Pro
180 185 190
Lys Gln Lys Ala Ala Leu Ala Arg Gln Leu Asn Leu Lys Pro Arg Gln
195 200 205
Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln
210 215 220
Thr Glu Val Asp Cys Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr
225 230 235 240
Asp Glu Asn Arg Arg Leu His Arg Glu Leu Gln Glu Leu Arg Ala Leu
245 250 255
Lys Leu Ala Ala Ala Ala Ala Ala Ala Pro His His Leu Tyr Gly Ala
260 265 270
Arg Val Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg
275 280 285
Val Ala Ser Ala Ala Thr Thr Thr Arg Asn Asn Ser Gly Ala Ala Pro
290 295 300
Ala Arg Pro Val Pro Thr Arg Pro Trp Pro Pro Ala Ala Ala Gln Arg
305 310 315 320
Ser Ser Ala
<210> 90
<211> 305
<212> PRT
<213> 高山南芥
<400> 90
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Leu
1 5 10 15
Gly Phe Asn Gln Lys Glu Gln Ser Pro Arg Leu Asn Pro Met Gln Phe
20 25 30
Gly Ser Tyr Ser Ser Ser Ser Ser His Met His Met Gln Ser Asn His
35 40 45
Ile Asn His Ser Gln Lys Ile Gln Asn Ser Trp Thr His Met Phe Gln
50 55 60
Ser Ser Glu Arg Asn Ser Asp Val Arg Ser Phe Leu Arg Gly Ile Asp
65 70 75 80
Val Asn Arg Ala Pro Ser Thr Val Val Val Asp Val Glu Glu Asp Ala
85 90 95
Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Val Met Ser Gly Lys
100 105 110
Arg Asn Glu Arg Val Ala Thr Val Val Gly Gly Gly Gly Val Ile Glu
115 120 125
Asp His Asp Val Glu Arg Ala Ser Ser Ser Leu Gly Gly Gly Ser Asp
130 135 140
Asp Glu Asp Gly Gly Gly Asn Gly Asp Asp Gly Ser Arg Lys Lys Leu
145 150 155 160
Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu Thr Phe Lys Glu
165 170 175
His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu Ala Lys Gln Leu
180 185 190
Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
195 200 205
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg
210 215 220
Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val
225 230 235 240
Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu Tyr Met His Met
245 250 255
Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala
260 265 270
Ala Thr Ser Ser Ser Ser Ser Val Ala Pro Pro Ala Met Asn Ser Ser
275 280 285
Ser Pro Trp Ala Ala Ile Pro Leu Arg Gln Arg Pro Ala Ala Gly Ser
290 295 300
His
305
<210> 91
<211> 315
<212> PRT
<213> 琴叶拟南芥
<400> 91
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Ser Leu
1 5 10 15
Gly Phe Asn Gln Lys Asp Pro Ser Ser Arg Leu Asn Pro Met Pro Leu
20 25 30
Ala Ser Tyr Ser Thr Ser Ser His Met His Met Gln Gln Ser Asn Tyr
35 40 45
Ser His Pro Gln Lys Ile Gln Asn Thr Trp Ile Asn Met Phe His Ser
50 55 60
Ser Glu Arg Asn Thr Asp Met Arg Ser Phe Leu Arg Gly Ile Asp Val
65 70 75 80
Asn Arg Ala Pro Ser Thr Val Val Val Asp Val Glu Asp Asp Gly Ala
85 90 95
Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Val Met Ser Gly Lys
100 105 110
Arg Ser Glu Arg Glu Leu Met Thr Ala Ala Ala Thr Ala Gly Gly Gly
115 120 125
Gly Arg Val Glu Asp Asn Glu Met Glu Arg Ala Ser Cys Ser Leu Gly
130 135 140
Gly Gly Ser Asp Asp Glu Asp Gly Ser Gly Asn Gly Asp Asp Gly Ser
145 150 155 160
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
165 170 175
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu
180 185 190
Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln
195 200 205
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
210 215 220
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Asp Glu Asn Arg Arg Leu
225 230 235 240
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
245 250 255
Tyr Met His Met Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
260 265 270
Glu Arg Val Ala Val Thr Ser Ser Ser Ser Ser Val Ala Pro Pro Val
275 280 285
Met Thr Ser Ser Ser Pro Met Gly Pro Met Ser Pro Trp Ala Ala Ile
290 295 300
Pro Leu Arg Gln Arg Pro Ala Ala Gly Ser His
305 310 315
<210> 92
<211> 339
<212> PRT
<213> 短舌野生稻
<400> 92
Met Glu Met Met Val His Gly Arg Arg Asp Glu Gln Tyr Gly Gly Leu
1 5 10 15
Gly Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly Val Ala Gly Gly Ala
20 25 30
Ala Asp Asp Glu Gln Pro Pro Pro Arg Arg Gly Ala Ala Pro Pro Pro
35 40 45
Gln Gln Gln Leu Cys Gly Trp Asn Gly Gly Gly Leu Phe Ser Ser Ser
50 55 60
Ser Ser Asp His Arg Gly Arg Ser Ala Met Met Ala Cys His Asp Val
65 70 75 80
Ile Glu Met Pro Phe Leu Arg Gly Ile Asp Val Asn Arg Ala Pro Ala
85 90 95
Ala Glu Thr Thr Thr Thr Thr Ala Arg Gly Pro Ser Cys Ser Glu Glu
100 105 110
Asp Glu Glu Pro Gly Ala Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu
115 120 125
Ser Gly Lys Arg Gly Ala Pro Ser Ala Ala Thr Ala Ala Ala Ala Ala
130 135 140
Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg Lys Lys Leu Arg Leu
145 150 155 160
Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr Phe Lys Glu His Asn
165 170 175
Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Arg Gln Leu Asn Leu
180 185 190
Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr
195 200 205
Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu Leu Lys Arg Cys Cys
210 215 220
Glu Thr Leu Thr Asp Glu Asn Arg Arg Leu His Arg Glu Leu Gln Val
225 230 235 240
Arg Arg Arg Ala His Val Leu Arg Ala Gln Val Pro Asp Val Leu Arg
245 250 255
Gln Glu Arg Ala Ala Val Glu Val Glu Pro Arg Pro Glu Arg Arg Arg
260 265 270
Asp Gly Leu Ala Thr Ala Ala Ala Ala Pro His His Leu Tyr Gly Ala
275 280 285
Arg Val Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg
290 295 300
Val Ala Ser Ala Ala Thr Thr Thr Arg Asn Asn Ser Gly Ala Ala Pro
305 310 315 320
Ala Arg Pro Val Pro Thr Arg Pro Trp Pro Pro Ala Ala Ala Gln Arg
325 330 335
Ser Ser Ala
<210> 93
<211> 287
<212> PRT
<213> 巨桉
<400> 93
Met Met Val Glu Arg Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Phe
1 5 10 15
Ser Asp Ser Ser Arg Pro Ser Gln Leu Gly Ala Ser Pro Phe Gly Phe
20 25 30
Asn Leu Tyr Lys Pro Ser His Arg Asp Cys Glu Thr Phe Ala Ser Leu
35 40 45
Asp Arg Ile Ser Glu Ala Asp Ala Arg Pro Ser Leu Arg Gly Ile Asp
50 55 60
Val Asn Arg Pro Pro Pro Ser Ala Ala Asp Cys Glu Glu Gln Glu Glu
65 70 75 80
Ala Gly Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Val Ser Gly Lys
85 90 95
Arg Gly Glu Arg Glu Met Val Ser Gly Gly Glu Asp Asn Glu Ala Glu
100 105 110
Arg Asp Cys Ser Arg Gly Gly Ser Asp Glu Glu Asp Gly Glu Asn Ser
115 120 125
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu
130 135 140
Ser Phe Arg Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
145 150 155 160
Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
165 170 175
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Ile Asp Cys Glu
180 185 190
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
195 200 205
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
210 215 220
Tyr Met His Met Pro Pro Pro Thr Thr Leu Thr Val Cys Pro Asn Cys
225 230 235 240
Glu Arg Val Gly Ala Ala Ala Pro Pro Leu Pro Ser Ala Gly Gly Gly
245 250 255
Gly Arg Pro Ala His His Arg Glu Pro Val Pro Met Ile Pro Trp Ala
260 265 270
Ala Arg Pro Gly Pro Val Ser His Gly Ala Leu Arg Pro Arg Thr
275 280 285
<210> 94
<211> 313
<212> PRT
<213> 盐芥
<400> 94
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Ser Leu
1 5 10 15
Gly Ser Asn Gln Asn Glu Ser Ser Ser Arg Phe Asn Pro Met Pro Leu
20 25 30
Ala Ser Phe Pro Ser Ser Ser His Met His Met Gln Asn His Tyr Ser
35 40 45
His Pro Gln Lys Ile Gln Asn Asn Trp Ile Gln Met Phe Gln Ser Ser
50 55 60
Glu Arg Asn Ser Asp Val Arg Ser Phe Leu Arg Gly Ile Asp Val Asn
65 70 75 80
Arg Ala Pro Ser Thr Val Val Val Asp Val Glu Glu Asp Ala Gly Val
85 90 95
Ser Ser Pro Asn Ser Thr Val Ser Ser Val Met Ser Gly Lys Arg Ser
100 105 110
Glu Arg Glu Leu Met Ala Ala Ala Ala Ala Gly Gly Val Arg Val Ile
115 120 125
Glu Asp Asn Glu Ala Glu Arg Ala Ser Cys Ser Leu Gly Gly Gly Gly
130 135 140
Ser Asp Asp Asp Asp Gly Gly Gly Asn Gly Asp Asp Gly Ser Arg Lys
145 150 155 160
Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu Thr Phe
165 170 175
Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu Ala Lys
180 185 190
Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln Asn Arg
195 200 205
Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu
210 215 220
Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys
225 230 235 240
Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu Tyr Met
245 250 255
His Met Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu Arg
260 265 270
Val Ala Val Thr Ser Ser Ser Ser Ser Val Ala Pro Pro Ala Met Thr
275 280 285
Ser Ser Ser Pro Met Gly Pro Met Ser Pro Trp Ala Ala Ile Pro Leu
290 295 300
Arg Gln Arg Pro Ala Ala Gly Ser His
305 310
<210> 95
<211> 241
<212> PRT
<213> 假稻
<400> 95
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala Pro
20 25 30
Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys Arg
35 40 45
Ser Glu Val Val Val Ala Ala Asp Glu Gly Met Arg Gly Gly Gly Gly
50 55 60
Gly Ser Asp Glu Glu Glu Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys
65 70 75 80
Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe
85 90 95
Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu Ala Gln
100 105 110
Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg
115 120 125
Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu
130 135 140
Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys
145 150 155 160
Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His Leu Tyr
165 170 175
Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu
180 185 190
Arg Val Ser Asn Thr Asn Asn Ser Asn Ser Asn Ser Ser Ser Ser Ala
195 200 205
Ala Ala Ala Ala Ala Asp Arg Arg Gly Val Gly Ser Asp Thr Ala Ala
210 215 220
Glu Gly Gly Ile Leu Cys His Arg Pro Ile Ala Val Arg Pro Gln Gln
225 230 235 240
Ser
<210> 96
<211> 339
<212> PRT
<213> 荠菜
<400> 96
Lys Asn Leu Arg Thr Gln Arg Gln Ile Phe Phe Phe Leu Leu Ser Val
1 5 10 15
Phe Gly Leu Gly Lys Thr Lys Lys Met Gly Glu Arg Asp Asp Gly Leu
20 25 30
Gly Leu Ser Leu Ser Leu Ser Leu Gly Phe Thr Pro Lys Glu Pro Ser
35 40 45
Ser Arg Phe Asn Pro Met Pro Met Ala Ser Tyr Ser Ser Ser Ser His
50 55 60
Met His Met Gln Gln Gln Ser Asn Tyr Ser His Pro His Lys Ile Gln
65 70 75 80
Asn Ser Trp Ile Asn Met Phe Gln Ser Ser Glu Arg Asn Ser Asp Met
85 90 95
Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Ala Pro Ser Thr Val
100 105 110
Val Val Asp Val Glu Asp Asp Ala Ala Gly Val Ser Ser Pro Asn Ser
115 120 125
Thr Val Ser Ser Val Val Ser Gly Lys Arg Ser Glu Arg Glu Leu Met
130 135 140
Ala Ala Ala Ala Ala Ala Gly Gly Gly Arg Ala Glu Asp Asn Glu Met
145 150 155 160
Glu Arg Ala Ser Cys Ser Leu Gly Gly Gly Ser Asp Asp Glu Asp Gly
165 170 175
Ser Gly Asn Gly Asp Asp Gly Ser Arg Lys Lys Leu Arg Leu Ser Lys
180 185 190
Glu Gln Ala Leu Val Leu Glu Glu Thr Phe Lys Glu His Ser Thr Leu
195 200 205
Asn Pro Lys Gln Lys Met Ala Leu Ala Lys Gln Leu Asn Leu Gln Thr
210 215 220
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu
225 230 235 240
Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Arg Arg Arg Cys Glu Asn
245 250 255
Leu Thr Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Ser Glu Leu Arg
260 265 270
Ala Leu Lys Leu Ser Pro His Leu Tyr Met His Met Lys Pro Pro Thr
275 280 285
Thr Leu Thr Met Cys Pro Ser Cys Glu Arg Val Ala Val Thr Ser Ser
290 295 300
Ser Ser Ser Val Ala Pro Pro Val Met Thr Ser Ser Ser Pro Met Gly
305 310 315 320
Gln Met Ser Pro Trp Ala Ala Ile Pro Leu Arg Gln Arg Pro Ala Ala
325 330 335
Gly Ser His
<210> 97
<211> 299
<212> PRT
<213> 克莱门柚
<400> 97
Met Ala Glu Lys Asp Asp Leu Gly Leu Ser Leu Ser Leu Ser Phe Pro
1 5 10 15
Gln Asn His His Ser Leu Gln Leu Asn Leu Met Pro Ser Ser Ala Cys
20 25 30
Ser Thr Ser Pro Ser Gly Phe Ser Leu Gln Lys Thr Pro Trp Asn Glu
35 40 45
Ala Leu Phe Pro Pro Ser Asp Pro Asn Ser Glu Ser Cys Arg Ala Glu
50 55 60
Thr Arg Ser Phe Leu Arg Gly Ile Asp Val Asn Arg Leu Pro Ser His
65 70 75 80
Ala Asp Asn Glu Glu Glu Val Gly Val Ser Ser Pro Asn Ser Thr Ile
85 90 95
Ser Ser Val Ser Gly Lys Arg Ser Glu Arg Glu Pro Asn Gly Asp Glu
100 105 110
Leu Glu Met Glu Arg Ala Cys Ser Arg Gly Ile Ser Asp Asp Glu Asp
115 120 125
Gly Asp Thr Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala
130 135 140
Ile Leu Glu Glu Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln
145 150 155 160
Lys Leu Ala Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu
165 170 175
Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu
180 185 190
Val Asp Cys Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu
195 200 205
Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu
210 215 220
Ser Pro Gln Phe Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met
225 230 235 240
Cys Pro Ser Cys Glu Arg Val Ala Val Pro Pro Ser Ala Ala Ala Ser
245 250 255
Ala Val Asp Pro Ala Arg Pro Thr His Gln Met Ala Ala Pro Asn His
260 265 270
His Arg Pro Ile Pro Ile Asn Pro Trp Ala Pro Ala Ala Ala Ile Pro
275 280 285
His Gly Pro Phe Asp Ala Leu Arg Pro Arg Ser
290 295
<210> 98
<211> 333
<212> PRT
<213> 川桑
<400> 98
Met Gly Glu Lys Asp Asp Asp Gly Leu Gly Leu Gly Leu Ser Leu Ser
1 5 10 15
Leu Gly Ile Phe Gly Gly Thr Thr Thr Thr Ala Thr Thr His Thr Thr
20 25 30
Thr His Gln Pro Gly Ser Ser Ser Ser Ser Ser Leu Lys Phe Asn Leu
35 40 45
Met Gln Lys Pro Ser Ser Ser Ser Met Gln Tyr Gln Gln Lys Thr Thr
50 55 60
Asn Thr Thr Ala Thr Pro Trp Asn Glu Ile Phe Gln Leu Ser Asp Arg
65 70 75 80
Asn Ser Asp Gly Arg Ser Phe Leu Arg Gly Leu Asp Val Asn Leu Thr
85 90 95
Pro Ser Phe Ala Ala Ala Ala Ala Ala Asp Tyr Asp Glu Glu Asn Gly
100 105 110
Val Ser Ser Pro Asn Ser Thr Ile Ser Ser Ile Ser Gly Lys Lys Ser
115 120 125
Glu Arg Glu Ala Pro Gly Gly Glu Glu Ala Glu Glu Gly Asp Arg Asp
130 135 140
Ser Cys Ser Arg Gly Gly Gly Gly Ser Asp Asp Glu Asp Gly Gly Asn
145 150 155 160
Gly Gly Gly Asp Ala Ser Arg Lys Lys Leu Arg Leu Thr Lys Asp Gln
165 170 175
Ser Leu Ile Leu Glu Glu Thr Phe Lys Glu His Asn Thr Leu Asn Pro
180 185 190
Lys Gln Lys Leu Ala Leu Ala Lys Glu Leu Asn Leu Arg Pro Arg Gln
195 200 205
Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln
210 215 220
Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr
225 230 235 240
Glu Glu Asn Arg Arg Leu Gln Lys Glu Val Gln Glu Leu Arg Ala Leu
245 250 255
Lys Leu Ser Pro Gln Leu Tyr Met His Met Ser Pro Pro Thr Thr Leu
260 265 270
Thr Met Cys Pro Ser Cys Glu Arg Val Ala Ala Ser Ser Ser Leu Ser
275 280 285
Ser Thr Ala Ala Ala Ala Pro Asn Gly Ser Asn Arg Gln Pro Ala Val
290 295 300
Pro Ser Ile Pro Arg Pro Val Pro Ile Asn Pro Trp Ala Ala Leu Pro
305 310 315 320
Ile Pro His Arg Pro Leu Asp Thr Pro Ala Ser Arg Ser
325 330
<210> 99
<211> 957
<212> DNA
<213> 拟南芥
<400> 99
atgggggaaa gagatgatgg gttgggtttg agtctaagct tgggaaatag tcaacaaaaa 60
gaaccatctc tgaggttgaa tcttatgccg ttgacaactt cttcttcttc ttcttcgttt 120
caacacatgc acaatcagaa taacaatagc catccccaga agattcataa catctcttgg 180
actcatctgt ttcaatcttc tgggattaaa cgtacaactg cagagagaaa ctccgacgcc 240
gggtcatttc taagaggttt caacgtgaac agagctcagt cttcggtggc ggtagtggac 300
ttggaagaag aagccgccgt cgtctcgtct ccaaacagcg ccgtttcgag tctgagtgga 360
aataaaaggg atcttgcggt ggcgagagga ggagatgaaa acgaggcgga gagagcttct 420
tgctcacgcg gagggggaag cggtggtagc gacgatgaag acggcggaaa cggcgacgga 480
tcaaggaaga aactacggtt atcgaaggat caagctcttg ttctcgagga gacttttaaa 540
gaacatagca ctcttaatcc gaagcaaaag ctggctctag caaaacagtt gaatctaagg 600
gcaagacaag ttgaagtgtg gtttcagaac cgtagggcaa ggacgaagct gaaacaaacg 660
gaggttgatt gtgagtattt aaagagatgt tgcgataatc tgaccgagga gaatcgacgg 720
ctgcagaaag aagtgtcgga gctgagggcg ttgaagttgt ctccacatct ctacatgcac 780
atgactcctc ctactactct caccatgtgc ccttcttgcg aacgtgtctc ctcctctgcc 840
gccactgtga ccgctgctcc ttccactact actactccta cggtggtggg gcggccaagt 900
ccacagcgat taactccttg gactgctatt tctctccagc aaaaatcagg tcgctag 957
<210> 100
<211> 891
<212> DNA
<213> 蒺藜苜蓿
<400> 100
atgagtattg aaaaggaaga ttttggtttg agcctaagtt tgagctttcc tcaaaatcca 60
ccaaatcctc aataccttaa tcttatgtct tcttcaactc attcatattc tccttctact 120
ttcaatcctc aaaaaccttc ttggaatgat gtttttactt cttcagatcg ggattcggag 180
acatgcagaa tcgaagaacg tcctttaatt ctccgaggaa tcgatgtgaa tcggttacct 240
tcaggtgctg attgtgaaga agaagcagga gtttcatcac caaacagcac cgtttcaagt 300
gtgagtggta aaagaagcga aagagaagtt accggtgaag atcttgacat ggaaagagat 360
tgttcaagag gaatcagtga tgaagaagac gctgaaactt caaggaaaaa acttagactc 420
accaaagacc aatcaatcat tctcgaagag agtttcaaag aacacaacac tcttaatccc 480
aaacaaaaat tggcacttgc aaaacaattg ggacttcgtg ctagacaagt tgaagtttgg 540
tttcaaaatc gtagagcaag gactaagttg aagcaaacag aggtagattg tgaatttttg 600
aaaagatgtt gtgagaatct aacggatgaa aatagacggt tgcaaaaaga agtgcaagag 660
ttaagagcat tgaaactttc cccacaattc tacatgcaaa tgacaccacc aacaacactt 720
accatgtgcc cctcttgtga gcgtgtcgct gttccatcat ctgccgttga tgctgccacg 780
cgtcgtcatc ctatggcttc aaatcaccct cgtacgtttt ccgtgggacc atgggccaca 840
gctgctccaa tccaacatag gacctttgat acactccgtc ctagatctta a 891
<210> 101
<211> 957
<212> DNA
<213> 拟南芥
<400> 101
atgggggaaa gagatgatgg gttgggtttg agtctaagct tgggaaatag tcaacaaaaa 60
gaaccatctc tgaggttgaa tcttatgccg ttgacaactt cttcttcttc ttcttcgttt 120
caacacatgc acaatcagaa taacaatagc catccccaga agattcataa catctcttgg 180
actcatctgt ttcaatcttc tgggattaaa cgtacaactg cagagagaaa ctccgacgcc 240
gggtcatttc taagaggttt caacgtgaac agagctcagt cttcggtggc ggtagtggac 300
ttggaagaag aagccgccgt cgtctcgtct ccaaacagcg ccgtttcgag tctgagtgga 360
aataaaaggg atcttgcggt ggcgagagga ggagatgaaa acgaggcgga gagagcttct 420
tgctcacgcg gagggggaag cggtggtagc gacgatgaag acggcggaaa cggcgacgga 480
tcaaggaaga aactacggtt atcgaaggat caagctcttg ttctcgagga gacttttaaa 540
gaacatagca ctcttaatcc gaagcaaaag ctggctctag caaaacagtt gaatctaagg 600
gcaagacaag ttgaagtgtg gtttcagaac cgtagggcaa ggacgaagct gaaacaaacg 660
gaggttgatt gtgagtattt aaagagatgt tgcgataatc tgaccgagga gaatcgacgg 720
ctgcagaaag aagtgtcgga gctgagggcg ttgaagttgt ctccacatct ctacatgcac 780
atgactcctc ctactactct caccatgtgc ccttcttgcg aacgtgtctc ctcctctgcc 840
gccactgtga ccgctgctcc ttccactact actactccta cggtggtggg gcggccaagt 900
ccacagcgat taactccttg gactgctatt tctctccagc aaaaatcagg tcgctag 957
<210> 102
<211> 891
<212> DNA
<213> 蒺藜苜蓿
<400> 102
atgagtattg aaaaggaaga ttttggtttg agcctaagtt tgagctttcc tcaaaatcca 60
ccaaatcctc aataccttaa tcttatgtct tcttcaactc attcatattc tccttctact 120
ttcaatcctc aaaaaccttc ttggaatgat gtttttactt cttcagatcg ggattcggag 180
acatgcagaa tcgaagaacg tcctttaatt ctccgaggaa tcgatgtgaa tcggttacct 240
tcaggtgctg attgtgaaga agaagcagga gtttcatcac caaacagcac cgtttcaagt 300
gtgagtggta aaagaagcga aagagaagtt accggtgaag atcttgacat ggaaagagat 360
tgttcaagag gaatcagtga tgaagaagac gctgaaactt caaggaaaaa acttagactc 420
accaaagacc aatcaatcat tctcgaagag agtttcaaag aacacaacac tcttaatccc 480
aaacaaaaat tggcacttgc aaaacaattg ggacttcgtg ctagacaagt tgaagtttgg 540
tttcaaaatc gtagagcaag gactaagttg aagcaaacag aggtagattg tgaatttttg 600
aaaagatgtt gtgagaatct aacggatgaa aatagacggt tgcaaaaaga agtgcaagag 660
ttaagagcat tgaaactttc cccacaattc tacatgcaaa tgacaccacc aacaacactt 720
accatgtgcc cctcttgtga gcgtgtcgct gttccatcat ctgccgttga tgctgccacg 780
cgtcgtcatc ctatggcttc aaatcaccct cgtacgtttt ccgtgggacc atgggccaca 840
gctgctccaa tccaacatag gacctttgat acactccgtc ctagatctta a 891
<210> 103
<211> 744
<212> DNA
<213> 亚洲栽培稻
<400> 103
atgatggaga gggccgagga cctgcgcctg agcctcagtc tcagctcgcc gcttattgct 60
cctcgtactc accatgtcgc catgctgttc cacgctcctc cagagaaaag attcctggag 120
atgccgctgc tccctgctgc gaagcggagc gaggtcgtcg cggcagaaga ggagcgcgcg 180
ggcctgcgcg gcggcggcgg cagcgacgag gaggacggtg gctgcggcat cgacggctca 240
cgcaagaagc tccggctttc caaggaccag tccgccgtgc tcgaggacag cttccgggag 300
caccccaccc tcaaccccag gcagaaggca actttggcgc agcagctcgg gcttcggcct 360
cggcaggtcg aggtgtggtt tcagaacaga cgcgcaagga cgaagctgaa gcagacggag 420
gtggactgcg agttcctgaa gcgctgctgc gagacgctca cggaggagaa ccggaggctg 480
cagaaggagg tgcaggagct gcgagcgctc aagctcgtct cgccgcacct ctacatgaac 540
atgtccccgc ccaccacgct caccatgtgc ccctcctgcg agcgcgtctc caacaccaat 600
aacaactcca gcgccgccgc cgccgccgac cgccgcggca tcaggactac tactgccgca 660
ggcggcggca gcgtcgtcga caccgccgcc gacgggggca tcctctgcca ccgcccgatc 720
gccgtccggc cgcagcagtc atga 744
<210> 104
<211> 744
<212> DNA
<213> 亚洲栽培稻
<400> 104
atgatggaga gggccgagga cctgcgcctg agcctcagtc tcagctcgcc gcttattgct 60
cctcgtactc accatgtcgc catgctgttc cacgctcctc cagagaaaag attcctggag 120
atgccgctgc tccctgctgc gaagcggagc gaggtcgtcg cggcagaaga ggagcgcgcg 180
ggcctgcgcg gcggcggcgg cagcgacgag gaggacggtg gctgcggcat cgacggctca 240
cgcaagaagc tccggctttc caaggaccag tccgccgtgc tcgaggacag cttccgggag 300
caccccaccc tcaaccccag gcagaaggca actttggcgc agcagctcgg gcttcggcct 360
cggcaggtcg aggtgtggtt tcagaacaga cgcgcaagga cgaagctgaa gcagacggag 420
gtggactgcg agttcctgaa gcgctgctgc gagacgctca cggaggagaa ccggaggctg 480
cagaaggagg tgcaggagct gcgagcgctc aagctcgtct cgccgcacct ctacatgaac 540
atgtccccgc ccaccacgct caccatgtgc ccctcctgcg agcgcgtctc caacaccaat 600
aacaactcca gcgccgccgc cgccgccgac cgccgcggca tcaggactac tactgccgca 660
ggcggcggca gcgtcgtcga caccgccgcc gacgggggca tcctctgcca ccgcccgatc 720
gccgtccggc cgcagcagtc atga 744
<210> 105
<211> 744
<212> DNA
<213> 亚洲栽培稻
<400> 105
atgatggaga gggccgagga cctgcgcctg agcctcagtc tcagctcgcc gcttattgct 60
cctcgtactc accatgtcgc catgctgttc cacgctcctc cagagaaaag attcctggag 120
atgccgctgc tccctgctgc gaagcggagc gaggtcgtcg cggcagaaga ggagcgcgcg 180
ggcctgcgcg gcggcggcgg cagcgacgag gaggacggtg gctgcggcat cgacggctca 240
cgcaagaagc tccggctttc caaggaccag tccgccgtgc tcgaggacag cttccgggag 300
caccccaccc tcaaccccag gcagaaggca actttggcgc agcagctcgg gcttcggcct 360
cggcaggtcg aggtgtggtt tcagaacaga cgcgcaagga cgaagctgaa gcagacggag 420
gtggactgcg agttcctgaa gcgctgctgc gagacgctca cggaggagaa ccggaggctg 480
cagaaggagg tgcaggagct gcgagcgctc aagctcgtct cgccgcacct ctacatgaac 540
atgtccccgc ccaccacgct caccatgtgc ccctcctgcg agcgcgtctc caacaccaat 600
aacaactcca gcgccgccgc cgccgccgac cgccgcggca tcaggactac tactgccgca 660
ggcggcggca gcgtcgtcga caccgccgcc gacgggggca tcctctgcca ccgcccgatc 720
gccgtccggc cgcagcagtc atga 744
<210> 106
<211> 957
<212> DNA
<213> 拟南芥
<400> 106
atgggggaaa gagatgatgg gttgggtttg agtctaagct tgggaaatag tcaacaaaaa 60
gaaccatctc tgaggttgaa tcttatgccg ttgacaactt cttcttcttc ttcttcgttt 120
caacacatgc acaatcagaa taacaatagc catccccaga agattcataa catctcttgg 180
actcatctgt ttcaatcttc tgggattaaa cgtacaactg cagagagaaa ctccgacgcc 240
gggtcatttc taagaggttt caacgtgaac agagctcagt cttcggtggc ggtagtggac 300
ttggaagaag aagccgccgt cgtctcgtct ccaaacagcg ccgtttcgag tctgagtgga 360
aataaaaggg atcttgcggt ggcgagagga ggagatgaaa acgaggcgga gagagcttct 420
tgctcacgcg gagggggaag cggtggtagc gacgatgaag acggcggaaa cggcgacgga 480
tcaaggaaga aactacggtt atcgaaggat caagctcttg ttctcgagga gacttttaaa 540
gaacatagca ctcttaatcc gaagcaaaag ctggctctag caaaacagtt gaatctaagg 600
gcaagacaag ttgaagtgtg gtttcagaac cgtagggcaa ggacgaagct gaaacaaacg 660
gaggttgatt gtgagtattt aaagagatgt tgcgataatc tgaccgagga gaatcgacgg 720
ctgcagaaag aagtgtcgga gctgagggcg ttgaagttgt ctccacatct ctacatgcac 780
atgactcctc ctactactct caccatgtgc ccttcttgcg aacgtgtctc ctcctctgcc 840
gccactgtga ccgctgctcc ttccactact actactccta cggtggtggg gcggccaagt 900
ccacagcgat taactccttg gactgctatt tctctccagc aaaaatcagg tcgctag 957
<210> 107
<211> 957
<212> DNA
<213> 拟南芥
<400> 107
atgggggaaa gagatgatgg gttgggtttg agtctaagct tgggaaatag tcaacaaaaa 60
gaaccatctc tgaggttgaa tcttatgccg ttgacaactt cttcttcttc ttcttcgttt 120
caacacatgc acaatcagaa taacaatagc catccccaga agattcataa catctcttgg 180
actcatctgt ttcaatcttc tgggattaaa cgtacaactg cagagagaaa ctccgacgcc 240
gggtcatttc taagaggttt caacgtgaac agagctcagt cttcggtggc ggtagtggac 300
ttggaagaag aagccgccgt cgtctcgtct ccaaacagcg ccgtttcgag tctgagtgga 360
aataaaaggg atcttgcggt ggcgagagga ggagatgaaa acgaggcgga gagagcttct 420
tgctcacgcg gagggggaag cggtggtagc gacgatgaag acggcggaaa cggcgacgga 480
tcaaggaaga aactacggtt atcgaaggat caagctcttg ttctcgagga gacttttaaa 540
gaacatagca ctcttaatcc gaagcaaaag ctggctctag caaaacagtt gaatctaagg 600
gcaagacaag ttgaagtgtg gtttcagaac cgtagggcaa ggacgaagct gaaacaaacg 660
gaggttgatt gtgagtattt aaagagatgt tgcgataatc tgaccgagga gaatcgacgg 720
ctgcagaaag aagtgtcgga gctgagggcg ttgaagttgt ctccacatct ctacatgcac 780
atgactcctc ctactactct caccatgtgc ccttcttgcg aacgtgtctc ctcctctgcc 840
gccactgtga ccgctgctcc ttccactact actactccta cggtggtggg gcggccaagt 900
ccacagcgat taactccttg gactgctatt tctctccagc aaaaatcagg tcgctag 957
<210> 108
<211> 744
<212> DNA
<213> 亚洲栽培稻
<400> 108
atgatggaga gggccgagga cctgcgcctg agcctcagtc tcagctcgcc gcttattgct 60
cctcgtactc accatgtcgc catgctgttc cacgctcctc cagagaaaag attcctggag 120
atgccgctgc tccctgctgc gaagcggagc gaggtcgtcg cggcagaaga ggagcgcgcg 180
ggcctgcgcg gcggcggcgg cagcgacgag gaggacggtg gctgcggcat cgacggctca 240
cgcaagaagc tccggctttc caaggaccag tccgccgtgc tcgaggacag cttccgggag 300
caccccaccc tcaaccccag gcagaaggca actttggcgc agcagctcgg gcttcggcct 360
cggcaggtcg aggtgtggtt tcagaacaga cgcgcaagga cgaagctgaa gcagacggag 420
gtggactgcg agttcctgaa gcgctgctgc gagacgctca cggaggagaa ccggaggctg 480
cagaaggagg tgcaggagct gcgagcgctc aagctcgtct cgccgcacct ctacatgaac 540
atgtccccgc ccaccacgct caccatgtgc ccctcctgcg agcgcgtctc caacaccaat 600
aacaactcca gcgccgccgc cgccgccgac cgccgcggca tcaggactac tactgccgca 660
ggcggcggca gcgtcgtcga caccgccgcc gacgggggca tcctctgcca ccgcccgatc 720
gccgtccggc cgcagcagtc atga 744
<210> 109
<211> 858
<212> DNA
<213> 葡萄
<400> 109
atggtcgaca aggacgacga cttaggcttg agtctagccc taaaatgccc cgaagcgctg 60
cctcagaggc ctctcaatct cttcgtgcaa aagaaggccc tctgcagcga cgcgtttcat 120
gcatctgaga cgagagcgta cctgagaggc atcgatgtga atcgggcacc gacgatggcg 180
gattgcgagg atgttggggt gtcgtcgcca aacagcacga tatcgagcat aagcgggaag 240
aggaatgaca gggaaaccaa cgaagaagag aatgagaacg agaatgagat tgagagttcg 300
gaggaagacg ccggaggcac cggggacacc gtcaggaaga agctccggtt gtcgaaagaa 360
cagtcggcga ttctcgaaga gactttcaaa gaacacaaca ctctcaaccc gaagcaaaag 420
ttggcgctag cgaagcaatt gaatctgagg ccgaggcagg tggaagtttg gtttcagaac 480
agaagggcaa gaactaagtt gaagcagacg gaggtggact gcgagtatct gaagaggtgc 540
tgtgagaatc taaccgagga gaacagacgg ctgcagaagg aggtgcagga gctgagaaca 600
ctgaagcttt caccacagct ctacatgcac atgaaccctc ccaccactct caccatgtgc 660
ccatcgtgtg agcgcgtggc cgtcgcgtcc gcctcatcct cagcaccctc tccatcaccc 720
gcctccaacc cacttgctgc agcccctcat ttcccattgg gcccgcatca acatcggccc 780
atgcccatag ccgggccatg ggccggagca gcatcaatgc gccacagacc gttcgatgcc 840
catggcacca ggtcgtga 858
<210> 110
<211> 885
<212> DNA
<213> 蓖麻
<400> 110
atggaagaca aagatgatgg gctgggtttg ggtttgagtc tgagtttggg aggtcaggaa 60
aaacatcaaa atcagccatc tttgaagctc aatctcatgc cgtttccgtc gctctttatg 120
caaaatactc accacagtac ctccttgaat gaccttttcc aatcatctga tagaaacgct 180
gatacgaggt catttcaacg agggattgat atgaatcgga tgcccctctt cgccgattgc 240
gacgatgaaa acggtgtttc ttcgccgaac agtacgattt ccagtttaag tggaaagaga 300
agcgagaggg aacagattgg aggagaggag atggaggcag agagagcatc atgctctcgc 360
ggcggaagtg acgacgaaga cggtggcgcc ggcggcgatg acggttctag gaaaaaactg 420
aggctctcaa aggaacaatc tttattgctt gaagagactt ttaaggagca caatactctc 480
aatccaaagc agaagctggc tttagctaaa cagttgaatc tcaagccaag acaggtggag 540
gtgtggtttc agaaccggag ggcaaggact aagtcgaagc aaactgaagt tgattgtgag 600
tacttaaaaa ggtgttgtga gaatctgaca caagagaaca ggaggttgca gaaggaggtg 660
caggagctta gagcattgaa gctctcccca cagctgtaca tgcacatgaa ccctcccacc 720
acactcacaa tgtgcccttc atgcgagcgt gttgcagtct cctcatcggc tgctcccagc 780
cgccaaccac cgaattccca accccaacga ccggtgcctg ttaagccttg ggcagcattg 840
cctatccagc atcgaccgtt tgatacgcct gcttctagat cgtag 885
<210> 111
<211> 702
<212> DNA
<213> 双色高粱
<400> 111
atgatggaga gggtcgagga cttagggctc agcctcagcc tcagctcgtc cctcgcgtct 60
cctcgcactc accatgtcgc caccatgctg ctacgcgctc caccagagaa gaggttcctg 120
gagatgccgc tgctgctccc cgcgaagcga agcgagctgg ccacgggcga ggagggcctg 180
cgaggcggcg gcagcgacga ggaggacggc ggctgcggca tcgacggctc caggaagaag 240
ctccggctgt ccaaggacca gtcggccgtg ctcgaggata gcttccggga gcacccaact 300
ctcaaccctc ggcagaaggc agccttggcg cagcagctgg gcctgcggcc ccgccaggtg 360
gaggtgtggt tccagaacag gcgcgccagg acgaagctga agcagacgga ggtggactgc 420
gagtacctga agcgctgctg cgagacgctg acggaggaga accggcggct gcacaaggag 480
gtgcaggagc tccgcgcgct caagctcgtc tcgccgcacc tctacatgca catgcccccg 540
cccaccaccc tcaccatgtg cccctcctgc gagcgcgtct cctcctccaa cgcgtccaac 600
gccaactccg ccgccgctga ccgcaaggcg ggcgccggcg tcgccgacgg tggcgccatc 660
gtctgccacc gcccgatcgc cgtccggccg cagcagtcat ga 702
<210> 112
<211> 948
<212> DNA
<213> 琴叶拟南芥琴叶亚种
<400> 112
atgggtgaaa gagatgatgg gttgggtctg agtctaagct tgggaaatag tcaacaaaaa 60
gaaccatctc tgaggttgaa tcttatgccg ttgacaactt cttcttcttc ttcgtttcaa 120
cacatgcaca atcagaataa taatagccat ccccagaaga ttcatcacaa ctcttggact 180
catctgtttc aatcttctgg aattaaacgt acaactgcag agagaaactc tgacgccggg 240
tcttttctaa gaggtttcaa cgtgagcaga gctccgtctg cggtggcggt ggtggacttg 300
gaagaagaag ccgccgttgt ctcgtctccg aacagcaccg tctcgagtct gagtgggaat 360
aagagggatc ttgcggtggc aagaggagga gatgaaaacg aggcggagag agcttcttgc 420
tcacgtggag ggggaagcgg tggaagtgac gatgaagagg gcggaaacgg cgacggatca 480
aggaagaaac tccggttatc gaaggaacaa gctcttgttc tcgaggagac ttttaaagaa 540
catagcactc ttaatccgaa gcaaaagctg gctctagcaa aacagttgaa tctaagggca 600
agacaagtgg aagtgtggtt tcagaaccga agggcaagga cgaagctgaa acaaacggag 660
gttgattgtg agtatttgaa gagatgttgc gatagtctga cggaggagaa tcgacggttg 720
cagaaagaag tgtcggagct gagagcgttg aagttgtctc cacatctcta catgcatatg 780
actccgccta ctactctcac catgtgccct tcttgcgaac gtgtctcctc ctctgccgcc 840
actgtgacgg ctgctcctcc tactactcct acggtggtgg ggcggccaag tccacagcgg 900
ttaactccgt ggactactat ttctctccag caaaaatcag gtcgctag 948
<210> 113
<211> 960
<212> DNA
<213> 桃
<400> 113
atgatggttg agagagatca agatttgggt ttgagtctga gcttgagttt tcctcagacc 60
cacaaccacc acaacaacaa caacaacaac agcagcagca ccaccagcac ccttcagctc 120
aatctcatgc cttctttggc ccctacttct gcttcttctc cttctgggtt tcttcctcaa 180
aaaccctctt ggaatgaggc cttgatttct tcagatcgaa actccaactc cgaaacgttc 240
cgggtcgggc cccgatcgtt ccttcggggc atcgacgtga accggttgcc ttcaacgggc 300
gactgcgaag acgaggcggg cgtgtcgtcg cccaacagca cggtgtcgag cgtgagcggc 360
aagcggagcg agagagaggc caatggcgaa gatctcgaca tcgagactcg aggcatcagc 420
gatgaagaag acggcgagac ctctagaaag aagctcaggc tctccaagga ccagtccgcc 480
attctcgaag agagcttcaa ggagcacaac actctcaacc caaagcaaaa gttggcgttg 540
gctaaacagc ttggcctccg gcctagacaa gtggaagtct ggtttcagaa cagaagagca 600
aggactaagt tgaagcaaac ggaggtggac tgtgagttct tgaagaggtg ctgtgagaat 660
ctgacagagg agaacaggcg gttgcagaag gaggttcagg agctgagagc actgaaactt 720
tccccacagt tctacatgca aatgacccca cccacgacac tcaccatgtg cccctcgtgt 780
gagcgtgtcg cggtcccacc caactcctca tcctcaaccg tcgagccccg gccccacccc 840
cacccccacc cccaaatggg ttcggtccag acccggcccg tccccatcaa cccgtgggca 900
tccgccaccc caatccccca ccggccgctg ccgttcgaag ccttccacac ccggacgtaa 960
<210> 114
<211> 471
<212> DNA
<213> 乌拉尔图小麦
<400> 114
atggatggct cccgcaagaa gctccggttg tccaaggacc agtccgccgt gctcgaggac 60
agcttccggg agcaccccac tctgaacccg aggcagaagg cagccttggc gcagcagctg 120
ggcctgcggt cgcggcaggt ggaggtgtgg ttccagaaca gacgcgcaag gacgaagctg 180
aagcagacgg aggtggactg cgagttcctg aagcgatgct gcgagacgct gacggaggag 240
aaccggcggc tgcagaagga ggtgcaggag ctccgcgcgc tcaagctcgt ctccccgcac 300
cactacatgc acatgtcccc gcccaccacc ctcaccatgt gcccctcctg cgagcgcgtc 360
tccaacaaca acaacaacaa caacaacaac tccaccaccg ccgaccgccg caacggtgtc 420
gagggcgcca tctgccaccg acccatcgcc gtccggccgc agcagtcatg a 471
<210> 115
<211> 963
<212> DNA
<213> 荠菜
<400> 115
atgggtgaac gagatgatgg gttgggtctg agtctaagct tgggaaatag tagtcagcta 60
aaagaaccat ctctgaggtt gaatcttacg cctttcacag cttctacttc ttcctcgttt 120
cctcctcaca tgcacaatca gattattaat aataatagcc atccccaaaa gattcatcac 180
aactcttgga ctcatctgtt tcaatcttct ggaattaaac gtacaactgc agagagaaac 240
tccgacgccg gatctttcct aagaagtttc gacgtgaaca gagctccgtc ctcttcggtg 300
gcggtggtga acctggaaga agaagcagcc gtcgtctcgt ctccgaacag caccgtatcg 360
agtctgagtg ggaataagag ggatcttgcg gcggctagag gaggagatga gcacgaggcg 420
gagagagctt cttgctcacg cggcggagga agtgatgacg aagactgcgg aaatggcgac 480
gggtcaagaa agaagctacg gttgtcgaag gaacaagctc ttgttctcga ggagactttc 540
aaagtacaca gcactcttaa tccgaagcaa aagctggttc tagcaaaaca gttgaatcta 600
agggcaagac aagtggaagt gtggtttcag aaccgaaggg caaggacgaa gctgaaacaa 660
acggaggttg attgtgagta tttgaagaga tgttgtgata atttgacgga ggagaatcga 720
cgattgcaaa aagaagtgtc ggagctgaga gcgttgaagt tgtctccaca tctctacatg 780
cacatgactc ctcctactac tctcaccatg tgcccttctt gcgagcgtgt ctcctccacc 840
tcatccgcca atgcgagcat cgctcctcct ccacctcctg ctactagtgt ggttgggcgg 900
ccaagtccgc agcgatcgac tcattggact gctatttccc tccagcaacg atcaggccgc 960
tag 963
<210> 116
<211> 888
<212> DNA
<213> 可可树
<400> 116
atgggtgctg aaaaagatga tggtttgggg ttgagcttga gcttgggatg tgctcaaaat 60
cacccttctt tgaagttaaa tctcatgcct ttagcgtcac cccgcatgca aaatcttcag 120
cagaagaaca cttggaatga gctgtttcaa tcttctgatc gaaacctgga tacgagatca 180
tttcttcgag ggattgatgt gaaccgggca ccagcaacgg ttgattgcga ggaggaaggt 240
ggggtctcgt ctcccaacag caccatttct agcataagtg ggaagagaaa cgagagagac 300
cctgtgggtg atgaaactga ggccgagaga gcgtcttgct ctcgtgccag tgatgatgaa 360
gacggcggtg ctggtggcga tgcctcgagg aaaaagctta ggctctcaaa ggaacagtcc 420
ttgctgcttg aagaaacctt caaggagcat agcactctta atccgaagca aaagttggca 480
ctggcaaagc aattgaatct gaggcctagg caagtggagg tctggttcca gaacagaagg 540
gccaggacaa agttgaagca gacggaagtt gactgtgagt atctaaagag atgttgcgag 600
aatctgaccg aggagaatag gcggctgcag aaggaagtgc aagagcttag agctttgaaa 660
ctctctccac agctctacat gcacatgaac cctcccacaa ccctcactat gtgcccttct 720
tgtgaacgtg tggcggtttc ttcctcctcc tcctccgcag cagctactgc ttcctccacc 780
ccaacttcga cggtcccaaa ccgtcaccac cggacgagtt ccgttagccc ttgggcagca 840
atgccaattg gtcatcgacc cttccatgcc cctgcatcta gatcataa 888
<210> 117
<211> 801
<212> DNA
<213> 无油樟
<400> 117
atgaatagag aagatctgaa tctgagttta agcttgagga gagtcggaga tttcgagttg 60
aatctgttac ccagaaattg cagaaatgat tcttccagtt tagatagatc agagacagct 120
agatcaatcc taaaatcctt tgatgtgaac cggattcagg cgacatcaga taggattccg 180
acaacaaccg atgcgattcg atcagaaatc agccggattc cggcaacacc gaacatggct 240
ggattcgatg taaataggat cccagtcatt tcagagtgcg aagaagaggc agtggtgtcg 300
tcgccaatga gcacagtttc gagcttgagc atgagtggcg ggaagagaga tgagccggag 360
ggggagagag cgagctcgag gggatctagt gacgaggagg atggtggtga ggctgcaagg 420
aagaaacttc gattgtcaaa ggatcaatct gcagttctag aggagagttt caaggaacac 480
aatactctta acccgaagca gaagctcact ttggcaaagc agttgaatct tcgccctcgt 540
caagtcgaag tctggtttca gaaccgaaga gcaaggacta agttaaagca aacagaagta 600
gattgtgaat ttttaaagag gtgttgtgaa aacctgactg aagagaacag gaggctccaa 660
aaagaagtga tggagctaag gtcccttaag caaacccctc acttctatat gcacgtgcct 720
cccgctgccc tgacgatgtg cccctcatgc gagcgtgtgg cagtgtcgga gtcccagttt 780
cgaccacaga ttcgatcatg a 801
<210> 118
<211> 972
<212> DNA
<213> 盐芥
<400> 118
atgggtgaaa gagatgatgg gttgggtctg agtctaagct tggggtttag tcaacagaag 60
gaaccatgtc cgaggttgaa tctactacct ttgacaactt cttcttcttc atcttcgttt 120
catcacatgc acaatcacaa caataaccat ctccagaaga agattcaaca caactcttgg 180
cctcatctgt ttcaatcttc tgagaaaaat cccgacgccg gatcttttgg acgaggtttc 240
gacgtgaaca gagctccgtc tgcggcggcg gtggttgact tagaggaaga cggcaccggc 300
gtgtcgtcgc cgaacagcac cgtctcgagt gttagtggga acaagagaga tcttgcggcg 360
gcgagaggag gaggaggaga tgaaaacgag ggggagagag cttcttgctc acacggcggc 420
ggaagcggtg gaagcgacga tgaagacggc ggaaacggcg acggatcgag gaagaaactc 480
cgtttatcta aggaacaagc tgtggttctc gaagagactt tcaaagaaca taccactcta 540
aatccgaagc aaaagctggc cctagcgaga cagttgaatc taaggacaag gcaagtagaa 600
gtgtggttcc agaaccgaag ggcaaggacg aagctgaaac aaacggaggt tgattgtgag 660
tatttgaaga gatgttgcga taatctaacg gaggagaatc gacggttgca caaggaagta 720
tctgagctca gagcgttgaa gctgtctcca catctctaca tgcacatgac tcctccaact 780
actcttacaa tgtgtccttc ttgcgaacgt gtctcggctt cctcctcctc caccgccgtt 840
gctgctcctc cgtcgtcttc ctccgctgca tctggcggtg gtggatggat tcctacggtg 900
gtgggacggc caagtccaca acgaccaact ccttgcgcag ctatttctct ccagtcaaga 960
ttagctcact ag 972
<210> 119
<211> 864
<212> DNA
<213> 克莱门柚
<400> 119
atgggcgaga aggatgacgg attgggtttg agtctaagct tgggatgtgc tgcaagaaat 60
gaaccttctt tgaggttgaa tcacatgcct ttgtcttctt cacaatccat gcaaaatcat 120
cataaaagaa gcccttggac tgagctgttc cattcgtccg atcgaaactc agatacaaga 180
tcattcctta gaggaataga tgtgaatcag gcaccaacag tggcagattg cgaggaagaa 240
aatggggttt catcaccaaa cagcactgtt tctagcataa gtggaaagag gagtgagaga 300
gagcccattg gagatgagac tgaggctgaa agagcgtctt gctctcgcgg cagtgacgac 360
gaagacggtg gcgctggtga tgcatcaaga aagaagctga gattgtcgaa agaacagtct 420
ttgttgcttg aagagacctt caaagagcat agcactctca atcctaagca aaagttggct 480
ttggcaaagc agttgaatct taggcctaga caagtagaag tgtggtttca gaacagaagg 540
gcaaggacaa agttgaagca aacagaggtt gattgtgagt acttaaagag atgctgcgag 600
aatctaacgg aggagaacag gagattgcag aaggaagtgc aagagcttag atcattgaag 660
ctttctcctc aactctacat gaatatgaat cctcccacga cactcacaat gtgtccctcc 720
tgtgagcgtg tggctgtatc atcgtcgtcg tcgtcatcct ctgctgctgc caacggcacc 780
acccgtctcc ccattggtcc taaccatcaa cgactgactc cagtgagccc ttgggcagca 840
ttaccaatcc accaccggtc gtaa 864
<210> 120
<211> 918
<212> DNA
<213> 菜豆
<400> 120
atgggtgaaa aagatgatgg gttggggtta aggttgagtt tgagatgggg agaaaatgat 60
gataataaca tgaatcaaca acaccctttc aacatgcaca agcctcctca acctgttcca 120
aaccaaagga cttctttcaa taatttgttc catttccatg gagcttctca tgtaacaaat 180
cggaactccg agccgccacc gtttttcttt ggaatagatg ttaacttgcc gccgccacca 240
acaccaacac cgtcggtggt accatgcgaa gaggacaatc ttgtgtcttc gcagaacagc 300
gcagtatcaa gcatcagcgg gaagaggagc gaaagagagg agaatgagag agggtcgtgt 360
tcgcatggaa gtgaagatga ggatggcgga gggttcggtg gtgaaggcga tggcgacatg 420
tcaaggaaga aactgaggtt gtcgaaggaa caggccttgg tgctggaaga aacattcaag 480
gaacacaaca ctctgaatcc gaaacaaaag caagctttgg caaagcagtt gaatctgagt 540
cctagacagg ttgaggtgtg gtttcaaaac agaagagcaa ggaccaagct gaagcagact 600
gaagtggact gtgaatactt aaagagatgt tgtgagaatc taactgagga gaataggagg 660
ctacagaagg aagtgcaaga gctaagagca ttgaagtttt ctccacagct ctacatgcac 720
atgaatcctc caaccactct tacaatgtgt ccttcctgtg agcgtgttgc tgtctcatct 780
gcatcctcct cctcatcagc tgccatgcct tctgtgccac ctccagctaa tcacaaccca 840
ttaggcccta ccatccagcg gccagtgccg gtcaaccctt gggcagcaat gtcaattcaa 900
cgcccctgcc gtaattga 918
<210> 121
<211> 1002
<212> DNA
<213> 川桑
<400> 121
atgggtgaga aagatgatga tgggttgggg ttggggttga gtttgagctt gggaatattt 60
ggtggaacta caacaacagc aacaactcac actactactc atcaaccggg ttcttcttct 120
tcttcttctc tcaagtttaa tctcatgcaa aagccttctt cttcttccat gcaatatcaa 180
caaaagacta ctaataccac cgccactcct tggaatgaaa tctttcagct ttctgatcgg 240
aactccgacg gcaggtcgtt cctccggggg ctcgacgtga acctgacacc ctcgtttgcg 300
gcggcggcgg cggcggatta cgatgaggaa aacggcgtgt cgtctccgaa cagcacgata 360
tcgagcataa gcgggaagaa gagcgagaga gaggcaccgg gaggagagga ggccgaggag 420
ggagacagag actcctgctc tcgcggcggc ggaggaagtg atgacgaaga cggcggaaat 480
ggcggcggcg acgcctccag aaagaagctc cgcctcacca aggaccagtc tctcatcctt 540
gaagaaactt tcaaggagca caacactctc aacccgaagc aaaagctggc gttggctaag 600
gaactgaacc tgcggccaag acaagtggag gtgtggtttc agaacaggag ggcaaggact 660
aaattgaagc agacagaagt ggactgtgag tatctaaaga ggtgctgtga gaatctgact 720
gaagagaaca ggaggctgca aaaggaagtg caagagctta gagcattaaa gttgtcccca 780
cagctctaca tgcacatgag ccctcccacc accctcacaa tgtgcccttc atgtgagcgt 840
gtggcggcct cgtcgtcgtt gtcctctact gctgctgccg ctccaaacgg ttcaaaccgg 900
cagcccgccg ttcccagcat cccacggcct gtgcccatta acccgtgggc cgcattgcca 960
atcccacacc ggccgttgga tacacctgcc tctaggtcct aa 1002
<210> 122
<211> 972
<212> DNA
<213> 猴面花
<400> 122
atgatgacgg ccggaaaaga agatttgggg ctgagtttga gcctgacctt cccgccggag 60
aagaaggccg tttcgaatat tccgagctca ctgcacctca atctcatgcc ttcttcgcct 120
tctcccaatt tcaccatttt caataataat ttcaattgga cgtcgacgca acaagctgct 180
gctgctttcc ccttctcaga tcggagctcg gagacatgca gagtggagac gacgaggtct 240
tttctgaaag gaatcgatgt caactgcctc ccgtcggcgg cggcggcgga ggaggaagag 300
gaggaggaag gcggcggcgt ctcctccccc aacagcacga tctcaagcgt gagcgggaag 360
cggagcgaga gggaagacgc cacggaggag cacgacggcg agagagcttg ctcccgcggc 420
atcagcgacg aagaagacgc tgagaacgcc cggaaaaagc tccgcctctc caaagaccag 480
tccgccactc tcgaagaaag cttcaaagaa cacaacacac tcaatcccaa gcaaaagatg 540
gctttggcta aaagattagg gctaaggcca agacaagttg aagtctggtt ccaaaacaga 600
agggctagga caaaactgaa gcaaacagag gttgattgcg agttcctaaa gagatgctgc 660
gaaaacctaa cagaagagaa cagaaggctg caaaaagagg tccaagaact aagggcactt 720
aagctatccc cacagttcta catgcagatg acccctccaa ctactctcac catgtgccct 780
tcttgcgaga gagtcgcggt gccgacaatg gggggcccac cgtcgaacgg cggccgagca 840
ccaccagctg cgtccgctgc cgcggcagtt cagccgcggc cgatcacatt caatccgtgg 900
gctgccgtca tgcctagtca gcagcagcag cagctgcacc ggccgttcga tgctattatg 960
cattcgagat ga 972
<210> 123
<211> 864
<212> DNA
<213> 巨桉
<400> 123
atgatggtgg agagggaaga tctgggcttg tctctgagct tgagcttctc tgacagcagt 60
cggccttccc agctcggcgc ctctcctttc gggttcaacc tctacaagcc atctcaccgc 120
gactgcgaga ccttcgcttc attagatcgg atctcggagg cggatgcgcg gccgtccctg 180
cggggcatcg acgtgaaccg gccgccgccg tcggcggcgg actgcgagga gcaggaggag 240
gcgggggtgt cgtccccgaa cagcactatc tcgagcgtca gcgggaagag gggcgagagg 300
gagatggtca gcggcgggga ggacaacgag gcggagaggg actgcagccg cggaggcagc 360
gacgaggagg acggcgagaa ctcgaggaag aagctgaggc tgtccaagga tcagtcggcc 420
gtcttggagg agagcttccg agagcacaac actctgaatc ccaagcaaaa gctggcgttg 480
gctaagcagc taggcctgcg acctagacaa gtagaagtct ggtttcagaa ccgcagagca 540
cggaccaagt tgaagcagac ggagatagac tgcgagttcc tgaagaggtg ctgcgagaac 600
ctgacggagg agaaccggcg gctgcagaag gaggtccagg agctgcgcgc tctcaagctc 660
tcccctcagt tctacatgca catgccccct cccaccaccc ttaccgtctg ccccaactgc 720
gagcgcgtcg gggcggccgc accgccgctc ccatccgccg gcggcggcgg caggcccgcc 780
caccatcggg agccggtgcc catgatccca tgggccgcgc ggcccggccc ggtctcgcac 840
ggggctctcc ggcccaggac gtga 864
<210> 124
<211> 864
<212> DNA
<213> 甜橙
<400> 124
atgggcgaga aggatgacgg attgggtttg agtctaagct tgggatgtgc tgcaagaaat 60
gaaccttctt tgaggttgaa tcacatgcct ttgtcttctt cacaatccat gcaaaatcat 120
cataaaagaa gcccttggac tgagctgttc cattcgtccg atcgaaactc agatacaaga 180
tcattcctta gaggaataga tgtgaatcag gcaccaacag tggcagattg cgaggaagaa 240
aatggggttt catcaccaaa cagcactgtt tctagcataa gtggaaagag gagtgagaga 300
gagcccattg gagatgagac tgaggctgaa agagcgtctt gctctcgcgg cagtgacgac 360
gaagacggtg gcgctggtga tgcatcaaga aagaagctga gattgtcgaa agaacagtct 420
ttgttgcttg aagagacctt caaagagcat agcactctca atcctaagca aaagttggct 480
ttggcaaagc agttgaatct taggcctaga caagtagaag tgtggtttca gaacagaagg 540
gcaaggacaa agttgaagca aacagaggtt gattgtgagt acttaaagag atgctgcgag 600
aatctaacgg aggagaacag gagattgcag aaggaagtgc aagagcttag atcattgaag 660
ctttctcctc aactctacat gaatatgaat cctcccacga cactcacaat gtgtccctcc 720
tgtgagcgtg tggctgtatc atcgtcgtcg tcgtcatcct ctgctgctgc caacggcacc 780
acccgtctcc ccattggtcc taaccatcaa cgactgactc cagtgagccc ttgggcagca 840
ttaccaatcc accaccggtc gtaa 864
<210> 125
<211> 918
<212> DNA
<213> 高山南芥
<400> 125
atgggtgaga gagatgatgg attggggtta agtttgagct tgggattagg gtttaatcaa 60
aaggagcaat ctccgaggtt aaatccaatg cagtttggtt cttattcttc ttcgtcttca 120
cacatgcata tgcagagcaa tcatattaac cattctcaaa agattcagaa tagttggact 180
cacatgtttc aatcttcaga gagaaactct gacgtgagat catttctccg ggggattgac 240
gtgaacagag caccatcaac ggtggtggtt gacgtggagg aagacgccgg agtgtcgtct 300
ccgaacagca ccgtttcgag cgtgatgagt gggaagagaa acgagcgagt tgccacggtg 360
gtcggaggag gaggagttat agaagatcac gacgtggaga gagcttcttc ctcgcttggt 420
ggtggtagtg atgatgaaga cggtggtgga aatggagacg acggttctag gaagaaacta 480
cggttgtcta aagaacaagc tttggttctt gaagaaactt ttaaagaaca tagcactctt 540
aatccgaagc aaaagatggc tttggctaaa caattgaatc tgaggacaag gcaagttgaa 600
gtgtggttcc aaaaccgaag ggcaaggacg aagctgaagc aaacggaagt ggattgtgaa 660
tatctaaaaa gatgttgtga gaatctaacg gaagagaatc ggagattgca aaaggaagtg 720
agtgagctta gggctttaaa gctttcacct catttataca tgcacatgaa acctcccact 780
acactcacaa tgtgtccttc gtgtgagcga gtcgctgcta catcgtcatc ttcctcggtg 840
gctcctcctg cgatgaattc gtcgtcgccg tgggctgcga ttcctctccg gcaacgacct 900
gctgctggtt ctcattag 918
<210> 126
<211> 885
<212> DNA
<213> 黄瓜
<400> 126
atgggcggga gagatgatga cgtgggactc actttgagtt taggttttgg tgttacgact 60
cagtccactc acatgcaaag gccgtcgtcg atgcataatc accacctccg caagactcat 120
tggaacgagc tttttcaatt ttctgatcga aacgccgatt cgaggtcgtt tcttagagga 180
atcgacgtga atcggttgcc gacgggcgtg gacggcgagg aagagaacgg cgtttcatct 240
ccgaacagta cgatttctag cattagtgga aagagaagcg agagagaagc ggctggagac 300
gaggcggagg cggaggctga ggcggaggct gaagcggaag cggaagcgga agccgaaaga 360
gcctcgtgct cgcgagggag tgatgatgaa gacggcggag gcggggacgg tgacgcgtcg 420
agaaagaagc tgaggctatc gaaggaacag tcaatggttc ttgaagagac gttcaaagag 480
cacaatacgc tgaatcctaa gcaaaagctg gcacttgcaa agcagctgaa tctgacacca 540
agacaagtgg aggtgtggtt tcaaaacaga agggcaagga ccaaattgaa gcaaacagaa 600
gtggattgtg agtacttgaa gaggtgctgt gagaatctaa cagaggaaaa caggaggcta 660
cagaaggagg tgcaagagtt gagagcactc aagctttctc cacagcttta tatgcacatg 720
aatcctccta ccaccctcac catgtgccct caatgtgagc gtgtggcggt ttcttcatct 780
tcttcgacct cagctgctac caccactcgc catcaagcag cagctggtgt gcagcgtccc 840
tctatggcca tcaacccgtg ggcagtgttg ccgattcaac gttga 885
<210> 127
<211> 906
<212> DNA
<213> 雷蒙德氏棉
<400> 127
atgatggtgg gaaaagaaga tctgggtttg agtcttagtt tgggttttcc tcagaatcac 60
cactccttgc agctgaatct aaggccttct ttgcttcctt cctccgttga ttcttgctct 120
tcggtccctt ctgggtttac agcctttcac aaatcgtcgt ggaacgatgt ttctgctcct 180
tcagatccta acgcagaatc tttccgaggc gagactagat catttcttag aggaatcgac 240
gtgaacagat tgccatctac ggtcgactgc gaagaagaag ctggagtttc atctccgaac 300
agcacgatat cgagtgtgag tgggaaaagg agcgaaaggg aaggcactaa tggagatgag 360
cttgatattg aaagagcttg ttctcgtggc atcagtgacg aggaagatgg tgacgcttcg 420
agaaaaaaac ttagactttc gaaggatcag tctgctattc ttgaagaaag ctttaaagaa 480
cacaacactc tgaacccaaa acaaaagatg gctttggcta agcagctggg attgcgaccc 540
agacaagttg aagtttggtt ccaaaacaga agggcgagga ccaagctgaa gcaaactgag 600
gttgactgtg agttcctaaa gagatgctgt gagaatctga cggaggaaaa caggcggttg 660
cagaaggaag ttcaggagct gagagcactg aaactttccc ctcagttcta catgcaaatg 720
accccaccta ccaccctcac catgtgccca tcgtgtgaga gagtgggtgc atcatccacc 780
gttgatccaa gatcccatca tcaactaccc caaacccacc acagggccat ccccatcaac 840
ccttgggctc cggctgctgc cccaatccct catggaccgt tcgatgctct tcggcctcaa 900
tcgtaa 906
<210> 128
<211> 678
<212> DNA
<213> 二穗短柄草
<400> 128
atgatggaga gggccgagga cttggggctc agtctcagtc tcagctcatc acttgctcct 60
cgcactcacc atgtctccaa gctgttccat gcgccagaga ggagattcat ggagatgccg 120
ttgctccccg caaagaggag tagcgaggct gctggcgacg attcaagcct acttggcggc 180
agcgacgagg aggacggtgg ctgcggtgta gacggctccc gcaagaagct ccggttgtcc 240
aaagaccagt ccgccgtgct ggaggacagc ttccgggagc acccgactct aaacccgagg 300
cagaaggcag cgttggcgca gcagctcggg ctgcggtcgc ggcaggttga ggtgtggttc 360
cagaatagac gcgccaggac gaagctgaag cagacggagg tggactgcga gttcctgaag 420
cgctgctgcg agacgctgac cgaggagaac cggcggctgc agaaggaggt gcaggagctc 480
cgggcgctca agctcgtctc cccgcgccac tacatgcaca tgtccccgcc caccacgctc 540
accatgtgcc cctcctgcga gcgcgtctcc aacaagaaca acaacaacaa taacaacaac 600
agctccgctg ccgccgaccg ccgcggcgac gtcgcaatct gccaccgccc gatcgccgtc 660
cggccgcagc agtcatga 678
<210> 129
<211> 954
<212> DNA
<213> 大豆
<400> 129
atgggtgaga aagatgatgg cttgggtttg gggttgagtt tgaagttagg atggggagaa 60
aataatgata acaataataa tcaacaacaa caccctttca acgtgcacaa gcctcctcaa 120
tcggttccaa accaaagggt ttccgtcaat agcttgttcc attttcatga cgaaaatcat 180
gcaatgagga acacagatcg gagctccgag atgcggtcgt tcttccgcgg aatagacgtg 240
aatttgccac cgcccccgcc ttcggcggct ctggcggcgt tcgatgacga gaacggggtg 300
tcctcgccga acagcacgat atcgagcatc agcgggaagc ggagcgagag agagggaaac 360
ggagaggaga acgagagaac gtcgagttct cgcggcggcg gcggaagcga cgacgatgaa 420
ggcggcgcgt gtggtggaga cgccgacgcc gatgcgtcga ggaagaagct gaggttgtct 480
aaggaacagg ccttggtgct ggaagaaaca ttcaaggaac acaatactct gaacccgaag 540
caaaagcaag ctttggcaaa gcagttgaat ttgatgccta ggcaggtgga ggtgtggttt 600
caaaacagaa gagcaaggac caaattgaag cagactgaag tggattgtga atatttgaag 660
aggtgctgtg agaatctaac tgaagagaat aggaggcttc aaaaggaagt gcaagagctc 720
agggcattga agttatcccc acatctttac atgcaaatga accctcccac cactctcaca 780
atgtgccctt catgtgagcg tgttgctgtc tcatccgcat cctcttcctc atcggccacc 840
atgccctctg ccctgcctcc agctaatctc aacccggtgg gccctaccat ccagcggcca 900
atgcccgtca acccttgggc agcaatgttg aatcagcacc gtggccggcc ataa 954
<210> 130
<211> 960
<212> DNA
<213> 桃
<400> 130
atgatggttg agagagatca agatttgggt ttgagtctga gcttgagttt tcctcagacc 60
cacaaccacc acaacaacaa caacaacaac agcagcagca ccaccagcac ccttcagctc 120
aatctcatgc cttctttggc ccctacttct gcttcttctc cttctgggtt tcttcctcaa 180
aaaccctctt ggaatgaggc cttgatttct tcagatcgaa actccaactc cgaaacgttc 240
cgggtcgggc cccgatcgtt ccttcggggc atcgacgtga accggttgcc ttcaacgggc 300
gactgcgaag acgaggcggg cgtgtcgtcg cccaacagca cggtgtcgag cgtgagcggc 360
aagcggagcg agagagaggc caatggcgaa gatctcgaca tcgagactcg aggcatcagc 420
gatgaagaag acggcgagac ctctagaaag aagctcaggc tctccaagga ccagtccgcc 480
attctcgaag agagcttcaa ggagcacaac actctcaacc caaagcaaaa gttggcgttg 540
gctaaacagc ttggcctccg gcctagacaa gtggaagtct ggtttcagaa cagaagagca 600
aggactaagt tgaagcaaac ggaggtggac tgtgagttct tgaagaggtg ctgtgagaat 660
ctgacagagg agaacaggcg gttgcagaag gaggttcagg agctgagagc actgaaactt 720
tccccacagt tctacatgca aatgacccca cccacgacac tcaccatgtg cccctcgtgt 780
gagcgtgtcg cggtcccacc caactcctca tcctcaaccg tcgagccccg gccccacccc 840
cacccccacc cccaaatggg ttcggtccag acccggcccg tccccatcaa cccgtgggca 900
tccgccaccc caatccccca ccggccgctg ccgttcgaag ccttccacac ccggacgtaa 960
<210> 131
<211> 897
<212> DNA
<213> 毛果杨
<400> 131
atgggtgata aaaatgatgg actgggcttg agtttgagct tgggattcga tgctacacaa 60
caaaatcatc aacagcagcc ttctttgaag ctaaatctca tgcccgtacc ttcacaaaac 120
aatcatagaa aaacttcctt gactgacctc tttcaatcat cagatagagc atgtggtacg 180
aggttttttc aacgaggaat tgacatgaac agggtgccag ctgcagtgac agattgtgat 240
gacgaaactg gggtttcttc accaaacagt acgctatcca gcttaagtgg taaaagaagc 300
gaaagagaac agattggaga agaaacagaa gcggagaggg cctcttgctc tcgtgacagt 360
gatgatgaag atggtgctgg tggtgatgct tctaggaaga agctgagact ctcaaaggaa 420
cagtctttag tgcttgaaga gactttcaag gaacataata ctcttaatcc caaggagaag 480
ctggccttgg caaagcagtt gaatctcagg cctaggcaag tggaggtgtg gtttcagaac 540
cgaagagcaa ggactaagtt gaagcaaact gaagtcgatt gcgagtacct aaagaggtgc 600
tgtgaaaatc taacagagga gaacaggagg ttacagaagg aggtgcaaga gcttagagca 660
ctgaaacttt cccctcagct ctacatgcac atgaaccctc ccaccaccct caccatgtgc 720
ccttcatgcg agcgagttgc tgtctcgtca gcctcatcat cttctgctgc tgccgcgtcc 780
tctgctcttg ctccaactgc ctcaacccgc caaccacaac gacccgtgcc cattaaccct 840
tgggcaacaa tgcccgtcca ccaacgaact tttgatgctc ctgcttccag gtcatga 897
<210> 132
<211> 684
<212> DNA
<213> 玉米
<400> 132
atgatggaga gggtcgagga cttagggctc agcctcagcc tcagctcgtc cctcgcgtct 60
cctcgaactc accatgtcgc caccatgctg ctacgcgctc cagagaagag gttcctggag 120
atgccactgc tgctgcccgc gaagcggacg accgaggtca ccggcgagga tggcctgcga 180
ggcggcagcg acgaggagga cggcggctgc ggcatcgacg gctccaggaa gaagctccgg 240
ctgtccaagg accagtccgc cgtgctcgag gatagcttcc gggagcaccc aactctcaac 300
cctcggcaga aggcagcctt ggcgcagcag ctaggcctgc ggccccgcca ggtggaggtg 360
tggttccaga acaggcgcgc caggacgaag ctgaagcaga cggaggtgga ctgcgagtac 420
ctgaagcgct gctgcgagac gctgacggag gagaaccggc ggctgcagaa ggaggtgcag 480
gagctccgcg cgctcaagct cgtgtcgccg cacctctaca tgcacatgtc cccgcccacc 540
accctcacca tgtgcccctc ctgcgagcgc gtctcctcgt ccaacggcaa ctccgcagct 600
gccacggccg ccgcgcgcgc gcgcgccggc gccggcgccg gcgccatcgt ctgccacccg 660
atcgaccgag ccactagtac gtag 684
<210> 133
<211> 714
<212> DNA
<213> 粟
<400> 133
atgatggaga gggccgagga cttagggctc agcctcagcc tcagctcgtc gctcgccgct 60
cctcgcactc accatgtctc cgccatgctg ctccgctctc cagagaagag gttcctggag 120
atgccactgc taccggcaaa gcggagcgag gtcacggctg aggagggcct gctgcgcggc 180
ggcagcgacg aggaggacgg cagctgcggc atcgacggct ccaggaagaa gctccggctt 240
tccaaggacc agtcggccgt gctcgaggac agcttccggg agcaccccac tctgaaccct 300
cgtcagaagg cagccttggc gcagcagctc ggcctgcggc cccggcaggt ggaggtgtgg 360
ttccagaaca gacgcgcgag gacgaagctg aagcaaacgg aggtggactg cgagttcctg 420
aagcgctgct gcgagacact gacggaggag aaccggcggc tgcagaagga ggtgcaggag 480
ctccgcgcgc tcaagctcgt ctcgccgcac ctctatatgc acatgtcccc gcccaccacc 540
ctcaccatgt gcccctcctg cgagcgcgtc tcctccagcg gcgccaactc caccggcgcc 600
gcggcgtcgt cagaccgacg cgccggcggc gccatcatca gcacggccgc cgccgccgcc 660
gaaggcgccg ccatctgcca ccgcccgatc gccgtccggc cgcagcagtc atga 714
<210> 134
<211> 891
<212> DNA
<213> 蒺藜苜蓿
<400> 134
atgagtattg aaaaggaaga ttttggtttg agcctaagtt tgagctttcc tcaaaatcca 60
ccaaatcctc aataccttaa tcttatgtct tcttcaactc attcatattc tccttctact 120
ttcaatcctc aaaaaccttc ttggaatgat gtttttactt cttcagatcg ggattcggag 180
acatgcagaa tcgaagaacg tcctttaatt ctccgaggaa tcgatgtgaa tcggttacct 240
tcaggtgctg attgtgaaga agaagcagga gtttcatcac caaacagcac cgtttcaagt 300
gtgagtggta aaagaagcga aagagaagtt accggtgaag atcttgacat ggaaagagat 360
tgttcaagag gaatcagtga tgaagaagac gctgaaactt caaggaaaaa acttagactc 420
accaaagacc aatcaatcat tctcgaagag agtttcaaag aacacaacac tcttaatccc 480
aaacaaaaat tggcacttgc aaaacaattg ggacttcgtg ctagacaagt tgaagtttgg 540
tttcaaaatc gtagagcaag gactaagttg aagcaaacag aggtagattg tgaatttttg 600
aaaagatgtt gtgagaatct aacggatgaa aatagacggt tgcaaaaaga agtgcaagag 660
ttaagagcat tgaaactttc cccacaattc tacatgcaaa tgacaccacc aacaacactt 720
accatgtgcc cctcttgtga gcgtgtcgct gttccatcat ctgccgttga tgctgccacg 780
cgtcgtcatc ctatggcttc aaatcaccct cgtacgtttt ccgtgggacc atgggccaca 840
gctgctccaa tccaacatag gacctttgat acactccgtc ctagatctta a 891
<210> 135
<211> 948
<212> DNA
<213> 拟南芥
<400> 135
atgagtgaaa gagatgatgg attggggcta agtttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgaggtt aaatccaatg cctctggctt cttatgcatc ttcatcacac 120
atgcagcata tgcagcagag caattataac catcctcaaa agattcagaa cacttggatt 180
aacatgtttc agtcatcaga gagaaactcg gacatgagat cgtttctccg gggaatagac 240
gtgaacagag ctccatcgac ggtggtggtt gacgtggagg atgaaggcgc cggagtttcg 300
tctccgaaca gcaccgtctc aagcgtgatg agcgggaaga agagcgagcg agagctaatg 360
gctgcggcag gtgcagttgg aggaggtaga gtagaagata atgagattga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga tgacagttcg 480
aggaagaaac tccgattgtc taaagaacaa gctttggttc ttgaagaaac ttttaaagaa 540
catagtacac tcaatccgaa gcaaaagatg gctttggcta agcagttgaa tctgaggacg 600
agacaagttg aagtgtggtt ccaaaaccga aggcaaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa cggatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggcttta aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac aatgtgtcct tcttgcgagc gagtcgctgt tacgtcatct 840
ccgtcatcgg tggctcctcc tgtgatgaat tcatcgtctc cgatgggtcc gatgagtccg 900
tgggctgcca tgcctctacg gcaacgacct gctgctggtt ctcattag 948
<210> 136
<211> 948
<212> DNA
<213> 拟南芥
<400> 136
atgagtgaaa gagatgatgg attggggcta agtttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgaggtt aaatccaatg cctctggctt cttatgcatc ttcatcacac 120
atgcagcata tgcagcagag caattataac catcctcaaa agattcagaa cacttggatt 180
aacatgtttc agtcatcaga gagaaactcg gacatgagat cgtttctccg gggaatagac 240
gtgaacagag ctccatcgac ggtggtggtt gacgtggagg atgaaggcgc cggagtttcg 300
tctccgaaca gcaccgtctc aagcgtgatg agcgggaaga agagcgagcg agagctaatg 360
gctgcggcag gtgcagttgg aggaggtaga gtagaagata atgagattga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga tgacagttcg 480
aggaagaaac tccgattgtc taaagaacaa gctttggttc ttgaagaaac ttttaaagaa 540
catagtacac tcaatccgaa gcaaaagatg gctttggcta agcagttgaa tctgaggacg 600
agacaagttg aagtgtggtt ccaaaaccga aggcaaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa cggatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggcttta aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac aatgtgtcct tcttgcgagc gagtcgctgt tacgtcatct 840
ccgtcatcgg tggctcctcc tgtgatgaat tcatcgtctc cgatgggtcc gatgagtccg 900
tgggctgcca tgcctctacg gcaacgacct gctgctggtt ctcattag 948
<210> 137
<211> 936
<212> DNA
<213> 亚洲栽培稻
<400> 137
atggagatga tggttcatgg gaggagagac gagcagtatg gcgggctcag gctcgggctt 60
gggcttgggc tcagcctcgg cgtcgccggt ggtgcagccg acgacgagca gccgccgccg 120
cgccgtggtg ccgccccgcc gccgcagcag cagctgtgcg gctggaacgg cggcggtctc 180
ttctcctcgt cttcctccga tcatcggggg aggtcggcga tgatggcgtg ccacgacgtc 240
atcgagatgc cgttcctgcg ggggatcgac gtgaaccgtg cgccggcggc agagacgacc 300
acgacgacgg cgagggggcc cagctgcagc gaggaagacg aggagcccgg cgcgtcctcc 360
cccaacagca cgctctccag cctcagcggc aagcgcggcg caccatctgc cgccaccgcc 420
gccgccgccg ccgccagcga cgacgaggac tccggcggcg gatcccgcaa gaagctccgc 480
ctctccaagg accaagccgc cgtcctcgag gacaccttca aagagcacaa caccctcaat 540
cccaagcaga aggcggcgct ggcgaggcag ctgaatctga agccgcggca ggtggaggtg 600
tggttccaga acaggagggc gaggacgaag ctgaagcaga cggaggtgga ctgcgagctg 660
ctcaagcgct gctgcgagac gctcaccgac gagaaccgcc gcctccaccg cgagctccag 720
gagctccgcg ccctcaagct cgccaccgcc gccgccgcgc cgcaccacct ctacggcgcc 780
cgcgtcccgc cgcccaccac cctcaccatg tgcccctcct gcgagcgcgt cgcctccgca 840
gccaccacca cccgcaacaa ctccggcgcc gcccccgcgc ggccggtgcc cacccgcccg 900
tggccgccgg cggcggcgca gaggtcgtcg gcgtag 936
<210> 138
<211> 948
<212> DNA
<213> 拟南芥
<400> 138
atgagtgaaa gagatgatgg attggggcta agtttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgaggtt aaatccaatg cctctggctt cttatgcatc ttcatcacac 120
atgcagcata tgcagcagag caattataac catcctcaaa agattcagaa cacttggatt 180
aacatgtttc agtcatcaga gagaaactcg gacatgagat cgtttctccg gggaatagac 240
gtgaacagag ctccatcgac ggtggtggtt gacgtggagg atgaaggcgc cggagtttcg 300
tctccgaaca gcaccgtctc aagcgtgatg agcgggaaga agagcgagcg agagctaatg 360
gctgcggcag gtgcagttgg aggaggtaga gtagaagata atgagattga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga tgacagttcg 480
aggaagaaac tccgattgtc taaagaacaa gctttggttc ttgaagaaac ttttaaagaa 540
catagtacac tcaatccgaa gcaaaagatg gctttggcta agcaattgaa tctgaggacg 600
agacaagttg aagtgtggtt ccaaaaccga agggcaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa cggatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggcttta aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac aatgtgtcct tcttgcgagc gagtcgctgt tacgtcatct 840
tcgtcatcgg tggctcctcc tgtgatgaat tcatcgtctc cgatgggtcc gatgagtccg 900
tgggctgcca tgcctctacg gcaacgacct gctgctggtt ctcattag 948
<210> 139
<211> 948
<212> DNA
<213> 拟南芥
<400> 139
atgagtgaaa gagatgatgg attggggcta agtttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgaggtt aaatccaatg cctctggctt cttatgcatc ttcatcacac 120
atgcagcata tgcagcagag caattataac catcctcaaa agattcagaa cacttggatt 180
aacatgtttc agtcatcaga gagaaactcg gacatgagat cgtttctccg gggaatagac 240
gtgaacagag ctccatcgac ggtggtggtt gacgtggagg atgaaggcgc cggagtttcg 300
tctccgaaca gcaccgtctc aagcgtgatg agcgggaaga agagcgagcg agagctaatg 360
gctgcggcag gtgcagttgg aggaggtaga gtagaagata atgagattga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga tgacagttcg 480
aggaagaaac tccgattgtc taaagaacaa gctttggttc ttgaagaaac ttttaaagaa 540
catagtacac tcaatccgaa gcaaaagatg gctttggcta agcaattgaa tctgaggacg 600
agacaagttg aagtgtggtt ccaaaaccga agggcaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa cggatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggcttta aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac aatgtgtcct tcttgcgagc gagtcgctgt tacgtcatct 840
tcgtcatcgg tggctcctcc tgtgatgaat tcatcgtctc cgatgggtcc gatgagtccg 900
tgggctgcca tgcctctacg gcaacgacct gctgctggtt ctcattag 948
<210> 140
<211> 936
<212> DNA
<213> 亚洲栽培稻
<400> 140
atggagatga tggttcatgg gaggagagac gagcagtatg gcgggctcag gctcgggctt 60
gggcttgggc tcagcctcgg cgtcgccggt ggtgcagccg acgacgagca gccgccgccg 120
cgccgtggtg ccgccccgcc gccgcagcag cagctgtgcg gctggaacgg cggcggtctc 180
ttctcctcgt cttcctccga tcatcggggg aggtcggcga tgatggcgtg ccacgacgtc 240
atcgagatgc cgttcctgcg ggggatcgac gtgaaccgtg cgccggcggc agagacgacc 300
acgacgacgg cgagggggcc cagctgcagc gaggaagacg aggagcccgg cgcgtcctcc 360
cccaacagca cgctctccag cctcagcggc aagcgcggcg caccatctgc cgccaccgcc 420
gccgccgccg ccgccagcga cgacgaggac tccggcggcg gatcccgcaa gaagctccgc 480
ctctccaagg accaagccgc cgtcctcgag gacaccttca aagagcacaa caccctcaat 540
cccaagcaga aggcggcgct ggcgaggcag ctgaatctga agccgcggca ggtggaggtg 600
tggttccaga acaggagggc gaggacgaag ctgaagcaga cggaggtgga ctgcgagctg 660
ctcaagcgct gctgcgagac gctcaccgac gagaaccgcc gcctccaccg cgagctccag 720
gagctccgcg ccctcaagct cgccaccgcc gccgccgcgc cgcaccacct ctacggcgcc 780
cgcgtcccgc cgcccaccac cctcaccatg tgcccctcct gcgagcgcgt cgcctccgca 840
gccaccacca cccgcaacaa ctccggcgcc gcccccgcgc ggccggtgcc cacccgcccg 900
tggccgccgg cggcggcgca gaggtcgtcg gcgtag 936
<210> 141
<211> 891
<212> DNA
<213> 蒺藜苜蓿
<400> 141
atgagtattg aaaaggaaga ttttggtttg agcctaagtt tgagctttcc tcaaaatcca 60
ccaaatcctc aataccttaa tcttatgtct tcttcaactc attcatattc tccttctact 120
ttcaatcctc aaaaaccttc ttggaatgat gtttttactt cttcagatcg ggattcggag 180
acatgcagaa tcgaagaacg tcctttaatt ctccgaggaa tcgatgtgaa tcggttacct 240
tcaggtgctg attgtgaaga agaagcagga gtttcatcac caaacagcac cgtttcaagt 300
gtgagtggta aaagaagcga aagagaagtt accggtgaag atcttgacat ggaaagagat 360
tgttcaagag gaatcagtga tgaagaagac gctgaaactt caaggaaaaa acttagactc 420
accaaagacc aatcaatcat tctcgaagag agtttcaaag aacacaacac tcttaatccc 480
aaacaaaaat tggcacttgc aaaacaattg ggacttcgtg ctagacaagt tgaagtttgg 540
tttcaaaatc gtagagcaag gactaagttg aagcaaacag aggtagattg tgaatttttg 600
aaaagatgtt gtgagaatct aacggatgaa aatagacggt tgcaaaaaga agtgcaagag 660
ttaagagcat tgaaactttc cccacaattc tacatgcaaa tgacaccacc aacaacactt 720
accatgtgcc cctcttgtga gcgtgtcgct gttccatcat ctgccgttga tgctgccacg 780
cgtcgtcatc ctatggcttc aaatcaccct cgtacgtttt ccgtgggacc atgggccaca 840
gctgctccaa tccaacatag gacctttgat acactccgtc ctagatctta a 891
<210> 142
<211> 948
<212> DNA
<213> 拟南芥
<400> 142
atgagtgaaa gagatgatgg attggggcta agtttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgaggtt aaatccaatg cctctggctt cttatgcatc ttcatcacac 120
atgcagcata tgcagcagag caattataac catcctcaaa agattcagaa cacttggatt 180
aacatgtttc agtcatcaga gagaaactcg gacatgagat cgtttctccg gggaatagac 240
gtgaacagag ctccatcgac ggtggtggtt gacgtggagg atgaaggcgc cggagtttcg 300
tctccgaaca gcaccgtctc aagcgtgatg agcgggaaga agagcgagcg agagctaatg 360
gctgcggcag gtgcagttgg aggaggtaga gtagaagata atgagattga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga tgacagttcg 480
aggaagaaac tccgattgtc taaagaacaa gctttggttc ttgaagaaac ttttaaagaa 540
catagtacac tcaatccgaa gcaaaagatg gctttggcta agcaattgaa tctgaggacg 600
agacaagttg aagtgtggtt ccaaaaccga agggcaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa cggatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggcttta aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac aatgtgtcct tcttgcgagc gagtcgctgt tacgtcatct 840
tcgtcatcgg tggctcctcc tgtgatgaat tcatcgtctc cgatgggtcc gatgagtccg 900
tgggctgcca tgcctctacg gcaacgacct gctgctggtt ctcattag 948
<210> 143
<211> 891
<212> DNA
<213> 蒺藜苜蓿
<400> 143
atgagtattg aaaaggaaga ttttggtttg agcctaagtt tgagctttcc tcaaaatcca 60
ccaaatcctc aataccttaa tcttatgtct tcttcaactc attcatattc tccttctact 120
ttcaatcctc aaaaaccttc ttggaatgat gtttttactt cttcagatcg ggattcggag 180
acatgcagaa tcgaagaacg tcctttaatt ctccgaggaa tcgatgtgaa tcggttacct 240
tcaggtgctg attgtgaaga agaagcagga gtttcatcac caaacagcac cgtttcaagt 300
gtgagtggta aaagaagcga aagagaagtt accggtgaag atcttgacat ggaaagagat 360
tgttcaagag gaatcagtga tgaagaagac gctgaaactt caaggaaaaa acttagactc 420
accaaagacc aatcaatcat tctcgaagag agtttcaaag aacacaacac tcttaatccc 480
aaacaaaaat tggcacttgc aaaacaattg ggacttcgtg ctagacaagt tgaagtttgg 540
tttcaaaatc gtagagcaag gactaagttg aagcaaacag aggtagattg tgaatttttg 600
aaaagatgtt gtgagaatct aacggatgaa aatagacggt tgcaaaaaga agtgcaagag 660
ttaagagcat tgaaactttc cccacaattc tacatgcaaa tgacaccacc aacaacactt 720
accatgtgcc cctcttgtga gcgtgtcgct gttccatcat ctgccgttga tgctgccacg 780
cgtcgtcatc ctatggcttc aaatcaccct cgtacgtttt ccgtgggacc atgggccaca 840
gctgctccaa tccaacatag gacctttgat acactccgtc ctagatctta a 891
<210> 144
<211> 936
<212> DNA
<213> 亚洲栽培稻
<400> 144
atggagatga tggttcatgg gaggagagac gagcagtatg gcgggctcag gctcgggctt 60
gggcttgggc tcagcctcgg cgtcgccggt ggtgcagccg acgacgagca gccgccgccg 120
cgccgtggtg ccgccccgcc gccgcagcag cagctgtgcg gctggaacgg cggcggtctc 180
ttctcctcgt cttcctccga tcatcggggg aggtcggcga tgatggcgtg ccacgacgtc 240
atcgagatgc cgttcctgcg ggggatcgac gtgaaccgtg cgccggcggc agagacgacc 300
acgacgacgg cgagggggcc cagctgcagc gaggaagacg aggagcccgg cgcgtcctcc 360
cccaacagca cgctctccag cctcagcggc aagcgcggcg caccatctgc cgccaccgcc 420
gccgccgccg ccgccagcga cgacgaggac tccggcggcg gatcccgcaa gaagctccgc 480
ctctccaagg accaagccgc cgtcctcgag gacaccttca aagagcacaa caccctcaat 540
cccaagcaga aggcggcgct ggcgaggcag ctgaatctga agccgcggca ggtggaggtg 600
tggttccaga acaggagggc gaggacgaag ctgaagcaga cggaggtgga ctgcgagctg 660
ctcaagcgct gctgcgagac gctcaccgac gagaaccgcc gcctccaccg cgagctccag 720
gagctccgcg ccctcaagct cgccaccgcc gccgccgcgc cgcaccacct ctacggcgcc 780
cgcgtcccgc cgcccaccac cctcaccatg tgcccctcct gcgagcgcgt cgcctccgca 840
gccaccacca cccgcaacaa ctccggcgcc gcccccgcgc ggccggtgcc cacccgcccg 900
tggccgccgg cggcggcgca gaggtcgtcg gcgtag 936
<210> 145
<211> 936
<212> DNA
<213> 亚洲栽培稻
<400> 145
atggagatga tggttcatgg gaggagagac gagcagtatg gcgggctcag gctcgggctt 60
gggcttgggc tcagcctcgg cgtcgccggt ggtgcagccg acgacgagca gccgccgccg 120
cgccgtggtg ccgccccgcc gccgcagcag cagctgtgcg gctggaacgg cggcggtctc 180
ttctcctcgt cttcctccga tcatcggggg aggtcggcga tgatggcgtg ccacgacgtc 240
atcgagatgc cgttcctgcg ggggatcgac gtgaaccgtg cgccggcggc agagacgacc 300
acgacgacgg cgagggggcc cagctgcagc gaggaagacg aggagcccgg cgcgtcctcc 360
cccaacagca cgctctccag cctcagcggc aagcgcggcg caccatctgc cgccaccgcc 420
gccgccgccg ccgccagcga cgacgaggac tccggcggcg gatcccgcaa gaagctccgc 480
ctctccaagg accaagccgc cgtcctcgag gacaccttca aagagcacaa caccctcaat 540
cccaagcaga aggcggcgct ggcgaggcag ctgaatctga agccgcggca ggtggaggtg 600
tggttccaga acaggagggc gaggacgaag ctgaagcaga cggaggtgga ctgcgagctg 660
ctcaagcgct gctgcgagac gctcaccgac gagaaccgcc gcctccaccg cgagctccag 720
gagctccgcg ccctcaagct cgccaccgcc gccgccgcgc cgcaccacct ctacggcgcc 780
cgcgtcccgc cgcccaccac cctcaccatg tgcccctcct gcgagcgcgt cgcctccgca 840
gccaccacca cccgcaacaa ctccggcgcc gcccccgcgc ggccggtgcc cacccgcccg 900
tggccgccgg cggcggcgca gaggtcgtcg gcgtag 936
<210> 146
<211> 936
<212> DNA
<213> 亚洲栽培稻
<400> 146
atggagatga tggttcatgg gaggagagac gagcagtatg gcgggctcag gctcgggctt 60
gggcttgggc tcagcctcgg cgtcgccggt ggtgcagccg acgacgagca gccgccgccg 120
cgccgtggtg ccgccccgcc gccgcagcag cagctgtgcg gctggaacgg cggcggtctc 180
ttctcctcgt cttcctccga tcatcggggg aggtcggcga tgatggcgtg ccacgacgtc 240
atcgagatgc cgttcctgcg ggggatcgac gtgaaccgtg cgccggcggc agagacgacc 300
acgacgacgg cgagggggcc cagctgcagc gaggaagacg aggagcccgg cgcgtcctcc 360
cccaacagca cgctctccag cctcagcggc aagcgcggcg caccatctgc cgccaccgcc 420
gccgccgccg ccgccagcga cgacgaggac tccggcggcg gatcccgcaa gaagctccgc 480
ctctccaagg accaagccgc cgtcctcgag gacaccttca aagagcacaa caccctcaat 540
cccaagcaga aggcggcgct ggcgaggcag ctgaatctga agccgcggca ggtggaggtg 600
tggttccaga acaggagggc gaggacgaag ctgaagcaga cggaggtgga ctgcgagctg 660
ctcaagcgct gctgcgagac gctcaccgac gagaaccgcc gcctccaccg cgagctccag 720
gagctccgcg ccctcaagct cgccaccgcc gccgccgcgc cgcaccacct ctacggcgcc 780
cgcgtcccgc cgcccaccac cctcaccatg tgcccctcct gcgagcgcgt cgcctccgca 840
gccaccacca cccgcaacaa ctccggcgcc gcccccgcgc ggccggtgcc cacccgcccg 900
tggccgccgg cggcggcgca gaggtcgtcg gcgtag 936
<210> 147
<211> 948
<212> DNA
<213> 拟南芥
<400> 147
atgagtgaaa gagatgatgg attggggcta agtttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgaggtt aaatccaatg cctctggctt cttatgcatc ttcatcacac 120
atgcagcata tgcagcagag caattataac catcctcaaa agattcagaa cacttggatt 180
aacatgtttc agtcatcaga gagaaactcg gacatgagat cgtttctccg gggaatagac 240
gtgaacagag ctccatcgac ggtggtggtt gacgtggagg atgaaggcgc cggagtttcg 300
tctccgaaca gcaccgtctc aagcgtgatg agcgggaaga agagcgagcg agagctaatg 360
gctgcggcag gtgcagttgg aggaggtaga gtagaagata atgagattga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga tgacagttcg 480
aggaagaaac tccgattgtc taaagaacaa gctttggttc ttgaagaaac ttttaaagaa 540
catagtacac tcaatccgaa gcaaaagatg gctttggcta agcaattgaa tctgaggacg 600
agacaagttg aagtgtggtt ccaaaaccga agggcaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa cggatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggcttta aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac aatgtgtcct tcttgcgagc gagtcgctgt tacgtcatct 840
tcgtcatcgg tggctcctcc tgtgatgaat tcatcgtctc cgatgggtcc gatgagtccg 900
tgggctgcca tgcctctacg gcaacgacct gctgctggtt ctcattag 948
<210> 148
<211> 948
<212> DNA
<213> 拟南芥
<400> 148
atgagtgaaa gagatgatgg attggggcta agtttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgaggtt aaatccaatg cctctggctt cttatgcatc ttcatcacac 120
atgcagcata tgcagcagag caattataac catcctcaaa agattcagaa cacttggatt 180
aacatgtttc agtcatcaga gagaaactcg gacatgagat cgtttctccg gggaatagac 240
gtgaacagag ctccatcgac ggtggtggtt gacgtggagg atgaaggcgc cggagtttcg 300
tctccgaaca gcaccgtctc aagcgtgatg agcgggaaga agagcgagcg agagctaatg 360
gctgcggcag gtgcagttgg aggaggtaga gtagaagata atgagattga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga tgacagttcg 480
aggaagaaac tccgattgtc taaagaacaa gctttggttc ttgaagaaac ttttaaagaa 540
catagtacac tcaatccgaa gcaaaagatg gctttggcta agcaattgaa tctgaggacg 600
agacaagttg aagtgtggtt ccaaaaccga agggcaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa cggatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggcttta aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac aatgtgtcct tcttgcgagc gagtcgctgt tacgtcatct 840
tcgtcatcgg tggctcctcc tgtgatgaat tcatcgtctc cgatgggtcc gatgagtccg 900
tgggctgcca tgcctctacg gcaacgacct gctgctggtt ctcattag 948
<210> 149
<211> 894
<212> DNA
<213> 葡萄
<400> 149
atgatggttg acaaggagga cttgggtttg agcttgagct taagctttcc tcaggacgca 60
catcgtccgc tacagttgaa tctgatgcct tcgttgcttc ctgcctcttc ctcttctcct 120
tctccttctc ccttcgctct tcagaaacct tcatggcacg acgcctttcc ctcttctgat 180
cgaacctcag agacatgcag aggcgatgcc agatcgttcc tccgtggaat agatgtgaac 240
cgcttgccat cgacggccga ctgcgaagaa gaggccggcg tttcatcacc aaacagcacg 300
atttccagcg taagcgggaa aagaagcgag agagaagcaa acggagacga gcatgagatg 360
gagagagctt gttctcgcgg aatcagcgac gaagaagatg gcgacacttc gagaaagaag 420
cttagactct ctaaggatca gtccgcgatt ctcgaagaaa acttcaaaga acacaacact 480
ctcaatccaa agcaaaagct ggccttggct aagcaactga acctgagacc aagacaggtg 540
gaggtgtggt ttcagaacag aagggcaagg accaagttga agcaaacgga ggttgactgt 600
gagttcttga agagatgctg cgagaatctg acggaggaga acagacggtt gcagaaggag 660
gtgaatgagc tgagagcact gaaactttcc ccacagttct acatgcaaat gaccccaccc 720
acaaccctca ccatgtgccc atcatgtgag cgtgtggcgg tcccacctcc ctcgtcggag 780
gctcgctccc accagatggc caccacccac caccgtccca tccccatcaa cccttgggcc 840
accgccactc ccatccccca ccgccccttc gacgccctcc atcctcgctc ctga 894
<210> 150
<211> 936
<212> DNA
<213> 亚洲栽培稻
<400> 150
atggagatga tggttcatgg gaggagagac gagcagtatg gcgggctcag gctcgggctt 60
gggcttgggc tcagcctcgg cgtcgccggt ggtgcagccg acgacgagca gccgccgccg 120
cgccgtggtg ccgccccgcc gccgcagcag cagctgtgcg gctggaacgg cggcggtctc 180
ttctcctcgt cttcctccga tcatcggggg aggtcggcga tgatggcgtg ccacgacgtc 240
atcgagatgc cgttcctgcg ggggatcgac gtgaaccgtg cgccggcggc agagacgacc 300
acgacgacgg cgagggggcc cagctgcagc gaggaagacg aggagcccgg cgcgtcctcc 360
cccaacagca cgctctccag cctcagcggc aagcgcggcg caccatctgc cgccaccgcc 420
gccgccgccg ccgccagcga cgacgaggac tccggcggcg gatcccgcaa gaagctccgc 480
ctctccaagg accaagccgc cgtcctcgag gacaccttca aagagcacaa caccctcaat 540
cccaagcaga aggcggcgct ggcgaggcag ctgaatctga agccgcggca ggtggaggtg 600
tggttccaga acaggagggc gaggacgaag ctgaagcaga cggaggtgga ctgcgagctg 660
ctcaagcgct gctgcgagac gctcaccgac gagaaccgcc gcctccaccg cgagctccag 720
gagctccgcg ccctcaagct cgccaccgcc gccgccgcgc cgcaccacct ctacggcgcc 780
cgcgtcccgc cgcccaccac cctcaccatg tgcccctcct gcgagcgcgt cgcctccgca 840
gccaccacca cccgcaacaa ctccggcgcc gcccccgcgc ggccggtgcc cacccgcccg 900
tggccgccgg cggcggcgca gaggtcgtcg gcgtag 936
<210> 151
<211> 483
<212> DNA
<213> 小立碗藓(Physcomitrella patens)
<400> 151
atgagctcgc gggggggaag cgacgatgag gacgaaggga cgacgcggaa gaagctgcga 60
ctgtcgaagg aacagtcggc actgctggag gagagtttca aggagcacag tacgctgaac 120
ccgaagcaga agaacgctct ggcgaagcag ctgggtctcc ggccgcggca ggtggaagtg 180
tggttccaga acaggagggc tcggacaaag ctgaaacaga ccgaagtgga ctgcgagttg 240
cttaagcgat gctgcgattc gctgaaggag gagaacagga ggttgcagaa agagttgctg 300
gagttgcgag ccatcaaggt ggcgcctcca tgtgtgatat cgcacgatta ctacatgcct 360
ctgcccgcgg cgacgctgac gatgtgtccg tcatgcgaga gagtggcgac ggtggacaac 420
aggtcgttga cgtttgcgaa gccagggttt tcacatttgt cgcaatcaag cgcagcatgt 480
tag 483
<210> 152
<211> 885
<212> DNA
<213> 蓖麻
<400> 152
atggaagaca aagatgatgg gctgggtttg ggtttgagtc tgagtttggg aggtcaggaa 60
aaacatcaaa atcagccatc tttgaagctc aatctcatgc cgtttccgtc gctctttatg 120
caaaatactc accacagtac ctccttgaat gaccttttcc aatcatctga tagaaacgct 180
gatacgaggt catttcaacg agggattgat atgaatcgga tgcccctctt cgccgattgc 240
gacgatgaaa acggtgtttc ttcgccgaac agtacgattt ccagtttaag tggaaagaga 300
agcgagaggg aacagattgg aggagaggag atggaggcag agagagcatc atgctctcgc 360
ggcggaagtg acgacgaaga cggtggcgcc ggcggcgatg acggttctag gaaaaaactg 420
aggctctcaa aggaacaatc tttattgctt gaagagactt ttaaggagca caatactctc 480
aatccaaagc agaagctggc tttagctaaa cagttgaatc tcaagccaag acaggtggag 540
gtgtggtttc agaaccggag ggcaaggact aagtcgaagc aaactgaagt tgattgtgag 600
tacttaaaaa ggtgttgtga gaatctgaca caagagaaca ggaggttgca gaaggaggtg 660
caggagctta gagcattgaa gctctcccca cagctgtaca tgcacatgaa ccctcccacc 720
acactcacaa tgtgcccttc atgcgagcgt gttgcagtct cctcatcggc tgctcccagc 780
cgccaaccac cgaattccca accccaacga ccggtgcctg ttaagccttg ggcagcattg 840
cctatccagc atcgaccgtt tgatacgcct gcttctagat cgtag 885
<210> 153
<211> 1041
<212> DNA
<213> 双色高粱
<400> 153
atggagatgg cggttaatgc gagagacgag gagaagaagt acgacgggga cgacaaccat 60
ctcgggcttg ggctaagcct cagcctcggc atcgccacca ccgcggctac tccggtcgag 120
gtcgacccgc cgccgcggca gcagcagcag cagcgagcta tcagcgtcgc gcccatctcc 180
tccctccccg cgccgcagtg gtggaacgga cccgccggtc tcttcttctc cccctcctcc 240
gggatgaaga tggatccatc tctggagagg aagcatcagc atcagcagca gcagcagcag 300
caggcggcgg ccacgagcta cagccacgat atgccgttcc tgcgtgggat cgacgtgaac 360
cggcgggcca ccgccggaga gacccggagg ggccgcagct gcagcgagga cgaggagccc 420
ggcgcgtcgt cgccgaacag cacgctctcc agcctcagcg ggaagcgcgc cgcgccggcg 480
aggagcagcg gagaagtgga tcgagaggcc gacggccaca ccccgagagc cggaggcggc 540
ggcagcgacg acgaggactc cggcgccggc ggtgggtcgc gcaagaagct ccgcctctcc 600
aaggaccagg ccgccgtcct cgaggacagc ttcaaggagc acaacaccct caaccccaag 660
cagaaggcgg cgctggcgaa gcagctgaac ctgaagccac gtcaggttga ggtctggttc 720
cagaaccgca gagccaggac gaagctgaag cagacggagg tggactgcga gttcctgaag 780
cgctgctgcg agacgctgac ggaggagaac cggcggctgc agcgggaggt ggcggagctg 840
cgcgcgctca agctcgtggc gccgcaccac tacgcgcgga tgccgccgcc aaccacgctc 900
accatgtgcc cctcctgcga gcgcctcgcc tccgcgcccg ccgacgaggc ggtggcgggc 960
cgtaccgccg cgcccacagg gccctggggc cctctccccg tgcggccagt gttcgtcgac 1020
ggcccggccc ggaggtcatg a 1041
<210> 154
<211> 948
<212> DNA
<213> 琴叶拟南芥
<400> 154
atgggtgaaa gagatgatgg attggggcta agcttgagct tgagtttagg ttttaatcaa 60
aaggacccgt cttcgagatt aaatccaatg cctttggctt cttattcaac ttcatcacac 120
atgcatatgc agcagagcaa ttatagccat cctcaaaaga ttcagaacac ttggattaac 180
atgtttcatt catcagagag aaacaccgac atgagatcgt ttctccgggg aatagacgtg 240
aacagagctc catcgacggt ggttgttgat gtggaggatg acggagccgg agtctcgtct 300
ccgaatagca ccgtatcaag cgtgatgagc gggaagagga gcgagcggga gctaatgact 360
gcggcagcta cagccggagg aggaggtaga gtagaagata acgagatgga gagagcttct 420
tgctcgctcg gcggtggtag cgacgatgaa gacggtagcg ggaacggaga cgatggttcg 480
aggaagaaac tgcgtttgtc taaagaacaa gctttggttc tcgaagaaac ttttaaagaa 540
catagcacac tcaatccgaa gcaaaagatg gcgttggcta agcaattgaa tctgaggacg 600
aggcaagtag aagtgtggtt ccaaaaccga agggcaagga cgaagctgaa gcaaacggaa 660
gtagactgtg aatatcttaa gagatgttgc gagaatctaa ctgatgagaa tcggagattg 720
caaaaggaag tgagtgagct tagggctttg aagctttctc cacacttata catgcacatg 780
aaacctccca ctactctcac tatgtgccct tcttgcgagc gagtcgctgt tacatcatct 840
tcgtcatctg tggctcctcc tgtgatgact tcatcgtctc cgatgggacc gatgagtccg 900
tgggctgcca ttcctctccg gcaacgacct gctgctggtt ctcattag 948
<210> 155
<211> 960
<212> DNA
<213> 桃
<400> 155
atgatggttg agagagatca agatttgggt ttgagtctga gcttgagttt tcctcagacc 60
cacaaccacc acaacaacaa caacaacaac agcagcagca ccaccagcac ccttcagctc 120
aatctcatgc cttctttggc ccctacttct gcttcttctc cttctgggtt tcttcctcaa 180
aaaccctctt ggaatgaggc cttgatttct tcagatcgaa actccaactc cgaaacgttc 240
cgggtcgggc cccgatcgtt ccttcggggc atcgacgtga accggttgcc ttcaacgggc 300
gactgcgaag acgaggcggg cgtgtcgtcg cccaacagca cggtgtcgag cgtgagcggc 360
aagcggagcg agagagaggc caatggcgaa gatctcgaca tcgagactcg aggcatcagc 420
gatgaagaag acggcgagac ctctagaaag aagctcaggc tctccaagga ccagtccgcc 480
attctcgaag agagcttcaa ggagcacaac actctcaacc caaagcaaaa gttggcgttg 540
gctaaacagc ttggcctccg gcctagacaa gtggaagtct ggtttcagaa cagaagagca 600
aggactaagt tgaagcaaac ggaggtggac tgtgagttct tgaagaggtg ctgtgagaat 660
ctgacagagg agaacaggcg gttgcagaag gaggttcagg agctgagagc actgaaactt 720
tccccacagt tctacatgca aatgacccca cccacgacac tcaccatgtg cccctcgtgt 780
gagcgtgtcg cggtcccacc caactcctca tcctcaaccg tcgagccccg gccccacccc 840
cacccccacc cccaaatggg ttcggtccag acccggcccg tccccatcaa cccgtgggca 900
tccgccaccc caatccccca ccggccgctg ccgttcgaag ccttccacac ccggacgtaa 960
<210> 156
<211> 471
<212> DNA
<213> 乌拉尔图小麦
<400> 156
atggatggct cccgcaagaa gctccggttg tccaaggacc agtccgccgt gctcgaggac 60
agcttccggg agcaccccac tctgaacccg aggcagaagg cagccttggc gcagcagctg 120
ggcctgcggt cgcggcaggt ggaggtgtgg ttccagaaca gacgcgcaag gacgaagctg 180
aagcagacgg aggtggactg cgagttcctg aagcgatgct gcgagacgct gacggaggag 240
aaccggcggc tgcagaagga ggtgcaggag ctccgcgcgc tcaagctcgt ctccccgcac 300
cactacatgc acatgtcccc gcccaccacc ctcaccatgt gcccctcctg cgagcgcgtc 360
tccaacaaca acaacaacaa caacaacaac tccaccaccg ccgaccgccg caacggtgtc 420
gagggcgcca tctgccaccg acccatcgcc gtccggccgc agcagtcatg a 471
<210> 157
<211> 1020
<212> DNA
<213> 荠菜
<400> 157
aaaaacctga gaacccagag acaaattttc ttctttcttc tttctgtttt tgggctagga 60
aaaaccaaaa aaatgggtga aagagatgat ggattgggtc taagcttgag cttgagttta 120
ggttttactc caaaggagcc gtcttctagg tttaatccaa tgcctatggc ttcttattca 180
tcttcttcac acatgcatat gcagcagcag agcaattata gccatcctca caagattcag 240
aacagttgga tcaacatgtt ccagtcttca gagagaaact ccgacatgag atcgtttctc 300
cggggaatcg acgtgaacag agctccatcg acggtggtgg ttgacgtgga ggatgacgcc 360
gccggagtct cgtccccgaa cagcaccgtg tcaagcgtgg tgagcgggaa gaggagcgag 420
cgggagctaa tggctgcggc agctgcagcc ggaggaggca gagcagaaga taacgagatg 480
gagagagctt cttgttcgct cggtggtggt agcgacgatg aggacgggag tgggaacgga 540
gacgacggtt cgaggaagaa actccgtttg tctaaagaac aagctttggt tcttgaagag 600
acttttaaag aacatagcac actcaatccg aagcaaaaga tggcgttggc taagcaattg 660
aatctgcaga cgaggcaagt ggaagtgtgg ttccaaaacc gaagggcaag gacgaagctg 720
aagcaaacgg aagtagactg tgaatatctg aggagacgtt gcgagaatct aacggaggag 780
aatcgaagat tgcaaaagga agtgagtgag ctaagggctt tgaagctttc gccacactta 840
tacatgcaca tgaaacctcc cactacgcta acaatgtgcc cttcttgcga acgagtggct 900
gttacatcat catcctcgtc ggtggctcct cctgtcatga cttcttcgtc tcctatgggg 960
caaatgagtc catgggctgc cattcctctc cgacaacgac ctgctgctgg ttctcattag 1020
<210> 158
<211> 888
<212> DNA
<213> 可可树
<400> 158
atgggtgctg aaaaagatga tggtttgggg ttgagcttga gcttgggatg tgctcaaaat 60
cacccttctt tgaagttaaa tctcatgcct ttagcgtcac cccgcatgca aaatcttcag 120
cagaagaaca cttggaatga gctgtttcaa tcttctgatc gaaacctgga tacgagatca 180
tttcttcgag ggattgatgt gaaccgggca ccagcaacgg ttgattgcga ggaggaaggt 240
ggggtctcgt ctcccaacag caccatttct agcataagtg ggaagagaaa cgagagagac 300
cctgtgggtg atgaaactga ggccgagaga gcgtcttgct ctcgtgccag tgatgatgaa 360
gacggcggtg ctggtggcga tgcctcgagg aaaaagctta ggctctcaaa ggaacagtcc 420
ttgctgcttg aagaaacctt caaggagcat agcactctta atccgaagca aaagttggca 480
ctggcaaagc aattgaatct gaggcctagg caagtggagg tctggttcca gaacagaagg 540
gccaggacaa agttgaagca gacggaagtt gactgtgagt atctaaagag atgttgcgag 600
aatctgaccg aggagaatag gcggctgcag aaggaagtgc aagagcttag agctttgaaa 660
ctctctccac agctctacat gcacatgaac cctcccacaa ccctcactat gtgcccttct 720
tgtgaacgtg tggcggtttc ttcctcctcc tcctccgcag cagctactgc ttcctccacc 780
ccaacttcga cggtcccaaa ccgtcaccac cggacgagtt ccgttagccc ttgggcagca 840
atgccaattg gtcatcgacc cttccatgcc cctgcatcta gatcataa 888
<210> 159
<211> 801
<212> DNA
<213> 无油樟
<400> 159
atgaatagag aagatctgaa tctgagttta agcttgagga gagtcggaga tttcgagttg 60
aatctgttac ccagaaattg cagaaatgat tcttccagtt tagatagatc agagacagct 120
agatcaatcc taaaatcctt tgatgtgaac cggattcagg cgacatcaga taggattccg 180
acaacaaccg atgcgattcg atcagaaatc agccggattc cggcaacacc gaacatggct 240
ggattcgatg taaataggat cccagtcatt tcagagtgcg aagaagaggc agtggtgtcg 300
tcgccaatga gcacagtttc gagcttgagc atgagtggcg ggaagagaga tgagccggag 360
ggggagagag cgagctcgag gggatctagt gacgaggagg atggtggtga ggctgcaagg 420
aagaaacttc gattgtcaaa ggatcaatct gcagttctag aggagagttt caaggaacac 480
aatactctta acccgaagca gaagctcact ttggcaaagc agttgaatct tcgccctcgt 540
caagtcgaag tctggtttca gaaccgaaga gcaaggacta agttaaagca aacagaagta 600
gattgtgaat ttttaaagag gtgttgtgaa aacctgactg aagagaacag gaggctccaa 660
aaagaagtga tggagctaag gtcccttaag caaacccctc acttctatat gcacgtgcct 720
cccgctgccc tgacgatgtg cccctcatgc gagcgtgtgg cagtgtcgga gtcccagttt 780
cgaccacaga ttcgatcatg a 801
<210> 160
<211> 942
<212> DNA
<213> 盐芥
<400> 160
atgggtgaga gagatgatgg attggggcta agcttgagct tgagtttagg ttcaaatcaa 60
aacgagtcgt cttcgaggtt taatcctatg cctctggctt cttttccatc ttcatcacac 120
atgcatatgc agaaccatta tagccatcct cagaagattc agaacaactg gattcaaatg 180
tttcaatctt cagagaggaa ctccgacgtg agatcttttc tccggggaat cgacgtgaac 240
agagctccat cgacggtggt ggttgacgtt gaggaagacg ccggagtctc gtctccgaac 300
agcacagtct caagcgtgat gagcgggaag agaagtgagc gagagctgat ggctgcggcg 360
gcggctggag gagtaagagt aatagaagac aacgaggcgg agagagcttc ttgctcgcta 420
ggcggcggtg gtagcgacga tgatgatggt ggcgggaacg gagacgacgg ttcgaggaag 480
aaactccgat tgtctaaaga acaagcttta gtcctcgagg agacttttaa agaacatagc 540
actctcaatc cgaagcaaaa gatggctttg gctaagcaat tgaatctaag aacaaggcaa 600
gtggaagtgt ggttccaaaa ccgaagggca aggacgaagc tgaagcaaac ggaagtagat 660
tgtgaatatc tgaaaagatg ctgcgagaat ctaacggagg agaatcgaag attgcaaaag 720
gaagtgagtg agctcagggc tttaaagctt tcaccacatt tatacatgca catgaaacct 780
cccactactc tcacaatgtg cccttcttgt gagcgagtcg ctgttacatc gtcgtcgtca 840
tcggtggccc ctcctgcgat gacgtcatca tctccgatgg ggccaatgag tccttgggct 900
gccattcctc tccggcaacg acctgctgct ggttctcatt ag 942
<210> 161
<211> 900
<212> DNA
<213> 克莱门柚
<400> 161
atggctgaga aagatgatct gggtttgagt cttagcttga gctttcctca aaatcaccat 60
tctttacagc taaatctcat gccttcttct gcttgttcca cttctccttc tggtttcagt 120
ctccaaaaaa ccccttggaa cgaggcctta ttcccacctt cagatccaaa ctctgagtct 180
tgtcgcgccg agacccgatc atttcttaga ggaatcgacg tgaatcgatt gccgtcacat 240
gcagataacg aagaagaagt gggcgtctca tctcctaaca gcacgatttc gagcgttagc 300
ggcaagagaa gcgagcggga acctaatgga gatgagctcg aaatggagag agcttgctct 360
cgtggtatca gcgacgatga agatggtgac acttcaagaa agaagctgag actttctaaa 420
gatcagtcag ccattcttga agagagcttc aaagagcaca acactctcaa cccaaagcaa 480
aagttggcgt tggcaaagca gcttggtctc agacctagac aggtggaagt gtggttccag 540
aacagaaggg caaggaccaa attgaagcaa actgaggttg actgcgaatt cttgaagaga 600
tgctgtgaga atctgacgga ggagaacagg cggttgcaga aagaagttca ggagctgaga 660
gcactgaagc tttccccgca gttctacatg caaatgaccc cacccacaac acttacgatg 720
tgtccttcgt gtgagcgtgt ggcagtccca ccatccgctg cagcatcagc cgttgatccg 780
gctaggccta ctcatcagat ggctgctccc aatcatcaca gacccatccc catcaaccct 840
tgggcccccg ctgctgccat ccctcatgga ccctttgatg cactccgtcc tcgatcgtga 900
<210> 162
<211> 888
<212> DNA
<213> 菜豆
<400> 162
atgatggttc aaaaggaaga tttgggtttg agtctgagcc tcaacttccg tcacaatatc 60
ccaaatcctc aacatcttac actcatctcc tcctcaactc attcatcttc cccttcggct 120
tcaaatcctt ttaaaccctc ttggaacgac cctttcgcct cttcggatcg aaactcggac 180
acatgcagag gcgaaacccg atctttcctc cgcggaatcg acgtgaatcg gttaccttcg 240
gccgtggaca tggaagagga agcgggagtt tcgtccccga acagcaccgt ctcgagcgtg 300
agcggaaagc ggagcgagcg agaacccaac ggtgaagaac acgacatgaa cagagcgtgt 360
tcccgcggaa tcagcgacga agaagacggc gaaacctcaa ggaaaaaact ccgactctcc 420
aaagaccaat cagctattct tgaagaaagt ttcaaagagc acaataccct caacccgaag 480
caaaagctgg cactggcaaa acagctaggc cttctaccaa gacaagttga ggtgtggttc 540
cagaaccgga gggcaaggac taaactgaag cagactgagg tggattgcga ggtgttgaaa 600
aggtgttgcg agaatctgac ggaggaaaat agaaggttgc agaaggaagt tcaggagctt 660
agagcactca aactttcccc tcagttttac atgcaaatga ccccacccac cacactcact 720
atgtgcccat cttgcgagcg ggtggctgtt ccgtcctccg ccgttgatgc cgccacacgt 780
catcatccca tggcccaggc ccagacacac ggtcggccca tacccattgg gccgtgggct 840
tcggctggtc ccattccgca gcgggccttt gatggtttcc accagtga 888
<210> 163
<211> 1002
<212> DNA
<213> 川桑
<400> 163
atgggtgaga aagatgatga tgggttgggg ttggggttga gtttgagctt gggaatattt 60
ggtggaacta caacaacagc aacaactcac actactactc atcaaccggg ttcttcttct 120
tcttcttctc tcaagtttaa tctcatgcaa aagccttctt cttcttccat gcaatatcaa 180
caaaagacta ctaataccac cgccactcct tggaatgaaa tctttcagct ttctgatcgg 240
aactccgacg gcaggtcgtt cctccggggg ctcgacgtga acctgacacc ctcgtttgcg 300
gcggcggcgg cggcggatta cgatgaggaa aacggcgtgt cgtctccgaa cagcacgata 360
tcgagcataa gcgggaagaa gagcgagaga gaggcaccgg gaggagagga ggccgaggag 420
ggagacagag actcctgctc tcgcggcggc ggaggaagtg atgacgaaga cggcggaaat 480
ggcggcggcg acgcctccag aaagaagctc cgcctcacca aggaccagtc tctcatcctt 540
gaagaaactt tcaaggagca caacactctc aacccgaagc aaaagctggc gttggctaag 600
gaactgaacc tgcggccaag acaagtggag gtgtggtttc agaacaggag ggcaaggact 660
aaattgaagc agacagaagt ggactgtgag tatctaaaga ggtgctgtga gaatctgact 720
gaagagaaca ggaggctgca aaaggaagtg caagagctta gagcattaaa gttgtcccca 780
cagctctaca tgcacatgag ccctcccacc accctcacaa tgtgcccttc atgtgagcgt 840
gtggcggcct cgtcgtcgtt gtcctctact gctgctgccg ctccaaacgg ttcaaaccgg 900
cagcccgccg ttcccagcat cccacggcct gtgcccatta acccgtgggc cgcattgcca 960
atcccacacc ggccgttgga tacacctgcc tctaggtcct aa 1002
<210> 164
<211> 972
<212> DNA
<213> 猴面花
<400> 164
atgatgacgg ccggaaaaga agatttgggg ctgagtttga gcctgacctt cccgccggag 60
aagaaggccg tttcgaatat tccgagctca ctgcacctca atctcatgcc ttcttcgcct 120
tctcccaatt tcaccatttt caataataat ttcaattgga cgtcgacgca acaagctgct 180
gctgctttcc ccttctcaga tcggagctcg gagacatgca gagtggagac gacgaggtct 240
tttctgaaag gaatcgatgt caactgcctc ccgtcggcgg cggcggcgga ggaggaagag 300
gaggaggaag gcggcggcgt ctcctccccc aacagcacga tctcaagcgt gagcgggaag 360
cggagcgaga gggaagacgc cacggaggag cacgacggcg agagagcttg ctcccgcggc 420
atcagcgacg aagaagacgc tgagaacgcc cggaaaaagc tccgcctctc caaagaccag 480
tccgccactc tcgaagaaag cttcaaagaa cacaacacac tcaatcccaa gcaaaagatg 540
gctttggcta aaagattagg gctaaggcca agacaagttg aagtctggtt ccaaaacaga 600
agggctagga caaaactgaa gcaaacagag gttgattgcg agttcctaaa gagatgctgc 660
gaaaacctaa cagaagagaa cagaaggctg caaaaagagg tccaagaact aagggcactt 720
aagctatccc cacagttcta catgcagatg acccctccaa ctactctcac catgtgccct 780
tcttgcgaga gagtcgcggt gccgacaatg gggggcccac cgtcgaacgg cggccgagca 840
ccaccagctg cgtccgctgc cgcggcagtt cagccgcggc cgatcacatt caatccgtgg 900
gctgccgtca tgcctagtca gcagcagcag cagctgcacc ggccgttcga tgctattatg 960
cattcgagat ga 972
<210> 165
<211> 864
<212> DNA
<213> 巨桉
<400> 165
atgatggtgg agagggaaga tctgggcttg tctctgagct tgagcttctc tgacagcagt 60
cggccttccc agctcggcgc ctctcctttc gggttcaacc tctacaagcc atctcaccgc 120
gactgcgaga ccttcgcttc attagatcgg atctcggagg cggatgcgcg gccgtccctg 180
cggggcatcg acgtgaaccg gccgccgccg tcggcggcgg actgcgagga gcaggaggag 240
gcgggggtgt cgtccccgaa cagcactatc tcgagcgtca gcgggaagag gggcgagagg 300
gagatggtca gcggcgggga ggacaacgag gcggagaggg actgcagccg cggaggcagc 360
gacgaggagg acggcgagaa ctcgaggaag aagctgaggc tgtccaagga tcagtcggcc 420
gtcttggagg agagcttccg agagcacaac actctgaatc ccaagcaaaa gctggcgttg 480
gctaagcagc taggcctgcg acctagacaa gtagaagtct ggtttcagaa ccgcagagca 540
cggaccaagt tgaagcagac ggagatagac tgcgagttcc tgaagaggtg ctgcgagaac 600
ctgacggagg agaaccggcg gctgcagaag gaggtccagg agctgcgcgc tctcaagctc 660
tcccctcagt tctacatgca catgccccct cccaccaccc ttaccgtctg ccccaactgc 720
gagcgcgtcg gggcggccgc accgccgctc ccatccgccg gcggcggcgg caggcccgcc 780
caccatcggg agccggtgcc catgatccca tgggccgcgc ggcccggccc ggtctcgcac 840
ggggctctcc ggcccaggac gtga 864
<210> 166
<211> 918
<212> DNA
<213> 高山南芥
<400> 166
atgggtgaga gagatgatgg attggggtta agtttgagct tgggattagg gtttaatcaa 60
aaggagcaat ctccgaggtt aaatccaatg cagtttggtt cttattcttc ttcgtcttca 120
cacatgcata tgcagagcaa tcatattaac cattctcaaa agattcagaa tagttggact 180
cacatgtttc aatcttcaga gagaaactct gacgtgagat catttctccg ggggattgac 240
gtgaacagag caccatcaac ggtggtggtt gacgtggagg aagacgccgg agtgtcgtct 300
ccgaacagca ccgtttcgag cgtgatgagt gggaagagaa acgagcgagt tgccacggtg 360
gtcggaggag gaggagttat agaagatcac gacgtggaga gagcttcttc ctcgcttggt 420
ggtggtagtg atgatgaaga cggtggtgga aatggagacg acggttctag gaagaaacta 480
cggttgtcta aagaacaagc tttggttctt gaagaaactt ttaaagaaca tagcactctt 540
aatccgaagc aaaagatggc tttggctaaa caattgaatc tgaggacaag gcaagttgaa 600
gtgtggttcc aaaaccgaag ggcaaggacg aagctgaagc aaacggaagt ggattgtgaa 660
tatctaaaaa gatgttgtga gaatctaacg gaagagaatc ggagattgca aaaggaagtg 720
agtgagctta gggctttaaa gctttcacct catttataca tgcacatgaa acctcccact 780
acactcacaa tgtgtccttc gtgtgagcga gtcgctgcta catcgtcatc ttcctcggtg 840
gctcctcctg cgatgaattc gtcgtcgccg tgggctgcga ttcctctccg gcaacgacct 900
gctgctggtt ctcattag 918
<210> 167
<211> 885
<212> DNA
<213> 黄瓜
<400> 167
atgggcggga gagatgatga cgtgggactc actttgagtt taggttttgg tgttacgact 60
cagtccactc acatgcaaag gccgtcgtcg atgcataatc accacctccg caagactcat 120
tggaacgagc tttttcaatt ttctgatcga aacgccgatt cgaggtcgtt tcttagagga 180
atcgacgtga atcggttgcc gacgggcgtg gacggcgagg aagagaacgg cgtttcatct 240
ccgaacagta cgatttctag cattagtgga aagagaagcg agagagaagc ggctggagac 300
gaggcggagg cggaggctga ggcggaggct gaagcggaag cggaagcgga agccgaaaga 360
gcctcgtgct cgcgagggag tgatgatgaa gacggcggag gcggggacgg tgacgcgtcg 420
agaaagaagc tgaggctatc gaaggaacag tcaatggttc ttgaagagac gttcaaagag 480
cacaatacgc tgaatcctaa gcaaaagctg gcacttgcaa agcagctgaa tctgacacca 540
agacaagtgg aggtgtggtt tcaaaacaga agggcaagga ccaaattgaa gcaaacagaa 600
gtggattgtg agtacttgaa gaggtgctgt gagaatctaa cagaggaaaa caggaggcta 660
cagaaggagg tgcaagagtt gagagcactc aagctttctc cacagcttta tatgcacatg 720
aatcctccta ccaccctcac catgtgccct caatgtgagc gtgtggcggt ttcttcatct 780
tcttcgacct cagctgctac caccactcgc catcaagcag cagctggtgt gcagcgtccc 840
tctatggcca tcaacccgtg ggcagtgttg ccgattcaac gttga 885
<210> 168
<211> 876
<212> DNA
<213> 雷蒙德氏棉
<400> 168
atgggtgata aagatgatgg tttggggttg agtttgagct tgggttgtgg tcagaatcag 60
ccttcttcta aattaaattt catgttttta gcttcaaacc ccttgcaaaa tcttcagcag 120
aacaaaactt ggaaccgact gtgtctgtct tctgatggac acatggatac aggatcattt 180
cttcgaggaa tcgatgtgaa ccgagcaccg gcagcaacgg tcgattgcga ggaagaaggt 240
gggggggtgt cgtcgcccaa cagcactatt tccaccataa gtgggaagaa aaacgagaga 300
gatcatgtcg ctgatgaaac cgaggccgag agagattctt gctctcgtgc cagcgatgac 360
gaagatggcg gtggcaatgc tggtggcggg gatgcctcga ggaagaagct taggctttca 420
aaggaacaat ccatggtgct ggaagaaact ttcaaggagc atagtactct gaatccgaaa 480
caaaagttgg cattggctaa gcaattgaat ctcaagccca ggcaagtgga ggtttggttt 540
caaaacagaa gggcaaggac aaagttgaag cagacggaag tcgactgcga gtatctaaaa 600
aggtgttgcg agaatctaac ggaggagaac cggaggttgc ataaggaagt acaagaactt 660
agagcactga aactatcccc acagctttac atgcacatga aacctcctac gacactcacc 720
atgtgcccgt cttgtgaacg tgtggctgcc cctggttctt ctgctgtgaa gcgttgccaa 780
acgagccctg accgtcaaca gccagtgcct gttaaccctt gggctgcaat gccgattact 840
catcaacctt tcaatgcccc tgcatctaga tcataa 876
<210> 169
<211> 900
<212> DNA
<213> 大豆
<400> 169
atgatggttc aaaaggaaga tttgggtttg agtttaagcc tcaacttccc tcatcacaat 60
accccaaatc ctcaacatcc gagtctcatg tcatcctcta ctcattcctc ttctccttct 120
ggttgcaacc ctcaaaaacc ctcttggaac gaggctttca cttcttcgga tcgaaactcc 180
gacacatgca gaggcgaaac gcgatcgttc ctgcgcggaa tcgacgtgaa ccggttacct 240
tccgccgtgg acaccgagga ggaaacggga gtttcgtctc cgaacagcac cgtctctagc 300
gtgagtggaa aacgtagcga gagagaagaa ccgaacggcg aagaacacga catggacaga 360
gcctgttccc gcggaatcag cgacgaggaa gacgctgaaa ccgcaaggaa aaaacttaga 420
ctctccaaag accaatccgc tatactcgaa gaaagcttca aagaacacaa caccctcaac 480
cccaagcaaa aattggcact ggcgaaacag ctaggacttc gacctagaca agtggaggtg 540
tggttccaga acagaagagc aaggactaag ctgaagcaaa ccgaggtgga ctgcgaagta 600
ttgaaaaggt gctgcgagaa tctgacggag gaaaatagaa ggttgcagaa ggaggttcag 660
gagcttagag cactgaaact ttccccacag ttttacatgc aaatgacccc acccacgacg 720
ctcaccatgt gcccctcttg cgagcgtgtg gctgttccgt cctccgccgt cgatgctgcc 780
acgcgtcatc atcccatggc ccaggcccag gcccaggccc agattcggca caggcccatt 840
ggcccgtggg cttccgcctc tcccattacg caccggccgt ttgatgtctt ccaccactga 900
<210> 170
<211> 960
<212> DNA
<213> 桃
<400> 170
atgatggttg agagagatca agatttgggt ttgagtctga gcttgagttt tcctcagacc 60
cacaaccacc acaacaacaa caacaacaac agcagcagca ccaccagcac ccttcagctc 120
aatctcatgc cttctttggc ccctacttct gcttcttctc cttctgggtt tcttcctcaa 180
aaaccctctt ggaatgaggc cttgatttct tcagatcgaa actccaactc cgaaacgttc 240
cgggtcgggc cccgatcgtt ccttcggggc atcgacgtga accggttgcc ttcaacgggc 300
gactgcgaag acgaggcggg cgtgtcgtcg cccaacagca cggtgtcgag cgtgagcggc 360
aagcggagcg agagagaggc caatggcgaa gatctcgaca tcgagactcg aggcatcagc 420
gatgaagaag acggcgagac ctctagaaag aagctcaggc tctccaagga ccagtccgcc 480
attctcgaag agagcttcaa ggagcacaac actctcaacc caaagcaaaa gttggcgttg 540
gctaaacagc ttggcctccg gcctagacaa gtggaagtct ggtttcagaa cagaagagca 600
aggactaagt tgaagcaaac ggaggtggac tgtgagttct tgaagaggtg ctgtgagaat 660
ctgacagagg agaacaggcg gttgcagaag gaggttcagg agctgagagc actgaaactt 720
tccccacagt tctacatgca aatgacccca cccacgacac tcaccatgtg cccctcgtgt 780
gagcgtgtcg cggtcccacc caactcctca tcctcaaccg tcgagccccg gccccacccc 840
cacccccacc cccaaatggg ttcggtccag acccggcccg tccccatcaa cccgtgggca 900
tccgccaccc caatccccca ccggccgctg ccgttcgaag ccttccacac ccggacgtaa 960
<210> 171
<211> 960
<212> DNA
<213> 玉米
<400> 171
atggatatta tggcgcttaa tgcgagagac gaggagcagt acgggaacaa ccatctcggg 60
ctcgggctga gcctcagcct cggcctcggc gtcgccaccg cggctccggt cgaggtcgag 120
cccccgccac cgccgcggca gcagcagcag cgagctatca gcgtcgcgcc catcacctcc 180
ctccccgcgc cgcagtggtg gaagtggaac ggccccggtc tcttcttcgg gacgacaatg 240
gatcagcagc agcagccggc ggccgcgcgc cacggccacg agatgccgtt cctgcggggg 300
gtggacgtga accgggcccc tgccggggat accaggaggg gtagctgcag cgaggacgac 360
gaggagcctg gcggcgcgtc gtcgtcgcca aacagcacgc tctccagcag cctcagcggg 420
aagcgcgcag ctccggcgag gagcggcgga gaggtggccg accacacccc gagagccgga 480
ggcggcagcg acgacgagga ctccggcggt gggtcgcgca agaagctccg cctgtccaag 540
gaccaggccg ccgtcctcga ggagagcttc aaggagcata acacactcaa ccccaagcag 600
aaggcggcgc tggcgaagca gctgaacctg aagccgcgtc aggtggaggt gtggttccag 660
aaccgcagag ccaggacgaa gctgaagcag acggaggtgg actgcgagtt cctgaagcgc 720
tgctgcgaga cgctgacgga ggagaaccgg cggctgcagc gggaggtggc ggagctgcgc 780
gtgctcaagc tcgtggcgcc gcaccactac gcgcgcatgc cgccgcccac cacgctcacc 840
atgtgcccct cctgcgagcg cctcgcctcc gcgtccgcgt ccgccgacca ggcgggccgt 900
gcagggccct gctggggccc tctccccgtg ttcgtcgacg gcccagcccg gaggccgtga 960
<210> 172
<211> 897
<212> DNA
<213> 毛果杨
<400> 172
atgggtgata aaaatgatgg actgggcttg agtttgagct tgggattcga tgctacacaa 60
caaaatcatc aacagcagcc ttctttgaag ctaaatctca tgcccgtacc ttcacaaaac 120
aatcatagaa aaacttcctt gactgacctc tttcaatcat cagatagagc atgtggtacg 180
aggttttttc aacgaggaat tgacatgaac agggtgccag ctgcagtgac agattgtgat 240
gacgaaactg gggtttcttc accaaacagt acgctatcca gcttaagtgg taaaagaagc 300
gaaagagaac agattggaga agaaacagaa gcggagaggg cctcttgctc tcgtgacagt 360
gatgatgaag atggtgctgg tggtgatgct tctaggaaga agctgagact ctcaaaggaa 420
cagtctttag tgcttgaaga gactttcaag gaacataata ctcttaatcc caaggagaag 480
ctggccttgg caaagcagtt gaatctcagg cctaggcaag tggaggtgtg gtttcagaac 540
cgaagagcaa ggactaagtt gaagcaaact gaagtcgatt gcgagtacct aaagaggtgc 600
tgtgaaaatc taacagagga gaacaggagg ttacagaagg aggtgcaaga gcttagagca 660
ctgaaacttt cccctcagct ctacatgcac atgaaccctc ccaccaccct caccatgtgc 720
ccttcatgcg agcgagttgc tgtctcgtca gcctcatcat cttctgctgc tgccgcgtcc 780
tctgctcttg ctccaactgc ctcaacccgc caaccacaac gacccgtgcc cattaaccct 840
tgggcaacaa tgcccgtcca ccaacgaact tttgatgctc ctgcttccag gtcatga 897
<210> 173
<211> 1059
<212> DNA
<213> 粟
<400> 173
atggagatgg cggttaatgc gagggatcgg gagcagcacg gccacggcgg tctcgggctc 60
gggctcagcc tcagcctgag catcgccacc gcggcaccgc cgccgcagca gcagcgagcc 120
atcagcgtcg cgcccatctc ctcccacccc gcgccgccgg tgccgccgca gccgcagtgg 180
tggaacggcg gcgccggtct cttcttctct ccctcctccg ggatggtgga tcgatctatg 240
gagaggaagc tgcagcagca gccggcagtg gcggcggcgt gccacggcca cgagatgccg 300
ttcctgcggg ggatcgacgt gaaccgggcg ccggccgccg gggagagccg gaggggctgc 360
tgcagcgagg acgaggagcc cgccgcgtcg tctcccaaca gcacgctgtc cagcctcagc 420
gggaagcggc ccgcggcgac gaggagcggg gacctagagg gcgaccacac cccgagggcc 480
ggcggcgcca gcgacgacga ggacagtggc gccggcggcg ggtcccgcaa gaagctccgc 540
ctgtccaagg accaggccgc cgtcctcgag gagagcttca aggagcacaa caccctcaac 600
cccgtacgta ctctccccaa gcagaaggcg gcgctggcga agcagctgaa cctgaagccg 660
cgccaggtcg aggtctggtt ccagaaccgc agagccagga cgaagctgaa gcagacggag 720
gtggactgcg agttcctgaa gcgctgctgc gagacgctga cggaggagaa ccggcggctg 780
cagcgggagg tggcggagct gcgcgcgctc aagctcgtcg cgccgcacca gtacgcgcgc 840
atgccgccgc ccaccacact caccatgtgc ccctcctgcg agcgcctcgc caccgccgac 900
gaggccggcc gcgcggcccg tcccgccgcg cccacggggc cctggggccc cgtccccgtg 960
cgccccgtgt tcgtcgacgg catgatcatc gacgcagacg cgcgccccga acaccccaac 1020
agcggtggac cggtggttgt agaaaaaaaa agttggtag 1059
<210> 174
<211> 891
<212> DNA
<213> 蒺藜苜蓿
<400> 174
atgagtattg aaaaggaaga ttttggtttg agcctaagtt tgagctttcc tcaaaatcca 60
ccaaatcctc aataccttaa tcttatgtct tcttcaactc attcatattc tccttctact 120
ttcaatcctc aaaaaccttc ttggaatgat gtttttactt cttcagatcg ggattcggag 180
acatgcagaa tcgaagaacg tcctttaatt ctccgaggaa tcgatgtgaa tcggttacct 240
tcaggtgctg attgtgaaga agaagcagga gtttcatcac caaacagcac cgtttcaagt 300
gtgagtggta aaagaagcga aagagaagtt accggtgaag atcttgacat ggaaagagat 360
tgttcaagag gaatcagtga tgaagaagac gctgaaactt caaggaaaaa acttagactc 420
accaaagacc aatcaatcat tctcgaagag agtttcaaag aacacaacac tcttaatccc 480
aaacaaaaat tggcacttgc aaaacaattg ggacttcgtg ctagacaagt tgaagtttgg 540
tttcaaaatc gtagagcaag gactaagttg aagcaaacag aggtagattg tgaatttttg 600
aaaagatgtt gtgagaatct aacggatgaa aatagacggt tgcaaaaaga agtgcaagag 660
ttaagagcat tgaaactttc cccacaattc tacatgcaaa tgacaccacc aacaacactt 720
accatgtgcc cctcttgtga gcgtgtcgct gttccatcat ctgccgttga tgctgccacg 780
cgtcgtcatc ctatggcttc aaatcaccct cgtacgtttt ccgtgggacc atgggccaca 840
gctgctccaa tccaacatag gacctttgat acactccgtc ctagatctta a 891
<210> 175
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 175
ccgtgctcga ggatagcttc cgg 23
<210> 176
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 176
ggtactcgca gtccacctcc gtc 23
<210> 177
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 177
ggagcaccca actctcaacc ctg 23
<210> 178
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 178
cctccgtctg cttcagcttc gtc 23
<210> 179
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 179
aggagcataa cacactcaac ccc 23
<210> 180
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 180
ggacgaagct gaagcagacg gag 23
<210> 181
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 181
aggaccaggc cgccgtcctc gag 23
<210> 182
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<400> 182
ggaactcgca gtccacctcc gtc 23
<210> 183
<211> 166
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 183
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1 5 10 15
Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile
35 40 45
Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
50 55 60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
85 90 95
Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala
100 105 110
Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg
115 120 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
130 135 140
Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys
145 150 155 160
Ala Gln Ser Ser Thr Asp
165
<210> 184
<211> 166
<212> PRT
<213> 人工序列
<220>
<223> 合成的tRNA特异性腺苷脱氨酶
<400> 184
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1 5 10 15
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
35 40 45
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
50 55 60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65 70 75 80
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
85 90 95
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
100 105 110
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
115 120 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
130 135 140
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
145 150 155 160
Ala Gln Ser Ser Thr Asp
165
<210> 185
<211> 166
<212> PRT
<213> 人工序列
<220>
<223> 合成的tRNA特异性腺苷脱氨酶
<400> 185
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1 5 10 15
Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ser Ile
35 40 45
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
50 55 60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65 70 75 80
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
85 90 95
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
100 105 110
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
115 120 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
130 135 140
Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys
145 150 155 160
Ala Gln Ser Ser Thr Asp
165
<210> 186
<211> 166
<212> PRT
<213> 人工序列
<220>
<223> 合成的tRNA特异性腺苷脱氨酶
<400> 186
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1 5 10 15
Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
35 40 45
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
50 55 60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65 70 75 80
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
85 90 95
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
100 105 110
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
115 120 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu
130 135 140
Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys
145 150 155 160
Ala Gln Ser Ser Thr Asp
165
<210> 187
<211> 166
<212> PRT
<213> 人工序列
<220>
<223> 合成的tRNA特异性腺苷脱氨酶
<400> 187
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1 5 10 15
Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
35 40 45
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
50 55 60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65 70 75 80
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
85 90 95
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
100 105 110
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
115 120 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu
130 135 140
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
145 150 155 160
Ala Gln Ser Ser Thr Asp
165
<210> 188
<211> 228
<212> PRT
<213> 大鼠(Rattus norvegicus)
<400> 188
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser
35 40 45
Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe
100 105 110
Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro
145 150 155 160
Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu
165 170 175
Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 189
<211> 199
<212> PRT
<213> 人(Homo sapiens)
<400> 189
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 190
<211> 621
<212> DNA
<213> Petromyzon marinus
<400> 190
acagatgcag agtatgtgag aattcacgaa aagctggaca tctatacctt caagaagcag 60
ttctttaaca ataagaagtc tgtgagccat aggtgctacg tgctgttcga gctgaagaga 120
aggggtgaaa gaagggcatg tttttggggg tatgctgtga acaagcccca gtctggaact 180
gagagaggca ttcacgccga aattttcagc atcagaaagg tggaggaata cctgagggat 240
aaccctggac agtttacaat taattggtat tctagctggt ctccatgcgc tgactgtgcc 300
gagaagatcc tggaatggta caaccaggag ctgagaggaa atggccatac cctgaagatt 360
tgggcctgca agctgtacta tgaaaagaac gcaagaaatc agatcggact gtggaacctg 420
agggataatg gtgtggggct gaacgtgatg gtgtccgagc actatcagtg ctgtagaaag 480
attttcattc agtcctcaca taatcagctg aacgagaata gatggctgga aaagactctg 540
aagagggctg agaagagaag gtccgaactg tcaattatga tccaggtgaa gatcctgcac 600
accactaagt cacctgccgt g 621
<210> 191
<211> 160
<212> PRT
<213> 人工序列
<220>
<223> 合成的FERNY脱氨酶
<400> 191
Phe Glu Arg Asn Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Tyr Leu
1 5 10 15
Leu Tyr Glu Ile Lys Trp Gly Lys Ser Gly Lys Leu Trp Arg His Trp
20 25 30
Cys Gln Asn Asn Arg Thr Gln His Ala Glu Val Tyr Phe Leu Glu Asn
35 40 45
Ile Phe Asn Ala Arg Arg Phe Asn Pro Ser Thr His Cys Ser Ile Thr
50 55 60
Trp Tyr Leu Ser Trp Ser Pro Cys Ala Glu Cys Ser Gln Lys Ile Val
65 70 75 80
Asp Phe Leu Lys Glu His Pro Asn Val Leu Glu Ile Tyr Val Ala Arg
85 90 95
Leu Tyr Tyr His Glu Asp Glu Arg Asn Arg Gln Gly Leu Arg Asp Leu
100 105 110
Val Asn Ser Gly Val Thr Ile Arg Ile Met Asp Leu Pro Asp Tyr Asn
115 120 125
Tyr Cys Trp Lys Thr Phe Val Ser Asp Gln Gly Gly Asp Glu Asp Tyr
130 135 140
Trp Pro Gly His Phe Ala Pro Trp Ile Lys Gln Tyr Ser Leu Lys Leu
145 150 155 160
<210> 192
<211> 207
<212> PRT
<213> 人工序列
<220>
<223> 合成的胞苷脱氨酶
<400> 192
Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr Thr
1 5 10 15
Phe Lys Lys Gln Phe Ser Asn Asn Lys Lys Ser Val Ser His Arg Cys
20 25 30
Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys Phe
35 40 45
Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly Ile
50 55 60
His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg Asp
65 70 75 80
Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro Cys
85 90 95
Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu Arg
100 105 110
Gly Asn Gly His Thr Leu Lys Ile Trp Val Cys Lys Leu Tyr Tyr Glu
115 120 125
Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn Gly
130 135 140
Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg Lys
145 150 155 160
Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp Leu
165 170 175
Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser Ile
180 185 190
Met Phe Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 193
<211> 228
<212> PRT
<213> 人工序列
<220>
<223> 合成的胞苷脱氨酶
<400> 193
Ser Ser Lys Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser
35 40 45
Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro Asn Val Thr Leu Phe
100 105 110
Ile Tyr Ile Ala Arg Leu Tyr His Leu Ala Asn Pro Arg Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Glu Gln Glu Ser Gly Tyr Cys Trp His Asn Phe Val Asn Tyr Ser Pro
145 150 155 160
Ser Asn Glu Ser His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu
165 170 175
Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Ser Gln Leu Thr Ser Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 194
<211> 162
<212> PRT
<213> 人工序列
<220>
<223> 合成的胞苷脱氨酶
<400> 194
Ser Phe Glu Arg Asn Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Tyr
1 5 10 15
Leu Leu Tyr Glu Ile Lys Trp Gly Lys Ser Gly Lys Leu Trp Arg His
20 25 30
Trp Cys Gln Asn Asn Arg Thr Gln His Ala Glu Val Tyr Phe Leu Glu
35 40 45
Asn Ile Phe Asn Ala Arg Arg Phe Asn Pro Ser Thr His Cys Ser Ile
50 55 60
Thr Trp Tyr Leu Ser Trp Ser Pro Cys Ala Glu Cys Ser Gln Lys Ile
65 70 75 80
Val Asp Phe Leu Lys Glu His Pro Asn Val Asn Leu Glu Ile Tyr Val
85 90 95
Ala Arg Leu Tyr Tyr Pro Glu Asn Glu Arg Asn Arg Gln Gly Leu Arg
100 105 110
Asp Leu Val Asn Ser Gly Val Thr Ile Arg Ile Met Asp Leu Pro Asp
115 120 125
Tyr Asn Tyr Cys Trp Lys Thr Phe Val Ser Asp Gln Gly Gly Asp Glu
130 135 140
Asp Tyr Trp Pro Gly His Phe Ala Pro Trp Ile Lys Gln Tyr Ser Leu
145 150 155 160
Lys Leu
<210> 195
<211> 83
<212> PRT
<213> 芽孢杆菌噬菌体AR9
<400> 195
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1 5 10 15
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
20 25 30
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
35 40 45
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
50 55 60
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
65 70 75 80
Lys Met Leu
<210> 196
<211> 1592
<212> DNA
<213> 蒺藜苜蓿
<400> 196
actgttaata atttttaaac gtcagcgcac taaaaaaacg aaaagacgga cacgtgaaaa 60
taaaaaacac acactagttt atgacgcaat actattttac ttatgatttg ggtacattag 120
acaaaaccgt gaaagagatg tatcagctat gaaacctgta tacttcaata cagagactta 180
ctcatatcgg atacgtacgc acgaagtatc atattaatta ttttaatttt taataaatat 240
tttatcggat acttatgtga tactctacat atacacaagg atatttctaa gatactttat 300
agatacgtat cctagaaaaa catgaagagt aaaaaagtga gacaatgttg taaaaattca 360
ttataaatgt atatgattca attttagata tgcatcagta taattgattc tcgatgaaac 420
acttaaaatt atatttcttg tggaagaacg tagcgagaga ggtgattcag ttagacaaca 480
ttaaataaaa ttaatgttaa gttcttttaa tgatgtttct ctcaatatca catcatatga 540
aaatgtaata tgatttataa gaaaattttt aaaaaattta ttttaataat cacatgtact 600
attttttaaa aattgtatct tttataataa tacaataata aagagtaatc agtgttaatt 660
tttcttcaaa tataagtttt attataaatc attgttaacg tatcataagt cattaccgta 720
tcgtatctta attttttttt aaaaaccgct aattcacgta cccgtattgt attgtacccg 780
cacctgtatc acaatcgatc ttagttagaa gaattgtctc gaggcggtgc aagacagcat 840
ataatagacg tggactctct tataccaaac gttgtcgtat cacaaagggt taggtaacaa 900
gtcacagttt gtccacgtgt cacgttttaa ttggaagagg tgccgttggc gtaatataac 960
agccaatcga tttttgctat aaaagcaaat caggtaaact aaacttcttc attcttttct 1020
tccccatcgc tacaaaaccg gttcctttgg aaaagagatt cattcaaacc tagcacccaa 1080
ttccgtttca aggtataatc tactttctat tcttcgatta ttttattatt attagctact 1140
atcgtttaat cgatcttttc ttttgatccg tcaaatttaa attcaattag ggttttgttc 1200
ttttctttca tctgattgaa atccttctga attgaaccgt ttacttgatt ttactgttta 1260
ttgtatgatt taatcctttg tttttcaaag acagtcttta gattgtgatt aggggttcat 1320
ataaattttt agatttggat ttttgtattg tatgattcaa aaaatacgtc ctttaattag 1380
attagtacat ggatattttt tacccgattt attgattgtc agggagaatt tgatgagcaa 1440
gtttttttga tgtctgttgt aaattgaatt gattataatt gctgatctgc tgcttccagt 1500
tttcataacc catattcttt taaccttgtt gtacacacaa tgaaaaattg gtgattgatt 1560
catttgtttt tctttgtttt ggattataca gg 1592
<210> 197
<211> 2000
<212> DNA
<213> 玉米
<400> 197
gtcgtgcccc tctctagaga taaagagcat tgcatgtcta aagtataaaa aattaccaca 60
tatttttttg tcacacttat ttgaagtgta gtttatctat ctctatacat atatttaaac 120
ttcactctac aaataatata gtctataata ctaaaataat attagtgttt tagaggatca 180
tataaataaa ctgctagaca tggtctaaag gataattgaa tattttgaca atctacagtt 240
ttatcttttt agtgtgcatg tgatctctct gttttttttg caaatagctt gacctatata 300
atacttcatc cattttatta gtacatccat ttaggattta gggttgatgg tttctataga 360
ctaattttta gtacatccat tttattcttt ttagtctcta aattttttaa aactaaaact 420
ctattttagt tttttattta ataatttaga tataaaatga aataaaataa attgactaca 480
aataaaacaa atacccttta agaaataaaa aaactaagca aacatttttc ttgtttcgag 540
tagataatga caggctgttc aacgccgtcg acgagtctaa cggacaccaa ccagcgaacc 600
agcagcgtcg cgtcgggcca agcgaagcag acggcacggc atctctgtag ctgcctctgg 660
acccctctcg agagttccgc tccaccgttg gacttgctcc gctgtcggca tccagaaatt 720
gcgtggcgga gcggcagacg tgaggcggca cggcaggcgg cctcttcctc ctctcacggc 780
accggcagct acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc 840
gtaataaata gacaccccct ccacaccctc tttccccaac ctcgtgttcg ttcggagcgc 900
acacacacgc aaccagatct cccccaaatc cagccgtcgg cacctccgct tcaaggtacg 960
ccgctcatcc tccccccccc cctctctcta ccttctctag atcggcgatc cggtccatgg 1020
ttagggcccg gtagttctac ttctgttcat gtttgtgtta gagcaaacat gttcatgttc 1080
atgtttgtga tgatgtggtc tggttgggcg gtcgttctag atcggagtag gatactgttt 1140
caagctacct ggtggattta ttaattttgt atctgtatgt gtgtgccata catcttcata 1200
gttacgagtt taagatgatg gatggaaata tcgatctagg ataggtatac atgttgatgc 1260
gggttttact gatgcatata cagagatgct ttttttctcg cttggttgtg atgatatggt 1320
ctggttgggc ggtcgttcta gatcggagta gaatactgtt tcaaactacc tggtggattt 1380
attaaaggat aaagggtcgt tctagatcgg agtagaatac tgtttcaaac tacctggtgg 1440
atttattaaa ggatctgtat gtatgtgcct acatcttcat agttacgagt ttaagatgat 1500
ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 1560
acagagatgc tttttttcgc ttggttgtga tgatgtggtc tggttgggcg gtcgttctag 1620
atcggagtag aatactgttt caaactacct ggtggattta ttaattttgt atctttatgt 1680
gtgtgccata catcttcata gttacgagtt taagatgatg gatggaaata ttgatctagg 1740
ataggtatac atgttgatgt gggttttact gatgcatata catgatggca tatgcggcat 1800
ctattcatat gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa 1860
ttattttgat cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt 1920
agccctgcct tcatacgcta tttatttgct tggtactgtt tcttttgtcc gatgctcacc 1980
ctgttgtttg gtgatacttc 2000
<210> 198
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的间隔子
<220>
<221> misc_feature
<222> (1)..(19)
<223> n是a, c, g或t
<400> 198
nnnnnnnnnn nnnnnnnnn 19
<210> 199
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的靶链
<220>
<221> misc_feature
<222> (4)..(22)
<223> n是a, c, g或t
<400> 199
aaannnnnnn nnnnnnnnnn nn 22
<210> 200
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的非靶链
<220>
<221> misc_feature
<222> (4)..(22)
<223> n是a, c, g或t
<400> 200
tttnnnnnnn nnnnnnnnnn nn 22
<210> 201
<211> 207
<212> PRT
<213> 人工序列
<220>
<223> 合成的HB78多肽
<400> 201
Met Asp Ile Met Ala Leu Asn Ala Arg Asp Glu Glu Gln Tyr Gly Asn
1 5 10 15
Asn His Leu Gly Leu Gly Leu Ser Leu Ser Leu Gly Leu Gly Val Ala
20 25 30
Thr Ala Ala Pro Val Glu Val Glu Pro Pro Pro Pro Pro Arg Gln Gln
35 40 45
Gln Gln Arg Ala Ile Ser Val Ala Pro Ile Thr Ser Leu Pro Ala Pro
50 55 60
Gln Trp Trp Lys Trp Asn Gly Pro Gly Leu Phe Phe Met His Ala Gly
65 70 75 80
Thr Thr Met Asp Gln Gln Gln Gln Pro Ala Ala Ala Arg His Gly His
85 90 95
Glu Met Pro Phe Leu Arg Gly Val Asp Val Asn Arg Ala Pro Ala Gly
100 105 110
Asp Thr Arg Arg Gly Ser Cys Ser Glu Asp Asp Glu Glu Pro Gly Gly
115 120 125
Ala Ser Ser Ser Pro Asn Ser Thr Leu Ser Ser Ser Leu Ser Gly Lys
130 135 140
Arg Ala Ala Pro Ala Arg Ser Gly Gly Glu Val Ala Asp His Thr Pro
145 150 155 160
Arg Ala Gly Gly Gly Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg
165 170 175
Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Glu Ser
180 185 190
Phe Lys Glu His Asn Thr Ser Arg Arg Arg Arg Trp Arg Ser Ser
195 200 205
<210> 202
<211> 947
<212> DNA
<213> 人工序列
<220>
<223> 合成的HB78核酸分子
<400> 202
atggatatta tggcgcttaa tgcgagagac gaggagcagt acgggaacaa ccatctcggg 60
ctcgggctga gcctcagcct cggcctcggc gtcgccaccg cggctccggt cgaggtcgag 120
cccccgccac cgccgcggca gcagcagcag cgagctatca gcgtcgcgcc catcacctcc 180
ctccccgcgc cgcagtggtg gaagtggaac ggccccggtc tcttcttcat gcatgcaggg 240
acgacaatgg atcagcagca gcagccggcg gccgcgcgcc acggccacga gatgccgttc 300
ctgcgggggg tggacgtgaa ccgggcccct gccggggata ccaggagggg tagctgcagc 360
gaggacgacg aggagcctgg cggcgcgtcg tcgtcgccaa acagcacgct ctccagcagc 420
ctcagcggga agcgcgcagc tccggcgagg agcggcggag aggtggccga ccacaccccg 480
agagccggag gcggcagcga cgacgaggac tccggcggtg ggtcgcgcaa gaagctccgc 540
ctgtccaagg accaggccgc cgtcctcgag gagagcttca aggagcataa cacaagcaga 600
aggcggcgct ggcgaagcag ctgaacctga agccgcgtca ggtggaggtg tggttccaga 660
accgcagagc cacgaagctg aaggtggact gcgagttcct gaagcgctgc tgcgagacgc 720
tgacggagga gaaccggcgg ctgcagcggg aggtggcgga gctgcgcgtg ctcaagctcg 780
tggcgccgca ccactacgcg cgcatgccgc cgcccaccac gctcaccatg tgcccctcct 840
gcgagcgcct cgcctccgcg tccgcgtccg ccgaccaggc gggccgtgca gggccctgct 900
ggggccctct ccccgtgttc gtcgacggcc cagcccggag gccgtga 947
<210> 203
<211> 53
<212> PRT
<213> 无油樟
<400> 203
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 204
<211> 53
<212> PRT
<213> 琴叶拟南芥
<400> 204
Leu Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 205
<211> 53
<212> PRT
<213> 拟南芥
<400> 205
Leu Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 206
<211> 53
<212> PRT
<213> 高山南芥
<400> 206
Leu Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 207
<211> 53
<212> PRT
<213> 白菜型油菜
<400> 207
Leu Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 208
<211> 53
<212> PRT
<213> 甘蓝
<400> 208
Leu Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 209
<211> 53
<212> PRT
<213> 荠菜
<400> 209
Leu Ala Lys Gln Leu Asn Leu Gln Thr Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Arg Arg Arg Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 210
<211> 53
<212> PRT
<213> 鹰嘴豆
<400> 210
Leu Ala Lys Gln Leu Asn Leu Met Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 211
<211> 53
<212> PRT
<213> 克莱门柚
<400> 211
Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 212
<211> 53
<212> PRT
<213> 甜橙
<400> 212
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 213
<211> 53
<212> PRT
<213> 甜瓜
<400> 213
Leu Ala Lys Gln Leu Asn Leu Thr Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 214
<211> 53
<212> PRT
<213> 黄瓜
<400> 214
Leu Ala Lys Gln Leu Asn Leu Thr Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 215
<211> 53
<212> PRT
<213> 猴面花
<400> 215
Leu Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 216
<211> 53
<212> PRT
<213> 巨桉
<400> 216
Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Ile Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 217
<211> 53
<212> PRT
<213> 盐芥
<400> 217
Leu Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 218
<211> 53
<212> PRT
<213> 大豆
<400> 218
Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Val Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 219
<211> 53
<212> PRT
<213> 雷蒙德氏棉
<400> 219
Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu His Lys Glu Val
50
<210> 220
<211> 53
<212> PRT
<213> 假稻
<400> 220
Leu Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 221
<211> 53
<212> PRT
<213> 蒺藜苜蓿
<400> 221
Leu Ala Lys Gln Leu Gly Leu Arg Ala Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 222
<211> 53
<212> PRT
<213> 川桑
<400> 222
Leu Ala Lys Glu Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 223
<211> 53
<212> PRT
<213> 小果野蕉
<400> 223
Leu Ala Lys Arg Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 224
<211> 53
<212> PRT
<213> 莲
<400> 224
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 225
<211> 53
<212> PRT
<213> 美花烟草
<400> 225
Leu Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 226
<211> 53
<212> PRT
<213> 短舌野生稻
<400> 226
Leu Ala Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu His Arg Glu Leu
50
<210> 227
<211> 53
<212> PRT
<213> 短药野生稻
<400> 227
Leu Ala Arg Gln Leu Gly Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu His Lys Glu Leu
50
<210> 228
<211> 53
<212> PRT
<213> 非洲栽培稻
<400> 228
Leu Ala Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu His Arg Glu Leu
50
<210> 229
<211> 53
<212> PRT
<213> 展颖野生稻
<400> 229
Leu Ala Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu His Arg Glu Leu
50
<210> 230
<211> 53
<212> PRT
<213> 南方野生稻
<400> 230
Leu Ala Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu His Arg Glu Leu
50
<210> 231
<211> 53
<212> PRT
<213> 泥瓦拉野生稻
<400> 231
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Leu
50
<210> 232
<211> 53
<212> PRT
<213> 斑点野生稻
<400> 232
Leu Ala Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu His Arg Glu Leu
50
<210> 233
<211> 53
<212> PRT
<213> 普通野生稻
<400> 233
Leu Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 234
<211> 53
<212> PRT
<213> 亚洲栽培稻
<400> 234
Leu Ala Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg
35 40 45
Leu His Arg Glu Leu
50
<210> 235
<211> 53
<212> PRT
<213> 菜豆
<400> 235
Leu Ala Lys Gln Leu Gly Leu Leu Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Val Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 236
<211> 53
<212> PRT
<213> 小立碗藓
<400> 236
Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Leu Leu Lys Arg Cys Cys Asp Ser Leu Lys Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Leu
50
<210> 237
<211> 53
<212> PRT
<213> 毛果杨
<400> 237
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 238
<211> 53
<212> PRT
<213> 桃
<400> 238
Leu Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 239
<211> 53
<212> PRT
<213> 蓖麻
<400> 239
Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Ser Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Gln Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 240
<211> 53
<212> PRT
<213> 粟
<400> 240
Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Arg Glu Val
50
<210> 241
<211> 53
<212> PRT
<213> 马铃薯
<400> 241
Leu Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 242
<211> 53
<212> PRT
<213> 双色高粱
<400> 242
Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Arg Glu Val
50
<210> 243
<211> 53
<212> PRT
<213> 可可树
<400> 243
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 244
<211> 53
<212> PRT
<213> 乌拉尔图小麦
<400> 244
Leu Ala Gln Gln Leu Gly Leu Arg Ser Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 245
<211> 53
<212> PRT
<213> 葡萄
<400> 245
Leu Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Lys Glu Val
50
<210> 246
<211> 53
<212> PRT
<213> 玉米
<400> 246
Leu Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Arg Glu Val
50
<210> 247
<211> 114
<212> PRT
<213> 无油樟
<400> 247
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Thr Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Met Glu Leu Arg Ser Leu Lys Gln Thr Pro His Phe
85 90 95
Tyr Met His Val Pro Pro Ala Ala Leu Thr Met Cys Pro Ser Cys Glu
100 105 110
Arg Val
<210> 248
<211> 115
<212> PRT
<213> 琴叶拟南芥
<400> 248
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Ala Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Asp Ser Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 249
<211> 115
<212> PRT
<213> 拟南芥
<400> 249
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Ala Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Asp Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 250
<211> 115
<212> PRT
<213> 高山南芥
<400> 250
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met His Met Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 251
<211> 116
<212> PRT
<213> 二穗短柄草
<400> 251
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Ser Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro Arg
85 90 95
His Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 252
<211> 115
<212> PRT
<213> 白菜型油菜
<400> 252
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Asp
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Asp Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
His Lys Glu Val Ala Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 253
<211> 115
<212> PRT
<213> 甘蓝
<400> 253
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Trp Thr Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Asp Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
His Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 254
<211> 115
<212> PRT
<213> 荠菜
<400> 254
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Val His Ser Thr Leu Asn Pro Lys Gln Lys Leu Val Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Ala Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Asp Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 255
<211> 115
<212> PRT
<213> 鹰嘴豆
<400> 255
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Val Leu Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Gln Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Met Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 256
<211> 115
<212> PRT
<213> 克莱门柚
<400> 256
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ser Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met Asn Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 257
<211> 115
<212> PRT
<213> 甜橙
<400> 257
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ser Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met Asn Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 258
<211> 115
<212> PRT
<213> 甜瓜
<400> 258
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Met Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Thr Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Gln Cys
100 105 110
Glu Arg Val
115
<210> 259
<211> 115
<212> PRT
<213> 黄瓜
<400> 259
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Met Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Thr Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Gln Cys
100 105 110
Glu Arg Val
115
<210> 260
<211> 115
<212> PRT
<213> 猴面花
<400> 260
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Thr Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Met Ala Leu
20 25 30
Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
85 90 95
Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 261
<211> 115
<212> PRT
<213> 巨桉
<400> 261
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu
1 5 10 15
Ser Phe Arg Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Ile Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
85 90 95
Tyr Met His Met Pro Pro Pro Thr Thr Leu Thr Val Cys Pro Asn Cys
100 105 110
Glu Arg Val
115
<210> 262
<211> 115
<212> PRT
<213> 盐芥
<400> 262
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Val Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Thr Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Arg Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Asp Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
His Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 263
<211> 115
<212> PRT
<213> 大豆
<400> 263
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Gln Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Met Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
85 90 95
Tyr Met Gln Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 264
<211> 115
<212> PRT
<213> 雷蒙德氏棉
<400> 264
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Met Ala Leu
20 25 30
Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
85 90 95
Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 265
<211> 116
<212> PRT
<213> 大麦
<400> 265
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Ser Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Gln Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 266
<211> 116
<212> PRT
<213> 假稻
<400> 266
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 267
<211> 115
<212> PRT
<213> 蒺藜苜蓿
<400> 267
Arg Lys Lys Leu Arg Leu Thr Lys Asp Gln Ser Ile Ile Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Gly Leu Arg Ala Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Asp Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
85 90 95
Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 268
<211> 115
<212> PRT
<213> 川桑
<400> 268
Arg Lys Lys Leu Arg Leu Thr Lys Asp Gln Ser Leu Ile Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Glu Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 269
<211> 115
<212> PRT
<213> 小果野蕉
<400> 269
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Thr Thr Leu Ser Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 270
<211> 115
<212> PRT
<213> 莲
<400> 270
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
85 90 95
Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 271
<211> 115
<212> PRT
<213> 美花烟草
<400> 271
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Ala Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ser Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Arg Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Thr Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Met
85 90 95
Tyr Met Asn Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Gln Cys
100 105 110
Glu Arg Val
115
<210> 272
<211> 116
<212> PRT
<213> 短舌野生稻
<400> 272
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 273
<211> 116
<212> PRT
<213> 短药野生稻
<400> 273
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 274
<211> 116
<212> PRT
<213> 非洲栽培稻
<400> 274
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 275
<211> 116
<212> PRT
<213> 展颖野生稻
<400> 275
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 276
<211> 116
<212> PRT
<213> 南方野生稻
<400> 276
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 277
<211> 116
<212> PRT
<213> 泥瓦拉野生稻
<400> 277
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 278
<211> 116
<212> PRT
<213> 斑点野生稻
<400> 278
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 279
<211> 116
<212> PRT
<213> 普通野生稻
<400> 279
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 280
<211> 116
<212> PRT
<213> 亚洲栽培稻
<400> 280
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 281
<211> 115
<212> PRT
<213> 菜豆
<400> 281
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Gln Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Ser Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Phe Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 282
<211> 115
<212> PRT
<213> 毛果杨
<400> 282
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Val Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Glu Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 283
<211> 115
<212> PRT
<213> 桃
<400> 283
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
85 90 95
Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 284
<211> 115
<212> PRT
<213> 蓖麻
<400> 284
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Ser Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Gln Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 285
<211> 116
<212> PRT
<213> 粟
<400> 285
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 286
<211> 115
<212> PRT
<213> 马铃薯
<400> 286
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu
1 5 10 15
Ser Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Arg Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe
85 90 95
Tyr Met Gln Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 287
<211> 116
<212> PRT
<213> 双色高粱
<400> 287
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
His Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met His Met Pro Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 288
<211> 115
<212> PRT
<213> 可可树
<400> 288
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Leu Leu Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 289
<211> 116
<212> PRT
<213> 乌拉尔图小麦
<400> 289
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Ser Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
His Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 290
<211> 115
<212> PRT
<213> 葡萄
<400> 290
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Ala Ile Leu Glu Glu
1 5 10 15
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
20 25 30
Ala Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Thr Leu Lys Leu Ser Pro Gln Leu
85 90 95
Tyr Met His Met Asn Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
100 105 110
Glu Arg Val
115
<210> 291
<211> 116
<212> PRT
<213> 玉米
<400> 291
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
1 5 10 15
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Ala Leu
20 25 30
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
35 40 45
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
50 55 60
Tyr Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
65 70 75 80
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
85 90 95
Leu Tyr Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
100 105 110
Cys Glu Arg Val
115
<210> 292
<211> 56
<212> RNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸
<400> 292
ccgccaggug gagguguggu uccagaacag gcgcgccagg acgaagcuga agcaga 56
<210> 293
<211> 56
<212> RNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸
<400> 293
ggcgguccac cuccacacca aggucuuguc cgcgcggucc ugcuucgacu ucgucu 56
<210> 294
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 294
Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu
1 5 10 15
Lys Gln
<210> 295
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸
<400> 295
aagaagctcc gcctgtccaa ggaccaggcc gccgtcctcg aggagagctt caaggagcat 60
aacacactca accccgtacg tgtataatta cttatatcct ccaaaaagaa acatcg 116
<210> 296
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<400> 296
Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Glu Ser
1 5 10 15
Phe Lys Glu His Asn Thr Leu Asn Pro
20 25
<210> 297
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸
<400> 297
aagaagctcc gcctgtccaa ggaccaggcc gccgtcctcg aggagagctt caaggagcat 60
aacacgtacg tgtataatta cttatatcct ccaaaaagaa acatcg 106
<210> 298
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸
<400> 298
caaggaccag gccgccgtcc tcgaggagag cttcaaggag cataacacaa gcagaaggcg 60
gcgctggcga agcagctgaa cctgaagccg cgtcaggtgg aggtgtggtt ccagaaccgc 120
agagcc 126
<210> 299
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸
<400> 299
gttcctggtc cggcggcagg agctcctctc gaagttcctc gtattgtgtt cgtcttccgc 60
cgcgaccgct tcgtcgactt ggacttcggc gcagtccacc tccacaccaa ggtcttggcg 120
tctcgg 126
<210> 300
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<400> 300
Lys Asp Gln Ala Ala Val Leu Glu Glu Ser Phe Lys Glu His Asn Thr
1 5 10 15
Ser Arg Arg Arg Arg Trp Arg Ser Ser
20 25
<210> 301
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 合成的肽
<400> 301
Ser Arg Val Arg Trp Arg Cys Gly Ser Arg Thr Ala Glu Pro
1 5 10
<210> 302
<211> 53
<212> PRT
<213> 大麦
<400> 302
Leu Ala Arg Gln Leu Arg Leu Arg Pro Arg Gln Val Glu Val Trp Phe
1 5 10 15
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
20 25 30
Glu Ser Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg
35 40 45
Leu Gln Arg Glu Val
50
<210> 303
<211> 323
<212> PRT
<213> 短药野生稻
<220>
<221> misc_feature
<222> (243)..(291)
<223> Xaa可以是任何天然氨基酸
<400> 303
Met Glu Thr Met Val His Gly Arg Arg Glu Gln Gln Arg His Val Gly
1 5 10 15
Leu Gly Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly Val Gly Ala Val
20 25 30
Asp Glu Gln Pro Cys Arg Gly Ala Arg Val Pro Ser Pro Ala Ala Pro
35 40 45
Pro Pro Pro Ser Gln Glu Cys Ser Trp Ser Gly Ala Gly Leu Phe Ser
50 55 60
Ser Ser Ser Ser Asp Arg Arg Ser Thr Thr Met Met Thr Ala Met Ala
65 70 75 80
Ala Cys His Asp Val Glu Met Pro Phe Leu Arg Gly Ile Asp Val Asn
85 90 95
Arg Ala Pro Ala Glu Thr Thr Arg Pro Gly Leu Ser Cys Ser Glu Glu
100 105 110
Asp Glu Glu Thr Gly Ala Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu
115 120 125
Ser Gly Lys Arg Gly Ala Pro Ala Ala Ala Arg Thr Ala Ala Ala Gly
130 135 140
Gly Ser Asp Asp Glu Asp Ser Gly Ala Gly Ala Gly Ser Arg Lys Lys
145 150 155 160
Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr Phe Lys
165 170 175
Glu His Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Arg Gln
180 185 190
Leu Gly Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg
195 200 205
Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu Leu Lys
210 215 220
Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu His Lys Glu
225 230 235 240
Leu Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
245 250 255
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
260 265 270
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
275 280 285
Xaa Xaa Xaa Pro Arg Gln His Pro Pro Arg Pro Ala Asp Val Val Pro
290 295 300
Pro Gln Ala Gly Gly Glu Glu Ala Ala Ala Val Val Glu Val Leu His
305 310 315 320
Trp Arg Gly
<210> 304
<211> 1648
<212> DNA
<213> 玉米
<400> 304
actgccacac cacatcgaca gctccatcga ttcatccacc gctatctctc tctctctctc 60
tctctctctc tctctctctc tctttcaact gtaagggaaa ccgagctcaa agtggcaacc 120
atcaatggat attatggcgc ttaatgcgag agacgaggag cagtacggga acaaccatct 180
cgggctcggg ctgagcctca gcctcggcct cggcgtcgcc accgcggctc cggtcgaggt 240
cgagcccccg ccaccgccgc ggcagcagca gcagcgagct atcagcgtcg cgcccatcac 300
ctccctcccc gcgccgcagt ggtggaagtg gaacggcccc ggtctcttct tcggtgagta 360
attgattcaa agagcagaca ccgcatgcat gacgccgttc ctctaatcct gacagagata 420
ctgcgcgcat gcatgcaggg acgacaatgg atcagcagca gcagccggcg gccgcgcgcc 480
acggccacga gatgccgttc ctgcgggggg tggacgtgaa ccgggcccct gccggggata 540
ccaggagggg tagctgcagc gaggacgacg aggagcctgg cggcgcgtcg tcgtcgccaa 600
acagcacgct ctccagcagc ctcagcggga agcgcgcagc tccggcgagg agcggcggag 660
aggtggccga ccacaccccg agagccggag gcggcagcga cgacgaggac tccggcggtg 720
ggtcgcgcaa gaagctccgc ctgtccaagg accaggccgc cgtcctcgag gagagcttca 780
aggagcataa cacactcaac cccgtacgtg tataattact tatatcctcc aaaaagaaac 840
atcgatcaac cttcaactcg atctaataat aataagaacc gttggctgat cagaagcaga 900
aggcggcgct ggcgaagcag ctgaacctga agccgcgtca ggtggaggtg tggttccaga 960
accgcagagc caggtgaaca aagcagcgcc cttgaagcag cacacgcatg ccatttatac 1020
tgactcatcc tccgtggcta atactagtct aataataata ttatcgttca ggacgaagct 1080
gaagcagacg gaggtggact gcgagttcct gaagcgctgc tgcgagacgc tgacggagga 1140
gaaccggcgg ctgcagcggg aggtggcgga gctgcgcgtg ctcaagctcg tggcgccgca 1200
ccactacgcg cgcatgccgc cgcccaccac gctcaccatg tgcccctcct gcgagcgcct 1260
cgcctccgcg tccgcgtccg ccgaccaggc gggccgtgca gggccctgct ggggccctct 1320
ccccgtgttc gtcgacggcc cagcccggag gccgtgatcc acgaccacga tatggcatga 1380
gatggatgcg cttgctaatc gctaccgcta gctaagtagc tagtgctaat tagggctgga 1440
tcttcttttt ttctttgttt ggttcttatt atactcgcag gctattacag cttagtagtg 1500
tttattagtc cgatatgata aaaatcttcg ttgtttggca gtgttttatt tgctgaaaaa 1560
tagataacga tgtcttatgt ctttgtactc ataagtgatg caaaattgtc ttactactac 1620
tttgcatata taaggtttca gttgttaa 1648
<210> 305
<211> 1375
<212> DNA
<213> 玉米
<400> 305
actgccacac cacatcgaca gctccatcga ttcatccacc gctatctctc tctctctctc 60
tctctctctc tctctctctc tctttcaact gtaagggaaa ccgagctcaa agtggcaacc 120
atcaatggat attatggcgc ttaatgcgag agacgaggag cagtacggga acaaccatct 180
cgggctcggg ctgagcctca gcctcggcct cggcgtcgcc accgcggctc cggtcgaggt 240
cgagcccccg ccaccgccgc ggcagcagca gcagcgagct atcagcgtcg cgcccatcac 300
ctccctcccc gcgccgcagt ggtggaagtg gaacggcccc ggtctcttct tcgggacgac 360
aatggatcag cagcagcagc cggcggccgc gcgccacggc cacgagatgc cgttcctgcg 420
gggggtggac gtgaaccggg cccctgccgg ggataccagg aggggtagct gcagcgagga 480
cgacgaggag cctggcggcg cgtcgtcgtc gccaaacagc acgctctcca gcagcctcag 540
cgggaagcgc gcagctccgg cgaggagcgg cggagaggtg gccgaccaca ccccgagagc 600
cggaggcggc agcgacgacg aggactccgg cggtgggtcg cgcaagaagc tccgcctgtc 660
caaggaccag gccgccgtcc tcgaggagag cttcaaggag cataacacac tcaaccccaa 720
gcagaaggcg gcgctggcga agcagctgaa cctgaagccg cgtcaggtgg aggtgtggtt 780
ccagaaccgc agagccagga cgaagctgaa gcagacggag gtggactgcg agttcctgaa 840
gcgctgctgc gagacgctga cggaggagaa ccggcggctg cagcgggagg tggcggagct 900
gcgcgtgctc aagctcgtgg cgccgcacca ctacgcgcgc atgccgccgc ccaccacgct 960
caccatgtgc ccctcctgcg agcgcctcgc ctccgcgtcc gcgtccgccg accaggcggg 1020
ccgtgcaggg ccctgctggg gccctctccc cgtgttcgtc gacggcccag cccggaggcc 1080
gtgatccacg accacgatat ggcatgagat ggatgcgctt gctaatcgct accgctagct 1140
aagtagctag tgctaattag ggctggatct tctttttttc tttgtttggt tcttattata 1200
ctcgcaggct attacagctt agtagtgttt attagtccga tatgataaaa atcttcgttg 1260
tttggcagtg ttttatttgc tgaaaaatag ataacgatgt cttatgtctt tgtactcata 1320
agtgatgcaa aattgtctta ctactacttt gcatatataa ggtttcagtt gttaa 1375
<210> 306
<211> 314
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 306
Met Asp Ile Met Ala Leu Asn Ala Arg Asp Glu Glu Gln Tyr Gly Asn
1 5 10 15
Asn His Leu Gly Leu Gly Leu Ser Leu Ser Leu Gly Leu Gly Val Ala
20 25 30
Thr Ala Ala Pro Val Glu Val Glu Pro Pro Pro Pro Pro Arg Gln Gln
35 40 45
Gln Gln Arg Ala Ile Ser Val Ala Pro Ile Thr Ser Leu Pro Ala Pro
50 55 60
Gln Trp Trp Lys Trp Asn Gly Pro Gly Leu Phe Phe Gly Thr Thr Met
65 70 75 80
Asp Gln Gln Gln Gln Pro Ala Ala Ala Arg His Gly His Glu Met Pro
85 90 95
Phe Leu Arg Gly Val Asp Val Asn Arg Ala Pro Ala Gly Asp Thr Arg
100 105 110
Arg Gly Ser Cys Ser Glu Asp Asp Glu Glu Pro Gly Gly Ala Ser Ser
115 120 125
Ser Pro Asn Ser Thr Leu Ser Ser Ser Leu Ser Gly Lys Arg Ala Ala
130 135 140
Pro Ala Arg Ser Gly Gly Glu Val Ala Asp His Thr Pro Arg Ala Gly
145 150 155 160
Gly Gly Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg Lys Lys Leu
165 170 175
Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Glu Ser Phe Lys Glu
180 185 190
His Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Lys Gln Leu
195 200 205
Asn Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
210 215 220
Arg Thr Lys Leu Met Arg Val Pro Glu Ala Leu Leu Arg Asp Ala Asp
225 230 235 240
Gly Gly Glu Pro Ala Ala Ala Ala Gly Gly Gly Gly Ala Ala Arg Ala
245 250 255
Gln Ala Arg Gly Ala Ala Pro Leu Arg Ala His Ala Ala Ala His His
260 265 270
Ala His His Val Pro Leu Leu Arg Ala Pro Arg Leu Arg Val Arg Val
275 280 285
Arg Arg Pro Gly Gly Pro Cys Arg Ala Leu Leu Gly Pro Ser Pro Arg
290 295 300
Val Arg Arg Arg Pro Ser Pro Glu Ala Val
305 310
<210> 307
<211> 1631
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 307
actgccacac cacatcgaca gctccatcga ttcatccacc gctatctctc tctctctctc 60
tctctctctc tctctctctc tctttcaact gtaagggaaa ccgagctcaa agtggcaacc 120
atcaatggat attatggcgc ttaatgcgag agacgaggag cagtacggga acaaccatct 180
cgggctcggg ctgagcctca gcctcggcct cggcgtcgcc accgcggctc cggtcgaggt 240
cgagcccccg ccaccgccgc ggcagcagca gcagcgagct atcagcgtcg cgcccatcac 300
ctccctcccc gcgccgcagt ggtggaagtg gaacggcccc ggtctcttct tcggtgagta 360
attgattcaa agagcagaca ccgcatgcat gacgccgttc ctctaatcct gacagagata 420
ctgcgcgcat gcatgcaggg acgacaatgg atcagcagca gcagccggcg gccgcgcgcc 480
acggccacga gatgccgttc ctgcgggggg tggacgtgaa ccgggcccct gccggggata 540
ccaggagggg tagctgcagc gaggacgacg aggagcctgg cggcgcgtcg tcgtcgccaa 600
acagcacgct ctccagcagc ctcagcggga agcgcgcagc tccggcgagg agcggcggag 660
aggtggccga ccacaccccg agagccggag gcggcagcga cgacgaggac tccggcggtg 720
ggtcgcgcaa gaagctccgc ctgtccaagg accaggccgc cgtcctcgag gagagcttca 780
aggagcataa cacactcaac cccgtacgtg tataattact tatatcctcc aaaaagaaac 840
atcgatcaac cttcaactcg atctaataat aataagaacc gttggctgat cagaagcaga 900
aggcggcgct ggcgaagcag ctgaacctga agccgcgtca ggtggaggtg tggttccaga 960
accgcagagc caggtgaaca aagcagcgcc cttgaagcag cacacgcatg ccatttatac 1020
tgactcatcc tccgtggcta atactagtct aataataata ttatcgttca ggacgaagct 1080
gatgcgagtt cctgaagcgc tgctgcgaga cgctgacgga ggagaaccgg cggctgcagc 1140
gggaggtggc ggagctgcgc gtgctcaagc tcgtggcgcc gcaccactac gcgcgcatgc 1200
cgccgcccac cacgctcacc atgtgcccct cctgcgagcg cctcgcctcc gcgtccgcgt 1260
ccgccgacca ggcgggccgt gcagggccct gctggggccc tctccccgtg ttcgtcgacg 1320
gcccagcccg gaggccgtga tccacgacca cgatatggca tgagatggat gcgcttgcta 1380
atcgctaccg ctagctaagt agctagtgct aattagggct ggatcttctt tttttctttg 1440
tttggttctt attatactcg caggctatta cagcttagta gtgtttatta gtccgatatg 1500
ataaaaatct tcgttgtttg gcagtgtttt atttgctgaa aaatagataa cgatgtctta 1560
tgtctttgta ctcataagtg atgcaaaatt gtcttactac tactttgcat atataaggtt 1620
tcagttgtta a 1631
<210> 308
<211> 943
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 308
atggatatta tggcgcttaa tgcgagagac gaggagcagt acgggaacaa ccatctcggg 60
ctcgggctga gcctcagcct cggcctcggc gtcgccaccg cggctccggt cgaggtcgag 120
cccccgccac cgccgcggca gcagcagcag cgagctatca gcgtcgcgcc catcacctcc 180
ctccccgcgc cgcagtggtg gaagtggaac ggccccggtc tcttcttcgg gacgacaatg 240
gatcagcagc agcagccggc ggccgcgcgc cacggccacg agatgccgtt cctgcggggg 300
gtggacgtga accgggcccc tgccggggat accaggaggg gtagctgcag cgaggacgac 360
gaggagcctg gcggcgcgtc gtcgtcgcca aacagcacgc tctccagcag cctcagcggg 420
aagcgcgcag ctccggcgag gagcggcgga gaggtggccg accacacccc gagagccgga 480
ggcggcagcg acgacgagga ctccggcggt gggtcgcgca agaagctccg cctgtccaag 540
gaccaggccg ccgtcctcga ggagagcttc aaggagcata acacactcaa ccccaagcag 600
aaggcggcgc tggcgaagca gctgaacctg aagccgcgtc aggtggaggt gtggttccag 660
aaccgcagag ccaggacgaa gctgatgcga gttcctgaag cgctgctgcg agacgctgac 720
ggaggagaac cggcggctgc agcgggaggt ggcggagctg cgcgtgctca agctcgtggc 780
gccgcaccac tacgcgcgca tgccgccgcc caccacgctc accatgtgcc cctcctgcga 840
gcgcctcgcc tccgcgtccg cgtccgccga ccaggcgggc cgtgcagggc cctgctgggg 900
ccctctcccc gtgttcgtcg acggcccagc ccggaggccg tga 943
<210> 309
<211> 1358
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 309
actgccacac cacatcgaca gctccatcga ttcatccacc gctatctctc tctctctctc 60
tctctctctc tctctctctc tctttcaact gtaagggaaa ccgagctcaa agtggcaacc 120
atcaatggat attatggcgc ttaatgcgag agacgaggag cagtacggga acaaccatct 180
cgggctcggg ctgagcctca gcctcggcct cggcgtcgcc accgcggctc cggtcgaggt 240
cgagcccccg ccaccgccgc ggcagcagca gcagcgagct atcagcgtcg cgcccatcac 300
ctccctcccc gcgccgcagt ggtggaagtg gaacggcccc ggtctcttct tcgggacgac 360
aatggatcag cagcagcagc cggcggccgc gcgccacggc cacgagatgc cgttcctgcg 420
gggggtggac gtgaaccggg cccctgccgg ggataccagg aggggtagct gcagcgagga 480
cgacgaggag cctggcggcg cgtcgtcgtc gccaaacagc acgctctcca gcagcctcag 540
cgggaagcgc gcagctccgg cgaggagcgg cggagaggtg gccgaccaca ccccgagagc 600
cggaggcggc agcgacgacg aggactccgg cggtgggtcg cgcaagaagc tccgcctgtc 660
caaggaccag gccgccgtcc tcgaggagag cttcaaggag cataacacac tcaaccccaa 720
gcagaaggcg gcgctggcga agcagctgaa cctgaagccg cgtcaggtgg aggtgtggtt 780
ccagaaccgc agagccagga cgaagctgat gcgagttcct gaagcgctgc tgcgagacgc 840
tgacggagga gaaccggcgg ctgcagcggg aggtggcgga gctgcgcgtg ctcaagctcg 900
tggcgccgca ccactacgcg cgcatgccgc cgcccaccac gctcaccatg tgcccctcct 960
gcgagcgcct cgcctccgcg tccgcgtccg ccgaccaggc gggccgtgca gggccctgct 1020
ggggccctct ccccgtgttc gtcgacggcc cagcccggag gccgtgatcc acgaccacga 1080
tatggcatga gatggatgcg cttgctaatc gctaccgcta gctaagtagc tagtgctaat 1140
tagggctgga tcttcttttt ttctttgttt ggttcttatt atactcgcag gctattacag 1200
cttagtagtg tttattagtc cgatatgata aaaatcttcg ttgtttggca gtgttttatt 1260
tgctgaaaaa tagataacga tgtcttatgt ctttgtactc ataagtgatg caaaattgtc 1320
ttactactac tttgcatata taaggtttca gttgttaa 1358
<210> 310
<211> 1708
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 310
cttcttttat caccttcatc tatatctact gctactctca gtactatata tctatcccca 60
gttccatagt tcttccagct ctacacatac acatacacgc agcacgctag ctctagctct 120
cacatcgatt gagatcatca gagaggtgga agaagaagga gctaagatac cagatcgagg 180
aagagaggcg gtgcggtcgg tagatgatgg agagggtcga ggacttaggg ctcagcctca 240
gcctcagctc gtccctcgcg tctcctcgaa ctcaccatgt cgccaccatg ctgctacgcg 300
ctccaggtaa atataatgca atttgctata tatatatata tatatatata tctctgtact 360
aagtagctat atatgctgct tggatgatct atcagagagt atttagctag ctcctgcagg 420
cacgcgcgct actgctagca gctaactgtg aatgaccata tcaattaagc tatagctagc 480
tctagtgtac atgtgtgagt tttatgtctg tctgactata tgtaagatta gtagtcagca 540
actacaaacc gtacgtgtat ggctggcact ctgatgcatc acatataatg tatcagagaa 600
gaggttcctg gagatgccac tgctgctgcc cgcgaagcgg acgaccgagg tcaccggcga 660
ggatggcctg cgaggcggca gcgacgagga ggacggcggc tgcggcatcg acggctccag 720
gaagaagctc cggctgtcca aggaccagtc cgccgtgctc gaggatagct tccgggagca 780
cccaactctc aaccctgtaa gtactagtag tatagtagta gcagctagca ttaagagcta 840
cagttctgtg gttcatcctc ccggccgctc accaagactc ctgatggacg aacgtacagc 900
taggctaggc agcagtagct ttcaatcatt cgccggttct cgaccttatc aacctgcctg 960
tgactgtgag ctgtactaac ttgcttatta atggcgtgca gcggcagaag gcagccttgg 1020
cgcagcagct aggcctgcgg ccccgccagg tggaggtgtg gttccagaac aggcgcgcca 1080
ggtacgtacg tagcgcacat gcgatatgtc gccgcgcgct agctgcttcg cgtgtgctga 1140
tgatcagcaa gcatgcactg catgtctgca tgggatttct ctctcttttc tgcccctcgc 1200
tcgatcgctt cattcgttcg tgcaggacga agctgaagca gacggaggtg gactgcgagt 1260
acctgaagcg ctgctgcgag acgctgacgg aggagaaccg gcggctgcag aaggaggtgc 1320
aggagctccg cgcgctcaag ctcgtgtcgc cgcacctcta catgcacatg tccccgccca 1380
ccaccctcac catgtgcccc tcctgcgagc gcgtctcctc gtccaacggc aactccgcag 1440
ctgccacggc cgccgcgcgc gcgcgcgccg gcgccggcgc cggcgccatc gtctgccacc 1500
cgatcgaccg agccactagt acgtagtagt agtagctgct acactagcta gctgtacacg 1560
ggcgccggcc gtaacgtgta aaagccaaca aaacagtctc tctgcgcatt tattcgaccg 1620
tgcaaacgac tgttccctcg ttaatcttag tattggtatt gactagtcac ccacagtatt 1680
agacttgaag atccagcaga ttacagtt 1708
<210> 311
<211> 1069
<212> DNA
<213> 玉米
<400> 311
cttcttttat caccttcatc tatatctact gctactctca gtactatata tctatcccca 60
gttccatagt tcttccagct ctacacatac acatacacgc agcacgctag ctctagctct 120
cacatcgatt gagatcatca gagaggtgga agaagaagga gctaagatac cagatcgagg 180
aagagaggcg gtgcggtcgg tagatgatgg agagggtcga ggacttaggg ctcagcctca 240
gcctcagctc gtccctcgcg tctcctcgaa ctcaccatgt cgccaccatg ctgctacgcg 300
ctccagagaa gaggttcctg gagatgccac tgctgctgcc cgcgaagcgg acgaccgagg 360
tcaccggcga ggatggcctg cgaggcggca gcgacgagga ggacggcggc tgcggcatcg 420
acggctccag gaagaagctc cggctgtcca aggaccagtc cgccgtgctc gaggatagct 480
tccgggagca cccaactctc aaccctcggc agaaggcagc cttggcgcag cagctaggcc 540
tgcggccccg ccaggtggag gtgtggttcc agaacaggcg cgccaggacg aagctgaagc 600
agacggaggt ggactgcgag tacctgaagc gctgctgcga gacgctgacg gaggagaacc 660
ggcggctgca gaaggaggtg caggagctcc gcgcgctcaa gctcgtgtcg ccgcacctct 720
acatgcacat gtccccgccc accaccctca ccatgtgccc ctcctgcgag cgcgtctcct 780
cgtccaacgg caactccgca gctgccacgg ccgccgcgcg cgcgcgcgcc ggcgccggcg 840
ccggcgccat cgtctgccac ccgatcgacc gagccactag tacgtagtag tagtagctgc 900
tacactagct agctgtacac gggcgccggc cgtaacgtgt aaaagccaac aaaacagtct 960
ctctgcgcat ttattcgacc gtgcaaacga ctgttccctc gttaatctta gtattggtat 1020
tgactagtca cccacagtat tagacttgaa gatccagcag attacagtt 1069
<210> 312
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 312
Met Met Glu Arg Val Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Ser Leu Ala Ser Pro Arg Thr His His Val Ala Thr Met Leu Leu Arg
20 25 30
Ala Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Leu Pro Ala Lys
35 40 45
Arg Thr Thr Glu Val Thr Gly Glu Asp Gly Leu Arg Gly Gly Ser Asp
50 55 60
Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys Lys Leu Arg
65 70 75 80
Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg Glu His
85 90 95
Pro Thr Asn Gly Arg Arg Gln Pro Trp Arg Ser Ser
100 105
<210> 313
<211> 1697
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 313
cttcttttat caccttcatc tatatctact gctactctca gtactatata tctatcccca 60
gttccatagt tcttccagct ctacacatac acatacacgc agcacgctag ctctagctct 120
cacatcgatt gagatcatca gagaggtgga agaagaagga gctaagatac cagatcgagg 180
aagagaggcg gtgcggtcgg tagatgatgg agagggtcga ggacttaggg ctcagcctca 240
gcctcagctc gtccctcgcg tctcctcgaa ctcaccatgt cgccaccatg ctgctacgcg 300
ctccaggtaa atataatgca atttgctata tatatatata tatatatata tctctgtact 360
aagtagctat atatgctgct tggatgatct atcagagagt atttagctag ctcctgcagg 420
cacgcgcgct actgctagca gctaactgtg aatgaccata tcaattaagc tatagctagc 480
tctagtgtac atgtgtgagt tttatgtctg tctgactata tgtaagatta gtagtcagca 540
actacaaacc gtacgtgtat ggctggcact ctgatgcatc acatataatg tatcagagaa 600
gaggttcctg gagatgccac tgctgctgcc cgcgaagcgg acgaccgagg tcaccggcga 660
ggatggcctg cgaggcggca gcgacgagga ggacggcggc tgcggcatcg acggctccag 720
gaagaagctc cggctgtcca aggaccagtc cgccgtgctc gaggatagct tccgggagca 780
cccaactaag tactagtagt atagtagtag cagctagcat taagagctac agttctgtgg 840
ttcatcctcc cggccgctca ccaagactcc tgatggacga acgtacagct aggctaggca 900
gcagtagctt tcaatcattc gccggttctc gaccttatca acctgcctgt gactgtgagc 960
tgtactaact tgcttattaa tggcgtgcag cggcagaagg cagccttggc gcagcagcta 1020
ggcctgcggc cccgccaggt ggaggtgtgg ttccagaaca ggcgcgccag gtacgtacgt 1080
agcgcacatg cgatatgtcg ccgcgcgcta gctgcttcgc gtgtgctgat gatcagcaag 1140
catgcactgc atgtctgcat gggatttctc tctcttttct gcccctcgct cgatcgcttc 1200
attcgttcgt gcaggacgaa gctgaagcag acggaggtgg actgcgagta cctgaagcgc 1260
tgctgcgaga cgctgacgga ggagaaccgg cggctgcaga aggaggtgca ggagctccgc 1320
gcgctcaagc tcgtgtcgcc gcacctctac atgcacatgt ccccgcccac caccctcacc 1380
atgtgcccct cctgcgagcg cgtctcctcg tccaacggca actccgcagc tgccacggcc 1440
gccgcgcgcg cgcgcgccgg cgccggcgcc ggcgccatcg tctgccaccc gatcgaccga 1500
gccactagta cgtagtagta gtagctgcta cactagctag ctgtacacgg gcgccggccg 1560
taacgtgtaa aagccaacaa aacagtctct ctgcgcattt attcgaccgt gcaaacgact 1620
gttccctcgt taatcttagt attggtattg actagtcacc cacagtatta gacttgaaga 1680
tccagcagat tacagtt 1697
<210> 314
<211> 677
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 314
atgatggaga gggtcgagga cttagggctc agcctcagcc tcagctcgtc cctcgcgtct 60
cctcgaactc accatgtcgc caccatgctg ctacgcgctc cagagaagag gttcctggag 120
atgccactgc tgctgcccgc gaagcggacg accgaggtca ccggcgagga tggcctgcga 180
ggcggcagcg acgaggagga cggcggctgc ggcatcgacg gctccaggaa gaagctccgg 240
ctgtccaagg accagtccgc cgtgctcgag gatagcttcc gggagcaccc aactaacggc 300
agaaggcagc cttggcgcag cagctaggcc tgcggccccg ccaggtggag gtgtggttcc 360
agaacaggcg cgccaggacg aagctgaagc agacggaggt ggactgcgag tacctgaagc 420
gctgctgcga gacgctgacg gaggagaacc ggcggctgca gaaggaggtg caggagctcc 480
gcgcgctcaa gctcgtgtcg ccgcacctct acatgcacat gtccccgccc accaccctca 540
ccatgtgccc ctcctgcgag cgcgtctcct cgtccaacgg caactccgca gctgccacgg 600
ccgccgcgcg cgcgcgcgcc ggcgccggcg ccggcgccat cgtctgccac ccgatcgacc 660
gagccactag tacgtag 677
<210> 315
<211> 1062
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 315
cttcttttat caccttcatc tatatctact gctactctca gtactatata tctatcccca 60
gttccatagt tcttccagct ctacacatac acatacacgc agcacgctag ctctagctct 120
cacatcgatt gagatcatca gagaggtgga agaagaagga gctaagatac cagatcgagg 180
aagagaggcg gtgcggtcgg tagatgatgg agagggtcga ggacttaggg ctcagcctca 240
gcctcagctc gtccctcgcg tctcctcgaa ctcaccatgt cgccaccatg ctgctacgcg 300
ctccagagaa gaggttcctg gagatgccac tgctgctgcc cgcgaagcgg acgaccgagg 360
tcaccggcga ggatggcctg cgaggcggca gcgacgagga ggacggcggc tgcggcatcg 420
acggctccag gaagaagctc cggctgtcca aggaccagtc cgccgtgctc gaggatagct 480
tccgggagca cccaactaac ggcagaaggc agccttggcg cagcagctag gcctgcggcc 540
ccgccaggtg gaggtgtggt tccagaacag gcgcgccagg acgaagctga agcagacgga 600
ggtggactgc gagtacctga agcgctgctg cgagacgctg acggaggaga accggcggct 660
gcagaaggag gtgcaggagc tccgcgcgct caagctcgtg tcgccgcacc tctacatgca 720
catgtccccg cccaccaccc tcaccatgtg cccctcctgc gagcgcgtct cctcgtccaa 780
cggcaactcc gcagctgcca cggccgccgc gcgcgcgcgc gccggcgccg gcgccggcgc 840
catcgtctgc cacccgatcg accgagccac tagtacgtag tagtagtagc tgctacacta 900
gctagctgta cacgggcgcc ggccgtaacg tgtaaaagcc aacaaaacag tctctctgcg 960
catttattcg accgtgcaaa cgactgttcc ctcgttaatc ttagtattgg tattgactag 1020
tcacccacag tattagactt gaagatccag cagattacag tt 1062
<210> 316
<211> 109
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 316
Met Met Glu Arg Val Glu Asp Leu Gly Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Ser Leu Ala Ser Pro Arg Thr His His Val Ala Thr Met Leu Leu Arg
20 25 30
Ala Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Leu Pro Ala Lys
35 40 45
Arg Thr Thr Glu Val Thr Gly Glu Asp Gly Leu Arg Gly Gly Ser Asp
50 55 60
Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser Arg Lys Lys Leu Arg
65 70 75 80
Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp Ser Phe Arg Glu His
85 90 95
Pro Thr Leu Asn Gly Arg Arg Gln Pro Trp Arg Ser Ser
100 105
<210> 317
<211> 1700
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 317
cttcttttat caccttcatc tatatctact gctactctca gtactatata tctatcccca 60
gttccatagt tcttccagct ctacacatac acatacacgc agcacgctag ctctagctct 120
cacatcgatt gagatcatca gagaggtgga agaagaagga gctaagatac cagatcgagg 180
aagagaggcg gtgcggtcgg tagatgatgg agagggtcga ggacttaggg ctcagcctca 240
gcctcagctc gtccctcgcg tctcctcgaa ctcaccatgt cgccaccatg ctgctacgcg 300
ctccaggtaa atataatgca atttgctata tatatatata tatatatata tctctgtact 360
aagtagctat atatgctgct tggatgatct atcagagagt atttagctag ctcctgcagg 420
cacgcgcgct actgctagca gctaactgtg aatgaccata tcaattaagc tatagctagc 480
tctagtgtac atgtgtgagt tttatgtctg tctgactata tgtaagatta gtagtcagca 540
actacaaacc gtacgtgtat ggctggcact ctgatgcatc acatataatg tatcagagaa 600
gaggttcctg gagatgccac tgctgctgcc cgcgaagcgg acgaccgagg tcaccggcga 660
ggatggcctg cgaggcggca gcgacgagga ggacggcggc tgcggcatcg acggctccag 720
gaagaagctc cggctgtcca aggaccagtc cgccgtgctc gaggatagct tccgggagca 780
cccaactctt aagtactagt agtatagtag tagcagctag cattaagagc tacagttctg 840
tggttcatcc tcccggccgc tcaccaagac tcctgatgga cgaacgtaca gctaggctag 900
gcagcagtag ctttcaatca ttcgccggtt ctcgacctta tcaacctgcc tgtgactgtg 960
agctgtacta acttgcttat taatggcgtg cagcggcaga aggcagcctt ggcgcagcag 1020
ctaggcctgc ggccccgcca ggtggaggtg tggttccaga acaggcgcgc caggtacgta 1080
cgtagcgcac atgcgatatg tcgccgcgcg ctagctgctt cgcgtgtgct gatgatcagc 1140
aagcatgcac tgcatgtctg catgggattt ctctctcttt tctgcccctc gctcgatcgc 1200
ttcattcgtt cgtgcaggac gaagctgaag cagacggagg tggactgcga gtacctgaag 1260
cgctgctgcg agacgctgac ggaggagaac cggcggctgc agaaggaggt gcaggagctc 1320
cgcgcgctca agctcgtgtc gccgcacctc tacatgcaca tgtccccgcc caccaccctc 1380
accatgtgcc cctcctgcga gcgcgtctcc tcgtccaacg gcaactccgc agctgccacg 1440
gccgccgcgc gcgcgcgcgc cggcgccggc gccggcgcca tcgtctgcca cccgatcgac 1500
cgagccacta gtacgtagta gtagtagctg ctacactagc tagctgtaca cgggcgccgg 1560
ccgtaacgtg taaaagccaa caaaacagtc tctctgcgca tttattcgac cgtgcaaacg 1620
actgttccct cgttaatctt agtattggta ttgactagtc acccacagta ttagacttga 1680
agatccagca gattacagtt 1700
<210> 318
<211> 680
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 318
atgatggaga gggtcgagga cttagggctc agcctcagcc tcagctcgtc cctcgcgtct 60
cctcgaactc accatgtcgc caccatgctg ctacgcgctc cagagaagag gttcctggag 120
atgccactgc tgctgcccgc gaagcggacg accgaggtca ccggcgagga tggcctgcga 180
ggcggcagcg acgaggagga cggcggctgc ggcatcgacg gctccaggaa gaagctccgg 240
ctgtccaagg accagtccgc cgtgctcgag gatagcttcc gggagcaccc aactcttaac 300
ggcagaaggc agccttggcg cagcagctag gcctgcggcc ccgccaggtg gaggtgtggt 360
tccagaacag gcgcgccagg acgaagctga agcagacgga ggtggactgc gagtacctga 420
agcgctgctg cgagacgctg acggaggaga accggcggct gcagaaggag gtgcaggagc 480
tccgcgcgct caagctcgtg tcgccgcacc tctacatgca catgtccccg cccaccaccc 540
tcaccatgtg cccctcctgc gagcgcgtct cctcgtccaa cggcaactcc gcagctgcca 600
cggccgccgc gcgcgcgcgc gccggcgccg gcgccggcgc catcgtctgc cacccgatcg 660
accgagccac tagtacgtag 680
<210> 319
<211> 1065
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 319
cttcttttat caccttcatc tatatctact gctactctca gtactatata tctatcccca 60
gttccatagt tcttccagct ctacacatac acatacacgc agcacgctag ctctagctct 120
cacatcgatt gagatcatca gagaggtgga agaagaagga gctaagatac cagatcgagg 180
aagagaggcg gtgcggtcgg tagatgatgg agagggtcga ggacttaggg ctcagcctca 240
gcctcagctc gtccctcgcg tctcctcgaa ctcaccatgt cgccaccatg ctgctacgcg 300
ctccagagaa gaggttcctg gagatgccac tgctgctgcc cgcgaagcgg acgaccgagg 360
tcaccggcga ggatggcctg cgaggcggca gcgacgagga ggacggcggc tgcggcatcg 420
acggctccag gaagaagctc cggctgtcca aggaccagtc cgccgtgctc gaggatagct 480
tccgggagca cccaactctt aacggcagaa ggcagccttg gcgcagcagc taggcctgcg 540
gccccgccag gtggaggtgt ggttccagaa caggcgcgcc aggacgaagc tgaagcagac 600
ggaggtggac tgcgagtacc tgaagcgctg ctgcgagacg ctgacggagg agaaccggcg 660
gctgcagaag gaggtgcagg agctccgcgc gctcaagctc gtgtcgccgc acctctacat 720
gcacatgtcc ccgcccacca ccctcaccat gtgcccctcc tgcgagcgcg tctcctcgtc 780
caacggcaac tccgcagctg ccacggccgc cgcgcgcgcg cgcgccggcg ccggcgccgg 840
cgccatcgtc tgccacccga tcgaccgagc cactagtacg tagtagtagt agctgctaca 900
ctagctagct gtacacgggc gccggccgta acgtgtaaaa gccaacaaaa cagtctctct 960
gcgcatttat tcgaccgtgc aaacgactgt tccctcgtta atcttagtat tggtattgac 1020
tagtcaccca cagtattaga cttgaagatc cagcagatta cagtt 1065
<210> 320
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 320
ccaaggacca gtccgccgtg ctcgaggata gcttccggga gcacccaact aagtactagt 60
agtatagtag tagcagctag cattaagagc 90
<210> 321
<211> 101
<212> DNA
<213> 玉米
<400> 321
ccaaggacca gtccgccgtg ctcgaggata gcttccggga gcacccaact ctcaaccctg 60
taagtactag tagtatagta gtagcagcta gcattaagag c 101
<210> 322
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 322
ccaaggacca gtccgccgtg ctcgaggata gcttccggga gcacccaact ccctgtaagt 60
actagtagta tagtagtagc agctagcatt aagagc 96
<210> 323
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 323
ccaaggacca gtccgccgtg ctcgaggata gcttccggga gtactagtag tatagtagta 60
gcagctagca ttaagagc 78
<210> 324
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<220>
<221> misc_feature
<222> (42)..(44)
<223> n是a, c, g或t
<400> 324
agtccgccgt gctcgaggat agcttccggg agcacccaac tnnnaagtac tagtagtata 60
gtagtagcag ctagcattaa gagctacagt tc 92
<210> 325
<211> 100
<212> DNA
<213> 玉米
<400> 325
agtccgccgt gctcgaggat agcttccggg agcacccaac tctcaaccct gtaagtacta 60
gtagtatagt agtagcagct agcattaaga gctacagttc 100
<210> 326
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 326
agtccgccgt gctcgaggat agcttccggg agcacccaac tcttaagtac tagtagtata 60
gtagtagcag ctagcattaa gagctacagt tc 92
<210> 327
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 327
agtccgccgt gctcgaggat agcttccggg agcacccaac taagtactag tagtatagta 60
gtagcagcta gcattaagag ctacagttc 89
<210> 328
<211> 132
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 328
ccgcagagcc aggtgaacaa agcagcgccc ttgaagcagc acacgcatgc catttatact 60
gactcatcct ccgtggctaa tactagtcta ataataatat tatcgttcag gacgaagctg 120
atgcgagttc ct 132
<210> 329
<211> 149
<212> DNA
<213> 玉米
<400> 329
ccgcagagcc aggtgaacaa agcagcgccc ttgaagcagc acacgcatgc catttatact 60
gactcatcct ccgtggctaa tactagtcta ataataatat tatcgttcag gacgaagctg 120
aagcagacgg aggtggactg cgagttcct 149
Claims (79)
1.一种在内源的同源结构域-亮氨酸拉链(HD-Zip)转录因子中包含至少一个非天然突变的植物或其部分,其中所述突变破坏所述HD-Zip转录因子与DNA的结合。
2.根据权利要求1所述的植物或其部分,其中所述HD-Zip转录因子是HD-Zip II型(HD-Zip II)转录因子。
3.根据权利要求2所述的植物或其部分,其中所述HD-Zip II转录因子能够调节植物对光照的反应(例如避荫反应(SAR));例如是AtHB2、HB53和/或HB78的直向同源物。
4.根据权利要求3所述的植物或其部分,其中所述HD-Zip II转录因子是同源异型框蛋白53(HB53)或同源异型框蛋白78(HB78)。
5.根据权利要求1-3所述的植物或其部分,其中所述植物是单子叶植物。
6.根据权利要求1-3所述的植物或其部分,其中所述植物是双子叶植物。
7.根据前述权利要求中任一项所述的植物或其部分,其中所述植物是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑树莓或芸苔属某些种。
8.根据权利要求1-5所述的植物或其部分,其中所述植物为玉米,任选地,其中所述玉米植物包含矮小/半矮小表型。
9.根据权利要求1-5所述的植物或其部分,其中所述植物为小麦,任选地,其中HD-Zip转录因子中的所述至少一个非天然突变位于编码所述HD-Zip转录因子的内源基因中,所述内源基因位于A基因组、B基因组、D基因组或其任意组合中。
10.前述权利要求中任一项所述的植物或其植物部分,其中所述HD-Zip转录因子包含:
(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与以下氨基酸序列具有至少80%序列同一性的序列的多肽:
RKKLRLSKDQSAVLEDSFREHPTLNPRQKAALAQQLGLRPR QVEVWFQNRRARTKLKQTEVDCEYLKRCCETLTEENRRLQKEVQE LRALKLVSPHLYMHMSPPTTLTMCPSCERV(SEQ ID NO:1)(玉蜀黍HB53),或
RKKLRLSKDQAAVLEESFKEHNTLNPKQKAALAKQLNLKPR QVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTEENRRLQREVAE LRVLKLVAPHHYARMPPPTTLTMCPSCERL SEQ ID NO:2)(玉蜀黍HB78);
(c)包含与氨基酸序列LAKQLNLKPRQVEVWFQNRRARTKL KQTEVDCEFLKRCCETLTEENRRLQREV(SEQ ID NO:3)具有至少80%序列同一性的序列的多肽;
(d)包含与RQVEVWFQNRRARTKLKQTEVDCE的核苷酸序列(SEQ ID NO:4)具有至少95%序列同一性的序列的多肽;
(e)包含具有氨基酸序列RQVEVWFQNRRARTKXKQTEVDCE(SEQ ID NO:5)的序列的多肽,其中X是L或S;
(f)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
11.根据前述权利要求中任一项所述的植物或其植物部分,其中所述HD-Zip转录因子包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的DNA结合结构域。
12.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个非天然突变是取代、缺失和/或插入。
13.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个非天然突变包含对A、T、G或C的碱基置换,这导致氨基酸取代并破坏所述HD-Zip转录因子与DNA的结合。
14.根据权利要求1至12中任一项所述的植物或其植物部分,其中编码HD-Zip转录因子的内源基因中的至少一个非天然突变包括缺失。
15.根据权利要求14所述的植物或其植物部分,其中所述缺失包括所述HD-Zip转录因子的DNA结合结构域的全部或一部分的缺失(例如,SEQ ID NO:9(VWFQNRRA)的至少1个、2个、3个、4个、5个、6个、7个或8个氨基酸残基的缺失)。
16.根据权利要求14所述的植物或其植物部分,其中所述缺失包括从所述HD-Zip转录因子缺失约1个氨基酸残基至约120个氨基酸残基。
17.根据权利要求16所述的植物或其植物部分,其中所述缺失包括从所述HD-Zip转录因子的C末端截短约96个氨基酸残基至约125个氨基酸残基。
18.根据前述权利要求中任一项所述的植物或其植物部分,其中编码HD-Zip转录因子的内源基因中的所述至少一个非天然突变为显性隐性突变。
19.一种包括编辑系统的植物细胞,所述编辑系统包括:
(a)CRISPR相关效应蛋白;和
(c)具有与编码野生型HD-Zip转录因子的内源靶基因互补的间隔子序列的引导核酸(gRNA、gDNA、crRNA、crDNA)。
20.根据权利要求19所述的植物细胞,其中所述野生型HD-Zip转录因子是野生型HD-Zip II转录因子,任选地是HB53转录因子或HB78转录因子。
21.根据权利要求19或权利要求20所述的植物细胞,其中所述HD-Zip转录因子包含:
(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(f)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
22.根据权利要求19至21中任一项所述的植物细胞,其中所述引导核酸包含SEQ IDNO:175-182中任一所示的核苷酸序列。
23.一种植物,其由权利要求1至18中任一项的植物部分或权利要求19至22中任一项的植物细胞再生而来。
24.一种植物细胞,其包含对内源HD-Zip转录因子基因中DNA结合位点的非天然突变,所述突变防止或减少所述编码的HD-Zip转录因子与DNA的结合,
其中所述非天然突变是使用编辑系统引入的取代、插入和/或缺失,所述编辑系统包括与所述HD-Zip转录因子基因中的靶位点结合的核酸结合结构域,
其中所述HD-Zip转录因子基因编码:
(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(f)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
25.根据权利要求24所述的植物细胞,其中所述编辑系统的所述核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白。
26.一种在内源HD-Zip转录因子中包含突变的植物或其部分,所述突变降低所述内源HD-Zip转录因子的DNA结合,其中所述内源HD-Zip转录因子包含多肽,所述多肽包含与SEQID NO:1或SEQ ID NO:2(玉蜀黍HB78)的氨基酸序列具有至少80%序列同一性的序列;其中所述突变是SEQ ID NO:1或SEQ ID NO:2的氨基酸序列的氨基酸残基45-52(VWFQNRRA(SEQID NO:9))中的至少一个氨基酸残基的缺失、取代和/或插入。
27.根据权利要求26所述的植物或其部分,其中SEQ ID NO:1或SEQ ID NO:2的氨基酸序列的氨基酸残基45-52的所述至少一个氨基酸残基的突变是在被核酸酶切割后产生的,所述核酸酶包含与靶核酸内的靶位点结合的DNA结合结构域,所述靶核酸编码与SEQ IDNO:1(玉蜀黍HB53)或SEQ ID NO:2(玉蜀黍HB78)的氨基酸序列具有至少80%序列同一性的序列。
28.根据权利要求26或27中任一项所述的植物或其部分,其中所述突变是插入和/或缺失。
29.根据权利要求28中任一项所述的植物或其部分,其中所述突变包含所述内源HD-Zip转录因子的DNA结合结构域的全部或部分的缺失。
30.根据权利要求25至29中任一项所述的植物或其部分,其中所述植物是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑树莓或芸苔属某些种。
31.根据权利要求1至18或26至30中任一项所述的植物或其部分,其中所述植物部分是细胞。
32.根据权利要求1至18、23或26至30中任一项所述的植物或其部分,其中所述植物包含减弱的避荫反应。
33.根据权利要求26至32所述的植物或其部分,其中所述植物是玉米,任选地,其中所述玉米植物包含矮小/半矮小表型。
34.一种包含编码SEQ ID NO:201的氨基酸序列的HD-Zip转录因子基因的植物或其植物部分。
35.一种包含HD-Zip转录因子基因的植物或其部分,所述HD-Zip转录因子基因包含SEQID NO:202的核苷酸序列。
36.根据权利要求35所述的植物或植物部分,其中所述植物是玉米。
37.一种提供多个植物的方法,当所述多个植物中的每个植物彼此紧邻种植时,所述植物具有增加的产量,所述方法包括:
将权利要求1-18、23或26-36中任一项的两个或更多个植物彼此紧密相邻地种植,从而提供与彼此紧密相邻种植的多个对照植物相比具有增加的产量的多个植物。
38.一种生产/培育无转基因的基因组编辑的(例如,碱基编辑的)植物的方法,所述方法包括:
(a)将权利要求1-18、23或26-36中任一项的植物与无转基因的植物杂交,从而将所述突变引入无转基因的植物中;以及
(b)选择包含所述突变但无转基因的子代植物,从而产生无转基因的基因组编辑的(例如碱基编辑的)植物。
39.一种编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割所述植物细胞中内源HD-Zip转录因子基因内的靶位点,所述内源HD-Zip转录因子基因编码:
(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(f)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(g)包含具有氨基酸序列VWFQNRRA(SEQ ID No:9)的序列的多肽,从而在所述植物细胞的内源HD-Zip转录因子基因中产生编辑。
40.根据权利要求39所述的方法,其还包括从在所述内源HD-Zip转录因子基因中包含所述编辑的植物细胞再生植物,以产生在其内源HD-Zip转录因子基因中包含所述编辑的植物。
41.根据权利要求40所述的方法,其中在其内源HD-Zip转录因子基因中包含所述编辑的所述植物与不包含所述编辑的对照植物相比,具有减弱的避荫反应。
42.根据权利要求39-41中任一项所述的方法,其中所述编辑导致所述内源HD-Zip转录因子基因中的非天然发生的突变,所述突变产生具有降低的DNA结合的HD-Zip转录因子。
43.一种制造植物的方法,其包括:
(a)将包含编码HD-Zip转录因子的野生型内源基因的植物细胞群与靶向该野生型内源基因的核酸酶接触,其中该核酸酶与DNA结合结构域连接,所述结合结构域与编码以下序列的核酸序列结合:
(i)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(ii)包含与SEQ ID NO:1或SEQ ID No:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(iii)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(iv)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(v)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(vi)多肽,其包含:
(1)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(2)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(3)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(4)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(vii)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽;
(b)从所述群体中选择在编码HD-Zip转录因子的野生型内源基因内包含突变的植物细胞,其中所述突变是(i)-(v)中任一项的多肽中至少一个氨基酸残基的取代和/或缺失,其中所述突变降低或消除了所述HD-Zip转录因子结合DNA的能力;以及
(c)使所述选择的植物细胞生长成植物。
44.一种用于减少植物中的避荫反应的方法,其包括:
(a)将包含编码HD-Zip转录因子的野生型内源基因的植物细胞与靶向所述野生型内源基因的核酸酶接触,其中所述核酸酶与结合所述野生型内源基因中靶位点的DNA结合结构域连接,所述野生型内源基因编码:
(i)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(ii)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(iii)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(iv)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(v)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(vi)多肽,其包含:
(1)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(2)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(3)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(4)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(vii)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生在编码HD-Zip转录因子的野生型内源基因中包含突变的植物细胞;以及
(b)使所述植物细胞生长成植物,从而减少所述植物中的避荫反应。
45.一种用于产生植物或其部分的方法,所述植物或其部分包含在内源HD-Zip转录因子基因中具有突变的至少一个细胞,所述方法包括:
将所述植物或植物部分中内源HD-Zip转录因子基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中所述DNA结合结构域与所述内源HD-Zip转录因子基因中的靶位点结合,
其中所述内源HD-Zip转录因子基因编码:
(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(f)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(g)包含具有氨基酸序列VWFQNRRA(SEQ ID No:9)的序列的多肽,从而产生包含在所述内源HD-Zip转录因子基因中具有突变的至少一个细胞的植物或其部分。
46.根据权利要求45所述的方法,其中所述突变的内源HD-Zip转录因子基因产生具有降低的DNA结合的HD-Zip转录因子。
47.一种产生包含具有降低的DNA结合的突变内源HD-Zip转录因子的植物或其部分的方法,所述方法包括将所述植物或植物部分中内源HD-Zip转录因子基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中所述DNA结合结构域与所述HD-Zip转录因子基因中的靶位点结合,
其中所述HD-Zip转录因子基因编码:
(a)包含与SEQ ID NO:38或SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(d)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(e)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(f)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
(iv)具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(g)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,从而产生具有降低的DNA结合的突变的内源HD-Zip转录因子的植物或其部分。
48.根据权利要求45至47中任一项所述的方法,其中SEQ ID NO:38、SEQ ID NO:83中任一所示的氨基酸序列包含氨基酸序列VWFQNRRA(SEQ ID No:9),并且所述突变的内源HD-Zip转录因子包含氨基酸序列VWFQNRRA(SEQ ID NO:9)中的突变。
49.根据权利要求45至48中任一项所述的方法,其中所述植物与对照植物相比表现出降低的避荫反应。
50.根据权利要求45至49中任一项所述的方法,其中包含降低的避荫反应的所述植物包含以下表型中的至少一种:与和不包含降低的避荫反应的一个或多个植物紧邻种植的、不包含降低的避荫反应的植物相比,所述植物与包含降低的避荫反应的一个或多个植物紧邻种植时,具有增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。
51.根据权利要求45至50中任一项所述的方法,其中所述核酸酶切割所述内源HD-Zip转录因子基因,并且将突变引入由所述内源HD-Zip转录因子基因编码的所述内源HD-Zip转录因子的DNA结合位点中。
52.根据权利要求45至51中任一项所述的方法,其中所述突变是非天然突变。
53.根据权利要求45至52中任一项所述的方法,其中所述突变是取代、插入和/或缺失。
54.根据权利要求45至53中任一项所述的方法,其中所述核酸酶是锌指核酸酶、转录激活因子样效应子核酸酶(TALEN)、核酸内切酶(例如,Fok1)或CRISPR-Cas效应蛋白。
55.根据权利要求45至54中任一项所述的方法,其中所述HD-Zip转录因子是HD-Zip II型(HD-Zip II)转录因子。
56.根据权利要求55所述的方法,其中所述HD-Zip II转录因子能够调节所述植物中对光照的反应(例如避荫反应(SAR));例如是AtHB2、HB53和/或HB78的直向同源物。
57.根据权利要求55所述的方法,其中所述HD-Zip II转录因子是同源异型框蛋白53(HB53)或同源异型框蛋白78(HB78)。
58.一种与HD-Zip转录因子基因中的靶位点结合的引导核酸,所述靶位点包含编码下述的核苷酸序列:
(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(e)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
59.根据权利要求58所述的引导核酸,其中所述引导核酸包含具有SEQ ID No:175-182中任一所示的核苷酸序列的间隔子。
60.根据权利要求58或59所述的引导核酸,其中所述HD-Zip转录因子是HD-Zip II型(HD-Zip II)转录因子,任选地其中所述HD-Zip II转录因子是HB53或HB78。
61.一种系统,其包含权利要求58至60中任一项的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应蛋白。
62.根据权利要求61所述的系统,所述系统还包含与所述引导核酸和CRISPR-Cas效应蛋白相缔合的tracr核酸,任选地,其中所述tracr核酸和所述引导核酸共价连接。
63.一种包含与引导核酸缔合的CRISPR-Cas效应蛋白的基因编辑系统,其中所述引导核酸包含与HD-Zip转录因子基因结合的间隔子序列。
64.根据权利要求63所述的基因编辑系统,其中所述HD-Zip转录因子基因编码:
(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(e)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
65.根据权利要求63或64所述的基因编辑系统,其中所述引导核酸包含具有SEQ IDNO:175-182中任一项的核苷酸序列的间隔子序列。
66.根据权利要求63至65中任一项所述的基因编辑系统,其还包含与所述引导核酸和CRISPR-Cas效应蛋白相缔合的tracr核酸,任选地,其中所述tracr核酸和所述引导核酸共价连接。
67.根据权利要求63至66中任一项所述的基因编辑系统,其中所述HD-Zip转录因子是HD-Zip II型(HD-Zip II)转录因子,任选地其中所述HD-Zip II转录因子是HB53或HB78。
68.一种包含CRISPR-Cas效应蛋白的复合物,所述CRISPR-Cas效应蛋白包含切割结构域和引导核酸,其中所述引导核酸与HD-Zip转录因子基因中的靶位点结合,所述HD-Zip转录因子基因编码:
(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(e)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽,其中所述切割结构域切割所述HD-Zip转录因子基因中的靶链。
69.一种表达盒,其包含(a)编码含有切割结构域的CRISPR-Cas效应蛋白的多核苷酸,和(b)与HD-Zip转录因子基因中的靶位点结合的引导核酸,其中所述引导核酸包含与编码以下序列的核苷酸序列互补并结合的间隔子序列:
(a)包含与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少80%序列同一性的序列的多肽;
(b)包含与SEQ ID NO:3的氨基酸序列具有至少80%序列同一性的序列的多肽;
(c)包含与SEQ ID NO:4的核苷酸序列具有至少95%序列同一性的序列的多肽;
(d)包含具有SEQ ID NO:5所示氨基酸序列的序列的多肽,其中X是L或S;
(e)多肽,其包含:
(i)具有氨基酸序列RKKLRLX1KX2QX3(SEQ ID NO:6)的序列,其中X1是S或T,X2是D或E,X3是S或A;
(ii)具有氨基酸序列PX1X2 X2LTX3CPX4CER(SEQ ID NO:8)的序列,其中X1是P或A,X2是T或A,X3是V或M,X4是Q、S或N;
(iii)具有氨基酸序列ENRRLX1X2EX3(SEQ ID NO:7)的序列,其中X1是Q或H,X2是R或K,X3是V或L;和
具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列;和/或
(f)包含具有氨基酸序列VWFQNRRA(SEQ ID NO:9)的序列的多肽。
70.根据权利要求68所述的复合物或如权利要求69所述的表达盒,其中所述HD-Zip转录因子是HD-Zip II型(HD-Zip II)转录因子,任选地其中所述HD-Zip II转录因子是HB53或HB78。
71.一种编码具有突变的DNA结合位点的HD-Zip转录因子的核酸,其中所述突变的DNA结合位点包含破坏DNA结合的突变。
72.根据权利要求71所述的核酸,其中所述突变消除了所述HD-Zip转录因子与DNA的结合。
73.根据权利要求71或72所述的核酸,其中所述突变使所述HD-Zip转录因子与DNA结合的能力降低至少75%。
74.根据权利要求71至73中任一项所述的核酸,其中所述HD-Zip转录因子是HD-Zip II型(HD-Zip II)转录因子,任选地其中所述HD-Zip II转录因子是HB53或HB78。
75.一种植物或其部分,其中包含权利要求71至74中任一项的核酸。
76.一种玉米植物或其部分,其中包含权利要求71至74中任一项的核酸,任选地,其中所述玉米植物包含矮小/半矮小表型。
77.一种小麦植物或其部分,其中包含权利要求71至74中任一项的核酸。
78.根据权利要求77所述的小麦植物或其部分,其中所述核酸包含在A基因组、B基因组、D基因组或其任意组合中。
79.根据权利要求75所述的植物、根据权利要求76所述的玉米植物或者根据权利要求77或权利要求78所述的小麦植物,和与不包含降低的避荫反应的一个或多个植物紧邻种植的不包含降低的避荫反应的植物相比,其在与包含降低的避荫反应的一个或多个植物、玉米植物和/或小麦植物紧邻种植时,包含增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062968596P | 2020-01-31 | 2020-01-31 | |
US62/968,596 | 2020-01-31 | ||
PCT/US2021/015609 WO2021155084A1 (en) | 2020-01-31 | 2021-01-29 | Suppression of shade avoidance response in plants |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115335392A true CN115335392A (zh) | 2022-11-11 |
Family
ID=74732971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180011481.4A Pending CN115335392A (zh) | 2020-01-31 | 2021-01-29 | 植物避荫反应的抑制 |
Country Status (9)
Country | Link |
---|---|
US (1) | US11959072B2 (zh) |
EP (1) | EP4097125A1 (zh) |
CN (1) | CN115335392A (zh) |
AR (1) | AR121242A1 (zh) |
BR (1) | BR112022012417A2 (zh) |
CA (1) | CA3165291A1 (zh) |
MX (1) | MX2022009333A (zh) |
UY (1) | UY39058A (zh) |
WO (1) | WO2021155084A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AR129709A1 (es) * | 2022-06-27 | 2024-09-18 | Pairwise Plants Services Inc | Métodos y composiciones para modificar el escape a la sombra en plantas |
Family Cites Families (116)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ221259A (en) | 1986-07-31 | 1990-05-28 | Calgene Inc | Seed specific transcriptional regulation |
US6040504A (en) | 1987-11-18 | 2000-03-21 | Novartis Finance Corporation | Cotton promoter |
EP0342926B1 (en) | 1988-05-17 | 1994-09-28 | Mycogen Plant Science, Inc. | Plant ubiquitin promoter system |
US5641876A (en) | 1990-01-05 | 1997-06-24 | Cornell Research Foundation, Inc. | Rice actin gene and promoter |
DE69133128T2 (de) | 1990-04-12 | 2003-06-18 | Syngenta Participations Ag, Basel | Gewebe-spezifische Promotoren |
US6395966B1 (en) | 1990-08-09 | 2002-05-28 | Dekalb Genetics Corp. | Fertile transgenic maize plants containing a gene encoding the pat protein |
US5459252A (en) | 1991-01-31 | 1995-10-17 | North Carolina State University | Root specific gene promoter |
EP0600993B1 (en) | 1991-08-27 | 1999-11-10 | Novartis AG | Proteins with insecticidal properties against homopteran insects and their use in plant protection |
UA48104C2 (uk) | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
CZ331797A3 (cs) | 1995-04-20 | 1998-06-17 | American Cyanamid Company | Produkty rezistentní na herbicidy vyvíjené na struktuře založeným způsobem |
IL121243A (en) | 1995-11-06 | 2010-05-31 | Wisconsin Alumni Res Found | Pecombinant insecticidal protein toxin from photorhabdus, polynucleotide encoding said protein and method of controlling pests using said protein |
TR199901126T2 (xx) | 1996-08-29 | 1999-07-21 | Dow Agrosciences Llc | Photarhabdus' dan elde edilen insektisid i�levli protein toksinleri. |
EP0975778B8 (en) | 1997-04-03 | 2007-11-21 | DeKalb Genetics Corporation | Use of glyphosate resistant maize lines |
EP0915909B1 (en) | 1997-05-05 | 2007-06-13 | Dow AgroSciences LLC | Insecticidal protein toxins from xenorhabdus |
KR20010041129A (ko) | 1998-02-20 | 2001-05-15 | 돈 리사 로얄 | 화분 특이적 프로모터 |
US6333449B1 (en) | 1998-11-03 | 2001-12-25 | Plant Genetic Systems, N.V. | Glufosinate tolerant rice |
AU1336200A (en) | 1998-11-03 | 2000-05-22 | Aventis Cropscience N.V. | Glufosinate tolerant rice |
US6509516B1 (en) | 1999-10-29 | 2003-01-21 | Plant Genetic Systems N.V. | Male-sterile brassica plants and methods for producing same |
US6506963B1 (en) | 1999-12-08 | 2003-01-14 | Plant Genetic Systems, N.V. | Hybrid winter oilseed rape and methods for producing same |
AU784649B2 (en) | 1999-12-28 | 2006-05-18 | Bayer Cropscience Nv | Insecticidal proteins from Bacillus thuringiensis |
US6395485B1 (en) | 2000-01-11 | 2002-05-28 | Aventis Cropscience N.V. | Methods and kits for identifying elite event GAT-ZM1 in biological samples |
MXPA02009335A (es) | 2000-03-27 | 2003-02-12 | Syngenta Participations Ag | Promotores del virus de la rizadura amarilla del cestrum. |
AR044724A1 (es) | 2000-03-27 | 2005-10-05 | Syngenta Participations Ag | Promotores del virus de la rizadura amarilla del cestrum |
BR122013026754B1 (pt) | 2000-06-22 | 2018-02-27 | Monsanto Company | Molécula de dna e processos para produzir uma planta de milho tolerante à aplicação do herbicida glifosato |
US6713259B2 (en) | 2000-09-13 | 2004-03-30 | Monsanto Technology Llc | Corn event MON810 and compositions and methods for detection thereof |
AU9304401A (en) | 2000-09-29 | 2002-04-08 | Monsanto Technology Llc | Glyphosate tolerant wheat plant 33391 and compositions and methods for detectionthereof |
AU2002215363B2 (en) | 2000-10-25 | 2006-10-12 | Monsanto Technology Llc | Cotton event PV-GHGT07(1445) and compositions and methods for detection thereof |
ATE509110T1 (de) | 2000-10-30 | 2011-05-15 | Monsanto Technology Llc | Canola event pv-bngt(rt73), zusammensetzungen und verfahren zum nachweis davon |
AR035215A1 (es) | 2000-11-20 | 2004-05-05 | Monsanto Technology Llc | Polinucleotido aislado, primer y segundo polinucleotido cebador, metodo para detectar el suceso vegetal de algodon 531, molecula de polinucleotido aislado obtenida por dicho metodo, equipo de deteccion de acido nucleico y metodo para determinar la cigosidad del genoma de una planta de algodon. |
AU2002218413A1 (en) | 2000-11-30 | 2002-06-11 | Ses Europe N.V. | Glyphosate resistant transgenic sugar beet characterised by a specific transgene insertion (t227-1), methods and primers for the detection of said insertion |
EG26529A (en) | 2001-06-11 | 2014-01-27 | مونسانتو تكنولوجى ل ل سى | Prefixes for detection of DNA molecule in cotton plant MON15985 which gives resistance to damage caused by insect of squamous lepidoptera |
US6818807B2 (en) | 2001-08-06 | 2004-11-16 | Bayer Bioscience N.V. | Herbicide tolerant cotton plants having event EE-GH1 |
AR037856A1 (es) | 2001-12-17 | 2004-12-09 | Syngenta Participations Ag | Evento de maiz |
WO2004011601A2 (en) | 2002-07-29 | 2004-02-05 | Monsanto Technology, Llc | Corn event pv-zmir13 (mon863) plants and compositions and methods for detection thereof |
GB0225129D0 (en) | 2002-10-29 | 2002-12-11 | Syngenta Participations Ag | Improvements in or relating to organic compounds |
EP1567000A4 (en) | 2002-12-05 | 2007-09-05 | Monsanto Technology Llc | EVENT ASSOCIATED WITH AGROSTIDE ASR-368 AND COMPOSITIONS AND METHODS FOR DETECTING THE PRESENCE THEREOF |
ES2382804T3 (es) | 2003-02-12 | 2012-06-13 | Monsanto Technology Llc | Evento de algodón MON 88913 y composiciones y procedimientos para su detección |
US7335816B2 (en) | 2003-02-28 | 2008-02-26 | Kws Saat Ag | Glyphosate tolerant sugar beet |
EA011923B1 (ru) | 2003-02-20 | 2009-06-30 | Квс Саат Аг | Устойчивое к глифосату растение сахарной свеклы |
DK1620571T3 (en) | 2003-05-02 | 2015-10-05 | Dow Agrosciences Llc | MAJS TD1507 and methods for detecting it |
ATE495264T1 (de) | 2003-10-06 | 2011-01-15 | Syngenta Participations Ag | In pflanzenplastiden funktionsfähiger promotor |
KR100537955B1 (ko) | 2003-10-29 | 2005-12-20 | 학교법인고려중앙학원 | 꽃가루 특이적 유전자 발현 프로모터 |
WO2005054480A2 (en) | 2003-12-01 | 2005-06-16 | Syngenta Participations Ag | Insect resistant cotton plants and methods of detecting the same |
EP1699929A1 (en) | 2003-12-01 | 2006-09-13 | Syngeta Participations AG | Insect resistant cotton plants and methods of detecting the same |
US7157281B2 (en) | 2003-12-11 | 2007-01-02 | Monsanto Technology Llc | High lysine maize compositions and event LY038 maize plants |
US8212113B2 (en) | 2003-12-15 | 2012-07-03 | Monsanto Technology Llc | Corn plant Mon88017 and compositions and methods for detection thereof |
GB0402106D0 (en) | 2004-01-30 | 2004-03-03 | Syngenta Participations Ag | Improved fertility restoration for ogura cytoplasmic male sterile brassica and method |
EP2281447B1 (en) | 2004-03-25 | 2016-07-27 | Syngenta Participations AG | Corn event MIR604 |
AU2004318788B2 (en) | 2004-03-26 | 2011-12-22 | Corteva Agriscience Llc | Cry1F and Cry1Ac transgenic cotton lines and event-specific identification thereof |
CA2588243C (en) | 2004-09-29 | 2013-06-11 | Pioneer Hi-Bred International, Inc. | Corn event das-59122-7 and methods for detection thereof |
PT1868426T (pt) | 2005-03-16 | 2018-05-08 | Syngenta Participations Ag | Evento de milho 3272 e métodos para a sua deteção |
ES2388548T3 (es) | 2005-04-08 | 2012-10-16 | Bayer Cropscience Nv | Suceso de élite A2704-12 y métodos y estuches para identificar a dicho suceso en muestras biológicas |
PL1871901T3 (pl) | 2005-04-11 | 2011-11-30 | Bayer Bioscience Nv | Elitarne zdarzenie a5547-127 oraz sposoby i zestawy do identyfikacji takiego zdarzenia w próbkach biologicznych |
AP2693A (en) | 2005-05-27 | 2013-07-16 | Monsanto Technology Llc | Soybean event MON89788 and methods for detection thereof |
EP1917359A2 (en) | 2005-06-02 | 2008-05-07 | Syngeta Participations AG | Ce43-67b, insecticidal transgenic cotton expressing cry1ab |
WO2006128570A1 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | 1143-51b insecticidal cotton |
WO2006128569A2 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | 1143-14a, insecticidal transgenic cotton expressing cry1ab |
WO2006128572A1 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | Ce46-02a insecticidal cotton |
US20100024077A1 (en) | 2005-06-02 | 2010-01-28 | Syngenta Participations Ag | Ce44-69d insecticidal cotton |
WO2006128568A2 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | T342-142, insecticidal transgenic cotton expressing cry1ab |
EP2295587A1 (en) | 2005-08-08 | 2011-03-16 | Bayer BioScience N.V. | Herbicide tolerant cotton plants and methods for identifying same |
UY29761A1 (es) | 2005-08-24 | 2007-03-30 | Du Pont | Composiciones que proporcionan tolerancia a múltiples herbicidas y métodos para usarlas |
EP1989313B1 (en) | 2006-02-10 | 2016-01-13 | Maharashtra Hybrid Seeds Company Limited (MAHYCO) | Transgenic brinjal (solanum melongena) expressing the cryiac gene |
CN101495635B (zh) | 2006-05-26 | 2017-05-17 | 孟山都技术有限公司 | 对应于转基因事件mon89034的玉米植物和种子及其检测和使用方法 |
ES2546255T3 (es) | 2006-06-03 | 2015-09-22 | Syngenta Participations Ag | Evento de Maíz MIR162 |
US7951995B2 (en) | 2006-06-28 | 2011-05-31 | Pioneer Hi-Bred International, Inc. | Soybean event 3560.4.3.5 and compositions and methods for the identification and detection thereof |
US20080064032A1 (en) | 2006-09-13 | 2008-03-13 | Syngenta Participations Ag | Polynucleotides and uses thereof |
US7928296B2 (en) | 2006-10-30 | 2011-04-19 | Pioneer Hi-Bred International, Inc. | Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof |
US7897846B2 (en) | 2006-10-30 | 2011-03-01 | Pioneer Hi-Bred Int'l, Inc. | Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof |
BR122017006111B8 (pt) | 2006-10-31 | 2022-12-06 | Du Pont | Métodos para controlar ervas daninhas |
US8381096B2 (en) | 2007-03-15 | 2013-02-19 | Yahoo! Inc. | Managing list tailoring for a mobile device |
WO2008114282A2 (en) | 2007-03-19 | 2008-09-25 | Maharashtra Hybrid Seeds Company Limited | Transgenic rice (oryza sativa) comprising pe-7 event and method of detection thereof |
EP2132320B1 (en) | 2007-04-05 | 2013-08-14 | Bayer CropScience NV | Insect resistant cotton plants and methods for identifying same |
AU2008261312B2 (en) | 2007-06-11 | 2013-09-05 | BASF Agricultural Solutions Seed US LLC | Insect resistant cotton plants comprising elite event EE-GH6 and methods for identifying same |
US8362325B2 (en) * | 2007-10-03 | 2013-01-29 | Ceres, Inc. | Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics |
US8049071B2 (en) | 2007-11-15 | 2011-11-01 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event MON87701 and methods for detection thereof |
WO2009100188A2 (en) | 2008-02-08 | 2009-08-13 | Dow Agrosciences Llc | Methods for detection of corn event das-59132 |
AR074135A1 (es) | 2008-02-14 | 2010-12-29 | Pioneer Hi Bred Int | Adn genomico vegetal flanqueador de evento spt y metodos para identificar el evento de tecnologia de produccion de semillas (spt) |
WO2009102873A1 (en) | 2008-02-15 | 2009-08-20 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event mon87769 and methods for detection thereof |
PL2247736T3 (pl) | 2008-02-29 | 2013-10-31 | Monsanto Technology Llc | Zdarzenie MON87460 rośliny kukurydzy oraz kompozycje i sposoby do jego wykrywania |
BRPI0915154A2 (pt) | 2008-06-11 | 2017-06-13 | Dow Agrosciences Llc | construtos para expressão de genes de tolerância a herbicida, plantas relacionadas e combinações de traços relacionados |
WO2010024976A1 (en) | 2008-08-29 | 2010-03-04 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event mon87754 and methods for detection thereof |
US8329989B2 (en) | 2008-09-29 | 2012-12-11 | Monsanto Technology Llc | Soybean transgenic event MON87705 and methods for detection thereof |
NZ593410A (en) | 2008-12-16 | 2013-01-25 | Syngenta Participations Ag | Corn event 5307 |
EA201100945A1 (ru) | 2008-12-19 | 2012-01-30 | Зингента Партисипейшнс Аг | Трансгенный вариант сахарной свеклы gm rz13 |
KR101741266B1 (ko) | 2009-01-07 | 2017-05-29 | 바스프아그로케미칼 프로덕츠 비.브이. | 대두 이벤트 127 및 이에 관한 방법 |
KR101813722B1 (ko) | 2009-03-30 | 2017-12-29 | 몬산토 테크놀로지 엘엘씨 | 벼의 17314 트랜스제닉 사건 및 이의 이용 방법 |
JP5762400B2 (ja) | 2009-03-30 | 2015-08-12 | モンサント テクノロジー エルエルシー | イネ遺伝子組換え事象17053およびその使用方法 |
JP2013526832A (ja) | 2009-08-19 | 2013-06-27 | ダウ アグロサイエンシィズ エルエルシー | Aad−1イベントdas−40278−9、関連するトランスジェニックトウモロコシ系統およびそのイベント特異的同定 |
RU2624025C2 (ru) | 2009-09-17 | 2017-06-30 | МОНСАНТО ТЕКНОЛОДЖИ ЭлЭлСи | Трансгенный объект сои mon 87708 и способы его применения |
CN106399482B (zh) | 2009-11-23 | 2021-04-27 | 拜尔作物科学股份有限公司 | 耐除草剂大豆植物及鉴定其的方法 |
RU2764586C2 (ru) | 2009-11-23 | 2022-01-18 | Монсанто Текнолоджи Ллс | Трансгенное событие mon 87427 маиса и относительная шкала развития |
AU2010324752B2 (en) | 2009-11-24 | 2016-04-21 | Dow Agrosciences Llc | AAD-12 event 416, related transgenic soybean lines, and event-specific identification thereof |
US8581046B2 (en) | 2010-11-24 | 2013-11-12 | Pioneer Hi-Bred International, Inc. | Brassica gat event DP-073496-4 and compositions and methods for the identification and/or detection thereof |
BR112012012494A2 (pt) | 2009-11-24 | 2020-11-03 | Dow Agrosciences Llc | detecção de evento de soja aad-12 416 |
WO2011075593A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event dp-040416-8 and methods for detection thereof |
WO2011075595A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event dp-043a47-3 and methods for detection thereof |
US20110154524A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event DP-032316-8 and methods for detection thereof |
ES2730684T3 (es) | 2009-12-17 | 2019-11-12 | Pioneer Hi Bred Int | Evento de maíz DP-004114-3 y métodos para la detección del mismo |
UA118535C2 (uk) | 2010-06-04 | 2019-02-11 | Монсанто Текнолоджи Ллс | Рекомбінантна молекула днк, що надає рослині brassica стійкості до гліфосату |
BR112013005431A2 (pt) | 2010-09-08 | 2016-06-07 | Dow Agrosciences Llc | "evento 1606 de aad-12 e linhagens de soja transgênica relacionadas". |
BR112013009001A2 (pt) | 2010-10-12 | 2016-07-05 | Monsanto Technology Llc | planta e semente de soja correspondendo a evento transgênico mon87712 e métodos para deteção das mesmas |
WO2012071039A1 (en) | 2010-11-24 | 2012-05-31 | Pioner Hi-Bred International, Inc. | Brassica gat event dp-061061-7 and compositions and methods for the identification and/or detection thereof |
CN107529548B (zh) | 2010-12-03 | 2021-05-04 | 陶氏益农公司 | 叠加的除草剂耐受性事件8264.44.06.1、相关转基因大豆系、及其检测 |
BR112013015745B1 (pt) | 2010-12-03 | 2021-01-19 | Ms Technologies, Llc | polinucleotídeos referente ao evento de tolerância a herbicida 8291.45.36.2, cassete de expressão, sonda, bem como processos para identificação do evento, determinação da zigosidade, produção de uma planta de soja transgênica e produção de uma proteína em uma célula de planta |
TWI667347B (zh) | 2010-12-15 | 2019-08-01 | 瑞士商先正達合夥公司 | 大豆品種syht0h2及偵測其之組合物及方法 |
CN103597079B (zh) | 2011-03-30 | 2017-04-05 | 孟山都技术公司 | 棉花转基因事件mon88701及其使用方法 |
CA2840630C (en) | 2011-06-30 | 2021-11-30 | Monsanto Technology Llc | Alfalfa plant and seed corresponding to transgenic event kk 179-2 and methods for detection thereof |
EP2731419A4 (en) | 2011-07-13 | 2015-04-29 | Dow Agrosciences Llc | STACKED HERBIC TOLERANT EVENT 8264.42.32.1, CORRESPONDING TRANSGENIC SOYBEAN LINE AND EVIDENCE OF THIS |
WO2013012643A1 (en) | 2011-07-15 | 2013-01-24 | Syngenta Participations Ag | Polynucleotides encoding trehalose-6-phosphate phosphatase and methods of use thereof |
AR090417A1 (es) | 2012-02-01 | 2014-11-12 | Dow Agrosciences Llc | Plantas resistentes al glifosato y metodos asociados |
BR112016007562A2 (pt) * | 2013-10-09 | 2017-09-12 | Monsanto Technology Llc | interferência com repressão do fator de transcrição hd-zip de expressão gênica para produzir plantas com traços intensificados |
KR102357893B1 (ko) | 2014-08-05 | 2022-02-04 | 맵퀘스트 에스아 | Pd-1 에 결합하는 면역학적 시약 |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
IL310721A (en) | 2015-10-23 | 2024-04-01 | Harvard College | Nucleobase editors and their uses |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
-
2021
- 2021-01-29 CN CN202180011481.4A patent/CN115335392A/zh active Pending
- 2021-01-29 EP EP21708095.1A patent/EP4097125A1/en active Pending
- 2021-01-29 CA CA3165291A patent/CA3165291A1/en active Pending
- 2021-01-29 WO PCT/US2021/015609 patent/WO2021155084A1/en unknown
- 2021-01-29 AR ARP210100244A patent/AR121242A1/es unknown
- 2021-01-29 UY UY0001039058A patent/UY39058A/es unknown
- 2021-01-29 MX MX2022009333A patent/MX2022009333A/es unknown
- 2021-01-29 US US17/162,075 patent/US11959072B2/en active Active
- 2021-01-29 BR BR112022012417A patent/BR112022012417A2/pt unknown
Also Published As
Publication number | Publication date |
---|---|
US11959072B2 (en) | 2024-04-16 |
UY39058A (es) | 2021-08-31 |
MX2022009333A (es) | 2022-10-07 |
CA3165291A1 (en) | 2021-08-05 |
WO2021155084A1 (en) | 2021-08-05 |
EP4097125A1 (en) | 2022-12-07 |
AR121242A1 (es) | 2022-05-04 |
BR112022012417A2 (pt) | 2022-08-30 |
US20210238579A1 (en) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021127341A1 (en) | Mutation of growth regulating factor family transcription factors for enhanced plant growth | |
CA3210785A1 (en) | Methods and compositions for modifying cytokinin oxidase levels in plants | |
CA3232804A1 (en) | Methods and compositions for reducing pod shatter in canola | |
CN115335392A (zh) | 植物避荫反应的抑制 | |
CN115697045B (zh) | 控制分生组织大小以改良作物的方法 | |
CN118076742A (zh) | 修饰油菜素内酯受体基因以改善产量性状 | |
US20210371873A1 (en) | Methods for controlling meristem size for crop improvement | |
US20230284577A1 (en) | Suppression of shade avoidance response in plants | |
US20210395767A1 (en) | Methods for controlling meristem size for crop improvement | |
WO2024006679A1 (en) | Methods and compositions for modifying shade avoidance in plants | |
WO2023034731A1 (en) | Modification of ubiquitin binding peptidase genes in plants for yield trait improvement | |
US20230151379A1 (en) | Methods and compositions for improving plant architecture and yield traits | |
US20230016618A1 (en) | Modification of hect e3 ubiquitin ligase genes to improve yield traits | |
US20240090466A1 (en) | Methods and compositions for improving yield characteristics in plants | |
US20230108968A1 (en) | Methods for improving floret fertility and seed yield | |
WO2022182834A1 (en) | Methods and compositions for modifying root architecture in plants | |
CN117794358A (zh) | 用于增强根系发育的方法和组合物 | |
US20240287536A1 (en) | Methods and compositions for modifying shade avoidance in plants | |
CN118302434A (zh) | 用于改善小花育性和种子产量的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |