CN102216460A - 生物量增加的转基因植物 - Google Patents
生物量增加的转基因植物 Download PDFInfo
- Publication number
- CN102216460A CN102216460A CN2009801456875A CN200980145687A CN102216460A CN 102216460 A CN102216460 A CN 102216460A CN 2009801456875 A CN2009801456875 A CN 2009801456875A CN 200980145687 A CN200980145687 A CN 200980145687A CN 102216460 A CN102216460 A CN 102216460A
- Authority
- CN
- China
- Prior art keywords
- seq
- sequence
- plant
- nucleic acid
- polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
本发明公开了调控植物生物量水平的方法和材料。例如,公开了编码生物量-调控多肽的核酸以及用该核酸转化植物细胞的方法。同时公开了生物量水平增加的植物和生物量水平增加的植物生产的植物产品。
Description
相关申请
本申请要求2008年9月17日递交的申请号为61/097,789的美国临时专利申请的优先权。先前申请案之全文以引用的方式并入本文中。
发明领域
本申请涉及调节植物生物量水平的方法和材料。例如,本申请提供了具有生物量水平增加的植物以及制备具有生物量水平增加的植物以及植物产品的材料和方法。
发明背景
本发明涉及增加植物生物量的方法以及由此获得的植物。具有生物量增加和/或改良的植物对农业、园艺、生物量与能源转化、造纸、植物产品生产,以及其它行业非常有用。特别地,是需要增加专用能源作物诸如柳枝稷(柳枝稷)、奇岗(芒草)、高粱和甘蔗(甘蔗)的生物量。纵观人类历史,植物生物量同时作为食物和燃料对于维持和增加人口水平是不可缺少的。科学家们正在不断努力提高农作物的生物量。有关增加植物特别是专用能源作物的生物量的大量研究表明,其对于人类在提供可持续的能源来源上的重要程度。当前事件,诸如油价上涨增加了对作为能源的植物生物量的可持续发展和稳定来源的紧迫性。植物产生的生物量的数量是受多种生化途径影响的数量性状。这就需要利用分子遗传的方法更快速地生产能够增加生物量的植物。同时还需要培育在不同地理和/或气候环境生长更快并产生更多生物量的植物品种。宜将此类方法用于多种植物品种(Zhang等,(2004)Plant Physiol.135:615)。尽管在分子遗传方法上取得了一些进步,但是还需要鉴定能够用于有效提高植物生物量的特定的基因和/或序列。
发明概述
本发明提供了有关具有调节植物生物量水平的方法和材料。例如,本发明提供了具有生物量水平增加的转基因植物和植物细胞,用于生产具有生物量水平增加的转基因植物和植物细胞的核酸,制备具有生物量水平增加的植物的方法,和制备能够生产具有生物量水平增加植物的植物细胞的方法。此类植物和植物细胞可以通过栽培获得,例如,具有增加高度、增加分蘖数,或增加干重的植物。具有生物量水平增加的植物对于食物和饲料的生物量产生是有用的,其可能造福人类和动物。具有生物量水平增加的植物在将此类生物量转化为液体燃料(例如,乙醇),或其它化学物质上是有用的,或可以作为热化学燃料上是有用的。
本发明提供了生产具有生物量增加的植物的方法。一方面,该方法包括培养含有外源核酸的植物细胞。该外源核酸包括一个可操作地连接到编码多肽的核酸序列的调控区。多肽的氨基酸序列的隐马尔可夫模型(HMM)标准化比特值(bit score)分别比利用图1-7描述的氨基酸序列产生的HMM值大约210、230、350、215、880、240、310或810。与不包含外源核酸的对照植物的生物量相应水平相比,该植物具有不同水平的生物量。
另一方面,本发明还包括培养含有外源核酸的植物细胞的方法。所述外源核酸包括调控区域,该调控区域可操作地连接到编码多肽的核苷酸序列上,该多肽与SEQ ID NOs:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、410、411、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636或638的氨基酸序列有80%或更高的序列一致性。由植物细胞获得的植株可以用于制备一种植物,其与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。
另一方面,包含含有外源核酸的植物细胞培养的方法。所述外源核酸包括调控区,该调控区可操作地连接到核苷酸序列上,该核酸序列与SEQ IDNO:1、3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635或637的序列,或其片段,有80%或更高的序列一致性。由植物细胞产生的植物与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。
本发明提供了调节植物生物量水平的方法。一方面,该方法包含向植物细胞中导入含有包括可操作地连接到编码多肽的核酸序列的调控区的外源核酸。多肽的氨基酸序列的HMM标准化比特值(bit score)比由图1-7之一所示的氨基酸序列得到的HMM值大约210。由植物细胞产生的植物与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图1所示的氨基酸序列得到的HMM值大约230,其中该多肽含有聚戊烯合成酶结构域,其与SEQ ID NO:2的残基93-356具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图2所示的氨基酸序列得到的HMM值大约350。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图3所示的氨基酸序列得到的HMM值大约215,其中所述多肽含有多蛋白桥因子1结构域,其与SEQ ID NO:165的残基11-83具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图3所示的氨基酸序列得到的HMM值大约215,其中所述多肽含有螺旋-转角-螺旋结构域,其与SEQ ID NO:165的残基91-145具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图4所示的氨基酸序列得到的HMM值大约880,其中所述多肽含有植物中性转化酶结构域,其与SEQ ID NO:315的残基84-551具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图5所示的氨基酸序列得到的HMM值大约240,其中所述多肽含有sedlin,N-末端保守区域,其与SEQ ID NO:474的残基9-126具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在一些实施方式中,多肽的氨基酸序列的HMM值比由图5所示的氨基酸序列得到的HMM值大约310,其中所述多肽含有G-盒结合蛋白MFMR结构域,其与SEQ ID NO:521的残基1-188具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图6所示的氨基酸序列得到的HMM值大约310,其中所述多肽含有bZIP_1转录因子结构域,其与SEQ ID NO:521的残基279-342具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图6所示的氨基酸序列得到的HMM值大约310,其中所述多肽含有bZIP_2碱性区域亮氨酸拉链结构域,其与SEQ ID NO:521的残基279-333具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
在某些实施方式中,多肽的氨基酸序列的HMM值比由图7所示的氨基酸序列得到的HMM值大约810,其中该多肽含有表异构酶结构域,其与SEQ IDNO:591的残基20-290具有至少60%或更高(例如,65、70、75、80、85、90、95、99或100%)的序列一致性。
另一方面,本发明包含将含有外源核酸导入植物细胞的方法,所述外源核酸包括调控区,该调控区可操作地连接到编码多肽的核苷酸序列上,该多肽与SEQ ID NO:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、410、411、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636或638的氨基酸序列有80%或更高的序列一致性。由植物细胞获得的植物与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。上述任一方法的多肽具有以下氨基酸序列SEQ IDNO:2、106、165、315、474、521或591。
另一方面,本发明包含将含有外源核酸导入植物细胞的方法,所述外源核酸包括调控区,该调控区可操作地连接到核苷酸序列上,该核苷酸序列与SEQ ID NO:3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635或637的核酸序列或其片段有80%或更高的序列一致性的核酸序列上。由植物细胞产生的植物与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。
含有外源核酸的植物细胞。一方面,外源核酸包含可操作地连接到编码多肽的核酸序列的调控区域。所述多肽的氨基酸序列的HMM值比由图1-7之一所示的氨基酸序列得到的HMM值大约210。所述植物与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。另一方面,所述外源核酸包含调控区域,该调控区可操作连接到编码多肽的核酸序列上,该多肽与选自包含SEQ ID NO:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、410、411、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636和638的氨基酸序列有80%或更高的序列一致性。由植物细胞产生的植物与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。另一方面,所述外源核酸包含调控区域,该调控区可操作连接到核酸序列上,该核酸序列与选自包含SEQ ID NO:3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635和637的核酸序列,或其片段有80%或更高的序列一致性。由植物细胞获得的植物与不含外源核酸的对照植物的生物量对应水平比较具有不同的生物量水平。本发明还提供了含有此植物细胞的转基因植物。本发明同样提供植物生物量或种子产品。该产物包括本发明所述转基因植物的营养或胚组织。
本发明还提供分离的核酸。一方面,分离的核酸包含的核酸序列与SEQID NO:10、18、27、35、37、57、67、116、128、130、132、138、164、180、207、216、231、239、328、333、339、344、348、358、365、368、370、372、379、381、383、392、394、396、404、406、425、427、473、478、482、486、491、495、497、499、505、509、512、520、526、528、535、539、556、558、561、563、565、567、583、592、597、604、614、622、625、632或637的核酸序列具有80%或更高的序列一致性。另一方面,分离的核酸包含的核酸编码的多肽与SEQ ID NO:11、13、19、28、34、36、38、58、109、114、117、129、133、139、165、165、181、334、340、345、349、359、366、369、371、373、380、382、384、393、395、397、405、407、426、428、474、492、500、506、510、513、517、536、540、557、559、562、564、566、568、584、593、598、600、608、615、623、633、636或638的氨基酸序列具有80%或更高的序列一致性。
另一方面,本发明提供了鉴定与生物量水平变异相关的遗传多态的方法。这些方法包括提供植物群体,以及确定该群体中一个或多个遗传多态位点是否与选自包含图1-7描述的多肽和其功能类似物所在位点遗传连锁。测定群体中植物组织生物量水平的变异与群体中植物出现的一个或多个遗传多态的相关性,因此能够鉴定一个或多个多态与此类变异是否相关联。
另一方面,本发明提供了制备植物品系的方法。该方法包括确定植物群体中一个或多个遗传多态是否与图1-7所示的一种或多种多肽和此类多肽的功能类似物所在位点连锁。群体中的一个或多个植株通过其出现至少一个遗传多态位点与生物量性状变异相关来鉴定。上述步骤还可以按照其它顺序进行。接着将鉴定出的一个或多个植株自交或与其他植株杂交产生种子,并且至少一个后代植株来自自交或与不同植株杂交的种子生长所得。额外重复自花授精和异型杂交步骤0-5代,目的是产生至少出现一个多态的植物品系。生物量性状可以是干物质产量,并且植物群体可以柳枝稷植物。
若无其他定义,此处所用的所有的技术和科学术语与本发明所属领域普通技术人员正常理解的相同意义。尽管此处所描述的类似的或等同的方法和材料可以用于实施本发明,但是下面还是描述了适当的方法和材料。此处所提到的所有出版物、专利申请文件、专利和其它参考文献之全文以引用的方式并入本文中。万一冲突,本发明的说明书,包括定义,将作为参考。此外,材料、方法,以及实施例旨在说明本发明,而不是对本发明的限制。
本发明的一个或多个实施例的详细内容载于附图以及下述描述。本发明的其它特征、目标和优势将在说明书和附图中,以及权利要求书中明显提及。申请人依据专利法的标准惯例利用过渡词“包含”,“主要组成元素为...”,或“组成元素为...”来保护本发明揭示的权利要求任一项的权利。
附图简述
图1(A-E)是对应于Ceres Clone:29678(SEQ ID NO:2)的氨基酸序列CW00012与同源和/或直系同源氨基酸序列的比对结果。此处所显示的所有比对图中,比对序列中的破折号表示缺口,即在那个位置有一个氨基酸的缺失。不同比对序列之间相同氨基酸或保守氨基酸取代用方框标示。图1和此处提供的其它比对图片是通过MUSCLE程序3.52版本获得的。
图2(A-C)是对应于Ceres Clone:33232(SEQ ID NO:106)的氨基酸序列CW00212与同源和/或直系同源氨基酸序列的比对结果。
图3(A-B)是对应于Ceres Clone:158734(SEQ ID NO:165)的氨基酸序列CW00226与同源和/或直系同源氨基酸序列的比对结果。
图4(A-H)是对应于Ceres annot ID:876994(SEQ ID NO:315)的氨基酸序列CW00233与同源和/或直系同源氨基酸序列的比对结果。
图5是对应于Ceres Clone:1554933(SEQ ID NO:474)的氨基酸序列CW00305与同源和/或直系同源氨基酸序列的比对结果。
图6(A-D)是对应于Ceres Clone:258841(SEQ ID NO:521)的氨基酸序列CW00327与同源和/或直系同源氨基酸序列的比对结果。
图7(A-C)是对应于Ceres Annot:863641(SEQ ID NO:591)的氨基酸序列CW00539与同源和/或直系同源氨基酸序列的比对结果。
发明详述
本发明特征方法和材料涉及植物生物量水平的调节。在一些实施方式中,植物也可以调节例如木质素的水平,修改根构,改良除草剂抗性,改良类胡萝卜素生物合成,或调节细胞壁内含物。所述方法包括用编码生物量-调节多肽的核酸转化植物细胞,其中多肽的表达导致了生物量水平的调节。利用此方法获得的植物细胞可以培养成获得具有生物量增加或减少的植物。这些植物以及它们的种子,可以用于生产,例如,作为生物燃料的原料,其数量增加的生物量。
I.定义
“氨基酸”是指20种生物发生的氨基酸之一以及合成氨基酸,包括D/L光学异构体。
“细胞类-优先启动子”或“组织-优先启动子”是指分别能够优先在靶细胞或组织中启动表达的启动子,但是同时也可以导致其它细胞类型的一些转录。
“对照植株”是指不含感兴趣转基因植株中出现的外源核酸的植株,但是相反地具有与转基因植株相同或相似的遗传背景。一个适当的对照植株可以是一个非转基因野生型植株,从转化试验中分离的非-转基因分离株,或含有不是感兴趣外源核酸的转基因植株。
“结构域”是指多肽中大幅连续的氨基酸组合,其可以用于区分蛋白家族和/或蛋白部分。此类结构域具有“指纹”或“标签”,包含保守的初级序列,二级结构,和/或三维构象。一般地,结构域与特定的体内和/或体外活动相关。结构域的长度可以是10-400个氨基酸,例如,10-50个氨基酸,或25-100个氨基酸,或35-65个氨基酸,或35-55个氨基酸,或45-60个氨基酸,或200-300个氨基酸,或300-400氨基酸。
“下调”是指相对于基础或本身状态表达产物(mRNA、多肽或二者)下降的调节。
“外源”对于核酸是表明该核酸是重组核酸结构的部分,或不在其自然环境中。例如,外源核酸可以是从一个物种导入其它物种的一段序列,即异源核酸。通常情况下,此类外源核酸通过重组核酸载体导入到其它物种。外源核酸也可以是有机体本身具有的序列,重新导入到了机体细胞内。含有本身序列的外源核酸常常通过在外源核酸上连接非本身序列来区别自然发生的序列,例如,在一个重组核酸载体中非-本身序列侧翼添加一个本身序列。另外,稳定转化外源核酸通常地整合到不是本身序列发现的位置上。应理解,基于考虑外源核酸应导入到亲本,而不是导入到细胞内。例如,含有外源核酸的转基因植物可以作为稳定转化植株和非-转基因植株杂交的后代。此类后代可以认为含有外源核酸。
“表达”是指多聚核酸在酶、RNA聚合酶的催化作用下将多核苷酸的遗传信息转录为RNA,并在核糖体上将mRNA翻译成蛋白的过程。
此处所用的“异源多肽”是指不是植物细胞中天然发生的多肽,例如,转基因柳枝稷植物中转化和表达的编码玉米中氮转运多肽的序列。
此处所用的“分离核酸”包括天然-发生的核酸,其提供所述序列一侧或两侧在其天然-发生基因组的核酸被移除或缺失。因此,一种分离核酸包括,但是不限于,连接到载体或病毒作为纯化分子或核酸分子存在的核酸。存在于成千上万的,例如,cDNA文库,基因组文库或含有基因组DNA限制性酶切的凝胶片中的其它核酸之中的核酸,不认为是一种分离的核酸。
生物量水平的“调节”是指植物细胞和/或植物中外源核酸表达或转录结果观察到的生物量水平的改变。水平的改变是相对于对照植物相应水平测定的。
此处中可交换使用的“核酸”和“多聚核酸”,是指RNA和DNA两者,包括cDNA、基因组DNA、合成DNA和含有核酸类似物的DNA或RNA。核酸可以是双链或单链(即,一条正义链或一条反义链)。多聚核酸的非限制性例子包括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、siRNA、小-RNA、核酶、cDNA、重组多聚核酸、分支多聚核酸、核酸探针和核酸引物。多聚核酸可以含有非常规或经修饰的核苷酸。
“可操作连接”是指放置调控区域和核酸中将要转录的序列,从而调控区域能够有效调节该序列的转录或翻译。例如,可操作连接一个编码序列和一个调控区域,编码序列的翻译读码框的翻译起始位点一般地位于调控区域下游的1到大约50个核苷之间。然而,一个调控区域,可以是位于翻译起始位点上游5000个核苷酸,或大约是转录开始位点上游2000个核苷酸。
此处所用的“多肽”是指两种或多种亚基氨基酸、氨基酸类似物,或其它类肽物,而不管翻译后修饰,例如,磷酸化或糖基化。亚基可以通过肽键或其它键诸如,例如酯或醚键连接。全长多肽、截短多肽、点突变、插入突变、剪接变异体、嵌合蛋白,及其片段都包含在该定义内。
“子代“包括某一植物或植物品系的后裔。瞬时植物的后代包括F1、F2、F3、F4、F5、F6以及后续代植物的种子,或BC1、BC2、BC3,以及后续代植物的种子,或F1BC1、F1BC2、F1BC3,以及后续代植物的种子。F1称号是指遗传背景不同的两个亲本杂交的子代。F2、F3、F4、F5以及F6称号是指F1植株自或同胞授粉后续子代。
“调控区域”是指具有影响转录或翻译起始和效率,以及转录或翻译产物稳定性和/或可动性的核酸序列的核酸。调控区域包括不限于,启动子序列、增强子序列、反应元件、蛋白识别位点、诱导元件、蛋白结合序列、5′和3′非翻译区(UTRs)、转录起始位点、终止序列、加尾序列、内含子,及其组合。一般地调控区域至少包含有核心(基础)启动子。调控区域也可以包括至少一个调控元件,诸如增强序列、上游元件或上游激活区域(UAR)。例如,合适的增强子是来自octopine合成酶(ocs)基因上游区域的顺式调控元件(-212--154)。Fromm等,The Plant Cell,1:977-984(1989)。
“上调”是指相对于基础或本身状态,增加表达产物(mRNA,,多肽,或两者)的水平。
“载体”是指一种复制子,诸如质粒、噬菌体,或粘粒,在其中其它的DNA片段可以插入,从而使插入的片段复制。一般地,当连接有合适的调控元件时,载体能够复制。术语“载体”包括克隆和表达载体,以及病毒载体和整合载体。“表达载体”是包含有调控区域的载体。
II.多肽
此处描述的多肽包括生物量-调节多肽。当生物量调节多肽在植物或植物细胞中表达时能够有效地调节生物量的水平。此类多肽典型地含有至少一种生物量-调节多肽指示性结构域,此处将更详细描述。生物量-调节多肽通常HMM比特值大于210,此处将更详细描述。在一些实施方式中,生物量-调节多肽具有与SEQ ID NOs:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、401、403、405、407、408、410、411、413、414、415、416、417、418、419、420、421、422、423、424、426、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636或638大于80%的一致性,此处将更详细描述。
A.生物量-调节多肽指示性结构域
生物量-调节多肽可以含有聚戊烯合成酶结构域,其是预测聚戊烯合成酶的特征。聚戊烯合成酶是不同有机体能够合成的异戊二烯化合物的一种变异。例如,在真核生物中,异戊二烯生物合成途径负责包括胆固醇、多萜醇、泛醌或辅酶Q多种末端产物的合成。在细菌中,该途径可以导致异戊烯tRNA、醌类异戊二烯,以及糖脂质载体的合成。在这些酶中能够参与那条途径的是许多聚戊烯合成酶,其催化5碳异戊烯单元间1′4-缩合。上述所有酶通常都具有在一些区域序列相同。这些区域中的两种通常地富集有天门冬酸残基,并可能参与催化机制和/或底物的结合。SEQ ID NO:2为从拟南芥克隆的氨基酸序列,此处鉴定为CeresClone:29678(SEQ ID NO:2),据预测编码含有聚戊烯合成酶结构域的多肽。例如,生物量-调节多肽可以由具有与SEQ IDNO:2的93-356残基60%或更高序列一致性的聚戊烯合成酶结构域组成。在一些实施方式中,生物量-调节多肽可以由聚戊烯合成酶结构域组成,其与SEQ ID NOs:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103或104中所示的一种或多种多肽的聚戊烯合成酶结构域有60%或更高的序列一致性。这些序列的聚戊烯合成酶结构域列于序列表中。
生物量-调节多肽可以包含有多蛋白桥梁因子1结构域。该结构域与MBF2形成异二聚体。其可以直接与TATA-框结合蛋白(TBP)结合,并能够与Ftz-F1互作,稳定Ftz-F1-DNA复合物。还可以在内皮细胞分化相关因子(EDF-1)中发现该结构域。在一个广范围的包括后生动物、真菌和植物真核蛋白中发现该结构域。其C-端常常有螺旋-转角-螺旋结构(PF01381)。
该结构域也存在于SEQ ID NO:165中,该序列是拟南芥克隆的氨基酸序列,此处鉴定为Ceres clone:158734(SEQ ID NO:165),据预测其编码的多肽含有多蛋白桥梁因子1结构域。例如,生物量-调节多肽可以由与SEQ IDNO:165的11-83残基具有60%或更高序列一致性的多蛋白桥梁因子1结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312,或313列出的一种或多种多肽的多蛋白桥梁因子1结构域有60%或更高序列一致性的多蛋白桥梁因子1结构域组成。这些序列的多蛋白桥梁因子1结构域列于序列表中。
生物量-调节多肽可以包含螺旋-转角-螺旋3结构域。该结构域也出现在SEQ ID NO:165中,该序列是拟南芥克隆的氨基酸序列,此处鉴定为Ceresclone:158734(SEQ ID NO:165),据预测其编码的多肽含有螺旋-转角-螺旋3结构域。这是一个大家族的DNA结合螺旋-转角-螺旋蛋白,其包括细菌质粒复制调控蛋白、细菌甲基化酶、各种噬菌体转录调控蛋白以及粘菌(Slime mould)营养期特定蛋白。例如,生物量-调节多肽可以由与SEQ IDNO:165的91-145残基具有60%或更高序列一致性的螺旋-转角-螺旋3结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、82、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、306、307、308、309、310、310、311、312,或313列出的一种或多种多肽的螺旋-转角-螺旋3结构域有60%或更高序列一致性的螺旋-转角-螺旋3结构域组成。这些序列的螺旋-转角-螺旋3结构域列于序列表中。
生物量-调节多肽可以包含中性转化酶结构域。该结构域也出现在SEQID NO:315中,该序列是拟南芥克隆的氨基酸序列,此处鉴定为annot:876994(SEQ ID NO:315),据预测其编码的多肽含有中性转化酶结构域。
该结构域家族代表了许多中性转化酶(例如,EC.2.1.26)。该家族属于GDE族(CL0211),其含有下面4个成员:Bac_鼠李糖苷(Bac_rhamnosid)、GDE_C、中性转化酶(Invertase_neut)、和海藻糖酶。例如,生物量-调节多肽可以由与SEQ ID NO:315的84-551残基具有60%或更高序列一致性的植物中性转化酶结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、393、395、397、398、399、400、401、403、405、407、408、410、411、413、414、415、416、417、418、419、420、421、422、423、424、426、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471,或472列出的一种或多种多肽的植物中性转化酶结构域有60%或更高序列一致性的植物中性转化酶结构域组成。这些序列的植物中性转化酶结构域列于序列表中。
生物量-调节多肽可以包含sedlin,N-末端结构域。该结构域也出现在SEQ ID NO:474中,该序列是从玉米克隆的氨基酸序列,此处鉴定为Ceres Clone:1554933(SEQ ID NO:474),据预测其编码的多肽含有sedlin,N-末端结构域。Sedlin是一个由140个氨基酸组成的蛋白,其在内质网到高尔基体运输中发挥作用。例如,生物量-调节多肽可以由与SEQ ID NO:474的9-126残基具有60%或更高序列一致性的sedlin,N-末端结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518,或519列出的一种或多种多肽的sedlin,N-末端结构域有60%或更高序列一致性的sedlin,N-末端结构域组成。这些序列的sedlin,N-末端结构域列于序列表中。
生物量-调节多肽可以包含G-盒结合蛋白MFMR。该结构域也出现在SEQ ID NO:521中,该序列是从玉米克隆的氨基酸序列,此处鉴定为CeresClone:258841(SEQ ID NO:521),据预测其编码的多肽含有G-盒结合蛋白MFMR结构域。该区域通常地位于PF00170转录因子结构域的N-末端。通常地位于长度的150-200氨基酸之间。N-末端部分通常地富含辅氨酸并命名为PRD(辅氨酸富含区域),而C-末端部分通常地多极并命名为MFMR(多功能嵌合区域)。该家族由三个亚族组成,依据结构组成分类为A、B和C。一些结构域可以参与介导蛋白-蛋白之间的互作。MFMR区域含有存在于bZIPopaque和GBF-2中的核定位信号。MFMR含有存在于TAF-1中的反式调控活性。MFMR含有存在于CPRF-2中的胞质滞留信号。例如,生物量-调节多肽可以由与SEQ ID NO:521的1-188残基具有60%或更高序列一致性的G-盒结合蛋白MFMR结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:521、523、525、、527、529、531、533、534、536、538、540、541、543、544、545、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588或589列出的一种或多种多肽的G-盒结合蛋白MFMR结构域有60%或更高序列一致性的G-盒结合蛋白MFMR结构域组成。这些序列的G-盒结合蛋白MFMR结构域列于序列表中。
生物量-调节多肽可以包含bZIP_1转录因子。该结构域也存在于SEQ IDNO:521中,该序列是从玉米克隆的氨基酸序列,此处鉴定为Ceres Clone:258841(SEQ ID NO:521),据预测其编码的多肽含有bZIP_1转录因子结构域。真核细胞的碱性-亮氨酸拉链(bZIP)转录因子是含有介导序列-特异DNA结合的碱性区域,紧接着二聚化所需的亮氨酸拉链区域的蛋白。例如,生物量-调节多肽可以由与SEQ ID NO:521的279-342残基具有60%或更高序列一致性的bZIP_1转录因子结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:521、523、525、、527、529、531、533、534、536、538、540、541、543、544、545、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588或589列出的一种或多种多肽的bZIP_1转录因子结构域有60%或更高序列一致性的bZIP_1转录因子结构域组成。这些序列的bZIP_1转录因子结构域列于序列表中。
生物量-调节多肽可以包含bZIP_2碱性区域亮氨酸拉链结构域。该结构域也存在于SEQ ID NO:521中,该序列是从玉米克隆的氨基酸序列,此处鉴定为Ceres Clone:258841(SEQ ID NO:521),据预测其编码的多肽含有bZIP_2碱性区域亮氨酸拉链结构域。真核细胞的碱性-亮氨酸拉链(bZIP)转录因子是含有介导序列-特异DNA结合的碱性区域,紧接着二聚化所需的亮氨酸拉链区域的蛋白。例如,生物量-调节多肽可以由与SEQ ID NO:521的279-333残基具有60%或更高序列一致性的bZIP_2碱性区域亮氨酸拉链结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:521、523、525、、527、529、531、533、534、536、538、540、541、543、544、545、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588或589列出的一种或多种多肽的bZIP_2碱性区域亮氨酸拉链结构域有60%或更高序列一致性的bZIP_2碱性区域亮氨酸拉链结构域组成。这些序列的bZIP_2碱性区域亮氨酸拉链结构域列于序列表中。
生物量-调节多肽可以包含表异构酶结构域。该结构域也存在于SEQ IDNO:591中,该序列是从拟南芥克隆的氨基酸序列,此处鉴定为Ceres Annot:863641(SEQ ID NO:591),据预测其编码的多肽含有表异构酶结构域。通常地该家族蛋白的表异构酶结构域利用NAD作为辅因子。该家族的蛋白利用核苷-糖底物参与多种化学反应。例如,生物量-调节多肽可以由与SEQ IDNO:591的20-290残基具有60%或更高序列一致性的表异构酶结构域组成。在一些实施方式中,生物量-调节多肽可以由与SEQ ID NOs:591、593、595、596、598、600、602、603、605、606、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636或638列出的一种或多种多肽的表异构酶结构域有60%或更高序列一致性的表异构酶结构域组成。这些序列的表异构酶结构域列于序列表中。
在一些实施方式中,生物量-调节多肽是天然发生多肽氨基-或羧基-末端截短型。截短型多肽可以保留天然发生多肽一定的结构域,而缺失其他的。因此,通常地短或长达到5个氨基酸的长度突变体表现出截短型多肽的生物量-调节活性。在一些实施方式中,截短型多肽是显性失活多肽。这些截短型多肽在植物中的表达与不含截短型的对照植物相应生物量水平比较存在差异。
B.通过双向比对鉴定功能性同系物
在一些实施方式中,由上述表示的一种或多种Pfam描述定义的参考生物量-调节多肽的一种或多种功能性同系物适合用作生物量-调节多肽。功能性同系物是具有与参考多肽序列相似性的多肽,并且其产生参考多肽的一种或多种生化或生理功能。功能性同系物和参考多肽可以是天然发生多肽,并且由于进化事件收敛或发散序列相似性。因此,功能性同系物在文献中有时特定为同系物,或类似物,或旁系物。天然发生功能性同系物的变异,诸如由野生型编码序列突变编码的多肽,本身可能是功能性同系物。功能性同系物也可以通过生物量-调节多肽编码序列定点突变,或通过来自不同天然-发生生物量-调节多肽编码序列的组合结构域(“结构域交换”)创建。术语“功能性同系物”有时应用于编码功能性同源多肽的核酸。
功能性同系物可以通过核酸和多肽序列比对分析鉴定。例如,在核酸或多肽序列数据库进行查询可以鉴定生物量-调节多肽同系物。序列分析涉及利用生物量-调节多肽氨基酸序列作为参考序列的非冗余数据库BLAST,双向BLAST,或PSI-BLAST分析。氨基酸序列,在某些情况下,由核酸序列推导出。数据库中的这些具有大于40%序列一致性的多肽作为候选,用于作为生物量-调节多肽合格的进一步评估。氨基酸序列相似性考虑保守氨基酸替换,诸如疏水残基间取代或极性残基间取代。如果需要,还需要进行这些候选的人工检测,目的是缩小需要进一步评估的候选数量。人工检测通过选择那些具有生物量-调节多肽出现结构域,例如,保守功能性结构域的候选者。
保守区域可以通过定位一个区域来鉴定,定位区域位于生物量-调节多肽的一级氨基酸序列内,可以是重复序列,形成一些二级结构(例如,螺旋和β折叠),建立正或负电荷结构域,或代表蛋白基序或结构域。参见,例如,描述多种蛋白基序和结构域一致序列的Pfam网址是万维网sanger.ac.uk/Software/Pfam/and pfam.janelia.org/。Pfam数据库包含的信息描述于Sonnhammer等,Nucl.Acids Res.,26:320-322(1998);Sonnhammer等,Proteins,28:405-420(1997);和Bateman等,Nucl.Acids Res.,27:260-262(1999)。也可以通过密切相关物种的相同或相关多肽的比对序列来
确定保守区域。密切相关的物种最好来源于同一科。在一些实施方式中,来源于两个不同物种的序列比对是足够的。
通常地,表现出至少约40%氨基酸序列一致性的多肽对于鉴定保守区域是非常有用的。相关多肽的保守区域显示至少45%的氨基酸序列一致性(例如,至少50%、至少60%、至少70%、至少80%,或至少90%氨基酸序列一致性)。在一些实施方式中,保守区域显示至少92%、至少94%、至少96%、至少98%,或至少99%氨基酸序列一致性。
SEQ ID NO:2所示的多肽功能性同系物的氨基酸序列的例子列于图1以及序列表中。这些功能性同系物包括,例如,Ceres Clone:36701(SEQ ID NO:4)、Ceres Clone:36311(SEQ ID NO:6)、Ceres Clone:581754(SEQ ID NO:8)、GI:34484306(SEQ ID NO:9)、Ceres Clone:1894727(SEQ ID NO:11)、Ceres Annot:1487885(SEQ ID NO:13)、GI:13431547(SEQ ID NO:14)、GI:75250205(SEQ ID NO:15)、GI:82547882(SEQ ID NO:16)、GI:46241274(SEQ ID NO:17)、CeresAnnot:6023904(SEQ ID NO:19)、CeresClone:753701(SEQ ID NO:21)、GI:157348194(SEQ ID NO:22)、GI:6449052(SEQ ID NO:23)、CeresClone:1811354(SEQ ID NO:25)、GI:115473007(SEQ ID NO:26)、Ceres Clone:1856050(SEQ ID NO:28)、CeresAnnot:1457156(SEQ ID NO:30)、CeresAnnot:1449371(SEQ ID NO:32)、CeresAnnot:1445504(SEQ ID NO:34)、CeresAnnot:1460575(SEQID NO:36)、Ceres Annot:1450618(SEQ ID NO:38)、GI:15231881(SEQID NO:39)、GI:26450928(SEQ ID NO:40)、GI:15232010(SEQ ID NO:41)、GI:62320250(SEQ ID NO:42)、GI:15234534(SEQ ID NO:43)、GI:413730(SEQ ID NO:44)、GI:15224197(SEQ ID NO:45)、GI:15224199(SEQ ID NO:46)、Ceres Clone:590924(SEQ ID NO:48)、GI:558925(SEQ ID NO:49)、GI:164605012(SEQ ID NO:50)、GI:4958918(SEQID NO:51)、GI:4958920(SEQ ID NO:52)、GI:13431546(SEQ ID NO:53)、GI:121145(SEQ ID NO:54)、GI:3885426(SEQ ID NO:55)、GI:14422402(SEQ ID NO:56)、Ceres Annot:8659367(SEQ ID NO:58)、Ceres Annot:8681395(SEQ ID NO:60)、GI:9971808(SEQ ID NO:61)、GI:147843373(SEQ ID NO:62)、GI:157335383(SEQ ID NO:63)、GI:157336281(SEQ ID NO:64)、Ceres Clone:1796324(SEQ ID NO:66)、Ceres Clone:1819213(SEQ ID NO:68)、GI:18146809(SEQ ID NO:69)、GI:41059107(SEQ ID NO:70)、GI:87299435(SEQ ID NO:71)、GI:22535957(SEQ ID NO:72)、GI:22535959(SEQ ID NO:73)、GI:17352451(SEQ ID NO:74)、GI:158104429(SEQ ID NO:75)、GI:79154586(SEQID NO:76)、GI:79154639(SEQ ID NO:77)、GI:4322331(SEQ ID NO:78)、GI:6277254(SEQ ID NO:79)、GI:6277256(SEQ ID NO:80)、GI:56122554(SEQ ID NO:81)、GI:56122559(SEQ ID NO:82)、GI:20386366(SEQ ID NO:83)、GI:20386368(SEQ ID NO:84)、GI:58201026(SEQ ID NO:85)、GI:88910043(SEQ ID NO:86)、GI:145352919(SEQID NO:87)、GI:87124785(SEQ ID NO:88)、GI:88808953(SEQ ID NO:89)、GI:22297564(SEQ ID NO:90)、GI:16329282(SEQ ID NO:91)、GI:33863380(SEQ ID NO:92)、GI:78184316(SEQ ID NO:93)、GI:119489387(SEQ ID NO:94)、GI:124026221(SEQ ID NO:95)、GI:159030944(SEQ ID NO:96)、GI:11467424(SEQ ID NO:97)、GI:126696514(SEQID NO:98)、GI:145620854(SEQ ID NO:99)、GI:33861626(SEQ ID NO:100)、GI:110599112(SEQ ID NO:101)、GI:117924356(SEQ ID NO:102)、GI:39996864(SEQ ID NO:103),或GI:77919267(SEQ ID NO:104)。在某些情况下,SEQ ID NO:2的功能性同系物的氨基酸序列与SEQ IDNO:2中的氨基酸序列具有至少45%序列一致性,例如,有50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。
SEQ ID NO:106所示的多肽功能性同系物的氨基酸序列的例子列于图2以及序列表中。这些功能性同系物包括,例如,GI:159472210(SEQ ID NO:107)、Ceres Annot:1504045(SEQ ID NO:109)、Ceres Clone:572174(SEQID NO:111)、GI:58198163(SEQ ID NO:112)、Ceres Annot:1450983(SEQ ID NO:114)、GI:118487460(SEQ ID NO:115)、Ceres Annot:1469397(SEQ ID NO:117)、Ceres Annot:859452(SEQ ID NO:119)、GI:21592852(SEQ ID NO:120)、Ceres Annot:884039(SEQ ID NO:122)、Ceres Clone:38304(SEQ ID NO:124)、Ceres Clone:467904(SEQ ID NO:126)、GI:124360157(SEQ ID NO:127)、Ceres Annot:8454475(SEQ ID NO:129)、Ceres Annot:8703127(SEQ ID NO:131)、Ceres Annot:8666968(SEQ IDNO:133)、Ceres Clone:238400(SEQ ID NO:135)、Ceres Clone:338909(SEQ ID NO:137)、Ceres Clone:1728626(SEQ ID NO:139)、GI:157345039(SEQ ID NO:140)、GI:147815273(SEQ ID NO:141)、GI:157359875(SEQ ID NO:142)、GI:125526023(SEQ ID NO:143)、GI:58531976(SEQ ID NO:144)、GI:125591796(SEQ ID NO:145)、GI:115436670(SEQ ID NO:146)、GI:125570472(SEQ ID NO:147)、GI:116056026(SEQ ID NO:148)、GI:58198153(SEQ ID NO:149)、GI:145355993(SEQ ID NO:150)、(SEQ ID NO:151)、(SEQ ID NO:152)、(SEQ ID NO:153)、(SEQ ID NO:154)、EV091145(SEQ ID NO:155)、DW088645(SEQID NO:156)、EX088422(SEQ ID NO:157)、EV189515(SEQ ID NO:158)、EY943890(SEQ ID NO:159)、DW088842(SEQ ID NO:160)、EV534950(SEQ ID NO:161)、ES337067(SEQ ID NO:162),或AY873990(SEQ IDNO:163)。在某些情况下,SEQ ID NO:106的功能性同系物的氨基酸序列与SEQ ID NO:106中的氨基酸序列具有至少45%序列一致性,例如,有50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。
SEQ ID NO:165所示的多肽功能性同系物的氨基酸序列的例子列于图3以及序列表中。这些功能性同系物包括,例如,GI:159483353(SEQ ID NO:166)、GI:116781877(SEQ ID NO:167)、Ceres Clone:1628154(SEQ IDNO:169)、Ceres Clone:1836022(SEQ ID NO:171)、Ceres Annot:1477956(SEQ ID NO:173)、Ceres Clone:1077443(SEQ ID NO:175)、GI:1632831(SEQ ID NO:176)、GI:5669634(SEQ ID NO:177)、Ceres Annot:8743195(SEQ ID NO:179)、CeresPClone:101144543(SEQ ID NO:181)、CeresClone:1732715(SEQ ID NO:183)、GI:157342830(SEQ ID NO:184)、GI:115468750(SEQ ID NO:185)、GI:116785703(SEQ ID NO:186)、Ceres Clone:1833747(SEQ ID NO:188)、Ceres Clone:1896466(SEQ IDNO:190)、Ceres Annot:1482906(SEQ ID NO:192)、GI:118485147(SEQID NO:193)、Ceres Annot:1519958(SEQ ID NO:195)、Ceres Annot:1466623(SEQ ID NO:197)、GI:15230125(SEQ ID NO:198)、Ceres Clone:39345(SEQ ID NO:200)、Ceres Clone:946651(SEQ ID NO:202)、Ceres Clone:1085665(SEQ ID NO:204)、Ceres Clone:474636(SEQ ID NO:206)、Ceres Clone:1614765(SEQ ID NO:208)、Ceres Clone:1027534(SEQ IDNO:210)、Ceres Clone:1049407(SEQ ID NO:212)、Ceres Clone:1075173(SEQ ID NO:214)、GI:117574665(SEQ ID NO:215)、Ceres Annot:8457163(SEQ ID NO:217)、GI:109288140(SEQ ID NO:218)、GI:20086364(SEQ ID NO:219)、GI:8895787(SEQ ID NO:220)、Ceres Annot:8709723(SEQ ID NO:222)、Ceres Clone:638938(SEQ ID NO:224)、Ceres Clone:1031619(SEQ ID NO:226)、Ceres Clone:685323(SEQ ID NO:228)、Ceres Clone:683522(SEQ ID NO:230)、CeresPClone:101136883(SEQ IDNO:232)、Ceres Clone:348434(SEQ ID NO:234)、Ceres Clone:1377080(SEQ ID NO:236)、Ceres Clone:1159254(SEQ ID NO:238)、Ceres Clone:417073(SEQ ID NO:240)、GI:147852829(SEQ ID NO:241)、GI:147865629(SEQ ID NO:242)、GI:147777777(SEQ ID NO:243)、Ceres Clone:1607224(SEQ ID NO:245)、Ceres Clone:1609842(SEQ ID NO:247)、Ceres Clone:2030861(SEQ ID NO:249)、Ceres Clone:1875246(SEQ ID NO:251)、Ceres Clone:1764141(SEQ ID NO:253)、GI:115476102(SEQ ID NO:254)、GI:19225065(SEQ ID NO:255)、BX822592(SEQ ID NO:257)、DR234115(SEQ ID NO:258)、EL589037(SEQ ID NO:259)、FD566230(SEQ ID NO:260)、EX895802(SEQ ID NO:261)、CD824249(SEQ ID NO:262)、ES914361(SEQ ID NO:263)、FD953773(SEQ ID NO:264)、ES264137(SEQ ID NO:265)、DR234111(SEQ ID NO:266)、EE417608(SEQ ID NO:267)、AM730131(SEQ ID NO:268)、BW598058(SEQ ID NO:269)、DT018442(SEQ ID NO:270)、CK755926(SEQ ID NO:271)、CF517682(SEQ ID NO:272)、CF517596(SEQ ID NO:273)、EH701015(SEQ ID NO:274)、EH709076(SEQ ID NO:275)、CV881605(SEQ ID NO:276)、DW101014(SEQ ID NO:277)、DB938705(SEQ ID NO:278)、DW071774(SEQ IDNO:279)、CN868205(SEQ ID NO:280)、BW606099(SEQ ID NO:281)、DX491679(SEQ ID NO:282)、CN909317(SEQ ID NO:283)、CO576745(SEQ ID NO:284)、CB347147(SEQ ID NO:285)、BW615679(SEQ IDNO:286)、BQ594558(SEQ ID NO:287)、CT543278(SEQ ID NO:288)、BP531744(SEQ ID NO:289)、DY827040(SEQ ID NO:290)、EX328884(SEQ ID NO:291)、DY826487(SEQ ID NO:292)、EX310992(SEQ ID NO:293)、DR513090(SEQ ID NO:294)、EX333956(SEQ ID NO:295)、DR081329(SEQ ID NO:296)、ES890011(SEQ ID NO:297)、CB346943(SEQ ID NO:298)、BG275592(SEQ ID NO:299)、BX254073(SEQ ID NO:300)、DR531251(SEQ ID NO:301)、BP890754(SEQ ID NO:302)、BW988808(SEQ IDNO:303)、BE131423(SEQ ID NO:304)、CO161904(SEQ ID NO:305)、EB695134(SEQ ID NO:306)、CN495585(SEQ ID NO:307)、CV883104(SEQ ID NO:308)、FC456374(SEQ ID NO:309)、EX310578(SEQ ID NO:310)、FC421487(SEQ ID NO:311)、FC405689(SEQ ID NO:312),或BG275837(SEQ ID NO:313)。在某些情况下,SEQ ID NO:165的功能性同系物的氨基酸序列与SEQ ID NO:165中的氨基酸序列具有至少45%序列一致性,例如,有50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。
SEQ ID NO:315所示的多肽功能性同系物的氨基酸序列的例子列于图4以及序列表中。这些功能性同系物包括,例如,CerescDNA_ID:1498985(SEQID NO:317)、Ceres Annot:866611(SEQ ID NO:319)、Ceres Annot:838033(SEQ ID NO:321)、Ceres Clone:6399(SEQ ID NO:323)、Ceres Annot:883525(SEQ ID NO:325)、Ceres Annot:867752(SEQ ID NO:327)、CeresAnnot:871059(SEQ ID NO:329)、GI_NO_12039257(SEQ ID NO:330)、GI:157352568(SEQ ID NO:331)、GI:74476783(SEQ ID NO:332)、Ceres Annot:1486768(SEQ ID NO:334)、GI:112383516(SEQ ID NO:335)、GI:51587334(SEQ ID NO:336)、Ceres Clone:535739(SEQ ID NO:338)、Ceres Clone:1886265(SEQ ID NO:340)、GI:115446631(SEQ IDNO:341)、Ceres Annot:6119623(SEQ ID NO:343)、Ceres Clone:1580417(SEQ ID NO:345)、GI:146395463(SEQ ID NO:346)、GI:152955872(SEQ ID NO:347)、Ceres Clone:1883376(SEQ ID NO:349)、Ceres Clone:1883376(SEQ ID NO:349)、GI:21322510(SEQ ID NO:350)、GI:4200165(SEQ ID NO:351)、Ceres Peptide_ID:1010103(SEQ ID NO:352)、CeresPeptide_ID:1010104(SEQ ID NO:353)、Ceres Peptide_ID:1498987(SEQID NO:354)、Ceres Peptide_ID:1498988(SEQ ID NO:355)、CeresPeptide_ID:1809802(SEQ ID NO:356)、GI:7267646(SEQ ID NO:357)、Ceres Annot:1479723(SEQ ID NO:359)、GI:42572857(SEQ ID NO:360)、GI:18395144(SEQ ID NO:361)、GI:21594008(SEQ ID NO:362)、GI:15236209(SEQ ID NO:363)、GI:157335158(SEQ ID NO:364)、Ceres Annot:6086289(SEQ ID NO:366)、GI:125539847(SEQ ID NO:367)、Ceres Annot:1450491(SEQ ID NO:369)、Ceres Annot:1460693(SEQID NO:371)、Ceres Annot:1452868(SEQ ID NO:373)、GI:115458460(SEQ ID NO:374)、GI:115484433(SEQ ID NO:375)、GI:125576397(SEQ ID NO:376)、GI:125548352(SEQ ID NO:377)、GI:79319205(SEQ ID NO:378)、Ceres Annot:6007912(SEQ ID NO:380)、Ceres Clone:1941767(SEQ ID NO:382)、Ceres Annot:1444452(SEQ ID NO:384)、GI:41053066(SEQ ID NO:385)、GI:108864059(SEQ ID NO:386)、GI:157327128(SEQ ID NO:387)、GI:157343294(SEQ ID NO:388)、GI:125580647(SEQ ID NO:389)、GI:125537900(SEQ ID NO:390)、GI:125555130(SEQ ID NO:391)、GI:125555130(SEQ ID NO:391)、Ceres Annot:1465440(SEQ ID NO:393)、Ceres Annot:1488320(SEQ IDNO:395)、Ceres Annot:1510995(SEQ ID NO:397)、GI:45935151(SEQID NO:398)、GI:157353979(SEQ ID NO:399)、GI:125525725(SEQ IDNO:400)、GI:115436346(SEQ ID NO:401)、Ceres Annot:6096803(SEQID NO:403)、Ceres Annot:1511927(SEQ ID NO:405)、Ceres Annot:1458667(SEQ ID NO:407)、GI:157346594(SEQ ID NO:408)、Ceres Annot:6035762(SEQ ID NO:410)、GI:115446465(SEQ ID NO:411)、CeresAnnot:6018379(SEQ ID NO:413)、GI:157353064(SEQ ID NO:414)、GI:27948558(SEQ ID NO:415)、GI:153850908(SEQ ID NO:416)、GI:115452671(SEQ ID NO:417)、GI:147773544(SEQ ID NO:418)、GI:157347020(SEQ ID NO:419)、GI:115458252(SEQ ID NO:420)、GI:125548194(SEQ ID NO:421)、GI:2832717(SEQ ID NO:422)、GI:124270304(SEQID NO:423)、GI:125539719(SEQ ID NO:424)、Ceres Annot:1469136(SEQ ID NO:426)、Ceres Annot:1522532(SEQ ID NO:428)、GI:12322685(SEQ ID NO:429)、GI:30794036(SEQ ID NO:430)、GI:118562909(SEQ ID NO:431)、GI:30679615(SEQ ID NO:432)、GI:125590306(SEQ ID NO:433)、GI:125543620(SEQ ID NO:434)、GI:125586048(SEQ ID NO:435)、(SEQ ID NO:436)、(SEQ ID NO:437)、(SEQ ID NO:438)、(SEQ ID NO:439)、(SEQ ID NO:440)、(SEQ ID NO:441)、(SEQID NO:442)、(SEQ ID NO:443)、(SEQ ID NO:444)、(SEQ ID NO:445)、(SEQ ID NO:446)、(SEQ ID NO:447)、(SEQ ID NO:448)、(SEQ ID NO:449)、CAP59642(SEQ ID NO:450)、(SEQ ID NO:451)、(SEQ ID NO:452)、(SEQ ID NO:453)、(SEQ ID NO:453)、(SEQ ID NO:454)、(SEQID NO:455)、(SEQ ID NO:456)、(SEQ ID NO:457)、(SEQ ID NO:458)、EDQ57342(SEQ ID NO:459)、EDQ52662(SEQ ID NO:460)、(SEQ ID NO:461)、(SEQ ID NO:462)、(SEQ ID NO:463)、(SEQ ID NO:464)、(SEQID NO:465)、(SEQ ID NO:466)、(SEQ ID NO:467)、(SEQ ID NO:468)、(SEQ ID NO:469)、EDQ55594(SEQ ID NO:470)、EDQ76746(SEQ IDNO:471),或(SEQ ID NO:472)。在某些情况下,SEQ ID NO:315的功能性同系物的氨基酸序列与SEQ ID NO:315中的氨基酸序列具有至少45%序列一致性,例如,有50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。
SEQ ID NO:474所示的多肽功能性同系物的氨基酸序列的例子列于图5以及序列表中。这些功能性同系物包括,例如,Ceres Peptide_ID:4355121(SEQ ID NO:475)、Ceres Clone:1284476(SEQ ID NO:477)、CeresPClone:100746476(SEQ ID NO:479)、Ceres Clone:1758903(SEQ ID NO:481)、Ceres Clone:622426(SEQ ID NO:483)、Ceres Clone:1770660(SEQ ID NO:485)、Ceres Clone:1871189(SEQ ID NO:487)、GI:32490260(SEQ ID NO:488)、GI:49659792(SEQ ID NO:489)、GI:115447281(SEQ ID NO:490)、Ceres Clone:1835064(SEQ ID NO:492)、Ceres Clone:18152(SEQID NO:494)、Ceres Clone:1418421(SEQ ID NO:496)、Ceres Clone:1416780(SEQ ID NO:498)、Ceres Clone:1894775(SEQ ID NO:500)、Ceres Clone:980427(SEQ ID NO:502)、GI:70663924(SEQ ID NO:503)、GI:125548935(SEQ ID NO:504)、Ceres Clone:1730282(SEQ ID NO:506)、Ceres Clone:528086(SEQ ID NO:508)、Ceres Annot:8657405(SEQ ID NO:510)、GI:115459286(SEQ ID NO:511)、Ceres Annot:7923831(SEQ ID NO:513)、Ceres Clone:1287015(SEQ ID NO:515)、Ceres Annot:1448104(SEQID NO:517)、(SEQ ID NO:518),或(SEQ ID NO:519)。在某些情况下,SEQ ID NO:474的功能性同系物的氨基酸序列与SEQ ID NO:474中的氨基酸序列具有至少45%序列一致性,例如,有50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。
SEQ ID NO:521所示的多肽功能性同系物的氨基酸序列的例子列于图6以及序列表中。这些功能性同系物包括,例如,Ceres Clone:258841(SEQID NO:521)、Ceres Annot:834509(SEQ ID NO:523)、Ceres Annot:866384(SEQ ID NO:525)、Ceres Annot:880496(SEQ ID NO:527)、Ceres Annot:862435(SEQ ID NO:529)、Ceres Clone:16533(SEQ ID NO:531)、CeresClone:540068(SEQ ID NO:533)、GI:2815305(SEQ ID NO:534)、CeresClone:1973300(SEQ ID NO:536)、Ceres Annot:1538994(SEQ ID NO:538)、Ceres Clone:1611686(SEQ ID NO:540)、GI:51870705(SEQ ID NO:541)、Ceres Annot:6047730(SEQ ID NO:543)、GI:122771(SEQ ID NO:544)、GI:102140034(SEQ ID NO:545)、GI:125536186(SEQ ID NO:546)、(SEQ ID NO:547)、(SEQ ID NO:548)、(SEQ ID NO:549)、(SEQID NO:550)、(SEQ ID NO:551)、(SEQ ID NO:552)、(SEQ ID NO:553)、X83922(SEQ ID NO:554)、SOYGBFB(SEQ ID NO:555)、Ceres Clone:1837464(SEQ ID NO:557)、Ceres Clone:1884689(SEQ ID NO:559)、GI:118488723(SEQ ID NO:560)、Ceres Annot:1487864(SEQ ID NO:562)、Ceres Annot:1541275(SEQ ID NO:564)、Ceres Annot:1471259(SEQID NO:566)、Ceres Annot:1444364(SEQ ID NO:568)、GI:3608135(SEQID NO:569)、GI:30690290(SEQ ID NO:570)、GI:1399005(SEQ ID NO:571)、GI:113367212(SEQ ID NO:572)、GI:113367192(SEQ ID NO:573)、GI:1354857(SEQ ID NO:574)、GI:1155054(SEQ ID NO:575)、GI:9650824(SEQ ID NO:576)、GI:1169081(SEQ ID NO:577)、GI:728628(SEQ ID NO:578)、Ceres Annot:6007883(SEQ ID NO:580)、Ceres Annot:6109033(SEQ ID NO:582)、Ceres Clone:645403(SEQ ID NO:584)、Ceres Clone:1221348(SEQ ID NO:586)、GI:157335369(SEQ IDNO:587)、GI:157348180(SEQ ID NO:588),或GI:147867254(SEQ IDNO:589)。在某些情况下,SEQ ID NO:521的功能性同系物的氨基酸序列与SEQ ID NO:521中的氨基酸序列具有至少45%序列一致性,例如,有50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。
SEQ ID NO:591所示的多肽功能性同系物的氨基酸序列的例子列于图7以及序列表中。这些功能性同系物包括Ceres Clone:1948444(SEQ ID NO:593)、Ceres Annot:1541782(SEQ ID NO:595)、GI:157352120(SEQ IDNO:596)、Ceres Annot:8460479(SEQ ID NO:598)、Ceres Clone:300029(SEQ ID NO:600)、Ceres Clone:1788124(SEQ ID NO:602)、GI:115442487(SEQ ID NO:603)、Ceres Annot:6017305(SEQ ID NO:605)、GI:147771536(SEQ ID NO:606)、Ceres cDNA_ID:23374400(SEQ ID NO:608)、CerescDNA_ID:23374400(SEQ ID NO:608)、CeresPeptide_ID:1009650(SEQID NO:609)、Ceres Peptide_ID:2182905(SEQ ID NO:610)、CeresPeptide_ID:2182906(SEQ ID NO:611)、GI:14596185(SEQ ID NO:612)、GI:157346638(SEQ ID NO:613)、Ceres Clone:1969770(SEQ ID NO:615)、Ceres Clone:1995643(SEQ ID NO:617)、Ceres Clone:1459647(SEQID NO:619)、Ceres Clone:243057(SEQ ID NO:621)、Ceres Clone:1936952(SEQ ID NO:623)、GI:125529268(SEQ ID NO:624)、Ceres Annot:7951750(SEQ ID NO:626)、GI:85718018(SEQ ID NO:627)、GI:162462229(SEQ ID NO:628)、Ceres Annot:1460446(SEQ ID NO:630)、GI:37379419(SEQ ID NO:631)、Ceres Annot:1488364(SEQ ID NO:633)、GI:45935133(SEQ ID NO:634)、Ceres Clone:6892(SEQ ID NO:636),或Ceres Clone:1047104(SEQ ID NO:638)。在某些情况下,SEQ ID NO:591的功能性同系物的氨基酸序列与SEQ ID NO:521中的氨基酸序列具有至少45%序列一致性,例如,有50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。
生物量-调节多肽保守结构域的鉴定有利于生物量-调节多肽变异体的生产。通常地生物量-调节多肽变异体的初级氨基酸序列中具有10个或更少的保守氨基酸替换,例如,7个或更少的保守氨基酸替换,5个或更少的保守氨基酸替换,或介于1-5之间的保守氨基酸替换。有用的变异多肽可以通过基于图1、图2、图3、图4、图5、图6或图7中的一个比对和/或序列表中鉴定的同系物来构建。这些多肽包括按照图中所示的从氨基-末端到羧基-末端顺序排列的保守结构域。这些多肽在破折号标记的地方还可以包括0、1或多于1个氨基酸。当在破折号标记的位置没有氨基酸时,该多肽的长度就是所有保守区域的氨基酸总和。当在破折号标记的位置出现氨基酸时,该多肽的长度就是所有保守区域以及所有破折号的氨基酸总和。
C.通过HMMER鉴定功能性同系物
在一些实施方式中,有用的生物量-调节多肽包括那些适合基于图1-7中任一阐述的多肽的隐马尔可夫模型。隐马尔可夫模型(HMM)是一组功能性同系物一致序列的统计模型。参见,Durbin等,Biological Sequence Analysis:Probabilistic Models of Proteins and Nucleic Acids,Cambridge University Press,Cambridge,UK(1998)。HMM是通过HMMER 2.3.2程序的默认程序参数,利用输入的一组功能性同系物的序列产生的。多序列比对是通过ProbCons(Do et al.,Genome Res.,15(2):330-40(2005))1.11版本,利用一系列参数:-c,--REPS一致性2次;-ir,--REPS重复-精制100次;-pre,--REPS预先-训练0次产生(-c,--consistency REPS of 2;-ir,--iterative-refinement REPS of 100;-pre,--pre-training REPS of 0)。ProbCons是斯坦福大学提供的一个公共领域软件程序。
构建HMM(hmmbuild)的默认参数如下:用MAP构架构建的默认“事先构架”(archpri)参数是0.85,以及用于决定有效序列数的默认截止阈值是0.62。根据GNU通用公共许可证,HMMER 2.3.2在2003年10月3日释放,在万维网不同资源都可使用,诸如,hmmer.janelia.org;hmmer.wustl.edu;和fr.com/hmmer232/。Hmmbuild输出模型是文本文档。
HMM对于功能性同系物组可以用来确定候选生物量-调节多肽序列比通过没有结构或功能性相关的序列组获得的无效HMM更适合特殊HMM的可能性。所述比无效HMM更适合HMM的候选多肽序列的可能性是通过HMM比特得分来表示,当使用HMMER hmm搜索程序将候选序列拟合到HMM序列谱时获得一个数值。当运行hmm搜索程序时使用以下默认参数:默认E-值截止(cutoff)(E)为10.0,默认比特值截止(cutoff)(T)为负无穷大,默认数据库中的序列数(Z)为数据库中序列的真实数,默认每-结构域命中表排名的E-值截止(cutoff)(domE)为无穷大,以及默认每-结构域命中表排名的比特值截止(cutoff)(domT)为负无穷大。高HMM比特值表明候选序列实现用于获得HMM的多肽的一种或多种生化或生理功能的更大可能性。高比特值至少为20,并且通常更高。特殊序列的HMM比特值的轻微变化可能是由于存在诸如指令因子,该因子所在序列通过诸如ProbCons程序的多重序列比对算法经行过比对。然而,这种HMM比特值变化是较小的。
下面讨论的生物量-调节多肽适合具有HMM比特值大于210(例如,大于230、240、250、260、270、280、290、2100、2200、2300、2400或2500)的HMM表示。在一些实施方式中,下面讨论的生物量-调节多肽的HMM比特值大约是在本申请序列表中提供的功能性同系物的HMM比特值的50%、60%、70%、80%、90%或95%。在一些实施方式中,下面讨论的生物量-调节多肽适合具有HMM比特值大于210的HMM表示,并具有表明生物量-调节多肽的结构域。在一些实施方式中,下面讨论的生物量-调节多肽适合具有HMM比特值大于210的HMM表示,并与图1-7中任一所示氨基酸序列具有65%或更高序列一致性(例如,75%、80%、85%、90%、95%或100%)。
多肽的例子显示在序列表中,其具有HMM比特值比来源于图1所示的被鉴定于本申请的序列表中的氨基酸序列的HMM值230大。这些多肽包括,例如,2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103或104。
多肽的例子显示在序列表中,其具有HMM比特值比来源于图2所示的的被鉴定于本申请的序列表中的氨基酸序列的HMM350大。这些多肽包括,例如,SEQ ID NOs:106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162或163。
多肽的例子显示在序列表中,其具有HMM比特值比来源于图3所示的被鉴定于本申请的序列表中的氨基酸序列的HMM215大。这些多肽包括,例如,SEQ ID NOs:165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312,或313。
多肽的例子显示在序列表中,其具有HMM比特值比来源于图4所示的被鉴定于本申请的序列表中的氨基酸序列的HMM880大。这些多肽包括,例如,SEQ ID NOS:315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、375、376、377、378、380、382、384、385、386、387、388、389、390、391、393、395、397、398、399、400、401、403、405、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、428、429、430、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471,或472。
多肽的例子显示在序列表中,其具有HMM比特值比来源于图5所示的被鉴定于本申请的序列表中的氨基酸序列的HMM240大。这些多肽包括,例如,474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518,或519。
多肽例子显示在序列表中,其具有HMM比特值比来源于图6所示的被鉴定于本申请的序列表中的氨基酸序列的HMM310大。这些多肽包括,例如,521、523、525、527、529、531、533、534、536、538、540、541、543、544、545、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、572、573、574、575、576、577、578、580、582、584、586、587、588,或589。
多肽例子显示在序列表中,其具有HMM比特值比来源于图7所示的被鉴定于本申请的序列表中的氨基酸序列的HMM810大。这些多肽包括,例如,591、593、595、596、598、600、602、603、605、606、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636,或638。
D.一致性百分数
在一些实施方式中,生物量-调节多肽的氨基酸序列与SEQ ID NOs:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636,或638的一条氨基酸序列至少有45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%,或99%。如上所述,具有此百分比序列一致性的多肽常常具有一个表明生物量-调节多肽的结构域和/或具有HMM比特值大于210。生物量-调节多肽的氨基酸序列与图1-7和序列表提供的SEQ ID NOs:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636,或638的一条氨基酸序列至少有80%的序列一致性。
“序列一致性百分率”是指给定参考序列,例如,SEQ ID NO:2,和候选生物量-调节序列之间的序列一致性程度。通常地候选序列长度是参考序列长度的80-200%,例如,是参考序列的82、85、87、89、90、93、95、97、99、100、105、110、115、120、130、140、150、160、170、180、190,或200。候选核酸或多肽相对于参考核酸或多肽的一致性百分率可以由以下确定。利用计算机程序ClustalW(1.83版本,默认参数)将参考序列(例如,核酸序列或氨基酸序列)和一条或多条候选序列进行比对,该程序允许核酸或多肽序列在其整个长度内进行比对(全局序列比对)。Chenna等,NucleicAcids Res.,31(13):3497-500(2003)。
ClustalW计算参考序列和一条或多条候选序列之间的最佳匹配,以及比对它们从而确定一致性、相似性和差异。为了最大化序列比对,一个或多个氨基酸残基间隔可以插入到参考序列、候选序列或二者中。对于核酸序列快速成对比对,可以使用下述默认参数:字体大小:2;窗口大小:4;评分方法:百分比;顶部对角线数目:4;以及间隔罚分:5。核酸序列多重比对,所用参数如下:间隔开放罚分:10.0;间隔拓展罚分:5.0;以及权重转换:是。对于蛋白序列快速成对比对,可以使用下述默认参数:字体大小:1;窗口大小:5;评分方法:百分比;顶部对角线数目:5;间隔罚分:3。对于蛋白序列多重比对,所用参数如下:权重矩阵:blosum;间隔开放罚分:10.0;间隔拓展罚分:0.05;亲水间隔:on;亲水残基:Gly、Pro、Ser、Asn、Asp、Gln、Glu、Arg,和Lys;残基-特异间隔罚分:on。ClustalW输出是一条反应序列之间关系的序列比对结果。可以在例如在贝勒医学院的搜索启动网站(searchlauncher.bcm.tmc.edu/multi-align/multi-align.html)以及在欧洲生物信息学研究结构网站(ebi.ac.uk/clustalw)上运行ClustalW。
为了确定候选核酸或氨基酸序列相对于参考序列的一致性百分率,利用ClustalW进行序列比对,比对结果中相同匹配的数目除以参考序列长度,结果乘100。值得注意的是一致性百分率值可以调整到最接近十分之一。例如,78.11 78.12、78.13,和78.14下调整到78.1,而78.15、78.16、78.17、78.18和78.19上调整到78.2。
在某些情况下,生物量-调节多肽的氨基酸序列与SEQ ID NO:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103或104中的氨基酸序列有至少45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。图1和序列表提供了具有与SEQ ID NO:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103,或104中的多肽大于45%序列一致性的多肽的氨基酸序列。
在某些情况下,生物量-调节多肽的氨基酸序列与SEQ ID NO:106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162或163中的氨基酸序列有至少45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。图2和序列表提供了具有与SEQ ID NO:106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162或163中的多肽大于45%序列一致性的多肽的氨基酸序列。
在某些情况下,生物量-调节多肽的氨基酸序列与SEQ ID NO:165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312或313中的氨基酸序列有至少45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。图3和序列表提供了具有与SEQ IDNO:165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312或313中的多肽大于45%序列一致性的多肽的氨基酸序列。
在某些情况下,生物量-调节多肽的氨基酸序列与SEQ ID NO:315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、375、376、377、378、380、382、384、385、386、387、388、389、390、391、393、395、397、398、399、400、401、403、405、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、428、429、430、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471或472中的氨基酸序列有至少45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。图4和序列表提供了具有与SEQ ID NO:315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、375、376、377、378、380、382、384、385、386、387、388、389、390、391、393、395、397、398、399、400、401、403、405、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、428、429、430、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471或472中的多肽大于45%序列一致性的多肽的氨基酸序列。
在某些情况下,生物量-调节多肽的氨基酸序列与SEQ ID NO:474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518或519中的氨基酸序列有至少45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。图5和序列表提供了具有与SEQ ID NO:474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518或519中的多肽大于45%序列一致性的多肽的氨基酸序列。
在某些情况下,生物量-调节多肽的氨基酸序列与SEQ ID NO:521、523、525、527、529、531、533、534、536、538、540、541、543、544、545、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、572、573、574、575、576、577、578、580、582、584、586、587、588或589中的氨基酸序列有至少45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。图6和序列表提供了具有与EQ ID NO:521、523、525、527、529、531、533、534、536、538、540、541、543、544、545、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、572、573、574、575、576、577、578、580、582、584、586、587、588或589中的多肽大于45%序列一致性的多肽的氨基酸序列。
在某些情况下,生物量-调节多肽的氨基酸序列与SEQ ID NO:591、593、595、596、598、600、602、603、605、606、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636或638中的氨基酸序列有至少45%的序列一致性,例如,50%、52%、56%、59%、61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的序列一致性。图7和序列表提供了具有与SEQ ID NO:591、593、595、596、598、600、602、603、605、606、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636或638中的多肽大于45%序列一致性的多肽的氨基酸序列。
E.其他序列
生物量-调节多肽可以包括不参与生物量调节的别的氨基酸,因此这样的多肽就比其本来情况长。例如,生物量-调节多肽可以包括纯化标签、叶绿体转运肽、线粒体转运肽、淀粉体肽,或氨基或羧基末端添加的引导序列。在一些实施方式中,生物量-调节多肽包括功能上作为报告子的氨基酸序列,例如绿色荧光蛋白或黄色荧光蛋白。
III.核酸
此处描述的核酸包括当在植物或植物细胞中转录时能有效调节生物量水平的核酸。此类核酸包括,但不限于,那些编码生物量-调节多肽以及那些通过核酸基础方法用于抑制生物量-调节多肽表达的核酸。
A.编码生物量-调节多肽的核酸
此处描述了编码生物量-调节多肽的核酸。此类核酸的例子包括SEQ IDNOs:1、105、164、314、473、520,或590,下面详细描述。核酸也可以是SEQ ID NOs:1、3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635或637中核酸的片段,该片段至少是核酸全长的40%(例如,至少45、50、55、60、65、70、75、80、85、90、95或99%)。
生物量-调节核酸可以包括SEQ ID NO:1中的核酸序列。另外,生物量-调节核酸可以是SEQ ID NO:1中的核酸序列的核酸变异体。例如,生物量-调节核酸与SEQ ID NO:1、3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65或67中的核酸序列至少有80%的序列一致性,例如,81%、85%、90%、95%、97%、98%或99%的序列一致性。
生物量-调节核酸可以包括SEQ ID NO:105中的核酸序列。另外,生物量-调节核酸可以是SEQ ID NO:105中的核酸序列的核酸变异体。例如,生物量-调节核酸与SEQ ID NO:105、108、110、113、116、118、121、123、125、128、130、132、134、136或138中的核酸序列至少有80%的序列一致性,例如,81%、85%、90%、95%、97%、98%或99%的序列一致性。
生物量-调节核酸可以包括SEQ ID NO:164中的核酸序列。另外,生物量-调节核酸可以是SEQ ID NO:164中的核酸序列的核酸变异体。例如,生物量-调节核酸与SEQ ID NO:164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250或252中的核酸序列至少有80%的序列一致性,例如,81%、85%、90%、95%、97%、98%或99%的序列一致性。
生物量-调节核酸可以包括SEQ ID NO:314中的核酸序列。另外,生物量-调节核酸可以是SEQ ID NO:314中的核酸序列的核酸变异体。例如,生物量-调节核酸与SEQ ID NO:314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425或427中的核酸序列至少有80%的序列一致性,例如,81%、85%、90%、95%、97%、98%或99%的序列一致性。
生物量-调节核酸可以包括SEQ ID NO:473中的核酸序列。另外,生物量-调节核酸可以是SEQ ID NO:473中的核酸序列的核酸变异体。例如,生物量-调节核酸与SEQ ID NO:473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514或516中的核酸序列至少有80%的序列一致性,例如,81%、85%、90%、95%、97%、98%或99%的序列一致性。
生物量-调节核酸可以包括SEQ ID NO:520中的核酸序列。另外,生物量-调节核酸可以是SEQ ID NO:520中的核酸序列的核酸变异体。例如,生物量-调节核酸与SEQ ID NO:520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583或585中的核酸序列至少有80%的序列一致性,例如,81%、85%、90%、95%、97%、98%或99%的序列一致性。
生物量-调节核酸可以包括SEQ ID NO:590中的核酸序列。另外,生物量-调节核酸可以是SEQ ID NO:590中的核酸序列的核酸变异体。例如,生物量-调节核酸与SEQ ID NO:590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635或637中的核酸序列至少有80%的序列一致性,例如,81%、85%、90%、95%、97%、98%或99%的序列一致性。
分离核酸分子可以通过标准技术获得。例如,聚合酶链式反应(PCR)技术可以用于获得含有此处描述核酸序列的分离核酸。PCR可以用于从DNA以及RNA,包括基因组总DNA或细胞内总RNA中扩增特异序列。不同的PCR方法,描述于例如,PCR Primer:A Laboratory Manual,Dieffenbach和Dveksler,eds.,Cold Spring Harbor Laboratory Press,1995。一般地,来自感兴趣区域末端或旁边的序列信息用于设计寡核苷酸引物,该引物与扩增模板的反向链序列是相同或相似的。通过将点-特异核酸序列修饰引入模板核酸的不同PCR策略也是可行的。分离核酸也可以是化学合成的(例如,利用亚磷酰胺技术在3′-5′方向使DNA自动合成),或是单条核酸分子或是一系列的寡核苷酸。例如,合成一或多对含有所需序列的长寡核苷酸(例如,>100核苷酸),其中每对含有互补短片段(例如,大约15个核苷酸),因此当寡核苷酸对退火时就形成双链。DNA聚合酶用于寡核苷酸的延伸,每对寡苷酸形成单链、双链核酸分子,接着其可以用于连接到载体上。本发明分离的核酸可以通过,例如,天然发生DNA的突变获得。
B.利用核酸调节多肽的表达
i.生物量-调节多肽的表达
编码一种此处描述的生物量-调节多肽的核酸可以在感兴趣植物品种中表达该多肽,通常是通过利用具有多肽编码序列可操作地正向连接一个或多个调控区域的核酸转化植物细胞完成。由于遗传密码的简并性,许多核酸可以编码特定的生物量-调节多肽;即对于许多氨基酸,作为氨基酸的密码的核苷酸三连体多于1个。因此,可以利用那个物种适当的密码偏爱表对给定生物量-调节多肽的编码序列的密码子进行修饰,以便优化在特定植物品种中表达。
在某些情况下,生物量-调节多肽的表达抑制内源性多肽的一种或多种功能。例如,编码显性失活多肽的核酸可以用于抑制蛋白功能。通常地,显性失活多肽相对于内源野生型多肽是突变的或截短型的,其在细胞中的出现抑制了那种细胞中野生型多肽的一种或多种功能,即,显性失活多肽是显性遗传并赋予功能的缺失。显性失活多肽赋予这种表型的机制可以不同,但常常是涉及蛋白-蛋白互作或蛋白-DNA互作。例如,显性失活多肽可以是一种相对于自然野生型酶截短型的酶,因此截短型多肽保留参与结合第一种蛋白的结构域,但是缺乏参与结合第二种蛋白的结构域。因此,截短型多肽不能正确地调节第二种蛋白的活性。参见,例如,US 2007/0056058。另一个例子,点突变导致催化结构域中非-保守氨基酸替换可以导致显性失活多肽。参见,例如,US 2005/032221。另一个例子,显性失活多肽可以是相对天然野生型转录因子的一个截短的转录因子,因此该截短型多肽保留了DNA结合结构域,但是缺失激活结构域。这样的一个截短型多肽可以抑制野生型转录因子与DNA的结合,从而抑制转录激活。
ii.生物量-调节多肽的表达抑制
此处描述的多聚核苷酸和重组载体可以用于抑制生物量-调节多肽在感兴趣植物品种中的表达。参见,例如,Matzke和Birchler,N Nature Reviews Genetics 6:24-35(2005);Akashi等,Nature Reviews Mol.Cell Biology 6:413-422(2005);Mittal,Nature Reviews Genetics 5:355-365(2004);和2005年10月,nature.com/reviews/focus/mai上的Nature Reviews RNA interference collection。许多核酸基本方法,包括反义RNA、酶介导的RNA裂解、转录后基因沉默(PTGS),例如,RNA干涉(RNAi),以及转录基因沉默(TGS)是已知的可以抑制植物中基因表达的方法。合适的多聚核苷酸包括编码生物量-调节多肽的全长核酸或该全长核酸的片段。在一些实施方式中,可以用全长核酸及其片段的互补序列。通常地,片段至少是10个核苷酸大小,例如,至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、35、40、50、80、100、200、500核苷酸或更多。一般地,较高的同源性可以用于弥补使用较短的序列。
反义技术是一种众所周知的方法。在该方法中,克隆要抑制的基因的核酸,并可操作地连接一段调控区域和转录终止序列,因此RNA反义链是转录的。接着按照此处描述,将重组构结构化到植物中,产生RNA反义链。核酸不需要是需要抑制的基因的整个序列,但是通常是至少与需要抑制的基因有义链的一部分基本互补。
影响mRNA表达的另一方法,是将核酸转录到核酶或催化RNA中。参见,美国专利No.6,423,885。核酶可以设计成几乎和任何靶RNA特异配对和在特殊位点裂解磷酸二酯骨架,从而使靶RNA功能失活。异源核酸能够编码设计来裂解特殊mRNA转录本的核酶,进而阻止多肽的表达。尽管可以使用多种核酶在位点特异性识别序列裂解mRNA,但是锤头核酶对破坏特殊mRNAs是非常有用的。锤头核酶在侧翼区域表示的位置裂解mRNAs,该区域与靶mRNA形成碱基互补配对。唯一的要求是靶RNA含有5′-UG-3′核苷酸序列。锤头核酶的构建和生产是本领域内的已知技术。参见,例如,美国专利No.5,254,678和WO 02/46449以及其中引用的参考文献。为了增加体内裂解的效率,可以将锤头核酶序列嵌入稳定的RNA中,诸如转运RNA(tRNA)。Perriman等,Proc.Natl.Acad.Sci.USA,92(13):6175-6179(1995);de Feyter和Gaudron,Methods in Molecular Biology,Vol.74,Chapter 43,“Expressing Ribozymes in Plants”,Turner,P.C.主编,Humana Press Inc.,Totowa,NJ。已经描述的RNA核酸内切酶,诸如嗜热四膜虫天然发生的,是非常有用的。参见,例如,美国专利No.4,987,071和6,423,885。
PTGS,例如RNAi,也可用于抑制基因的表达。例如,可以构建包含一条序列,其可以转录成能与自己退火的RNA,例如,具有茎环结构的双链RNA。在一些实施方式中,双链RNA的茎部分中的一条链包含的序列与生物量-调节多肽的有义编码序列或其片段是相似的或等同的,长度上从大约10个核苷酸到大约2500个核苷酸。有义编码序列相似的或相同的序列的长度可以是从10-500个核苷酸、从15-300个核苷酸、从20-100个核苷酸,或从25-100个核苷酸。双链RNA的茎部分中的另一条链包含的序列与生物量-调节多肽的有义编码序列或其片段是相似的或等同的,长度上可以短于、相同或长于有义序列的相应长度。在某些情况下,双链RNA的茎部分中的一条链包含的序列与编码生物量-调节多肽的mRNA的3′或5′非翻译区或其片段是相似的或等同的,并且双链RNA的茎部分中的另一条链包含的序列与编码生物量-调节多肽的mRNA的3′或5′非翻译区,或其片段的互补序列是相似的或等同的。在其他实施方式中,双链RNA的茎部分中的一条链包含的序列与编码生物量-调节多肽的pre-mRNA的内含子或其片段是相似的或等同的,并且双链RNA的茎部分中的另一条链包含的序列与编码生物量-调节多肽的pre-mRNA的内含子或其片段的互补序列是相似的或等同的。
双链RNA的茎部分可以是从3个核苷酸到5000个核苷酸,例如从3个核苷酸到25个核苷酸、从15个核苷酸到1000个核苷酸、从20个核苷酸到500个核苷酸,或从25个核苷酸到200个核苷酸。RNA的环部分可以包括内含子或其片段。双链RNA可以有0、1、2、3、4、5、6、7、8、9、10,或更多的茎环结构。
将一条序列通过可操作地连接一个调控区域和一个转录终止序列,该序列转录成RNA时能形成双链RNA,将这样构建好的序列按照此处描述的方法转化进入植物中。使用RNAi抑制基因表达的方法是本领域内技术人员已知的。参见,例如,美国专利5,034,323;6,326,527;6,452,067;6,573,099;6,753,139;以及6,777,588。同样参见WO 97/01952;WO 98/53083;WO99/32619;WO 98/36083;和美国专利出版物20030175965、20030175783、20040214330,以及20030180945。
含有可操作地连接到正向的核酸分子上的调控区域的结构可以用于抑制基因的表达。转录产物可以与生物量-调节多肽的正向编码序列或其片段相似或等同。转录产物也可以是非多聚腺苷酸化的,缺乏5′帽子结构,或含有未剪切的内含子。利用全长cDNA以及部分cDNA序列来抑制基因表达的方法是本领域内已知的。参见,例如,美国专利No.5,231,020。
在一些实施方式中,含有具有至少一条链是同时是相互互补的正义和反义序列的模板的核酸的结构可以用于抑制基因的表达。有义和反义序列可以是大的核酸分子的一部分或可以是具有不互补序列的分离核酸分子。有义或反义序列可以是与mRNA序列,mRNA序列的3′或5′的非翻译区域,或是编码生物量-调节多肽的pre-mRNA的内含子序列,或这些序列的片段等同或互补的序列。在一些实施方式中,有义或反义序列是与驱使编码生物量-调节多肽的的基因转录的调控区域序列等同或互补的。在各种情况中,有义链是反义链的互补序列。
有义和反义序列的长度大于约10个核苷酸(例如,12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30,或更多核苷酸)。例如,反义序列长度上可以是21或22个核苷酸。通常地,有义和反义序列长度范围从约15个核苷酸到约30个核苷酸,例如,从约18个核苷酸到约28个核苷酸,或从约21个核苷酸到约25个核苷酸。
在一些实施方式中,反义序列是与编码此处描述的生物量-调节多肽的mRNA序列,或其片段互补的序列。与反义序列互补的有义序列可以是生物量-调节多肽的mRNA内出现的序列。通常地,有义序列和反义序列是对应于靶mRNA的15-30个核苷酸序列设计,因此靶mRNA的水平降低。
在一些实施方式中,含有具有至少一条链同时是多于一条有义序列(例如,2,3,4,5,6,7,8,9,10或更多有义序列)的模板的核酸的结构可以用于抑制基因的表达。同样,含有具有至少一条链同时是多于一条反义序列(例如,2,3,4,5,6,7,8,9,10或更多反义序列)的模板的核酸的结构可以用于抑制基因的表达。例如,一个结构含有的核酸具有至少一条链是两条有义序列和两条反义序列的模板。多有义序列可以相同或不同,并且多反义序列可以相同或不同。例如,一个结构含有的核酸具有一条链是两条相同有义序列以及与两条相同有义序列互补的两条相同反义序列的模板。另外,分离的核酸可以具有一条链作为(1)长度是20个核苷酸的两条相同有义序列,(2)与长度是20个核苷酸的两条相同有义序列互补的一条反义序列,(3)长度是30个核苷酸的有义序列,以及(4)与长度是30个核苷酸的有义序列互补的3条相同反义序列的模板。此处提供的结构可以设计成具有有义和反义序列的适当组合。例如,两条相同有义序列后面可以是两条相同的反义序列或可以置于两条相同反义序列之间。
具有至少一条链是作为一条或多条有义和/或无义序列的模板的核酸可以可操作地连接上驱使含有有义和/或反义序列的RNA分子的转录的调控区域。另外,该核酸可以可操作地连接上一个转录终止序列,诸如胭脂碱和成酶(nos)基因的终止子。在某些情况下,两个调控区域可以直接转录两个转录本:一个从上游链,以及一个从下游链。参见,例如,Yan等,Plant Physiol.,141:1508-1518(2006)。两个调控区域可以是相同的或不同的。两个转录本可以来自诱导靶RNA降解的双链RNA分子。在某些情况下,核酸可以置于T-DNA或植物来源的转运DNA(P-DNA)内,使得在T-DNA的左和右边界序列,或P-DNA的左和右边界类似序列,侧面相接或置于核酸的任何一边。参见,美国2006/0265788。位于两个调控区域之间的核酸序列的长度可以从约15个到约300个核苷酸。在一些实施方式中,位于两个调控区域之间的核酸序列的长度可以从约15个到约200个核苷酸、长度可以从约15个到约100个核苷酸、长度可以从约15个到约50个核苷酸、长度可以从约18个到约50个核苷酸、长度可以从约18个到约40个核苷酸、长度可以从约18个到约30个核苷酸,或长度可以从约18个到约25个核苷酸。
在一些用于抑制植物基因表达的基于核酸的方法中,适当的核酸可以是核酸类似物。核酸类似物可以在碱基、糖基,或磷酸骨架进行修饰,以利于提高核酸的,例如稳定性、杂交或可溶性。碱基的修饰包括脱氧胸苷的脱氧,和脱氧胞苷的5-甲基-2’-脱氧胞苷和5-溴-2’-脱氧胞苷。糖基的修饰包括核糖的2’羟基修饰形成2’-O-甲基或2’-O-烯丙基糖。脱氧核糖磷酸骨架可以通过修饰获得吗啉代核酸(morpholino nucleic acids),在其中每个碱基连接有6成员的吗啉代环,或获得肽核酸,在其中脱氧核糖磷酸骨架被伪肽骨架替代以及保留4个碱基。参见,例如,Summerton和Weller,1997,Antisense Nucleic Acid Drug Dev.,7:187-195;Hyrup等,Bioorgan.Med.Chem.,4:5-23(1996)。另外,脱氧磷酸骨架可以被替换,例如硫代磷酸酯或二硫代磷酸酯骨架、亚磷酰胺,或烷基磷酸三酯骨架。
C.结构/载体
为了调节生物量水平,此处提供的重组结构可以用于转化植物或植物细胞。一个重组核酸结构可以包含编码此处描述的生物量-调节多肽的核酸,可操作地连接有适合生物量-调节多肽在植物或细胞中表达的调控区域。因此,核酸可以包含一种编码生物量-调节多肽的编码序列,该多肽的序列为SEQ ID NOs:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636或638。编码生物量调节多肽的核酸的例子包括SEQID NO:3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635或637。由重组核酸编码的生物量-调节多肽可以是天然的生物量-调节多肽,或可以是细胞异源的多肽。在某些情况下,含有抑制生物量-调节多肽表达的核酸的重组结构,可操作地连接有一个调控区域。适当的调控区域的例子描述于命名为“调控区域”部分。
本发明还提供了诸如此处提供的含有重组核酸结构的载体。合适的载体骨架包括,例如,那些本领域常用的诸如质粒、病毒、人工染色体、BACs、YACs,或PACs。合适的表达载体包括不限于,来源于,例如细菌噬菌体、杆状病毒和逆转录病毒的质粒和病毒载体。很多载体和表达系统是商业化的,可以从这些公司如Novagen(Madison,WI),Clontech(Palo Alto,CA),Stratagene(La Jolla,CA),和Invitrogen/Life Technologies(Carlsbad,CA)购得。
此处提供的载体也可以包括,例如,复制起始区、骨架附着区(SARs)和/或标记。标记基因在植物细胞中可以赋予可选择的表型。例如,标记可以赋予杀菌剂抗性,诸如具有抗生素(例如,卡那霉素、G418、博莱霉素,或潮霉素),或除草剂(例如,草甘膦、氯磺隆,或草胺膦)抗性。另外,表达载体可以包括标签序列,设计目的有利于表达多肽的操作或检测(例如,纯化或定位)。标签序列,诸如荧光素酶、β-葡萄糖醛酸酶(GUS)、绿色荧光蛋白(GFP)、谷胱甘肽S-转移酶(GST)、多聚组氨酸、c-myc、血凝素,或FlagTM标签(Kodak,New Haven,CT)序列通常地与编码多肽作为融合蛋白表达。这些标签可以插入到多肽的任何位置,包括或氨基末端或羧基末端。
D.调控区域
包括在重组结构中的调控区域的选择依赖于几个因素,包括但不限于,效率、可选择性、可诱导性、所需表达水平以及细胞-或组织-优选表达。对于本领域而言,通过适当选择以及定位与编码序列相关联的调控区域来调节编码序列的表达是一种常规的方式。也可以利用相似方式调节核酸的转录。
一些适宜的调控区域仅仅或主要在某些特定细胞类型中启动转录。用于鉴定和表征植物基因组DNA调控区域的方法是已知的,包括,例如,那些下述参考文献中描述的:Jordano等,Plant Cell,1:855-866(1989);Bustos等,Plant Cell,1:839-854(1989);Green等,EMBO J.,7:4035-4044(1988);Meier等,Plant Cell,3:309-316(1991);和Zhang等,Plant Physiology,110:1069-1079(1996)。
不同类的调控区域的例子描述如下。下面显示的一些调控区域以及另外的调控区域详细描述于美国专利申请Nos.60/505,689;60/518,075;60/544,771;60/558,869;60/583,691;60/619,181;60/637,140;60/757,544;60/776,307;10/957,569;11/058,689;11/172,703;11/208,308;11/274,890;60/583,609;60/612,891;11/097,589;11/233,726;11/408,791;11/414,142;10/950,321;11/360,017;PCT/US05/011105;PCT/US05/23639;PCT/US05/034308;PCT/US05/034343;和PCT/US06/038236;PCT/US06/040572;和PCT/US07/62762。
例如,调控区域p326、YP0144、YP0190、p13879、YP0050、p32449、21876、YP0158、YP0214、YP0380、PT0848、PT0633、YP0128、YP0275、PT0660、PT0683、PT0758、PT0613、PT0672、PT0688、PT0837、YP0092、PT0676、PT0708、YP0396、YP0007、YP0111、YP0103、YP0028、YP0121、YP0008、YP0039、YP0115、YP0119、YP0120、YP0374、YP0101、YP0102、YP0110、YP0117、YP0137、YP0285、YP0212、YP0097、YP0107、YP0088、YP0143、YP0156、PT0650、PT0695、PT0723、PT0838、PT0879、PT0740、PT0535、PT0668、PT0886、PT0585、YP0381、YP0337、PT0710、YP0356、YP0385、YP0384、YP0286、YP0377、PD1367、PT0863、PT0829、PT0665、PT0678、YP0086、YP0188、YP0263、PT0743和YP0096的序列阐述于PCT/US06/040572的序列表中;调控区域PT0625的序列阐述于PCT/US05/034343的序列表中;调控区域PT0623、YP0388、YP0087、YP0093、YP0108、YP0022和YP0080的序列阐述于美国专利申请Ser.No.11/172,703的序列表中;调控区域PR0924的序列阐述于PCT/US07/62762的序列表中;以及调控区域p530c10、pOsFIE2-2、pOsMEA、pOsYp102,和pOsYp285的序列阐述于PCT/US06/038236的序列表中。
调控区域可以基于其在一个植物品种中的活性符合一个类型的标准,以及也基于其在另一个植物品种中的活性符合另一个不同类型的标准。
i.广泛表达启动子
一个启动子当其在所有或大多数组织中,在所有组织中的不止一个但是不必是所有细胞类型中促进转录可以称之为“广泛表达”。例如,广泛表达的启动子可以促进可操作地连接序列在一个或多个枝条、茎尖(顶尖)和叶子表达,但是较弱或根本就不在诸如根或茎组织中表达。另一个例子,广泛表达启动子可以促进可操作地连接的序列在一个或多个枝条、茎尖(顶尖)和叶子表达,但是较弱或根本就不促进在诸如花和发育种子的繁殖组织中表达。广泛表达启动子的无限例子可以包括在此处提供的核酸结构中,包括p326、YP0144、YP0190、p13879、YP0050、p32449、21876、YP0158、YP0214、YP0380、PT0848、PD3141,和PT0633启动子。参见,例如,WO/2009/099899。另外的例子包括花椰菜花叶病毒(CaMV)35S启动子、甘露碱合成酶(MAS)启动子、来源于农杆菌T-DNA的1’或2’启动子、玄参花叶病毒34S启动子、肌动蛋白启动子诸如水稻肌动蛋白启动子,以及泛素化启动子诸如玉米泛素化-1启动子。在某些情况下,CaMV 35S是排除在广泛表达启动子内的。
ii.根启动子
根-激活启动子赋予在根组织中的转录,例如,根内皮、根表皮,或根维管组织。在一些实施方式中,根-激活启动子是根-优选启动子,即仅在或主要在根组织中赋予转录。根-优选启动子包括YP0128、YP0275、PT0625、PT0660、PT0683和PT0758启动子。其他的根-优选启动子包括PT0613、PT0672、PT0688和PT0837启动子,其主要驱动在根组织中的表达,而在胚珠和/或种子种较低程度表达。根-优选启动子的其他例子包括CaMV 35S启动子的根-特异亚结构域(Lam等,Proc.Natl.Acad.Sci.USA,86:7890-7894(1989)),Conkling等,Plant Physiol.,93:1203-1211(1990)报道的根细胞特异启动子,以及烟草RD2启动子。
iii.成熟胚乳启动子
在一些实施方式中,驱使成熟胚乳转录的启动子是非常有用的。成熟胚乳启动子的转录通常地在受精后开始,和主要发生在种子发育过程中的胚乳组织,并通常在细胞化阶段达到最高。尽管有时也用还在其他组织激活的启动子,但是大多数适合的启动子是主要在成熟胚乳中激活。包含于此处提供的核酸结构的成熟胚乳启动子的非限制性例子包括napin启动子、Arcelin-5启动子、phaseolin启动子(Bustos等,Plant Cell,1(9):839-853(1989))、大豆胰蛋白酶抑制剂基因启动子(Riggs等,Plant Cell,1(6):609-621(1989))、APC启动子(Baerson等,Plant Mol.Biol.,22(2):255-267(1993))、硬脂-ACP去饱和酶启动子(Slocombe等,Plant Physiol.,104(4):167-176(1994))、大豆β-conglycinin α′亚基启动子(Chen等,Proc.Natl.Acad.Sci.USA,83:8560-8564(1986))、油体蛋白启动子(Hong等,Plant Mol.Biol.,34(3):549-555(1997)),和zein启动子,诸如15kD zein启动子、16kD zein启动子、19kD zein启动子、22kD zein启动子和27kD zein启动子。同时适合的有来自水稻glutelin-1基因的Osgt-1启动子(Zheng等,Mol.Cell Biol.,13:5829-5842(1993))、β-淀粉酶启动子,以及大麦醇溶蛋白启动子。其他的成熟胚乳启动子包括YP0092、PT0676,和PT0708启动子。
iv.子房组织启动子
在子房组织诸如胚珠壁和中果皮中激活的启动子也是非常有用的,例如,聚半乳糖醛酸苷酶启动子,香蕉TRX启动子、西瓜肌动蛋白启动子、YP0396和PT0623。主要在子房中激活的启动子的例子包括YP0007、YP0111、YP0092、YP0103、YP0028、YP0121、YP0008、YP0039、YP0115、YP0119、YP0120和YP0374。
v.胚囊/早期胚乳启动子
为了实现在胚囊/早期胚乳中的表达,可以使用在极核和/或中心细胞,或极核前体中,但不在卵细胞或卵细胞前体激活的调控序列。大多数适合的启动子是驱动仅在或主要在极核或其前体和/或中心细胞中表达的启动子。尽管通常地在细胞化阶段期间和之后,转录在后期胚乳发育中显著降低,但是从极核延长到早期胚乳发育得的转录模式中也发现了胚囊/早期胚乳-优选启动子。合子或发育胚胎的表达通常地不出现胚囊/早期胚乳启动子。
适合的启动子包括那些来源于下述基因的启动子:拟南芥viviparous-1(参见,GenBank No.U93215);拟南芥atmycl(参见,Urao,Plant Mol.Biol.,32:571-57(1996);Conceicao,Plant,5:493-505(1994));拟南芥FIE(GenBank No.AF129516);拟南芥MEA;拟南芥FIS2(GenBank No.AF096096);以及FIE 1.1(美国专利6,906,244)。可能适合的其他启动子包括那些来源于下述基因的启动子:玉米MAC1(参见,Sheridan,Genetics,142:1009-1020(1996));玉米Cat3(参见,GenBank No.L05934;Abler,Plant Mol.Biol.,22:10131-1038(1993))。其他的启动子包括下述拟南芥启动子:YP0039、YP0101、YP0102、YP0110、YP0117、YP0119、YP0137、DME、YP0285和YP0212。可能有用的其他启动子包括下述水稻启动子:p530c10、pOsFIE2-2、pOsMEA、pOsYp102和pOsYp285。
vi胚启动子
优选地驱动受精后合子细胞调控区域的转录能够提供胚-优选表达。大多数适合的启动子是那些优选驱动早于心期的早期胚中的表达,但是在晚期和成熟胚中的表达也是适合。胚-优选的启动子包括大麦脂质转运蛋白(Ltp1)启动子(Plant Cell Rep 20:647-654(2001))、YP0097、YP0107、YP0088、YP0143、YP0156、PT0650、PT0695、PT0723、PT0838、PT0879,和PT0740。
vii.光合组织启动子
在光合组织中激活的启动子赋予在绿色组织诸如叶和茎中的转录。大多数合适的启动子是仅在或主要在这些组织中驱使表达。这类启动子的例子包括核酮糖-1,5-二磷酸羧化酶(RbcS)启动子诸如来自落叶松(Larix laricina)的RbcS启动子,来自松树的cab6启动子(Yamamoto等,Plant Cell Physiol.,35:773-778(1994))来自小麦的Cab-1启动子(Fejes等,Plant Mol.Biol.,15:921-932(1990)),来自菠菜的CAB-1启动子(Lubberstedt等,Plant Physiol.,104:997-1006(1994)),来自水稻的cab1R启动子(Luan等,Plant Cell,4:971-981(1992)),来自玉米的丙酮酸磷酸双激酶(PPDK)启动子(Matsuoka等,Proc.Natl.Acad.Sci.USA,90:9586-9590(1993)),烟草Lhcb1*2启动子(Cerdan等,Plant Mol.Biol.,33:245-255(1997)),拟南芥SUC2蔗糖-H+协同转运启动子(Truernit等,Planta,196:564-570(1995)),和来自菠菜的类囊体膜蛋白启动子(psaD、psaF、psaE、PC、FNR、atpC、atpD、cab、rbcS)。其他的光合组织启动子包括PT0535、PT0668、PT0886、YP0144、YP0380和PT0585。
viii.微管组织启动子
在微管束中具有高或较优活性的启动子的例子包括YP0087、YP0093、YP0108、YP0022和YP0080。其他的微管组织-优选启动子包括富含甘氨酸细胞壁蛋白GRP 1.8启动子(Keller和Baumgartner,Plant Cell,3(10):1051-1061(1991))、鸭跖草黄斑驳病毒(CoYMV)启动子(Medberry等,Plant Cell,4(2):185-192(1992)),以及水稻东格鲁杆状病毒(RTBV)启动子(Dai等,Proc.Natl.Acad.Sci.USA,101(2):687-692(2004))。
ix.诱导型启动子
诱导型启动子回应外界刺激时,诸如化学药品或环境刺激赋予转录。例如,诱导型启动子回应激素时,诸如赤霉酸或乙烯,或光照或干旱赋予转录。干旱-诱导型启动子的例子包括YP0380、PT0848、YP0381、YP0337、PT0633、YP0374、PT0710、YP0356、YP0385、YP0396、YP0388、YP0384、PT0688、YP0286、YP0377、PD1367,和PD0901。氮-诱导型启动子的例子包括PT0863、PT0829,PT0665,和PT0886。阴暗-诱导型启动子的例子包括PR0924和PT0678。盐诱导的启动子的例子是rd29A(Kasuga等,(1999)Nature Biotech,17:287-291)。
x.基本启动子
基本启动子是组装转录起始所需的转录复合物所必需的最小序列。基本启动子经常包括一个“TATA框”元件,其可以位于转录起始位点上游约15到约35个核苷酸之间。基本启动子也可以包括一个“CCAAT框”元件(通常是序列CCAAT)和/或一个GGGCG序列,其可以位于转录起始位点上游约40和约200核苷酸之间,通常是约60到约120个核苷酸之间。
xi.茎启动子
茎启动子可以是特异针对一种或多种茎组织或特异针对茎和其它植物部分。茎启动子可以在,例如表皮和皮层、微管形成层、原形成层或木质部具有高或较优的活性。茎启动子的例子包括描述于US20060015970的YP0018以及CryIA(b)和CryIA(c)(Braga等,2003,Journal of New Seeds 5:209-221)。
xii生殖组织启动子
生殖组织启动子是主要是,但是不单独是在植物有性繁殖组织中驱使表达的调控序列。这些组织包括,但不限于,花序分生组织、花分生组织、花器官和配子体细胞。在生殖组织中表达的启动子的例子包括PCT/US2009/038792中的PD3720。
xiii.其他启动子
其他类启动子包括,但是不限于,冠-优选、愈伤组织-优选、毛细胞-优选、保卫细胞-优选诸如PT0678、块根-优选、薄壁细胞-优选,以及衰老-优选启动子。上面参考专利申请中描述的命名为YP0086、YP0188、YP0263、PT0758、PT0743、PT0829、YP0119和YP0096的启动子也可以是有用的。
xiv.其他调控区域
在此处描述的核酸结构包括5′非翻译区(UTR)。5′UTR可以转录,但是不能翻译,并位于转录起始位点和翻译起始密码子之间,可以包括+1核苷酸。3′UTR可以置于翻译终止密码子和转录结束之间。UTRs具有诸如增加mRNA稳定性或减弱翻译的特殊功能。3′UTRs的例子包括,但不限于,尾信号和转录终止序列,例如,胭脂碱合成酶终止序列。
在重组多聚核酸中可以出现多于一个的调控区域,例如,内含子、增强子、上游激活区域、转录终止子和诱导元件。因此,例如,多于一个的调控区域可以可操作地连接到编码生物量-调节多肽的多核苷酸序列上。
调控区域,诸如内源基因的启动子,可以通过化学合成或通过包含该调控区域的基因组DNA的亚克隆获得。包含该调控区域的核酸也可以包括包含限制酶切位点的侧翼序列,这样有利于随后的操作。
IV.转基因植物和植物细胞
A.转化
本发明的特征还在于含有至少一种此处描述的重组核酸结构的转基因植物细胞和植物。植物或植物细胞可以通过将结构整合到其基因组上进行转化,即,能够稳定转化。稳定转化细胞通常地在每次细胞分裂中保留导入的核酸。植物或植物细胞也可以瞬时转化,因此结构没有整合到其基因组上。瞬时转化细胞通常地在每次细胞分裂时丢失全部或部分导入的核酸结构,因此在足够数量细胞分裂后不能在子细胞中检测到导入的核酸。瞬时转化和稳定转化转基因植物和植物细胞两者在此处描述的方法中是有用的。
用于此处描述的方法的转基因植物细胞可以构成整个植物的部分或全部。该植物可以用适合该物种的方式培养,或培养于生长室、温室,或地里。转基因植物可以按照特殊目的的需要进行培育,例如,在其他品系中导入重组核酸,转移重组核酸到别的品种,或用于其他可取性状的进一步选择。另外,转基因植物可以无性繁殖那些能够实用该技术的品种。此处中所使用的,转基因植物也指最初转基因植物的继承了转基因的后代。转基因植物的种子可以培养,接着自交(或异交和自交)获得核酸结构的纯合子种子。
转基因植物可以悬浮培养,或组织或器官培养。鉴于本发明的目的,可以使用固体和/或液体组织培养技术。当使用固体培养基时,转基因植物细胞可以直接置于培养基上或置于一个滤器上,接着放置与培养基接触。当使用液体培养基时,将植物细胞置于浮选设备,例如,接触液体培养基的多孔膜。固体培养基可以是,例如,含有糖和合适浓度生长素,如2,4-二氯苯氧乙酸(2,4-D),以及合适浓度的细胞分裂素,如kinetin的Murashige和Skoog(MS)培养基。
当采用瞬时转化植物细胞时,具有报告基因活性的编码报告基因多肽的报告基因序列可以包括在转化过程中,并在转化之后适当时间进行报告基因活性或表达分析。进行分析的适当时间通常是在转化后约1-21天,例如,约1-14天,约1-7天,或约1-3天。瞬时分析的使用对于不同物种的快速分析,或确定前面在特殊受体细胞中还没有确定表达的异源生物量-调节多肽的表达是尤为方便。
向单子叶和双子叶植物中导入外源核酸的技术是本领域内已知的,包括,但不限于,农杆菌-介导的转化、病毒载体-介导的转化、电穿孔和粒子枪转化,例如,美国专利5,538,880;5,204,253;6,329,571和6,013,863。如果使用细胞或培养组织作为转化受体组织,如果需要可以利用本领域内技术人员已知的技术从转化培养物中再生植物。
B.筛选/选择
可以筛选和/或选择转基因植物群中的具有通过转基因表达赋予的性状或表型的成员。例如,可以对单次转化事件的后代群进行具有生物量调节多肽或核酸理想表达水平的植物的筛选。使用物理的和生物化学的方法确定表达水平。这些方法包括用于检测多核苷酸的Southern分析或PCR扩增;检测RNA转录本的Northern杂交、S1核糖核酸酶检测、引物-延伸,或RT-PCR扩增;检测多肽和多核苷酸的酶或核酶活性的酶分析试验;和检测多肽的蛋白凝胶电泳、Western杂交、免疫共沉淀,和酶联免疫试验。其它技术诸如原位杂交、酶染色,和免疫染色也可以用于多肽和/或多核苷酸出现或表达的检测。进行所有的参考技术的方法都是已知的。作为替换,含有单独转化事件的植物群可以用于筛选具有所需性状的植物,诸如经调节的生物量水平。可以在一代或多代进行选择和/筛选,和/或不止在一个物理位置。在某些情况下,可以在转基因植物中诱导预期表型或产生预期表型所需的条件下培养和选择转基因植物。另外,可以在预计植物表型出现的特殊发育阶段进行选择和/或筛选。开展选择和/或筛选来选择与相对于缺乏转基因对照植物生物量水平具有统计学显著差异的转基因植物。与相应对照植物相比,表型改变的转基因植物的选择或筛选描述在该部分的“转基因植物表型”。
C.植物品种
此处描述的多核苷酸和载体可以用于许多单子叶和双子叶植物和植物细胞系统的转化,包括的植物品种来自下述科中的一种:爵床科、葱科、六出花科、石蒜科、夹竹桃科、棕榈科、菊科、小檗科、红木科、十字花科、凤梨科、大麻科、石竹科、三尖杉科、藜科、秋水仙科、葫芦科、薯蓣科、麻黄科、古柯科、大戟科、豆科、唇形科、亚麻科、石松科、锦葵科、黑药花科、芭蕉科、桃金娘科、蓝果树科、罂粟科、松科、车前科、禾木科、蔷薇科、茜草科、杨柳科、无患子科、茄科、紫杉科、茶科,或葡萄科。
适合的物种包括下述属秋葵属、冷杉属、槭属、翦股颖属、葱属、六出花属、凤梨属、穿心莲属、须芒草属、艾属、芦竹属、颠茄属、小檗属、甜菜属、红木属、芸薹属、金盏花属、山茶属、喜树属、大麻属、辣椒属、红花属、长春花属、尖杉属、菊属、金鸡纳属、西瓜属、咖啡属、秋水仙属、鞘蕊花属、甜瓜属、南瓜属、狗牙根属、曼陀罗属、石竹属、毛地黄属、薯蓣属、油棕属、麻黄属、蔗茅属、古柯属、桉属、羊茅属、草莓属、雪花属、大豆属、棉属、向日葵属、橡胶树属、大麦属、天仙子属、麻风树属、莴苣属、亚麻属、黑麦草属、羽扇豆属、番茄属、石松属、木薯属、苜蓿属、薄荷属、芒属、芭蕉属、烟草属、稻属、黍属、罂粟属、银胶菊属、狼尾草属、矮牵牛属、虉草属、牧梯草属、松属、早熟禾属、大戟属、杨属、萝芙木属、蓖麻属、蔷薇属、甘蔗属、柳属、血根草、莨菪属、黑麦属、茄属、高粱属、大米草属、菠菜属、菊蒿属、红豆杉属、可可属、小黑麦属、小麦属、北美穗草属、藜芦属、蔓长春花属、葡萄属和玉蜀黍属。
适合的物种包括黍、高粱、芒草、甘蔗、斑茅、杨木、大蓝茎草(大蓝茎草)、象草(象草)、虉草(虉草)、狗牙根(狗牙根)、高羊茅(高羊茅)、草原网茅(草原网茅)、紫苜蓿(紫花苜蓿)、芦竹(芦竹)、黑麦(黑麦)、柳树(柳树)、桉树(桉树)、小黑麦(小黑麦)和竹。
适合的物种还包括向日葵(太阳花)、红花(红花)、麻风树(麻风树)、蓖麻(蓖麻)、棕榈(棕榈)、亚麻(亚麻)和芥菜。
适合的物种还包括甜菜(甜菜)和木薯(木薯)。
适合的物种还包括番茄(番茄)、莴苣(莴苣)、香蕉(香蕉)、马铃薯(马铃薯)、甘蓝(青花菜、花椰菜、抱子甘蓝)、茶树(茶树)、草莓(草莓)、可可树(可可树)、阿拉比卡(咖啡)、葡萄树(葡萄树)、凤梨(凤梨)、五彩椒(辣和甜椒)、洋葱(洋葱)、甜瓜(甜瓜)、黄瓜(黄瓜)、印度南瓜(南瓜)、中国南瓜(南瓜)、菠菜(菠菜)、西瓜(西瓜)、秋葵(秋葵)和茄子(茄子)。
适合的物种还包括罂粟(罂粟)、东方罂粟、欧洲红豆杉、短叶红豆杉、青蒿、大麻、喜树、长春花、玫瑰红长春花、正鸡纳树、秋水仙、加州藜芦(Veratrum californica)、狭叶洋地黄、毛地黄、山药、穿心莲、颠茄、曼陀罗(Datura stomonium)、小檗属(Berberis spp.)、三尖杉、草麻黄、麻黄、古柯、雪花莲(Galanthus wornorii)、莨菪、蛇足石杉(千层塔)、石松、蛇根木、萝芙木、血根草、天仙子、金盏菊、小白菊(Chrysanthemum parthenium)、毛喉鞘蕊苏(Coleus forskohlii)和小白菊(Tanacetum parthenium)。
适合的物种还包括银胶菊(银胶菊)、三叶胶(橡胶)、留兰香(薄荷)、辣薄荷(薄荷)、胭脂树和六出花。
适合的物种还包括玫瑰(玫瑰)、康乃馨(康乃馨)、矮牵牛(矮牵牛)和一品红(一品红)。
适合的物种还包括烟草(烟草)、羽扇豆(羽扇豆)、燕麦(燕麦)、翦股颖(翦股颖)、美洲山杨(山杨)、松树(松树)、冷杉(冷杉)、硬槭木(枫树)、大麦(大麦)、草地早熟禾(早熟禾)、黑麦草(黑麦草)和猫尾草(梯牧草)。
由此,该方法和组成可以用于一个很宽的植物品种范围,包括来自以下物种:双子叶芸薹属、红花属、大豆属、棉属、向日葵属、麻风树属、银胶菊属、杨属和蓖麻属;以及单子叶油棕属、羊茅属、大麦属、黑麦草属、稻属、黍属、狗尾草属、梯牧草属、早熟禾属、甘蔗属、黑麦属、高粱属、小黑麦属、小麦属和玉蜀黍属。在一些实施方式中,植物是以下物种之一:柳枝稷(柳枝稷)、蜀黍(高粱、苏丹草)、巨芒(芒草)、甘蔗(能源甘蔗)、香脂杨(白杨)、玉米(玉米)、橹豆(大豆)、甘蓝型油菜(加拿大油菜)、小麦(小麦)、陆地棉(棉花)、水稻(水稻)、向日葵(太阳花)、苜蓿(苜蓿)、甜菜(糖甜菜)或珍珠粟(珍珠粟)
在某些实施方式中,此处所描述的多核苷酸和载体可以用于转化若干单子叶和双子叶植物以及植物细胞系统,其中所述植物为不同物种的杂种或特定物种的变种(例如甘蔗X芒草,高粱X芒草)。
D.转基因植物表型
在一些实施方式中,调节表达生物量-调节多肽表达的植物能够增加植物生物量的水平。例如,此处描述的生物量-调节多肽可以在转基因植物中表达,导致营养组织水平的增加。与不表达转基因的相应对照植物的生物量水平相比,生物量水平至少可以增加2个百分点,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60,或多于60个百分点。在一些实施方式中,生物量-调节多肽的表达被调节的植物可能具有降低水平的种子生产。与不表达转基因的相应对照植物的种子生产水平相比,种子生产水平至少可以被降低2个百分点,例如,2、3、4、5、10、15、20、25、30、35,或多于35个百分点。
这些植物中种子产量的增加可以在植物类食物摄入量常常不足的地区提供改善营养供应或用于生物燃料。在一些实施方式中,这些植物生物量的降低当营养组织不是收获用于人或动物消费(即,收获的种子)的主要植物部分的情形时是有用的。
在一些实施方式中,生物量-调节多肽表达被调节的植物可以增加或降低一种或多种植物组织,例如,营养组织、繁殖组织,或根组织的生物量水平。例如,与不表达转基因的相应对照植物的生物量水平相比,生物量水平至少可以增加2个百分点,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60,或多于60个百分点。在一些实施方式中,生物量-调节多肽表达被调节的植物可以降低一种或多种植物组织的生物量水平。与不表达转基因的相应对照植物的种子生产水平相比,种子生产水平至少可以降低2个百分点,例如,2、3、4、5、10、15、20、25、30、35,或多于35个百分点。
增加这些植物的生物量能够提高食物数量,或提高能量生产。生物量的降低可以供给那些收集来作为人或动物消耗的植物部分更充足的营养部分。
通常地,转基因植物或细胞中生物量的数量相对于对照植物或细胞的差异被认为是利用适当参数或非参数统计,例如卡方检验,Student′s t-检验,Mann-Whitney检验,或F-检验,具有在p≤0.05的统计学显著性。在一些实施方式中,生物量的数量的差异具有在p<0.01、p<0.005,或p<0.001的统计学显著性。统计学上显著差异,例如,转基因植物生物量的数量与对照植物的数量相比具有统计学上显著差异表明转基因植物中出现的重组核酸导致生物量水平的改变。
转基因植物的表型相对于对照植物来评价。当植物具有少于10%,例如,少于9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%,或0.001%的感兴趣的植物应具有的多肽或编码多肽的mRNA量时,称之为“不表达”。评价表达使用的方法包括,例如,RT-PCR、Northern杂交、S1核酶保护、引物延伸、Western杂交、蛋白凝胶电泳、免疫共沉淀、酶联免疫试验、染色质免疫共沉淀试验,和质谱。应当注意,如果多肽在组织优选或广泛表达启动子控制下表达,可以在整个植物或选择的组织中评价表达。同样地,如果多肽在特定时间表达,例如,在发育或诱导的特定时间,可以选择在预期时间评价表达。
生物量包括可收获的植物组织诸如叶、茎,以及繁殖结构,或所有的植物组织诸如叶、茎、根,以及繁殖结构。在一些实施方式中,生物量仅包含植物地上部分。在一些实施方式中,生物量仅包含植物茎部分。在一些实施方式中,生物量仅包含除花序和种子部分外的植物地上部分。生物量可以通过实施例部分描述的方法测定。生物量可以以干物质量量化,如果从新鲜湿重中减去水,其是产生的生物量的总量(常常记录为T/英亩)。利用新鲜物质量(FMW)以及测定水分重量百分比(M)按照下述方程式来计算干物质量(DMY)。DMY=((100-M)/100)*FMW。生物量可以以新鲜物物质产量量化,其以接收到为基础产生的生物量总和(常常记录为T/英亩),其包括水分的重量。
v.植物育种
遗传多态性是在群体中呈离散等位基因序列差异。通常地,一个等位基因出现1%或更大差异就被认为是遗传多态。此处披露的能够调节生物量含量的多肽的发现对于植物育种是很有用的,因为与该多肽的基因位点具有一定程度连锁的遗传多态性更可能与生物量性状变异相关。例如,这些多肽的基因位点连锁的遗传多态更有可能用于标记辅助育种项目中培育具有生物量性状理想调节的新品系。
因此,本发明一个方面包括判断一个或多个遗传多态是否与生物量性状变异相关的鉴定方法。这些方法涉及确定给定群体中遗传多态性是否与图1-7所示的多肽和/或其功能同系物,诸如,但是不限于那些本申请序列表中鉴定的多肽中的一种的等位基因相连锁。测定植物群体中生物量性状变异和植物群体中出现遗传多态的相关性,从而鉴定遗传多态是否与性状变异相关。如果出现特殊的等位基因与生物量性状的期望调节在统计学上显著相关,该等位基因与该性状变异相关,则可以作为性状有用的标记。如果,另一方面,出现特殊等位基因与期望调节不显著相关,等位基因与性状变异不相关,则不能作为性状有用的标记。
这些方法可应用于含有天然发生内源多肽的群体,而不是编码该多肽的外源核酸,即不是转化外源核酸的转基因群体。应理解,然而,适合这些方法使用的群体可以含有别的不同性状的转基因,例如除草剂抗性。
在这些方法中有用的遗传多态包括简单序列重复(SSRs,或微卫星)、多态DNA的快速扩增(RAPDs)、单核苷酸多态(SNPs)、扩增片段长度多态(AFLPs)和限制片段长度多态(RFLPs)。SSR多态可以被鉴定,例如,通过制备序列特异的探针并通过感兴趣群体中的个体模板DNA的PCR扩增来。如果探针位于群体SSR的侧翼,将产生不同大小的PCR产物。参见,例如,美国专利5,766,847。另外,SSR多态可以通过利用PCR产物作为探针对群体中的不同个体的Southern杂交来鉴定。参见,U.H.Refseth等,(1997)Electrophoresis 18:1519。RFLPs的鉴定讨论于,例如,Alonso-Blanco等(Methods in Molecular Biology,vol.82,“Arabidopsis Protocols”,pp.137-146,J.M.Martinez-Zapater和J.Salinas,eds.,c.1998 by Humana Press,Totowa,NJ);Burr(“Mapping Genes with Recombinant Inbreds”,pp.249-254,inFreeling,M.和V.Walbot(Ed.),The Maize Handbook,c.1994 by Springer-Verlag New York,Inc.:New York,NY,USA;Berlin Germany;Burr等,Genetics(1998)118:519;以及Gardiner,J.等,(1993)Genetics 134:917。AFLPs的鉴定讨论于,例如,EP 0 534 858和美国专利5,878,215。
在一些实施方式中,这些方法被直接用于植物品系的育种。这些方法在分子标记辅助育种程序中使用上面描述鉴定的遗传多态,有利于培育具有生物量性状期望改变的品系。一旦适当的遗传多态被鉴定为与性状变异相关联,那么一个或多个拥有与期望变异相关联的多态位点的植株被鉴定出来。接着这些植株被用于育种程序,去将该多肽等位基因和与与期望变异相关的其它位点的其他多元等位基因相结合。适合用于植物育种程序的技术是本领域内已知的,包括,不限于,回交、混合选择、系谱选育、集团选择、与其他群体杂交以及轮回选择。在一个育种程序中,这些技术可以单独使用或一种或多种技术组合使用。因此,每个鉴定的植物自交或与不同植株杂交产生种子,接着发芽形成子代植株。接着至少一个后代植株自交或与不同的植株杂交形成随后的后一代。育种程序可以在额外的0-5代重复自交或杂交步骤,目的是为了使最后获得的保留多态位点的植物品系达到期望的一致性和稳定性。尽管如果需要可以在交叉代之间进行分析,但是在大多数育种项目中,特殊多态位点的分析将在每代中进行。
在某些情况下,也可以进行其他有用性状的选择,例如,真菌抗性或细菌抗性的选择。这些其他性状的选择可以在拥有所需多态位点的单独植株鉴定之前,之间或之后进行。
vi.加工产品
此处提供的转基因植物在农业和能源生产产业中具有多种用途。例如,此处描述的转基因植物可以用于制备动物饲料和食品产品。然而,这些植物作为能源生产的原料极其有用。
此处描述的转基因植物,相对于缺乏外源核酸的对照植物,常常每公顷生产更高产量的粮食和/或生物量。在一些实施方式中,当这些转基因植物在减少投入诸如化肥和/或水的条件下生长,相对于对照植物每公顷仍然提供等量或甚至更高产量的粮食和/或生物量。因此,这些转基因植物可以用于在减少投入和/或诸如干旱环的境应激条件下维持产量的稳定性。在一些实施方式中,此处描述的植物含有一个组分,其允许更高效加工成游离糖,以及随后的乙醇,用于能量生产。在一些实施方式中,相对于对照植物,这些植物每千克的植物材料提供更高产量的乙醇、丁醇、二甲醚,其它生物燃料分子,和/或糖衍生副产品。该加工效率被认为是来源于植物组分,包括,但不限于,葡聚糖、纤维素、半纤维素,和木质素含量。通过在同等或甚至降低产品投入下提供更高生物量产量,此处描述的转基因植物提高农民和加工者的盈利以及降低消费者成本。
此处描述的转基因种子可以使其适应并用本领域已知包装材料包装形成加工产品。包装材料诸如纸和布是领域内众所周知的。包装好的种子可以有一个标签,例如,一个标签或标记标贴于包装材料上,打印在包装材料上的标签,或插入包装里面的标签,用来描述里面种子的特性。
本发明还将进一步描述下述实施例,其不限制本发明权利要求保护的范围。
实施例
实施例1:转基因水稻植物
下面的符号用于有关水稻转化中:T0:转化组织培养获得的植物;T1:自花授粉T0植物的第一代后代;T2:自花授粉T1植物的第二代后代;T3:自花授粉T2植物的第二代后代。
下面是从拟南芥中分离出来的核酸的清单:Ceres Clone:33232、Ceres Clone:29678、Ceres Annot:876994、Ceres Clone:158734,和Ceres Annot:863641。下述核酸是从玉米中分离出来的:Ceres Clone:1554933和Ceres Clone:258841。
将上述每个分离的核酸克隆到含有草丁膦乙酰转移酶基因的Ti质粒载体中,其赋予转化植物FinaleTM抗性。利用Ceres Clone:33232,Ceres Clone:29678,Ceres Annot:876994,Ceres Clone:158734,Ceres Annot:863641,Ceres Clone:1554933和Ceres Clone:258841来制备结构,含有每一个可操作地连接到326F启动子结构按照农杆菌-介导的转化方案导入到Kitaake品种水稻愈伤组织细胞。每个转化以及对照质粒(空载体),可以获得大约20-30独立的T0转基因植物。初步表型分析表明,T0转化株的营养器官不显示明显的表型异常,除几个少数表现受精减少外,这很可能是由于组织培养的影响。
T0植物生长于温室,允许自花授粉,并收集T1种子。T1植物生长于田间。每个结构的存在通过PCR进行确定。
实施例2:转基因水稻植物生物量的筛选
收集生长在中国廊坊的T1植物对CW00233、CW00327、CW00305,和CW00539进行干物质测定。收集连同叶和叶鞘,但不包括穗的茎在温室里干燥至少一个月,接着对每个植株(每个植株的所有分蘖一起称重)称重。收集生长在中国北京的T1植物对CW00012进行干物质测定。收集连同叶和叶鞘,但不包括穗的茎在温室里干燥至少一个月,接着对每个植株(每个植株的所有分蘖一起称重)称重。收集生长在中国北京的T1植物对CW00012进行分蘖数目测定。生长4个月后计算分蘖数目。收集生长在中国海南的T1植物对CW00226和CW00212进行分蘖数目测定。生长3个月后计算分蘖数目。收集生长在中国海南的T1植物对CW00212进行植株高度测定。生长4个月后测定植株高度。
实施例3:CW00212事件(SEQ ID NO:106)结果
来自含有Ceres Clone:33232的CW00212两事件的T1种子按照实施例2描述方法进行分蘖数目分析。表1显示了转基因T1植物对比生长于相同地方的不含转基因的植物的分蘖数百分比。T-检验表明测定的减少相对于不含转基因植物具有统计学意义。
来自含有Ceres Clone:33232的CW00212两事件的T1种子按照实施例2描述方法进行植株高度分析。表2显示了转基因T1植物对比生长于相同地方的不含转基因的植物的高度改变百分比。T-检验表明测定的减少相对于不含转基因植物具有统计学意义。
表1
表2
实施例4:CW00012(Ceres Clone 29678)事件结果(SEQ ID NO:2)
来自含有Ceres Clone:29678的CW00212两事件的T1种子按照实施例2描述的干物质测定方法进行生物量分析。表3显示了转基因T1植物对比生长于相同地方的不含转基因的植物的干物质重量增加百分比。T-检验表明测定的增加的可靠性相对于不含转基因植物具有统计学意义。
来自含有Ceres Clone:29678的CW00212两事件的T1种子按照实施例2描述的方法进行分蘖数分析。表3显示了转基因T1植物对比生长于相同地方的不含转基因的植物的分蘖数增加百分比。T-检验表明测定的增加相对于不含转基因植物具有统计学意义。
表3
实施例5:CW00327事件(SEQ ID NO:521)结果
来自含有Ceres Clone:258841的CW00327两事件的T1种子按照实施例2描述的干物质重量测定方法进行生物量分析。表4显示了转基因T1植物对比生长于相同地方的野生型植物(100%)的干物质重量百分比。T-检验表明测定的增加相对于野生型对照植物具有统计学意义。
表4
实施例6:CW00233事件(SEQ ID NO:315)结果
来自含有Ceres Annot:876994的CW00233两事件的T1种子按照实施例2描述的干物质重量测定方法进行生物量分析。表5显示了转基因T1植物超过生长于相同地方的野生型植物的干物质重量百分比。T-检验表明测定的增加相对于野生型对照植物具有统计学意义。
表5
实施例7:CW00226事件(SEQ ID NO:165)结果
来自含有Ceres Clone:158734的CW00226两事件的T1种子按照实施例2描述的分蘖数测定方法进行生物量分析。表6显示了转基因T1植物对比生长于相同地方的不含转基因的植物的分蘖数增加百分比。T-检验表明测定的增加相对于不含转基因植物具有统计学意义。
表6
实施例8:CW00305事件(SEQ ID NO:474)结果
来自含有Ceres Clone:1554933的CW00305两事件的T1种子按照实施例2描述的干物质重量测定方法进行生物量分析。表7显示了转基因T1植物对比生长于相同地方的不含转基因的植物的干物质重量增加百分比。T-检验表明测定的增加相对于不含转基因植物具有统计学意义。
表7
实施例9:CW00539事件(SEQ ID NO:591)结果
来自含有Ceres Annot:863641的CW00539两事件的T1种子按照实施例2描述的干物质重量测定方法进行生物量分析。表8显示了转基因T1植物对比生长于相同地方的不含转基因的植物的干物质重量增加百分比。T-检验表明测定的增加相对于不含转基因植物具有统计学意义。
表8
实施例10:通过相互BLAST确定功能同系物
如果候选序列和参考序列编码蛋白具有相似功能和/或活性,该候选序列被认为是参考序列的功能同系物。被称为双向BLAST(Rivera等,Proc.Natl.Acad.Sci.USA,95:6239-6244(1998))的程序被用于从所有可用的公共和私有多肽序列组成的数据库,包括NCBI的NR和Ceres克隆多肽翻译物中鉴定潜在的功能同系物序列。
在运行双向BLAST程序之前,对特异的参考多肽在其种源中对所有多肽进行BLAST搜寻,目的是鉴定具有与参考多肽80%或更高BLAST序列一致性的多肽和在比对中沿着较短序列具有85%或更高的对齐长度。参考多肽和任何一条上述鉴定的多肽作为一个聚类。
利用美国密苏里州圣路易斯的华盛顿大学的BLASTP2.0版本程序来确定BLAST序列一致性和E-值。BLASTP2.0版本程序包括下述参数:1)使用1.0e-5作为E-值的截止(cutoff);2)字体大小5;以及3)-postsw选项。BLAST序列一致性是基于第一次BLAST HSP(高比值片段对)鉴定的潜在功能同系物序列与特异的参考多肽比对计算的。BLAST HSP比对中相同匹配残基的数目通过HSP长度分开,接着乘以100得到BLAST序列一致性。HSP通常地包括比对间隔,但是在某些情况下,间隔不包含在内。
主要的双向BLAST程序由2轮BLAST搜索组成;正向搜索和反向搜索。正向搜索步骤中,利用参考多肽序列、“多肽A”,来源于SA物种,对感兴趣物种的所有蛋白序列进行BLAST。利用10-5的E-值截止(cutoff)和35%序列一致性截止(cutoff)来确定高比值。在这些高比值之间,具有最低E-值得序列被称为最佳匹配,并被认为是潜在的功能同系物或类似物。与最佳匹配或最初的参考多肽有80%序列一致性或更高匹配的任何其他高匹配的序列也被认为是潜在的功能同系物或类似物。该程序在所有感兴趣物种中重复进行。
在反向搜索循环中,利用正向搜索在所有物种中鉴定的最高匹配在来源物种SA的所有蛋白序列中进行BLAST。正向搜索的最高匹配从上述聚类中返回一个多肽作为其最佳匹配也被认为是潜在的功能同系物。
通过人工检测潜在的功能同系物序列来鉴定功能同系物。代表SEQ IDNO:2、106、165、315、474、521或591的功能同系物分别显示于图1-7。其他示例性同系物与序列表中的某些图相关。
实施例11:借助隐马尔可夫模型确定功能同系物
隐马尔可夫模型(HMMs)是通过HMMER 2.3.2程序产生的。利用配置全局比对的默认HMMER 2.3.2程序参数来获得每个HMM。
利用图1显示的序列作为输入数据获得HMM。符合模型的序列,并且每条序列代表的HMM比特值显示在序列表中。符合该模型的另外的序列,并且任何一条另外的序列代表的HMM比特值显示在序列表中。结果显示这些另外的序列是SEQ ID NO:2的功能同系物。
重复上述过程,利用每个图显示的序列作为HMM的输入,这样图2、3、4、5、6和7显示的每组序列都产生一个HMM。每条序列的代表性比特值显示在序列表中。符合一定HMMs的其它序列,以及这些其它序列的代表性HMM比特值显示在序列表中。结果显示这些其它的序列是用于获得HMM的序列的功能同系物。
其他实施方式
应理解,虽然本发明已经通过其详细的说明书进行了描述,但前面描述旨在说明而不是限制所附权利要求确定的发明范围。其他方面、优势和修改属于下述权利要求范围内。
Claims (27)
1.一种制备植物的方法,所述方法包括培养含有外源核酸的植物细胞,所述外源核酸包括可操作地连接到一编码多肽的核酸序列的调控区域,其中所述多肽的氨基酸序列的HMM比特值高于210,所述HMM基于图1-7中之一所示的氨基酸序列,以及其中所述植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
2.一种制备植物的方法,所述方法包括培养含有外源核酸的植物细胞,所述外源核酸包括调控区域,该调控区域可操作地连接到编码多肽的核苷酸序列上,所述多肽与选自SEQ ID NO:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636和638的氨基酸序列具有80%或更高序列一致性,其中由所述植物细胞产生的植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
3.根据权利要求1或2所述的方法,其中所述多肽包括与SEQ ID NO:2的93-356残基的聚戊烯合成酶结构域相比具有60%或更高序列一致性的聚戊烯合成酶结构域。
4.根据权利要求1或2所述的方法,其中所述多肽包括与SEQ ID NO:165的11-83残基的多蛋白桥因子1相比具有60%或更高序列一致性的多蛋白桥因子1,以及所述多肽包括SEQ ID NO:165的91-145残基的螺旋-转角-螺旋结构域相比具有60%或更高序列一致性的螺旋-转角-螺旋结构域。
5.根据权利要求1或2所述的方法,其中所述多肽包括与SEQ ID NO:315的84-551残基的中性转化酶相比具有60%或更高序列一致性的中性转化酶结构域。
6.根据权利要求1或2所述的方法,其中所述多肽包括与SEQ ID NO:474的9至126残基的sedlin蛋白N末端保守区相比具有60%或更高一致性的sedlin蛋白N末端保守区。
7.根据权利要求1或2所述的方法,其中所述多肽包括与SEQ ID NO:521的1-188残基的G-盒结合蛋白MFMR结构域相比具有60%或更高序列一致性的G-盒结合蛋白MFMR结构域,以及其中所述多肽包括与SEQ ID NO:521的279-342残基的bZIP1转录因子结构域相比具有60%或更高序列一致性的bZIP1转录因子结构域,以及其中所述多肽包括与SEQ ID NO:521的279-333残基的bZIP2碱性区亮氨酸拉链结构域相比具有60%或更高序列一致性的bZIP2碱性区亮氨酸拉链结构域。
8.根据权利要求1或2所述的方法,其中所述多肽包括与SEQ ID NO:591的20至290残基的表异构酶结构域相比具有60%或更高一致性的表异构酶结构域。
9.一种制备植物的方法,所述方法包括培养含有外源核酸的植物细胞,所述外源核酸包括调控区域,该调控区域可操作地连接到核苷酸序列上,所述核苷酸序列与选自SEQ ID NO:1、3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635和637,或它们的片段,具有80%或更高序列一致性,其中由所述植物细胞产生的植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
10.一种制备植物的方法,所述方法包括培养含有外源核酸的植物细胞,所述外源核酸有效下调植物细胞内源性核酸,其中所述内源性核酸编码多肽,并且所述多肽的氨基酸序列的HMM比特值高于210,所述HMM基于图1-7中之一所示的氨基酸序列。
11.一种调节植物生物量水平的方法,所述方法包括向植物细胞中导入外源性核酸,所述外源核酸包括可操作地连接到一编码多肽的核酸序列的调控区域,其中所述多肽的氨基酸序列的HMM比特值高于210,所述HMM基于图1-7中之一所示的氨基酸序列,以及其中由所述植物细胞产生的植物与不含有所述外源性核酸的对照植物相应水平相比具有不同生物量水平的差异。
12.一种调节植物生物量水平的方法,所述方法包括向植物细胞中导入外源性核酸,所述外源核酸包括调控序列,该调控序列可操作地连接到编码多肽的核苷酸序列上,所述多肽与选自SEQ ID NO:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636和638的氨基酸序列具有80%或更高序列一致性,其中由所述植物细胞产生的植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
13.权利要求1、2、9、10、11或12任一项所述的方法,其中所述多肽选自SEQ ID NO:2、106、165、315、474、521和591。
14.一种调节植物生物量水平的方法,所述方法包括向植物细胞中导入外源性核酸,所述外源核酸包括调控区域,该调控区域可操作地连接到核苷酸序列上,所述核苷酸序列与SEQ ID NO:1、3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635和637,或它们的片段,具有80%或更高序列一致性,其中由所述植物细胞产生的植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
15.一种包含外源核酸的植物细胞,所述外源核酸包括可操作地连接到一编码多肽的核苷酸序列的调控区域,其中所述多肽的氨基酸序列的HMM比特值高于210,所述HMM基于图1-7中之一所示的氨基酸序列,以及其中所述植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
16.一种包含外源核酸的植物细胞,所述外源核酸包括调控区域,该调控区域可操作地连接到编码多肽的核苷酸序列上,所述多肽与选自SEQ IDNO:2、4、6、8、9、11、13、14、15、16、17、19、21、22、23、25、26、28、30、32、34、36、38、39、40、41、42、43、44、45、46、48、49、50、51、52、53、54、55、56、58、60、61、62、63、64、66、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、106、107、109、111、112、114、115、117、119、120、122、124、126、127、129、131、133、135、137、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、165、166、167、169、171、173、175、176、177、179、181、183、184、185、186、188、190、192、193、195、197、198、200、202、204、206、208、210、212、214、215、217、218、219、220、222、224、226、228、230、232、234、236、238、240、241、242、243、245、247、249、251、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、315、317、319、321、323、325、327、329、330、331、332、334、335、336、338、340、341、343、345、346、347、349、349、350、351、352、353、354、355、356、357、359、360、361、362、363、364、366、367、369、371、373、374、374、375、376、376、377、378、380、382、384、385、386、387、388、389、390、391、391、393、395、397、398、399、400、400、401、401、403、403、405、405、407、407、408、410、411、413、414、415、416、417、418、419、420、420、421、422、423、424、426、426、428、428、429、430、430、431、432、432、433、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、474、475、477、479、481、483、485、487、488、489、490、492、494、496、498、500、502、503、504、506、508、510、511、513、515、517、518、519、521、523、525、527、529、531、533、534、536、538、540、541、543、544、546、547、548、549、550、551、552、553、554、555、557、559、560、562、564、566、568、569、570、571、572、573、574、575、576、577、578、580、582、584、586、587、588、589、591、593、595、596、598、600、602、603、605、606、608、608、609、610、611、612、613、615、617、619、621、623、624、626、627、628、630、631、633、634、636和638的氨基酸序列具有80%或更高序列一致性,其中由所述植物细胞产生的植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
17.一种包含外源核酸的植物细胞,所述外源核酸包括调控区域,该调控区域可操作地连接到的核苷酸序列上,所述核苷酸序列与选自SEQ ID NO:1、3、5、7、10、12、18、20、24、27、29、31、33、35、37、47、57、59、65、67、105、108、110、113、116、118、121、123、125、128、130、132、134、136、138、164、168、170、172、174、178、180、182、187、189、191、194、196、199、201、203、205、207、209、211、213、216、221、223、225、227、229、231、233、235、237、239、244、246、248、250、252、314、316、318、320、322、324、326、328、333、337、339、342、344、348、358、365、368、370、372、379、381、383、392、394、396、402、404、406、409、412、425、427、473、476、478、480、482、484、486、491、493、495、497、499、501、505、507、509、512、514、516、520、522、524、526、528、530、532、535、537、539、542、556、558、561、563、565、567、579、581、583、585、590、592、594、597、599、601、604、607、614、616、618、620、622、625、629、632、635和637的序列,或它们的片段,具有80%或更高序列一致性,其中由所述植物细胞产生的植物与不含有所述核酸的对照植物相应水平相比具有不同生物量水平的差异。
18.一种含有权利要求15、16或17任一项所述植物细胞的转基因植物。
19.权利要求13的转基因植物,其中所述植物选自柳枝稷(柳枝稷)、高粱(高粱,苏丹草)、巨芒(芒草)、甘蔗(能源蔗)、香脂杨(白杨)、玉米(玉米)、橹豆(大豆)、甘蓝型油菜(加拿大油菜)、小麦(小麦)、陆地棉(棉花)、水稻(水稻)、向日葵(太阳花)、苜蓿(苜蓿)、甜菜(糖甜菜)或珍珠粟(珍珠粟)中的一种。
20.含有权利要求15或16所述植物细胞的转基因植物,其中所述多肽选自SEQ ID NO:2、106、165、315、474、521和591。
21.含有来自权利要求20转基因植物胚性组织的种子产品。
22.一种分离核酸,其包括与以下核苷酸序列具有85%或更高序列一致性的核苷酸序列:SEQ ID NO:10、18、27、35、37、57、67、116、128、130、132、138、164、180、207、216、231、239、328、333、339、344、348、358、365、368、370、372、379、381、383、392、394、396、404、406、425、427、473、478、482、486、491、495、497、499、505、509、512、520、526、528、535、539、556、558、561、563、565、567、583、592、597、604、614、622、625、632或637。
23.一种分离核酸,其包括编码与以下氨基酸序列具有80%或更高序列一致性的多肽的核苷酸序列:SEQ ID NO:11、13、19、28、34、36、38、58、109、114、117、129、133、139、165、165、181、334、340、345、349、359、366、369、371、373、380、382、384、393、395、397、405、407、426、428、474、492、500、506、510、513、517、536、540、557、559、562、564、566、568、584、593、598、600、608、615、623、633、636或638。
24.一种鉴定某种特征是否存在与变异相关联的多态性的方法,该方法包括:
a)确定植物群体中是否存在一种或多种与选自图1-7所示的多肽和具有其同等功能的基因座相关联的遗传多态性;以及
b)测定在所述群体的植物中的所述特征变异之间的相关性和所述群体的植物中的一种或多种遗传多态性的存在,从而鉴定是否存在一种或多种遗传多态性与所述特征变异相关联。
25.一种制备植物系的方法,所述方法包括:
a)确定植物群体中是否存在一种或多种与选自图1-7所示的多肽和具有其同等功能的基因座相关联的遗传多态性;
b)鉴定所述群体中的一个或多个植物,其至少存在一种所述生物量特征变异相关联的遗传多态性;
c)将一种或多种所述经鉴定的植物自交或与其他植物杂交制种;
d)将至少一种所述种子产生的后代与其自交或与其他植物杂交;以及
e)重复步骤c)和d)以额外0-5个世代来制备所述植物系,其中所述植物系中至少存在一种所述遗传多态性。
26.根据权利要求24或25所述的方法,其中所述生物量特征为干物质产量。
27.根据权利要求24或25所述的方法,其中所述群体为柳枝稷植物群体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US9778908P | 2008-09-17 | 2008-09-17 | |
US61/097,789 | 2008-09-17 | ||
PCT/US2009/057116 WO2010033564A1 (en) | 2008-09-17 | 2009-09-16 | Transgenic plants having increased biomass |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102216460A true CN102216460A (zh) | 2011-10-12 |
Family
ID=42039838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801456875A Pending CN102216460A (zh) | 2008-09-17 | 2009-09-16 | 生物量增加的转基因植物 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20130014292A1 (zh) |
CN (1) | CN102216460A (zh) |
BR (1) | BRPI0918621A2 (zh) |
WO (1) | WO2010033564A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106755070A (zh) * | 2016-12-12 | 2017-05-31 | 华南农业大学 | 一种创制耐热芥蓝种质的方法 |
CN110872590A (zh) * | 2019-11-14 | 2020-03-10 | 南京农业大学 | 转录因子OsTBP2.1的应用 |
CN110938122A (zh) * | 2019-12-11 | 2020-03-31 | 上海交通大学 | 雄性不育基因OsNIN5及其应用和育性恢复的方法 |
CN111909250A (zh) * | 2019-05-10 | 2020-11-10 | 中国农业大学 | 蛋白质invan6、其编码基因以及它们在选育玉米雄性不育系中的应用 |
CN114634993A (zh) * | 2022-04-27 | 2022-06-17 | 南通大学 | 一种基于转录组和蛋白组联合分析的棉花耐盐基因发现方法及其应用 |
CN116590337A (zh) * | 2023-04-21 | 2023-08-15 | 中国科学院华南植物园 | 水稻转录因子OsbZIP13及其编码序列的应用 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130191941A1 (en) | 2006-07-05 | 2013-07-25 | Shing Kwok | Modulating light response pathways in plants, increasing light-related tolerances in plants, and increasing biomass in plants |
US8846003B2 (en) | 2008-03-27 | 2014-09-30 | Symic Biomedical, Inc. | Collagen-binding synthetic peptidoglycans, preparation, and methods of use |
RS55986B1 (sr) | 2010-01-22 | 2017-09-29 | Bayer Ip Gmbh | Akaricidne i/ili insekticidne kombinacije aktivnih supstanci |
WO2012047006A2 (ko) * | 2010-10-08 | 2012-04-12 | 한국생명공학연구원 | 식물의 생장 또는 바이오매스 증가를 촉진시키는 ggps 유전자 및 이의 용도 |
MX2013012329A (es) * | 2011-04-22 | 2013-11-01 | Basf Plant Science Co Gmbh | Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas. |
JP6069307B2 (ja) | 2011-05-24 | 2017-02-01 | シミック・アイピー・リミテッド・ライアビリティー・カンパニーSymic Ip, Llc | ヒアルロン酸結合合成ペプチドグリカン、その製造および使用方法 |
CN103717076B (zh) | 2011-08-10 | 2016-04-13 | 拜耳知识产权股份有限公司 | 含有特定特特拉姆酸衍生物的活性化合物组合物 |
US9562236B2 (en) | 2011-08-12 | 2017-02-07 | Ceres, Inc. | Transcription terminators |
WO2013086499A2 (en) | 2011-12-09 | 2013-06-13 | Ceres, Inc. | Transgenic plants having altered biomass composition |
WO2014007400A1 (ja) * | 2012-07-03 | 2014-01-09 | サントリーホールディングス株式会社 | 花芽形成を促進する方法 |
SG11201506966RA (en) | 2013-03-15 | 2015-10-29 | Symic Biomedical Inc | Extracellular matrix-binding synthetic peptidoglycans |
US10772931B2 (en) | 2014-04-25 | 2020-09-15 | Purdue Research Foundation | Collagen binding synthetic peptidoglycans for treatment of endothelial dysfunction |
US9101100B1 (en) | 2014-04-30 | 2015-08-11 | Ceres, Inc. | Methods and materials for high throughput testing of transgene combinations |
AU2015289691B2 (en) * | 2014-07-15 | 2020-12-24 | Ceres, Inc. | Methods of increasing crop yield under abiotic stress |
CN105177021B (zh) * | 2015-10-21 | 2018-12-28 | 华南农业大学 | 一种药用野生稻基因OobZIP2及其表达载体和构建方法 |
CN105177022B (zh) * | 2015-10-21 | 2018-12-28 | 华南农业大学 | 一种药用野生稻基因OobZIP1及其表达载体和构建方法 |
CN107652360B (zh) * | 2016-10-12 | 2020-03-03 | 清华大学 | Abi5蛋白及其编码基因在调控植物种子氧化胁迫抗性中的应用 |
EP3648774A4 (en) | 2017-07-07 | 2021-04-21 | Symic IP, LLC | SYNTHETIC ORGANIC CONJUGATES |
CN109486838B (zh) * | 2018-12-21 | 2021-09-17 | 中国农业科学院北京畜牧兽医研究所 | 一种调控植物类黄酮合成的转录因子基因及其用途 |
CN115725531B (zh) * | 2020-11-02 | 2024-05-07 | 武汉大学 | 乙酰转移酶OsG2基因及其编码的蛋白质在调节水稻籽粒大小方面的应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7989676B2 (en) * | 2006-08-31 | 2011-08-02 | Ceres, Inc. | Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics |
CA2496595A1 (en) * | 2004-02-11 | 2005-08-11 | Hybrigene, Inc. | Development of controlled total vegetative growth for prevention of transgene escape from genetically modified plants |
WO2006063963A1 (en) * | 2004-12-14 | 2006-06-22 | Vib Vzw | Method to increase plant biomass in stress conditions |
EP1866418A2 (en) * | 2005-02-22 | 2007-12-19 | Ceres Inc. | Modulating plant alkaloids |
BRPI0709801B1 (pt) * | 2006-03-31 | 2017-11-21 | Pioneer Hi - Bred International, Inc. | Isolated polynucleotyde, expression cassette, method for modular size of plants without plants, method of modular any plant or organ size in a plant, product |
US8362325B2 (en) * | 2007-10-03 | 2013-01-29 | Ceres, Inc. | Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics |
-
2009
- 2009-09-16 CN CN2009801456875A patent/CN102216460A/zh active Pending
- 2009-09-16 BR BRPI0918621-2A patent/BRPI0918621A2/pt not_active IP Right Cessation
- 2009-09-16 US US13/119,572 patent/US20130014292A1/en not_active Abandoned
- 2009-09-16 WO PCT/US2009/057116 patent/WO2010033564A1/en active Application Filing
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106755070A (zh) * | 2016-12-12 | 2017-05-31 | 华南农业大学 | 一种创制耐热芥蓝种质的方法 |
CN106755070B (zh) * | 2016-12-12 | 2020-06-12 | 华南农业大学 | 一种创制耐热芥蓝种质的方法 |
CN111909250A (zh) * | 2019-05-10 | 2020-11-10 | 中国农业大学 | 蛋白质invan6、其编码基因以及它们在选育玉米雄性不育系中的应用 |
CN111909250B (zh) * | 2019-05-10 | 2022-08-09 | 中国农业大学 | 蛋白质invan6、其编码基因以及它们在选育玉米雄性不育系中的应用 |
CN110872590A (zh) * | 2019-11-14 | 2020-03-10 | 南京农业大学 | 转录因子OsTBP2.1的应用 |
CN110872590B (zh) * | 2019-11-14 | 2022-03-29 | 南京农业大学 | 转录因子OsTBP2.1的应用 |
CN110938122A (zh) * | 2019-12-11 | 2020-03-31 | 上海交通大学 | 雄性不育基因OsNIN5及其应用和育性恢复的方法 |
CN114634993A (zh) * | 2022-04-27 | 2022-06-17 | 南通大学 | 一种基于转录组和蛋白组联合分析的棉花耐盐基因发现方法及其应用 |
CN114634993B (zh) * | 2022-04-27 | 2023-03-14 | 南通大学 | 一种基于转录组和蛋白组联合分析的棉花耐盐基因发现方法及其应用 |
CN116590337A (zh) * | 2023-04-21 | 2023-08-15 | 中国科学院华南植物园 | 水稻转录因子OsbZIP13及其编码序列的应用 |
CN116590337B (zh) * | 2023-04-21 | 2023-12-05 | 中国科学院华南植物园 | 水稻转录因子OsbZIP13及其编码序列的应用 |
Also Published As
Publication number | Publication date |
---|---|
BRPI0918621A2 (pt) | 2015-08-25 |
US20130014292A1 (en) | 2013-01-10 |
WO2010033564A1 (en) | 2010-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220056465A1 (en) | Transgenic plants having increased biomass | |
CN102216460A (zh) | 生物量增加的转基因植物 | |
US11542521B2 (en) | Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics in response to cold | |
US20100064392A1 (en) | Nucleotide sequences and corresponding polypeptides conferring improved agricultural and/or ornamental characteristics to plants by modulating abscission | |
CN102007214A (zh) | 赋予植物提高的氮利用效率特性的核苷酸序列和相应的多肽 | |
US11629352B2 (en) | Methods of increasing crop yield under abiotic stress | |
US20100115670A1 (en) | Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics in response to cold | |
US12024713B2 (en) | Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics in response to cold |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20111012 |