本申请是申请号为200680012490.0、发明名称为“分析细胞增殖性病症的方法和核酸”的中国专利申请的分案申请,该母案申请是2006年4月17日提交的PCT国际专利申请TPC/US2006/014131进入中国国家阶段的申请。
具体实施方式
定义:
术语“观测/预期比”(“O/E比”)指CpG二核苷酸在特定DNA序列中的频率,对应于[CpG位点数/(C碱基数x G碱基数)]/每一片段的带长(band length).
术语“CpG岛”指满足以下标准的基因组DNA的连续区域:(1)对应于“观测/预期比”的CpG二核苷酸频率>0.6,以及(2)“GC含量”>0.5。CpG岛的长度通常但并非总是在约0.2至约1KB,或至2kb之间。
术语“甲基化状态”或“甲基化状况”指DNA序列内一个或多个CpG二核苷酸处存在或不存在5-甲基胞嘧啶(“5-mCyt”)。DNA序列内一个或多个特定CpG甲基化位点(每处具有两个CpG二核苷酸序列)处的甲基化状态包括“未甲基化的”、“全甲基化的”和“半甲基化的”。
术语“半-甲基化”或“半甲基化”指双链DNA的甲基化状态,其中只有一条链被甲基化。
用在本文时,术语“AUC”为area under a curve(曲线下面积)的缩写。具体地,它指受试者工作特征(ROC)曲线下的面积。ROC曲线为真阳性率相对假阳性率的曲线,用于诊断测试的不同可能性临界值。其显示取决于所选临界值的敏感性和特异性之间的折中(敏感性的任何提高都会伴随有特异性的下降)。ROC曲线下的面积(AUC)是对诊断测试精确性的衡量(面积越大越好,最佳值是1,随机测试的ROC曲线位于对角线,面积为0.5;参见J.P.Egan.Signal Detection Theory andROC Analysis(信号检测理论和ROC分析),Academic Press,New York,1975)。
术语“超甲基化”指相对于正常对照DNA样品内对应CpG二核苷酸处发现的5-mCyt的量来说,对应于测试DNA样品的DNA序列内一个或多个CpG二核苷酸处5-mCyt的出现率增加的平均甲基化状态。
术语“低甲基化”指相对于正常对照DNA样品内对应CpG二核苷酸处发现的5-mCyt的量来说,对应于测试DNA样品的DNA序列内一个或多个CpG二核苷酸处5-mCyt的出现率减少的平均甲基化状态。
术语“微阵列”在广义上,如本领域所接受地,指“DNA微阵列”和“DNA芯片”,包括所有已认可的固体支持物,并包括用于将核酸分子附于其上或在其上合成核酸的所有方法。
“遗传参数”为基因和序列的突变和多态性,为它们的调节进一步所需。被认为是突变的尤其是插入、删除、点突变、倒位以及多态性,并且尤其优选SNP(单核苷酸多态性)。
“表观遗传参数(epigenetic parameter)”尤其是指胞嘧啶甲基化。其它的表观遗传参数例如包括组蛋白的乙酰化,但是其不能采用所述的方法直接分析,但是其与DNA甲基化相关。
术语“亚硫酸氢盐试剂”指包括亚硫酸氢盐(bisulfite)、disulfite、酸式亚硫酸盐(hydrogen sulfite)或其组合,如本文所公开的,用于区分甲基化的和未甲基化的CpG二核苷酸序列。
术语“甲基化测定”指确定DNA序列内一个或多个CpG二核苷酸序列的甲基化状态的任何测定。
术语“MS.AP-PCR”(甲基化敏感的随机引物聚合酶链式反应)指采用富含CG的引物全面扫描基因组以便能集中于最可能含有CpG二核苷酸的区域的本领域已知技术,如Gonzalgo等人,Cancer Research57:594-599,1997所描述的。
术语“MethyLightTM”指本领域已知的由Eads等人,Cancer Res.59:2302-2306,1999描述的基于荧光的实时PCR技术。
在本文使用的其实施方案中,术语“HeavyMethylTM”测定法指这样的测定,其中覆盖位于扩增引物之间或被扩增引物覆盖的CpG位置的甲基化特异的阻断探针(本文也称为阻断剂)使得甲基化特异的选择性扩增核酸样品成为可能。
在本文使用的其实施方案中,术语“HeavyMethylTM MethyLightTM”测定法指HeavyMethylTM MethyLightTM测定,其是MethyLightTM测定的变体,其中MethyLightTM测定与覆盖扩增引物之间CpG位置的甲基化特异阻断探针联合。
术语“Ms-SNuPE”(甲基化敏感单核苷酸引物延伸)指已知的由Gonzalgo&Jones,Nucleic Acids Res.25:2529-2531,1997描述的测定。
术语“MSP”(甲基化特异PCR)指已知的由Herman等人,Proc.Natl.Acad.Sci.USA93:9821-9826,1996以及由美国专利5,786,146描述的甲基化测定。
术语“COBRA”(联合的亚硫酸氢盐限制性分析)指已知的由Xiong&Laird,Nucleic Acids Res.25:2532-2534,1997描述的甲基化测定。
术语“MCA”(甲基化的CpG岛扩增)指由Toyota等人,Cancer Res.59:2307-12,1999以及WO00/26401A1中描述的甲基化测定。
术语“杂交作用”应被理解为寡核苷酸与互补序列沿样品DNA中Watson-Crick碱基配对线的键合,形成双链体结构。
本文中定义的“严紧杂交条件”包括在68℃下在5x SSC/5xDenhardt溶液/1.0%SDS中杂交,并在室温下在0.2x SSC/0.1%SDS中洗涤,或者包括其已知的等同条件(例如这样的条件:杂交在60℃下在2.5x SSC缓冲液中进行,随后是在37℃下在低缓冲浓度下的几个洗涤步骤,并保持稳定)。本文中定义的中等严紧条件包括在42℃下在在3x SSC中洗涤,或其已知的等同条件。可改变盐浓度和温度参数以获得探针和靶核酸之间最佳水平的同一性。在现有技术中可获得对这些条件的指导,例如Sambrook等人,1989,Molecular Cloning,ALaboratory Manual(分子克隆实验指南),Cold Spring Harbor Press,N.Y.以及Ausubel等人,Current Protocols in Molecular Biology(最新分子生物学实验),(John Wiley&Sons,N.Y.)单元2.10。
术语“甲基化特异限制酶”或“甲基化敏感限制酶”应被理解为根据其识别位点的甲基化状态而选择性消化核酸的酶。对于当识别位点未被甲基化或半甲基化时才特异剪切的限制酶来说,当识别位点被甲基化时,不会发生剪切,或以显著降低的效率剪切。对于当识别位点被甲基化时才特异剪切的限制酶来说,当识别位点未被甲基化时,不会发生剪切,或以显著降低的效率剪切。优选的是甲基化特异的限制酶,其识别序列含有CG二核苷酸(例如cgcg或cccggg)。对一些实施方案来说,进一步优选的为当该二核苷酸中的胞嘧啶在C5碳原子被甲基化时不切割的限制酶。
“非甲基化特异的限制酶”或“非甲基化敏感的限制酶”为与甲基化状态无关而以基本相同的效率切割核酸序列的限制酶。它们也被称为“甲基化非特异性限制酶”。
术语“基因”应被认为是包括其所有的转录本变体(例如,术语“Septin9”应包括例如其截短的转录本Q9HC74)以及其所有的启动子和调节元件。此外,由于已知在所述基因内有多个SNP,所以该术语应被认为包括其所有的序列变体。
术语“癌变前的”或“瘤变前的”或其等同用语应被认为是指正经历恶性转变的任何细胞增殖病症。就结肠直肠细胞增殖性病症来说,这类状况的实例包括高度发育异常的细胞增殖性疾病,包括以下类别的腺瘤:
等级1:恶性腺体从肌粘膜渗透入息肉头部(polyp head)内的粘膜下层:
等级2:相同的粘膜下层侵入,但存在于头部至茎部的接合处;
等级3:侵入茎部;以及
等级4:在连接至结肠壁的连接处侵入茎的基部(该等级对应于Dukes A期)。
概述
本发明提供检测和/或分类个体中细胞增殖性疾病的方法,包括确定分离自所述个体的生物样品中至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ1D NOS:160至SEQ ID NO:165的基因或基因组序列的表达水平,其中欠表达和/或CpG甲基化表明所述病症的存在或类别。所述标志物可以用于诊断瘤性细胞增殖性病症(癌症),包括疾病的癌变前期期间的早期检测,以及还用于区分瘤性和良性细胞增殖病症。本发明公开方法,其中瘤性细胞增殖性疾病和良性细胞增殖性疾病被区分开,所述方法的特征在于欠表达和/或存在CpG甲基化表明存在瘤性细胞增殖疾病或瘤前病症,其不存在则表明存在良性细胞增殖性疾病。
本发明的标志物在检测或区分肝细胞增殖性病症或者检测或区分结肠直肠细胞增殖性病症方面尤其有效,由此提供了早期检测、分类和治疗所述病症的改良的手段。
除了以上分析至少一个选自选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的甲基化的实施方案之外,本发明还提供具有新的应用的用于检测癌症尤其是肝癌和/或结肠直肠癌的成组的基因,包括选自至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列。
在第一其它实施方案中,本发明是基于对至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的CpG甲基化状态的分析。进一步优选所述基因的序列如表1所示。
DNA的亚硫酸氢盐修饰为已知的用于评估CpG甲基化状态的工具。在真核细胞的DNA中,5-甲基胞嘧啶是最常见的共价碱基修饰。其例如在调节转录、遗传印迹以及肿瘤发生中起作用。因此确认5-甲基胞嘧啶作为遗传信息组分有相当大的意义。但是,5-甲基胞嘧啶不能通过测序来鉴定,因为5-甲基胞嘧啶与胞嘧啶有相同的碱基配对行为。此外,例如在PCR扩增过程中,5-甲基胞嘧啶携带的表观遗传信息则完全丢失。
最常用于分析DNA中5-甲基胞嘧啶存在的方法是基于亚硫酸氢盐与胞嘧啶的特异反应,由此在随后的碱性水解后,胞嘧啶被转变为在配对行为上对应胸腺嘧啶的尿嘧啶。但重要的是,在这些条件下5-甲基胞嘧啶保持不被修饰。结果,原始的DNA以此方式被转变,使得原来在其杂交行为上不能与胞嘧啶区分开的甲基胞嘧啶现在可作为仅剩的胞嘧啶被常规的已知分子生物学技术检测到,例如通过扩增和杂交。所有这些技术都基于不同的碱基配对特性,现在可被充分利用了。
就敏感性而言,现有技术由方法确定,该方法包括将待分析的DNA包封在琼脂糖基质中,由此防止DNA扩散和复性(亚硫酸氢盐仅与单链DNA反应),并且用快速透析替代所有的沉淀和纯化步骤(OlekA等人,A modified and improved methodfor bisulfite based cytosinemethylation analysis(用于基于亚硫酸氢盐的胞嘧啶分析的改变和改进的方法),NucleicAcids Res.24:5064-6,1996))。因而有可能分析单个细胞的甲基化状态,说明该方法的实用性和敏感性。Rein,T等人,NucleicAcids Res.,26:2255,1998提供了对检测5-甲基胞嘧啶的已知方法的综述。
除了极个别例子外(例如,Zeschnigk M等人,Eur J Hum Genet.5:94-98,1997),该亚硫酸盐技术目前仅用于研究。在所有情况下,在亚硫酸氢盐处理后扩增已知基因的短的特异性片段,并且或者完全测序(Olek&Walter,Nat Genet.199717:275-6,1997),或者进行一个或多个引物延伸反应(Gonzalgo&Jones,NucleicAcids Res.,25:2529-31,1997;WO95/00669;美国专利6,251,594)以分析各个胞嘧啶位置,或者通过酶消化处理(Xiong&Laird,Nucleic Acids Res.,25:2532-4,1997)。通过杂交作用的检测在现有技术中也有描述(Olek等人,wO99/28498)。此外,也描述了使用亚硫酸氢盐技术针对单个基因的甲基化检测(Grigg&Clark,Bioessays,16:431-6,1994;Zeschnigk M等人,Hum Mol Genet.,6:387-95,1997;Feil R等人,NucleicAcids Res.,22:695-,1994;Martin V等人,Gene,157:261-4,1995;wO9746705以及WO9515373)。
本发明还提供该亚硫酸氢盐技术与一种或多种甲基化测定的联合使用,用于确定至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQIDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列内的CpG二核苷酸序列的甲基化状态。基因组CpG二核苷酸可被甲基化或未被甲基化(或者分别称为上和下甲基化(up-and down-methylated))。但是,本发明的方法适于分析异质的生物样品,例如血液或粪便中的低浓度肿瘤细胞。因此,当分析这种样品中CpG位置的甲基化状态时,本领域技术人员可以使用定量测定法来确定特定CpG位置处的甲基化水平(例如百分比、份数、比率、比例或程度),而不是甲基化状态。相应地,术语甲基化状况或甲基化状态还应被认为是指反映CpG位置处甲基化程度的值。除非有明确说明,术语“超甲基化”或“上甲基化”应被认为是指甲基化水平超过特定的临界值,其中所述的临界值可以是代表给定群体的平均或中值甲基化水平的值,或优选为优化的临界水平。在本文中“临界”也可指“阈值”。在本发明的上下文中,对于在选自以下序列的基因或基因组序列内的或与其有关的(例如在启动子或调节区内)所有CpG位置来说,术语“甲基化的”、“超甲基化的”或“上甲基化的”应被认为是包括甲基化水平高于临界值零(0)%(或其等同值)甲基化,所述序列为Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165。
根据本发明,确定SEQ ID NOS:1至SEQ ID NO:3,SEQ ID NO:24,SEQ ID NO:28,SEQ ID NOS:159至SEQ ID NO:167内CpG二核苷酸序列的甲基化状态在诊断和表征细胞增殖性疾病方面均有用处。甲基化测定方法。现有技术中已知多种甲基化测定方法,并且可与本发明联合使用。这些测定使得能够确定DNA序列内一个或多个CpG二核苷酸(例如CpG岛)的甲基化状态。其中,这类测定包括经亚硫酸氢盐处理的DNA的DNA测序、PCR(用于序列特异性扩增)、Southem印迹分析、使用甲基化敏感的限制酶以及其它技术。
例如,通过使用亚硫酸氢盐处理,基因组测序被简化用来分析DNA甲基化模式和5-甲基胞嘧啶的分布(Frommer等人,Proc.Natl.Acad.Sci.USA89:1827-1831,1992)。此外,使用限制酶消化从经亚硫酸氢盐转变的DNA扩增的PCR产物,例如Sadri&Hornsby(Nucl.Acids Res.24:5058-5059,1996),或COBRA(Combined BisulfiteRestriction Analysis(联合的亚硫酸氢盐分析))(Xiong&Laird,NucleicAcids Res.25:2532-2534,1997)所描述的方法。
COBRA.COBRATM是可用于确定小量基因组DNA中特定基因座处的DNA甲基化水平的定量甲基化测定(Xiong&Laird,Nucleic AcidsRes.25:2532-2534,1997)。简言之,将限制酶消化用于揭示经亚硫酸氢钠处理的DNA的PCR产物中甲基化依赖的序列差异。根据Frommer等人描述的方法(Proc.Natl.Acad.Sci.USA89:1827-1831,1992)首先通过标准亚硫酸氢盐处理将甲基化依赖的序列差异引入基因组DNA。随后采用对目的CpG岛特异的引物进行经亚硫酸氢盐转变的DNA的PCR扩增,接着是限制性内切酶消化、凝胶电泳以及采用特异的被标记的杂交探针检测。在原始DNA样品中的甲基化水平由被消化的和未被消化的PCR产物的相对量表示,其在大范围的DNA甲基化水平范围内为线性定量的。此外,这种技术可可靠地用于从显微解剖的石蜡包埋的组织样品获得的DNA。
用于COBRATM分析的典型试剂(例如,可以在典型的基于COBRATM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;限制性酶和适合的缓冲液;基因杂交寡核苷酸;对照杂交寡核苷酸;用于寡核苷酸探针的激酶标记试剂盒;以及标记的核苷酸。另外,亚硫酸氢盐转变试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺酸基缓冲液;以及DNA回收组分。
优选地,诸如“MethyLightTM”(基于荧光的实时PCR技术)(Eads等人,Cancer Res.59:2302-2306,1999)、Ms-SNuPETM(甲基化敏感的单核苷酸引物延伸)反应(Gonzalgo&Jones,NucleicAcidsRes.25:2529-2531,1997)、甲基化特异性PCR(“MSP”;Herman等人,Proc.Natl.Acad.Sci. USA93:9821-9826,1996;美国专利5,786,146)以及甲基化的CpG岛扩增(“MCA”;Toyota等人,Cancer Res.59:2307-12,1999)的测定被单独或与这些方法中的其它方法联合使用。
“HeavyMethylTM”测定技术是用于评估甲基化差异的定量方法,其基于对经亚硫酸氢盐处理的DNA的甲基化特异扩增。覆盖位于扩增引物之间或被扩增引物覆盖的CpG位置的甲基化特异阻断探针(在本文中也被称为阻断剂)使得甲基化特异选择性扩增核酸样品称为可能。在本文应用的其实施方案中,术语“HeavyMethylTM MethyLightTM”测定指HeavyMethylTM MethyLightTM测定,其中MethyLightTM测定与覆盖扩增引物之间CpG位置的甲基化特异阻断探针联合。HeavyMethylTM测定也可与甲基化特异的扩增引物联合使用。
通常用于HeavyMethylTM分析的典型试剂(例如,可在典型的基于MethyLightTM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;阻断寡核苷酸;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
MSP.MSP(甲基化特异的PCR)使得能评估CpG岛内基本上任何CpG位点组的甲基化状态,而与甲基化敏感的限制酶的使用无关(Herman等人,Proc.Natl.Acad.Sci.USA93:9821-9826,1996:美国专利5,786,146)。简言之,用亚硫酸氢钠修饰DNA,将所有未甲基化的而不是甲基化的胞嘧啶转变为尿嘧啶,接着用相对于未甲基化DNA而特异于甲基化DNA的引物扩增。MSP仅需要小量的DNA,对给定CpG岛部位的0.1%的甲基化等位基因敏感,并且可在从石蜡包埋的样品中提取的DNA上进行。用于MSP分析的典型试剂(例如,可能在典型的基于MSP的试剂盒中找到)包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的甲基化的和未甲基化的PCR引物、优化的PCR缓冲液以及脱氧核苷酸和特异探针。
MethyLightTM.MethyLightTM测定为高通量定量甲基化测定,其使用基于荧光的实时PCR()技术,在PCR步骤后不需要进一步的操作(Eads等人,Cancer Res.59:2302-2306,1999)。简言之,MethyLightTM方法以基因组DNA的混合样品开始,该混合样品根据标准操作(亚硫酸氢盐过程将未甲基化的胞嘧啶残基转变成尿嘧啶)在亚硫酸氢钠反应中被转变为甲基化依赖的序列差异的混合池。随后在“偏移的(biased)”反应(采用重叠已知CpG二核苷酸的PCR引物)中进行基于荧光的PCR。可在扩增过程水平以及在荧光检测过程水平上产生序列差别。
MethyLightTM测定可以用作基因组DNA样品中甲基化模式的定量测试,其中序列区分发生在探针杂交水平上。在该定量方式中,在重叠特定的推定甲基化位点的荧光探针存在下,PCR反应提供了甲基化特异的扩增。用于输入DNA量的无偏移对照由以下反应提供:其中引物和探针都不覆盖任何CpG二核苷酸。或者,通过以不“覆盖”已知甲基化位点的对照寡核苷酸(HeavyMethylTM和MSP技术的基于荧光的方式),或者以覆盖潜在甲基化位点的寡核苷酸探测偏移的PCR池来实现对基因组甲基化的定量测试。
MethyLightTM方法可与任何适合的探针一起使用,如“”、等等。例如,用亚硫酸氢钠处理双链基因组DNA,并对其进行采用探针的两套PCR反应之一;例如,采用MSP引物和/或HeavyMethyl阻断剂寡核苷酸和探针。该探针为荧光“报道物”和“淬灭”分子双标记的,并被设计为特异于相对高GC含量区,以至于其在PCR循环中以比正向或反向引物高约10℃的温度熔解。这使得探针在PCR退火/延伸步骤中保持充分杂交。当Taq聚合酶在PCR中酶合成新链时,其最终会遇到退火的探针。Taq聚合酶5’至3’内切酶活性随后将通过消化探针而顶替它,从而释放荧光报道物分子用于采用实时荧光检测系统定量检测其现在未被淬灭的信号。
用于MethyLightTM分析的典型试剂(例如,可以在基于MethyLightTM的试剂盒中找到的)可以包括,但不限于:用于特定基因(或亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;或探针;优化的PCR缓冲液以及脱氧核苷酸;以及Taq聚合酶。
QMTM(定量甲基化)测定为基因组DNA样品中甲基化模式的另一种定量测试,其中序列区分出现在探针杂交水平上。在这种定量方式中,PCR反应在荧光探针的存在下提供无偏移的扩增,其中该荧光探针重叠特定的推定甲基化位点。由这样的反应来提供输入DNA量的无偏移的对照:即其中引物或探针都不重叠任何CpG二核苷酸。或者,通过以不“覆盖”已知甲基化位点的对照寡核苷酸(HeavyMethylTM和MSP技术的基于荧光的方式),或者以覆盖潜在甲基化位点的寡核苷酸探测偏移的PCR池来实现对基因组甲基化的定量测试。
QM TM方法在扩增过程中可与任何适合的探针一起使用,如 等等。例如,用亚硫酸氢钠处理双链基因组DNA,并对其使用无偏移的引物和探针。该探针为荧光“报道物”和“淬灭”分子双标记的,并被设计为特异于相对高GC含量区,以至于其在PCR循环中以比正向或反向引物高约10℃的温度熔解。这使得探针在PCR退火/延伸步骤中保持充分杂交。当Taq聚合酶在PCR中酶合成新链时,其最终会遇到退火的探针。Taq聚合酶5’至3’内切酶活性随后将通过消化探针而顶替它,从而释放荧光报道物分子用于采用实时荧光检测系统定量检测其现在未被淬灭的信号。用于QMTM分析的典型试剂(例如,可以在基于QMTM的试剂盒中找到的)可以包括,但不限于:用于特定基因(或亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;或探针;优化的PCR缓冲液以及脱氧核苷酸;以及Taq聚合酶。
Ms-SNuPE.Ms-SNuPETM技术是用于评估特定CpG位点的甲基化差异的定量方法,其基于亚硫酸氢盐处理DNA,接着是单核苷酸引物延伸(Gonzalgo&Jones,NucleicAcids Res.25:2529-2531,1997)。简言之,使基因组DNA与亚硫酸氢钠反应以将未甲基化的胞嘧啶转变为尿嘧啶,而保持5-甲基胞嘧啶不变。随后采用特异于经亚硫酸氢盐转变的DNA的PCR引物扩增所需的靶序列,分离所得到的产物并用作分析目的CpG位点处甲基化的模板。可分析小量的DNA(例如显微解剖的病理切片),其避免了使用限制酶确定CpG位点处的甲基化状态。
用于Ms-SNuPETM分析的典型试剂(例如,可以在典型的基于COBRATM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒、阳性对照引物;用于特定基因的Ms-SNuPETM引物;反应缓冲液(用于Ms-SNuPE反应);以及标记的核苷酸。另外,亚硫酸氢盐转变试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺酸基缓冲液;以及DNA回收组分。
SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ IDNO:28、
SEQ ID NOS:159至SEQ ID NO:167的基因组序列,以及其非天然发
生的经处理的变体SEQ ID NOS:1O至SEQ ID NO:15、SEQ ID NOS:28
至SEQ ID NO:33、SEQ ID NOS:30至SEQ IDNO:31、SEQIDNOS:42
至SEO ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50
至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203被确定在细胞
增殖性病症尤其是结肠直肠和/或肝细胞增殖性病症的早期检测、分类
和/或治疗方面具有新的应用。
在一个实施方案中,本发明的方法包括以下步骤:i)使从个体获得的基因组DNA(优选从体液分离的)与至少一种试剂或一组试剂接触,所述试剂区分至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165(包括其启动子和调节区域)的基因或基因组序列内的甲基化和未甲基化的CpG二核苷酸;以及ii)以大于或等于80%的敏感性和大于或等于80%的特异性检测、或检测并区分结肠或肝细胞增殖性病症。
优选地,所述敏感性为约75%至约96%、或约80%至约90%、或约80%至约85%。优选地,所述特异性为约75%至约96%、或约80%至约90%、或约80%至约85%。
可通过任何的现有技术中的标准方法分离基因组DNA,包括使用可商购的试剂盒。简言之,当目的DNA在生物样品中被包裹在细胞膜中时,该生物样品必须被破碎并通过酶、化学或机械手段被裂解。随后例如通过蛋白激酶K的消化而清除蛋白和其它的污染物。接着从溶液中回收基因组DNA。这可以通过各种方法来实现,包括盐析、有机提取或将DNA结合到固相支持物。对方法的选择会受到多种因素的影响,包括时间、费用和所需的DNA的量。所有的临床样品种类,包括瘤性物质或瘤前物质,都适合用在本发明方法中,优选的为细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。体液为优选的DNA源;尤其优选的为血浆、血清、全血、分离的血细胞和从血液分离的细胞。
随后,用区分基因组DNA至少一个靶区域内甲基化和未甲基化CpG二核苷酸的至少一种或成组试剂处理基因组DNA样品,其中所述靶区域包括或在严紧条件下杂交至至少一个序列的长度为至少16个连续核苷酸的序列,所述至少一个序列选自分别选自SEQ ID NOS:1至SEQ TD NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167,其中所述连续核苷酸包括至少一个CpG二核苷酸序列。
尤其优选的是,所述试剂将未在5’位甲基化的胞嘧啶碱基转变为尿嘧啶、胸腺嘧啶或其它在杂交行为上不同于胞嘧啶的的另一碱基。但是,在另一实施方案中,所述试剂可以为甲基化敏感的限制酶。
当基因组DNA被这种方式处理,以便使在5’位未甲基化的胞嘧啶碱基转变为尿嘧啶、胸腺嘧啶或其它在杂交行为上不同于胞嘧啶的的其它碱基时,优选这种处理用亚硫酸氢盐进行(酸式亚硫酸盐、亚硫酸氢盐(disulfite))并且随后碱性水解。这种处理导致SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167(分别)被转变为SEQ ID NOs:10至SEQ ID NO:15、SEQID NOS:30至SEQ ID NO:31、SEQ ID NOS:38至SEQ ID NO:39、SEQID NOS:168至SEQ ID NO:185,其中所述CpG二核苷酸为甲基化的,或SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOs:42至SEQ IDNO:43、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:186至SEQ IDNO:203,其中所述CpG二核苷酸为未甲基化的。
随后分析经处理的DNA,以便确定靶基因序列(处理前至少一个基因或基因组序列选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQID NO:165)的甲基化状态。尤其优选的是,该靶区域包括或在严紧条件下杂交至至少一个基因或基因组序列的至少16连续核苷酸,所述至少一个基因或基因组序列选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165。优选分析SEQ ID NOS:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的基因序列。所述分析方法可以选自现有技术中已知的那些,包括那些列在本文中的。尤其优选的是MethyLightTM、MSP以及使用本文描述的阻断寡核苷酸(HeavyMethylTM)。进一步优选的是,用在这种分析中的任何寡核苷酸(包括引物、阻断寡核苷酸以及检测探针)应该反向互补于、等同于或在严紧或高度严紧条件下杂交SEQ ID NOS:10至SEQ IDNO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ IDNO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ IDNO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ IDNO:203及其互补序列中的一种或多种碱基序列的至少16个碱基对长的片段。
异常甲基化,更具体地是选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ IDNOS:160至SEQ ID NO:165(包括它们的启动子和/或调节区)的基因或基因组序列的超甲基化与瘤性细胞增殖性病症的存在有关,在结肠直肠和肝细胞瘤中尤其普遍。因此,当生物样品表现出任何程度的甲基化时,所述样品应被确定为瘤性的。
对选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列之一的分析首次使得能够以高于或等于80%的敏感性以及高于或等于80%的特异性检测或检测并区分结肠或肝细胞增殖性病症。敏感性的计算为:(检测到的瘤/所有的瘤);例如(检测到的结肠瘤/所有的结肠瘤);特异性的计算为(未检测到的阴性/总的阴性)。
优选地,所述敏感性为约75%至约96%、或约80%至约90%、或约80%至约85%。优选地,所述特异性为约75%至约96%、或约80%至约90%、或约80%至约85%。
本文所定义的瘤为所有的大于1cm结肠恶性肿瘤以及腺瘤,或其亚型。阴性可被定义为健康个体。
在一个实施方案中,所述方法公开了选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165(或其启动子和/或调节区)的至少一个基因或基因组序列用作区别、检测和区分细胞增殖性病症(尤其是瘤性的结肠或肝脏病症)的标志物。
所述方法可以通过任何分析从它们转录的RNA的表达或从所述RNA翻译的多肽或蛋白的表达来实现,优选通过mRNA表达分析或多肽表达分析。因此,本发明还提供诊断测定和方法,定量和定性地检测个体中至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的表达,并由此确定在所述个体中是否存在癌症。
自选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列转录的mRNA的异常表达与个体中癌症的存在相关。根据本发明,欠表达(和/或存在甲基化)与癌症的存在相关,反之过表达(和/或不存在甲基化)与不存在癌症相关。尤其优选地,确定至少一个如SEQ ID NOS:16至SEQ ID NO:19中公开的基因Septin9的转录变体的表达。
为了检测编码基因或基因组序列的mRNA的存在,从患者去得样品。该样品可以是任何适合的包含肿瘤的细胞物质的样品。适合的样品种类包括细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,及其所有可能的组合。优选地,所述样品种类为粪便或体液,选自结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞。
所述样品可以被处理以提取其中所含的RNA。随后分析从该样品所得的核酸。现有技术中已知很多用于确定基因表达的绝对和相对水平的技术,适合用在本发明中的常用技术包括原位杂交(例如FISH)、Northern分析、RNA酶保护测定(RPA)、微阵列和基于PCR的技术,例如定量PCR和差异显示PCR或任何其它的核酸检测方法。
尤其优选的是使用逆转录/聚合链式反应技术(RT-PCR)。RT-PCR方法在现有技术中是公知的(例如,参见上文Watson and Fleming)。
RT-PCR方法可如下进行。通过例如标准的异硫氰酸胍方法分离细胞总RNA,并且逆转录该总RNA。该逆转录方法包括采用逆转录酶和3’端寡核苷酸dT引物和/或随机六聚体引物在RNA模板上合成DNA。由此产生的cDNA随后被PCR扩增(Belyavsky等人,Nucl AcidRes17:2919-2932,1989;Krug and Berger,Methods in Enzymology(酶学中的方法),Academic Press,N.Y.,Vol.152,pp.316-325,1987,通过参考将它们引入)。进一步优选的是RT-PCR的“实时”变体,其中所述PCR产物通过杂交探针(例如TaqMan、Lightcyc1er、Mo1ecu1arBeacons&Scorpion)或SYBR绿来检测。然后,参照标准曲线或通过将Ct值与校准标准的Ct值比较而将从探针或SYBR绿检测到的信号定量。对看家基因的分析经常用来标准化结果。
在Northern印迹分析中,在变性琼脂糖凝胶上分离总mRNA或po1y(A)+mRNA,并在该干燥的凝胶自身中或膜上杂交至标记的探针。所得的信号与RNA群中靶RNA的量成比例。
对来自两个或多个细胞群或组织的信号的比较揭示基因表达水平的相对差异。可通过将信号与采用已知量的对应于靶RNA的体外转录本产生的标准曲线进行比较来进行绝对定量。对看家基因的分析经常用于标准化结果,排除了由于转移至膜上的RNA的不同或上样到凝胶上的RNA的不同所引起的任何明显差异,所述看家基因是表达水平与条件无关而预期保持相对恒定的基因。
Northern分析中的第一步是从目的细胞或组织分离纯的、完整的RNA。因为Northern印迹通过大小来区分RNA,样品的完整性影响信号在单条带中的集中度。部分降解的RNA样品将导致信号模糊或分布在几个条带,导致敏感性的总体上的降低并可能导致对数据的错误解释。在Northern印迹分析中,可使用DNA、RNA以及寡核苷酸探针,这些探针优选被标记(例如,放射性标记物、质谱标记物(mass1abe1)或荧光标记物)。靶RNA,而不是探针的大小将决定检测到的条带的大小,所以诸如产生不同长度探针的随机引物标记的方法适用于探针分析。探针的特异活性将决定敏感性的水平,所以优选使用具有高特异活性的探针。
在RNA酶保护测定中,RNA靶和具有确定长度的RNA探针在溶液中杂交。杂交后,用特异于单链核酸的RNA酶(RNase)消化RNA以除去任何未杂交的单链靶RNA和探针。使RNA酶失活,并且例如通过变性聚丙烯酰胺凝胶电泳来分离RNA。完整RNA探针的量与RNA群中的靶RNA的量成比例。RPA可用于基因表达的相对和绝对定量,并且也用于绘制RNA结构,例如内含子/外显子边界和转录起始位点。RNA酶保护测定优于Northern印迹分析,因为其具有较低的检测限。
用于RPA中的反义RNA探针通过体外转录具有明确端点的DNA模板而生成,通常在50-600核苷酸的范围内。使用包括额外的不与靶RNA同源的序列的RNA探针使得被保护的片段与全长探针区分开。RNA探针通常替代DNA探针使用,这是因为易于产生单链RNA探针以及用RNase消化RNA:RNA双链体的重现性和可靠性(AuSube1等人,2003),尤其优选的是具有高特异活性的探针。
尤其优选的是使用微阵列。微阵列方法可被划分为两个主要部分。第一个是将已知的基因序列固定到载玻片或其它固体支持物上,随后是荧光标记的cDNA(包含待研究的序列)与该固定到载玻片(或其它固相)上的已知基因的杂交。杂交后,采用荧光微阵列扫描仪扫描阵列。对不同基因相对荧光强度的分析提供了对基因表达差异的衡量。
可通过将预先合成的寡核苷酸固定到制备的载玻片或其它固体表面来产生DNA阵列。这种情况下,采用标准寡核苷酸合成和纯化方法来加工和制备代表性的基因序列。这些合成的基因序列互补于目的基因的RNA转录本(这种情况下,基因或基因组序列选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165),并且倾向于25-70核苷酸范围内的短序列。在优选的实施方案中,所述寡核苷酸或多核苷酸包括与选自SEQ ID NOS:16至SEQ ID NO:19以及其互补序列的至少一个序列互补或杂交的序列的至少9、18或25个碱基。或者,固定的寡聚体可在载玻片表面上原位化学合成。原位寡核苷酸合成涉及将合适的核苷酸连续地添加至微阵列上的点;未接受核苷酸的点在该方法的每个阶段采用物理或实际掩蔽物来保护。优选地,所述合成的核酸为锁定的核酸。
在分析表达的微阵列实验中,所用的RNA模板代表所研究的细胞或组织的转录谱。首先从待比较的细胞群或组织中分离RNA。然后将每一RNA样品用作模板通过逆转录反应来产生荧光标记的cDNA。该cDNA的荧光标记可通过直接标记或间接标记方法来实现。在直接标记中,荧光修饰的核苷酸(例如,-或-dCTP)在逆转录反应中被直接掺入到cDNA中。或者,可通过在cDNA合成期间掺入氨基烯丙基修饰的核苷酸,接着在逆转录反应结束后将N-羟基琥珀酰亚胺(NHS)-脂染料偶联到该氨基烯丙基修饰cDNA来完成间接标记。或者,该探针可为未标记的,但可以通过与直接或间接标记的配体特异结合而被检测。用于标记配体(和探针)的标记物和方法在本领域是已知的,包括例如可通过已知方法(例如缺口平移或激酶磷酸化(kinasing))掺入的放射性标记物。其它合适的标记物包括但不限于生物素、荧光团、化学发光团(例如二氧杂环己烷,尤其是引发的二氧杂环己烷、酶、抗体等。
为了进行差别基因表达分析,从不同RNA样品产生的cDNA被标记。所得到的标记的cDNA被纯化以除去未掺入的核苷酸、游离染料和残留RNA。纯化之后,标记的cDNA样品被杂交至微阵列。该杂交的严紧性由杂交过程中和洗涤过程中的多种因素决定,包括温度、离子强度、时长和甲酰胺的浓度。例如在Sambrook et al.(MolecularCloning:A Laboratory Manual(分子克隆:实验室手册),2nd ed.,1989)中概述了这些因素。杂交后使用荧光微阵列扫描仪扫描微阵列。每个点的荧光强度表示所分析基因的表达水平;亮点对应于强表达的基因,而暗点表示弱表达。
一旦获得了图像,需要分析原始数据。首先,必须从每个点的荧光中减去背景荧光。然后将数据相对对照序列标准化,对照序列例如外源添加的核酸(优选RNA或DNA),或看家基因组,以弥补任何非特异的杂交、阵列缺陷或测定装置、cDNA标记、杂交或洗涤的差异。数据标准化使得可对多个测定的结果进行比较。
本发明的另一方面涉及用于根据本发明的方法诊断个体中癌症中的试剂盒,所述试剂盒包括:测量选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ IDNOS:160至SEQ ID NO:165的基因或基因组序列转录水平的组件。在优选的实施方案中,用于测量转录水平的组件包含能够在严紧或中等严紧条件下与选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQID NO:165的基因或基因组序列的转录产物杂交的寡核苷酸或多核苷酸。优选地,所述寡核苷酸或多核苷酸能够在严紧或中等严紧条件下与选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的至少一种转录产物杂交,如SEQ ID NOS:16至SEQID NO:19中所提供的。在一个实施方案中,所述寡核苷酸或多核苷酸包含与选自SEQ ID NOS:16至SEQ ID NO:19及其互补序列的至少一个序列互补或杂交的序列的至少9、18或25个碱基。
在最优选的实施方案中,通过选自Northern印迹分析、逆转录酶PCR、实时PCR、RNA酶保护、以及微阵列的技术来确定转录水平。在本发明的另一实施方案中,该试剂盒还包含用于从患者获得生物样品的装置。优选地,试剂盒还包括容器,其最优选适合于盛装用于测定转录水平的组件和患者的生物样品,最优选地,还包括使用以及解释试剂盒结果的说明书。
在优选的实施方案中,该试剂盒包括(a)能够在严紧或中等严紧条件下与选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的至少一种基因或基因组序列的转录产物杂交的多种寡核苷酸或多核苷酸;(b)容器,优选适于盛装所述寡核苷酸或多核苷酸以及包含转录产物的患者生物样品,其中所述寡核苷酸或多核苷酸能够在严紧或中等严紧条件下与所述转录产物杂交;(c)用于检测(b)的杂交的组件,以及任选地,(d)使用和解释试剂盒结果的说明书。进一步优选地,所述(a)的寡核苷酸或多核苷酸的每一种都包含与选自SEQ ID NOS:16至SEQ ID NO:19及其互补序列的至少一个序列互补或杂交的序列的至少9、18或25个碱基。
所述试剂盒也可含有其它的组分,诸如包装在分开容器中的杂交缓冲液(其中寡核苷酸将被用作探针)。或者,当所述寡核苷酸将被用于扩增靶区域时,所述试剂盒可以含有包装在分开容器中的聚合酶和优化的用于聚合酶介导的引物延伸的反应缓冲液,如PCR。优选地,所述聚合酶是逆转录酶。进一步优选的是所述试剂盒还含有RNA酶试剂。
本发明还提供用于检测从患者获得的样品中是否存在由所述基因序列编码的多肽的方法。
由选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列编码的多肽的多肽表达水平异常与癌症的存在相关。
根据本发明,所述多肽的欠表达与癌症的存在相关。尤其优选地,所述多肽为转录自Septin9基因的SEQ ID NOS:20至SEQ ID NO:23多肽提供的至少一种氨基酸序列。
可以使用任何现有技术中已知的用于检测多肽的方法。这类方法包括,但不限于质谱法、免疫扩散法、免疫电泳法、免疫化学方法、结合物-配体测定法、免疫组化技术、凝集和补体测定法(例如,参见Basic and Clinical Immunology(基础和临床免疫学),Sites and Terr,eds.,Appleton&Lange,Norwalk,Conn,pp217-262,1991,将其通过参考并入本文)。优选的是结合物-配体免疫测定方法,包括使抗体与一个或多个表位反应,并竞争性地置换标记的多肽或其衍生物。
本发明的某些实施方案包括使用特异于由选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列编码的多肽的抗体。尤其优选的是,所述多肽为SEQ ID NOS:20至SEQ IDNO:23提供的至少一种氨基酸序列。
这类抗体可用于癌症诊断。在某些实施方案中,单克隆或多克隆抗体的产生可通过用由SEQ ID NOS:20至SEQ ID NO:23的多肽编码的表位作为抗原来诱导。这类抗体叉可用于检测作为癌症诊断标记物的表达的多肽。可通过常规方法定量这些多肽的存在水平。可以通过多种现有技术中已知的手段来检测和定量抗体-多肽结合,诸如用荧光或放射性配体标记。本发明还包括用于进行上述方法的试剂盒,其中这些试剂盒含有特异于所研究多肽的抗体。
本领域公知多种竞争性和非竞争性多肽结合免疫测定法。在这些测定中使用的抗体可以是未被标记的,例如用在凝集测试中,或被标记的,用于多种测定方法。可使用的标记物包括放射性核素、酶、荧光剂、化学发光剂、酶底物或辅因子、酶抑制剂、颗粒、染料等等。优选的测定包括但不限于放射免疫测定(RIA),酶免疫测定,例如酶联免疫吸附测定(ELISA)、荧光免疫测定等。可通过本领域已知的多种方法中的任何方法来制备用于免疫测定的多克隆或单克隆抗体或其表位。
在所述方法的其它实施方案中,所述蛋白可以用western印迹分析来检测。所述分析在本领域中是标准的。简言之,通过电泳如SDS-PAGE将蛋白分开。随后将分开的蛋白转移至适合的膜(或纸)上,如硝酸纤维素,同时保持通过电泳获得的空间分离。接着将膜与结合膜上剩余的有结合性位置的封闭试剂一起孵育,通常使用的试剂包括一般蛋白(例如乳蛋白)。然后,加入特异于目的蛋白的抗体,所述抗体被可检测地标记,例如通过染料或酶学方法(例如碱性磷酸酶或辣根过氧化物酶)。随后检测所述抗体在膜上的位置。
在该方法的其它实施方案中,所述蛋白可以通过免疫组化方法来检测(使用抗体来探测样品中的特异抗原)。所述分析在现有技术中是标准的,其中对组织中抗原的检测被称为免疫组织化学,而在培养细胞中的检测通常称为免疫细胞化学。简言之,初级抗体通过结合到其特异抗原而被检测。随后,该抗体-抗原复合物被次级酶偶联的抗体结合。在必要的底物和发色团存在下,根据在抗体-抗原结合位点处的有色沉积来检测结合的酶。适合的样品种类、抗原-抗体亲和性、抗体种类以及检测增强方法都有多种。因此,用于免疫组织化学或免疫细胞化学检测的最优条件必须由本领域技术人员为每个个例单独确定。
一种制备针对多肽的抗体的方法为:选择并制备该多肽的全部或部分氨基酸序列,化学合成该氨基酸序列并将其注射进适合的动物,通常是兔或小鼠(Milstein and Kohler Nature256:495-497,1975;Gulfreand Milstein,Methods in Enzymology:Immunochemical Techniques(酶学中的方法:免疫化学技术)73:1-46,Langone and Banatis eds.,Academic Press,1981,将其整体通过参考并入本文)。制备多肽或其表位的方法包括,但不限于化学合成、重组DNA技术或从生物样品分离。
在该方法的最后步骤中,确定患者的诊断结果,其中(选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的至少一种基因或基因组序列的)欠表达表明存在癌症。术语欠表达应被认为是指检测到的水平少于预先确定的临界值,该临界值可以从均值、中值或优化的阈值中选择。
本发明的另一方面提供用于根据本发明方法诊断个体中癌症的试剂盒,包括:用于检测至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARMl、VTN、PRDM6、NR2E1、FAT以及SEQ IDNOS:160至SEQ ID NO:165的基因或基因组序列的多肽的组件。优选地,所述多肽的序列如SEQ ID NOS:20至SEQ ID NO:23所提供的。用于检测所述多肽的组件优选包括抗体、抗体衍生物或抗体片段。所述多肽最优选通过利用标记的抗体的Western印迹来检测。在本发明的另一实施方案中,该试剂盒还包括获得患者生物样品的组件。优选地,试剂盒还包括适于盛装检测患者生物样品中多肽的容器,最优选还包括使用和解释试剂盒结果的说明书。在优选的实施方案中,所述试剂盒包括:(a)用于检测至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQID NOS:160至SEQ ID NO:165的基因或基因组序列多肽的组件;(b)适于盛装所述组件和包含所述多肽的患者生物样品的容器,其中所述组件能够与所述多肽形成复合物;(c)检测(b)的复合物的组件;以及任选地(d)使用和解释试剂盒结果的说明书。优选地,所述检测至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM l、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的多肽的组件特异于至少一种选自SEQ ID NOS:20至SEQ ID NO:23的多肽序列。所述试剂盒还可以含有包装在分开容器中的其它组分,例如用于阻断、洗涤或包被的缓冲液或溶液。
本发明的具体实施方案提供对所述序列内甲基化水平和/或模式的分析的新应用,其使得精确的检测、表征和/或治疗肝和/或结肠直肠细胞增殖性病症成为可能。癌症的早期检测直接与疾病预后相联系,因而这里公开的方法使得医师和患者能够做出更好更合理的治疗决定。
进一步的改进
本发明提供基因组序列SEQ ID NOS:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的新用途。其它的实施方案提供了SEQ ID NOS:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的经修饰的变体,以及用于分析SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167内胞嘧啶甲基化模式的寡核苷酸和/或PNA-寡聚体。
本发明的目的包括分析至少一种选自SEQ ID NOS:1至SEQ IDNO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列的序列内的一个或多个CpG二核苷酸的甲基化状态。
所公开的发明提供衍生自基因组SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的经处理的核酸,其中所述处理适合于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转变为尿嘧啶或其它在杂交上可检测地不同于胞嘧啶的其它碱基。所讨论的基因组可以包括一个或多个连续的甲基化CpG位置。所述处理优选包括使用选自亚硫酸氢盐、酸式亚硫酸盐、disulfite及其组合的试剂。在本发明优选的实施方案中,本发明提供非天然产生的经修饰的核酸,其包含选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS.50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列的长度为至少16个连续核苷酸碱基的序列。在进一步优选的实施方案中,所述核酸是至少50、100、150、200、250或500个碱基对长度的公开在SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203中的核酸序列的片段。尤其优选的是不与SEQ ID NOS:10至SEQ IDNO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ IDNO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ IDNO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ IDNO:203而不是SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQID NO:28、SEQ ID NOS:159至SEQ ID NO:167或其它天然产生的DNA的全部或部分序列相同或互补的核酸分子。
优选的是,所述序列包含CpG、TpA或CpA二核苷酸以及与其互补的序列中的至少一个。SEQ ID NOS:10至SEQ ID NO:15、SEQ IDNOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ IDNOS.42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ IDNOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列提供了SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的非天然产生的经修饰的形式,其中每一基因组序列的修饰导致合成如下的具有独特和不同于所述基因组序列的序列的核酸。对于每一有义链基因组DNA如SEQ ID NO:1来说,公开了4种被转变的形式。第一种形式是“C”被转变成“T”,但是“CpG”仍保持“CpG”(即,对应于这样的情况:其中对于基因组序列来说,所有的“CpG”二核苷酸序列中的“C”残基被甲基化,因此不被转变);第二种形式公开了所公开的基因组DNA序列的互补序列(即反义链),其中“C”被转变成“T”,但是“CpG”仍保持“CpG”(即,对应于这样的情况:其中对于基因组序列来说,所有的“CpG”二核苷酸序列中的“C”残基被甲基化,因此不被转变)。SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的“上甲基化的”转变的序列对应于SEQ ID NOS:1O至SEQ ID NO:15、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:168至SEQ ID NO:185。提供每一基因组序列的第三种化学转变形式,其中对于所有的“C”残基“C”都被转变为“T”,包括“CpG”二核苷酸序列中的那些(即,对应于这样的情况:其中对于基因组序列来说,“CpG”二核苷酸序列中的所有“C”残基是未被甲基化的);每一序列的最后一种化学转变形式公开了所公开的基因组DNA序列的互补序列(即反义链),其中对于所有的“C”残基“C”都被转变为“T”,包括“CpG”二核苷酸序列中的那些(即,对应于这样的情况:其中对于每一基因组序列的互补序列(反义链)来说,“CpG”二核苷酸序列中的所有“C”残基是未被甲基化的)。SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的“下甲基化的”转变的序列对应于SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:42至SEQ IDNO:43、SEQ ID NOS:5O至SEQ ID NO:51、SEQ ID NOS:186至SEQ IDNO:203的序列。
因此,重要的是,SEQ ID NOS:10至SEQ ID NO:15、SEQ IDNOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ IDNOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ IDNOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的核酸序列和分子不涉及或与细胞增殖性病症的检测、分类或治疗相联系。
在其它优选的实施方案中,本发明还提供适于用在本发明方法中的寡核苷酸或寡聚体,用于检测SEQ ID NOS:1至SEQ ID NO:3、SEQID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQID NOS:30至SEQ ID NO:31、SEQ ID NOD:42至SEQ ID NO:43、SEQID NOD:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQID NOS:168至SEQ ID NO:203的基因组或经处理的(化学修饰的)DNA内的胞嘧啶甲基化状态。所述寡核苷酸或寡聚体核酸提供了新的诊断手段。所述寡核苷酸或寡聚体包含具有至少九(9)个核苷酸的核酸序列,其相同于或在中等严紧或严紧条件下(如上文所定义的)杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ IDNOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ IDNOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ IDNOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203和/或其互补序列,或者基因组序列SEQ ID NOS:1至SEQ ID NO:3、SEQ IDNOS:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167和/或其互补序列。
因此,本发明包括在中等严紧和/或严紧杂交条件下杂交选自SEQID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ IDNOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203或其互补序列的全部或部分序列的核酸分子(例如寡核苷酸和肽核酸(PNA)分子(PNA-寡聚体))。尤其优选的是在中等严紧和/或严紧杂交条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203而不是SEQ IDNOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167或其它人基因组DNA的全部或部分序列的核酸分子。
所述杂交核酸的相同或杂交部分通常长为至少9、16、20、25、30或35个核苷酸。但是,更长的分子具有本发明的应用,因此也包含在本发明的范围内。
优选地,本发明杂交核酸分子的杂交部分与选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203或其互补序列的序列或其一部分有至少95%或至少98%或100%的一致性。
本文描述的杂交核酸类型可例如用作引物(例如,PCR引物)、或诊断和/或预后探针或引物。优选地,所述寡核苷酸探针与核酸样品的杂交在严紧条件下进行,并且该探针与靶序列100%相同。核酸双链体或杂交稳定性被表达为熔解温度或Tm,其为探针与靶DNA解离的温度。此熔解温度可用于确定所需的严紧条件。
对于与相应序列SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167相关或基本相同而不是相同的靶序列(例如等位变体和SNP)而言,有用的是首先用特定浓度的盐(例如SSC或SSPE)确定只发生同源杂交的最低温度。然后,假定1%的错配导致Tm降低1℃,杂交反应中最后洗涤的温度也相应降低(例如,如果检测与探针有>95%同一性的序列,则最终的洗涤温度降低5℃)。实际上,Tm的变化可在每1%错配0.5℃至1.5℃之间。
长度为X(以核苷酸计)的本发明寡核苷酸的实例,如通过参照例如SEQ ID NO:1的多核苷酸位置表明的,包括对应于那些长度X的连续重叠寡核苷酸集(有义集和反义集),其中每一连续重叠集内的寡核苷酸(对应于给定的X值)被定义为来自核苷酸位置:
n至(n+(X-1))
的Z寡核苷酸的有限集;
其中n=1,2,3,...(Y-(X-1));
其中Y等于SEQ ID NO:1的长度(核苷酸或碱基对)(219909);
其中X等于所述集中每一寡核苷酸的共同长度(以核苷酸计)(例如对于连续重叠的20聚体(20-mer),X=20);并且
其中对于长度为Y的给定SEQ ID NO来说,长度为X的连续重叠寡聚体的数量(Z)等于Y-(X-1)。例如,当X=20时,对于SEQ ID NO:1的有义或反义集而言Z=219909-19=219890。
优选地,所述集被限制于包含至少一个CpG、TpG或CpA二核苷酸的那些寡聚体。
本发明20聚体寡核苷酸的实例包括以下219890个寡聚体的集(以及与其互补的反义集),通过参照SEQ ID NO:1的多核苷酸位置来表示:
1-20,2-21,3-22,4-23,5-24,………….和219890-219909。
优选地,所述集限制在包含至少一个CpG、TpG或CpA二核苷酸的那些寡聚体。
同样地,本发明的25聚体寡核苷酸的实例包括以下219885个寡聚体的集(以及与其互补的反义集),通过参照SEQ ID NO:1的多核苷酸位置来表示:
1-25,2-26,3-27,4-28,5-29…………和219885-219909。
优选地,所述集限制在包含至少一个CpG、TpG或CpA二核苷酸的那些寡聚体。
对于SEQ ID NOS:1至SEQ ID NO3、SEQ ID NO.24、SEQ IDNO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQID NO:203(有义和反义的)中的每一个,本发明包括长度为X的寡核苷酸或修饰的寡核苷酸的多个连续重叠集。
本发明的寡核苷酸或寡聚体构成可用于确定选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的基因组序列的遗传和表观遗传参数的有效工具。这类长度为X的寡核苷酸或经修饰的寡核苷酸的优选集为那些对应于SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:2O3(及其互补序列)的寡聚体的连续重叠集。优选地,所述寡聚体包含至少一个CpG、TpG或CpA二核苷酸。
本发明尤其优选的寡核苷酸或寡聚体为其中CpG二核苷酸(或对应的转变的TpG或CpA二核苷酸)序列的胞嘧啶位于该寡核苷酸的中部三分之一的那些;即其中该寡核苷酸例如是13个碱基长,则CpG、TpG或CpA二核苷酸位于从5’端起的第五至第九氨基酸。
本发明的寡核苷酸也可通过将该寡核苷酸化学连接至一个或多个部分或偶联物进行修饰,以提高该寡核苷酸的活性、稳定性或检测。这类部分或偶联物包括生色团,荧光团,诸如胆固醇、胆酸、硫醚、脂族链、磷脂的脂类,多胺,聚乙二醇(PEG),棕榈基部分以及其它例如公开在美国专利5,514,758、5,565,552、5,567,810、5,574,142、5,585,481、5,587,371、5,597,696和5,958,773中的。所述探针也可以为PNA(肽核酸)的形式,其具有特别优选的配对性能。因此,所述寡核苷酸可以包括其它附加的基团、例如肽,并可以包括杂交触发的切割剂(Kro1等人,BioTechniques6:958-976,1988)或插入剂(Zon,Pharm.Res.5:539-549,1988)。为此,所述寡核苷酸可以被偶联至另一分子,例如生色团、荧光团、肽、杂交触发的交联剂、转运剂、杂交触发的切割剂等。
所述寡核苷酸也可以包含至少一种已知的修饰的糖和/或碱基部分,或可以包含修饰的主链或非天然核苷间键。
根据本发明的特定实施方案,所述寡核苷酸或寡聚体通常被用在“集”中,其含有至少一个寡聚体,用于分析选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167以及互补序列的基因组序列的每个CpG二核苷酸,或经处理的核酸SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列内对应的CpG、TpG或CpA二核苷酸。但是,预期出于经济或其它因素,可优选分析所述序列内有限选择的CpG,并相应地改变所述寡核苷酸集的容量。
因此,在特定实施方案中,本发明提供含有至少两(2)个(寡核苷酸和/或PNA寡聚体)的集,可用于检测经处理的基因组DNA(SEQ IDNOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ IDNOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ IDNOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ IDNOS:168至SEQ ID NO:203)或基因组DNA(SEQ ID NOS:1至SEQ IDNO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOD:159至SEQ IDNO:167及其互补序列)中的胞嘧啶甲基化状态。这些探针使得诊断、分类和/或治疗肝和/或结肠直肠细胞增殖性病症的遗传和表观遗传参数成为可能。这套寡聚体也可以用于检测经处理的基因组DNA(SEQID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQID NOS:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ IDNO:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ IDNOS:168至SEQ ID NO:203)中,或基因组DNA(SEQ ID NOS:1至SEQII NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ IDNOS:167及其互补序列)中的单核苷酸多态性(SNPs)。
在优选的实施方案中,至少一种,更优选寡核苷酸集的所有成员都被结合至固相。
在其它实施方案中,本发明提供含有至少两(2)个核苷酸的集,他们被用作“引物”寡核苷酸用于扩增SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列或其片段之一的DNA序列。
预期所述寡核苷酸可以构成整个或部分“阵列”或“DNA芯片”(即,结合到固相的不同寡核苷酸和/或PNA-寡聚体的排列)。这种不同核苷酸和/或PNA-寡聚体序列的阵列的特征可例如在于在固相上以矩形或六角形点阵排列。所述固相表面可以由硅、玻璃、聚苯乙烯、铝、钢、铁、铜、镍、银或金构成。也可以使用硝酸纤维素以及塑料如尼龙,其可以以沉积物的形式或作为树脂基质存在,也可以被使用。寡聚体阵列制备方面现有技术的综述可从Nature Genetics的特别版(Nature Genetics Supplement,Volume21,January1999,及其中所引用的文献)获得。荧光标记的探针通常用于扫描固定化的DNA阵列。将Cy3和Cy5染料简单的附着到特定探针的5’-OH上对于荧光标记物尤其适用。对杂交的探针荧光的检测可以例如通过共聚焦显微镜进行。Cy3和Cy5染料以及很多其它的染料都是可商购的。
还预期所述寡核苷酸或其特定序列可以构成“虚拟阵列”的全部或部分,其中所述寡核苷酸或其特定序列用作例如“指定物(specifier)”,作为独特的被标记探针的多样群的一部分,或与其组合来分析被分析物的复杂混合物。这种方法例如描述在US2003/0013091(美国序列号09/898,743,2003年1月16日公开)中。在这些方法中,产生足够多的标记物,以便该复杂混合物(即每种分析物)中的每种核酸可被独特标记物唯一结合,从而被检测(每种标记物是直接计数的,获得混合物中每种分子的数字读出值)。
尤其优选的是,本发明的寡聚体被至少用于以下用途之一:检测、检测并区分亚型、诊断、预后、治疗、监测、以及治疗并监测肝和/或结肠直肠细胞增殖性病症。这通过使用所述集来检测或检测并区分下列组织类型中的一种或多种来实现:结肠直肠癌、结肠癌、炎性结肠组织、小于1cm的2级发育异常结肠腺瘤、大于1cm的3级发育异常结肠腺瘤、正常的结肠组织、非结肠健康组织以及非结肠癌组织。
尤其优选的是实施例中的那些寡聚体集。
在所述方法的最优选实施方案中,确定是否存在细胞增殖性病症,最优选确定瘤性细胞增殖或将其与良性病症区分开。这通过分析至少一种包含至少一个CpG位置的靶序列的甲基化状态来实现,其中所述序列包含或在严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列的序列的至少16个连续核苷酸。本发明还提供通过分析胞嘧啶甲基化和单核苷酸多态性来确定个体中基因组序列SEQ IDNOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的遗传和/或表观遗传参数的方法。所述方法包括使从所述个体获得的生物样品中包含SEQ ID NOS:1至SEQ IDNO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的核酸与至少一种试剂或成组试剂接触,其中所述试剂或成组试剂区分所述靶核酸内的甲基化和非甲基化CpG二核苷酸。
在优选的实施方案中,所述方法包括以下步骤:在第一步中,获得待分析的组织样品。该来源可以是任何适合的来源,例如细胞系、组织学切片、活检组织、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液分离的细胞及其所有可能的组合。优选地,DNA的所述来源为粪便或体液,选自结肠流出物、尿、血浆、血清、全血、分离的血细胞、分离自血液的细胞。
然后从所述样品分离基因组DNA。可通过现有技术中的任何标准手段来分离,包括使用可商购的试剂盒。简言之,当目的DNA被包裹在细胞膜中时,该生物样品必须被破碎并通过酶、化学或机械手段被裂解。随后例如通过蛋白激酶K的消化而清除蛋白和其它的污染物。接着从溶液回收基因组DNA。这可以通过各种方法来实现,包括盐析、有机提取或将DNA结合到固相支持物。对方法的选择会受到多种因素的影响,包括时间、费用和所需的DNA的量。
当所述样品DNA未被包裹在细胞膜中时(例如来自血液样品的循环DNA),可以使用现有技术中分离和/或纯化DNA的标准方法。这些方法包括使用蛋白降解试剂,例如离液盐,如盐酸胍或脲;或去污剂,如十二烷基磺酸钠(SDS)、溴化氰。其它方法包括但不限于乙醇沉淀或丙醇沉淀、通过离心的真空浓缩等。本领域技术人员也可以利用装置,例如诸如超滤的滤器,硅表面或膜,磁性颗粒,聚苯乙烯颗粒,聚苯乙烯表面,带正电荷的表面以及带阳性电荷的膜,带电膜,带电表面,带电转换膜,带电转换表面。
一旦核酸被提取,就将基因组双链DNA用于分析。
在所述方法的第二步中,将所述基因组DNA样品处理以使得在5’位未甲基化的胞嘧啶碱基被转变为尿嘧啶、胸腺嘧啶或在杂交行为上不用于胞嘧啶的另一碱基。这应被理解为本文所述的“预处理”或“处理”。
这优选通过亚硫酸氢盐试剂处理来实现。术语“亚硫酸氢盐试剂”指包括亚硫酸氢盐、亚硫酸氢盐(disulfite)、酸式亚硫酸盐或其组合的试剂,如这里所公开的可用于区分甲基化和未甲基化的CpG二核苷酸序列。所述处理在本领域中是已知的(例如PCT/EP2004/011715,通过参考将其整体并入本文)。优选地,该亚硫酸氢盐处理在变性溶剂存在下进行,所述变性溶剂诸如但不限于正烷基二醇,尤其是二乙二醇二甲基醚(DME),或者在二烷或二烷衍生物存在下进行。在优选的实施方案中,所述变性溶剂以1%至35%(v/v)的浓度使用。还优选该亚硫酸氢盐反应在清除剂存在下进行,例如但不限于色原烷衍生物,如6-羟基-2,5,7,8,-四甲基色原烷2-羧酸或三羟基苯甲酸及其衍生物,例如没食子酸(参见:PCT/EP2004/011715,将其整体通过参考并入本文)。该亚硫酸氢盐转变优选在30℃至70℃的反应温度下进行,其中在反应期间温度短时间地增加至超过85℃(参见:PCT/EP2004/011715,将其整体通过参考并入本文)。经亚硫酸氢盐处理的DNA优选在定量之前进行纯化。这可通过任何现有技术中已知的方法来进行,例如但不限于超滤,优选通过Microcon^(TM)柱(由Millipore^(TM)生产)进行。该纯化根据改良的制造商的方案进行(参见:PCT/EP2004/011715,将其整体通过参考并入本文)。
在所述方法的第三步中,采用本发明的成套引物寡核苷酸以及扩增酶扩增经处理的DNA的片段。可在同一个反应容器中同时进行几种DNA片段的扩增。通常,该扩增反应采用聚合酶链式反应(PCR)进行。优选地,所述扩增产物的长度为100至2,000个碱基对。所述成套的引物寡核苷酸包括至少两种寡核苷酸,每一种的序列都反向互补于、相同于、或在严紧或高度严紧条件下杂交SEQ ID NOS:10至SEQID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOs:38至SEQID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQID NO:203及其互补序列之一的碱基序列的至少16个碱基长的片段。
在所述方法的其它实施方案中,至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的核酸序列内预选的CpG位置的甲基化状态可以通过使用甲基化特异的引物寡核苷酸来检测。这项技术(MSP)已描述在授予Herman的美国专利6,265,171中。使用甲基化状态特异引物来扩增经亚硫酸氢盐处理的DNA使得能区分甲基化和未甲基化的核酸。MSP引物对含有至少一个杂交经亚硫酸氢盐处理的CpG二核苷酸的引物。因此,所述引物的序列包含至少一个CpG二核苷酸。特异于未甲基化DNA的MSP引物在CpG的C位置处含有“T”。优选地,因而所述引物的碱基序列需要包含具有至少9个核苷酸长度的序列,其杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ IDNOS:28至SEQ ID NO:33、SEQ ID NOS.30至SEQ ID NO:31、SEQ IDNOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ IDNOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一,其中所述寡聚体的碱基序列包含至少一个CpG二核苷酸。本发明进一步优选的实施方案包括使用阻断寡核苷酸(HeavyMethylTM测定)。对这类阻断寡核苷酸的使用已由Yu等人,BioTechniques23:714-720,1997描述。阻断探针寡核苷酸与PCR引物同时杂交至经亚硫酸氢盐处理的核酸。该核酸的PCR扩增在阻断探针的5’位置处终止,以便在存在互补于阻断探针的序列时核酸的扩增被抑制。所述探针可以被设计为以甲基化状态特异的方式杂交经亚硫酸氢盐处理的核酸。例如,为了检测未甲基化核酸群内的甲基化核酸,对在所讨论位置处未甲基化的核酸的扩增的抑制可通过使用阻断探针进行,该阻断探针在所讨论位置处包含“CpA”或“TpA”,这与希望抑制甲基化核酸的扩增时的“CpG”相反。
对于采用阻断寡核苷酸的PCR方法来说,有效破坏聚合酶介导的扩增需要阻断剂不被聚合酶延伸。优选地,这通过使用3’-脱氧寡核苷酸阻断剂或在3’位具有除“自由”羟基基团之外的衍生的寡核苷酸阻断剂来实现。例如,3’-O-乙酰基寡核苷酸为阻断分子的优选类别的代表。
此外,应排除聚合酶介导的阻断寡核苷酸降解。优选地,这种排除包括使用缺少5’-3’外切酶活性的聚合酶,或者使用修饰的阻断寡核苷酸,其例如在其5’末端具有硫酯桥,这赋予该阻断分子核酸酶抗性。特定的应用可以不需要阻断剂的这种5’修饰。例如,如果阻断和引物结合位点重叠因而防止了引物的结合(例如,阻断剂过量),则阻断寡核苷酸的降解将基本上防止。这是因为聚合酶不会向前延伸引物并穿过(5’-3’方向)阻断剂-一种通常导致杂交的阻断寡核苷酸降解的过程。
出于本发明的目的以及如这里所实施的,尤其优选的阻断剂/PCR实施方案包括使用肽核酸(PNA寡聚体作为阻断寡核苷酸。这种PNA阻断寡聚体极好地适合,因为它们不被降解也不被聚合酶延伸。
优选地,因此所述阻断寡核苷酸的碱基序列要求包含具有至少9个核苷酸长度的序列,其杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOs:168至SEQ ID NO:203及其互补序列之一,其中。所述寡核苷酸的碱基序列包含至少一个CpG、TpG或CpA二核苷酸。
通过扩增获得的片段可携带有可直接或间接地检测的标记物。优选的是,标记物为荧光标记物、放射性核素或可附着的分子片段的形式,该可附着的分子片段通常具有可在质谱中检测的质量。当所述标记物为质谱标记物时,优选的是标记的扩增产物具有单个阳性或阴性净电荷,使得能在质谱仪中更好地被检测。可通过例如基质辅助激光解吸/电离质谱(MALDI)或使用电喷雾质谱(ESI)来检测和观察。
基质辅助激光解吸/电离质谱(MALDI-TOF)为分析生物分子非常有效的进展(Karas&Hillenkamp,Anal Chem.,60:2299-301,1988)。分析物被包埋在吸收光的基质中。该基质被短激光脉冲蒸发,由此以非片段化的方式将分析物分子输送进蒸气相。该分析物通过与基质分子的碰撞而被离子化。施加的电压加速该离子进入无场飞行管。由于它们不同的质量,离子以不同的速率被加速。小离子比大离子更快到达检测器。MALDI-TOF质谱很适于分析肽和蛋白。对核酸的分子稍有些困难(Gut&Beck,Current Innovations and Future Trends,1:147-57,1995)。核酸分析的敏感性大约比肽小100倍,并且与增加的片段大小成反比。此外,对于具有多个负电荷的主链来说,经由基质的离子化过程明显效率较低。在MALDI-TOF质谱中,对基质的选择极其关键。对于肽的解吸,已发现了几种非常有效的基质,其产生极好的结晶作用。现在有几种用于DNA的应答基质,但是,在肽和核酸之间敏感性的差异并没有被消除。然而敏感性的差异可通过化学修饰DNA使其变得更加类似于肽来减少。例如,采用简单的烷基化化学,硫代磷酸酯(phosphorothioate)核酸(其中通常的磷酯主链被硫代磷酸酯(thiophosphate)替换)可被转变进电中性的DNA中(Gut&Beck,NucleicAcids Res.23:1367-73,1995)。将电荷标签连接到这种经修饰的DNA导致MALDI-TOF敏感性增加至肽的水平。电荷标签的其它优点为克服杂质的增加的分析稳定性,其中杂质使得检测未修饰的底物明显更加困难。
在所述方法的第四步中,分析在所述方法的第三步中获得的扩增产物,以便确定处理之前CpG二核苷酸的甲基化状态。
在通过MSP扩增获得扩增产物的实施方案中,根据所述引物的碱基序列,扩增产物存在与否自身就表明了由该引物覆盖的CpG位置的甲基化状态。
通过标准和甲基化特异PCR获得的扩增产物均可以通过基于碱基的方法进一步分析,例如但不限于阵列技术和基于探针的技术,以及通过诸如测序和模板指导延伸的技术。
在所述方法的一个实施方案中,在第三步中合成的扩增产物随后杂交至寡核苷酸和/或PNA探针阵列或寡核苷酸和/或PNA探针集。这种情况下,杂交按如下方式进行:杂交过程中使用的探针集优选由至少两个寡核苷酸或PNA寡聚体组成;在该过程中,扩增产物用作探针,其杂交之前结合到固相的寡核苷酸;随后除去未杂交的片段;所述寡核苷酸含有至少一个具有至少9个核苷酸长度的碱基序列,其逆向互补或相同于在本发明序列表中给出的碱基序列的片段;并且所述片段包含至少一个CpG、TpG或CpA二核苷酸。杂交核酸的杂交部分的长度典型地为至少9、15、20、25、30或35个核苷酸。但是,更长的分子具有本发明的应用,因此也落入本发明的范围内。
在优选的实施方案中,所述核苷酸存在于所述寡聚体的中间三分之一内。例如,当所述寡聚体包含一个CpG二核苷酸时,所述二核苷酸优选为13聚体的从5’端起的第五至第九核苷酸。对于选自SEQ IDNOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ IDNOS:159至SEQ ID NO:167的序列内的每一CpG二核苷酸以及SEQID NOS:10至SEQ ID NO.15、SEQ ID NOS:28至SEQ ID NO.33、SEQID NOs:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQID NOS:168至SEQ ID NO:203内的等同位置,均存在一种寡核苷酸用于其分析。
所述寡核苷酸也可以以肽核酸的形式存在。然后除去未杂交的扩增产物。随后检测杂交的扩增产物。这种情况下,优选地,连接到扩增产物的标记物在固相的寡核苷酸所处的每个位置处均可鉴别。
在其它实施方案中,CpG位置的基因组甲基化状态可以通过与PCR扩增引物(其中所述引物可以是甲基化特异的或标准的)同时杂交经亚硫酸氢盐处理的DNA的寡核苷酸探针(如上所详述的)来确定。
在该方法的尤其优选的实施方案中,使用采用双标记的荧光寡核苷酸探针(TaqManTM PCR,采用ABI Prism7700Sequence DetectionSystem,Perkin Elmer Applied Biosystems,Foster City,California)的基于荧光的实时定量PCR(Heid等人,Genome Res.6:986-994,1996;还参见美国专利6,331,393)。该TaqManTM PCR反应采用不可延伸的探测寡核苷酸,称为TaqManTM探针,在优选的实施方案中,其被设计为与位于正向和反向扩增引物之间的富含CpG的序列杂交。该TaqManTM探针还包含荧光“报道物部分”和“淬灭部分”,它们共价连接到附着于所述TaqManTM寡核苷酸的核苷酸的接头部分(例如亚磷酰胺)。为了在亚硫酸氢盐处理后分析核酸内的甲基化,需要探针为甲基化特异的,如美国专利6,331,393(通过参考将其整体并入本文)中所述,也被称为MethyLightTMTM测定。也适用于本发明的TaqManTM检测方法的变化包括使用双探针技术(LightcyclerTM)或荧光扩增引物(SunriseTM技术)。这两种技术均可被改变以适用于经亚硫酸氢盐处理的DNA,以及用于CpG二核苷酸内的甲基化分析。
在所述方法的进一步优选的实施方案中,所述方法的第四步包括使用模板指导的寡核苷酸延伸,如Gonzalgo&Jones,Nucleic Acids Res25:2529-2531,1997描述的MS-SNuPE。
在所述方法的其它实施方案中,所述方法的第四步包括对所述方法第三步中产生的扩增产物测序和随后的序列分析(Sanger F.等人,Proc Natl Acad Sci USA74:5463-5467,1977)。
最佳方案
在所述方法的最优选的实施方案中,所述基因组核酸根据上述方法的前三步骤被分离和处理,即:
a)从个体获得具有个体基因组DNA的生物样品;
b)提取或以其它方式分离所述基因组DNA;
c)用一种或多种试剂处理b)的基因组DNA或其片段,以将在5’位未甲基化的胞嘧啶碱基转变为尿嘧啶或在杂交性能方面可检测地不同于胞嘧啶的另一碱基;以及其中
d)c)中处理之后的扩增以甲基化特异的方式进行,即通过甲基化特异的引物或阻断寡核苷酸,以及进一步地,其中
e)对扩增产物的检测是通过实时检测探针来进行,如上所述。
优选地,当d')的随后扩增通过如上所述的甲基化特异引物的方式进行时,所述甲基化特异的引物包含具有至少9个核苷酸长的序列,该序列杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQID NOS:28至SEQ ID N0:33、SEQ ID NOS:30至SEQ ID N0:31、SEQID NS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ IDNOS:50至SEQ ID NO:51、SEQ ID NOs:l68至SEQ ID NO:203及其互补序列之一,其中所述寡聚体的碱基序列包含至少一个CpG二核苷酸。
所述方法的步骤e),即对表明SEQ ID NOS:l至SEQ ID NO:3、SEQ ID NO:24、SEQ ID N0:28、SEQ ID NOS:159至SEQ ID NO:167中至少一种序列的一个或多个CpG位置甲基化状态的特异扩增产物的检测通过如上所述的实时检测方法进行。
本发明的其它实施方案提供无需亚硫酸氢盐转变的分析本发明基因组DNA(SEQ ID NOs:1至SEQ ID NO:3、SEQ ID NO:24、SEQ IDNO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列、)甲基化状态的方法。现有技术中已知这样的方法,包括但不限于DMH,其中甲基化敏感的限制酶试剂或包含甲基化敏感限制酶试剂的一系列限制酶试剂被用于确定甲基化,该甲基化敏感限制酶试剂可区分靶区域内甲基化和未甲基化CpG二核苷酸。
在这种其它实施方案的第一步中,从组织或细胞源分离基因组DNA。基因组DNA可以通过现有技术中任何标准手段分离,包括使用可购得的试剂盒。简言之,当目的DNA被包裹在细胞膜中时,该生物样品必须被破碎并通过酶、化学或机械手段被裂解。随后例如通过蛋白激酶K的消化而清除蛋白和其它的污染物。接着从溶液回收该基因组DNA。这可以通过各种方法来实现,包括盐析、有机提取或将DNA结合到固相支持物。对方法的选择会受到多种因素的影响,包括时间、费用和所需的DNA的量。所有的临床样品种类,包括瘤性物质或潜在瘤性物质,都适合用在本发明方法中,优选的为细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,及其组合。体液为优选的DNA源;尤其优选的为血浆、血清、全血、分离的血细胞和从血液分离的细胞。
一旦核酸被提取后,基因组双链DNA就被用在分析中。
在优选的实施方案中,所述DNA可以在用甲基化敏感的限制酶处理前被切割。这类方法在现有技术中是已知的,可以包括物理和化学手段。尤其优选的是使用一种或多种非甲基化敏感的限制酶,且它们的识别位点富含AT并且不包含CG二核苷酸。这类酶的使用使得能在片段化的DNA中保留CpG岛和富含CpG的区域。所述非甲基化特异的限制酶优选地选自MseI、BfaI、Csp6I、Tru1I、Tvu1I、Tru9I、Tvu9I、MaeI和XspI。尤其优选的是使用两种或三种这类酶。尤其优选的是使用MseI、BfaI和Csp6I的组合。
片段化的DNA随后可被连接到接头寡核苷酸,以有利于随后的酶法扩增。将寡核苷酸连接到平末端和粘性末端的DNA片段在现有技术中是已知的,通过使末端去磷酸化(例如使用牛或虾碱性磷酸酶)并随后在dATPs存在下使用连接酶(例如T4DNA连接酶)连接来完成。所述的接头寡核苷酸通常为至少18个碱基对长。
在第三步中,随后用一种或多种甲基化敏感的限制酶消化所述DNA(或其片段)。进行所述消化以使得DNA在限制位点的水解提供至少一种选自Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQIDNO:165的基因或基因组序列的特定CpG二核苷酸的甲基化状态信息。
优选地,甲基化特异的限制酶选自BsiEI、HgaIHinPI、Hpy99I、AvaI、BceAI、Bsa HI、BisI、BstUI、Bshl236I、AccII、BstFNI、McrBC、GIaI、MvnI、HpaII(HapII)、HhaI、AciI、SmaI、HinPlI、HpyCH4IV、EagI以及以上两种或多种酶的混合物。优选的是含有限制酶BstUI、HpaII、HpyCH4IV和HinPlI的混合物。
在第四步中,其为任选但优选的实施方案,所述限制性片段被扩增。这可通过聚合酶链式反应来进行,并且所述扩增产物可以带有如上所述适合的检测标记物,即荧光标记物、放射性核素以及质谱标记物。尤其优选的是通过扩增酶和至少两种每一种都包含至少16个核苷酸长的连续序列的引物来扩增,所述连续序列互补于或在中等严紧或严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列及其互补序列的序列。优选地,所述连续序列为至少16、20或25个核苷酸长。在其它实施方案中,所述引物可以互补于连接到所述片段的任何接头。
在第五步中,检测所述扩增产物。该检测可以使现有技术中的任何标准手段,例如但不限于凝胶电泳分析、杂交分析、将可检测标记物掺入PCR产物内、DNA阵列分析、MALDI或ESl分析。优选地,所述检测通过杂交至少一种每一个都包含至少16个核苷酸长的连续序列的核酸或肽核酸进行,所述连续序列互补于或在中等严禁或严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQID NO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列的序列。优选地,所述连续序列为至少16、20或25个核苷酸长。
在确定所述基因组核酸的甲基化状态或水平之后,基于至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸序列的甲基化状态或水平,或反映至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的多个CpG二核苷酸序列的平均甲基化状态的均值或值来推定细胞增殖性病症是否存在或其类别,其中甲基化与瘤性或瘤前细胞增殖性病症相关。当所述甲基化通过定量手段确定时,用于确定所述甲基化存在的临界值优选为零(即当样品表现出任何程度的甲基化时,确定为在分析的CpG位置具有甲基化的状态)。然而,可预知本领域技术人员可能希望调整所述临界值以便为测定提供特别优选的敏感性或特异性。相应地,所述临界值可以提高(因此提高特异性),所述临界值可以在0%-5%、5%-10%、10%-15%、15%-20%、20%-30%或30%-50%的范围内。尤其优选的是临界值10%、15%、25%以及30%。
在所述方法的其它实施方案中,其中成组基因包含Septin9或其截短的转录本Q9HC74和至少一种选自FOXL2、NGFR、TMEFF2、SIX6、SARM1、VTN和ZDHHC22的基因,在确定所述基因组核酸的甲基化状态之后,根据SEQ ID NO:1的至少一个CpG二核苷酸序列和SEQ ID NO:24至SEQ ID NO:29的至少一个CpG二核苷酸序列的甲基化状态,或反映其多个CpG二核苷酸的平均甲基化状态的均值或值来推定是否存在细胞增殖性病症或其亚型,尤其是肝和/或结肠直肠细胞增殖性病症,其中甲基化与癌症,尤其是肝和/或结肠直肠癌相关。
细胞增殖性病症的诊断和预后测定
本发明使得能够诊断不利于患者或个体的事件,其中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列内的重要遗传和/或表观遗传参数可以用作标志物。通过本发明方法获得的所述参数可以与另一套遗传和/或表观遗传参数进行比较,其差异用作不利于患者或个体的事件的诊断和/或预后的基础。
更具体地,本发明使得能够筛选风险人群以早期检测癌症,最优选的是肝癌和/或结肠直肠癌。此外,本发明使得能够区分瘤性(例如恶性肿瘤)和良性(非癌性)细胞增殖性病症。例如,其使得能区分结肠直肠癌和小细胞结肠腺瘤或息肉。瘤性细胞增殖性病症在至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列内表现降低的甲基化(即降低的表达),与不表现降低的甲基化的所述良性病症相反。
具体地,本发明提供癌症诊断和分类测定法,其基于对至少一种包含CpG二核苷酸的选自SEQ ID NOS:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的基因的一个或多个CpG二核苷酸的差异表达的测量。通常,这种测定包括从个体获得样品,进行测定以衡量至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的表达,优选地通过确定衍生自所述样品的至少一种选自SEQ ID NOS:1至SEQID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ IDNO:167的序列的相对于对照样品或已知标准品的甲基化状态,并由此做出诊断。
在特别优选的实施方案中,本发明的寡聚体被用于评估CpG二核苷酸的甲基化状态,例如基于SEQ ID NOS:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ IDNOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ IDNOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ IDNOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ IDNOS:168至SEQ ID NO:203的那些或其阵列,以及位于基于它们的试剂盒中并且可用于细胞增殖性病症的诊断和/或分类。
试剂盒
此外,本发明的另一方面是试剂盒,其包括:用于确定至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的甲基化的组件。所述用于确定甲基化的组件优选包括含亚硫酸氢盐的试剂;一种或多种寡核苷酸,其每一种的序列都相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:3O至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列的9或更优选18个碱基长的片段;以及优选地,用于进行和评估所描述的甲基化分析方法的说明书。在一个实施方案中,所述寡核苷酸的碱基序列包含至少一个CpG、CpA或TpG二核苷酸。
在其它实施方案中,所述试剂盒还可以包括用于进行CpG位置特异的甲基化分析的标准试剂,其中所述分析包括一种或多种下列技术:MS-SNuPE、MSP、MethyLightTM、HeavyMethyl、COBRA以及核酸测序。但是,属于本发明的试剂盒还可仅含有前述组分的一部分。
在优选的实施方案中,所述试剂盒可以包含选自以下试剂的其它亚硫酸氢盐转变试剂:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺酸基缓冲液;以及DNA回收组分。
在其它实施方案中,所述试剂盒可含有包装在分开容器中的聚合酶和经优化用于例如PCR的聚合酶介导的引物延伸的反应缓冲液。在本发明的另一实施方案中,所述试剂盒还包含用于获得患者生物样品的组件。优选的是这样的试剂盒,其还包括适于盛装用于确定患者生物样品中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQID NO:165的基因或基因组序列的甲基化的组件的容器,最优选还包含使用和解释试剂盒结果的说明书。在优选的实施方案中,所述试剂盒包括:(a)亚硫酸氢盐试剂;(b)适于盛装所述亚硫酸氢盐试剂以及患者生物样品的容器;(c)至少一套包含两种寡核苷酸的引物寡核苷酸,所述每一种寡核苷酸的序列都相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列的9或更优选18个碱基长的片段;以及优选地,(d)用于使用和解释试剂盒结果的说明书。在另一优选的实施方案中,所述试剂盒包含:(a)亚硫酸氢盐试剂;(b)适于盛装所述亚硫酸氢盐试剂和患者生物样品的容器;(c)具有至少9或16个核苷酸长度的至少一种寡核苷酸和/或PNA-寡聚体,其相同于或杂交预先处理的核酸序列SEQ ID NOS:10至SEQID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQID NO:203及其互补序列之一;以及任选地,(d)关于使用和解释试剂盒结果的说明书。
在另一实施方案中,所述试剂盒包括:(a)亚硫酸氢盐试剂;(b)适于盛装所述亚硫酸氢盐试剂和患者生物样品的容器;(c)至少一套含有两种寡核苷酸的引物寡核苷酸,其每一种的序列相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ IDNO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ IDNO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ IDNO:203的9或更优选18个碱基长的片段;(d)具有至少9或16个核苷酸长度的至少一种寡核苷酸和/或PNA-寡聚体,其相同于或杂交预先处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一;以及任选地(e)关于使用和解释试剂盒结果的说明书。
所述试剂盒还可含有包装在分开容器中的其它的组分,如用于阻断、洗涤或包被的缓冲液或溶液。
用于COBRATM分析的典型试剂(例如可能在典型的基于COBRATM的试剂盒中找到)可以包括,但不限于:用于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的PCR引物;限制酶和合适的缓冲液;基因杂交寡聚体;对照杂交寡聚体;用于寡聚体探针的激酶标记试剂盒;以及标记的核苷酸。用于MethyLightTM分析的典型试剂(例如可能在典型的基于MethyLightTM的试剂盒中找到)可以包括,但不限于:用于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的经亚硫酸氢盐转化的序列的PCR引物;亚硫酸氢盐特异的探针(例如TaqManTM或LightcyclerTM);优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
用于Ms-SNuPETM分析的典型试剂(例如可能在典型的基于Ms-SNuPETM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的经亚硫酸氢盐转化的序列的Ms-SNuPETM引物;反应缓冲液(用于Ms-SNuPE反应);以及标记的核苷酸。
用于MSP分析的典型试剂(例如可能在典型的基于MSP的试剂盒中找到)可以包括,但不限于:用于选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ IDNOS:160至SEQ ID NO:165的经亚硫酸氢盐转化的序列基因或基因组序列的甲基化和未甲基化的PCR引物,优化的PCR缓冲液和脱氧核苷酸,以及特异的探针。
此外,本发明的其它方面为可供选择的试剂盒,其包括用于确定至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的甲基化的组件,其中所述组件优选包括至少一种甲基化特异的限制酶;一种或多种适于扩增包含选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的序列的引物寡核苷酸(优选一个或多个引物对);以及任选地,用于进行和评估所述的甲基化分析方法的说明书。在一个实施方案中,所述寡核苷酸的碱基序列相同于、互补于、或在严紧或高度严紧条件下杂交选自SEQ IDNOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ IDNOS:159至SEQ ID NO:167的序列的长度为至少18个碱基的片段。
在其它的实施方案中,所述试剂盒可以包括一种或多种用于分析所述消化片段的寡核苷酸探针,优选所述寡核苷酸相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的长度为至少16个碱基的片段。
在优选的实施方案中,所述试剂盒可以包括其它试剂,该其它试剂选自:缓冲液(例如限制酶、PCR、储存或洗涤缓冲液);DNA回收试剂或试剂盒(例如沉淀、超滤、亲和柱)以及DNA回收组分。
在另外的其它实施方案中,所述试剂盒可以含有包装在分开容器中的聚合酶和反应缓冲液,所述反应缓冲液被优化用于所述聚合酶介导的引物延伸,例如PCR。在本发明的另一实施方案中,所述试剂盒还包括用于获得患者生物样品的组件。在优选的实施方案中,所述试剂盒包括:(a)甲基化敏感的限制酶试剂;(b)适合于盛装所述试剂和所述患者生物样品的容器;(c)含有一种或多种肽核酸的至少一套寡核苷酸,其相同于、互补于或在严紧或高度严紧条件下杂交选自SEQID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ IDNOS:159至SEQ ID NO:167的序列的长度为至少16个碱基的片段;以及任选地(d)使用和解释试剂盒结果的说明书。
在其它优选的实施方案中,所述试剂盒包括:(a)甲基化敏感的限制酶试剂;(b)用于盛装所述试剂和患者生物样品的容器;(c)至少一套适合于扩增包含选自SEQ ID NOs:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的序列的引物寡核苷酸;以及任选地,(d)使用和解释试剂盒结果的说明书。
在另一实施方案中,所述试剂盒包括:(a)甲基化敏感的限制酶;(b)适合于盛装所述试剂和患者生物样品的容器;(c)至少一套适合于扩增包含选自SEQ ID NOs:1至SEQ ID NO:3、SEQ ID NO:24、SEQ IDNO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的序列的引物寡核苷酸;(d)至少一套包含一种或多种核酸或肽核酸的寡核苷酸,其相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOs:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的长度为至少9个碱基的片段以及任选地,(e)使用和解释试剂盒结果的说明书。
所述试剂盒还可含有包装在分开容器中的其它组分,例如缓冲液或溶液,其适合于阻断、洗涤或包被。
本发明还涉及试剂盒用于提供对个体中细胞增殖性病症是否存在的诊断中的用途,其通过甲基化敏感的限制酶分析来实现。所述试剂盒包括容器和DNA微阵列组分。所述DNA微阵列组分为一表面,在其上指定的位置固定有多种寡核苷酸,其中所述寡核苷酸包含至少一个CpG甲基化位点。至少一种所述寡核苷酸特异于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列,并且包含SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167之一的至少15个碱基对长但不超过200bp的序列。优选地,所述序列是SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167之一的至少15个碱基对长但不超过80bp的序列。进一步优选地,所述序列是SEQ ID NOS:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167之一的至少20个碱基对长但不超过30bp的序列。
所述测试试剂盒优选地还包括包含一种或多种甲基化敏感限制酶的限制酶组分。
在另一实施方案中,所述测试试剂盒的特征还在于其包含至少一种甲基化特异的限制酶,并且其中所述寡核苷酸包含所述至少一种甲基化特异的限制酶的限制性位点。
所述试剂盒还可以包含一种或几种在现有技术中已知的用于DNA富集的以下组分:蛋白组分,所述蛋白选择性结合甲基化的DNA;任选地处于适合溶液中的三链体形成核酸组分、一种或多种接头;用于进行连接的物质或溶液,例如连接酶或缓冲液;用于进行柱层析的物质或溶液;用于进行基于免疫学的富集(例如免疫沉淀)的物质或溶液;用于进行例如PCR的核酸扩增的物质或溶液;如果可与偶联剂一起使用、如果可在溶液中使用的一种或多种染料;用于进行杂交的物质或溶液;和/或用于进行清洗步骤的物质或溶液。
本发明还提供可用于检测、区分和区别结肠细胞增殖性病症的组合物。所述组合物包含至少一种18个碱基对长的核酸,其为公开在SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS.42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203中的核酸序列的片段,以及一种或多种取自以下的物质:1-5mM的氯化镁、100-500μM dNTP、O.5-5单位的taq聚合酶、牛血清白蛋白、寡聚体尤其是寡核苷酸或肽核苷酸(PNA)寡聚体,所述寡聚体的每一个都包含至少一个长度为至少9个核苷酸的碱基序列,其互补于或在中等严紧或严紧条件下杂交预处理的基因组DNA SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一。优选的是所述物质的组合物包含这样的缓冲溶液:其适合于在水溶液中稳定所述核酸并使得基于聚合酶的反应能在所述溶液中进行。适合的缓冲液在现有技术中是已知和可商购的。
在本发明进一步优选的实施方案中,所述至少一种核酸为公开在SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203中的核酸序列的至少50、100、150、200、250或500个碱基对长的片断。
本发明已经参照其某些优选实施方案具体地进行了描述,以下的实施例仅用于解释本发明,无意在本发明的原理和最广义解释的范围及其等同物内对其进行限制。
实施例
实施例1
在以下的实施例中,以下列出的序列通过MSP和/或HeavyMethyl测定来分析。该测定被设计为在LightCycler平台(Roche Diagnostics)上运行,但其它在现有技术中通常使用的这类仪器也是适合的。
MSP扩增产物通过Taqman类型荧光标记的检测探针来检测,HeavyMethyl扩增产物通过Lightcycler类型双探针来检测。
目的基因组区域:
SEQ ID NO:165
测定类型:HeavyMethyl
引物:
SEQ ID NO:249
SEQ ID NO:250
阻断剂:
SEQ ID NO:251
探针:
SEQ ID NO:252
SEQ ID NO:253
温度循环程序:
活化:95℃ 10分钟
55个循环:95℃ 10秒(20℃/s)
56℃ 30秒(20℃/s)
72℃ 10秒(20℃/s)
熔解:
95℃ 10秒20
35℃ 20秒20检测
95℃ 0秒0,1
目的基因组区域
SEQ ID NO:24
测定类型:HeavyMethyl
引物:
SEQ ID NO:254
SEQ ID NO:255
阻断剂:
SEQ ID NO:256
探针:
SEQ ID NO:257(荧光标记的)
SEQ ID NO:258(Red640标记的)
温度循环程序:
95℃ 变性
95℃ 10分钟
55个循环:
95℃ 变性10秒(20℃/s)
56℃ 退火30秒(20℃/s)
72℃ 延伸10秒(20℃/s)
熔解:
95℃ 10秒20
35℃ 20秒20
95℃ 0秒0,1
目的基因组区域
SEQ ID NO:24
测定类型HeavyMethyl
引物:
SEQ ID NO:264
SEQ ID NO:265
阻断剂:
SEQ ID NO:266
探针:
SEQ ID NO:267(荧光标记的)
SEQ ID NO:268(Red64Q标己的)
温度循环程序:
95℃ 变性
95℃ 10分钟
55个循环:
95℃ 变性10秒(20℃/s)
56℃ 退火30秒(20℃/s)
72℃ 延伸10秒(20℃/s)
熔解:
95℃ 10秒20
35℃ 20秒20
95℃ 0秒0,1
目的基因组区域:
SEQ ID NO:28
测定类型:MSP
引物:
SEQ ID NO:274
SEQ ID NO:275
Taqman探针:
SEQ ID NO:276
温度循环程序:
活化:95℃ 10分钟
55个循环:95℃ 15秒(20℃/s)
62℃ 45秒(20℃/s)
冷却:40℃ 5秒
目的基因组区域:
SEQ ID NO:1
测定类型:MSP
引物:
SEQ ID NO:277
SEQ ID NO:278
Taqman探针:
SEQ ID NO:279
温度循环程序:
活化:95℃ 10分钟
55个循环:95℃ 15秒(20℃/s)
62℃ 45秒(20℃/s)
冷却:40℃ 5秒
目的基因组区域:
SEQ ID NO:28
测定类型:MSP
引物:
SEQ ID NO:280
SEQ ID NO:281
Taqman探针:
SEQ ID NO:282
温度循环情况:
活化:95℃ 10分钟
55个循环:95℃ 15秒(20℃/s)
62℃ 45秒(20℃/s)
目的基因组区域:
SEQ ID NO:1
测定类型:MSP
引物:
SEQ ID NO:283
SEQ ID NO:284
Taqman探针:
SEQ ID NO:285
温度循环情况:
活化:95℃ 10分钟
55个循环:95℃ 15秒(20℃/s)
62℃ 45秒(20℃/s)
目的基因组区域:
SEQ ID NO:28
测定类型:HeavyMethyl
引物:
SEQ ID NO:286
SEQ ID NO:287
阻断剂:
SEQ ID NO:288
探针:
SEQ ID NO:289
SEQ ID NO:29O
温度循环情况:
95℃ 活化
95℃ 10分钟
50个循环:
95℃ 变性 10秒(20℃/s)
56℃ 退火 30秒(20℃/s)
72℃ 延伸 10秒(20℃/s)
熔解
95℃ 10秒20
40℃ 10秒20
70℃ 0秒0,1
冷却
40℃ 5秒
目的基因组区域
SEQ ID NO:1
测定类型:HeavyMethyl
引物:
SEQ ID NO:291
SEQ ID NO:292
阻断剂:
SEQ ID NO:293
探针:
SEQ ID NO:294
SEQ ID NO:295
温度循环情况:
95℃ 活化
95℃ 10分钟
50个循环:
95℃ 变性 10秒(20℃/s)
56℃ 退火 30秒(20℃/s)
72℃ 延伸 10秒(20℃/s)
熔解
95℃ 10秒20
40℃ 10秒20
70℃ 0秒0,1
冷却
40℃ 5秒
目的基因组区域
SEQ ID NO:1
测定类型:HeavyMethyl
引物:
SEQ ID NO:296
SEQ ID NO:297
阻断剂:
SEQ ID NO:289
探针:
SEQ ID NO:299
SEQ ID NO:300
温度循环情况:
95℃ 活化
95℃ 10分钟
50个循环:
95℃ 变性 10秒(20℃/s)
56℃ 退火 30秒(20℃/s)
72℃ 延伸 10秒(20℃/s)
熔解
95℃ 10秒20
40℃ 10秒20
70℃ 0秒0,1
冷却
40℃ 5秒
目的基因组区域
SEQ ID N0:166
测定类型:HeavyMethyl
引物:
SEQ ID NO:259
SEQ ID NO:260
阻断剂:
SEQ ID NO:261
探针:
SEQ ID NO:262
SEQ ID NO:263
温度循环情况:
活化:95℃ 10分钟
55个循环:95℃ 10秒
58℃ 30秒
72℃ 10秒
熔解曲线:95℃10秒
35℃ 20秒
95℃ 0秒
冷却:40℃ 5秒
目的基因组区域:
SEQ ID NO:167
测定类型:HeavyMethyl
引物:
SEQ ID NO:269
SEQ ID NO:270
阻断剂:
SEQ ID NO:271
探针:
SEQ ID NO:272
SEQ ID NO:273
温度循环情况:
95℃ 变性
95℃ 10分钟
55个循环:
95℃ 变性 10秒
56℃ 退火 30秒
72℃ 延伸 10秒
熔解
95℃ 10秒
40℃ 10秒
实施例2
进行以下的分析,以便根据对全血内DNA甲基化的分析选择适合于结肠直肠癌筛查和/或诊断的优选组(panel)。
采用测定平台(Lightcycler)和实时测定法(MSP和/或HeavyMethyl)分析每种标志物的性能,如适合于用在参照或临床实验室装置中的。在结肠直肠癌组织和全血中独立地测试每种标志物的性能,以便提供每种标志物的精确度的指示。
所述组选自以下标志物:
SEQ ID NO:376
SEQ ID NO:378
SEQ ID NO:27
SEQ ID NO:26
SEQ ID NO:24
SEQ ID NO:1
SEQ ID NO:165
SEQ ID NO:25
SEQ ID NO:28
SEQ ID NO:378
SEQ ID NO:163
每种标志物通过至少一种甲基化特异的测定法,即MSP和/或HeavyMethyl,进行分析,如表2所示。
进行以下称为C3测定的进一步测定(非甲基化特异的),以便定量每种样品中的总DNA。所述C3测定为亚硫酸氢盐DNA测定,其独立于甲基化状态检测总DNA。使用了以下的引物和探针:
引物:GGAGTGGAGGAAATTGAGAT SEQ ID NO:62
引物:CCACACAACAAATACTCAAAAC SEQ ID NO:63
探针:TGGGTGTTTGTAATTTTTGTTTTGTGTTAGGTT SEQ IDNO:64
每种测定在结肠直肠癌、正常临近组织和/或全血样品上重复运行两次,如表3所示。
采用可商购的试剂盒进行DNA提取,根据稍有修改的Olek et al.(1996)中描述的方法进行亚硫酸氢盐转化。
所有的测定(C3和甲基化特异的)都采用Lightcycler平台进行。
数据解释
DNA浓度的计算
Lightcycler仪器软件计算的Cp(交叉点值)和强度曲线被用于确定DNA浓度。对于甲基化测定和C3测定来说,都通过使每孔的CP值参照标准曲线来计算DNA浓度。
样品重复
在多数情况下,每种测定都要对每种样品运行两次,对每种样品得到多个测量结果。对于每种样品,分值计算如下:
1.计算所有样品对的比例v1/v2
2.如果二者都低于阈值0.1ng,则比例设为=,如果一个是=,而另一个高于阈值,则将比例设为100
3.对于比例超过2.5的每个测定样品不再进一步分析
4.对于不精确地具有两次重复的样品,取均值,不取任何分值甲基化百分比
采用C3测定的经测量小于1ng DNA的样品不再进一步考虑。对于每种样品,所检测的甲基化百分比被计算为采用甲基化测定定量测量的DNA浓度相对于通过C3测定定量测量的样品中DNA浓度。
在三个不同的阈值水平上(参见表)以及在所有甲基化水平上(即检测甲基化的任何样品被视为阳性)确定甲基化的检测。
每种测定的灵敏度从结肠直肠癌样品阳性检出率来确定,其中灵敏度确定为甲基化被阳性检出(即真阳性)的样品%。
每种测定的特异性从全血样品阴性检出率(即真阴性检出率)来确定,其中从所分析的样品总数中扣除假阳性。
结果
测量的甲基化位于通过单独测定各种阈值内的所分析样品的比例显示在表4(结肠直肠癌组织)、5(正常临近组织)以及6(全血)。
图30至37显示二元分布图(图的左上侧)以及测量的甲基化水平高于特定临界值(X轴)的结肠直肠癌组织和全血(以及某些情况下正常临近组织)样品的比例(Y轴)的相关多类型分布图(图的左下侧)。每张图的右侧是灵敏度相对于特异性的ROC图。ROC曲线是用于诊断测试的不同可能临界值的真阳性率相对假阳性率的图。其显示灵敏度和特异性之间取决于所选择的临界值的折中(灵敏度的任何增加将伴随有特异性的降低)。ROC曲线下面积(AUC)是对诊断测试准确性的衡量(面积越大越好,最佳是1,随机测试会具有沿对角线的ROC曲线,面积0.5;参考:J.P.Egan.Signal Detection Theory and ROC Analysis,Academic Press,New York,1975)。每个ROC图的AUC和Wilcoxon p-值显示在表12中。
阶段
根据癌症分期对结肠直肠癌结果的进一步的分析显示在表7中。在所述表中,显示了对CRC所有阶段的基于两个不同甲基化阈值(>10%和>20%)的标志物灵敏度。对于大多数标志物,灵敏度在所有CRC阶段都是一致的,所以这些标志物会适合于在筛查或监测测试中CRC所有阶段的检测。看起来在II期癌症中有灵敏度升高的趋势。灵敏度越低,更多的特异性标志物趋于鉴定更早期的癌症(例如,SEQ ID NO:25(测定3))并会增加筛查和/或监测测试的灵敏度,但也可用于其它的应用(活检,大便测试等)。
组
表8-11中显示了在结肠直肠癌和全血中通过测定组合测量甲基化位于各种阈值内的所分析样品的比例。每种情况下,表格显示了给定阈值内的样品比例,以及采用两种标志物相较于仅第一种标志物样品检测的改进。
实施例3
进行以下的分析,以证实基因Septin9(包括其转录本变体Q9HC74)及其组为用于结肠直肠癌筛查和/或诊断的适合的标志物,其基于在全血中的DNA甲基化分析,通过在大量样品组中验证测定的性能.
标志物的性能通过采用测定平台(Lightcycler)和实时测定法(MSP和/或HeavyMethyl)来分析,如适合于用在参照或临床实验室装置中的。在结肠直肠组织(正常的临近组织)、结肠直肠癌组织和全血中独立地测试每种标志物的性能,以便提供对标志物精确性的指示。
采用了以下的引物和探针:
采用表2的Lightcycler探针的SEQ ID NO:1(测定7)采用以下方案进行:
DNA
LightCycler程序:
采用表2Taqman探针的SEQ ID NO:1(测定7)采用以下方案进行:
方案:
循环条件
进行C3测定以定量每种样品中的总DNA。该C3测定如以上实施例2进行。
每种测定在结肠直肠癌、正常临近组织和/或全血样品上重复进行两次。分析了两组样品,样品组1显示在表13中,样品组2显示在表14中。
样品组1采用以下测定进行分析,如表2中详述的:
SEQ ID NO:1(测定2)
SEQ ID NO:26(测定6)
SEQ ID NO:24(测定5)
SEQ ID NO:25(测定3)
样品组2采用以下测定进行分析,如表2中详述的:
SEQ ID NO:1(测定7)LightCycler(LC)和Taqman(Taq)变体以及以下的测定
SEQ ID NO:28(测定2)
SEQ ID NO:24(测定5b)
SEQ ID NO:29(测定2b)
如表7中所详述的。
仅分析含有大于4ng DNA的样品。在样品组1中,分析了27个血液样品和91个结肠直肠癌样品。在样品组2中,分析了26个血液样品,22个非临近的结肠直肠样品以及81个结肠直肠癌样品。
所有的测定(C3和甲基化特异的)均采用Lightcycler平台进行。
DNA提取知亚硫酸氢盐处理
按照制造商的说明通过Magna Pure方法(Roche)从所有的样品中分离DNA。然后根据以下的亚硫酸氢盐反应转化从纯化中得到的流出物。使流出物与354μl的亚硫酸氢盐溶液(5.89mol/1)和146μl的含有自由基清除剂的二氧杂环己烷((98.6mg的6-羟基-2,5,7,8-四甲基色原烷2-羧酸在2.5ml二氧杂环己烷中))混合。在99℃下使反应混合物变性3分钟,然后在以下温度程序下孵育总共7h分钟5O℃;一次热峰值(99.9℃)3分钟;1.5h50℃;一次热峰值(99℃)3分钟;3h50℃。随后采用Millipore MicroconTM柱通过超滤纯化反应混合物。基本上按照制造商的说明书进行纯化。为此,使反应混合物与300μl的水混合、上样到超滤膜、离心15分钟,接着以1x TE缓冲液洗涤。在这种处理中DNA仍保留在膜上。然后进行脱磺酸基。为此,加入0.2mol/lNaOH并孵育10分钟。然后顺序进行离心(10分钟)和1x TE缓冲液的洗涤步骤。此后,洗脱DNA。为此,使膜与75μl加热的1x TE缓冲液(50℃)混合10分钟。按照制造商的说明书将膜翻转。随后进行重复的离心,以此使DNA从膜移开。10μl的流出物被用于Lightcycler实时PCR测定。
反应溶液和热循环条件
SEQ ID NQ:26测定6(HeaVvMethyl测定)
反应溶液:
水
热循环条件:
SEQ ID NO:25测定3(HeavvMethvl测定)
反应溶液:
水
热循环条件:
SEQ ID NO:24Assay5B(HeayvMethyl Assay)
反应溶液:
水
热循环条件:
SEQ ID NO:24测定5(HeavvMethyl测定)
反应溶液:
水
热循环条件:
SEQ ID NO:1测定2(MSP测定)
反应溶液:
水(3315932)
热循环条件:
SEQ ID NQ:1测定7(LiqhtCycler探针HeawMethyl测定)
反应溶液:
水
SEQ ID NO:1测定7(Taqman HeavyMethyl测定)
反应溶液:
水
热循环条件:
SEQ ID NO:28测定2(HeavyMethy)测定)
反应溶液:
水
热循环条件:
SEQ ID NO:29测定2B(HeavvMethyl测定)
反应溶液:
水
热循环条件:
S EQ ID NO:29测定2(HeavvMethyl测定)
反应溶液:
水
热循环条件:
数据解释
DNA浓度的计算
Lightcycler仪器软件计算的Cp(交叉点值)被用于确定DNA浓度。对于甲基化测定和C3测定来说,都通过使每孔的CP值参照标准曲线来计算DNA浓度
在多数情况下,每种测定都要对每种样品运行两次,对每种样品得到多个测量结果。
甲基化百分比
采用C3测定的经测量小于4ng DNA的所有样品不再进一步考虑。对于每种样品,所检测的甲基化百分比被计算为采用甲基化测定定量测量的DNA浓度相对于通过C3测定定量测量的样品中DNA浓度。
在多个个不同阈值水平上(参见表)以及在所有甲基化水平上(即检测甲基化的任何样品均被视为阳性)确定甲基化的检测。
每种测定的灵敏度从结肠直肠癌样品阳性检出率来确定,其中灵敏度确定为甲基化被阳性检出(即真阳性)的样品%。
每种测定的特异性从全血样品阴性捡出率(即真阴性检出率)来确定,其中从所分析的样品总数中扣除假阳性。
结果
各个测定法测量的甲基化位于给定阈值内的经分析样品的比例或数量显示在表15(样品组1)和16(样品组2)中。其中至少两次重复的一次在给定阈值内测试为阳性,则该样品被认为是阳性。通过确定使用该组的至少一种测定被测量为具有给定阈值内的甲基化的被分析样品的比例或数量来汇编该组数据。当两个重复中的至少一个被测试为给定阈值内的阳性时,则该样品被认为是阳性。
在14个乳腺癌样品、12个结肠直肠癌样品和10个全血样品(样品组3)中进一步测试SEQ ID NO:1测定2。各个测定法测量的甲基化位于给定阈值内的经分析样品的比例或数量显示在表18中。
实施例4:其它癌症
进行以下的分析,以证实基因Septin9(包括其转录本变体Q9HC74)及其组为用于筛查和/或诊断其它癌症的适合的标志物,其基于在全血中的DNA甲基化分析,通过在大量样品组中验证测定的性能。
采用表2的SEQ ID NO:1HeavyMethyl测定7分析标志物的性能,反应条件按照实施例2。
表20显示了在每类中测试的样品数量,以及两次重复测定甲基化为阳性的样品的数量。图3显示了在其它癌症中测量的甲基化水平,可以看到该基因在多种类型的癌症中被甲基化。但是,只有肝癌以等于或高于结肠直肠癌的比例甲基化。图4显示了在其它非癌疾病中测量的甲基化水平,可以看出只有肾盂肾炎以等于或高于结肠直肠癌的比例被甲基化。
实施例5:亚硫酸氢盐测序
Septin9基因的测序
据推测Septin9具有4(参见之前关于Ensembl数据库的讨论)至至少6个不同的转录本变体(在5’端,参见Russell,Oncogene.2001Sep13;20(41):5930-9)。对于Russell等人所提及的变体,扩增子被设计为覆盖四种变体(α、β、γ和ε)的CpG岛或富含CpG区域。有两个CpG岛重叠2个变体,ε和γ。β变体看起来被γCPG岛调节。
分析了来自12患者的样品,Septin9甲基化的水平已通过HeavyMethyl分析被定量,如上所述。两个样品具有大于20%的甲基化(样品C组),4个样品具有l0%至20%甲基化(样品B组)以及6个样品具有之前显示了至多10%甲基化(样品A组)。
此外,来自没有明显疾病的个体的3个全血样品的DNA也用于α和β扩增子(样品N组)。
DNA提取和亚硫酸氢盐处理
采用QIAGEN Genomic-Tip500/G或100/G,按照制造商的说明书分离DNA。随后根据以下的亚硫酸氢盐反应转化所纯化的基因组DNA。
100μl中的2μlDNA与354μl的亚硫酸氢盐溶液(22ml无核酸酶水中10.36g亚硫酸氢钠和2.49g亚硫酸钠)以及含有自由基清除剂(6-羟基-2,5,7,8-四甲基色原烷2-羧酸,8.2ml二烷中323mg)的146μl二烷混合。该亚硫酸氢盐反应如下:
时间 |
速度 |
作用 |
3分钟 |
|
水浴99.9℃ |
30分钟 |
1000rpm |
Thermomixer60℃ |
3分钟 |
|
水浴99.9℃ |
1.5小时 |
1000rpm |
Thermomixer60℃ |
3分钟 |
|
水浴99.9℃ |
3小时 |
1000rpm |
Thermomixer60℃ |
反应混合物随后采用Millipore MicroconTM柱通过超滤纯化。该纯化按照制造商的说明书进行。更具体地,用脱磺酸基和洗涤:
然后,将50μl的亚硫酸氢盐TE缓冲液(预热至50℃;10mM Tris中0.1mM EDTA)加至膜,并在搅动下(1000rpm)孵育10分钟。将该柱反向放入1.7ml低截留管并以1000g旋转7分钟以洗脱DNA。采用对照序列(HB14)的实时PCR测定确定DNA浓度。
扩增
扩增子和PCR引物参见表21。在其名称中带有“rc”的扩增子从Bis2链扩增,而其它从Bisl链扩增。
目的片段采用以下条件在25μl反应中扩增。
PCR反应:
循环条件:
3min94℃;20s94℃;30s54℃;45s72℃(38-42循环);10min72℃PCR产物的纯化
采用MontageTM DNA凝胶提取试剂盒,根据制造商的说明书纯化PCR产物。简言之,PCR反应物在1%改良的TAE(含有0.1mM EDTA,而不是标准TAE中1.0mM EDTA)琼脂糖凝胶上跑胶。切下目的DNA带并剪碎。将胶块至于Montage凝胶提取设备中,并以5000g旋转10分钟收集DNA溶液。纯化的DNA被进一步浓缩至10μl。
TA克隆
采用InvitrogenTA克隆试剂盒,按照制造商的说明克隆并扩增所述PCR产物。简言之,将2μl纯化和浓缩的PCR产物用在TOPO克隆反应中以将其克隆进载体2.1-TOPO。转化采用化学上能胜任的E.coli株TOP10进行。
测序
挑取单个克隆并在LB(50μg卡比西林/ml LB用于选择)中培养。1μl的过夜培养物被用于在20μ1体积中的菌落PCR:
PCR混合物
2.5μl10×DyNAzyme缓冲液
2.5μl2mM dNTPs
1.25μlM13F引物(10μM)
1.25μl M13R引物(10μM)
0.25μl DyNAzyme聚合酶
12.25μl ddH20
循环条件:
3min94℃;1min94℃;1min55℃;1min72℃(36循环);10min72℃
采用标准操作进行菌落PCR扩增子纯化和序列阅读。所用的测序引物为M13反向引物或产生最初PCR产物的扩增子特异引物之一。
结果
图5至29提供了从通过申请人知识产权软件(进一步的信息,参见wO2004/000463)分析的γ扩增子的亚硫酸氢盐测序数据产生的矩阵。矩阵的每列代表用于一个样品重复的测序数据,每种样品的所用重复被划分进一个块中。矩阵的每行代表片段内的单个CpG位点。扩增产物的CpG数目显示在矩阵的左侧。
在每个CpG位置测量的甲基化的量由从浅灰色(0%甲基化)、至中灰(50%甲基化),至黑灰(100%甲基化)表示。一些扩增产物、样品或CpG位置未被正确测序,它们显示为白色,
图5至29提供了实施例5的亚硫酸氢盐测序数据的矩阵。该矩阵的每列代表一个样品的重复测序数据,每个样品的所有重复被分在一个块中。矩阵的每行代表片段内的单一CpG位点。扩增产物的CpG数显示在矩阵的左侧。
在每个CpG位置测量的甲基化的量由从浅灰色(0%甲基化)、至中灰(50%甲基化),至黑灰(100%甲基化)表示。一些扩增产物、样品或CpG位置未被成功测序,它们显示为白色。
图5至12提供了在4个以前被定量(通过HeavyMethyl分析)具有10%至20%甲基化的样品中,根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
图13至20提供了在2个以前被定量(通过HeavyMethyl分析)具有高于20%甲基化的样品中,根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
图21至22提供了在3个健康个体血液样品中根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
图23至29提供了在6个以前被定量(通过HeavyMethyl分析)具有低于10%甲基化(但高于0%)的样品中,根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
实施例6
适合于分析SEQ ID NO:159至SEQ ID NO:163的基因组序列的经亚硫酸氢盐处理的变体的其它测定显示在表22中。基因组DNA的亚硫酸氢盐处理可以按现有技术中已知的方案(例如Olek A等人,A modifiedand improved methodfor bisulfite based cytosine methylation analysis(基于亚硫酸氢盐的胞嘧啶甲基化分析的改变和改进的方法),Nucleic Acids Res.24:5064-6,1996)进行。适合的循环条件为本领域技术人员所知,并且可以从寡聚体的熔解温度得出,如表22中所示。
表1:根据序列表的基因组序列
*
Ensembl数据库
表2
表3:根据实施例2所分析的样品
表4:具有位于不同阈值内甲基化的结肠直肠癌样品的比例
表5:具有位于不同阈值内甲基化的正常临近组织样品的比例
表6:具有位于不同阈值内甲基化的全血样品的比例
表7:根据疾病阶段的不同甲基化阈值内的结肠直肠癌的比例
表8:检测到的位于1%至10%甲基化阈值内的结肠直肠癌样品的比例
表9检测到的位于15%至25%甲基化阈值内的结肠直肠癌样品的比例
表10检测到的位于30%至50%甲基化阈值内的结肠直肠癌样品的比例
表11经检测位于0.01%至0.1%甲基化阈值内的全血样品比例
表12:如图30-37中说明的血液和结肠直肠癌样品之间的差异*
*置信区间显示在括号内
表13:实施例3的样品组1
样品类型 |
性别 |
年龄 |
期 |
T |
N |
M |
位置 |
CRC |
F |
39 |
III |
4 |
1 |
0 |
乙状结肠 |
CRC |
F |
65 |
III |
3 |
2 |
0 |
回盲肠 |
CRC |
M |
58 |
IV |
|
|
|
直肠 |
CRC |
M |
63 |
III |
3 |
1 |
0 |
直肠 |
CRC |
M |
71 |
II |
|
|
|
升结肠 |
CRC |
F |
69 |
I |
2 |
0 |
0 |
盲肠 |
CRC |
F |
54 |
III |
3 |
2 |
0 |
盲肠 |
CRC |
M |
44 |
IV |
|
|
|
|
CRC |
F |
75 |
IV |
|
|
|
横结肠 |
CRC |
F |
60 |
II |
|
|
|
直肠 |
CRC |
M |
76 |
I |
|
|
|
降结肠 |
CRC |
M |
69 |
IV |
|
|
|
乙状结肠 |
CRC |
M |
73 |
I |
1 |
0 |
0 |
直肠 |
CRC |
M |
|
II |
3 |
0 |
0 |
升结肠 |
CRC |
M |
62 |
III |
3 |
1 |
|
|
CRC |
F |
49 |
IV |
|
|
|
升结肠 |
CRC |
F |
58 |
III |
3 |
1 |
X |
升结肠 |
CRC |
M |
42 |
IV |
3 |
0 |
1 |
|
CRC |
M |
64 |
I |
2 |
0 |
0 |
乙状结肠 |
CRC |
F |
64 |
III |
|
|
|
直肠 |
CRC |
F |
70 |
III |
3 |
1 |
0 |
终末回肠 |
CRC |
M |
67 |
|
|
|
|
|
CRC |
M |
80 |
III |
3 |
1 |
0 |
直肠乙状结肠 |
CRC |
F |
72 |
IV |
|
|
|
乙状结肠 |
CRC |
M |
|
III |
|
|
|
直肠 |
CRC |
M |
56 |
I |
2 |
0 |
0 |
乙状结肠 |
CRC |
M |
72 |
III |
2 |
1 |
0 |
直肠 |
CRC |
M |
45 |
IV |
4 |
2 |
1 |
盲肠 |
CRC |
F |
|
II |
3 |
0 |
0 |
|
CRC |
M |
74 |
III |
3 |
1 |
0 |
直肠乙状结肠 |
CRC |
F |
75 |
III |
4 |
2 |
0 |
盲肠壁 |
CRC |
M |
|
II川 |
3 |
1 |
0 |
|
CRC |
M |
|
I |
2 |
0 |
0 |
升结肠 |
CRC |
F |
74 |
I |
2 |
0 |
0 |
盲肠 |
CRC |
M |
62 |
I |
2 |
0 |
0 |
直肠乙状结肠 |
CRC |
F |
60 |
II |
3 |
0 |
0 |
直肠 |
CRC |
F |
80 |
II |
|
|
|
升结肠 |
CRC |
F |
70 |
III |
4 |
2 |
0 |
直肠 |
CRC |
M |
|
III |
3 |
1 |
0 |
|
CRC |
F |
75 |
III |
3 |
1 |
0 |
升结肠 |
CRC |
F |
49 |
IV |
4 |
X |
1 |
直肠 |
CRC |
F |
47 |
I |
|
|
|
肛门 |
CRC |
M |
81 |
IV |
|
|
1 |
|
CRC |
F |
89 |
III |
3 |
1 |
0 |
直肠 |
CRC |
M |
85 |
III |
3 |
1 |
0 |
盲肠 |
CRC |
M |
52 |
III |
2 |
1 |
0 |
|
CRC |
M |
75 |
II |
|
|
|
乙状结肠 |
CRC |
M |
|
|
|
|
|
|
CRC |
F |
71 |
|
|
|
|
|
CRC |
M |
|
III |
|
|
|
直肠 |
CRC |
M |
61 |
|
3 |
X |
0 |
降结肠 |
CRC |
F |
56 |
未知 |
|
|
|
乙状结肠 |
CRC |
F |
68 |
IV |
3 |
2 |
1 |
乙状结肠 |
CRC |
F |
65 |
III |
3 |
2 |
0 |
回盲肠 |
CRC |
M |
88 |
II |
3 |
0 |
0 |
曲段 |
CRC |
F |
72 |
III |
|
|
|
盲肠 |
CRC |
M |
61 |
IV |
3 |
2 |
1 |
直肠 |
CRC |
M |
|
III |
3 |
2 |
|
|
CRC |
M |
52 |
II |
3 |
0 |
0 |
横结肠 |
CRC |
M |
66 |
IV |
2 |
0 |
1 |
直肠 |
CRC |
M |
64 |
III |
|
|
|
升结肠 |
CRC |
F |
65 |
II |
3 |
0 |
0 |
|
CRC |
M |
61 |
IV |
3 |
2 |
1 |
乙状结肠 |
CRC |
M |
64 |
III |
3. |
1 |
0 |
升结肠 |
CRC |
M |
76 |
0 |
0 |
|
|
乙状结肠 |
CRC |
M |
64 |
I |
2 |
0 |
0 |
升结肠 |
CRC |
M |
56 |
I |
2 |
0 |
0 |
横结肠 |
CRC |
F |
67 |
II |
3 |
0 |
0 |
乙状结肠 |
CRC |
M |
|
II |
3 |
0 |
0 |
升结肠 |
CRC |
M |
66 |
III |
4 |
1 |
0 |
|
CRC |
M |
|
II |
3 |
0 |
0 |
|
CRC |
F |
|
III |
|
|
|
|
CRC |
F |
65 |
I |
2 |
0 |
X |
直肠 |
CRC |
M |
|
II |
3 |
0 |
0 |
|
CRC |
M |
40 |
I |
|
|
|
FAP |
CRC |
M |
77 |
I |
2 |
0 |
0 |
直肠乙状结肠 |
CRC |
M |
65 |
III |
4 |
2 |
0 |
降结肠 |
CRC |
M |
68 |
IV |
|
|
|
乙状结肠 |
CRC |
M |
67 |
II |
|
|
|
直肠 |
CRC |
M |
|
unk |
|
|
|
直肠 |
CRC |
F |
63 |
|
3 |
X |
0 |
|
CRC |
M |
68 |
unk |
|
|
|
降结肠 |
CRC |
F |
53 |
III |
3 |
1 |
0 |
升结肠 |
CRC |
M |
|
II |
3 |
0 |
0 |
|
CRC |
M |
68 |
I |
2 |
0 |
0 |
直肠 |
CRC |
M |
84 |
III |
|
|
|
直肠 |
CRC |
F |
53 |
1 |
1 |
0 |
0 |
降结肠 |
CRC |
M |
72 |
III |
4 |
1 |
0 |
|
CRC |
F |
69 |
I |
1 |
0 |
0 |
乙状结肠 |
CRC |
M |
|
I |
3 |
0 |
0 |
降结肠 |
CRC |
M |
|
I |
3 |
0 |
0 |
盲肠 |
正常血液 |
F |
62 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
62 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
44 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
57 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
51 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
66 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
65 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
55 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
70 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
40 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
42 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
68 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
67 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
53 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
|
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
50 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
50 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
51 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
56 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
58 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
67 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
55 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
62 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
66 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
56 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
56 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
69 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
表14:实施例3的样品组2
样品类型 |
性别 |
年龄 |
期 |
T |
N |
M |
位置 |
CRC |
F |
49 |
IV |
|
|
|
升结肠 |
CRC |
F |
72 |
IV |
|
|
|
乙状结肠 |
CRC |
M |
69 |
IV |
|
|
|
乙状结肠 |
CRC |
F |
58 |
III |
3 |
1 |
X |
升结肠 |
CRC |
F |
60 |
I |
|
|
|
直肠 |
CRC |
F |
74 |
I |
2 |
0 |
0 |
盲肠 |
CRC |
F |
70 |
III |
3 |
1 |
0 |
终末回肠 |
CRC |
F |
69 |
I |
2 |
0 |
0 |
盲肠 |
CRC |
F |
39 |
III |
4 |
1 |
0 |
乙状结肠 |
CRC |
M. |
56 |
I |
2 |
0 |
0 |
乙状结肠 |
CRC |
F |
|
II |
3 |
0 |
0 |
|
CRC |
M |
64 |
I |
2 |
0 |
0 |
乙状结肠 |
CRC |
M |
45 |
IV |
4 |
2 |
1 |
盲肠 |
CRC |
F |
54 |
III |
3 |
2 |
0 |
盲肠 |
CRC |
M |
42 |
IV |
3 |
0 |
1 |
|
CRC |
M |
73 |
I |
1 |
0 |
0 |
直肠 |
CRC |
M |
62 |
III |
3 |
1 |
|
|
CRC |
M |
|
I |
2 |
0 |
0 |
升结肠 |
CRC |
F |
75 |
III |
3 |
1 |
0 |
升结肠 |
CRC |
M |
74 |
III |
3 |
1 |
0 |
直肠乙状结肠 |
CRC |
F |
68 |
IV |
3 |
2 |
1 |
乙状结肠 |
CRC |
F |
75 |
IV |
|
|
|
横结肠 |
CRC |
M |
85 |
III |
3 |
1 |
0 |
盲肠 |
CRC |
M |
80 |
III |
3 |
1 |
0 |
直肠乙状结肠 |
CRC |
M |
66 |
III |
4 |
1 |
0 |
|
CRC |
F |
70 |
III |
4 |
2 |
0 |
直肠 |
CRC |
F |
89 |
III |
3 |
1 |
0 |
直肠 |
CRC |
M |
67 |
|
|
|
|
|
CRC |
F |
67 |
II |
3 |
0 |
0 |
乙状结肠 |
CRC |
M |
66 |
IV |
2 |
0 |
1 |
直肠 |
CRC |
F |
56 |
unk |
|
|
|
乙状结肠 |
CRC |
M |
72 |
III |
2 |
1 |
0 |
直肠 |
CRC |
F |
80 |
II |
|
|
|
升结肠 |
CRC |
M |
75 |
II |
|
|
|
乙状结肠 |
CRC |
F |
49 |
IV |
4 |
X |
1 |
直肠 |
CRC |
M |
|
III |
|
|
|
直肠 |
CRC |
F |
60 |
II |
3 |
0 |
0 |
直肠 |
CRC |
M |
62 |
I |
2 |
0 |
0 |
直肠乙状结肠 |
CRC |
M |
88 |
II |
3 |
0 |
0 |
曲段 |
CRC |
M |
61 |
IV |
3 |
2 |
1 |
乙状结肠 |
CRC |
M |
61 |
|
3 |
X |
0 |
降结肠 |
CRC |
F |
64 |
III |
|
|
|
直肠 |
CRC |
M |
|
III |
|
|
|
直肠 |
CRC |
M |
52 |
II |
3 |
0 |
0 |
横结肠 |
CRC |
F |
71 |
|
|
|
|
|
CRC |
M |
81 |
IV |
|
|
1 |
|
CRC |
F |
65 |
III |
3 |
2 |
0 |
回盲肠 |
CRC |
M |
|
|
|
|
|
|
CRC |
F |
65 |
II |
3 |
0 |
0 |
|
CRC |
F |
72 |
III |
|
|
|
盲肠 |
CRC |
M |
61 |
IV |
3 |
2 |
1 |
直肠 |
CRC |
M |
52 |
III |
2 |
1 |
0 |
|
CRC |
M |
|
II |
3 |
0 |
0 |
|
CRC |
F |
47 |
I |
|
|
|
肛门 |
CRC |
M |
|
I |
3 |
0 |
0 |
升结肠 |
CRC |
M |
64 |
III |
3 |
1 |
0 |
升结肠 |
CRC |
M |
64 |
I |
2 |
0 |
0 |
升结肠 |
CRC |
M |
76 |
0 |
0 |
|
|
乙状结肠 |
CRC |
M |
56 |
I |
2 |
0 |
0 |
横结肠 |
CRC |
M |
65 |
III |
4 |
2 |
0 |
降结肠 |
CRC |
M |
40 |
I |
|
|
|
FAP |
CRC |
F |
53 |
I |
1 |
0 |
0 |
降结肠 |
CRC |
M |
|
II |
3 |
0 |
O |
|
CRC |
M |
|
III |
3 |
2 |
|
|
CRC |
M |
|
未知 |
|
|
|
直肠 |
CRC |
M |
68 |
I |
2 |
0 |
O |
直肠 |
CRC |
F |
63 |
|
3 |
× |
O |
|
CRC |
F |
|
III |
|
|
|
|
CRC |
M |
67 |
II |
|
|
|
直肠 |
CRC |
F |
65 |
I |
2 |
0 |
X |
直肠 |
CRC |
M |
64 |
III |
|
|
|
升结肠 |
CRC |
M |
68 |
IV |
|
|
|
乙状结肠 |
CRC |
M |
|
II |
3 |
0 |
0 |
|
CRC |
M |
72 |
III |
4 |
1 |
0 |
|
CRC |
M |
77 |
I |
2 |
0 |
O |
直肠乙状结肠 |
CRC |
F |
53 |
III |
3 |
1 |
0 |
升结肠 |
CRC |
F |
69 |
I |
1 |
0 |
0 |
乙状结肠 |
CRC |
M |
84 |
III |
|
|
|
直肠 |
CRC |
M |
|
II |
3 |
0 |
0 |
降结肠 |
CRC |
M |
68 |
未知 |
|
|
|
降结肠 |
CRC |
M |
|
II |
3 |
O |
0 |
盲肠 |
正常血液 |
M |
55 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
62 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
57 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
62 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
65 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
|
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
44 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
68 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
70 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
58 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
62 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
53 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
42 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
51 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
66 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
51 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
40 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
56 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
56 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
50 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
50 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
F |
67 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
67 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
55 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
66 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
正常血液 |
M |
56 |
n.a. |
n.a. |
n.a. |
n.a. |
n.a. |
表15:具有位于不同阈值内甲基化的来自实施例3样品组1的样品比例
*两次重复测试阳性
**两次重复测试之一阳性或经测量位于阈值内
表16具有位于不同阈值内甲基化的来自实施例3样品组2的样品比例
*两次重复测试之一阳性或经测量位于阈值内
表17根据实施例3的测定
表18:具有位于不同阈值的甲基化的来自实施例3样品组1的样品比例
表19:实施例3的样品组3
表20:实施例4的结果
表21根据实施例5的引物和扩增产物的基因组等价物
注意:在名称中具有“rc”的扩增子是从Bis2链扩增的,
而其它是从Bisl扩增的。
表22:根据实施例6的寡聚体
表21根据实施例5的引物和扩增产物的基因组等价物
注意:在名称中具有“rc”的扩增子是从Bis2链扩增的,
而其它是从Bisl扩增的。
表22:根据实施例6的寡聚体
以下是原申请的权利要求书,作为说明书的一部分并入此处:
1.检测和/或分类个体中细胞增殖性病症的方法,包括确定分离自所述个体的生物样品中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的表达水平,其中欠表达和/或CpG甲基化表明所述病症存在或其种类。
2.如权利要求1所述的方法,其中癌性细胞增殖性病症区别于良性细胞增殖性病症,所述方法特征在于欠表达和/或CpG甲基化的存在表明癌性细胞增殖性病症的存在,而其不存在表明良性细胞增殖性病症的存在。
3.如权利要求1所述的方法,其中所述细胞增殖性病症为癌症。
4.如权利要求3所述的方法,其中所述细胞增殖性病症为肝细胞或结肠直肠癌。
5.如权利要求1-4任一项所述的方法,其中所述表达水平通过检测从所述基因转录的mRNA的存在与否或水平来确定。
6.如权利要求1-4任一项所述的方法,其中所述表达水平通过检测由所述基因或其序列编码的多肽的存在与否或水平来确定。
7.如权利要求6所述的方法,其中所述多肽通过一种或多种选自western印迹分析、色谱法、免疫分析、ELISA免疫分析、放射免疫分析、抗体法及其组合来检测。
8.如权利要求1-4任一项所述的方法,其中所述表达通过检测所述基因内CpG甲基化的存在与否来确定,其中甲基化的存在表明细胞增殖性病症的存在。
9.检测和/或分类个体中细胞增殖性病症的方法,包括使从所述个体生物样品中分离的基因组DNA与至少一种试剂或成组试剂接触,所述至少一种试剂或成组试剂区分所述基因组DNA至少一个靶区域内甲基化和未甲基化CpG二核苷酸,其中所述靶区域包含或在严紧条件下杂交于至少一种分别选自SEQ ID NO:1至SEQ ID NO:3、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少16连续核苷酸的序列,其中所述连续核苷酸包含至少一个CpG二核苷酸序列,由此至少部分地提供对细胞增殖性病症的检测和/或分类。
10.检测和/或分类个体中细胞增殖性病症的方法,包括:
a.提取或以其它方式从所述个体生物样品分离基因组DNA;
b.用一种或多种试剂处理a)的所述基因组DNA或其片段,以便将其5位未甲基化的胞嘧啶碱基转化为尿嘧啶或在杂交性能方面可检测地不同于胞嘧啶的其它碱基;
c.使所述经处理的基因组DNA或其经处理的片段与扩增酶和至少一种引物接触,所述引物包括至少9核苷酸的连续序列,其互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10至SEQ IDNO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ IDNO:31、SEQ ID NO.42至SEQ ID NO:43、SEQ ID NO:38至SEQ IDNO:39、SEQ ID NO:5O至SEQ ID NO:51、SEQ ID NO:168至SEQ IDNO:203及其互补序列的序列,其中所述经处理的基因组DNA或其片段被扩增以产生至少一种扩增产物或不被扩增;以及
d.基于所述扩增物是否存在或其性质,确定选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的甲基化状态或水平,或者反映选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的多个CpG二核苷酸平均甲基化状态或水平的均值或值,由此至少部分地提供至少检测和分类细胞增殖性病症之一。
11.如权利要求9所述的方法,其中b)中处理所述基因组DNA或其片段包括使用选自亚硫酸氢盐、酸式亚硫酸盐、disulfite及其组合的试剂。
12.如权利要求9所述的方法,其中c)中的接触或扩增包括使用至少一种选自如下的方法:使用耐热DNA聚合酶作为所述扩增酶;使用缺乏5’-3’外切酶活性的聚合酶;使用聚合酶链式反应(PCR);产生带有可检测标记的扩增产物核酸分子。
13.如权利要求1-11中任一项所述的方法,其中从所述个体获得的所述生物样品选自细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。
14.如权利要求10所述的方法,还在步骤d)中包括使用至少一种核酸分子或肽核酸分子,其在各种情况下都包含互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10至SEQ ID NO:15、SEQ IDNO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ IDNO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ IDNO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203序列及其互补序列的至少9核苷酸长度的连续序列,其中所述核酸分子或肽核酸分子抑制其所杂交的所述核酸的扩增。
15.如权利要求10所述的方法,其中d)中的确定包括至少一种核酸分子或肽核酸分子的杂交,所述至少一种核酸分子或肽核酸分子在各种情况下包含互补于或在中等严紧或严紧条件下杂交于选自SEQID NO:10.至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ IDNO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ IDNO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ IDNO:168至SEQ ID NO:203序列及其互补序列的至少9核苷酸长度的连续序列。
16.如权利要求15所述的方法,其中至少一种这种杂交核酸分子或肽核酸分子被连接到固相。
17.如权利要求15所述的方法,还使至少一种这种杂交的核酸分子延伸至少一个碱基。
18.如权利要求10所述的方法,其中d)中的确定包括对所述扩增产物的测序。
19.如权利要求10所述的方法,其中c)中的接触或扩增包括使用甲基化特异的引物。
20.检测和/或分类细胞增殖性病症的方法,包括:
a.提取或以其它方式从得自所述个体的生物样品分离基因组DNA;
b.以一种或多种甲基化敏感限制酶消化a)的所述基因组DNA或其片段:
使b)的DNA限制酶消化产物与扩增酶和至少两种适于扩增序列的引物接触,所述序列包含选自SEQ ID NO:1至SEQ ID NO:3、SEQID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸;以及
c.基于扩增产物存在与否,确定选自SEQ ID NO:1至SEQ IDNO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ IDNO:167的序列的至少一个CpG二核苷酸的甲基化状态或水平,由此至少部分地提供至少检测和分类细胞增殖性病症之一。
21.如权利要求20所述的方法,其中通过杂交至少一种核酸或肽核酸来确定扩增产物的存在与否,所述至少一种核酸或肽核酸等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:1至SEQID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ IDNO:167的序列的至少16碱基长片段。
22.衍生自基因组SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ TD NO:159至SEQ ID NO:167的经处理的核酸,其中所述处理适合于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转化至尿嘧啶或在杂交上可检测地不同于胞嘧啶的其它碱基。
23.核酸,其包含选自SEQ ID NO:10至SEQ ID NO:15、SEQ IDNO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ IDNO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ IDNO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的经处理的基因组DNA序列及其互补序列的至少16连续核苷酸,其中所述处理合适于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转变为尿嘧啶或在杂交上可检测地不同于胞嘧啶的其它碱基。
24.核酸,包含选自SEQ ID NO:10至SEQ ID NO:15、SEQ IDNO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ IDNO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ1DNO.50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203及其互补序列的DNA序列的至少50连续核苷酸。
25.如权利要求22-24中任一项所述的核酸,其中所述连续碱基序列包含至少一个CpG、TpG或CpA二核苷酸序列。
26.核酸,包含用作诊断工具的选自SEQ ID NO:1至SEQ IDNO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ IDNO:167、SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ IDNO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ IDNO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50.至SEQ IDNO:51、SEQ ID NO:168至SEQ ID NO:203的核酸序列及其互补序列的至少16连续核苷酸。
27.适合于实施权利要求3所述的方法的试剂盒,包括a)多种能够在严紧或中等严紧条件下杂交至少一种选自Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT和SEQID NO:160至SEQ ID NO:165的基因或基因组序列转录产物的寡核苷酸或多核苷酸;(b)适合于容纳所述寡核苷酸或多核苷酸以及包含所述转录产物的患者生物样品的容器,其中所述寡核苷酸或多核苷酸能在严紧或中等严紧条件下杂交所述转录产物,(c)检测(b)的杂交的工具;以及任选地,(d)使用和解释试剂盒结果的说明书。
28.适合于实施权利要求5所述的方法的试剂盒,包括(a)检测至少一种选自Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT和SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的多肽的工具;(b)适合于容纳所述工具和包含所述多肽的患者生物样品的容器,其中所述工具能与所述多肽形成复合物;(c)检测(b)的复合物的工具。
29.适合于实施权利要求9的方法的试剂盒,包括(a)亚硫酸氢盐试剂;(b)适合于容纳所述亚硫酸氢盐和患者生物样品的容器;(c)含有两种寡核苷酸的至少一套寡核苷酸,其序列在各种情况下都等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:10至SEQID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ IDNO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ IDNO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ IDNO:203的序列的9或更优选18碱基长片段。
30.适合于实施权利要求9的方法的试剂盒,包括(a)甲基化敏感限制酶试剂;(b)适合于容纳所述试剂和患者生物样品的容器;(c)含有一种或多种核酸或肽核酸的至少一套寡核苷酸,其等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:1至SEQ IDNO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ IDNO:167的序列的至少9碱基长片段;以及任选地,(d)使用和解释试剂盒结果的说明书。
31.权利要求1-21的方法、权利要求22-26的核酸和/或权利要求27-30的试剂盒在细胞增殖性病症的诊断和/或分类中的用途。