CN114375340A

CN114375340A - 结肠直肠癌的检测

Info

Publication number: CN114375340A
Application number: CN202080047767.3A
Authority: CN
Inventors: M·比滕茨; K·克鲁斯马; J·马丁内兹-巴雷亚; C·亨塞; P·索拉·德罗斯·桑托斯; P·科内尔·诺格尔; M·切西科拉; P·科纳普
Original assignee: General Diagnostics
Current assignee: General Diagnostics
Priority date: 2019-05-31
Filing date: 2020-05-28
Publication date: 2022-04-19
Also published as: CA3138354A1; EP3963111B1; KR20220025749A; ES2984254T3; SG11202112523UA; JP7540735B2; JP2022534436A; AU2020285322A1; EP3963111A1; WO2020239896A1; EP3963111B8

Abstract

本公开尤其提供用于结肠直肠癌检测(例如筛查)的方法和与之相关的组合物。在各种实施方式中，本公开提供用于结肠直肠癌筛查的方法，其包括分析一种或多种甲基化生物标志物的甲基化状态，以及与之相关的组合物。在各种实施方式中，本公开提供了用于结肠直肠癌检测(例如筛查)的方法，其包括检测(例如筛查)cfDNA中，例如ctDNA中的一种或多种甲基化生物标志物的甲基化状态。在各种实施方式中，本公开提供了用于结肠直肠癌筛查的方法，其包括使用MSRE‑qPCR检测(例如筛查)cfDNA中，例如ctDNA中的一种或多种甲基化生物标志物的甲基化状态。

Description

结肠直肠癌的检测

背景技术

癌症筛查是癌症预防、诊断和治疗的重要组成部分。根据一些报告，结肠直肠癌(CRC)已被鉴定为世界上第三大最常见的癌症类型和频率第二大的癌症死亡原因。根据一些报道，每年有超过180万例新发结肠直肠癌病例，约881,000人死于结肠直肠癌，约占癌症死亡人数的十分之一。建议进行定期结肠直肠癌筛查，尤其是50岁以上的个体。此外，50岁以下的个体的结肠直肠癌的发病率随着时间的推移而增加。统计数据表明，目前的结肠直肠癌筛查技术是不够的。

发明内容

尽管随着时间的推移有所改善，但目前只有约40％至44％的结肠直肠癌通过早期、局部阶段的筛查被检测到。这至少部分是由于当前筛查技术的灵敏度和/或特异性不足。目前推荐的技术包括对50岁以上的人进行结肠镜检查和/或粪便血检测。

本公开尤其提供用于结肠直肠癌筛查的方法和与之相关的组合物。在各种实施方式中，本公开提供用于结肠直肠癌筛查的方法，其包括确定在人类受试者的脱氧核糖核酸(DNA)的甲基化基因座，例如差异甲基化区域(DMR)内发现的一个或多个甲基化位点处的甲基化状态(例如甲基化的数量、频率或模式)，以及与之相关的组合物。在各种实施方式中，本公开提供了用于结肠直肠癌筛查的方法，其包括筛查cfDNA(无细胞DNA)，例如ctDNA(循环肿瘤DNA)中的一个或多个甲基化基因座中每一个的甲基化状态。在各种实施方式中，本公开提供了用于结肠直肠癌筛查的方法，其包括使用定量聚合酶链式反应(qPCR)(例如甲基化敏感性限制酶定量聚合酶链式反应，MSRE-qPCR)筛查cfDNA，例如ctDNA中的一个或多个甲基化基因座中每一个的甲基化状态。本文提供的各种组合物和方法提供足以用于结肠直肠癌筛查的临床应用的灵敏度和特异性。本文提供的各种组合物和方法可用于通过分析受试者的可及组织样品，例如作为血液或血液成分(例如，cfDNA，例如，ctDNA)或粪便的组织样品，进行结肠直肠癌筛查。

在一个方面，本发明涉及检测(例如，筛查)结肠直肠癌的方法，所述方法包括：确定人类受试者的脱氧核糖核酸(DNA)中以下中的每一个的甲基化状态[例如，甲基化基因座内的一个或多个甲基化位点处的甲基化的数量、频率或模式]：(a)ZNF132基因内的甲基化基因座(例如，差异甲基化区)；(b)ADAMTS2基因内的第一甲基化基因座；和(c)ADAMTS2基因内的第二甲基化基因座；以及基于所述确定的甲基化状态诊断人类受试者中的结肠直肠癌。

在一些实施方式中，所述方法还包括确定人类受试者DNA中以下中的每一个的甲基化状态：(d)ZNF542基因内的甲基化基因座；和(e)LONRF2基因内的甲基化基因座。

在一些实施方式中，所述方法还包括确定人类受试者DNA中ZNF492基因内的甲基化基因座的甲基化状态。

在一些实施方式中，ZNF132基因内的甲基化基因座包含ZNF132‘415(SEQ ID NO:40)。

在一些实施方式中，ADAMTS2基因内的第一甲基化基因座包含ADAMTS2‘254(SEQID NO:21)。

在一些实施方式中，ADAMTS2基因内的第二甲基化基因座包含ADAMTS2‘284(SEQID NO:22)。

在一些实施方式中，ZNF542基因内的甲基化基因座包含ZNF542‘502(SEQ ID NO:35)。

在一些实施方式中，LONRF2基因内的甲基化基因座包含LONRF2‘281(SEQ ID NO:19)。

在一些实施方式中，ZNF492基因内的甲基化基因座包含ZNF492‘069(SEQ ID NO:42)。

在一些实施方式中，所述DNA分离自人类受试者的血液或血浆中。

在一些实施方式中，所述DNA是所述人类受试者的无细胞DNA。

在一些实施方式中，使用定量聚合酶链式反应(qPCR)(例如，甲基化敏感性限制酶定量聚合酶链式反应，MSRE-qPCR)确定甲基化状态。

在另一方面，本发明涉及一种用于结肠直肠癌检测(例如筛查)的试剂盒，所述试剂盒包括：(a)用于扩增ZNF132基因内的甲基化基因座的寡核苷酸引物对；(b)用于扩增ADAMTS2基因内的第一甲基化基因座的寡核苷酸引物对；和(c)用于扩增ADAMTS2基因内的第二甲基化基因座的寡核苷酸引物对(例如，可选的，所述试剂盒进一步包含至少一种甲基化敏感性限制酶)。

在一些实施方式中，试剂盒还包括：(d)用于扩增ZNF542基因内的甲基化基因座的寡核苷酸引物对；和(e)用于扩增LONRF2基因内的甲基化基因座的寡核苷酸引物对。

在一些实施方式中，试剂盒还包括：(f)用于扩增ZNF492基因内的甲基化基因座的寡核苷酸引物对。

在一些实施方式中，(a)是用于扩增ZNF132‘415的寡核苷酸引物对(引物对SEQ IDNO:91和SEQ ID NO:92)。

在一些实施方式中，(b)是用于扩增ADAMTS2‘254的寡核苷酸引物对(引物对SEQID NO:53和SEQ ID NO:54)。

在一些实施方式中，(c)是用于扩增ADAMTS2‘284的寡核苷酸引物对(引物对SEQID NO:55和SEQ ID NO:56)。

在一些实施方式中，(d)是用于扩增ZNF542‘502的寡核苷酸引物对(引物对SEQ IDNO:81和SEQ ID NO:82)。

在一些实施方式中，(e)是用于扩增LONRF2‘281的寡核苷酸引物对(引物对SEQ IDNO:49和SEQ ID NO:50)。

在一些实施方式中，(h)是用于扩增ZNF492‘069的寡核苷酸引物对(引物对SEQ IDNO:95和SEQ ID NO:96)。

在另一方面，本发明涉及一种用于检测(例如筛查)结肠直肠癌的诊断性qPCR反应，所述诊断性qPCR反应包括：(a)人类DNA；(b)聚合酶；和(c)用于扩增ZNF132基因内的甲基化基因座的寡核苷酸引物对；(d)用于扩增ADAMTS2基因内的第一甲基化基因座的寡核苷酸引物对；和(e)用于扩增ADAMTS2基因内的第二甲基化基因座的寡核苷酸引物对；和(f)可选的，至少一种甲基化敏感性限制酶。

在一些实施方式中，反应还包括：(g)用于扩增ZNF542基因内的甲基化基因座的寡核苷酸引物对；和(h)用于扩增LONRF2基因内的甲基化基因座的寡核苷酸引物对。

在一些实施方式中，反应还包括：(i)用于扩增ZNF492基因内的甲基化基因座的寡核苷酸引物对。

在一些实施方式中，(c)是用于扩增ZNF132‘415的寡核苷酸引物对(引物对SEQ IDNO:91和SEQ ID NO:92)。

在一些实施方式中，(d)是用于扩增ADAMTS2‘254的寡核苷酸引物对(引物对SEQID NO:53和SEQ ID NO:54)。

在一些实施方式中，(e)是用于扩增ADAMTS2‘284的寡核苷酸引物对(引物对SEQID NO:55和SEQ ID NO:56)。

在一些实施方式中，(g)是用于扩增ZNF542‘502的寡核苷酸引物对(引物对SEQ IDNO:81和SEQ ID NO:82)。

在一些实施方式中，(h)是用于扩增LONRF2‘281的寡核苷酸引物对(引物对SEQ IDNO:49和SEQ ID NO:50)。

在一些实施方式中，(i)是用于扩增ZNF492‘069的寡核苷酸引物对(引物对SEQ IDNO:95和SEQ ID NO:96)。

在各个方面，本发明的方法和组合物可以与本领域已知的生物标志物组合使用，例如，如美国专利10,006,925号中所公开的生物标志物，该专利通过引用整体并入本文。

定义

一个或一种：冠词“a”和“an”在本文中用于指代一个或多个(即至少一个)冠词的语法对象。例如，“一种元素”是指一种元素或多于一种的元素。

约：术语“约”，当在本文中用于提及值时，是指在上下文中与所引用的值相似的值。一般而言，熟悉上下文的本领域技术人员将理解在该上下文中“约”所涵盖的相关差异程度。例如，在一些实施方式中，例如，如本文所述，术语“约”可涵盖在参考值的25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或百分之几的值的范围。

施用：如本文所用，术语“施用”通常是指将组合物施用至受试者或系统，例如以实现包括在组合物中或以其他方式由组合物递送的试剂的递送。

试剂：如本文所用，术语“试剂”是指实体(例如，小分子、肽、多肽、核酸、脂质、多糖、复合物、组合、混合物、系统或现象，例如热、电流、电场、磁力、磁场等)。

改善：如本文所用，术语“改善”是指受试者状态的预防、减轻、缓和或改良。改善包括但不要求完全康复或完全预防疾病、病症或状况。

扩增子或扩增子分子：如本文所用，术语“扩增子”或“扩增子分子”是指通过从模板核酸分子转录产生的核酸分子，或具有与其互补的序列的核酸分子，或双链核酸，包括任何此类核酸分子。转录可以从引物开始。

扩增：如本文所用，术语“扩增”是指使用模板核酸分子与各种试剂组合以从模板核酸分子产生另外的核酸分子，这些另外的核酸分子可以相同或与模板核酸分子的片段相似(例如，具有至少70％同一性，例如至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性)和/或是与其互补的序列。

扩增反应混合物：如本文所用，术语“扩增反应混合物”或“扩增反应”是指模板核酸分子连同足以扩增模板核酸分子的试剂。

生物样品：如本文所用，术语“生物样品”通常是指从感兴趣的生物来源(例如，组织或生物体或细胞培养物)获得或衍生的样品，如本文所述。在一些实施方式中，例如，如本文所述，生物来源是或包括生物体，例如动物或人。在一些实施方式中，例如，如本文所述，生物样品是或包括生物组织或流体。在一些实施方式中，例如，如本文所述，生物样品可以是或包括细胞、组织或体液。在一些实施方式中，例如，如本文所述，生物样品可以是或包括血液、血细胞、无细胞DNA、自由漂浮的核酸、腹水、活检样品、手术试样、含有细胞的体液、痰、唾液、粪便、尿液、脑脊液、腹腔液、胸水、淋巴液、妇科液、分泌物、排泄物、皮肤拭子、阴道拭子、口腔拭子、鼻拭子、冲洗液或灌洗液，例如导管灌洗液或支气管肺泡灌洗液、抽吸物、刮屑、骨髓。在一些实施方式中，例如，如本文所述，生物样品是或包括从单个受试者或多个受试者获得的细胞。样品可以是直接从生物来源获得的“原始样品”，也可以是“处理过的样品”。生物样品也可称为“样品”。

生物标志物：如本文所用，术语“生物标志物”与其在本领域中的使用一致，是指其存在、水平或形式与特定生物事件或感兴趣的状态相关的实体，因此其被认为是成为该事件或状态的“标志物”。本领域技术人员将理解，例如，在DNA生物标志物的上下文中，生物标志物可以是或包括基因座(例如一个或多个甲基化基因座)和/或基因座的状态(例如，一个或多个甲基化基因座的状态)。仅举几个生物标志物的例子，在一些实施方式中，例如，如本文所述，生物标志物可以是或包括特定疾病、病症或状况的标志物，或者可以是特定疾病、病症或状况可以例如在受试者中发展、发生或复发的定量概率的定性标志物。在一些实施方式中，例如，如本文所述，生物标志物可以是或包括特定治疗结果的标志物，或其定量概率的定性。因此，在各种实施方式中，生物标志物可以预测、预后和/或诊断相关生物事件或感兴趣的状态。生物标志物可以是任何化学类别的实体。例如，在一些实施方式中，例如，如本文所述，生物标志物可以是或包括核酸、多肽、脂质、碳水化合物、小分子、无机试剂(例如，金属或离子)或其组合。在一些实施方式中，例如，如本文所述，生物标志物是细胞表面标志物。在一些实施方式中，例如，如本文所述，生物标志物是细胞内的。在一些实施方式中，例如，如本文所述，在细胞外发现生物标志物(例如，在细胞外分泌或以其他方式产生或存在，例如在体液中，例如血液、尿液、眼泪、唾液、脑脊液等)。在一些实施方式中，例如，如本文所述，生物标志物是甲基化基因座的甲基化状态。在某些情况下，例如，如本文所述，生物标志物可称为“标志物”。

仅举一个生物标志物的实例，在一些实施方式中，例如，如本文所述，该术语指由基因编码的产物的表达，其表达是特定肿瘤、肿瘤亚类、肿瘤分期等的特征。作为另选或另外，在在一些实施方式中，例如，如本文所述，特定标志物的存在或水平可以与特定信号传导途径的活性(或活性水平)相关，例如，其活性是特定类别肿瘤特征的信号传导途径。

本领域技术人员将理解，生物标志物可以单独确定特定生物事件或感兴趣的状态，或者可以代表或有助于确定特定生物事件或感兴趣状态的统计概率。本领域技术人员将理解，标志物在其与特定生物事件或感兴趣状态相关的特异性和/或灵敏度方面可能不同。

血液成分：如本文所用，术语“血液成分”是指全血的任何成分，包括红细胞、白细胞、血浆、血小板、内皮细胞、间皮细胞、上皮细胞和无细胞DNA。血液成分还包括血浆成分，包括蛋白质、代谢物、脂质、核酸和碳水化合物，以及可存在于血液中的任何其他细胞，例如由于怀孕、器官移植、感染、损伤或疾病而存在于血液中的任何其他细胞。

癌症：如本文所用，术语“癌症”、“恶性肿瘤”、“赘生物”、“肿瘤”和“癌”可互换使用，指其中细胞表现出或表现了相对异常的、不受控制的和/或自主生长的疾病、病症或状况，因此它们展现出或展现了异常升高的增殖率和/或异常生长表型。在一些实施方式中，例如，如本文所述，癌症可包括一种或多种肿瘤。在一些实施方式中，例如，如本文所述，癌症可以是或包括癌前(例如良性)、恶性、转移前、转移和/或非转移的细胞。在一些实施方式中，例如，如本文所述，癌症可以是或包括实体瘤。在一些实施方式中，例如，如本文所述，癌症可以是或包括血液肿瘤。一般而言，本领域已知的不同类型癌症的实例包括例如结肠直肠癌，造血系统癌症包括白血病、淋巴瘤(霍奇金和非霍奇金)、骨髓瘤和骨髓增生性疾病；肉瘤，黑色素瘤，腺瘤，实体组织癌，口腔、咽喉、喉癌和肺癌的鳞状细胞癌，肝癌，泌尿生殖系统癌症如前列腺癌、宫颈癌、膀胱癌、子宫癌和子宫内膜癌，以及肾细胞癌，骨癌，胰腺癌，皮肤癌，皮肤或眼内黑色素瘤，内分泌系统癌，甲状腺癌，甲状旁腺癌，头颈癌，乳腺癌，胃肠癌和神经系统癌，良性病变等如乳头状瘤等。

化学治疗剂：如本文所用，术语“化学治疗剂”与其在本领域中的使用一致，是指一种或多种已知用于治疗癌症或有助于治疗癌症的或具有用于治疗癌症或有助于治疗癌症的已知特征的试剂。特别地，化学治疗剂包括促凋亡剂、细胞生长抑制剂和/或细胞毒性剂。在一些实施方式中，例如，如本文所述，化学治疗剂可以是或包括烷化剂、蒽环类、细胞骨架破坏剂(例如微管靶向部分，例如紫杉烷、美登素及其类似物)、埃坡霉素、组蛋白脱乙酰酶抑制剂HDAC)、拓扑异构酶抑制剂(例如抑制剂拓扑异构酶I和/或拓扑异构酶II)、激酶抑制剂、核苷酸类似物或核苷酸前体类似物、肽抗生素、铂类药物、维甲酸类、长春花生物碱了和/或具有相关抗增殖活性的类似物。在一些特定实施方式中，例如，如本文所述，化学治疗剂可以是或包括放线菌素、全反式视黄酸、奥瑞他汀、阿扎胞苷、硫唑嘌呤、博来霉素、硼替佐米、卡铂、卡培他滨、顺铂、氯霉素、环磷酰胺、姜黄素、阿糖胞苷、柔红霉素、多西紫杉醇、多西氟尿苷、多柔比星、表柔比星、埃坡霉素、依托泊苷、氟尿嘧啶、吉西他滨、羟基脲、伊达比星、伊马替尼、伊立替康、美登素和/或其类似物(如DM1)、氮芥、巯嘌呤、甲氨蝶呤、米托蒽醌、美坦素、奥沙利铂、紫杉醇、培美曲塞、泰尼泊苷、硫鸟嘌呤、托泊替康、戊柔比星、长春碱、长春新碱、长春地辛、长春瑞滨或其组合。在一些实施方式中，例如，如本文所述，可以在抗体-药物偶联物的上下文中使用化学治疗剂。在一些实施方式中，例如，如本文所述，化学治疗剂是在抗体-药物缀合物中发现的一种，其选自由以下组成的组：hLL1-多柔比星、hRS7-SN-38、hMN-14-SN-38、hLL2-SN-38、hA20-SN-38、hPAM4-SN-38、hLL1-SN-38、hRS7-Pro-2-P-Dox、hMN-14-Pro-2-P-Dox、hLL2-Pro-2-P-Dox、hA20-Pro-2-P-Dox、hPAM4-Pro-2-P-Dox、hLL1-Pro-2-P-Dox、P4/D10-多柔比星、吉妥珠单抗奥佐米星、本妥昔单抗、曲妥珠单抗、奥英妥珠单抗、格巴妥莫单抗(glembatumomab vedotin)、SAR3419、SAR566658、BIIB015、BT062、SGN-75、SGN-CD19A、AMG-172、AMG-595、BAY-94-9343、ASG-5ME、ASG-22ME、ASG-16M8F、MDX-1203、MLN-0264、anti-PSMA ADC、RG-7450、RG-7458、RG-7593、RG-7596、RG-7598、RG-7599、RG-7600、RG-7636、ABT-414、IMGN-853、IMGN-529、玛汀-沃瑟妥珠单抗(vorsetuzumab mafodotin)和莫星-洛沃妥珠单抗(lorvotuzumab mertansine)。在一些实施方式中，例如，如本文所述，化学治疗剂可以是或包含法呢基-硫代水杨酸(FTS)、4-(4-氯-2-甲基苯氧基)-N-羟基丁酰胺(CMH)、雌二醇(E2)、四甲氧基芪(TMS)、δ-生育三烯酚、盐霉素或姜黄素。

联合疗法：如本文所用，术语“联合疗法”是指向受试者施用两种或更多种试剂或方案，使得两种或更多种试剂或方案一起治疗受试者的疾病、病症或状况。在一些实施方式中，例如，如本文所述，两种或更多种治疗剂或方案可以同时、顺序或以重叠给药方案施用。本领域技术人员将理解，联合疗法包括但不要求将两种试剂或方案在单一组合物中一起施用，也不是同时施用。

可比较：如本文所用，术语“可比较”是指两个以上条件、环境、试剂、实体、群体等的组，它们可能彼此不相同，但足够相似以允许在之间进行比较，使得本领域技术人员将理解可以基于观察到的差异或相似性合理地得出结论。在一些实施方式中，例如，如本文所述，条件、环境、试剂、实体、群体等的可比较组通常以多个基本上相同的特征和零个、一个或多个不同的特征为特征。本领域普通技术人员将理解，在上下文中，需要何种程度的同一性才能使组中的成员是可比较的。例如，本领域普通技术人员将理解，当以足够数量和类型的基本上相同的特征为特征以保证观察到的差异可以全部或部分归因于其不相同的特征的合理结论。

可检测部分：如本文所用，术语“可检测部分”是指可检测的任何元素、分子、官能团、化合物、片段或其他部分。在一些实施方式中，例如，如本文所述，可检测部分单独提供或使用。在一些实施方式中，例如，如本文所述，提供和/或利用与另一试剂相关联(例如，连接至另一试剂)的可检测部分。可检测部分的实例包括但不限于各种配体、放射性同位素(例如³H、¹⁴C、¹⁸F、¹⁹F、³²P、³⁵S、¹³⁵I、¹²⁵I、¹²³I、⁶⁴Cu、¹⁸⁷Re、¹¹¹In、⁹⁰Y、^99mTc、¹⁷⁷Lu、⁸⁹Zr等)、荧光染料、化学发光剂、生物发光剂、光谱可分辨的无机荧光半导体纳米晶体(即量子点)、金属纳米颗粒、纳米团簇、顺磁性金属离子、酶、比色标记、生物素、地高辛(dioxigenin)、半抗原和可获得抗血清或单克隆抗体的蛋白质。

诊断：如本文所用，术语“诊断”是指确定受试者是否患有或将发展疾病、病症、状况或状态，和/或定量概率的定性。例如，在癌症的诊断中，诊断可以包括关于癌症的风险、类型、阶段、恶性度或其他分类的确定。在一些情况下，例如，如本文所述，诊断可以是或包括与预后和/或对一种或多种一般或特定治疗剂或方案的可能响应有关的确定。

诊断信息：如本文所用，术语“诊断信息”是指可用于提供诊断的信息。诊断信息可以包括但不限于生物标志物状态信息。

差异甲基化：如本文所用，术语“差异甲基化”描述了甲基化状态在第一条件和第二条件之间不同的甲基化位点。差异甲基化的甲基化位点可称为差异甲基化位点。在一些情况下，例如，如本文所述，DMR由通过使用寡核苷酸引物扩增产生的扩增子定义，例如，选择用于扩增DMR或扩增存在于扩增子中的感兴趣的DNA区域的一对寡核苷酸引物。在一些情况下，例如，如本文所述，DMR被定义为由一对寡核苷酸引物扩增的DNA区域，包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区域。在一些情况下，例如，如本文所述，DMR被定义为由一对寡核苷酸引物扩增的DNA区域，不包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区域。如本文所用，具体提供的DMR可以通过相关基因的名称后接起始位置的三位数字来明确标识，使得例如在ALK的位置29921434处开始的DMR可以标识为ALK'434。

差异甲基化区域：如本文所用，术语“差异甲基化区域”(DMR)是指包含一个或多个差异甲基化位点的DNA区域。在选定的感兴趣的条件下，例如癌症状态，包括更多数量或频率的甲基化位点的DMR可以被称为高甲基化DMR。在选定的感兴趣的条件下，例如癌症状态，包括较少数量或频率的甲基化位点的DMR可以被称为低甲基化DMR。作为结肠直肠癌甲基化生物标志物的DMR可称为结肠直肠癌DMR。。在一些情况下，例如，如本文所述，DMR可以是单个核苷酸，所述单个核苷酸是甲基化位点。在一些情况下，例如，如本文所述，DMR的长度为至少10，至少15，至少20，至少24，至少50或至少75个碱基对。在一些情况下，例如，如本文所述，DMR的长度为小于1000，小于750，小于500，小于350，小于300或小于250个碱基对(例如，其中使用定量聚合酶链式反应(qPCR)，例如甲基化灵敏度限制酶定量聚合酶链式反应(MSRE-qPCR)确定甲基化状态)。在一些情况下，例如，如本文所述，作为晚期腺瘤的甲基化生物标记的DMR也可用于鉴定结肠直肠癌。

DNA区：如本文所用，“DNA区”是指较大DNA分子的任何连续部分。本领域技术人员将熟悉用于确定第一DNA区和第二DNA区是否对应的技术，例如基于第一DNA区和第二DNA区的序列相似性(例如，序列同一性或同源性)和/或上下文(例如，第一DNA区和第二DNA区上游和/或下游的核酸的序列同一性或同源性)。

除非本文另有说明，在人类中发现的或与人类相关的序列(例如，与人类DNA杂交的序列)发现于、基于和/或衍生自实例代表性的人基因组序列，其通常称为和本领域技术人员已知为智人(人类)基因组组装GRCh38、hg38和/或基因组参考联盟Human Build 38。本领域技术人员将进一步理解，hg38的DNA区可以通过已知系统提及，所述已知系统包括根据指定的编号鉴定特定核苷酸位置或其范围。

给药方案：如本文所用，术语“给药方案”可以指一组施用于受试者的一个或多个相同或不同的单位剂量，通常包括多个单位剂量施用，其中每个单位剂量施用与其他单位剂量施用间隔一段时间。在各种实施方式中，例如，如本文所述，给药方案的一个或多个或所有单位剂量可以相同或可以变化(例如，随时间增加、随时间减少，或根据受试者和/或医生的决定进行调整)。在各种实施方式中，例如，如本文所述，每个剂量之间的一个或多个或所有时间段可以相同或可以变化(例如，随时间增加、随时间减少或根据受试者和/或医生的决定进行调整)。在一些实施方式中，例如，如本文所述，给定的治疗剂具有推荐的给药方案，其可以涉及一个或多个剂量。通常，市售药物的至少一个推荐给药方案是本领域技术人员已知的。在一些实施方式中，例如，如本文所述，当跨相关人群施用时，给药方案与期望的或有益的结果相关(即，是治疗性给药方案)。

下游：如本文所用，术语“下游”是指第一DNA区相对于第二DNA区更靠近包括第一DNA区和第二DNA区的核酸的C末端。

基因：如本文所用，术语“基因”是指例如在染色体中的单个DNA区，其包括编码产物(例如，RNA产物和/或多肽产物)的编码序列，连同所有、一些或没有有助于调节编码序列表达的DNA序列。在一些实施方式中，例如，如本文所述，基因包括一个或多个非编码序列。在一些特定实施方式中，例如，如本文所述，基因包括外显子和内含子序列。在一些实施方式中，例如，如本文所述，基因包括一种或多种调控元件，其例如可以控制或影响基因表达的一个或多个方面(例如，细胞类型特异性表达、诱导性表达等)。在一些实施方式中，例如，如本文所述，基因包括启动子。在一些实施方式中，例如，如本文所述，基因包括(i)在编码序列上游延伸预定数量的核苷酸的DNA核苷酸和(ii)在编码序列下游延伸预定数量的核苷酸的DNA核苷酸中的一者或两者。在各种实施方式中，例如，如本文所述，预定数量的核苷酸可以是500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。

同源性：如本文所用，术语“同源性”是指聚合性分子之间，例如核酸分子(例如，DNA分子和/或RNA分子)之间和/或多肽分子之间的总体相关性。本领域技术人员将理解同源性可以定义为例如百分比同一性或百分比同源性(序列相似性)。在一些实施方式中，例如，如本文所述，如果聚合性分子的序列具有至少25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或99％同一性，则其被认为是具有“同源性”。在一些实施方式中，例如，如本文所述，如果聚合物分子的序列具有至少25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或99％相似性，则其被认为是具有“同源性”。

杂交：如本文所用，“杂交”是指第一核酸与第二核酸结合以形成双链结构，该结合通过核苷酸的互补配对发生。本领域技术人员将认识到，互补序列尤其可以杂交。在各种实施方式中，杂交可发生在例如具有至少70％互补性，例如至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％互补性的核苷酸序列之间。本领域技术人员将进一步理解第一核酸和第二核酸的杂交是否发生可取决于各种反应条件。可以发生杂交的条件是本领域已知的。

低甲基化：如本文所用，术语“低甲基化”是指与参考状态相比，在感兴趣的状态中甲基化核苷酸至少一个少一个的甲基化基因座的状态(例如，与健康对照相比在结肠直肠癌中甲基化核苷酸至少少一个)。

高甲基化：如本文所用，术语“高甲基化”是指与参考状态相比在感兴趣的状态中甲基化核苷酸至少一个多一个的甲基化基因座的状态(例如，与健康对照相比在结肠直肠癌中甲基化核苷酸至少多一个)。

同一性、同一：如本文所用，术语“同一性”是指聚合性分子之间，例如核酸分子(例如，DNA分子和/或RNA分子)之间和/或多肽分子之间的总体相关性。计算两个提供的序列之间的百分比同一性的方法是本领域已知的。两个核酸或多肽序列的百分比同一性的计算，例如，可以通过比对两个序列(或一个或两个序列的互补序列)以实现最佳比较目的(例如，可以在第一序列和第二序列中的一个或两个中引入缺口以用于最佳比对，以及出于比较目的可以忽略不相同的序列)。然后比较相应位置处的核苷酸或氨基酸。当第一序列中的一个位置被与第二个序列中的相应位置相同的残基(例如，核苷酸或氨基酸)占据时，则分子在该位置是相同的。两个序列之间的百分比同一性是序列共享的相同位置数量的函数，并且可选地考虑缺口的数量和每个缺口的长度，可能需要引入其以实现两个序列的最佳比对。序列的比较和两个序列之间同一性百分比的确定可以使用计算算法来完成，例如BLAST(基本局部比对搜索工具)。

“改善”、“增加”或“减少”：如本文所用，这些术语或语法上可比较的比较术语表示相对于可比较的参考测量的值。例如，在一些实施方式中，例如，如本文所述，相对于使用可比较的参考试剂或没有试剂获得的评估值，使用感兴趣的试剂实现的评估值可以“提高”。替代地或另外地，在一些实施方式中，例如，如本文所述，相对于在不同条件下或在不同时间点(例如，在诸如施用感兴趣的试剂等事件之前或之后)在相同受试者或系统中获得的评估值，或在不同的比比较的受试者中(例如，在可比较的受试者或系统中，其与感兴趣的受试者或系统不同之处在于存在一种或多种特定疾病、感兴趣的障碍或状况，或之前接触过某种状况或试剂等)，在感兴趣受试者或系统中的评估值可以“提高”。在一些实施方式中，例如，如本文所述，比较性术语指的是统计相关的差异(例如，足以实现统计相关性的普遍性和/或量级的差异)。本领域技术人员将意识到或将能够容易地确定在给定上下文中需要或足以实现此类统计显著性的差异的程度和/或普遍性。

甲基化：如本文所用，术语“甲基化”包括在(i)胞嘧啶的C5位置；(ii)胞嘧啶的N4位置；(iii)腺嘌呤的N6位置中的任何位置处的甲基化。甲基化还包括(iv)其他类型的核苷酸甲基化。甲基化的核苷酸可称为“甲基化核苷酸”或“甲基化核苷酸碱基”。在某些实施方式中，例如，如本文所述，甲基化特指胞嘧啶残基的甲基化。在某些情况下，甲基化特指存在于CpG位点中的胞嘧啶残基的甲基化。

甲基化测试：如本文所用，术语“甲基化测试”是指可用于确定甲基化基因座的甲基化状态的任何技术。

甲基化生物标志物：如本文所用，术语“甲基化生物标志物”是指生物标志物，其是或包括至少一个甲基化基因座和/或至少一个甲基化基因座的甲基化状态，例如高甲基化基因座。特别地，甲基化生物标志物是一种生物标志物，其特征在于一个或多个核酸基因座的甲基化状态在第一状态和第二状态之间(例如，在癌性状态和非癌性状态之间)的变化。

甲基化基因座：如本文所用，术语“甲基化基因座”是指包含至少一个差异甲基化区域的DNA区。在选定的感兴趣的条件下，例如癌症状态，包括更多数量或频率的甲基化位点的甲基化基因座可以被称为高甲基化基因座。在选定的感兴趣的条件下，例如癌症状态，包括较少数量或频率的甲基化位点的甲基化基因座可以被称为低甲基化基因座。在一些情况下，例如，如本文所述，甲基化基因座的长度为至少10，至少15，至少20，至少24，至少50或至少75个碱基对。在一些情况下，例如，如本文所述，甲基化基因座的长度为小于1000，小于750，小于500，小于350，小于300或小于250个碱基对(例如，其中使用定量聚合酶链式反应(qPCR)，例如甲基化灵敏度限制酶定量聚合酶链式反应(MSRE-qPCR)确定甲基化状态)。

甲基化位点：如本文所用，甲基化位点是指在至少一种条件下被甲基化的核苷酸或核苷酸位置。在其甲基化状态下，甲基化位点可称为甲基化的位点。

甲基化状态：如本文所用，“甲基化状态”、“甲基化态”或“甲基化谱”是指甲基化基因座内甲基化位点处甲基化的数量、频率或模式。因此，第一状态和第二状态之间甲基化状态的变化可以是或包括甲基化位点的数量、频率或模式的增加，或者可以是或包括甲基化位点的数量、频率或模式的减少。在各种情况下，甲基化状态的变化是甲基化值的变化。

甲基化值：如本文所用，术语“甲基化值”是指甲基化状态的数字表示，例如，以代表甲基化基因座甲基化频率或比率的数字形式。在一些情况下，例如，如本文所述，甲基化值可以通过包括在用甲基化依赖性限制酶对样品进行限制性消化后定量样品中存在的完整核酸的量的方法产生。在一些情况下，例如，如本文所述，甲基化值可以通过包括在样品的亚硫酸氢盐反应之后比较扩增谱的方法产生。在一些情况下，例如，如本文所述，可以通过比较亚硫酸氢盐处理的和未处理的核酸的序列来产生甲基化值。在一些情况下，例如，如本文所述，甲基化值是或包括或基于定量PCR结果。

核酸：如本文所用，在其最广泛的意义上，术语“核酸”是指被引入或可以引入寡核苷酸链中的任何化合物和/或物质。在一些实施方式中，例如，如本文所述，核酸是通过磷酸二酯键引入或可以引入寡核苷酸链中的化合物和/或物质。从上下文中将清楚，在一些实施方式中，例如，如本文所述，术语核酸指单体核酸残基(例如，核苷酸和/或核苷)，并且在一些实施方式中，例如，如本文所述，指包含多个单体核酸残基的多核苷酸链。核酸可以是或包括DNA、RNA或其组合。核酸可包括天然核酸残基、核酸类似物和/或合成残基。在一些实施方式中，例如，如本文所述，核酸包括天然核苷酸(例如，腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)。在一些实施方式中，例如，如本文所述，核酸是或包括一种或多种核苷酸类似物(例如，2-氨基腺苷、2-硫胸苷、肌苷、吡咯-嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5-丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟嘌呤、2-硫胞苷、甲基化碱基、嵌入碱基及其组合)。

在一些实施方式中，例如，如本文所述，核酸具有编码功能基因产物例如RNA或蛋白质的核苷酸序列。在一些实施方式中，例如，如本文所述，核酸包括一个或多个内含子。在一些实施方式中，例如，如本文所述，核酸包括一个或多个基因。在一些实施方式中，例如，如本文所述，核酸通过从天然来源分离、通过基于互补模板的聚合酶促合成(体内或体外)、在重组细胞或系统中繁殖和化学合成中的一种或多种来制备。

在一些实施方式中，例如，如本文所述，核酸类似物与核酸的不同之处在于它不利用磷酸二酯骨架。例如，在一些实施方式中，例如，如本文所述，核酸可以包括一种或多种肽核酸，其是本领域已知的并且在主链中具有肽键而不是磷酸二酯键。作为选择或另外，在一些实施方式中，例如，如本文所述，核酸具有一个或多个硫代磷酸酯和/或5'-N-亚磷酰胺键而不是磷酸二酯键。在一些实施方式中，例如，如本文所述，与天然核酸中的那些相比，核酸包含一种或多种经修饰的糖(例如，2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。

在一些实施方式中，例如，如本文所述，核酸是或包括至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、1 10、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个残基。在一些实施方式中，例如，如本文所述，核酸部分或完全是单链的，或者部分或完全是双链的。

核酸检测测试：如本文所用，术语“核酸检测测试”是指确定感兴趣核酸的核苷酸组成的任何方法。核酸检测测试包括但不限于DNA测序方法、基于聚合酶链式反应的方法、探针杂交方法、连接酶链反应等。

核苷酸：如本文所用，术语“核苷酸”是指例如DNA和/或RNA聚合物的多核苷酸的结构组分或构件。核苷酸包括碱基(例如，腺嘌呤、胸腺嘧啶、尿嘧啶、鸟嘌呤或胞嘧啶)和糖分子和至少一个磷酸基团。如本文所用，核苷酸可以是甲基化的核苷酸或未甲基化的核苷酸。本领域技术人员将理解，核酸术语，例如“基因座”或“核苷酸”可以指单个核酸分子的基因座或核苷酸和/或指基因座的累积群体或代表基因座或核苷酸的多个核酸(例如样品和/或受试者的代表中的多个核酸)中的核苷酸(例如，具有相同的相同核酸序列和/或核酸序列背景，或具有基本上相同的核酸序列和/或核酸背景)。

寡核苷酸引物：如本文所用，术语寡核苷酸引物或引物是指使用、能够使用或用于从模板核酸分子产生扩增子的核酸分子。在允许转录的条件下(例如，在核苷酸和DNA聚合酶的存在下，以及在合适的温度和pH值下)，寡核苷酸引物可以提供从与寡核苷酸引物杂交的模板的转录起始点。通常，寡核苷酸引物是长度为5至200个核苷酸的单链核酸。本领域技术人员将理解用于从模板核酸分子产生扩增子的最佳引物长度可随包括温度参数、引物组成和转录或扩增方法在内的条件而变化。如本文所用，一对寡核苷酸引物是指分别与模板双链核酸分子的第一链和第二链互补的一组两条寡核苷酸引物。就模板核酸链而言，一对寡核苷酸引物的第一成员和第二成员可分别称为“正向”寡核苷酸引物和“反向”寡核苷酸引物，因为正向寡核苷酸引物能够和与模板核酸链互补的核酸链杂交，反向寡核苷酸引物能够与模板核酸链杂交，并且正向寡核苷酸引物相对于模板核酸链的位置为反向寡核苷酸引物序列相对于模板核酸链的位置的5'。本领域技术人员将理解，第一寡核苷酸引物和第二寡核苷酸引物分别作为正向寡核苷酸引物和反向寡核苷酸引物的鉴定是任意的，因为这些标识符取决于给定的核酸链或其互补物是否被用作模板核酸分子。

重叠：术语“重叠”在本文中用于指DNA的两个区域，每个区域包含与另一区域中相同长度的子序列基本相同的子序列(例如，DNA的两个区域具有共同的子序列)。“基本上相同”是指两个相同长度的子序列相差少于给定数目的碱基对。在某些情况下，例如，如本文所述，长度为至少20个碱基对的每个子序列彼此相差少于4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少24个碱基对的每个子序列相差少于5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少50个碱基对的每个子序列相差少于10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少100个碱基对的每个子序列相差少于20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少200个碱基对的每个子序列相差少于40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少250个碱基对的每个子序列相差少于50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少300个碱基对的每个子序列相差少于60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少500个碱基对的每个子序列相差少于100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，长度为至少1000个碱基对的每个子序列相差少于200、100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％，至少85％，至少90％，至少95％相似性，至少97％相似性，至少98％相似性，至少99％相似性或至少99.5％相似性)。在某些情况下，例如，如本文所述，DNA的两个区域中的第一区域的子序列可包含DNA的两个区域中的第二区域的全部(或反之亦然)(例如，共同子序列可或两个区域的全部)。

药物组合物：如本文所用，术语“药物组合物”是指其中活性剂与一种或多种药学上可接受的载体一起配制的组合物。在一些实施方式中，例如，如本文所述，活性剂以适合施用于受试者的单位剂量量存在，例如，在当施用于相关人群时显示达到预定治疗效果的统计学显著概率的治疗方案中。在一些实施方式中，例如，如本文所述，药物组合物可以配制用于以特定形式(例如，以固体形式或液体形式)施用，和/或可以特别适用于，例如：口服施用(例如，作为药液)(水溶液或非水溶液或混悬液)、片剂、胶囊剂、大丸剂(bolus)、粉剂、颗粒剂、糊剂等，其可专门配制用于例如口腔、舌下或全身吸收)；肠胃外施用(例如，通过皮下、肌内、静脉内或硬膜外注射，例如无菌溶液或混悬液，或缓释制剂等)；局部应用(例如，作为乳膏、软膏、贴剂或喷雾剂应用于例如皮肤、肺或口腔)；阴道内或直肠内施用(例如，作为子宫托、栓剂、乳膏或泡沫)；眼部施用；鼻或肺施用等。

药学上可接受的：如本文所用，术语“药学上可接受的”适用于用于配制本文公开的组合物的一种或多种或所有组分，是指每种组分必须与组合物的其他成分相容。组合物并且对其接收者无害。

药学上可接受的载体：如本文所用，术语“药学上可接受的载体”是指促进配制和/或改变试剂例如药物试剂的生物利用度的药学上可接受的材料、组合物或载体，例如液体或固体填充剂、稀释剂、赋形剂或溶剂包封材料。可用作药学上可接受的载体的材料的一些实例包括：糖类，例如乳糖、葡萄糖和蔗糖；淀粉，如玉米淀粉和马铃薯淀粉；纤维素及其衍生物，如羧甲基纤维素钠、乙基纤维素和醋酸纤维素；黄蓍胶粉；麦芽；明胶；滑石；赋形剂，如可可脂和栓剂蜡；油类，如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和豆油；二醇类，如丙二醇；多元醇，如甘油、山梨糖醇、甘露糖醇和聚乙二醇；酯类，如油酸乙酯、月桂酸乙酯；琼脂；缓冲剂，如氢氧化镁和氢氧化铝；海藻酸；无热原水；等渗盐水；林格氏溶液；乙醇；pH缓冲溶液；聚酯、聚碳酸酯和/或聚酐；和其他用于药物制剂的无毒相容性物质。

预防或防止：如本文所用的与疾病、病症或状况的发生相关的术语“预防”和“防止”是指降低发生疾病、病症或状况的风险；延迟疾病、病症或状况的发作；延迟疾病、病症或状况的一种或多种特征或症状的发作；和/或降低疾病、病症或状况的一种或多种特征或症状的频率和/或严重性。预防可以指对特定受试者的预防或对受试者群体的统计影响。当疾病、病症或状况的发作延迟了预定的时间段时，可以认为预防是完全的。

探针：如本文所用，术语“探针”是指能够与互补靶标杂交并包括可检测部分的单链或双链核酸分子。在某些实施方式中，例如，如本文所述，探针是限制性消化产物或合成产生的核酸，例如通过重组或扩增产生的核酸。在一些情况下，例如，如本文所述，探针是可用于检测、鉴定和/或分离靶序列例如基因序列的捕获探针。在各种情况下，例如，如本文所述，探针的可检测部分可以是例如酶(例如ELISA，以及基于酶的组织化学分析)、荧光部分、放射性部分或与发光信号相关的部分。

预后：如本文所用，术语“预后”是指确定至少一种可能的未来结果或事件的定量概率的定性。如本文所用，预后可以是对受试者中疾病、病症或状况例如癌症的可能进程的确定，关于受试者预期寿命的确定，或关于对治疗(例如特殊疗法)的响应的确定。

预后信息：如本文所用，术语“预后信息”是指可用于提供预后的信息。预后信息可包括但不限于生物标志物状态信息。

启动子：如本文所用，“启动子”可以指直接或间接(例如，通过启动子结合的蛋白质或物质)与RNA聚合酶结合并参与编码序列转录起始的DNA调控区。

参考：如本文所用，描述了相对于其进行比较的标准或对照。例如，在一些实施方式中，例如，如本文所述，将感兴趣的试剂、受试者、动物、个体、群体、样品、序列或值与参考或对照试剂、受试者、动物、个体、群体、样品、序列或值进行比较。在一些实施方式中，例如，如本文所述，与感兴趣样品中的特征的测试或确定基本上同时地测试和/或确定参考或其特征。在一些实施方式中，例如，如本文所述，参考是历史参考，可选地体现在有形媒介中。通常，如本领域技术人员将理解的，参考是在与评估中的那些可比较的条件或环境下确定或表征，例如，关于样品。当存在足够的相似性以证明对特定可能参考或对照的依赖和/或比较是合理的时，本领域技术人员将理解。

风险：如本文所用，关于疾病、病症或状况，术语“风险”是指特定个体发展疾病、病症或状况的定量概率(无论以百分比或其他方式表示)的定性。在一些实施方式中，例如，如本文所述，风险表示为百分比。在一些实施方式中，例如，如本文所述，风险是等于或大于0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100％的定量概率的定性。在一些实施方式中，例如，如本文所述，风险被表达为相对于参考风险或水平的风险或归因于参考的相同结果的风险的定量水平的定性。在一些实施方式中，例如，如本文所述，相对风险与参考样品相比增加或减少了的系数为1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10或更多。

样品：如本文所用，术语“样品”通常是指从感兴趣的来源获得或衍生的材料的等分试样。在一些实施方式中，例如，如本文所述，感兴趣的来源是生物或环境来源。在一些实施方式中，例如，如本文所述，样品是直接从感兴趣的来源获得的“原始样品”。在一些实施方式中，例如，如本文所述，从上下文中将清楚，术语“样品”是指通过处理原始样品(例如，通过去除一种或多种成分和/或通过将一种或多种试剂添加到原始样品中)获得的制剂。这样的“处理过的样品”可以包括例如从样品中提取的或通过使原始样品经受诸如核酸的扩增或逆转录、某些成分的分离和/或纯化等技术获得的细胞、核酸或蛋白质，等等。

在某些情况下，例如，如本文所述，处理过的样品可以是已被扩增(例如，预扩增)的DNA样品。因此，在各种情况下，例如，如本文所述，鉴定的样品可以指样品的原始形式或样品的加工形式。在一些情况下，例如，如本文所述，酶消化的DNA样品可以指初级酶消化的DNA(酶消化的直接产物)或进一步加工的样品，例如酶消化的DNA，其已经经过扩增步骤(例如，中间扩增步骤，例如预扩增)和/或过滤步骤、纯化步骤或修饰样品的步骤以促进进一步的步骤，例如在确定甲基化状态(例如，DNA的原始样品的甲基化状态和/或存在于其原始来源背景中的DNA的原始样品的甲基化状态)。

筛查：如本文所用，术语“筛查”是指旨在生成诊断信息和/或预后信息的任何方法、技术、过程或任务。因此，本领域技术人员将理解，术语筛查涵盖确定个体是否患有、可能患有或发展、或有风险患有或发展疾病、病症或状况，例如，结肠直肠癌的方法、技术、过程或任务。

特异性：如本文所用，生物标志物的“特异性”是指以不存在感兴趣的事件或状态为特征的样品的百分比，对此，生物标志物的测量准确地表明不存在感兴趣的事件或状态(真阴性率)。在各种实施方式中，例如，如本文所述，阴性样品的表征不依赖于生物标志物，并且可以通过任何相关测量来实现，例如本领域技术人员已知的任何相关测量。因此，特异性反映了当在未表征感兴趣的事件或状态的样品中测量时生物标志物检测不存在感兴趣的事件或状态的概率。在其中感兴趣的事件或状态是结肠直肠癌的特定实施方式中，例如，如本文所述，特异性是指生物标志物检测没有结肠直肠癌的受试者中没有结肠直肠癌的概率。例如，可以通过组织学来确定没有结肠直肠癌。

灵敏度：如本文所用，生物标志物的“灵敏度”是指以存在感兴趣的事件或状态为特征的样品的百分比，对此，生物标志物的测量准确地表明存在感兴趣的事件或状态(真阳性率)。在各种实施方式中，例如，如本文所述，阳性样品的表征不依赖于生物标志物，并且可以通过任何相关测量来实现，例如本领域技术人员已知的任何相关测量。因此，灵敏度反映了当在以存在感兴趣的事件或状态为特征的样品中测量时，生物标志物将检测到感兴趣的事件或状态存在的概率。在其中感兴趣的事件或状态是结肠直肠癌的特定实施方式中，例如，如本文所述，灵敏度是指生物标志物检测患有结肠直肠癌的受试者中是否存在结肠直肠癌的概率。结肠直肠癌的存在可以例如通过组织学来确定。

实体瘤：如本文所用，术语“实体瘤”是指包括癌细胞在内的异常组织块。在各种实施方式中，例如，如本文所述，实体瘤是或包括不包含囊肿或液体区域的异常组织块。在一些实施方式中，例如，如本文所述，实体瘤可以是良性的；在一些实施方式中，实体瘤可以是恶性的。实体瘤的例子包括癌、淋巴瘤和肉瘤。在一些实施方式中，例如，如本文所述，实体瘤可以是或包括肾上腺、胆管、膀胱、骨、脑、乳腺、子宫颈、结肠、子宫内膜、食道、眼睛、胆囊、胃肠道、肾、喉、肝、肺、鼻腔、鼻咽、口腔、卵巢、阴茎、垂体、前列腺、视网膜、唾液腺、皮肤、小肠、胃、睾丸、胸腺、甲状腺、子宫、阴道和/或外阴肿瘤。

癌症分期：如本文所用，术语“癌症分期”是指对癌症进展水平的定性或定量评估。在一些实施方式中，例如，如本文所述，用于确定癌症分期的标准可以包括但不限于癌症在身体中的位置、肿瘤大小、癌症是否已经扩散到淋巴结、癌症是否已经扩散到身体的一个或多个不同部位等。在一些实施方式中，例如，如本文所述，可以使用所谓的TNM系统对癌症进行分期，根据该系统，T是指主要肿瘤的大小和范围，通常称为原发肿瘤；N是指附近有癌症的淋巴结数量；M是指癌症是否已经转移。在一些实施方式中，例如，如本文所述，癌症可被称为0期(存在异常细胞但尚未扩散到附近组织，也称为原位癌或CIS；CIS不是癌症，但它可以变成癌症)、I-III期(存在癌症；数字越大，肿瘤越大，扩散到附近组织越多)，或IV期(癌症已扩散到身体的远处部位)。在一些实施方式中，例如，如本文所述，癌症可被指定为选自由以下组成的组的阶段：原位(存在异常细胞但未扩散至附近组织)；局部(癌症仅限于它开始的地方，没有扩散的迹象)；区域性(癌症已经扩散到附近的淋巴结、组织或器官)：远处(癌症已经扩散到身体的远处部位)；和未知(没有足够的信息来鉴定癌症分期)。

对……易感：对疾病、病症或状况“易感”的个体有风险发展该疾病、病症或状况。在一些实施方式中，例如，如本文所述，对疾病、病症或状况易感的个体不表现出该疾病、病症或状况的任何症状。在一些实施方式中，例如，如本文所述，对疾病、病症或状况易感的个体尚未被诊断出患有该疾病、病症和/或状况。在一些实施方式中，例如，如本文所述，对疾病、病症或状况易感的个体是已经暴露于与疾病、病症或状况的发展相关的状况或呈现与疾病、病症或状况的发展相关的生物标志物状态(例如甲基化状态)的个体。在一些实施方式中，例如，如本文所述，发展疾病、病症和/或状况的风险是基于人群的风险(例如，患有疾病、病症或状况的个体的家庭成员)。

受试者：如本文所用，术语“受试者”是指生物体，通常是哺乳动物(例如，人)。在一些实施方式中，例如，如本文所述，受试者患有疾病、病症或状况。在一些实施方式中，例如，如本文所述，受试者对疾病、病症或状况易感。在一些实施方式中，例如，如本文所述，受试者表现出疾病、病症或状况的一个或多个症状或特征。在一些实施方式中，例如，如本文所述，受试者未患有疾病、病症或状况。在一些实施方式中，例如，如本文所述，受试者不表现出疾病、病症或状况的任何症状或特征。在一些实施方式中，例如，如本文所述，受试者是具有对疾病、病症或状况的易感性或风险为特征的一种或多种特性的人。在一些实施方式中，例如，如本文所述，受试者是患者。在一些实施方式中，例如，如本文所述，受试者是已对其进行诊断和/或已对其进行治疗的个体。在某些情况下，例如，如本文所述，人类受试者可以互换地称为“个体”。

治疗剂：如本文所用，术语“治疗剂”是指当施用于受试者时引起所需药理学作用的任何试剂。在一些实施方式中，例如，如本文所述，如果一种试剂在合适的人群中表现出统计学上显著的效果，则该试剂被认为是治疗剂。在一些实施方式中，例如，如本文所述，合适的群体可以是模型生物体群体或人类群体。在一些实施方式中，例如，如本文所述，合适的群体可以通过各种标准定义，例如特定年龄组、性别、遗传背景、预先存在的临床状况等。在一些实施方式中，例如，如本文所述，治疗剂是可用于治疗疾病、病症或状况的物质。在一些实施方式中，例如，如本文所述，治疗剂是在其可上市用于施用于人类之前已经或需要由政府机构批准的试剂。在一些实施方式中，例如，如本文所述，治疗剂是需要医学处方才能施用于人类的试剂。

治疗有效量：如本文所用，术语“治疗有效量”是指产生所施用的所需效果的量。在一些实施方式中，例如，如本文所述，该术语是指当根据治疗给药方案向患有或易患疾病、病症或状况的群体施用时足以治疗该疾病、病症或状况的量。本领域普通技术人员将理解，术语治疗有效量实际上并不需要在特定个体中实现成功治疗。相反，治疗有效量可以是当施用于需要此类治疗的个体时在大量受试者中提供特定所需药理学响应的量。在一些实施方式中，例如，如本文所述，提及治疗有效量可以是提及在一种或多种特定组织(例如，受疾病、病症或状况影响的组织)或流体(例如，血液、唾液、血清、汗水、眼泪、尿液等)中测量的量。本领域普通技术人员将理解，在一些实施方式中，治疗有效量的特定试剂可以以单一剂量配制和/或施用。在一些实施方式中，例如，如本文所述，治疗有效的试剂可以以多个剂量配制和/或施用，例如，作为多剂量给药方案的一部分。

治疗：如本文所用，术语“治疗”(也称为“治疗”或“治疗”)是指施用部分或完全减轻、改善、缓解、抑制、延迟特定疾病、病症或状况的发作、降低特定疾病、病症或状况的严重程度和/或降低特定疾病、病症或状况的一种或多种症状、特征和/或原因的发生率，或为实现任何此类结果的目的而施用。在一些实施方式中，例如，如本文所述，此类治疗可以针对不表现出相关疾病、病症或状况的迹象的受试者和/或仅表现出疾病、病症或状况的早期征兆的受试者。作为选择或另外，此类治疗可以针对表现出相关疾病、病症和/或状况的一种或多种确定迹象的受试者。在一些实施方式中，例如，如本文所述，治疗可以针对已被诊断患有相关疾病、病症和/或状况的受试者。在一些实施方式中，例如，如本文所述，治疗可以针对已知具有一种或多种易感因素的受试者，所述一种或多种易感因素与相关疾病、病症或状况的发展风险增加在统计学上相关。在各种实例中，治疗是针对癌症的。

上游：如本文所用，术语“上游”是指第一DNA区相对于第二DNA区更靠近包括第一DNA区和第二DNA区的核酸的N末端。

单位剂量：如本文所用，术语“单位剂量”是指作为单一剂量和/或以药物组合物的物理离散单位施用的量。在许多实施方式中，例如，如本文所述，单位剂量包含预定量的活性剂。在一些实施方式中，例如，如本文所述，单位剂量包含完整的单一剂量的试剂。在一些实施方式中，例如，如本文所述，施用多于一个单位剂量以实现总单一剂量。在一些实施方式中，例如，如本文所述，需要或预期需要施用多个单位剂量，以实现指定效果。单位剂量可以例如是一定体积的含有预定量的一种或多种治疗部分的液体(例如，可接受的载体)、预定量的一种或多种固体形式的治疗部分、缓释制剂或包含预定量的一种或多种治疗部分的递送装置，等等。应当理解，单位剂量可以存在于包括除治疗剂之外的多种组分中的任一种的制剂中。例如，可以包括可接受的载体(例如，药学上可接受的载体)、稀释剂、稳定剂、缓冲剂、防腐剂等。本领域技术人员将理解，在许多实施方式中，例如，如本文所述，特定治疗剂的总适当日剂量可以包括一部分或多个单位剂量，并且可以例如由执业医师在合理的医学判断范围内决定。在一些实施方式中，例如，如本文所述，任何特定受试者或生物体的特定有效剂量水平可取决于多种因素，包括所治疗的病症和病症的严重程度；所用特定活性化合物的活性；采用的特定成分；受试者的年龄、体重、一般健康状况、性别和饮食；施用时间，使用的特定活性化合物的排泄率；治疗持续时间；与使用的特定化合物组合或同时使用的药物和/或其他疗法，以及医学领域众所周知的类似因素。

未甲基化：如本文所用，术语“未甲基化”和“非甲基化”可互换使用，是指鉴定的DNA区不包括甲基化核苷酸。

变体：如本文所用，术语“变体”是指与参考实体显示显著结构同一性但与参考实体相比在一个或多个化学部分的存在、不存在或水平上与参考实体在结构上不同的实体。在一些实施方式中，例如，如本文所述，变体在功能上也不同于其参考实体。一般而言，特定实体是否被适当地视为参考实体的“变体”取决于其与参考实体的结构同一性程度。变体可以是与参考相当但不完全相同的分子。例如，变体核酸可以在核苷酸序列的一个或多个差异处不同于参考核酸。在一些实施方式中，例如，如本文所述，变体核酸显示与参考核酸的总体序列同一性为至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％或99％。在许多实施方式中，例如，如本文所述，如果感兴趣的核酸具有与参考的序列相同但在特定位置有少量序列改变的序列，则感兴趣的核酸被认为是参考核酸的“变体”。在一些实施方式中，例如，如本文所述，与参考相比，变体具有10、9、8、7、6、5、4、3、2或1个取代的残基。在一些实施方式中，例如，如本文所述，与参考相比，变体具有不超过5、4、3、2或1个残基添加、取代或缺失。在各种实施方式中，例如，如本文所述，添加、取代或缺失的数目少于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8个、约7个、约6个，并且通常少于约5个、约4个、约3个或约2个残基。

附图说明

通过结合附图参考以下描述，本公开的前述和其他目的、方面、特征和优点将变得更加明显和更好理解，其中：

图1是显示示例MSRE-qPCR方法的示意图。

图2是显示70个人类受试者的第一受试者组的特征的表格。图2提供了受试者的女性百分比、男性百分比、年龄范围和BMI。图2进一步区分了在第一受试者组中基于组织学评估鉴定为局部或晚期的结肠直肠癌类型，以及基于结肠的结肠镜检查评估鉴定为近端或远端的结肠直肠癌类型。

图3是显示63个人类受试者的第二受试者组的特征的表格。图3提供了受试者的女性百分比、男性百分比、年龄范围和BMI。图3进一步区分了在第二受试者组中基于组织学评估鉴定为局部或晚期的结肠直肠癌类型，以及基于结肠的结肠镜检查评估确定为近端或远端的结肠直肠癌类型。

图4包括A图和B图。图4的A图是显示使用DMR的代表性原理验证组对第二受试者组进行结肠直肠癌筛查的性能的图。显示了第二受试者组的所有受试者的ROC曲线和AUC。图4的B图为显示准确度值的图表，从左到右依次包括结肠直肠癌的结肠直肠筛查的总体灵敏度、局部结肠直肠癌的结肠直肠癌筛查的灵敏度、晚期结肠直肠癌的结肠直肠癌筛查的灵敏度、近端结肠直肠癌的结肠直肠筛查的灵敏度、远端结肠直肠癌的结肠直肠筛查的灵敏度、对照受试者(健康受试者和非晚期腺瘤受试者)的结肠直肠筛查的特异性。

图5是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的ALK‘434的MSRE-qPCR的Ct值的图表。数据表示用于测试的第二受试者组(63个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图6是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的FGF14‘577DMR的MSRE-qPCR的Ct值的图表。数据表示用于测试的第二受试者组(63个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图7是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的PDGFD‘388的MSRE-qPCR的Ct值的图表。数据表示用于测试的第二受试者组(63个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图8是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的JAM2‘320的MSRE-qPCR的Ct值的图表。数据表示用于测试的第二受试者组(63个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图9是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的LONRF2‘281的MSRE-qPCR的Ct值的图表。数据表示用于测试的第二受试者组(63个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图10是显示82个人类受试者的第三受试者组的特征的表格。图10提供了通过使用本公开的28个结肠直肠癌DMR进行筛查而诊断的受试者的女性百分比、男性百分比、年龄范围和BMI。图10进一步区分了在第三受试者组中基于组织学评估鉴定为局部或晚期的结肠直肠癌类型，以及基于结肠的结肠镜检查评估鉴定为近端或远端的结肠直肠癌类型。

图11是显示在第三受试者组中使用28个DMR组进行结肠直肠癌筛查的性能的图表。显示了第三受试者组的所有受试者的ROC曲线和AUC。ROC曲线分析显示，28个DMR组实现了79％的一般结肠直肠癌灵敏度，对局部(早期)癌症的灵敏度为75％，对晚期癌症的灵敏度为84％，AUC为82％时的特异性非常稳定，为87％(另见表15)。

图12是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的ZNF471‘527的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图13是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的FGF14‘577的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图14是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的PDGFD‘388的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图15是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的ADAMTS2‘254的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图16是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的ZNF471‘558(该DMR在本文中或者也称为ZNF471_2)的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图17是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的ST6GALNAC5‘456的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图18是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的ZNF542‘525的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图19是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的LONRF2‘281的MSRE-qPCR的Ct值的图表。数据表示第三受试者组(82个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图20是显示正常细胞和癌细胞之间甲基化状态的示例甲基化变化的示意图，并进一步表明甲基化状态的变化如何影响正常细胞和癌细胞之间的基因表达差异。

图21是显示用作训练集的215个受试者的受试者组的特征的表格。图21提供了受试者的女性数量、男性数量、年龄范围和结肠直肠癌状态。图21进一步区分了基于组织学评价将受试者组中具有结肠直肠癌的那些中鉴定为局部的或晚期的结肠直肠癌类型，和基于结肠的结肠镜检查评价鉴定为近端或远端的结肠直肠癌类型。

图22是显示用作验证集的774个受试者的第四受试者组的特征的表格。图22提供了受试者的女性数量、男性数量、年龄范围和癌症状态。图22进一步区分了基于组织学评价将受试者组中具有癌症的那些中鉴定为局部的或晚期的癌症类型。

图23是显示使用表18的DMR进行结肠直肠癌筛查的3标志物组的性能的图。显示了第四验证受试者组所有受试者的ROC曲线和性能特征。

图24是显示使用表19的DMR进行结肠直肠癌筛查的5标志物组的性能的图。显示了第四验证受试者组所有受试者的ROC曲线和性能特征。

图25是显示使用表20的DMR进行结肠直肠癌筛查的6标志物组的性能的图。显示了第四验证受试者组所有受试者的ROC曲线和性能特征。

图26是表示患有结肠直肠癌的受试者和对照受试者(健康受试者和患有非晚期腺瘤的受试者)的ZNF132'415的MSRE-qPCR的Ct值的图表。数据表示第四受试者组(774个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图27是表示患有结肠直肠癌的受试者和对照受试者(健康受试者、患有非晚期腺瘤的受试者和患有其他癌症的受试者)的ADAMTS2'254的MSRE-qPCR的Ct值的图表。数据表示第四受试者组(774个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图28是表示患有结肠直肠癌的受试者和对照受试者(健康受试者、患有非晚期腺瘤的受试者和患有其他癌症的受试者)的ADAMTS2'284的MSRE-qPCR的Ct值的图表。数据表示第四受试者组(774个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图29是表示患有结肠直肠癌的受试者和对照受试者(健康受试者、患有非晚期腺瘤的受试者和患有其他癌症的受试者)的ZNF542'502的MSRE-qPCR的Ct值的图表。数据表示第四受试者组(774个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图30是表示患有结肠直肠癌的受试者和对照受试者(健康受试者、患有非晚期腺瘤的受试者和患有其他癌症的受试者)的LONRF2'281的MSRE-qPCR的Ct值的图表。数据表示第四受试者组(774个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

图31是表示患有结肠直肠癌的受试者和对照受试者(健康受试者、患有非晚期腺瘤的受试者和患有其他癌症的受试者)的ZNF492'069的MSRE-qPCR的Ct值的图表。数据表示第四受试者组(774个受试者)。出于显示目的，从45中减去Ct值(45-Ct)。较高的45-Ct值对应于较高的甲基化状态，表明结肠直肠癌受试者中存在高甲基化。

具体实施方式

结肠直肠癌的筛查

需要改进的筛查结肠直肠癌方法，包括用于诊断早期结肠直肠癌的筛查。尽管建议对个体(例如50岁以上)进行筛查，但结肠直肠癌筛查计划通常是无效的或不令人满意的。改进的结肠直肠癌筛查可改善诊断并降低结肠直肠癌死亡率。

DNA甲基化(例如，高甲基化或低甲基化)可以激活或失活基因，包括影响癌症发展的基因(参见，例如，图20)。因此，例如，高甲基化可使一种或多种通常用于抑制癌症的基因失活，从而导致或促进样品或受试者中的癌症发展。

本公开包括下述发现，对于本文提供的一个或多个甲基化基因座的甲基化状态，和/或本文提供的一个或多个DMR的甲基化状态，和/或本文提供的一个或多个甲基化位点的甲基化状态的确定可以提供例如具有高度灵敏度和/或特异性的结肠直肠癌筛查。本公开提供包括或涉及结肠直肠癌甲基化生物标志物的组合物和方法，其单独地或在包含两种以上结肠直肠癌甲基化生物标志物的各种组中以高度特异性和/或灵敏度提供对结肠直肠癌的筛查。

在各种实施方式中，本公开的结肠直肠癌甲基化生物标志物选自甲基化基因座，该基因座是或包括ALK、LONRF2、ADAMTS2、FGF14、DMRT1、ST6GALNAC5、MCIDAS、PDGFD、GSG1L、ZNF492、ZNF568、ZNF542、ZNF471、ZNF132、JAM2和CNRIP1(参见，例如，表1)。在各种实施方式中，结肠直肠癌DMR选自ALK‘434、CNRIP1‘232、CNRIP1‘272、LONRF2‘281、LONRF2‘387、ADAMTS2‘254、ADAMTS2‘284、ADAMTS2‘328、FGF14‘577、DMRT1‘934、ST6GALNAC5‘456、MCIDAS‘855、MCIDAS‘003、PDGFD‘388、PDGFD‘921、GSG1L‘861、ZNF492’499、ZNF492‘069、ZNF568‘252、ZNF568‘405、ZNF542‘525、ZNF542‘502、ZNF471‘527、ZNF471‘558、ZNF471‘662、ZNF132‘268、ZNF132‘415和JAM2‘320(参见，例如，表7)。

为避免任何疑问，本文提供的任何甲基化生物标志物尤其可以是或被包括在结肠直肠癌甲基化生物标志物中。

在一些实施方式中，结肠直肠癌甲基化生物标志物可以是或包括单个甲基化基因座。在一些实施方式中，结肠直肠癌甲基化生物标志物可以是或包括两个以上甲基化基因座。在一些实施方式中，结肠直肠癌甲基化生物标志物可以是或包括单个差异甲基化区域(DMR)。在一些实施方式中，甲基化基因座可以是或包括两个以上DMR。在一些实施方式中，甲基化生物标志物可以是或包括单个甲基化位点。在其他实施方式中，甲基化生物标志物可以是或包括两个以上甲基化位点。在一些实施方式中，甲基化基因座可以包括两个以上DMR并且进一步包括与一个或多个所包括的DMR相邻的DNA区。

在一些情况下，甲基化基因座是或包括基因，例如表1中提供的基因。在一些情况下，甲基化基因座是或包括基因的一部分，例如表1中提供的基因的一部分。在一些情况下，甲基化基因座包括但不限于基因的经鉴定核酸边界。

在一些情况下，甲基化基因座是或包括基因的编码区，例如表1中提供的基因的编码区。在一些情况下，甲基化基因座是或包括基因的编码区的一部分，例如，表1中提供的基因的编码区的一部分。在一些情况下，甲基化基因座包括但不限于基因编码区的经鉴定核酸边界。

在一些情况下，甲基化基因座是或包括基因的启动子和/或其他调控区，例如表1中提供的基因的启动子和/或其他调控区。在一些情况下，甲基化基因座是或包括基因的启动子和/或调控区的一部分，例如表1中提供的基因的启动子和/或调控区的一部分。在一些情况下，甲基化基因座包括但不限于基因的启动子和/或其他调控区的经鉴定核酸边界。在一些实施方式中，甲基化基因座是或包括高CpG密度启动子，或其一部分。

在一些实施方式中，甲基化基因座是或包括非编码序列。在一些实施方式中，甲基化基因座是或包括一个或多个外显子和/或一个或多个内含子。

在一些实施方式中，甲基化基因座包括在编码序列上游延伸预定数量的核苷酸的DNA区，和/或在编码序列下游延伸预定数量的核苷酸的DNA区。在各种情况下，上游和/或下游的预定数量的核苷酸是或包括例如500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。本领域技术人员将理解，能够影响编码序列表达的甲基化生物标志物通常可以在编码序列上游和/或下游的任何这些距离内。

本领域技术人员将理解，鉴定为甲基化生物标志物的甲基化基因座不必在单个实验、反应或扩增子中进行测试。鉴定为结肠直肠癌甲基化生物标志物的单个甲基化基因座可以例如以下述方法测试，所述方法包括单独扩增甲基化基因座内的一个或多个独立或重叠DNA区(或提供足以扩增甲基化基因座内的一个或多个不同或重叠DNA区的寡核苷酸引物和条件)。本领域技术人员将进一步理解，不需要分析被鉴定为甲基化生物标志物的甲基化基因座的每个核苷酸的甲基化状态，也不需要分析存在于甲基化基因座内的每个CpG。相反，可以例如通过分析甲基化基因座内的单个DNA区，例如通过分析甲基化基因座内的单个DMR，来分析作为甲基化生物标志物的甲基化基因座。

本公开的DMR可以是甲基化基因座或包括甲基化基因座的一部分。在一些情况下，DMR是具有例如长度为1至5,000bp的甲基化基因座的DNA区。在各种实施方式中，DMR是具有长度等于或小于5000bp、4,000bp、3,000bp、2,000bp、1,000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的甲基化基因座的DNA区。在一些实施方式中，DMR的长度为1、2、3、4、5、6、7、8或9bp。

甲基化生物标志物，包括但不限于本文提供的甲基化基因座和DMR，可以包括至少一个作为结肠直肠癌甲基化生物标志物的甲基化位点。

为清楚起见，本领域技术人员将理解术语甲基化生物标志物被广泛使用，使得甲基化基因座可以是包括一个或多个DMR的甲基化生物标志物，其中每个DRM本身也是甲基化生物标志物，并且每个所述DMR可以包括一个或多个甲基化位点，每个所述甲基化位点本身也是甲基化生物标志物。此外，甲基化生物标志物可以包括两个以上甲基化基因座。因此，作为甲基化生物标志物的状态不会开启生物标志物中包含的核酸的连续性，而是开启第一状态和第二状态之间(例如在结肠直肠癌和对照之间)所包含的DNA区的甲基化状态变化的存在。

如本文提供的，甲基化基因座可以是一个或多个以下甲基化基因座中的任一个，所述甲基化基因座中每一个是表1中鉴定的基因、包括表1中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括单个甲基化基因座，其是表1中鉴定的基因、包括表1中鉴定的基因或是其一部分。例如，在各种实施方式中，例如，如本文所述，结肠直肠癌甲基化生物标志物可包括下述甲基化基因座，其是或包括选自ZNF132、ADAMTS2、ZNF542、LONRF2、ZNF492、FGF14、ST6GALNAC5、PDGFD、ZNF471、JAM2、GSG1L、DMRT1和MCIDAS的基因，或是其一部分。

在一些具体实施方式中，结肠直肠癌甲基化生物标志物包括两个以上甲基化基因座，每个甲基化基因座是表1中鉴定的基因、包括表1中鉴定的基因或是其一部分。在一些实施方式中，结肠直肠癌甲基化生物标志物包括2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个甲基化基因座，每个甲基化基因座是表1中鉴定的基因、包括表1中鉴定的基因或是其一部分。

在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个以上甲基化基因座，其中所述两个以上甲基化基因座中每一个是表1至6中任一项中鉴定的基因、包括表1至表6中任一项中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个以上甲基化基因座，所述两个以上甲基化基因座中每一个是表2至6中任一项中鉴定的基因、包括表2至表6中任一项中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个以上甲基化基因座，所述两个以上甲基化基因座中每一个是表1中鉴定的基因、包括表1中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个甲基化基因座，所述两个甲基化基因座中每一个是表2中鉴定的基因、包括表2中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括三个甲基化基因座，所述三个甲基化基因座中的每一个是表3中鉴定的基因、包括表3中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括四个甲基化基因座，所述四个甲基化基因座中的每一个括是表4中鉴定的基因、包括表4中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括六个甲基化基因座，所述六个甲基化基因座中的每一个是表5中鉴定的基因、包括表5中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括11个甲基化基因座，所述11个甲基化基因座中的每一个表6中鉴定的基因、包括表6中鉴定的基因或是其一部分。在各种特定实施方式中，结肠直肠癌甲基化生物标志物或结肠直肠癌甲基化生物标志物组包括本公开的一个或多个甲基化基因座，但不包括作为或包括FGF14、ZNF471、PDGFD和ALK中的一个或多个或其一部分的甲基化基因座。

表1.通过基因名称识别的甲基化基因座

表2. 2个甲基化基因座的组合

ZNF471
	FGF14

表3. 3个甲基化基因座的组合

ZNF471
	FGF14
PDGFD

表4. 4个甲基化基因座的组合

ZNF471
	FGF14
PDGFD
	ADAMTS2

表5. 6个甲基化基因座的组合

ZNF471
	FGF14
PDGFD
	ADAMTS2
ZNF492
	ST6GALNAC5

表6. 11个甲基化基因座的组合

如本文所提供，结肠直肠癌甲基化生物标志物可以是一个或多个DMR中的任一种，其中每个DMR存在于甲基化基因座中，所述甲基化基因座是表1中鉴定的基因、包括表1中鉴定的基因或是其一部分。在一些特定实施方式中，结肠直肠癌甲基化生物标志物是或包括单个DMR，所述单个DMR包括表1中鉴定的基因的全部或部分，或存在于表1中。例如，在各种实施方式中，结肠直肠癌甲基化生物标志物可包括单个DMR，即，包括下述基因的全部或部分，或存在于下述基因中，所述基因选自ALK、CNRIP1、LONRF2、ADAMTS2、FGF14、DMRT1、ST6GALNAC5、MCIDAS、PDGFD、GSG1L、ZNF492、ZNF568、ZNF542、ZNF471、ZNF132和JAM2。

在一些具体实施方式中，结肠直肠癌甲基化生物标志物包括两个以上DMR，每个DMR是或包括表1中鉴定的基因的全部或部分、或存在于表1中鉴定的基因中。在一些实施方式中，结肠直肠癌甲基化生物标志物包括2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个DMR，每个DMR是或包括表1中鉴定的基因的全部或部分、或存在于表1中鉴定的基因中。

在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个以上DMR，所述两个以上DMR中的每一个是或包括表1-6任一项中鉴定的基因的全部或部分或存在于表1-6任一项中鉴定的基因中。在一些具体实施方式中，结肠直肠癌甲基化生物标志物包括两个DMR，所述两个DMR包括的DMR是或包括表2中鉴定的基因的全部或部分、或存在于表2中鉴定的基因中。在一些具体实施方式中，结肠直肠癌甲基化生物标志物包括三个DMR，所述三个DMR包括的DMR是或包括表3中鉴定的基因的全部或部分、或存在于表3中鉴定的基因中。在一些具体实施方式中，结肠直肠癌甲基化生物标志物包括四个DMR，所述四个DMR包括的DMR是或包括表4中鉴定的基因的全部或部分、或存在于表4中鉴定的基因中。在一些具体实施方式中，结肠直肠癌甲基化生物标志物包括六个DMR，所述六个DMR包括的DMR是或包括表5中鉴定的基因的全部或部分、或存在于表5中鉴定的基因中。在一些具体实施方式中，结肠直肠癌甲基化生物标志物包括11个DMR，所述11个DMR包括的DMR是或包括表6中鉴定的基因的全部或部分、或存在于表6中鉴定的基因中。在各种特定实施方式中，结肠直肠癌甲基化生物标志物或结肠直肠癌甲基化生物标志物组包括一个或多个DMR，但所述一个或多个DMR不包括：作为或包括FGF14、ZNF471、PDGFD和ALK中的一个或多个的全部或部分的DMR，或存在于FGF14、ZNF471、PDGFD和ALK中的一个或多个中的DMR。

如本文所提供，结肠直肠癌甲基化生物标志物可以包括一个或多个DMR中的任一个，其中每个DMR是或包括表7中鉴定的DMR的全部或包括表7中确定的DMR的一部分，包括但不限于具体如表7中鉴定的DMR。在一些特定实施方式中，结肠直肠癌甲基化生物标志物是或包括单个DMR，其是或包括表7中鉴定的DMR的全部或包括表7中鉴定的DMR的一部分，包括但不限于具体如表7中鉴定的DMR，例如，选自下述DMR组的表7的DMR，所述DMR组，包括但不限于ALK‘434、CNRIP1‘232、CNRIP1‘272、LONRF2‘281、LONRF2‘387、ADAMTS2‘254、ADAMTS2‘284、ADAMTS2‘328、FGF14‘577、DMRT1‘934、ST6GALNAC5‘456、MCIDAS‘855、MCIDAS‘003、PDGFD‘388、PDGFD‘921、GSG1L‘861、ZNF492’499、ZNF492‘069、ZNF568‘252、ZNF568‘405、ZNF542‘525、ZNF542‘502、ZNF471‘527、ZNF471‘558、ZNF471‘662、ZNF132‘268、、ZNF132‘415和JAM2‘320。例如，在各种实施方式中，结肠直肠癌甲基化生物标志物可包括单个DMR，其是或包括下述DMR的全部或者包括下述DMR的一部分，所述DMR选自LONRF2‘281、LONRF2‘387、ADAMTS2‘254、ADAMTS2‘284、ADAMTS2‘328、FGF14‘577、ST6GALNAC5‘456、PDGFD‘388、PDGFD‘921、ZNF492’499、ZNF492‘069、ZNF542‘525、ZNF542‘502、ZNF471‘527、ZNF471‘558和ZNF471‘662。

在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个以上DMR，每个所述DMR是或包括表7中鉴定的DMR的全部或包括表7中鉴定的DMR的一部分，包括但不限于具体如表7中鉴定的DMR。在一些实施方式中，结肠直肠癌甲基化生物标志物包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR，每个所述DMR是或包括表7中鉴定的DMR的全部或包括表7中鉴定的DMR的一部分，包括但不限于具体如表7中鉴定的DMR。

在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个以上DMR，所述两个以上DMR中的每一个是或包括表7至12任一个中鉴定的DMR的全部、或包括表7至12任一个中鉴定的DMR的一部分，包括但不限于具体如表8至12中所鉴定的DMR及其组合。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括两个DMR，所述两个DMR是表8中鉴定的DMR。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括3个DMR，所述3个DMR是表9中鉴定的DMR。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括5个DMR，所述5个DMR是表10中鉴定的DMR。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括8个DMR，所述8个DMR是表11中鉴定的DMR。在一些特定实施方式中，结肠直肠癌甲基化生物标志物包括15个DMR，所述15个DMR是表12中鉴定的DMR。在各种特定实施方式中，结肠直肠癌甲基化生物标志物或结肠直肠癌甲基化生物标志物组包括表7的一个或多个DMR，但所述一个或多个DMR不包括FGF14、ZNF471、PDGFD和ALK中的一个或多个或全部DMR，例如不包括表7中提供的FGF14、ZNF471、PDGFD和ALK中的一个或多个或全部DMR。

表7:结肠直肠癌DMR

表8. 2个DMR的组合

表9 3个DMR的组合

表10. 5个DMR的组合

表11. 8个DMR的组合

表12.15个DMR的组合

在各种实施方式中，甲基化生物标志物可以是或包括存在于本文提供的一个或多个甲基化基因座(例如，一个或多个DMR)中的一个或多个个体核苷酸(例如，CpG情况中的单个个体半胱氨酸残基)或多个个体半胱氨酸残基(例如，多个CpG的多个单独的半胱氨酸残基)。因此，在某些实施方式中，甲基化生物标志物是或包括多个个体甲基化位点的甲基化状态。

在各种实施方式中，甲基化生物标志物是或包括或特征在于甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内的一个或多个甲基化位点的甲基化的变化。在各种实施方式中，甲基化生物标志物是或包括甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内甲基化位点数量的变化。在各种实施方式中，甲基化生物标志物是或包括甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内甲基化位点频率的变化。在各种实施方式中，甲基化生物标志物是或包括甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内甲基化位点模式的变化。

在各种实施方式中，一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态表示为被甲基化的样品中存在的一个或多个甲基化基因座(例如，一个或多个DMR)的分数或百分比，例如，作为在一个或多个特定甲基化基因座(例如，一个或多个特定DMR)处甲基化的样品中DNA的单个DNA链的数量的分数。本领域技术人员将理解，在一些情况下，甲基化的分数或百分比可以从例如样品内的一个或多个分析的DMR的甲基化DMR与未甲基化DMR的比率计算。

在各种实施方式中，将一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态与参考甲基化状态值和/或与参考样品中的一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态进行比较。在某些情况下，参考是来自相同来源的非同期样品，例如来自相同来源的先前样品，例如来自相同受试者。在某些情况下，一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态的参考是已知代表特定状态(例如，癌症状态或非癌症状态)的样品(例如，来自受试者的样品)或多个样品中一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态)。因此，参考可以是或包括一个或多个预定阈值，该预定阈值可以是定量的(例如甲基化值)或定性的。在某些情况下，DMR甲基化状态的参考是在不包括DMR的核苷酸的同一样品中存在的一个核苷酸或多个核苷酸(例如，多个连续寡核苷酸)的甲基化状态。本领域技术人员将理解，参考测量通常通过使用与进行非参考测量的方法相同、相似或相当的方法进行测量来产生。

不希望受任何特定科学理论的束缚，图20提供了基因调控序列的高甲基化或低甲基化可以影响表达的一种可能机制的示意图。如图20所示，低甲基化可导致表达增加和/或高甲基化可导致表达抑制。在各种情况下，与参考相比，表达调控区例如启动子区和增强子区的甲基化增加可以降低或沉默可操作地连接的基因的表达，例如通常起到抑制癌症作用的可操作地连接的基因的表达。在各种实施方式中，与参考相比，表达调节区例如启动子区和增强子区的甲基化降低可以增加可操作地连接的基因的表达，例如具有有助于肿瘤发生的活性的可操作地连接的基因的表达。不希望受任何特定科学理论的束缚，DNA甲基化可以提供比RNA表达或蛋白质表达本身更具有化学和生物学稳定性的癌症状态指标。

甲基化通常被认为是高度组织特异性的，提供了DNA序列分析中不一定存在的信息维度。

实质上有助于肿瘤发生的甲基化事件可以发生在例如与癌症相关基因(例如通常起到抑制癌症作用的基因)可操作地连接的DNA的表达调控区(例如，在启动子区、增强子区、转录因子结合位点、CTCF结合位点、CpG岛或其他序列)。因此，通常用于抑制癌症的基因的失活导致或促成肿瘤发生。此外，高甲基化通常出现在CpG岛上。

癌症

本公开的方法和组合物可用于筛查癌症，特别是结肠直肠癌。结肠直肠癌包括但不限于结肠癌、直肠癌及其组合。结肠直肠癌包括转移性结肠直肠癌和非转移性结肠直肠癌。结肠直肠癌包括位于结肠癌近端的癌症和位于结肠远端的癌症。

结肠直肠癌包括本领域已知的各种可能分期中的任何一个的结肠直肠癌，包括例如I期、II期、III期和IV期结肠直肠癌(例如0、I、IIA、IIB、IIC、IIIA、IIIB、IIIC、IVA、IVB和IVC期)。结肠直肠癌包括肿瘤/淋巴结/转移(TNM)分期系统的所有阶段。对于结肠直肠癌，T可以指肿瘤是否生长到结肠壁还是直肠壁中，如果如此的话多少层；N可以指肿瘤是否已经扩散到淋巴结，如果如此，有多少个淋巴结以及它们位于哪里；并且M可以指癌症是否已经扩散到身体的其他部位，如果如此，已经扩散到哪些部位，扩散到什么程度。T、N和M的特定阶段是本领域已知的。T阶段可以包括TX、T0、Tis、T1、T2、T3、T4a和T4b；N阶段可以包括NX、N0、N1a、N1b、N1c、N2a和N2b；M阶段可以包括M0、M1a和M1b。此外，结肠直肠癌的等级可包括GX、G1、G2、G3和G4。癌症、尤其是结肠直肠癌分期的各种手段是本领域众所周知的，例如在万维网上的cancer.net/cancer-types/colorectal-cancer/stages上总结的。

在某些情况下，本公开内容包括早期结肠直肠癌的筛查。早期结肠直肠癌可以包括例如位于受试者内的结肠直肠癌，例如，因为它们尚未扩散至受试者的淋巴结，例如癌附近的淋巴结(N0期)，并且尚未扩散至远端位点(M0期)。早期癌症包括对应于例如0至II C期的结肠直肠癌。

因此，本公开的结肠直肠癌尤其包括恶性前结肠直肠癌和恶性结肠直肠癌。本公开的方法和组合物可用于筛查所有形式和阶段的结肠直肠癌，包括但不限于本文命名的或本领域已知的那些，以及其所有亚组。因此，本领域技术人员将理解，此处提供的对结肠直肠癌的所有参考包括但不限于其所有形式和阶段的结肠直肠癌，包括但不限于本文命名的或本领域已知的那些，以及所有其亚组。

受试者和样品

使用本文提供的方法和组合物分析的样品可以是任何生物样品和/或任何样品，包括核酸。在各种特定实施方式中，使用本文提供的方法和组合物分析的样品可以是来自哺乳动物的样品。在各种特定实施方式中，使用本文提供的方法和组合物分析的样品可以是来自人类受试者的样品。在各种特定实施方式中，使用本文提供的方法和组合物分析的样品可以是来自小鼠、大鼠、猪、马、鸡或牛的样品。

在各种情况下，人类受试者是被诊断或寻求诊断为患有癌症(例如结肠直肠癌)的受试者，被诊断为或寻求诊断为有风险患癌症(例如结肠直肠癌)的受试者，和/或被诊断为或寻求诊断为有直接风险患癌症(例如结肠直肠癌)的受试者。在各种情况下，人类受试者是被鉴定为需要结肠直肠癌筛查的受试者的受试者。在某些情况下，人类受试者是被鉴定为需要由执业医师进行结肠直肠癌筛查的受试者。在各种情况下，人类受试者被鉴定为由于年龄而需要结肠直肠癌筛查，例如由于年龄等于或大于50岁，例如年龄等于或大于50、55、60、65、70、75、80、85或90年。在各种情况下，人类受试者是未被诊断为患有癌症(例如结肠直肠癌)的受试者，没有风险患癌症(例如结肠直肠癌)的受试者，或没有直接风险患癌症(例如结肠直肠癌)的受试者，未被诊断为患有癌症(例如结肠直肠癌)的受试者，和/或没有尝试诊断癌症(例如结肠直肠癌)的受试者，或其任何组合。

来自受试者例如人类或其他哺乳动物受试者的样品可以是例如血液、血液成分、cfDNA、ctDNA、粪便或结肠直肠组织的样品。在一些特定实施方式中，样品是受试者的排泄物或体液(例如受试者的粪便、血液、淋巴液或尿液)或结肠直肠癌组织样品。来自受试者的样品可以是细胞或组织样品，例如具有癌症或包括癌细胞(例如具有肿瘤或转移性组织)的细胞或组织样品。在各种实施方式中，可以通过活组织检查(例如，细针抽吸或组织活组织检查)或手术获得来自受试者例如人或其他哺乳动物受试者的样品。

在各种特定实施方式中，样品是无细胞DNA(cfDNA)样品。cfDNA通常以短的双链片段形式存在于人体生物体液(例如血浆、血清或尿液)中。cfDNA的浓度通常很低，但在特定条件下会显著增加，包括但不限于怀孕、自身免疫性疾病、心肌梗塞和癌症。循环肿瘤DNA(ctDNA)是特异性源自癌细胞的循环DNA的组成部分。ctDNA可以存在于与白细胞和红细胞结合或不与白细胞和红细胞结合的人类生物体液中。用于检测肿瘤来源的cfDNA的各种测试基于对癌症(例如相关癌症)特征的遗传或表观遗传修饰的检测。癌症特征的遗传或表观遗传修饰可包括但不限于肿瘤抑制基因中的致癌突变或癌症相关突变、活化的致癌基因、高甲基化和/或染色体疾病。检测癌症特征的遗传或表观遗传修饰可以确认所检测的cfDNA是ctDNA。

cfDNA和ctDNA可提供源组织甲基化状态的实时或近乎实时的指标。cfDNA和ctDNA在血液中的半衰期约为2小时，因此在给定时间采集的样品可以相对及时地反映源组织的状态。

从样品中分离核酸(例如，从血液或血浆中分离cfDNA)的各种方法是本领域已知的。核酸可以通过例如但不限于标准DNA纯化技术，通过直接基因捕获(例如，通过澄清样品以去除测试抑制剂并用捕获剂从澄清样品中捕获靶核酸(如果存在的话)，以产生捕获复合物，并分离捕获复合物以回收目标核酸)来分离。

测量甲基化状态的方法

甲基化状态可以通过本领域已知的多种方法和/或通过本文提供的方法测量。本领域技术人员将理解，用于测量甲基化状态的方法通常可应用于来自任何来源和任何种类的样品，并且将进一步理解可用于将样品修饰成适合通过以下方法进行测量的形式的处理步骤。测量甲基化状态的方法包括但不限于，包括甲基化状态特异性聚合酶链式反应(PCR)的方法、包括核酸测序的方法、包括质谱的方法、包括甲基化特异性核酸酶的方法、包括基于质量的分离的方法、包括目标特异性捕获的方法，以及包括甲基化特异性寡核苷酸引物在内的方法。甲基化的某些特定测试使用亚硫酸氢盐试剂(例如，亚硫酸氢根离子)。

亚硫酸氢盐试剂尤其可包括亚硫酸氢盐(bisulfite)、偏重亚硫酸盐(disulfite)、亚硫酸氢盐(hydrogen sulfite)或它们的组合等，这些试剂可用于区分甲基化和未甲基化的核酸。亚硫酸氢盐与胞嘧啶和5-甲基胞嘧啶的相互作用不同。在典型的基于亚硫酸氢盐的方法中，DNA与亚硫酸氢盐接触会使未甲基化的胞嘧啶脱氨基为尿嘧啶，而甲基化的胞嘧啶不受影响；选择性保留甲基化胞嘧啶，而不是未甲基化胞嘧啶。因此，在经亚硫酸氢盐处理的样品中，尿嘧啶残基代替未甲基化的胞嘧啶残基，并因此提供未甲基化胞嘧啶残基的识别信号，而残留的(甲基化)胞嘧啶残基因此提供甲基化胞嘧啶残基的识别信号。可以例如，通过PCR分析经亚硫酸氢盐处理的样品。

各种甲基化测试程序可与亚硫酸氢盐处理结合使用，以确定靶序列如DMR的甲基化状态。此类测试可尤其包括甲基化特异性限制酶qPCR、经亚硫酸氢盐处理的核酸的测序、PCR(例如，使用序列特异性扩增)、甲基化特异性核酸酶辅助小等位基因富集PCR和甲基化灵敏度高分辨率溶解。在一些实施方式中，从经亚硫酸氢盐处理的DNA样品中扩增DMR，并根据例如Illumina方案或基于转座的Nextera XT方案制备DNA测序文库以用于测序。在某些实施方式中，高通量和/或下一代测序技术用于实现DNA序列的碱基对水平解析，允许分析甲基化状态。

在各种实施方式中，甲基化状态通过包括使用甲基化特异性寡核苷酸引物的PCR扩增的方法(MSP方法)检测，例如应用于经亚硫酸氢盐处理的样品(参见例如Herman1992Proc.Natl.Acad.Sci.USA 93:9821-9826，其关于确定甲基化状态的方法通过引用并入本文)。使用甲基化状态特异性寡核苷酸引物来扩增经亚硫酸氢盐处理的DNA可以区分甲基化和非甲基化核酸。用于MSP方法的寡核苷酸引物对包括至少一种寡核苷酸引物，其能够与包括甲基化位点(例如CpG)的序列杂交。在与胞嘧啶残基互补的位置包含T残基的寡核苷酸引物将选择性地与其中胞嘧啶在亚硫酸氢盐处理之前未甲基化的模板杂交，而在与胞嘧啶残基互补的位置包含G残基的寡核苷酸引物将在亚硫酸氢盐处理之前，与其中胞嘧啶是甲基化胞嘧啶的模板选择性杂交。MSP结果可以在使用或不使用测序扩增子的情况下获得，例如使用凝胶电泳。MSP(甲基化特异性PCR)允许使用亚硫酸氢盐转化的DNA的PCR扩增对位点特异性DNA甲基化进行高灵敏度检测(检测水平为0.1％的等位基因，具有完全特异性)。

可用于在亚硫酸氢盐处理后确定样品的甲基化状态的另一种方法是甲基化敏感高分辨率溶解(MS-HRM)PCR(参见，例如Hussmann 2018Methods Mol Biol.1708:551-571，其关于确定甲基化状态的方法通过引用并入本文)。MS-HRM是一种基于PCR的管内方法，其可基于杂交熔解检测感兴趣的特定基因座的甲基化水平。在执行MS-HRM之前对DNA进行亚硫酸氢盐处理可确保甲基化和未甲基化DNA之间的不同碱基组成，其用于通过高分辨率熔解分离所得扩增子。独特的引物设计促进了测试的高灵敏度，能够在未甲基化背景中检测低至0.1-1％的甲基化等位基因。用于MS-HRM测试的寡核苷酸引物设计为与甲基化等位基因互补，特定的退火温度使这些引物能够与甲基化和未甲基化等位基因退火，从而提高测试的灵敏度。

另一种可用于在亚硫酸氢盐处理样品后确定甲基化状态的方法是定量多重甲基化特异性PCR(QM-MSP)。QM-MSP使用甲基化特异性引物对DNA甲基化进行灵敏定量(参见，例如Fackler 2018Methods Mol Biol.1708:473-496，其关于确定甲基化状态的方法通过引用并入本文)。QM-MSP是一种两步PCR方法，在第一步中，一对基因特异性引物(正向和反向)在一个PCR反应中同时和多重扩增同一基因的甲基化和未甲基化拷贝。在36个PCR循环后，该甲基化独立扩增步骤可产生每μL高达10⁹个拷贝的扩增子。在第二步中，使用实时PCR和两个独立的荧光团检测同一孔中每个基因的甲基化/未甲基化DNA(例如6FAM和VIC)，用标准曲线对第一次反应的扩增子进行量化。在100,000个参考基因拷贝中可检测到一个甲基化拷贝。

另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化特异性核酸酶辅助小等位基因富集(MS-Name)(参见，例如，Liu 2017Nucleic Acids Res.45(6):e39，其关于确定甲基化状态的方法通过引用并入本文)。Ms-NaME基于对在双链(ds)DNA(DSN)具有特异性的DNA核酸酶的存在下探针与靶序列的选择性杂交，从而杂交产生随后被DSN消化的双链DNA的区域。因此，靶向未甲基化序列的寡核苷酸探针产生局部双链区域，导致未甲基化靶标的消化；能够与甲基化序列杂交的寡核苷酸探针会产生局部双链区，其导致甲基化靶标的消化，使甲基化靶标保持完整。此外，寡核苷酸探针可以同时将DSN活性导向经亚硫酸氢盐处理的DNA中的多个靶标。随后的扩增可以富集未消化的序列。Ms-NaME可以单独使用或与本文提供的其他技术组合使用。

另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化灵敏度单核苷酸引物延伸(Ms-SNuPE^TM)(参见例如Gonzalgo 2007Nat Protoc.2(8):1931-6，其关于确定甲基化状态的方法通过引用并入本文)。在Ms-SNuPE中，执行链特异性PCR以生成DNA模板，以用于使用Ms-SNuPE进行定量甲基化分析。然后用寡核苷酸进行SNuPE，该寡核苷酸设计用于在被询问的CpG位点的紧接上游进行杂交。反应产物可以在聚丙烯酰胺凝胶上电泳，以用于通过磷光体图像分析进行可视化和定量。扩增子还可以携带直接或间接可检测的标记，例如荧光标记、放射性同位素或可脱离的分子片段或具有可通过质谱法区分的质量的其他实体。检测可以通过例如基质辅助激光解吸/电离质谱(MALDI)或使用电子喷雾质谱(ESI)来进行和/或可视化。

可用于在亚硫酸氢盐处理样品后确定甲基化状态的某些方法在基于扩增的方法中利用第一寡核苷酸引物、第二寡核苷酸引物和寡核苷酸探针。例如，寡核苷酸引物和探针可用于实时聚合酶链式反应(PCR)或液滴数字PCR(ddPCR)的方法中。在各种情况下，第一寡核苷酸引物、第二寡核苷酸引物和/或寡核苷酸探针选择性杂交甲基化DNA和/或未甲基化DNA，使得扩增或探针信号指示样品的甲基化状态。

用于检测甲基化状态(例如，5-甲基胞嘧啶水平的存在)的其他基于亚硫酸氢盐的方法公开于例如Frommer(1992Proc Natl Acad Sci U S A.1；89(5):1827-31，其关于确定甲基化状态的方法通过引用并入本文)。

可用于确定甲基化状态的某些方法不包括样品的亚硫酸氢盐处理。例如，可以通过基于PCR的方法检测甲基化状态的变化，所述方法中在PCR扩增(例如，通过MSRE-qPCR)之前用一种或多种甲基化敏感限制酶(MSRE)消化DNA。通常，MSRE具有包含至少一个CpG基序的识别位点，因此如果该位点包含5-甲基胞嘧啶，则MSRE的活性被阻止切割可能的识别位点。(参见，例如，Beikircher 2018Methods Mol Biol.1708:407-424，其关于确定甲基化状态的方法通过引用并入本文)。因此，MSRE根据MSRE识别位点的甲基化状态选择性消化核酸；它们可以在未甲基化的MSRE识别位点消化DNA，但不能在甲基化的MSRE识别位点消化DNA。在某些实施方式中，样品的等分试样可以用MSRE消化，产生其中未甲基化的DNA已被MSRE切割的加工样品，使得在MSRE位点识别内具有至少一个甲基化位点的未切割的和/或可扩增的DNA(例如，DNA分子的每个MSRE识别位点内的至少一个甲基化位点)相对于在MSRE识别位点内不包括至少一个甲基化位点(例如，在DNA分子的每个MSRE识别位点内不包括至少有一个甲基化位点)的未切割的和/或可扩增的DNA的比例增加。然后可以将限制性酶消化样品的未切割序列进行预扩增(例如以PCR)，并定量，例如通过qPCR、实时PCR或数字PCR定量。用于MSRE-qPCR的寡核苷酸引物扩增包括一个或多个MSRE切割位点和/或多个MSRE切割位点的区域。包含多个MSRE切割位点的扩增子通常更有可能产生可靠的结果。DMR扩增子切割位点的数量，以及在某些情况下所产生的DMR甲基化状态确定的鲁棒性，可以通过设计在DMR扩增子中包含多个MSRE识别位点(而不是单个识别位点)的DMR来增加。在各种情况下，多个MSRE可以应用于同一样品，包括例如AciI、Hin6I、HpyCH4IV和HpaII中的两个以上(例如，包括AciI、Hin6I和HpyCH4IV)。多个MSRE(例如，AciI、Hin6I、HpyCH4IV和HpaII的组合，或AciI、Hin6I和HpyCH4IV的组合)可以在DMR扩增子内提供改善的MSRE识别位点频率。

鉴于血液中cfDNA的患病率较低，MSRE-qPCR还可以包括在通过MSRE消化样品之后但在qPCR之前进行预扩增步骤，以提高可用样品的数量。

在某些MSRE-qPCR实施方式中，使用例如实时PCR或数字PCR在天然(例如未消化)形式的样品的等分试样中测量总DNA的量。

各种扩增技术可单独使用或与本文所述的其他技术结合使用以检测甲基化状态。本领域技术人员在阅读了本说明书后将理解如何将本领域已知的和/或本文描述的各种扩增技术与本领域已知的和/或本文提供的用于甲基化状态确定的各种其他技术结合起来。扩增技术包括但不限于PCR，例如定量PCR(qPCR)、实时PCR和/或数字PCR。本领域技术人员将理解聚合酶扩增可以在单个反应中多重扩增多个靶标。PCR扩增子的长度通常为100至2000个碱基对。在各种情况下，扩增技术足以确定甲基化状态。

基于数字PCR(dPCR)的方法涉及将样品分配和分布在具有96孔、384孔或更多孔的板的孔中，或分配和分布在单个乳液液滴(ddPCR)中，例如，使用微流体装置，使得一些孔包括一个或多个模板拷贝，其他不包含模板拷贝。因此，扩增前每孔的平均模板分子数小于1。发生模板扩增的孔的数量提供了模板浓度的量度。如果样品已与MSRE接触，发生模板扩增的孔的数量提供了甲基化模板浓度的量度。

在各种实施方式中，基于荧光的实时PCR测试，例如MethyLight^TM，可用于测量甲基化状态(参见，例如Campan 2018Methods Mol Biol.1708:497-513，其甲基化状态的测试方法通过引用并入本文)。MethyLight是一种基于荧光的定量实时PCR方法，其可灵敏地检测和量化基因组候选区的DNA甲基化。MethyLight特别适合在未甲基化DNA的高背景下检测低频甲基化DNA区，因为它结合了甲基化特异性引发和甲基化特异性荧光探测。此外，MethyLight可与数字PCR结合使用，用于高度灵敏地检测个体甲基化分子，用于疾病检测和筛查。

用于确定甲基化状态的基于实时PCR的方法通常包括基于外部标准的分析生成未甲基化DNA的标准曲线的步骤。标准曲线可以由至少两个点构建，并且可以将消化的DNA的实时Ct值和/或未消化的DNA的实时Ct值与已知的定量标准进行比较。在特定情况下，可以确定MSRE消化和/或未消化样品或样品等分试样的样品Ct值，并且可以从标准曲线计算DNA的基因组当量。可以评估MSRE消化和未消化DNA的Ct值，以鉴定消化的扩增子(例如，有效消化；例如，产生45的Ct值)。也可以鉴定在消化或未消化条件下未扩增的扩增子。然后可以跨条件直接比较感兴趣的扩增子的校正Ct值，以确定条件之间甲基化状态的相对差异。作为选择或另外，消化和未消化DNA的Ct值之间的delta差异可用于确定条件之间甲基化状态的相对差异。

测量甲基化状态的方法可以包括但不限于大规模平行测序(例如下一代测序)以确定甲基化状态，例如合成测序、实时(例如单分子)测序、珠乳液测序、纳米孔测序或本领域已知的其他测序技术。在一些实施方式中，测量甲基化状态的方法可以包括全基因组测序，例如，利用碱基对分辨率。

在某些特定实施方式中，MSRE-qPCR以及其他技术可用于确定是或包括单个甲基化基因座的结肠直肠癌甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR以及其他技术可用于确定是或包括两个以上甲基化基因座的结肠直肠癌甲基化生物标志物的甲基化状态。在某些特定的实施方式中，MSRE-qPCR以及其他技术可用于确定是或包括单个差异甲基化区域(DMR)的结肠直肠癌甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR以及其他技术可用于确定是或包括两个以上DMR的结肠直肠癌甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR以及其他技术可用于确定是或包括单个甲基化位点的结肠直肠癌甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR以及其他技术可用于确定是或包括两个以上甲基化位点的结肠直肠癌甲基化生物标志物的甲基化状态。在各种实施方式中，结肠直肠癌甲基化生物标志物可以是本文提供的任何结肠直肠癌甲基化生物标志物。本公开尤其包括用于扩增DMR，例如用于扩增表7中鉴定的DMR的寡核苷酸引物对。

在某些特定实施方式中，cfDNA样品源自受试者血浆并与MSRE接触，MSRE是或包括AciI、Hin6I、HpyCH4IV和HpaII中的一个或多个(例如，AciI、Hin6I和HpyCH4IV)。经消化的样品可以用一个或多个DMR的寡核苷酸引物对进行预扩增，例如用表13中提供的一个或多个寡核苷酸引物对。经消化的DNA，例如，预扩增的经消化的DNA，可以用qPCR用一个或多个DMR的寡核苷酸引物对进行定量，例如，使用表13中提供的一个或多个寡核苷酸引物对。然后可以确定qPCR ct值并用于确定每个DMR扩增子的甲基化状态。

本领域技术人员将理解，表13中提供的寡核苷酸引物对可根据本文鉴定的结肠直肠癌甲基化生物标志物的任何组合使用。技术人员将意识到表2的寡核苷酸引物对可以单独包括或不包括在给定的分析中以分析特别期望的DRM组合。

本领域技术人员将进一步理解，虽然可以使用其他寡核苷酸引物对，但是选择和配对寡核苷酸引物以产生有用的DMR扩增子是重要的并且代表了实质性的贡献。

本领域技术人员将进一步理解，qPCR的方法、试剂和方案是本领域公知的。与传统PCR不同，qPCR能够检测扩增过程中(例如，在每个扩增循环结束时)随时间推移产生的扩增子，通常通过使用扩增响应荧光系统，例如，结合具有荧光检测能力的热循环仪。qPCR中使用的荧光报告基因的两种常见类型包括(i)双链DNA结合染料，其在结合时比未结合时发出的荧光更亮；(ii)标记的寡核苷酸(例如标记的寡核苷酸引物或标记的寡核苷酸探针)。

本领域技术人员将理解，以本文提供的结肠直肠癌筛查方法分析多个甲基化基因座(例如，多个DMR)的甲基化状态的实施方式中，每个甲基化基因座的甲基化状态可以是以多种形式中的任一种测量或表示，并且多个甲基化基因座的甲基化状态(优选地每个以相同、相似或可比较的方式测量和/或表示)一起或累积地以各种形式的任一种分析或表示。在各种实施方式中，每个甲基化基因座的甲基化状态可以测量为ct值。在各种实施方式中，每个甲基化基因座的甲基化状态可以表示为测量样品和参考之间的ct值差异。在各种实施方式中，每个甲基化基因座的甲基化状态可以表示为与参考的定性比较，例如通过将每个甲基化基因座鉴定为高甲基化或未高甲基化。

在其中分析单个甲基化基因座的一些实施方式中，单个甲基化基因座的高甲基化构成受试者患有或可能患有结肠直肠癌的诊断，而不存在单甲基化基因座的高甲基化构成受试者可能不患有结肠直肠癌的诊断。在一些实施方式中，多个分析的甲基化基因座的单甲基化基因座(例如单个DMR)的高甲基化构成受试者患有或可能患有结肠直肠癌的诊断，而在多个分析的甲基化基因座的任何甲基化基因座不存在高甲基化构成受试者可能不患有结肠直肠癌的诊断。在一些实施方式中，多个分析的甲基化基因座中甲基化基因座的确定百分比(例如，预定百分比)(例如，至少10％(例如，至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％或100％))构成受试者患有或可能患有结肠直肠癌的诊断，而不存在多个分析的甲基化基因座中甲基化基因座的确定百分比(例如，预定百分比)(例如，至少10％(例如，至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％或100％))构成受试者不可能患有结肠直肠癌的诊断。在一些实施方式中，多个分析的甲基化基因座(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)中确定数量(例如，预定数量)的甲基化基因座(例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)的高甲基化构成受试者患有或可能患有结肠直肠癌的诊断，而不存在多个分析的甲基化基因座(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)中确定数量(例如，预定数量)的甲基化基因座(例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)的高甲基化构成受试者不可能患有结肠直肠癌的诊断。

在一些实施方式中，定性或定量测量多个甲基化基因座(例如，多个DMR)的甲基化状态，并且组合多个甲基化基因座中的每一个的测量以提供诊断。在一些实施方式中，多个甲基化基因座中的每一个的定量测量的甲基化状态的定性被单独加权，并且加权值被组合以提供可以与参考进行比较以提供诊断的单个值。为了仅提供这种方法的一个实例，支持向量机(SVM)算法可用于分析本公开的多个甲基化基因座的甲基化状态以产生诊断。支持向量机算法的至少一个目标是在N维空间(N—特征的数量)中鉴定一个超平面，该超平面对数据点进行明确分类，目标是找到一个具有最大边距的平面，即两类数据点之间的最大距离。如本实施例中所讨论的，SVM模型建立在源自训练样品集(例如，第一受试者组和/或第二受试者组)的标记值(例如，ct值)上，其在进行预测时被转化成支持向量值。在将SVM模型应用于新样品时，样品将被映射到模型的向量空间并分类为具有属于第一条件或第二条件的概率，例如，基于每个新样品相对于两个条件之间的间隙的位置。本领域技术人员将理解，一旦确定了相关组合物和方法，向量值可以与由R-package的predict()函数定义的SVM算法结合使用(参见超文本传输协议安全(HTTPS)://cran.r-project.org/web/packages/e1071/index.html，其SVM在此通过引用并入)以容易地生成对新样品的预测。因此，利用本文公开的用于结肠直肠癌诊断的组合物和方法(并且仅在那时)，利用算法输入信息组合来预测R包的predict()函数(参见超文本传输协议安全(HTTPS)://cran.r-project.org/web/packages/e1071/index.html，其SVM在此通过引用并入)的预测模型的生成以提供结肠直肠癌诊断将是直截了当的。例如，表17中提供了用于通过分析本文提供的多个DMR的甲基化状态来诊断结肠直肠癌的SVM向量的一个非限制性实例。本领域技术人员将理解，使用在手头的本公开中，SVM向量的生成可以根据本文提供的方法以及本领域已知的其他方法来完成。

表13:结肠直肠癌DMR寡核苷酸引物对，例如，用于MSRE-qPCR

应用

本公开的方法和组合物可用于多种应用中的任何一种。例如，本公开的方法和组合物可用于筛查或帮助筛查结肠直肠癌。在各种情况下，使用本公开内容的方法和组合物进行筛查可以检测任何阶段的结肠直肠癌，包括但不限于早期结肠直肠癌。在一些实施方式中，使用本公开内容的方法和组合物进行的结肠直肠癌筛查适用于50岁以上，例如50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中，使用本公开的方法和组合物进行的结肠直肠癌筛查适用于20岁以上，例如20、25、30、35、40、45、50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中，使用本公开的方法和组合物进行的结肠直肠癌筛查适用于20至50岁，例如20至30岁、20至40岁、20至50岁、30岁至40岁、30至50岁或40至50岁的个体。在各种实施方式中，使用本公开内容的方法和组合物进行的结肠直肠癌筛查适用于经历腹痛或不适的个体，例如，经历未诊断或不完全诊断的腹痛或不适的个体。在各种实施方式中，使用本公开内容的方法和组合物进行的结肠直肠癌筛查适用于没有可能与结肠直肠癌相关的症状的个体。因此，在某些实施方式中，使用本公开内容的方法和组合物进行的结肠直肠癌筛查是完全或部分预防性或防止性的，至少对于晚期或非早期的结肠直肠癌而言如此。

在各种实施方式中，使用本公开内容的方法和组合物进行的结肠直肠癌筛查可应用于无症状的人类受试者。如本文所用，如果受试者通过非侵入性可观察标记(例如，没有一个、几个或所有基于装置的探测、组织样品分析、体液分析、手术或结肠直肠癌筛查)没有报告和/或证明结肠直肠癌的充分特征以支持对受试者可能患有结肠直肠癌和/或癌症的医学合理怀疑，则受试者可以称为是“无症状的”。早期结肠直肠癌特别可能在根据本公开内容的方法和组合物筛查的无症状个体中检测到。

在各种实施方式中，使用本公开内容的方法和组合物进行的结肠直肠癌筛查可应用于有症状的人类受试者。如本文所用，如果受试者通过非侵入性可观察标记(例如，没有基于装置的探测、组织样品分析、身体体液分析、手术或结肠直肠癌筛查)报告和/或证明结肠直肠癌的充分特征以支持医学上合理怀疑受试者可能患有结肠直肠癌和/或癌症，则受试者可以称为是“有症状的”。结肠直肠癌的症状可以包括但不限于持续(例如持续超过3天)的排便习惯改变(腹泻、便秘或大便变窄)，需要排便的感觉(这种感觉是排便后未缓解)、直肠出血(例如，鲜红色的血液)、便血(可导致大便呈黑色)、腹部绞痛、腹痛、虚弱、疲劳、意外体重减轻、贫血及其组合。本领域技术人员将理解，不会单独表明或引起结肠直肠癌怀疑的个体症状当以组合(例如为了提供但非限制性的实例，腹部绞痛和便血的组合)存在时，可能会表明或引起所述怀疑。

本领域技术人员将理解对结肠直肠癌的定期、预防性和/或防止性筛查改善了结肠直肠癌的诊断，包括和/或特别是早期癌症。如上所述，根据至少一种癌症分期系统，早期癌症包括结肠直肠癌的0至IIC期。因此，本公开尤其提供了适用于早期结肠直肠癌的诊断和治疗的方法和组合物。通常，特别是在根据本公开每年进行结肠直肠癌筛查和/或其中受试者在筛查时无症状的实施方式中，本发明的方法和组合物特别有可能检测到早期阶段结肠直肠癌。

在各种实施方式中，根据本公开的结肠直肠癌筛查对给定受试者进行一次或对给定受试者进行多次。在各种实施方式中，根据本公开定期进行结肠直肠癌筛查，例如每六个月、每年、每两年、每三年、每四年、每五年或每十年。

在各种实施方式中，使用本文公开的方法和组合物进行的结肠直肠癌筛查将提供结肠直肠癌的诊断。在其他情况下，使用本文公开的方法和组合物进行的结肠直肠癌筛查将指示结肠直肠癌的诊断，但不能确定结肠直肠癌的诊断。在使用本公开的方法和组合物筛查结肠直肠癌的各种情况下，使用本公开的方法和组合物进行筛查之后可以进行进一步的诊断确认测试，该进一步的诊断确认测试可以确认、支持、破坏、或拒绝由先前筛查(例如，根据本公开的筛查)产生的诊断。如本文所用，诊断确认测试可以是提供被执业医师确认为确定性的诊断的结肠直肠癌测试，例如基于结肠镜检查的诊断，或显著增加或降低先前诊断的可能性的结肠直肠癌测试是正确的，例如，根据本公开的筛查产生的诊断。诊断确认测试可以包括现有的筛查技术，这些技术通常需要在灵敏度、特异性和非侵入性中的一个或多个方面进行改进，特别是在检测早期结肠直肠癌方面。

在一些情况下，诊断确认测试是一种测试，它是或包括受试者组织的视觉或结构检查，例如通过结肠镜检查。在一些实施方式中，结肠镜检查包括或之后是组织学分析。结肠直肠癌的视觉和/或结构测试可以包括检查结肠和/或直肠的结构是否有任何异常组织和/或结构。例如，可以通过直肠使用内窥镜或通过CT扫描进行视觉和/或结构检查。在一些情况下，诊断确认测试是结肠镜检查，例如，包括或随后进行组织学分析。根据一些报告，结肠镜检查是目前主要的和/或最依赖于诊断确认测试。

另一种基于计算机断层扫描(CT)的视觉和/或结构诊断确认测试是CT结肠成像，有时也称为虚拟结肠镜检查。CT扫描利用结肠和/或直肠的大量X射线图像来生成结肠的尺寸表示。尽管可用作诊断确认测试，但一些报告表明CT结肠成像不足以替代结肠镜检查，至少部分是因为医生没有实际接触受试者的结肠来获取组织以进行组织学分析。

另一种诊断确认测试可以是乙状结肠镜检查。在乙状结肠镜检查中，乙状结肠镜用于通过直肠对结肠和/或直肠的部分进行成像。根据一些报道，乙状结肠镜检查并未得到广泛应用。

在某些情况下，诊断确认测试是基于粪便的测试。通常，当使用基于粪便的测试代替目视或结构检查时，建议以比使用目视或结构检查所需的频率更高的频率使用。在一些情况下，诊断确认测试是基于guiac的粪便潜血试验或粪便免疫化学试验(gFOBTs/FITs)(参见，例如Navarro 2017World J Gastroenterol.23(20):3632-3642，其关于结肠直肠癌测试通过引用并入本文)。FOBTs和FITs有时用于诊断结肠直肠癌(参见，例如，Nakamura2010J Diabetes Investig.Oct 19；1(5):208-11，其关于结肠直肠癌测试通过引用并入本文)。FIT是基于粪便中潜血的检测，潜血的存在通常预示着结肠直肠癌，但通常量不足以通过肉眼进行识别。例如，在典型的FIT中，该测试利用血红蛋白特异性试剂来测试粪便样品中的潜血。在各种情况下，FIT试剂盒适合个人在家中使用。当在没有其他诊断确认测试的情况下使用时，建议每年使用一次FIT。通常不依赖FIT为结肠直肠癌的结论性诊断提供足够的诊断信息。

诊断确认测试还包括gFOBT，其经设计以通过化学反应检测粪便中的潜血。与FIT一样，当在没有其他诊断确认测试的情况下使用时，可能建议每年使用gFOBT。通常不依赖gFOBT为结肠直肠癌的结论性诊断提供足够的诊断信息。

诊断确认测试还可以包括粪便DNA检测。结肠直肠癌的粪便DNA检测可经设计以鉴定粪便样品中癌症的DNA序列特征。如果在没有其他诊断确认测试的情况下使用，建议每三年使用一次粪便DNA检测。通常不依赖粪便DNA检测来为结肠直肠癌的结论性诊断提供足够的诊断信息。

一种特别的筛查技术是基于粪便的筛查测试(

(Exact SciencesCorporation,Madison,WI,United States)，其将FIT分析与DNA的异常修饰(例如突变和甲基化)分析相结合。

测试与单独的FIT检测相比，显示出改善的灵敏度，但由于依从率低，临床上可能不切实际或无效，所述低依从率至少部分是由于受试者不喜欢使用基于粪便的检测(参见，例如，doi:10.1056/NEJMc1405215(e.g.,2014N Engl J Med.371(2):184-188))。

测试似乎将几乎一半的合格人群排除在筛查计划之外(参见，例如，van der Vlugt 2017Br J Cancer.116(1):44-49)。如本文提供的筛查的使用(例如通过基于血液的分析)，将增加选择筛查结肠直肠癌的个体数量(参见，例如Adler 2014BMCGastroenterol.14:183；Liles 2017Cancer Treatment and Research Communications10:27-31)。就目前所知，只有一种现有的结肠直肠癌筛查技术Epiprocolon获得FDA批准和CE-IVD准售，并且是基于血液的。Epiprocolon基于SEPT9基因的高甲基化。Epiprocolon测试的结肠直肠癌检测的准确度低，灵敏度为68％，晚期腺瘤灵敏度仅为22％(参见，例如，Potter 2014Clin Chem.60(9):1183-91)。本领域尤其需要一种非侵入性结肠直肠癌筛查，其可以实现高受试者依从性，并且具有高和/或改进的特异性和/或灵敏度。

在各种实施方式中，根据本公开的方法和组合物的筛查降低了结肠直肠癌死亡率，例如通过早期结肠直肠癌诊断。数据支持结肠直肠癌筛查降低结肠直肠癌死亡率，这种影响持续了30多年(参见，例如，Shaukat 2013N Engl J Med.369(12):1106-14)。此外，结肠直肠癌特别难以治疗，至少部分是因为没有及时筛查的结肠直肠癌可能直到癌症过了早期阶段才被检测到。至少出于这个原因，结肠直肠癌的治疗通常是不成功的。为了使结肠直肠癌结果的全人群改善最大化，根据本公开的筛查的利用可以与例如合格受试者的招募配对以确保广泛筛查。

在各种实施方式中，包括一种或多种本文公开的方法和/或组合物的结肠直肠癌筛查之后是结肠直肠癌的治疗，例如早期结肠直肠癌的治疗。在各种实施方式中，结肠直肠癌例如早期结肠直肠癌的治疗包括施用治疗方案，所述治疗方案包括手术、放射疗法和化学疗法中的一种或多种。在各种实施方式中，结肠直肠癌例如早期结肠直肠癌的治疗包括施用包括本文提供的一种或多种治疗的治疗方案，以用于治疗0期结肠直肠癌、I期结肠直肠癌和/或II期结肠直肠癌。

在各种实施方式中，结肠直肠癌的治疗包括通过以下中的一种或多种来治疗早期结肠直肠癌，例如0期结肠直肠癌或I期结肠直肠癌：手术切除癌组织(例如通过局部切除(例如通过结肠镜)、部分结肠切除术或全结肠切除术)。

在各种实施方式中，结肠直肠癌的治疗包括通过以下中的一种或多种来治疗早期结肠直肠癌，例如II期结肠直肠癌：手术切除癌组织(例如，通过局部切除(例如，通过结肠镜)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结，以及化学疗法(例如，施用5-FU和亚叶酸、奥沙利铂或卡培他滨。

在各种实施方式中，结肠直肠癌的治疗包括通过以下中的一种或多种来治疗III期结肠直肠癌：手术切除癌组织(例如，通过局部切除(例如，通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结，以及化学疗法(例如，施用5-FU和亚叶酸、奥沙利铂或卡培他滨中的一种或多种，例如以下述组合：(i)5-FU和亚叶酸，(ii)5-FU、亚叶酸和奥沙利铂(例如，FOLFOX)，或(iii)卡培他滨和奥沙利铂(例如，CAPEOX))和放射疗法。

在各种实施方式中，结肠直肠癌的治疗包括通过以下中的一种或多种来治疗IV期结肠直肠癌：手术切除癌组织(例如，通过局部切除(例如，通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结，手术切除转移灶、化学疗法(例如，施用5-FU、亚叶酸、奥沙利铂、卡培他滨、伊立替康、VEGF靶向治疗剂(例如，贝伐单抗、阿柏西普、或雷莫芦单抗)、EGFR靶向治疗剂(例如，西妥昔单抗或帕尼单抗)、瑞戈非尼、三氟尿苷和替吡嘧啶中的一种或多种，例如以下述组合：(i)5-FU和亚叶酸，(ii)5-FU、亚叶酸和奥沙利铂(例如，FOLFOX)，(iii)卡培他滨和奥沙利铂(例如，CAPEOX)、以及(v)氟尿嘧啶和替吡嘧啶(Lonsurf))、放射疗法、肝动脉输注(例如，如果癌已转移至肝脏)、肿瘤消融、肿瘤栓塞、结肠支架、结肠切除术、结肠造口术(例如，分流结肠造口术)和免疫疗法(例如，派姆单抗)。

本领域技术人员本文提供的结肠直肠癌的治疗可以例如由执业医师确定的那样，单独或以任何组合，以任何顺序、方案和/或治疗程序使用。本领域技术人员将进一步理解，高级治疗选择可能适用于先前患有癌症或结肠直肠癌的受试者中的早期癌症，例如，被诊断为患有复发性结肠直肠癌的受试者。

在一些实施方式中，本文提供的用于结肠直肠癌筛查的方法和组合物可以告知例如由个体，医疗保健机构、医疗保健从业者、医疗保险提供者、政府机构或对医疗保健费用感兴趣的其他各方做出的治疗和/或支付(例如，医疗保健的费用的报销或减少，例如筛查或治疗)决定和/或行动。

在一些实施方式中，本文提供的用于结肠直肠癌筛查的方法和组合物可以告知与健康保险提供者是否偿付医疗保健费用支付者或接受者(或不)有关的决策，例如，用于(1)筛查本身(例如，报销筛查，除非不可用，仅适用于定期/定期筛查，或仅适用于临时和/或偶然动机的筛查)；和/或用于(2)治疗，包括例如，基于筛查结果启动、维持和/或改变治疗。例如，在一些实施方式中，本文提供的用于结肠直肠癌筛查的方法和组合物用作基础、有助于或支持确定是否将向医疗保健费用支付者或接受者提供报销或成本降低。在一些情况下，寻求报销或降低成本的一方可以提供根据本说明书进行的筛查的结果以及对医疗保健费用的这种报销或成本降低的请求。在某些情况下，作出关于是否提供医疗费用的报销或费用降低的决定的一方将全部或部分基于接收和/或审查根据本说明书进行的筛选的结果来作出决定。

为避免任何疑问，本领域技术人员将从本公开中理解，本说明书的用于结肠直肠癌诊断的方法和组合物至少用于体外使用。因此，本公开的所有方面和实施方式可以至少在体外进行和/或使用。

试剂盒

本公开内容尤其包括试剂盒，该试剂盒包括一种或多种如本文提供的用于结肠直肠癌筛查的组合物，任选地与其在结肠直肠癌筛查中的使用说明书组合。在各种实施方式中，用于结肠直肠癌筛查的试剂盒可包括以下中的一种或多种：一种或多种寡核苷酸引物(例如，一个或多个寡核苷酸引物对，例如见表13)、一种或多种MSRE、一种或多种用于qPCR的试剂(例如，足以完成qPCR反应混合物的试剂，包括但不限于dNTP和聚合酶)，以及用于结肠直肠癌筛查的试剂盒的一种或多种成分的使用说明书。在各种实施方式中，用于结肠直肠癌筛查的试剂盒可包括以下中的一种或多种：一种或多种寡核苷酸引物(例如，一个或多个寡核苷酸引物对，例如见表13)、一种或多种亚硫酸氢盐试剂、一种或多种用于qPCR的试剂(例如，足以完成qPCR反应混合物的试剂，包括但不限于dNTP和聚合酶)，以及用于结肠直肠癌筛查的试剂盒的一种或多种成分的使用说明书。

在某些实施方式中，本公开的试剂盒包括用于扩增如本文公开的甲基化基因座和/或DMR的至少一个寡核苷酸引物对。

在一些情况下，本公开的试剂盒包括用于扩增本公开的一个或多个甲基化基因座的一个或多个寡核苷酸引物对。在一些情况下，本公开的试剂盒包括用于扩增一个或多个甲基化基因座的一个或多个寡核苷酸引物对，所述一个或多个甲基化基因座是或包括表1中提供的一个或多个基因的全部或部分。在一些特定情况下，本公开的试剂盒包括包括用于多个甲基化基因座的寡核苷酸引物对，每个甲基化基因座是或包括表1中鉴定的基因的全部或部分，多个甲基化基因座包括，例如3、4、5、6、7、8、9、10、11、12、13、14、15或16个甲基化基因座，例如，如表1至6中任一个所提供的。

在一些情况下，本公开的试剂盒包括用于扩增本公开的一个或多个DMR的一个或多个寡核苷酸引物对。在一些情况下，本公开的试剂盒包括用于扩增一种或多种DMR的一个或多个寡核苷酸引物对，这些DMR是或包括表1中鉴定的基因的全部或部分或在表1中鉴定的基因内。在一些特定实施方式中，本公开的试剂盒包括用于多个DMR的寡核苷酸引物对，每个DMR是或包括表1中鉴定的基因的全部或部分，或在表1中鉴定的基因内，例如2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个DMR，例如，根据表1至6中的任一个。

在一些情况下，本公开的试剂盒包括用于扩增表7的一个或多个DMR的一个或多个寡核苷酸引物对。在一些特定情况下，本公开的试剂盒包括用于表7的多个DMR的寡核苷酸引物对，多个DMR包括，例如表7的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR，例如，如表8至12中的任一个中提供的。

在各种实施方式中，本公开的试剂盒包括表13中提供的一个或多个寡核苷酸引物对。本领域技术人员将理解表13中提供的寡核苷酸引物对可以以一个或多个寡核苷酸引物对的任何组合提供，例如以表1-12中任一项提供的组合。

在各种特定实施方式中，本公开的试剂盒不包括扩增FGF14、ZNF471、PDGFD和ALK中的一个或多个的全部或部分的寡核苷酸引物对。

本公开的试剂盒还可包括单独或在单一溶液中的一种或多种MSRE。在各种实施方式中，一个或多个MSRE选自包括AciI、Hin6I、HpyCH4IV和HpaII的MSRE组(例如，使得该试剂盒包括AciI、Hin6I和HpyCH4IV，单独或在单一溶液中)。在某些实施方式中，本公开的试剂盒包括一种或多种用于qPCR的试剂(例如，足以完成qPCR反应混合物的试剂，包括但不限于dNTP和聚合酶)。

实施例

本文的实施例确认，本公开尤其提供了用于筛查和治疗结肠直肠癌等的方法和组合物。本实施例进一步证明本文提供的组合物和方法在结肠直肠癌的筛查和/或治疗中提供了显著高度的灵敏度和特异性。还提供了比较来自诊断为患有结肠直肠癌的受试者的样品中的生物标志物的甲基化和来自对照受试者的样品中的生物标志物的甲基化的临床研究，进一步证明了包括本公开的方法和/或组合物的结肠直肠癌的筛查。除非另有特别说明，本实施例的样品是人或人源的。除实施例1外，所有实验均使用血浆样品进行。

实施例1.与结肠直肠癌相关的甲基化生物标志物的鉴定

本实施例包括鉴定与健康对照相比在结肠癌和直肠癌中的一种或多种中高甲基化的CpG基因座。特别地，本实施例的实验检查了来自以下的样品中的CpG甲基化：(i)先前诊断为患有结肠癌的341个受试者的结肠癌，所述受试者先前未接受过化学疗法或放射疗法；(ii)118名先前被诊断患有直肠癌的受试者的直肠癌，所述受试者先前未接受过化学疗法或放射疗法；(iii)40名未被诊断为患有结肠直肠癌的健康对照受试者的结肠；(iv)10名未诊断为患有结肠直肠癌的健康对照受试者的白细胞。组织样品是新鲜冷冻组织。

通过全球甲基组学分析平台(Infinium HumanMethylation450(HM450)珠测试)分析样品的DNA甲基化。Infinium HumanMethylation450阵列评估位于整个基因组中的>450000个CpG的甲基化状态。从所有组织样品中获得DNA甲基化谱。

鉴定了甲基化状态在结肠直肠癌和健康对照之间没有显著差异的CpG甲基化位点，并将其排除在考虑范围内(整个集合中不超过五个样品的平均b值<0.25和b值>0.3)。这种过滤产生了甲基化状态在结肠直肠癌和健康对照之间存在显著差异的CpG甲基化位点的列表。然后通过排除平均b值差异等于或小于0.1的CpG甲基化位点来进一步过滤所得的CpG甲基化位点组，产生253个CpG甲基化位点。与对照相比，253个CpG甲基化位点中的每一个都与结肠直肠癌状态中的高甲基化状态相关。

因此，本实施例产生了作为结肠直肠癌的甲基化生物标志物的253个个体CpG甲基化位点的组。253个甲基化生物标志物代表在36个基因内，即在36个甲基化基因座内共同发现的多个DMR。与健康对照相比，结肠直肠癌中36个DMR中的每一个都被高甲基化。

实施例2：通过MSRE-qPCR开发用于甲基化生物标志物的无细胞DNA检测

本实施例开发了一种基于循环无细胞DNA(cfDNA)确定结肠直肠癌甲基化生物标志物的甲基化状态的测试。cfDNA不完整和片段化，并且cfDNA从癌细胞传输到血液的机制(作为一部分称为循环肿瘤DNA)是未知的。至少因为实施例1的253个甲基化生物标志物是从组织样品中鉴定的，因此在本实施例的实验之前不知道是否可以从cfDNA充分分析鉴定的结肠直肠癌甲基化生物标志物以成功捕获ctDNA部分，所述ctDNA部分允许鉴定结肠直肠癌的受试者或样品。

作为确定是否可以从cfDNA中充分分析实施例1中鉴定的结肠直肠癌甲基化生物标志物以成功捕获允许鉴定结肠直肠癌受试者或样品的ctDNA部分的关键步骤，开发了一种灵敏的测试法来筛查这些生物标志物。特别是，开发了甲基化灵敏度限制酶(MSRE)-qPCR方法。开发MSRE-qPCR方法是为了测量DMR的甲基化，所述DMR覆盖血液样品中已鉴定的CpG位点，特别是在血液中存在的肿瘤的无细胞DNA(cfDNA)中。

MSRE-qPCR方法的开发具有重要意义，至少部分是因为通过分析cfDNA来分析源自肿瘤组织的CpG甲基化生物标志物具有挑战性，这归因于与样品的非肿瘤DNA背景相比，血液中循环的肿瘤来源的DNA的浓度低(0.1-1％)。因此，虽然通常优选开发依赖于容易获得的样品(例如血液、尿液或粪便)的生物标志物分析，但使用血液来分析肿瘤衍生的甲基化生物标志物是具有挑战性的。因此，即使在组织中鉴定了具有结肠直肠癌特征的甲基化生物标志物之后，如上所述，也无法预测ctDNA的碎片化和知之甚少的性质是否允许使用在组织中鉴定的甲基化生物标志物进行成功筛查。

MSRE-qPCR需要设计扩增基因座的寡核苷酸引物(MSRE-qPCR寡核苷酸引物对)，每个所述基因座包括至少一个结肠直肠癌MSRE切割位点(即，覆盖至少一个结肠直肠癌甲基化生物标志物位点的MSRE切割位点，使得允许在核酸分子中切割MSRE切割位点，其中所有的所述至少一个结肠直肠癌甲基化生物标志位点都未甲基化，并且在其中至少一个结肠直肠癌甲基化生物标志位点被甲基化的核酸分子中被阻断)。MSRE-qPCR测试可以利用多种限制性内切酶来扩大可通过单个MSRE-qPCR反应测试的结肠直肠癌甲基化生物标志物位点的范围，因为单个MSRE不太可能切割包括所有感兴趣的甲基化生物标志物位点的位点。本实施例的MSRE-qPCR测试利用MSREs AciI、Hin6I和HpyCH4IV，发现它们一起提供了足够的覆盖率。

图1中提供了MSRE-qPCR的示例性工作流程示意图。如本实施例中所执行的，根据制造商方案(QIAamp MinElute ccfDNA Handbook 08/2018,Qiagene)通过QIAampMinElute ccfDNA试剂盒从受试者血液(通常为约4mL的血浆样品)中提取循环无细胞肿瘤DNA。如图1所示，分离的cfDNA被分成两份等分试样，其中一份等分试样用于qPCR品质控制分析，第二份等分试样用于MSRE-qPCR。

对于MSRE-qPCR，2/3体积的洗脱cfDNA被MSRE消化。由于非甲基化DNA被选择性切割，因此将cfDNA与MSRE接触可富集样品的甲基化衍生信号；甲基化的DNA保持完整且可量化。剩余的1/3体积的洗脱cfDNA用于使用MSRE-qPCR寡核苷酸引物进行qPCR，以确认从cfDNA中成功扩增了扩增子，该扩增确认模板存在，从而提供技术品质控制。

如本文所应用的，成功开发了用于将DMR一起扩增的MSRE-qPCR寡核苷酸引物对，包括实施例1中鉴定的253个CpG甲基化生物标志物位点中的180个。DMR通常包括1至15个MSRE切割位点，所述MSRE切割位点共同覆盖了180个甲基化生物标志物位点中的每一个。如本文所用，六个基因(JUB、H19、TBP、TCEB2、SNRPN、IRF4)的甲基化状态提供了甲基化对照，该对照允许监测测试的鲁棒性和再现性。

实施例3：cfDNA的MSRE-qPCR通过结肠直肠癌状态成功区分了受试者

为了探测已鉴定甲基化生物标志物的临床诊断和预后能力，在从人类受试者血浆中提取的cfDNA中测试了由覆盖180个甲基化生物标志物位点的MSRE-qPCR寡核苷酸引物对扩增的DMR，和适当的对照。受试者是寻求或正在获得关于可能的结肠直肠癌的诊断的未确诊个体，使得可以在传统的结肠直肠癌诊断测试之前进行甲基化生物标志物分析，然后与随后的传统诊断进行比较。特别是，cfDNA是从2017年至2018年间在西班牙和美国的筛查中心和肿瘤诊所寻求或正在获得有关可能的结肠直肠癌诊断的未确诊个体的样品。第一受试者组包括70个这样的个体(参见图2中第一个受试者组的描述)，第二受试者组包括63个这样的个体(参见图3中第二受试者组的描述)。基于对第二受试者组中表14中所示基因的一小组测试DMR的MSRE-qPCR分析的初步结果提供了结肠直肠癌诊断的原理证明：结果表明，对于结肠直肠癌，总体诊断灵敏度为80％，早期局部结肠直肠癌的诊断灵敏度高达75％，特异性90％(图4)。代表性的DMR原理验证组在近端癌症和远端癌症方面的表现类似和/或统计上相当(图4)。DMR的原理验证小组在局部癌症和晚期癌症方面的表现也类似和/或在统计学上同样出色(图4)。此外，MSRE-qPCR对照基因和未消化DNA对照的甲基化的MSRE-qPCR分析表明，开发的MSRE-qPCR测试在测量血浆cfDNA中的结肠直肠癌生物标志物甲基化状态方面具有很高的技术可靠性。

图5-9显示了结肠直肠癌DMR的甲基化状态与结肠直肠癌的关联。结果显示为从45减去MSRE-qPCR Ct值(即45–Ct值)，以用于显示目的。结果证明了本公开的个体结肠直肠癌甲基化生物标志物或少至三个个体结肠直肠癌甲基化生物标志物对结肠直肠癌的预测能力(例如用于确定受试者中结肠直肠癌的筛查)令人吃惊地高。

表14:原理证明DMR组

实施例4.通过MSRE-qPCR进一步验证甲基化生物标志物

为了验证甲基化生物标志物DMR对结肠直肠癌的预测能力，进一步分析了来自实施例3中鉴定的第一受试者组和第二受试者组的133个受试者的样品的MSRE-qPCR分析的数据(见图2和图3)。使用Monte-Carlo交叉验证超过50次运行，使用随机森林算法进行特征排序，并且使VIP>2的标志物构建基于支持向量机(SVM)算法的分类模型。该分析鉴定了在SVM模型中给出良好预测的几个标志物亚组(2、3、5、8、15、28，如表7-12中所述)。

所有模型(2、3、5、8、15和28个结肠直肠癌DMR组)均应用于从第三受试者组的血浆中提取的cfDNA。第三受试者组包括82个受试者，基于结肠镜检查，所述82个受试者先前已接受结肠直肠癌的经确认诊断，或者是已知没有被认为患有结肠直肠癌的对照受试者(对照组包括患有增生性息肉和/或非晚期腺瘤的受试者，但没有结肠直肠癌))。所述82个受试者是在西班牙和美国参加结肠直肠癌筛查和肿瘤科的受试者。第三受试者组的进一步描述如图10所示。

用于在MSRE-qPCR中扩增28个DRM的寡核苷酸引物对(表13)覆盖至少一个MSRE切割位点，通常为3至15个MSRE切割位点。MSRE-qPCR根据实施例2中描述的方法进行。

尽管所有测试组用于筛查结肠直肠癌的充分性和实用性，本领域技术人员将理解，与表15中所示的所有其他DMR组相比，28-DMR组提供了增加的灵敏度和可比的特异性。为了避免疑问，测试的所有组(如表7-14中所述的组)，单独地单独用于临床筛查结肠直肠癌是足够的(例如，在灵敏度和特异性方面)和有用的。使用28个结肠直肠癌DMR组对第三受试者组进行的分析表明，诊断结肠直肠癌的一般灵敏度为79％，局部(早期)癌症的灵敏度为75％，晚期癌症的灵敏度为84％。数据还显示AUC为82％时的特异性为87％(图11)。图11提供了通过SVM模型鉴定的28个标志物组的第二验证组数据的ROC曲线分析。

因此，对28个结肠直肠癌DMR组及其亚组的性能的评估表明，28个结肠直肠癌DMR中的整个组和2、3、5、8和15个的各个亚组中的每一个都足以单独用于临床筛查结肠直肠癌(见表7-14)。例如，仅举一个例子，3-DMR亚组(表9)实现了结肠直肠癌受试者与对照受试者的良好分离，证明了结肠直肠癌临床筛查的足够性能，这至少部分通过确定的灵敏度为60％和特异性为87％来证明(表15)。

SVM-模型特征在表16中描述。输入支持SVM向量和它们的系数(权重)值在表17中给出(由于表17的大小，表17以几个部分显示，系数和基因名称在各部分中重复以供参考)。出于预测目的，提供的信息与R-package中的predict()函数结合使用(请参阅超文本传输协议安全(HTTPS)://cran.r-project.org/web/packages/e1071/index.html)。

表15.将28个结肠直肠癌DMR组及其亚组应用于第三受试者组的准确度度量

表16 SVM模型输入特性

变量	值
		type	0
kernel	2
		cost	1
degree	3
		gamma	0.035714
coef0	0
		nu	0.5
epsilon	0.1
		nclasses	2
rho	-0.73551
		probA	-2.14936
probB	-0.10114
		sigma	0

表17:SVM向量

coefs	GSG1L	ZNF492_2	ZNF568_2	ZNF568_1	ZNF542_2
							GSG1L'861	ZNF492'499	ZNF568'252	ZNF568'405	ZNF542'525
1	0.166333806	0.423405118	-0.939531248	0.275236404	-0.052862411
						1	0.183718034	-2.19255911	-0.092363545	-0.327541264	0.309450278
0.160992568	-0.094429617	-2.19255911	-0.939531248	-0.413652359	0.137466406
						1	0.475386751	0.318930431	-0.147777884	0.019978514	0.164983826
1	-0.152377044	0.473593938	1.146062978	0.429006217	0.574305439
						1	0.315065536	0.442866089	0.835406834	0.041506288	0.55940017
0.539110203	-0.428593114	0.344536972	0.864793226	-0.0507556	0.174156299
						1	0.143154835	-2.19255911	0.848840613	-0.373672208	0.025103611
0.228841426	-0.16396653	0.392677269	-0.939531248	-0.0507556	0.161544148
						1	0.691723813	0.288202582	-0.939531248	0.232180856	0.641952428
1	0.152812739	0.548365038	0.897538063	0.321367348	0.6259006
						0.086502196	0.152812739	0.413162502	-0.939531248	-0.318315075	0.260148235
1	0.058165275	0.455157229	-0.939531248	-0.035378619	0.421813073
						0.022981588	-0.055797999	-2.19255911	-0.939531248	-0.469009492	0.310596837
0.199753156	0.029191561	0.425453641	-0.939531248	-0.192223828	0.392002536
						0.640672506	0.401986676	0.512515881	0.731295044	-0.352144434	-2.050168434
0.488436741	0.11224954	-2.19255911	-0.939531248	-0.327541264	-2.050168434
						0.290813367	0.038849466	0.455157229	0.842963334	0.038430892	0.370217912
0.93438076	-0.165898111	0.292299628	0.996612184	-0.293711905	0.182182213
						1	0.34597083	0.531976852	-0.939531248	0.622756182	0.534175869
0.177133374	0.291886565	0.201140342	0.931122511	0.312141159	0.439011461
						0.363673626	-0.252819252	0.199091819	-0.939531248	-0.232203979	0.408054364
0.372869951	-0.022961123	-2.19255911	-0.939531248	-0.438255529	-2.050168434
						0.180416799	-0.0152348	0.246207854	-0.939531248	-0.247580961	0.130587052
1	1.837151292	1.131169911	-0.939531248	1.084065621	1.180835225
						0.236974727	-4.54286045	0.032137172	-0.240135117	-0.619703909	-2.050168434
0.433173404	-4.54286045	-2.19255911	-0.939531248	-0.40442617	0.427545869
						0.037394649	0.15474432	-2.19255911	-0.939531248	-0.204525413	0.471115116
1	0.245528623	0.455157229	-0.939531248	-0.207600809	0.380536944
						0.263636311	-4.54286045	-2.19255911	-0.939531248	-1.72992196	-2.050168434
1	0.682065908	0.557583393	1.034394689	0.828807731	0.838014042
						1	-0.042276933	0.55553487	0.775794438	0.158371346	0.349579848
1	0.025328399	0.467448369	0.848001002	-0.524366624	0.018224256
						0.26169536	-4.54286045	-2.19255911	-0.939531248	-7.963750185	-2.050168434

表17续：SVM向量

coefs	GSG1L	ZNF492_2	ZNF568_2	ZNF568_1	ZNF542_2
							GSG1L'861	ZNF492'499	ZNF568'252	ZNF568'405	ZNF542'525
0.1799778	0.295749727	0.267717349	-0.939531248	0.226030064	0.467675439
						0.898868481	-0.18521392	0.324051739	-0.939531248	-0.023077034	0.29339845
0.042908076	0.019533657	0.191921987	-0.939531248	-0.622779305	0.275053503
						0.140898434	-4.54286045	0.204213127	-0.939531248	-0.567422172	0.123707697
0.140415448	0.293818146	-2.19255911	-0.939531248	-0.699664211	0.061793503
						1	0.166333806	0.135587597	-0.939531248	-0.044604807	0.459649525
0.108835219	-0.378372011	0.333270094	-0.939531248	-0.604326927	-2.050168434
						1	0.608665834	0.370143513	0.901736119	0.641208559	0.750875547
-1	0.322791859	-2.19255911	1.066299914	0.186049912	0.550227697
						-1	0.025328399	-2.19255911	-0.497895756	0.026129307	0.433278665
-1	0.311202374	0.387555961	-0.939531248	-0.182997639	0.5192706
						-1	-0.059661161	0.322003216	1.020121298	0.422855425	0.403468127
-1	0.403918257	0.612893521	0.959669292	0.468986368	0.589210708
						-1	0.172128548	0.145830214	0.701908652	0.182974516	0.491753181
-1	-0.16396653	0.411113978	-0.939531248	-0.336767452	0.473408235
						-1	0.336312926	0.694834453	-0.939531248	0.819581542	0.740556515
-0.27309104	1.360050807	0.923244798	1.68509337	2.378807448	1.22669759
						-1	2.101777876	1.346264856	1.939495565	3.255295383	1.550027268
-1	0.712971203	0.404968409	0.776634049	0.475137161	-2.050168434
						-0.675668601	0.382670867	0.677422005	1.048668079	0.579700634	0.674056084
-1	0.245528623	0.403944147	-0.939531248	-0.545894398	-2.050168434
						-0.228886868	1.516508861	0.993918852	1.713640151	2.252716201	1.264534042
-1	0.523676274	0.505346049	0.922726399	0.272161008	0.602969418
						-0.253709663	0.53719734	0.671276435	-0.939531248	0.186049912	0.764634257
-1	-0.007508476	-2.19255911	-0.939531248	-0.284485716	0.336967697
						-1	0.465728846	0.297420936	-0.939531248	0.075335647	0.648831783
-1	0.206897005	0.52480702	0.981499183	0.066109458	0.583477912
						-1	0.626050062	0.583189934	-0.939531248	0.804204561	0.654564579
-1	0.094865312	0.356828111	0.968065404	0.112240402	0.397735331
						-1	0.04850737	-2.19255911	-0.939531248	-1.041033197	0.29339845
-1	-0.241229766	-2.19255911	0.913490675	-0.14916828	0.136319847
						-1	0.419370905	-2.19255911	-0.939531248	0.099938817	0.659150816
-1	0.228144395	0.438769043	0.834567222	0.413629236	0.549081138
						-1	0.45220778	0.585238457	0.886623117	-0.103037336	0.838014042
-1	0.237802299	0.444914613	-0.939531248	0.078411043	0.295691568

表17续：SVM向量

coefs	ZNF542_1	ZNF471_2	ZNF471_1	ZNF471_3	ZNF132_2
							ZNF542'502	ZNF471'527	ZNF471'558	ZNF471'662	ZNF132'268
1	0.210023302	0.448781467	0.381358009	0.276869984	-0.079808848
						1	0.096511033	-1.701659498	0.111027436	0.245615084	0.220719423
0.160992568	0.011755205	0.491015986	0.192253523	0.011882788	0.004011962
						1	0.075322076	0.362552655	0.179561947	0.342097602	0.355650484
1	0.438561338	0.531490735	0.353436542	0.351609963	0.275918493
						1	0.322022075	0.502454502	0.314092655	0.193976554	0.091921593
0.539110203	0.007214715	0.395108431	0.091990071	0.143696932	-0.206562268
						1	0.010241709	0.604521258	0.298862764	0.238820541	0.200275323
0.228841426	0.010241709	-1.701659498	-0.009542539	-3.291624259	0.120543333
						1	0.477912258	0.220891037	0.146563849	0.172234015	0.333161974
1	0.228185265	0.381030258	0.097066702	0.160003836	0.380183404
						0.086502196	0.116186493	-1.701659498	-0.38775151	-0.122649173	-0.237228418
1	0.194888333	0.592202857	0.357244014	0.299971432	0.053077803
						0.022981588	-0.13808099	-1.701659498	-0.060308843	-3.291624259	-0.186118168
0.199753156	0.15705091	0.495415416	0.260788035	0.227949271	-0.034831828
						0.640672506	0.120726984	-1.701659498	0.215098361	0.210283458	0.183920043
0.488436741	0.05867361	-1.701659498	0.02853219	0.007806062	-0.341493329
						0.290813367	0.063214101	0.449661352	0.10848912	0.248332902	0.433338064
0.93438076	0.043538641	0.359912998	0.034877978	-0.051985921	0.051033393
						1	0.211536799	-1.701659498	-0.187224606	-0.012577568	0.482403904
0.177133374	0.264509192	0.375750943	0.046300397	-3.291624259	-7.69E-05
						0.363673626	0.073808579	0.258726128	0.171947002	-0.049268103	-0.204517858
0.372869951	-3.407234345	0.527971191	0.279825399	0.138261297	-0.406914449
						0.180416799	-3.407234345	-1.701659498	-0.136458301	-3.291624259	-0.406914449
1	1.345145995	1.182606248	1.282459921	1.285180239	1.347189337
						0.236974727	-3.407234345	-1.701659498	-2.980640533	-0.383559643	-0.085942078
0.433173404	0.001160727	0.382790029	0.060261131	-0.069651734	-0.110474998
						0.037394649	-0.468023319	0.373111285	0.013302299	-0.008500842	-0.257672518
1	0.455209804	0.5957224	0.409279477	0.446733572	0.001967552
						0.263636311	-3.407234345	-1.701659498	-2.980640533	0.049932232	-5.066124854
1	0.721585263	0.52181199	0.325515074	0.344815419	0.791109815
						1	0.060187107	0.342315281	0.10848912	-0.046550286	0.071477493
1	-0.038190193	0.419745234	0.317900128	0.173592923	-0.413047679
						0.26169536	-3.407234345	0.529730963	0.213829203	-0.096829908	-0.366026249

表17续：SVM向量

coefs	ZNF542_1	ZNF471_2	ZNF471_1	ZNF471_3	ZNF132_2
							ZNF542'502	ZNF471'527	ZNF471'558	ZNF471'662	ZNF132'268
0.1799778	0.155537413	-1.701659498	-0.034925691	0.191258736	-5.066124854
						0.898868481	0.278130664	0.655554636	0.5463485	0.405966311	-0.192251398
0.042908076	0.079862567	0.491895872	0.225251622	0.179028558	0.020367243
						0.140898434	0.051106125	-1.701659498	-0.243067541	-3.291624259	-5.066124854
0.140415448	-0.074514119	-1.701659498	-2.980640533	0.154568201	-0.304693949
						1	0.128294469	0.220011151	-0.135189143	0.202130006	0.106232463
0.108835219	-3.407234345	-1.701659498	-2.980640533	-3.291624259	0.026500473
						1	0.526344159	-1.701659498	-0.140265774	0.233384906	0.603024094
-1	0.368940479	0.572845368	0.377550536	0.036343145	0.177786813
						-1	0.31445459	0.503334388	0.298862764	0.181746375	0.132809793
-1	0.240293241	0.61683966	0.287440345	0.473911746	0.378138994
						-1	0.134348456	0.407426833	0.248096459	0.279587802	-0.165674068
-1	0.424939866	0.570205711	0.39151127	0.305407067	0.523292104
						-1	0.347751522	0.558767195	0.404202846	0.324431789	0.210497373
-1	0.325049069	0.280723273	0.102143332	0.295894706	-0.286294258
						-1	0.577803055	0.540289593	0.434662629	0.505166646	0.881063855
-0.27309104	1.379956424	0.847369747	0.820486547	0.710361859	1.046661066
						-1	1.806762557	1.486166858	1.711435198	1.720031023	2.25286297
-1	0.343211032	0.614200002	0.400395374	0.426349941	0.654134345
						-0.675668601	0.455209804	0.547328679	0.424509368	0.408684128	0.776798945
-1	-0.012460745	0.328237108	-0.031118218	-0.007141934	0.077610723
						-0.228886868	1.384496915	1.151810244	1.269768345	1.328665317	1.330834057
-1	0.391642933	0.754981735	0.631382061	-3.291624259	0.118498923
						-0.253709663	0.741260723	1.184366019	1.220271198	1.031064312	0.367916944
-1	-0.147161972	-1.701659498	-0.187224606	-0.133520443	0.065344263
						-1	0.536938638	0.610680459	0.408010319	0.446733572	0.425160424
-1	0.188834345	-1.701659498	0.259518877	0.237461632	0.480359494
						-1	0.421912872	0.484856786	0.344552438	0.318996154	0.692978135
-1	0.190347842	0.604521258	0.31663097	0.270075441	-0.024609778
						-1	0.060187107	0.410946376	0.26332635	0.282305619	0.108276873
-1	0.043538641	0.546448794	0.279825399	0.100211854	-0.063453568
						-1	0.443101829	0.402147518	0.429585999	0.274152167	0.055122213
-1	0.446128822	0.451421124	0.211290888	0.308124884	0.220719423
						-1	0.774557655	0.410946376	0.221444149	0.145055841	0.717511055
-1	0.110132505	0.549968337	0.243019828	-0.111777904	0.273874083

表17续：SVM向量

coefs	ZNF132_1	JAM2	MCIDAS_1	MCIDAS_2	PDGFD_1
							ZNF132'415	JAM2'320	MCIDAS'855	MCIDAS'003	PDGFD'388
1	0.238896666	0.406419198	0.492859834	0.416450063	0.046762915
						1	-0.397730773	-2.423671354	0.320276073	0.121123394	-0.124572283
0.160992568	-0.170552517	-2.423671354	-2.052243039	0.091026409	-0.261640442
						1	0.347202579	0.464995238	0.485753444	0.245273459	0.426555938
1	0.120024323	0.545266109	0.761887461	0.544362251	-0.027482338
						1	0.006435195	0.297945048	0.524330991	0.190722673	0.235231633
0.539110203	-0.693590827	0.228521593	0.262409754	0.038356684	-0.53577676
						1	-0.550944015	0.287097633	0.044142056	-0.183608583	0.20382018
0.228841426	-0.352823443	0.214419954	0.199467441	0.028951376	0.121008168
						1	0.299653641	0.447639374	0.58219731	0.501097835	0.423700352
1	0.26795435	0.317470395	0.572045325	0.252797705	0.266643087
						0.086502196	-0.487545432	0.333741518	0.359868819	0.213295412	-0.16169491
1	0.088325031	0.395571783	0.40961355	0.333683353	0.126719341
						0.022981588	-1.155872162	-2.423671354	-2.052243039	0.019546069	-0.669989332
0.199753156	-0.231309492	-2.423671354	0.225862604	0.043999869	-0.17882843
						0.640672506	0.407959554	0.378215919	0.320276073	0.141815072	0.152419621
0.488436741	-0.410938811	-0.105578787	0.311139286	-4.590935879	-0.375863908
						0.290813367	-0.049038566	0.15367443	-2.052243039	0.168149934	0.358021859
0.93438076	-0.614342598	0.187301416	-0.001541881	-0.078269134	-0.624299946
						1	0.415884377	0.216589437	0.588288502	0.241511336	0.469389738
0.177133374	0.135873968	0.230691076	0.443115103	0.15122038	0.132430514
						0.363673626	-0.025264097	0.130894859	0.318245676	0.072215793	-0.247362509
0.372869951	-0.281500037	0.267572287	0.200482639	-0.042528964	-0.190250776
						0.180416799	-6.542110115	0.37930066	0.199467441	-0.245683615	-0.435831227
1	1.855560534	1.410889819	1.44105532	1.953277379	1.120463492
						0.236974727	-0.71208208	-2.423671354	-2.052243039	-4.590935879	-0.344452455
0.433173404	0.104174677	-0.128358358	0.297941704	-0.078269134	0.292343366
						0.037394649	-0.226026277	0.150420206	-2.052243039	0.049643054	-0.104583177
1	-0.424146849	0.275165477	-2.052243039	0.072215793	0.063896435
						0.263636311	-6.542110115	-0.08605344	-2.052243039	-0.591798947	-7.103626036
1	0.69061157	0.407503939	0.605546878	0.314872738	1.134741426
						1	-0.038472135	0.309877205	0.161905093	-0.241921492	0.295198953
1	-0.014697667	0.199233573	0.256318562	-0.24004043	-0.407275361
						0.26169536	-0.878503361	0.122216927	0.038050865	-4.590935879	-0.415842121

表17续：SVM向量

coefs	ZNF132_1	JAM2	MCIDAS_1	MCIDAS_2	PDGFD_1
							ZNF132'415	JAM2'320	MCIDAS'855	MCIDAS'003	PDGFD'388
0.1799778	-0.125645187	0.492113775	0.581182112	0.352493969	-7.103626036
						0.898868481	0.101533069	-2.423671354	0.41671994	0.02142713	-0.470098267
0.042908076	-0.281500037	-2.423671354	0.402507159	-0.345379879	-0.235940162
						0.140898434	-0.532452762	0.177538743	-2.052243039	-0.040647902	-0.707111958
0.140415448	-0.136211617	-2.423671354	0.160889894	0.143696133	-0.147416977
						1	0.006435195	0.180792967	0.542604565	0.326159107	-0.304474242
0.108835219	-0.292066467	-2.423671354	0.051248446	-0.388644296	-0.632866706
						1	0.574380834	0.446554633	0.667473992	0.598913037	0.812060135
-1	0.196630944	0.384724368	0.345656038	0.218938597	0.363733032
						-1	0.180781298	0.228521593	0.117236355	-0.119652489	0.546490577
-1	0.471358137	0.249131681	0.483723047	-0.149749474	0.483667671
						-1	-0.022622489	0.469334204	0.406567954	0.145577195	-0.007493231
-1	0.574380834	0.309877205	0.617729261	0.132409764	0.466534151
						-1	0.030209663	0.205742022	0.451236692	-0.003026671	-0.010348818
-1	0.02228484	0.213335212	0.123327546	0.237749213	0.078174368
						-1	0.970621979	0.511639122	0.606562077	0.311110614	0.689269909
-0.27309104	0.981188409	1.000857535	1.309079503	1.5507302	1.465989476
						-1	2.840880179	1.538889315	1.185225275	1.65795071	2.031395631
-1	0.574380834	0.560452489	0.650215616	0.561291805	0.777793095
						-0.675668601	1.139684867	0.64072336	0.720264319	0.572578175	0.892016561
-1	-0.178477339	0.079912009	0.120281951	0.008259699	0.123863754
						-0.228886868	1.945375193	1.1646535	1.014671911	1.069178434	1.683014061
-1	0.064550562	0.462825755	0.547680558	0.290418937	0.395144485
						-0.253709663	0.79099266	0.783909237	0.578136516	0.538719066	0.709259016
-1	-0.276216822	-2.423671354	0.205558632	-0.010550917	-0.298763069
						-1	0.36833544	0.443300408	0.530422182	0.094788532	0.400855659
-1	0.36833544	0.212250471	0.372051202	0.143696133	0.226664874
						-1	0.761934976	0.514893347	0.615698864	0.350612908	0.717825776
-1	0.283803995	0.427029286	0.48169265	0.243392397	0.149564034
						-1	-0.659249928	0.18296245	0.281698527	-0.371714741	0.118152581
-1	-0.241875922	0.190555641	0.327382464	-0.001145609	-0.116005524
						-1	0.149082006	0.290351858	0.572045325	0.388234139	0.452256218
-1	0.347202579	0.420520837	0.494890231	0.164387811	0.466534151
						-1	1.055153423	0.579977836	0.862392122	0.811472996	0.186686661
-1	-0.123003579	-2.423671354	0.184239462	0.29418106	0.443689458

表17续：SVM向量

coefs	PDGFD_2	ST6GALNAC5	ZNF492_1	CNRIP1_1	LONRF2_1
							PDGFD'921	ST6GALNAC5'456	ZNF492'069	CNRIP1'272	LONRF2'281
1	1.302789852	0.466406944	-0.240707793	-0.064165795	0.182108844
						1	-0.682617737	0.569041467	-0.17761095	-0.307307386	-0.063816882
0.160992568	-0.682617737	0.705281983	-0.150569446	0.093547669	-0.189987472
						1	-0.682617737	0.569041467	0.176933218	0.189928119	0.325387311
1	1.475318586	0.828806718	-0.132541776	0.498783653	0.197078236
						1	-0.682617737	-1.277471664	0.08679487	0.38268902	0.201355206
0.539110203	-0.682617737	-1.277471664	-0.210661677	0.019071866	0.100846431
						1	-0.682617737	0.367405503	0.056748754	-0.149593922	0.090154008
0.228841426	-0.682617737	0.246605578	0.194960887	0.161452077	-0.098032635
						1	1.096640133	0.76522781	0.480398989	0.178975795	0.534958799
1	-0.682617737	0.792475913	0.065762589	0.119833246	0.338218218
						0.086502196	1.281555546	-1.277471664	-0.327841529	-0.079499049	-0.207095348
1	-0.682617737	0.638978265	0.149891714	0.369546231	0.333941249
						0.022981588	-0.682617737	-1.277471664	-0.360892257	-3.744146627	-0.585607118
0.199753156	-0.682617737	-1.277471664	-0.162587892	-0.042261148	-5.029378066
						0.640672506	-0.682617737	0.586298599	0.23702545	-0.07073719	-0.22634171
0.488436741	1.209005001	-1.277471664	0.017688804	-0.348926217	-0.160048688
						0.290813367	-0.682617737	0.638069995	0.110831763	-0.007213711	0.165000968
0.93438076	1.368262294	0.469131755	-0.57421968	-0.379592724	-0.014631737
						1	-0.682617737	-1.277471664	0.423311368	0.316975076	0.498604562
0.177133374	-0.682617737	0.554509145	0.243034673	0.222785091	0.154308545
						0.363673626	-0.682617737	0.566316656	-0.369906092	-0.186831823	-0.068093851
0.372869951	-0.682617737	-1.277471664	-0.231693959	-0.06635626	-0.435913198
						0.180416799	-0.682617737	-1.277471664	-1.154109717	-2.41672497	-0.136525357
1	-0.682617737	1.508192759	1.468916202	2.071537366	0.917747538
						0.236974727	-0.682617737	-1.277471664	-0.330846141	-4.848140877	-5.029378066
0.433173404	-0.682617737	0.542701634	0.056748754	-0.243783907	0.263371258
						0.037394649	-0.682617737	-1.277471664	0.149891714	-0.362069006	-0.068093851
1	-0.682617737	0.620812863	0.336177632	0.045357444	-0.311881093
						0.263636311	-0.682617737	-1.277471664	-7.154319065	-0.734448018	-5.029378066
1	1.438158551	-1.277471664	1.072307472	0.660878047	0.791576948
						1	1.220506917	0.624445943	0.131864044	-0.048832542	-0.016770221
1	-0.682617737	0.609913622	-0.204652454	-0.160546246	-0.269111401
						0.26169536	-0.682617737	-1.277471664	-7.154319065	0.207451837	-5.029378066

表17续：SVM向量

coefs	PDGFD_2	ST6GALNAC5	ZNF492_1	CNRIP1_1	LONRF2_1
							PDGFD'921	ST6GALNAC5'456	ZNF492'069	CNRIP1'272	LONRF2'281
0.1799778	-0.682617737	-1.277471664	0.534481997	0.062881162	0.607667275
						0.898868481	-0.682617737	0.698015822	-0.021371147	0.268784851	-0.040293551
0.042908076	-0.682617737	-1.277471664	-0.339859976	-0.567972695	-0.326850485
						0.140898434	-0.682617737	-1.277471664	-0.571215068	-0.537306188	-0.442328652
0.140415448	-0.682617737	-1.277471664	-0.144560222	-3.146149742	0.111538853
						1	-0.682617737	-1.277471664	-0.021371147	0.178975795	0.505020015
0.108835219	-0.682617737	-1.277471664	-0.318827695	-4.848140877	-0.463713497
						1	-0.682617737	-1.277471664	0.429320592	0.560116667	0.757361195
-1	1.29571175	-1.277471664	0.092804093	-0.136451133	0.107261884
						-1	-0.682617737	0.76613608	0.393265253	-0.094832302	0.220601567
-1	-0.682617737	-1.277471664	0.324159186	0.260022992	0.415203663
						-1	1.442582365	0.811549586	-0.108504883	0.424307851	0.248401866
-1	-0.682617737	0.770677431	0.579551171	0.380498555	0.637606059
						-1	1.147071609	-1.277471664	-0.084467991	-0.241593443	0.094430977
-1	-0.682617737	0.633528644	0.342186855	0.216213697	0.081600069
						-1	-0.682617737	0.821540557	0.792878594	0.619259216	0.872839362
-0.27309104	2.042451502	1.427356719	1.264602614	1.732015325	1.51224625
						-1	-0.682617737	1.5981115	2.0127509	2.529344505	2.128129808
-1	1.308983191	0.435525761	0.480398989	0.316975076	0.733837865
						-0.675668601	-0.682617737	0.837889419	0.726777139	0.551354808	0.63332909
-1	-0.682617737	-1.277471664	0.083790259	-0.06635626	-0.040293551
						-0.228886868	1.923893295	1.317456036	1.381782466	1.839348099	1.349721423
-1	-0.682617737	0.856963091	0.315145351	0.343260654	0.259094289
						-0.253709663	1.235547883	1.01500209	0.964141455	1.026685666	0.729560896
-1	1.354106091	-1.277471664	-0.048412651	-0.099213232	-0.076647789
						-1	-0.682617737	0.617179782	0.393265253	0.303832288	0.505020015
-1	1.269168867	0.629895564	0.342186855	0.481259935	0.421619117
						-1	1.248819324	0.831531528	0.315145351	0.308213217	0.673960297
-1	1.336410836	0.788842833	-0.168597115	0.371736696	0.188524298
						-1	1.133800168	0.567224926	-0.126532553	-0.134260668	-0.001800829
-1	-0.682617737	-1.277471664	-0.105500272	-0.090451373	0.216324598
						-1	-0.682617737	0.717997765	0.390260641	0.411165062	0.513573954
-1	-0.682617737	0.735254897	0.231016227	0.384879485	0.541374253
						-1	-0.682617737	1.01681863	0.231016227	1.147161228	0.703899081
-1	1.284209834	-1.277471664	0.158905548	-0.103594161	-0.574914695

表17续：SVM向量

coefs	LONRF2_2	ADAMTS2_2	ADAMTS2_1	ADAMTS2_3	ALK
							LONRF2'387	ADAMTS2'254	ADAMTS2'284	ADAMTS2'328	ALK'434
1	0.816278101	-1.226540092	0.479237716	0.308464228	1.224961864
						1	0.707526931	0.608032885	0.377972809	0.108720604	-0.67135809
0.160992568	-1.17952336	-1.226540092	-1.402761026	-3.569757964	-0.67135809
						1	0.644016248	0.715511247	0.413319994	0.342021157	-0.67135809
1	1.028560383	0.889956898	0.805960341	0.757487893	-0.67135809
						1	0.704916903	0.774210969	0.512674242	0.359598595	-0.67135809
0.539110203	-1.17952336	0.74444773	0.34931293	-0.159734825	-0.67135809
						1	-1.17952336	-1.226540092	-1.344485938	-0.001537876	1.290071562
0.228841426	-1.17952336	0.651850986	0.265243951	0.155061125	-0.67135809
						1	0.849338456	0.647717203	0.611073161	0.319649871	1.311232214
1	0.788437801	0.675826929	0.455354484	0.27330935	-0.67135809
						0.086502196	0.548315219	-1.226540092	0.357910894	0.155061125	1.30146576
1	0.564845397	0.690708548	-1.172526662	0.340423208	1.271352524
						0.022981588	-1.17952336	-1.226540092	-1.818329276	-0.437777949	-0.67135809
0.199753156	0.650976323	0.717164761	0.579547294	0.310062177	-0.67135809
						0.640672506	-1.17952336	0.763463132	0.44580119	0.290886789	-0.67135809
0.488436741	-1.17952336	0.617127208	0.287216525	-0.153343029	-0.67135809
						0.290813367	0.570935463	0.735353407	0.491656997	0.316453973	-0.67135809
0.93438076	-1.17952336	0.666732606	0.444845861	0.169442666	-0.67135809
						1	-0.840219712	0.793226371	0.47350574	0.389959626	-0.67135809
0.177133374	-1.17952336	-1.226540092	0.355044906	0.129493941	-0.67135809
						0.363673626	0.538745116	-1.226540092	0.304412453	-0.142157387	-0.67135809
0.372869951	-1.17952336	-1.226540092	0.354089577	0.111916502	-0.67135809
						0.180416799	0.499594695	-1.226540092	-1.818329276	-3.569757964	-0.67135809
1	0.880658793	1.437269791	1.395398525	1.705071643	1.21519541
						0.236974727	-1.17952336	-1.226540092	-1.818329276	-3.569757964	-0.67135809
0.433173404	-1.17952336	-1.226540092	0.347402271	0.057586237	-0.67135809
						0.037394649	-1.17952336	-1.226540092	-1.818329276	-3.569757964	-0.67135809
1	-1.17952336	0.671693146	0.532736158	-0.081435325	-0.67135809
						0.263636311	-1.17952336	-1.226540092	-1.818329276	-3.569757964	-0.67135809
1	0.846728428	0.660118553	0.491656997	0.417124759	1.282746721
						1	0.650106314	-1.226540092	0.401856042	-0.322725622	-0.67135809
1	0.640536211	-1.226540092	0.567128013	0.254133962	-0.67135809
						0.26169536	0.519604911	-1.226540092	0.536557475	0.284494993	-0.67135809

表17续：SVM向量

coefs	LONRF2_2	ADAMTS2_2	ADAMTS2_1	ADAMTS2_3	ALK
							LONRF2'387	ADAMTS2'254	ADAMTS2'284	ADAMTS2'328	ALK'434
0.1799778	0.525694976	0.613820181	0.533691487	0.266917554	-0.67135809
						0.898868481	-1.17952336	0.719645031	0.407588018	-0.172518417	1.353553518
0.042908076	0.605735837	0.541065597	0.508852925	0.28928884	-0.67135809
						0.140898434	-1.17952336	-1.226540092	-1.818329276	-3.569757964	-0.67135809
0.140415448	-1.17952336	-1.226540092	-1.818329276	-0.332313316	-0.67135809
						1	0.771037614	-1.226540092	0.249958682	-0.099012764	-0.67135809
0.108835219	0.456094228	0.611339911	-1.818329276	-0.242828173	-0.67135809
						1	0.865868634	-1.226540092	0.373196163	0.410732963	-0.67135809
-1	-1.17952336	0.717991517	0.575725977	0.27330935	1.293327047
						-1	-0.466985698	0.596458292	0.295814489	0.17903036	-0.67135809
-1	0.741457296	0.675000172	0.399945384	0.287690891	-0.67135809
						-1	0.838898344	0.763463132	0.587189928	0.35160885	-0.67135809
-1	0.764077539	0.795706641	0.609162503	0.4315063	-0.67135809
						-1	0.920679223	-1.226540092	0.530825499	0.139081635	1.257516713
-1	-1.17952336	0.608859641	0.236584071	0.044802645	-0.67135809
						-1	0.706656922	0.8155488	0.656928968	0.760683791	1.349484162
-0.27309104	1.371344069	1.329791428	1.262607751	1.433420315	1.942796285
						-1	1.875079486	1.591046526	1.560670496	2.013475797	2.200793463
-1	0.539615126	0.697322601	0.524138194	0.247742166	-0.67135809
						-0.675668601	0.845858419	0.760982862	0.572859989	0.501816055	1.410524504
-1	-1.17952336	0.765943402	0.286261196	-0.031898906	1.241239289
						-0.228886868	1.433114734	1.358727911	1.26451841	1.481358784	1.862223034
-1	0.513514845	0.884996358	0.706606092	0.567331964	1.322626411
						-0.253709663	1.074670879	0.993301477	0.790675072	0.69996173	1.619689409
-1	-1.17952336	0.583230186	0.338804308	0.166246768	-0.67135809
						-1	0.977229831	0.713030978	0.603430527	0.370784238	-0.67135809
-1	0.684036679	0.742794216	0.471595082	0.263721656	-0.67135809
						-1	0.950259541	0.777517995	0.650241663	0.568929913	1.333206737
-1	0.843248391	0.738660433	0.582413282	0.319649871	-0.67135809
						-1	-1.17952336	-1.226540092	0.244226706	-0.234838428	-0.67135809
-1	0.717097034	-1.226540092	0.458220472	0.107122655	-0.67135809
						-1	0.689256735	-1.226540092	0.342625625	0.242948319	-0.67135809
-1	0.864128615	0.785785562	0.597698551	0.452279637	-0.67135809
						-1	1.023340327	-1.226540092	0.275752573	0.006451869	1.64085006
-1	-1.17952336	0.702283141	0.516495559	0.334031412	-0.67135809

表17续：SVM向量

coefs	FGF14	DMRT1	CNRIP1_2
					FGF14'577	DMRT1'934	CNRIP1'232
1	0.955300844	1.131612847	0.296394201
				1	-0.93950462	-0.701307401	0.101966839
0.160992568	0.846924723	-0.701307401	-2.336804129
				1	-0.93950462	-0.701307401	0.230086604
1	1.296419127	1.516680127	0.443619546
				1	0.974844079	-0.701307401	0.407656103
0.539110203	-0.93950462	1.17300758	0.203114022
				1	-0.93950462	-0.701307401	0.261554616
0.228841426	-0.93950462	1.199962289	0.268297762
				1	-0.93950462	-0.701307401	0.368321087
1	0.734106957	-0.701307401	0.228962746
				0.086502196	0.761645152	-0.701307401	0.236829749
1	-0.93950462	-0.701307401	0.536899725
				0.022981588	-0.93950462	-0.701307401	-2.336804129
0.199753156	0.771416769	-0.701307401	0.216600313
				0.640672506	0.814944884	-0.701307401	0.384055093
0.488436741	-0.93950462	-0.701307401	0.073870399
				0.290813367	-0.93950462	-0.701307401	0.268297762
0.93438076	-0.93950462	-0.701307401	0.027792238
				1	0.960630817	-0.701307401	0.3997891
0.177133374	-0.93950462	-0.701307401	0.092975978
				0.363673626	0.769640112	-0.701307401	0.317747496
0.372869951	-0.93950462	-0.701307401	0.225591173
				0.180416799	-0.93950462	1.108508811	-2.336804129
1	1.728146955	1.533045486	1.467453809
				0.236974727	-0.93950462	-0.701307401	-2.336804129
0.433173404	-0.93950462	-0.701307401	0.284031768
				0.037394649	-0.93950462	-0.701307401	-2.336804129
1	0.834488119	-0.701307401	0.25031604
				0.263636311	-0.93950462	-0.701307401	-2.336804129
1	0.798066635	-0.701307401	0.540271298
				1	-0.93950462	-0.701307401	-0.045258506
1	0.853143025	1.17300758	-2.336804129
				0.26169536	-0.93950462	-0.701307401	0.450362691

表17续：SVM向量

coefs	FGF14	DMRT1	CNRIP1_2
					FGF14'577	DMRT1'934	CNRIP1'232
0.1799778	-0.93950462	1.108508811	0.412151533
				0.898868481	-0.93950462	-0.701307401	0.412151533
0.042908076	-0.93950462	-0.701307401	0.205361737
				0.140898434	-0.93950462	-0.701307401	-2.336804129
0.140415448	0.748320219	-0.701307401	-2.336804129
				1	0.726111997	-0.701307401	0.384055093
0.108835219	-0.93950462	-0.701307401	-2.336804129
				1	-0.93950462	1.12487417	0.598711893
-1	0.830046474	-0.701307401	0.314375923
				-1	-0.93950462	-0.701307401	0.078365829
-1	-0.93950462	-0.701307401	0.552633732
				-1	0.867356287	1.072890087	0.532404295
-1	1.115200039	-0.701307401	0.452610406
				-1	0.632837467	1.202850294	0.307632777
-1	0.974844079	-0.701307401	0.05476482
				-1	0.946417555	-0.701307401	0.585225602
-0.27309104	1.777893371	2.092355709	1.213461994
				-1	1.891599465	2.29451603	1.66750046
-1	0.822939843	-0.701307401	-2.336804129
				-0.675668601	0.790071676	-0.701307401	0.593092605
-1	-0.93950462	-0.701307401	0.252563755
				-0.228886868	1.602004256	1.983574202	1.266283301
-1	1.124971657	1.209588971	0.542519013
				-0.253709663	1.057458663	-0.701307401	0.829102699
-1	1.010377234	-0.701307401	0.017677519
				-1	0.846924723	1.254834377	0.354834796
-1	1.049463703	1.121023497	0.557129162
				-1	-0.93950462	-0.701307401	0.488573849
-1	0.948194213	0.985287281	0.479582988
				-1	-0.93950462	-0.701307401	-2.336804129
-1	-0.93950462	-0.701307401	0.325614499
				-1	0.225094519	-0.701307401	0.389674381
-1	0.870909602	1.213439644	0.285155626
				-1	-0.93950462	1.568664209	0.829102699
-1	-0.93950462	-0.701307401	0.224467316

实施例5.各种个体甲基化生物标志物各自是高度信息性的

对来自28个结肠直肠癌DMR组的个体结肠直肠癌DMR性能的评估揭示，各种个体结肠直肠癌DMR足以筛查结肠直肠癌(参见图12-19)。对于选定的结肠直肠癌DMR，图12-19显示了结肠直肠癌样品和对照样品中指定DMR的甲基化状态。结果显示为从45中减去MSRE-qPCR Ct值(即45-Ct值)，以用于显示目的。本实施例中提供的数据以及本实施例提供的累积数据(包括，例如，图5-9)证明，对于每个个体结肠直肠癌DMR，甲基化状态信号在受试者组之间足够稳定以允许进行临床筛查。因此，图12-19中呈现的结果证实本文提供的结肠直肠癌的甲基化标志物可以为结肠直肠癌的筛查提供可靠的信号。此外，本领域技术人员将理解，本公开提供了可单独独立地用于筛查结肠直肠癌的甲基化生物标志物，具体而言，本文提供的甲基化生物标志物可单独或组合使用。

实施例6标志物的验证

使用血浆样品确定用于检测结肠直肠癌的最小存活DMR组。发现DMR的甲基化状态不仅可用于区分结肠直肠癌与健康受试者，而且可用于区分患有其它类型癌症(例如乳腺癌，肺癌)的受试者。

使用MSRE-qPCR分析来自215个受试者的血浆样品，并用作训练集以确定用于结肠直肠癌检测的最小存活DMR组。图21给出了用于训练算法以检测结肠直肠癌的一组受试者的详细视图。训练集包括93名被诊断患有结肠直肠癌(CRC)的人受试者，91名被诊断为健康的受试者和31名被诊断患有非晚期腺瘤(NAA)的受试者。NAA+健康列是健康和NAA列的总和。为了计算特异性，没有结肠直肠癌诊断的所有患者被认为是对照。图21还表示结肠直肠癌分布。结肠直肠癌被分类为局部的或晚期的，如通过组织学确定的。通过结肠镜检查确定的结肠直肠癌的位置被发现在近端或远端结肠中。

使用独立验证受试者组进一步验证了在结直肠癌检测中显示出潜力的选定DMR(参见图22)。在西班牙、乌克兰、英国和美国收集774个人类受试者的血浆样品。在这些774个受试者中，152个受试者被诊断为患有结肠直肠癌(CRC)。对照组包括622个受试者。对照组的148个受试者患有非晚期腺瘤，对照组的52个受试者患有非CRC癌症(即乳腺癌或肺癌)。图22列出了每组中男性和女性的数量、受试者的年龄范围和总数。对于患有癌症(即结肠直肠癌、乳腺癌或肺癌)的患者，癌症被分类为局部的或晚期的。

采用随机森林特征选择算法进行特征排序。该算法利用在图21的训练集上的50次子设置迭代上的Monte-Carlo交叉验证，以根据在50次迭代中出现的预选标志物的重要性变化(VIP)来排列预选标志物。VIP>2的标志物进一步用于在训练集上构建支持向量机算法。

发现3-DMR(图23)、5-DMR(图24)和6-DMR(图25)组在评价验证组(图22)的受试者的结肠直肠癌状态中都表现良好。表18、19和20(如下所示)分别标识了包括在3、5和6个标志物组的每一个中的标志物。

表18. 3DMR组

DMR	SEQ ID NO
		ZNF132'415	SEQ ID NO:40
ADAMTS2'254	SEQ ID NO:21
		ADAMTS2'284	SEQ ID NO:22

表19. 5DMR组

DMR	SEQ ID
		ZNF132'415	SEQ ID NO:40
ADAMTS2'254	SEQ ID NO:21
		ADAMTS2'284	SEQ ID NO:22
ZNF542'502	SEQ ID NO:35
		LONRF2'281	SEQ ID NO:19

表20. 6DMR组

DMR	SEQ ID
		ZNF132'415	SEQ ID NO:40
ADAMTS2'254	SEQ ID NO:21
		ADAMTS2'284	SEQ ID NO:22
ZNF542'502	SEQ ID NO:35
		LONRF2'281	SEQ ID NO:19
ZNF492'069	SEQ ID NO:42

此外，表21(下文)显示了如前所述的3-DMR(表18)、5-DMR(表19)和6-DMR(表20)组中每一组的准确度、灵敏度、特异性和AUC。

表21.每个模型的ROC曲线分析

	3DMR(2基因)	5DMR(4基因)	6DMR(5基因)
				AUC	0.85	0.87	0.86
灵敏度	0.58	0.60	0.69
				特异性	0.89	0.90	0.87
准确度	0.83	0.84	0.83

性能最好的算法使用表20的6个标志物，使得检测出69％的结肠直肠癌病例，特异性为87％，总AUC为86％。此外，3标志物和5标志物组对结肠直肠癌的分类表现良好。在3标志物组中，检测出58％的结肠直肠癌病例，特异性为89％，AUC为84.5％。

这些发现是特别显著的，因为即使具有结肠直肠癌以外的癌症诊断的受试者被包括在对照组中，也保持了高特异性。该发现表明，所讨论的标志物并非广泛地指示癌症，而是对于检测结肠直肠癌特别且令人惊讶地重要。

在一些实施方式中，本公开包括DMR的组合，其中各DMR是表22中鉴定的基因，包括表22中鉴定的基因的全部，包括表22中鉴定的基因的一部分或存在于表22中鉴定的基因中。在一些实施方式中，本公开包括DMR的组合，其中各DMR是表23中鉴定的基因，包括表23中鉴定的基因的全部，包括表23中鉴定的基因的一部分或存在于表23中鉴定的基因中。在一些实施方式中，本公开包括DMR的组合，其中各DMR是表24中鉴定的基因，包括表24中鉴定的基因的全部，包括表24中鉴定的基因的一部分或存在于表24中鉴定的基因中。

在一些特定的实施方式中，结肠直肠癌甲基化生物标志物包括两个DMR，其每一个是表22中鉴定的不同基因，包括表22中鉴定的不同基因的全部，包括表22中鉴定的不同基因的一部分或存在于表22中鉴定的不同基因中。在一些特定的实施方式中，结肠直肠癌甲基化生物标志物包括4个DMR，其每一个是表23中鉴定的不同基因，包括表23中鉴定的不同基因的全部，包括表23中鉴定的不同基因的一部分或存在于表23中鉴定的不同基因中。在一些特定的实施方式中，结肠直肠癌甲基化生物标志物包括5个DMR，其每一个是表24中鉴定的不同基因，包括表24中鉴定的不同基因的全部，包括表24中鉴定的不同基因的一部分或存在于表24中鉴定的不同基因中。

在各种实施方式中，结肠直肠癌甲基化生物标志物包括两个以上DMR，所述两个以上DMR包括表22的同一基因的全部，包括表22的同一基因的一部分，或存在于表22的同一基因中。在各种实施方式中，结肠直肠癌甲基化生物标志物包括两个以上DMR，所述两个以上DMR包括表23的同一基因的全部，包括表23的同一基因的一部分，或存在于表23的同一基因中。在各种实施方式中，结肠直肠癌甲基化生物标志物包括两个以上DMR，所述DMR包括表24的同一基因的全部，包括表24的同一基因的一部分，或存在于表24两个以上的同一基因中。

表22.表18的DMR组的基因

ZNF132
	ADAMTS2

表23.表19的DMR组的基因

ZNF132
	ADAMTS2
ZNF542
	LONRF2

表24.表20的DMR组的基因

ZNF132
	ADAMTS2
ZNF542
	LONRF2
ZNF492

实施例7.各种个体甲基化生物标志物各自是高度信息性的。

来自结肠直肠癌DMR组的个体结肠直肠癌DMR的性能的评价(例如，如实施例6中所述)揭示，各种个体结肠直肠癌DMR不仅足以从健康个体而且足以从患有其它癌症的个体筛选结肠直肠癌。如下表25中所示的每个甲基化标志物的甲基化状态的单变量分析显示具有高个体准确度的标志物的数量，如小于0.001的p值所指示的。

表25.验证组中CRC和对照组之间的T检验P值

基因参考名称	学生t检验的P值
		ZNF132'415	4.52E-25
ADAMTS2'254	8.00E-29
		ADAMTS2'284	1.62E-21
ZNF542'502	1.76E-37
		LONRF2'281	9.26E-38
ZNF492'069	1.18E-25

对于表25的所选结肠直肠癌DMR，图26-31进一步显示结肠直肠癌样品和对照样品(即图22的验证组)中所示DMR的甲基化状态。在这种情况下，对照样品包括健康受试者，具有非晚期腺瘤的受试者，具有乳腺癌的受试者和具有肺癌的受试者(参见图22)。结果显示为从45减去MSRE-qPCR Ct值(即，45-Ct值)，以用于显示目的。本实施例中提供的数据以及本实施例累积提供的数据(包括，例如，图23-25)证明，对于每个个体结肠直肠癌DMR，甲基化状态信号在受试者组之间足够且令人惊奇地稳定以允许进行临床筛查，特别是区分结肠直肠癌和其他形式的癌症。因此，图23-25中呈现的结果证实本文提供的结肠直肠癌的甲基化标志物可以为结肠直肠癌的筛查提供可靠的信号。此外，本领域技术人员将理解，本公开提供了可单独独立地用于筛查结肠直肠癌的甲基化生物标志物，具体而言，本文提供的甲基化生物标志物可单独或组合使用。

其他实施方式

虽然我们已经描述了许多实施方式，但显而易见的是，我们的基本公开内容和实施例可提供利用本文所述的组合物和方法或由本文所述的组合物和方法涵盖的其它实施方式。因此，应当理解的是，本发明的范围由可以从公开内容和所附权利要求中理解的内容来限定，而不是由已经通过示例表示的具体实施方式来限定。

本文引用的所有参考文献通过引用并入本文。

序列

SEQ ID NO:1(ZNF132)(参见表1)

ZNF132 chr19,bp 58439728至58440994，来自hg38

SEQ ID NO:2(DMRT1)(参见表1)

DMRT1 chr9,bp 841340至968090，来自hg38

SEQ ID NO:3(ALK)(参见表1)

ALK chr2,bp 29193215至29922286，来自hg38

SEQ ID NO:4(JAM2)(参见表1)

JAM2 chr21,bp 25637848至25714704，来自hg38

SEQ ID NO:5(FGF14)(参见表1)

FGF14 chr13,bp 101919879至102403137，来自hg38

SEQ ID NO:6(MCIDAS)(参见表1)

MCIDAS chr5,bp 55220951至55221051，来自hg38

SEQ ID NO:7(ST6GALNAC5)(参见表1)

ST6GALNAC5 chr1,bp 76866255至77063388，来自hg38

SEQ ID NO:8(LONRF2)(参见表1)

LONRF2 chr2,bp 100285667至100323015，来自hg38

SEQ ID NO:9(PDGFD)(参见表1)

PDGFD chr11,bp 104163499至104164026，来自hg38

SEQ ID NO:10(GSG1L)(参见表1)

GSG1L chr16,bp 27920615至28064275，来自hg38

SEQ ID NO:11(ZNF492)(参见表1)

ZNF492 chr19,bp 22633051至22666433，来自hg38

SEQ ID NO:12(ZNF568)(参见表1)

ZNF568 chr19,bp 36916312至36943940，来自hg38

SEQ ID NO:13(ADAMTS2)(参见表1)

ADAMTS2 chr5,bp 179118114至179344392，来自hg38

SEQ ID NO:14(ZNF542)(参见表1)

ZNF542 chr19,bp 56367838至56370986，来自hg38

SEQ ID NO:15(ZNF471)(参见表1)

ZNF471 chr19,bp 56507245至56508589，来自hg38

SEQ ID NO:16(CNRIP1)(参见表1)

CNRIP1 chr2,bp 68293114至68320928，来自hg38

SEQ ID NO:17(参见表7)

CCTCCTCACCCATCATCAGCGCCCGCGGCTTTGGGTGGCCGACCAGAGGGCGGCCGGAAAGCACCTCGGTGCCCCGCGACCCTCCGAACAGAGGCGGCGGGAGGTACC

SEQ ID NO:18(参见表7)

GCGTGCTGGGTTTAATCTTCACCTCAACCTTGTAGGAGGAGCCGGTGAGCAGCTTGATGGTGCGGTTCTGGCCGAAGCGCTGCCCGTCCACCTTGTAAAAGACCGGGCCGT

SEQ ID NO:19(参见表7)

AGGAAGCAAAGTGACCCCTAAGCCTAGACAAAGCTCTCGAAAGCCCAAAGCCTCGGGCCCACCGGCCAGCTCCCCACCCCGCTGCTGGGCCGGACAGGTGTAGGGGAGGCGGACC

SEQ ID NO:20(参见表7)

CTCTCAGTCCCGCCGGCTTAGGTAACCCAGGTCGCTGCGGTAACGCAGTGACCGCGCTCCAGGTCCGCGTCTCTTGC

SEQ ID NO:21(参见表7)

CCACTGCGAAGGGAAGGGGCATTCCGCCAGGCGACCCCAGAAGCCAGCCTGCACCTCCCCGGCTTTCCTGCAACCGGGAAGGGGCGTTAACAGGG

SEQ ID NO:22(参见表7)

GCGACCCCAGAAGCCAGCCTGCACCTCCCCGGCTTTCCTGCAACCGGGAAGGGGCGTTAACAGGGCCACCACTCCGGGGCTCCGCCACTCCCCAGCCGTT

SEQ ID NO:23(参见表7)

CAACGGAAACTTCCCGCGCTACGGCGGCTCCAACGGGCCGCTTCCGCCGCATTGCGTAGCGAAGCCCCCGGCGAG

SEQ ID NO:24(参见表7)

CAAAGCGTCTGGGGCGCTAGTGGGGGCGGCCAGCGGCTCGAGCGCCGGGGGCAGCAGCAGAGGAGGCGGCTCCGGCTCCGGGGCGTCGGACCTGGGTGCCGGGAGCAAGAAGT

SEQ ID NO:25(参见表7)

CGCTCAGCCGCTCTCCTCTTCTCTCTCCCGCCCGCCCGCAGCGCCATGGTCTGGCAGTGTGTTTAGCGCT

SEQ ID NO:26(参见表7)

GGGTTCGGAGCGTGCAAAAGGTGACCTAGGCGCGCTACGCACCACGCACTCAGCGGTACTCTCCTCTCCCGGGCCCCCACGGGTCCCGATGCTGGGCGGGGATGCACTGAACTGTTC

SEQ ID NO:27(参见表7)

GCGCCCCACTTACATCCAGCACCGAGGCCAGGTGCCGGGTTCGGCTGGCGAGTTCCTTCAGCTGCACGTTCCGCTCCTTGAGCGAGGCGATCTCCTCCTGTTTCTGGGTCAATGTCACGT

SEQ ID NO:28(参见表7)

AACGTCTATCACCCAGGGAAAGCTACTCTTGACTCCTTCCACCTATCAAAATTGCCTAAGAAAGGTTGAGTCTGACCAAGGGGCGGCGCAGCTTGCAACTTTCGCCAACTCCGGGA

SEQ ID NO:29(参见表7)

GGTGCATTTGGGATCAGCGACTAGAGACAGCGTCGCTCCAAGAAAAAGCCGGGTTCTGCTCCCGGGACCGACGCCGCGCCGCCCTGCGCTCTCGCCGCCTGCGCTCGCCCTGCGCTGGCCCGGGTCGCTGTGCTAATC

SEQ ID NO:30(参见表7)

CCGAAAGAAATCCGAGCCAGGGTGAGGGTCTGAGACGCAAGGAGAATCCCAGGCAAGGCGCTCCTGAGAAAAGATCCCCACGGCGGACGTGGGGCAACAAAACC

SEQ ID NO:31(参见表7)

CGAGAGAGGGGAAGGGGCTGGTTGGAACCGGTGGCAAGAGGCTGTGGCGGGACTCAGGCCTCCCCGCAGTCGGCTCCACAATCTGCGCCCCAAGTTCG

SEQ ID NO:32(参见表7)

GCCCAAGCCTCACCCTCACACAGGAAAGCAGATGTGTTCTGGCCGGAAGTTGAGTGGGGCCGCGGGGCCTGCTGGGAGGTGTTGTCCTCGGAAACGTCGCTGGCGCGGAGGGATGGTTCG

SEQ ID NO:33(参见表7)

GGTCGCCTTCACCCAGCATCTCAGAAACTGCGCGCGGGATGAACATTCGGGTGTTTCCGGCAGGTGACGCTG

SEQ ID NO:34(参见表7)

CCAGAGGCCCAGGGATCCGTTCAGGTCAGCGCTGGCGTCCGGGCCTGAGTTTGGAGGTGGCGGGTGCCTTACAAGAATGCTCGCGT

SEQ ID NO:35(参见表7)

GGGAGGAGTGGGCGGCTGAATGGCCAGAGGCCCAGGGATCCGTTCAGGTCAGCGCTGGCGTCCGGGCCTGAGTTTGGAGGTGGCGGGTGC

SEQ ID NO:36(参见表7)

CCCCACGCGTACTCACACCGAAGGCTCAGCCGTCGCGCGTTTCCCTCCCAGGCCCCAGGAACTAGTAACTAGGGACGCTTCTGGTCTCTAGGCGAGGAGAGGGGGAGAGCGCAATCTTTGCGCCTGCGCACACTCCTGCTCTTACCCGC

SEQ ID NO:37(参见表7)

GTCGCGCGTTTCCCTCCCAGGCCCCAGGAACTAGTAACTAGGGACGCTTCTGGTCTCTAGGCGAGGAGAGGGGGAGAGCGCAATCTTTGCGCCTGCGCACACTCCTGCTCTTACCCGC

SEQ ID NO:38(参见表7)

CTGCTCTTACCCGCCGGAACCCTGGGCCACGCCCGGCTCGCGTAATCACGCACTGCGCAGGCACCGCCCGCTCTGCTCTAAGGTCCCTC

SEQ ID NO:39(参见表7)

CTACTGCTAGGTCGTTGCCAAGGTGATTGAGGAATGGCGTTTATTGCGTCGCTGCTCAGGCAACGCAAACTACATTATCCAGAAGGACCCTCGCGGTGCCTCAGGGCTGGCCATTGGCAGCCGAGGAGACAGGCACTTCCGGGCGGAGTGTAAGACGCTGGCCAATCA

SEQ ID NO:40(参见表7)

GTGTAAGACGCTGGCCAATCACAGCCTGGCAGCGGGACTTCCGTCGTCGTCCTCGGACCATCACTTTGGCATTTCTCGATTTTGTCTGCTTCTGAAGGGACCGCGTTGT

SEQ ID NO:41(参见表7)

CCGCGTGGTCTGGGCTCTGTAGCGTCCCAGCTGAGCCGGCGATATGCAGCGCACTTGTGGGGCGGAGGTGGAGGGAATTC

SEQ ID NO:42(参见表7)

CAACGTTAAAGGCAAACACCTTCTGCGGTGTGCTTGGCTCAGCTCAGGCAGGAAGCCCTGCCTGAAAAGGCTGCACCTTCGGCTGTCACTCTGTCCTCATTCGGCC

SEQ ID NO:43(参见表7)

GCCGGTGAGCAGCTTGATGGTGCGGTTCTGGCCGAAGCGCTGCCCGTCCACCTTGTAAAAGACCGGGCCGT

SEQ ID NO:44(参见表7)

CGGGAAGGGGCGTTAACAGGGCCACCACTCCGGGGCTCCGCCACTCCCCAGCCGTTCCCTCCTCCGGAGACCTTGCCTGCCAAGA

SEQ ID NO:45(参见表13)

CCTCCTCACCCATCATCAGCGCCC

SEQ ID NO:46(参见表13)

GGTACCTCCCGCCGCCTCTGTTC

SEQ ID NO:47(参见表13)

GCGTGCTGGGTTTAATCTTCACCTCAA

SEQ ID NO:48(参见表13)

ACGGCCCGGTCTTTTACAAGGTGG

SEQ ID NO:49(参见表13)

AGGAAGCAAAGTGACCCCTAAGCCT

SEQ ID NO:50(参见表13)

GGTCCGCCTCCCCTACACCT

SEQ ID NO:51(参见表13)

CTCTCAGTCCCGCCGGCTTAGGTA

SEQ ID NO:52(参见表13)

GCAAGAGACGCGGACCTGGAGC

SEQ ID NO:53(参见表13)

CCACTGCGAAGGGAAGGGGCA

SEQ ID NO:54(参见表13)

CCCTGTTAACGCCCCTTCCCGGTT

SEQ ID NO:55(参见表13)

GCGACCCCAGAAGCCAGCCT

SEQ ID NO:56(参见表13)

AACGGCTGGGGAGTGGCGGA

SEQ ID NO:57(参见表13)

CAACGGAAACTTCCCGCGCTAC

SEQ ID NO:58(参见表13)

CTCGCCGGGGGCTTCGCTAC

SEQ ID NO:59(参见表13)

CAAAGCGTCTGGGGCGCTAGT

SEQ ID NO:60(参见表13)

ACTTCTTGCTCCCGGCACCCAGGTC

SEQ ID NO:61(参见表13)

CGCTCAGCCGCTCTCCTCTTCTCT

SEQ ID NO:62(参见表13)

AGCGCTAAACACACTGCCAGACCA

SEQ ID NO:63(参见表13)

GGGTTCGGAGCGTGCAAAAGGTGA

SEQ ID NO:64(参见表13)

GAACAGTTCAGTGCATCCCCGCCC

SEQ ID NO:65(参见表13)

GCGCCCCACTTACATCCAGCACC

SEQ ID NO:66(参见表13)

ACGTGACATTGACCCAGAAACAGGAGGA

SEQ ID NO:67(参见表13)

AACGTCTATCACCCAGGGAAAGCT

SEQ ID NO:68(参见表13)

TCCCGGAGTTGGCGAAAGTTGCAA

SEQ ID NO:69(参见表13)

GGTGCATTTGGGATCAGCGACTAGAGAC

SEQ ID NO:70(参见表13)

GATTAGCACAGCGACCCGGGCCAG

SEQ ID NO:71(参见表13)

CCGAAAGAAATCCGAGCCAGGGTGA

SEQ ID NO:72(参见表13)

GGTTTTGTTGCCCCACGTCC

SEQ ID NO:73(参见表13)

CGAGAGAGGGGAAGGGGCTGGTTG

SEQ ID NO:74(参见表13)

CGAACTTGGGGCGCAGATTGTGG

SEQ ID NO:75(参见表13)

GCCCAAGCCTCACCCTCACACAG

SEQ ID NO:76(参见表13)

CGAACCATCCCTCCGCGCCA

SEQ ID NO:77(参见表13)

GGTCGCCTTCACCCAGCATCTCAG

SEQ ID NO:78(参见表13)

CAGCGTCACCTGCCGGAAACACC

SEQ ID NO:79(参见表13)

CCAGAGGCCCAGGGATCCGTTCAG

SEQ ID NO:80(参见表13)

ACGCGAGCATTCTTGTAAGGCACCC

SEQ ID NO:81(参见表13)

GGGAGGAGTGGGCGGCTGAATGG

SEQ ID NO:82(参见表13)

GCACCCGCCACCTCCAAACTCAG

SEQ ID NO:83(参见表13)

CCCCACGCGTACTCACACCGAAG

SEQ ID NO:84(参见表13)

GCGGGTAAGAGCAGGAGTGTG

SEQ ID NO:85(参见表13)

GTCGCGCGTTTCCCTCCCAG

SEQ ID NO:86(参见表13)

GCGGGTAAGAGCAGGAGTGTG

SEQ ID NO:87(参见表13)

CTGCTCTTACCCGCCGGAACCCTG

SEQ ID NO:88(参见表13)

GAGGGACCTTAGAGCAGAGCGGGC

SEQ ID NO:89(参见表13)

CTACTGCTAGGTCGTTGCCAAGG

SEQ ID NO:90(参见表13)

TGATTGGCCAGCGTCTTACACTCCG

SEQ ID NO:91(参见表13)

GTGTAAGACGCTGGCCAATCACA

SEQ ID NO:92(参见表13)

ACAACGCGGTCCCTTCAGAAGCAG

SEQ ID NO:93(参见表13)

CCGCGTGGTCTGGGCTCTGTAG

SEQ ID NO:94(参见表13)

GAATTCCCTCCACCTCCGCCCCAC

SEQ ID NO:95(参见表13)

CAACGTTAAAGGCAAACACCTTCTGC

SEQ ID NO:96(参见表13)

GGCCGAATGAGGACAGAGTGACAG

SEQ ID NO:97(参见表13)

GCCGGTGAGCAGCTTGATGGT

SEQ ID NO:98(参见表13)

ACGGCCCGGTCTTTTACAAGG

SEQ ID NO:99(参见表13)

CGGGAAGGGGCGTTAACAGGGC

SEQ ID NO:100(参见表13)

TCTTGGCAGGCAAGGTCTCCGGAG

Claims

1.一种在受试者中筛查结肠直肠癌的体外方法，所述方法包括：

-确定受试者DNA样品中以下中的每一个的甲基化状态：

(a)ZNF132基因内的甲基化基因座；

(b)ADAMTS2基因内的第一甲基化基因座；和

(c)ADAMTS2基因内的第二甲基化基因座；和

-将所获得的数据与从健康个体获得的参考值进行比较，

-如果与参考样品相比在所述基因座中检测到高甲基化，则诊断所述受试者的结肠直肠癌。

2.如权利要求1所述的方法，所述方法还包括确定受试者DNA样品中以下中的每一个的甲基化状态：

(d)ZNF542基因内的甲基化基因座；和

(e)LONRF2基因内的甲基化基因座。

3.如权利要求1至2所述的方法，所述方法还包括确定受试者DNA样品中ZNF492基因内的甲基化基因座的甲基化状态。

4.如权利要求1至3所述的方法，其中，所述ZNF132基因内的甲基化基因座包含ZNF132‘415(SEQ ID NO:40)。

5.如权利要求1至4所述的方法，其中，所述ADAMTS2基因内的第一甲基化基因座包含ADAMTS2‘254(SEQ ID NO:21)。

6.如权利要求1至5所述的方法，其中，所述ADAMTS2基因内的第二甲基化基因座包含ADAMTS2‘284(SEQ ID NO:22)。

7.如权利要求2至6所述的方法，其中，所述ZNF542基因内的甲基化基因座包含ZNF542‘502(SEQ ID NO:35)。

8.如权利要求2至7所述的方法，其中，所述LONRF2基因内的甲基化基因座包含LONRF2‘281(SEQ ID NO:19)。

9.如权利要求3至8所述的方法，其中，所述ZNF492基因内的甲基化基因座包含ZNF492‘069(SEQ ID NO:42)。

10.如权利要求1至9中任一项所述的方法，其中，所述DNA分离自人类受试者的血液或血浆中。

11.如权利要求1至10所述的方法，其中，所述DNA是所述人类受试者的无细胞DNA。

12.如权利要求1至11所述的方法，其中，使用定量聚合酶链式反应(qPCR)确定甲基化状态。

13.一种试剂盒，所述试剂盒包括：

(a)用于扩增ZNF132基因内的甲基化基因座的寡核苷酸引物对；

(b)用于扩增ADAMTS2基因内的第一甲基化基因座的寡核苷酸引物对；和

(c)用于扩增ADAMTS2基因内的第二甲基化基因座的寡核苷酸引物对，

所述试剂盒任选地还包括：

(d)至少一种甲基化特异性限制酶和/或亚硫酸氢盐试剂，

(e)聚合酶。

14.如权利要求13所述的试剂盒，所述试剂盒还包括：

(f)用于扩增ZNF542基因内的甲基化基因座的寡核苷酸引物对；和

(g)用于扩增LONRF2基因内的甲基化基因座的寡核苷酸引物对。

15.如权利要求13或14所述的试剂盒，所述试剂盒还包括：

(h)用于扩增ZNF492基因内的甲基化基因座的寡核苷酸引物对。

16.如权利要求13至15所述的试剂盒，其中，(a)是用于扩增ZNF132‘415的寡核苷酸引物对(引物对SEQ ID NO:91和SEQ ID NO:92)。

17.如权利要求13至16所述的试剂盒，其中，(b)是用于扩增ADAMTS2‘254的寡核苷酸引物对(引物对SEQ ID NO:53和SEQ ID NO:54)。

18.如权利要求13至17所述的试剂盒，其中，(c)是用于扩增ADAMTS2‘284的寡核苷酸引物对(引物对SEQ ID NO:55和SEQ ID NO:56)。

19.如权利要求14至18所述的试剂盒，其中，(f)是用于扩增ZNF542‘502的寡核苷酸引物对(引物对SEQ ID NO:81和SEQ ID NO:82)。

20.如权利要求14至19所述的试剂盒，其中，(g)是用于扩增LONRF2‘281的寡核苷酸引物对(引物对SEQ ID NO:49和SEQ ID NO:50)。

21.如权利要求15至20所述的试剂盒，其中，(h)是用于扩增ZNF492‘069的寡核苷酸引物对(引物对SEQ ID NO:95和SEQ ID NO:96)。