CN1659287A

CN1659287A - 诊断肝癌转移或发病可能性及鉴定治疗靶点的方法

Info

Publication number: CN1659287A
Application number: CN038129825A
Authority: CN
Inventors: 王心伟; 叶青海; J·W·金
Original assignee: Goverment Of United States, AS REPRESENTED BY SECRETARY D
Current assignee: Goverment Of United States, AS REPRESENTED BY SECRETARY D; US Government
Priority date: 2002-04-05
Filing date: 2003-04-04
Publication date: 2005-08-24
Also published as: AU2003230838A8; WO2003087766A3; AU2003230838A1; WO2003087766A2

Abstract

本发明涉及诊断HCC患者的肝细胞癌(HCC)转移可能性和慢性肝病患者发展为HCC可能性的方法。还提供了用于上述分析的计算机可读介质、数字式计算机和系统。还公开了确定治疗HCC患者转移的潜在治疗靶点的方法和防止慢性肝病患者发展为HCC的方法。此外，本发明提供了通过抑制HCC患者的一个治疗靶点(骨桥蛋白)的功能而抑制HCC转移的方法，以及通过抑制慢性肝病患者的一个治疗靶点(EpCAM)的功能而防止其发展为HCC的方法。还公开了包含能抑制OPN或EpCAM功能的药物组合物。

Description

诊断肝癌转移或发病可能性及鉴定治疗靶点的方法

相关申请的交叉引用关系

该申请要求2002年4月5日提交的美国临时专利申请No.60/370,895的优先权，此申请的全部内容被引入本文作为参考。

对联邦政府资助的研究或开发下完成的发明的权力声明

本发明归美国政府(以健康及人类服务部秘书为代表)所有。

背景技术

肝细胞癌(HCC)是世界范围内最常见和最具侵入性的恶性肿瘤之一，治愈率低于5％。死亡率高的主要原因在于癌细胞在肝内出现转移。人们对有关肝内转移的分子机制或此类病人的特异性治疗靶点知之甚少。

在过去的十年内，许多技术使得监测在任一时间点的大量转录子(transcripts)的表达水平成为可能(见例如，Schena等人，Science 270：467-470，1995；Lockhart等人，NatureBiotechnology 14：1675-1680，1996；Blanchard等人，Nature Biotechnology 14：1649，1996；和美国专利No.5,569,588)。对于已经知道完整基因组的生物体而言，分析细胞内所有基因的转录子是可能的。对于其他生物体，如人，随着对人类基因组信息的逐渐了解，有可能在细胞内同时监测大量的基因。这些监测技术一般应用于鉴定在不同病理或生理状态下上调或下调的基因，应用于分析传递细胞状态信号的成员，以及应用于鉴定各种药物靶点。

本发明人分析了HCC组织中9180个基因的表达，病理组织来自伴随有肝内癌细胞转移或没有伴随转移的40个病人。使用监督机器学习算法(supervised machinelearning algorithm)对病人的基因表达特征进行分类，已经首次产生一分子信号特征(signature)，该信号特征可以正确地将转移病人和非转移病人分类，而且已经鉴别出了与预后(包括病人存活率)密切相关的一些基因。伴有转移的原发HCCs病灶的基因表达信号与相应转移病灶的基因表达信号非常相似，这表明有利于扩散的基因在原发肿瘤内已启动。而且在伴有肝内转移的原发性HCC内，骨桥蛋白过度表达，并且体外侵入实验表明，抗骨桥蛋白的中和抗体可阻止高转移性肝癌细胞的侵入。这些资料表明，骨桥蛋白既可以用于诊断，又可以作为转移性HCC的治疗靶点。

该研究对肿瘤样品中9180个基因的表达进行了分析，样品来自54个HCC患者的肿瘤组织和59个有严重肝病(含高度危险发展为HCC和低度危险发展为HCC两类)但未癌变的肝脏组织。高危组包括乙肝、丙肝、血色病和Wilson氏病患者。低危组包括酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。高危组和低危组之间基因表达水平的比较已鉴别出一组重要的基因，可以用这些基因来对高危组和低危组进行区分。用来自HCC样品的表达数据对这组显著基因进行过滤，已识别出具有多重HCC相关分子特征的且可用于样品分类的亚组基因。此外，EpCAM作为最显著基因之一，其过度表达与严重肝病患者继发HCC的危险性呈正相关，抑制其表达可使HCC细胞生长受抑制。因此，EpCAM是预测发展为HCC危险性的诊断标志，同时也是阻止慢性肝病患者发展为HCC的治疗靶点。

发明概述

本发明一方面涉及一种方法，该方法对于HCC患者而言，可以鉴定抑制转移的潜在治疗靶点；对于慢性肝病患者而言可以阻止发展成为HCC。

一种鉴定抑制HCC患者转移的潜在治疗靶点的方法，包括以下步骤：a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触；b)从样品中捕获标志物并产生第一个信号；c)用非转移的HCC患者的样品重复步骤a)和步骤b)从而产生第二信号；d)比较第一和第二信号，从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组，此亚组的细胞标记物就是治疗HCC转移的潜在治疗靶点。在某些具体实施例中，在步骤b)和步骤c)中扣除正常非癌组织样品在芯片(与步骤a)的芯片相同)上所产生的信号，从而产生第一和第二信号。

一种鉴别防止慢性肝病患者发展为HCC的潜在治疗靶点的方法，包括以下步骤：a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触；b)从样品中捕获标志物并产生第一个信号；c)用HCC低危的慢性肝病患者样品重复步骤a)和步骤b)，从而产生第二信号；d)比较第一和第二信号，从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组，此亚组的细胞标记物就是防止慢性肝病患者发展为HCC的潜在治疗靶点。在某些具体实施例中，在步骤b)和步骤c)中扣除正常非癌组织样本在芯片(与步骤a)的芯片相同)上所产生的信号，从而产生第一和第二信号。

本发明另一方面涉及预测HCC患者转移可能性或预测慢性肝病患者发展为HCC的危险性的方法。

一种预测HCC患者癌转移可能性的方法，包括下述步骤：a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触，这组细胞标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白；b)从样品中捕获标志物；c)从步骤b)的被捕获标志物中产生第一信号；d)用非转移的HCC患者的样品重复步骤a)至步骤c)从而产生第二信号；e)用不明确有无转移可能的HCC患者样品重复步骤a)至步骤c)从而产生第三信号；f)将第三信号和第一、第二信号进行比较，从而明确步骤e)的HCC患者是否有转移可能。在某些具体实施例中，进行上述实验的细胞标志物包括至少20个，较佳地50，更佳地100，最佳地全部的基因或由基因编码的蛋白，这些基因从表2中独立选出。在其他具体实施例中，这组细胞标志物包括来自表4的基因或基因所编码的蛋白，或编号为Hs.313、Hs.69707、Hs.222、Hs.63984、Hs.75573、Hs.177687、Hs.69707、Hs.222、Hs.323712、和Hs.63984的单基因(Unigene)。较佳地，步骤a)、b)、d)、e)所用样品最好为肝组织抽提物。在一优选例中，步骤a)的芯片是基因组芯片。在另一优选例中，步骤a)的芯片是蛋白组芯片。

一种预测慢性肝病患者发展为HCC的危险性的方法，包括以下步骤：a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触，这组细胞标志物至少包括10个基因或基因所编码的蛋白(由表5基因中独立选出)；b)从样品中捕获标志物；c)从步骤b)被捕获的标志物中产生第一信号；d)用HCC低危的慢性肝病患者样品重复步骤a)至步骤c)从而产生第二信号；e)用不明确有无HCC危险的慢性肝病患者样品重复步骤a)至步骤c)从而产生第三信号；f)将第三信号和第一、第二信号进行比较，从而确定步骤e)的患者发展为HCC的危险性。在某些具体实施例中，进行上述实验的细胞标志物包括至少20、较佳地50、更佳地100、最佳地全部的基因或基因所编码的蛋白，这些基因从表5中独立选出。有时，细胞标志物来自表6或表7的基因或基因所编码的蛋白。较佳地，步骤a)、b)、d)、e)所用样品为肝组织抽提物。在一优选例中，步骤a)的芯片是基因组芯片。在另一优选例中，步骤a)的芯片是蛋白组芯片。在某些实施例中，有高度危险发展为HCC的病人患乙肝感染、丙肝、血色病和Wilson氏病。在另一些例子中，发展为HCC危险性较低的病人患有酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。在另一些例子中，待评估患HCC的危险度的病人患有乙肝、丙肝、血色病、Wilson氏病、酒精性肝病、自身免疫性肝炎或原发性胆汁性肝硬化。

本发明的另一方面涉及抑制HCC患者癌转移的方法和抑制慢性肝病患者发展为HCC的方法。抑制HCC患者癌转移的方法包含步骤：抑制OPN的活性。在某些实施例中，可通过抑制OPN的表达来抑制OPN的活性，较佳地是采用OPN特异的反义多核苷酸。此外，可通过抑制OPN与其受体间的特异性结合来抑制OPN的活性，较佳地是采用抗OPN抗体。防止慢性肝病患者发展为HCC的方法包括步骤：抑制EpCAM的活性。在某些实施例中，可通过抑制EpCAM的表达来抑制EpCAM的活性，较佳地是采用EpCAM特异的反义多核苷酸或者小的干扰性RNA。此外，可通过抑制EpCAM与其受体间的特异性结合来抑制EpCAM的活性，较佳地是采用抗EpCAM抗体。

本发明的再一方面涉及用于评估HCC患者癌细胞转移可能性或评估慢性肝病患者发展为HCC危险性的计算机可读介质、数字式计算机和系统。

评估HCC患者癌细胞转移可能性的计算机可读介质包括：a)第一数据集的代码，该数据集来源于第一信号，该信号来自与转移性HCC患者的样品接触的芯片，所述芯片包含针对一组细胞标志物的捕获试剂，这组细胞标志物包括至少10个基因或基因所编码的蛋白(由表2基因中独立选出)；b)第二数据集的代码，该数据集来源于第二信号，该信号来自与非转移性HCC患者的样品接触的芯片，所述芯片与a)的芯片相同；c)第三数据集的代码，该数据集来源于第三信号，该信号来自与未知转移的HCC患者的样品接触的芯片，所述芯片与a)的芯片相同；d)将第三数据集与第一和第二数据集进行比较的代码。还提供了一种数字式计算机，它包含用来评估HCC患者癌细胞转移可能性的所述计算机可读介质。还提供了一个系统，它包括这样的数字式计算机、包含针对一组细胞标志物(所述标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白)的捕获试剂的阵列的芯片和能在与样品接触后从芯片上读取信号的阅读器。

评估慢性肝病患者发展为HCC危险的计算机可读介质包括：a)第一数据集的代码，该数据集来源于第一信号，该信号来自与患慢性肝病且HCC高危的患者的样品接触的芯片，所述芯片包含针对一组细胞标志物的捕获试剂，这组细胞标志物包括至少10个基因或基因所编码的蛋白(由表5基因中独立选出)；b)第二数据集的代码，该数据集来源于第二信号，该信号来自与慢性肝病且HCC低危的患者的样品接触的芯片，所述芯片与a)的芯片相同；c)第三数据集的代码，所述数据集来源于第三信号，该信号来自与慢性肝病且发展为HCC的危险度未知的患者的样品接触的芯片，所述芯片与a)的芯片相同；d)将第三数据集和第一和第二数据集进行比较的代码。还提供了数字式计算机，它包含用来评估慢性肝病发展为HCC的危险性的所述计算机可读介质。还提供一个系统，它包括这样的数字式计算机、包含针对一组细胞标志物(所述标志物包括从表5基因中独立选出的至少10个基因或基因所编码的蛋白)的捕获试剂的阵列的芯片和能在与样品接触后从芯片上读取信号的阅读器。

定义

除非另有说明，此处所用科学和技术术语为该发明所属领域专业人士通常所理解的意义。下述文献提供了本发明中所用许多术语的一般定义：Singleton等人，Dictionary of Microbiology and Molecular Biology(第2版，1994)；The CambridgeDictionary of Science and Technology(Walker ed.，1988)；The Glossary of Genetics，第5版，R.Rieger等人(eds.)，Springer Verlag(1991)；和Hale & Marham，The Harper CollinsDictionary of Biology(1991)。如本文所用，除非另有说明，下列术语具有其所属的含义。

如本文所用，术语“肝细胞癌”或“HCC”指占原发性肝癌的90％以上的主要类型的肝癌。肝癌细胞状态包括从高度分化的到高度退行性变而未分化的损伤。肝癌可以为单病灶肝内病变(非转移的)、多发性肝内转移或肝外转移。

“癌前高危疾病”指一组流行病学定义的疾病，这些疾病有高度危险发展为HCC。这些疾病包括慢性乙肝、丙肝、血色病和Wilson氏病。

“癌前低危疾病”指一组流行病学定义的疾病，这些疾病有低度危险发展为HCC。这些疾病包括酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。

术语“转移”或“转移的”指单个癌细胞浸润(侵入)周围组织、进入循环系统和在新的部位恶性增生的能力。

“非转移”指肿瘤未扩散到原发病灶以外，而且具体地指其未进入循环系统并在新的部位恶性增生。

术语“非癌”指一生物学或组织样品，其中的细胞呈正常或非病理形态，可采用肉眼、通过显微镜、免疫组织学、免疫学或应用检测病理状况的抗体或核酸探针在分子水平上进行分析。

术语“正常”指从未患HCC、高危癌前疾病、低危癌前疾病任一种病的个体采集而来的生物学样品或组织样品。

术语“捕获试剂”指任一能与特异性核酸或蛋白标志物结合的物质。典型地，可通过结合过程中的条件来控制具有标志物与捕获试剂的结合。如，核酸标志物与寡核苷酸的结合可被所用的杂交条件控制。严格的杂交条件仅允许有高度同源性(如与寡核苷酸有95％-100％的同源性)的核酸标志物与寡核苷酸结合。

“阵列”指结合于基片(如固相支持物)的多个捕获试剂，这些捕获试剂能结合于相关的标志物。例如，阵列可以由核酸分子、蛋白分子或其它试剂组成，可以特异性地结合从生物学样品中分离的核酸、蛋白或多肽。捕获试剂优先以可寻址方式结合，这样当相关标志物结合于捕获试剂时，可确定结合量。

“DNA微阵列”指捕获试剂是核酸分子的阵列。典型地，DNA阵列由一定长度的DNA寡核苷酸组成，在一定条件下能与DNA、cDNA或RNA分子杂交。DNA寡核苷酸可以是15～50碱基的短片段核苷酸，也可以是为500～1000碱基或更长片段的核苷酸。DNA微阵列可以由数百或数千个不同的核酸分子组成，每个核酸分子在阵列上处于固定的位置。当标志物被可检测分子标记后，标志物与DNA微阵列的结合通常可以被定量。术语DNA微阵列与术语“基因组阵列”可互换使用。

“蛋白质阵列”指捕获试剂能结合蛋白质标志物的阵列。典型地，捕获试剂为多克隆或单克隆抗体，可以与特异的蛋白质结合。换句话说，可以特异性结合蛋白的任何蛋白、多肽、核酸或其他分子或表面都可以被应用于蛋白阵列中。这些阵列通常包括数百或数千个位于可寻址区域的不同捕获试剂。当标志物被可检测分子标记后，蛋白质阵列上的捕获试剂与标志物的结合通常被定量。术语蛋白质阵列与术语“蛋白质组阵列”可互换使用。

“基因表达谱”指与标准样品比较，所有在组织样中表达的基因。基因表达谱中基因的表达水平，可通过比较标准样品和待检样品如HCC肿瘤样品或严重肝病患者样品的表达水平而确定。用于确定HCC肿瘤转移可能性的标准样品，为非癌肝脏组织或者为未诊断为HCC的病人的肝脏组织。用于确定严重肝病患者发展为HCC可能性的标准样品，为未诊断为严重肝病的病人的肝脏组织。与标准样品相比，待检样品中的基因可能过表达或低表达。

“转移性基因表达预测子(predictor)”指与转移性HCC的诊断相关的一簇特异基因的表达。转移性基因表达预测子可这样得出：比较非转移HCC样品和和转移的HCC样品的基因表达谱，继而运用一个明确的运算法则或一组运算法则进行聚类分析和分类分析。基因数可随所用的聚类运算法则或运算法则中的参数(如p-水平＝0.001vs.0.022)而变动。

“HCC基因表达预测子”指与诊断可能发展为HCC的患者相关的一簇特异基因的表达。HCC基因表达预测子可这样得出：比较有发展为HCC高危的病人的非转移性肝脏样品与有发展为HCC低危的病人的非转移性肝脏样品的基因表达谱，继而运用一个明确的运算法则或一组运算法则进行聚类分析和分类分析。基因数可随所用的聚类运算法则或运算法则中的参数(如p-水平＝0.001vs.0.022)而变动。

表2-7所用“UG簇”指由国家生物信息中心(NCBI)编辑的UniGene数据库。UniGene数据库中的每个登录号是所有核苷酸和氨基酸序列数据的汇编，可用于一特定的核酸序列。如，每个UG簇登录号可提供与GeneBank或其他数据库的链接，后者会提供编码基因的部分或全长cDNA的核苷酸序列。换句话说，链接可以提供基因组或EST序列资料或氨基酸序列信息。每个UG簇登录号为所鉴定的特定基因、核酸或氨基酸序列提供独一无二的序列信息。

“骨桥蛋白”指由SEQ ID NO：1编码的分泌型磷蛋白质或者其保守变异物，其Genebank登录号为NM_000582。在NCBI的UniGene数据库也可找到它的核酸和氨基酸序列信息，它在NCBI网址上的登录号为Hs.313。NCBI网址列出了9个mRNA/基因组DNA序列和900以上的表达序列标签(EST)。骨桥蛋白是一胞外蛋白，与骨基质和动脉粥样硬化斑块相关。全长的骨桥蛋白包括一个RGD氨基酸序列，该RGD氨基酸序列是整联蛋白的结合位点。骨桥蛋白是玻联蛋白受体的主要配体。“OPN”可与骨桥蛋白互换使用，都指蛋白、编码蛋白的基因或其片段。

“EpCAM”为一种40kDa的糖蛋白，功能是上皮细胞粘附分子。被确定为与肿瘤的钙离子信号转导物(也称为TACSTD1)，UniGene簇登录号为Hs.692，EpCAM由基因GA733-2编码，该基因位于人类染色体4q上。EpCAM是在上皮来源的细胞中表达的跨膜蛋白，可介导不依赖于钙离子的同型细胞之间的粘附，能被许多已知的单克隆抗体特异识别，如17-1A、323/A3、KS1/4、GA733、MOC31等。

本发明中的术语“标志物”指编码多肽(有特定的表观分子量)的核酸序列或基因，其在转移性HCC患者或易患HCC个体样品中与对照个体(如非转移性HCC患者、未诊断为癌症或未检测出癌症的个体，正常或健康人)的相应样品中是差异性存在的。标志物也可以指由核酸序列或基因编码的多肽或蛋白质，其在转移性HCC患者或易患HCC个体样品中与对照个体(如非转移性HCC患者、未诊断为癌症或未检测出癌症的个体，正常或健康人)的相应样品中是差异性存在的。本发明中的标志物包括下文表2-7中有UG簇登录号的基因和其编码的蛋白质。

如本文所用，术语“样品”指生物学组织或组织液样品，它们可用于确定基因表达谱、标志物的来源、或包含有关蛋白(如骨桥蛋白或EpCAM)或编码该蛋白的核酸。这样的样品包括(但并不限于)从人体分离来的各种类型的组织，也可以包括组织切片如冷冻切片或石蜡切片。组织包括肝脏样品和体液样品(血、血清、血浆、尿以及其他体液。本发明所用的优选样品是从感兴趣组织(如肝脏)抽提得到的细胞溶解产物，这样的细胞溶解产物可本领域技术人员熟知的各种方法制备，这取决于待检测和检查的细胞标志物的形式，如作为核酸(如mRNA)、蛋白或具有其他可检测生物特性(如酶活性)的分子。

对于分析测定那些具有调节象骨桥蛋白或EpCAM等重要蛋白生物活性的化合物而言，上下文提到的术语“功能效应”应该包括测定间接或直接地受OPN或EpCAM影响的相关参数，例如编码蛋白的mRNA水平、蛋白水平和它们在功能上的，以及物理和化学的效应(例如它们与其天然结合物，例如其他蛋白、核酸或其他分子，进行特异性相互作用的能力；以及它们调节信号转导引起细胞的一系列活动的能力，例如细胞增值、分化、凋亡、分泌、粘连等)。

“核酸”指的是脱氧核糖核酸或者是核糖核酸及其聚合物，可以是单链或是双链形式。这个术语应该包括有含已知核酸类似物的核酸或基本骨架残基被修饰过的核酸或是作为联接物的核酸，它们可以是合成的、自然存在的以及非自然存在的，与对照核酸相比，它们拥有相似的结合特性，并且以类似于对照核苷酸的方式被代谢。这些类似物的例子有硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性的甲基膦酸酯、2-O-甲基核糖核苷酸、肽核酸(PNAs)。该术语还包括从生物标本中分离获得的核酸以及人工合成的寡核苷酸。

除非另外说明，一个特定的核酸序列也隐含地包含其保守修饰的核酸变异体(例如简并密码子取代)以及它们的互补序列，还包括明示的序列。具体地，简并密码子的取代可以通过生成序列而获得，在该生成的序列中，一个或多个选定的(或全部)密码子的第三个位置被混合碱基和/或脱氧肌苷残基所取代(Batzer等人，Nucleic AcidRes.19：5081，1991；Ohtsuka等人，J.Biol.Chem.260：2605-2608，1985；Rossolini等人，Mol.Cell.Probes 8：91-98，1994)。核酸这一术语可与基因、cDNA、mRNA、寡核苷酸及多核苷酸互换使用。

术语“多肽”、“肽”及“蛋白”在本文可互换使用，指氨基酸残基的聚合物。该术语可指这样的氨基酸聚合物，其中一个或多个氨基酸残基是对相应天然存在氨基酸的人工化学模拟物，还可指天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。

术语“氨基酸”指的是天然存在的及人工合成的氨基酸，以及与天然存在的氨基酸发挥相同作用的氨基酸类似物和氨基酸模拟物，。天然存在的氨基酸是由遗传密码编码的氨基酸和那些后来被修饰的氨基酸，例如羟基脯氨酸，γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指的是这些化合物，它们具有同天然存在的氨基酸相同的基本化学结构，例如结合于H的α碳原子、羧基、氨基和R基，例如高丝氨酸、正亮氨酸(己氨酸)、甲硫氨酸亚砜、甲硫氨酸甲基锍。这些类似物具有修饰过的R基团(如正亮氨酸)或修饰过的多肽骨架，但保留了与天然氨基酸相同的基本化学结构。氨基酸模拟物是指这样化学化合物，它们的结构不同于氨基酸的通用化学结构，但在功能上与天然的氨基酸相似。

氨基酸可以通过它们通常已知的IUPAC-IUB生化命名委员会推荐的三字符，或通过单字符表示。同样，核酸可以通过通常已被接受的单字母密码表示。

“保守修饰的变异体”对氨基酸序列和核酸序列都适用。对于特定的核酸序列，保守修饰的变异体指编码相同或本质上相同的氨基酸序列的核酸，或者当核酸不编码氨基酸序列时指本质上相同的序列。由于遗传密码的简并性，有大量功能相同的核酸可编码任一特定的蛋白。例如，密码子GCA、GCC、GCG和GCU都编码丙氨酸。因此，在丙氨酸由一密码子限定的每个位置，该密码子能变为上述的相应密码子中的任一种而不会改变被编码的多肽。这样的核酸变异体是“沉默变异体”，它们是保守修饰变异体的一种。本文的编码多肽的每一个核酸序列也指该核酸的每种可能的沉默变异体。技术人员会认识到，核酸中的每个密码子都能被修饰，从而产生功能上相同的分子(除了AUG和TGG之外，AUG是编码甲硫氨酸的唯一密码子，TGG是编码色氨酸的唯一密码子)。因此，编码多肽的沉默的核酸变异体在每个被描述的序列中都是暗含的。

至于氨基酸序列，技术人员会认识到，通过对核酸、肽类、多肽或蛋白序列进行单个取代、缺失或插入，从而在编码序列中改变、添加或缺失单个氨基酸或小部分百分比的氨基酸，这是“保守修饰的变异体”，其中该改变导致了氨基酸被化学相似的氨基酸所取代。提供功能相似的氨基酸的保守取代表是本领域熟知的。这些保守修饰的变异体是本发明的多态变异体、种间同源物和等位基因之外的，而且并不排除本发明的多态变异体、种间同源物和等位基因。

下面8组的每一组都含有可相互保守取代的氨基酸：

1)丙氨酸(A)，甘氨酸(G)

2)天冬氨酸(D)，谷氨酸(E)

3)天冬酰胺(N)，谷氨酰胺(Q)

4)精氨酸(R)，赖氨酸(K)

5)异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，缬氨酸(V)

6)苯丙氨酸(F)，酪氨酸(Y)，色氨酸(W)

7)丝氨酸(S)，苏氨酸(T)；和

8)半胱氨酸(C)，甲硫氨酸(M)

(参见，例如Creighton，Proteins，1984)

对于诸如多肽结构等大分子结构，可以根据不同结构水平进行描述。对于该结构的综述，可以参阅例如Alberts等人，Molecular Biology of the Cell(3rd ed.，1994)以及Cantor和Schimmel，Biophysical Chemistry Part I：The Conformation of BiologicalMacromolecules(1980))。“一级结构”指一特定肽的氨基酸序列。“二级结构”指多肽中局部的有序三维结构。这些结构一般被称为(结构)域。结构域是多肽的一部分，它形成多肽紧凑单元并且通常长50到350个氨基酸。典型的结构域由更小的结构部件(如β-折叠和α-螺旋)构成。“三级结构”指多肽单体的完整三维结构。“四级结构”指独立的三级结构单元通过非共价键而形成的三维结构。各向异性术语也被认为是能量术语。

“抗体”指一多肽，它具有来自免疫球蛋白基因或其片段的骨架区域，并能特异性结合和识别抗原。具有识别功能的免疫球蛋白基因包括κ、λ、α、γ、δ(σ)、ε、μ恒定区基因以及成千上万的免疫球蛋白可变区基因。轻链被分为κ或σ。重链分成γ、μ、α、σ或ε，这依次限定了免疫球蛋白的种类，IgG、IgM、IgA、IgD和IgE。

一个典型的免疫球蛋白(抗体)的结构单元应包含四聚体。每个四聚体由两对相同的多肽链组成，每一对含有一条轻链(大约25KD)和一条重链(大约50-70KD)。每条链的N端界定了约100-110个或更多氨基酸组成的可变区，该可变区主要负责识别抗原。术语可变轻链(V_L)和可变重链(V_H)分别指这些轻链和重链。

抗体以完整的免疫球蛋白形式存在或以大量已充分表征的片段形式存在，这些片段是由不同的肽酶消化免疫球蛋白而产生的。因此，例如胃蛋白酶在铰链区中的二硫键下方消化抗体，从而产生F(ab)′₂，一个F(ab)的二聚物(Fab本身是通过二硫键连于V_H-C_H1区的轻链)。通过在柔和条件下打断铰链区二硫键，可使F(ab)′₂还原，由此将F(ab)′₂二聚物转变成Fab′单体。Fab′单体本质上是具有部分铰链区的Fab(参见Fundamental Immunology(Paul编，第3版，1993)。尽管各种抗体片段是按照完整抗体被酶消化的方式命名的，但技术人员会理解，这些片段可用化学法或DNA重组法从头合成。因此，如本文所用，术语抗体也应包括完整抗体通过修饰所产生的抗体片段，或者用DNA重组技术从头合成的抗体片段(例如，单链F_v)或使用噬菌体显示文库鉴定出的抗体片段(参见，例如McCafferty等人，Nature 348：552-554，1990)

对于单克隆或多克隆抗体的制备，本领域中任一已知的技术都能被使用(参见，例如Kohler & Milstein，Nature 256：495-497(1975)；Kozbor等人，Immunology Today 4：72(1983)；Cole等人，pp.77-96，Monoclonal Antibodies and Cancer Therapy(1985))。生产单链抗体的技术(美国专利4946778)能用于生产本发明的多肽抗体。转基因小鼠或其他生物体(如其他哺乳动物)也能被用于表达人源化抗体。同样，噬菌体显示技术能用于鉴定特异性结合于选定抗原的抗体和异聚体的Fab片段(参见，例如McCafferty等人，同上；Marks等人，Biotechnology 10：779-783，1992)。

“嵌合抗体”是一种抗体分子，在该抗体分子中，(a)恒定区或恒定区中的一部分被改变、取代或交换，以致抗原结合位点(可变区)被连接于不同类别或已改变类别的抗体恒定区、效应子官能团或种类、或者赋予嵌合抗体新性质的完全不同的分子，例如酶、毒素、激素、生长因子、药物等；或者(b)可变区或者其中一部分被改变、取代或与具有不同或已改变的抗原特异性的可变区进行交换。

“抗骨桥蛋白抗体”是一种抗体或抗体片段，它特异结合于骨桥蛋白基因、cDNA、或其亚序列所编码的多肽。抗EpCAM抗体以类似方式被定义。

如本文所用，“受体”包括能特异性结合于特定蛋白(如OPN或EpCAM)的任一分子，并且因此包括蛋白、核酸、碳水化合物或任何其他分子。

术语“免疫分析”是使用抗体对抗原进行特异性结合的一种分析。免疫分析的特征是利用特定抗体的特异结合性来分离、靶向和/或定量分析抗原。

当指蛋白或肽时，术语“特异性(或选择性)结合于”抗体或“特异性(或选择性)免疫反应于”抗体指结合反应，该结合反应是测定某蛋白是否存在于异源蛋白群或其他生物体中的决定因素。因此，在指定的免疫分析条件下，特异性抗体结合于特定蛋白至少是本底的两倍，而基本上不会大量结合于样本中的其他蛋白。在这种条件下抗体的特异结合，会需要因对特定蛋白有特异性而选出的抗体。例如，从大鼠、小鼠或人这些特定物种获得的抗OPN多克隆抗体，可被选择从而获得那些与OPN特异性免疫反应而不与其它蛋白(除了OPN的多态变异体和等位基因)反应的多克隆抗体。这个筛选可以通过扣减与其他种属的OPN分子有交叉反应的抗体而得以完成。各种不同的免疫分析方式可用于筛选与特定蛋白进行特异性反应的抗体。例如，固相ELISA免疫分析被常规用于筛选与蛋白进行特异反应的抗体，(对于能用于确定特异性免疫反应的免疫分析方式和条件的描述，可参见，例如Harlow & Lane，Antibodies，A LaboratoryManual，1988)。典型地，特异性或选择性反应至少两倍于本底信号或噪音，而且更典型地是高出本底10-100倍。

术语“差异存在”指：分别与非转移的HCC样本或低危HCC病人的肝组织样本相比，在取自转移的HCC肿瘤或高危HCC病人的肝组织样本中的生物标记物在数量和/或频率上有差异。例如，标记物可以是多肽或核酸，与非转移的HCC样本或低危HCC病人的肝组织样本相比，这些标记物在取自转移的HCC肿瘤或高危HCC病人的肝组织样本中会高水平或低水平地出现。或者，标记物是多肽，与非转移的HCC样本或低危HCC病人的肝组织样本相比，该多肽在取自转移的HCC肿瘤或高危HCC病人的肝组织样本中被频率更高或更低地检测到。标记物的差异存在可以是数量、频率、或兼而有之。

如果在一个样本中多肽的数量在统计学上显著不同于同另一个样本中的数量，那么该多肽或核酸在两个样本中就是差别存在的。例如，如果多肽出现在某个样本中比另一个样本高出至少120％、至少130％、至少150％、至少180％、至少200％、至少300％、至少500％、至少700％、至少900％、或者至少1000％，或者如果多肽在其中一个样本中被检测到而在另一个样本中检测不到，那么该多肽就差别存在于两个样本中。

作为替换或作为附加，如果在转移的HCC肿瘤或高危HCC病人的肝组织样本中多肽被检测到的频率，在统计学上显著性地高于或低于在非转移的HCC样本或低危HCC病人的肝组织样本中检测到的多肽频率，那么该多肽就差别存在于两组样本。例如，如果在某组样本中观察到的多肽检测频率比其他组样本高出或低于至少120％、至少130％、至少150％、至少180％、至少200％至少300％、至少500％、至少700％、至少900％、或者至少1000％，或者如果多肽能在其中一个样本中被检测到而在另一个样本中检测不到，那么多肽就差别存在于两个样本。

“诊断”意思就是：确定病理症状或病理症状易感性的存在与否或本质属性，如HCC或HCC转移。在灵敏性和特异性方面，诊断方法可有所不同。诊断分析的灵敏性就是检测为阳性的患者百分率(真阳性的百分比)。没有被检测到的患者称为假阴性。没有患病并且在分析中检测为阴性的人称为真阴性。诊断分析的特异性就是1减去假阳性率，其中假阳性率就是没有得病的人被检测出阳性的比例。虽然一个特定诊断方法可能不提供疾病的确定的诊断结果，但是如果该方法提供有助于诊断的阳性指示，那么就足够了。

标记物的测定量就是指标记物分布在被检测样本中的数量。测定量要么是以绝对数量表示(如ug/ml)，要么以相对值表示(例如信号的相对强度)。

标记物的诊断量就是在人样本中的标记物数量，它与转移的HCC肿瘤或高危险的HCC患者的组织样本的诊断相符合。诊断量可以是以绝对数量表示(如ug/ml)，也可以以相对值表示(例如信号的相对强度)。

标记物的对照量可以是任一数量或者是在某个范围的数量，这个数量被用于同标记物的测定量相比较。例如标记物的对照量就是在没有转移HCC肿瘤的人或低危险HCC患者组织样本中出现的标记物数量。对照量可以是以绝对数量表示(如ug/ml)，也可以以相对值表示(例如信号的相对强度)。

分光光度计探测器指一种设备，它能以可拆除的方式插进气相离子分光光度计，包括一个基质，该基质具有可放置用于测定的标记物的表面。分光光度计探测器可以含有单个基质或多个基质。名称有ProteinChip^，ProteinChip^阵列或芯片在本文也指特定种类的分光光度计探测器。

“基质”或“探测器基质”指在其表面提供吸附剂(如通过附着、沉积等)的固相载体。

“吸附剂”指能用于吸附标记物的任何物质。在这里使用的吸附剂术语既指与标记物接触的单一物质(单式吸附剂)(例如一个化合物或一个官能团)，又指与标记物接触的多种不同的物质(复式吸附剂)。复式吸附剂中的吸附剂材料被称为“吸附剂种类”。例如，在探测器基质上可寻址的位置可以包括复式吸附剂，其特征是具有许多不同的、有不同的结合特性的吸附剂种类(如阴离子交换物质、金属鳌合剂或抗体)。基质材料本身也能用于吸附标记物并可被认为是吸附剂的一部分。

“吸附”或“保留”指在用洗脱剂(选择性阈值调节剂)或洗涤溶液进行洗脱之前或之后，在吸附剂和标记物之间的可检测的结合。

“洗脱剂”或“洗涤溶液”指的是能用于调节标记物对吸附剂进行吸附的试剂。洗脱剂和洗涤溶液都被称为选择性阈值调节剂。洗脱剂和洗涤溶液都能用于洗脱和去除掉探测器基质表面没有被结合的物质。

“标记物的分辨”，“辨析”或“解析”指在某个样本中，至少有一个标记物被检测到。分辨的意思包含：在某个样本中经分离检测多个标记物，以及随后随后的差别检测。解析并不需要把一个或多个标记物同混合物中其他生物分子完全分离开来。相反，分离只要使至少一个标记物和其他生物分子区别开就足够了。

“气相离子分光光度计”指当样品被蒸发和电离时，测量参数能被转换成离子形式荷质比的仪器。一般地，离子带一个电荷，并且质荷比一般被称作质量。例如，气相离子分光光度计包括质谱仪、离子迁移分光光度计、以及全离子流测量仪。

“质谱仪”指气相离子分光光度计，它包括一个进样系统、一个电离源、一个离子光学装置、一个质谱分析仪以及一个检测器。

“激光解吸质谱仪”指利用以激光为手段解吸、蒸发和电离被分析物的质谱仪。

“检测”指确定被检测物的存在、不存在或数量。

“可检测成分”或“标记物”指可通过分光光谱、光化学、生物化学、免疫化学、化学手段检测出的物质。例如，有用的标记物包括³²P、³⁵S、荧光染料、电子致密试剂、酶(例如常用在ELISA中的酶，如辣根过氧化物酶)、生物素-抗生物素蛋白链菌素、地高辛、半抗原和蛋白质(已有针对它们的抗血清或单克隆抗体)、或与靶目标有互补序列的核酸分子。可检测成分一般会产生可测量的信号，如放射性、发色的、或荧光信号，该信号能用于定量样品中已结合的可检测成分。信号定量可通过例如液体闪烁计数、密度测量或流式细胞测量术而获得。

如在该申请书中所用，“活性”指分子如由某个基因编码的蛋白(如骨桥蛋白或EpCAM)的生物学功能。该词包含生物学功能，如酶活性，同其它分子的特异性作用，在细胞或分子水平上对生物活动的调节效应等等。

如本文所用，术语“抑制的”或“抑制作用”指对有关靶点分子功能或活性的负调节作用，以致于功能或活性(如酶活性或与其他分子的特异作用)发生可检测的下降，或有效丧失。

如本文所用，术语“拮抗剂”指能够对靶分子(如骨桥蛋白或EpCAM)的生物活性进行负调节的化合物。拮抗剂可以通过不同方式完成负调节，如在转录或翻译水平通过抑制靶基因的表达，或干扰靶分子与其他分子的特异性相互作用。

如在描述多核苷酸的上下文中所使用的那样，术语“反义”指单链核酸的核苷酸序列互补于编码有关蛋白(如骨桥蛋白或EpCAM)的靶核酸的至少一部分，即与“正义”序列互补。两个单链多核苷酸之间的互补性是基于“A-T G-C”碱基配对原则的。如序列“5′-AGAT-3′”同序列“5′-ATCT-3′”互补。靶序列与其反义多核苷酸之间的互补性典型地为100％，即反义多核苷酸的所有碱基同靶核苷酸碱基相匹配，但也可有不同的互补程度，即可以有某些错配的碱基。靶核酸同它的反义多核苷酸之间互补的程度，对杂交的效率和强度有显著的影响。在本申请中的反义多核苷酸序列，可对应于靶核酸的编码区(即外显子)或非编码区。

图表的简要描述

图1.按照基因表达对转移的或没有转移的肝细胞癌进行分类。A)通过对所有5个临床组(即P、P-M、PT、PT-M、PN)的监测类别比较分析，获得143个显著性基因(P＜0.0005)，利用这些基因对50个原发性和转移HCC样本进行多维量表分析。轴代表这些基因中前三个主要组分。P，为肝内扩散的原发性HCC；P-M，P的转移损伤；PT，在门静脉有肿瘤血栓的原发性HCC；PN，无转移的原发性HCC样本。B)用来自于监测类别比对得到的383个显著性基因(P＜0.0005)，对来自P、PT、和PN组的30个原发性HCC样本的分级聚类分析。

图2.利用源于“省略单因素(leave-one-out)”的交叉验证复合共变预测分类法的转移预测模型，对转移和存活进行的预测结果。A)用于40个训练的和测试的HCC患者的转移预测模型。预测是基于训练集(圈)的，它包括先前在复合共变预测分类中使用过的10个PN和10个PT的原发性HCC样本，和20个没有在训练程序中使用过的原发性双盲HCC样本。该预测使用了153个在这两组中有区别的显著性基因。B)用153个有显著性基因，通过预测对40例原发性HCC样本进行多维量表分析。标出了病人的身份(ID)。C)40例PN、PT和P患者的Kaplan-Meier生存曲线。交叉符号表示检查时间。

图3.同转移HCC相关的候选基因。A)主要的30个候选基因分级聚类，这些基因的表达在PT和PT-M组中大部分已改变，但在PN组的却很少。每一排代表单个基因，每一列代表单个肿瘤样本。在所有肿瘤样本中，按照某一基因的丰度对所有基因丰度中值的比例，各基因就按中心关联和完全连锁(complete linkage)而排序。伪彩暗示差别表达：绿色正方形，表示低于中值的转录水平；黑色正方形，表示等于中值的转录水平；红色正方形，表示高于中值的转录水平；灰色正方形，无数据。树状图是建立在10个原发性PN(绿色)和10个原发性PT(红色)样本之上的。B)在伴随有转移(黑色棒)的10个原发性PN样本(绿色棒)和10个原发性PT样本(红色棒)中，通过cDNA微阵列分析得到的OPN相对表达率。C)和D)是在有或没有转移的原发性HCC样本中，OPNmRNA水平的半定量RT-PCR分析结果。

图4.正常肝组织和肝细胞癌中骨桥蛋白的免疫组织化学分析。原发性肿瘤细胞(S30肿瘤细胞)显示了细胞质骨桥蛋白的免疫反应，尤其在脉管系统高致密区(图b和d)，但在纤维隔膜区(图b和d)或正常的肝实质细胞没有出现免疫反应(图a和c；正常肝914)。放大倍率50倍(H&E，x50)。

图5.骨桥蛋白在促进HCC转移中的作用。A)用大鼠的单克隆抗OPN抗体做Western印迹，确定了CCL 13、SK-Hep-1、和Hep3B细胞中骨桥蛋白的浓度。单克隆β-肌动蛋白抗体被作为内对照。密度测量仪用于OPN的定量，并相对肌动蛋白进行归一化处理。OPN水平表示为相对倍数。B)在有或没有重组的鼠骨桥蛋白，或者有或没有中和抗骨桥蛋白的抗体中的情况下，孵育CCL 13、SK-Hep-1、和Hep3B细胞，并通过Matrigel基膜细胞侵入腔(Cell Invasion Chamber)来测定其侵入情况。在每个条件下，数值为三次测量值的平均值，且表示为相对于穿过对照膜(对照室)的扩散而言，侵入Matrigel基质和膜(matrigel腔)的平均百分比(加上一个标准偏差)。C)五个额外HCC细胞系(SMMC7721、MHCC97、HuH1、HuH4和HuH7)通过matrigel基质与骨桥蛋白中和抗体发生反应，在该反应中的侵入情况如上进行测定。D)皮下注射HCCLM3细胞加抗OPN中和抗体(下图)或不加抗OPN中和抗体(上图)，从之后35天的小鼠获得的代表性肺组织切片(H&E染色，放大100倍)。箭头表示肿瘤细胞等级。E)在给裸鼠皮下注射HCCLM3细胞后的不同周数，监测原发性肿瘤的大小。数据是10只小鼠的均值。F)在裸鼠皮下注射HCCLM3细胞，并且注射或不注射抗OPN中和抗体，在35天后，在裸鼠中检测到转移灶在肺部形成。基于转移的等级，定量转移灶的数目。数值是每组10只小鼠的均值。具有显著性p值(＜0.05)的组用星号表示。

图6.EpCAM在HCC发展中潜在的致癌作用。a)和b)通过微阵列(a)或RT-PCR(b)分析，获得的EpCAM在不同慢性肝脏疾病的肝组织样本中的表达浓度。c)通过抗EpCAM的单克隆抗体的Western印迹分析，EpCAM在源于正常人的成纤维细胞(NHF-hTERT)、正常肝细胞(CCL13)和肝癌细胞(SK-Hep-1、Hep3B、Huh1、Huh4、Huh7、和HepG2)中的表达。抗β-肌动蛋白的单克隆抗体被用作内对照。d)由MTT分析获得的Hep3B、Huh1、和Huh4细胞的增值情况，数值为三个独立实验的平均值。e)通过Western印迹分析，测定siRNA对EpCAM表达有效的抑制作用。f)由MTT分析测定EpCAM siRNA对Hep3B细胞生长的抑制作用。

发明详述

在当今世界上，肝细胞癌(HCC)是最为普遍和最具攻击性的恶性肿瘤之一，在亚非十分盛行，而在欧洲和北美相对少(Parkin等人，CA Cancer J.Clin.49：33-64，1999；Pisani等人，Int.J.Cancer 83：18-29，1999)。近期研究表明，在过去的二十年，HCC在美国和英国的发生率显著增加(Taylor-Robinson等人，Lancet 350：1142-1143，1997；El-Serag and Mason，N.Eng.J.Med.340：745-750，1999)。大多数HCC患者由于落后的预测而导致无法救治。尽管通过对发展中的HCC患者例行检查可以使某些患者获得延长的寿命，但还是有许多患者被诊断为晚期HCC而被剥夺生存(参见，例如，Yang等人，J.Cancer Res.Clin.Oncol.123：357-360，1997；Izzo等人，Ann.Surg.227：513-518，1998)。虽然一小部分HCC患者有资格进行外科手术介入治疗，但对于长期生存质量的提高是不大的。极端落后的HCC预测主要是由于手术切除后的高复发率，或者是由于门静脉的侵入发展成肝内次生肿瘤，或者是由于扩散到肝内的其他部位，然而肝外次生肿瘤的发生并不普遍(参见，例如，Genda等人，Hepatology 30：1027-1036，1999)。这些文献说明肝脏是HCC转移的主要靶器官。这已经在动物模型系统以及门静脉是转移HCC细胞发生肝内次生肿瘤的主要路线的患者中得到证实(参见，例如，Mitsunobu等人，Clin.Exp.Metastasis 14：520-529，1996)。HCC的专一特征强调发展一种精确的分子模拟模型的必要性，目的是为了对那些有肝内次生肿瘤的患者提供更好的诊断和治疗靶点。

近期研究主要集中在单个候选基因上(参见，例如，Osada等人，Hepatology24：1460-1467，1996；Guo等人，Hepatology 28：1481-1488，1998；Hui等人，Int.J.Cancer84：604-608，1999)。这可能没有足够精确地反映转移型HCC的生物学本质。微阵列技术提供了在全基因组中探寻疾病相关基因表达的契机(参见，例如，Schena等人，Science 270：467-470，1995)。在关于肿瘤的发展进程、预后结果或治疗后的反应方面，这条途径已经对多种人类恶性肿瘤进行了成功的分子分类(Alizadeh等人，Nature403：503-511，2000；Bittner等人，Nature 406：536-540，2000；Perou等人，Nature406：747-752，2000；Khan等人，Nat.Med.7：673-679，2001；Pomeroy等人，Nature 415：436-442，2002；Shipp等人，Nat.Med.8：68-74，2002)。多个报告已经涉及原发性HCC样本的基因表达谱(Okabe等人，Cancer Res.61：2129-2137，2001；Xu等人，Proc.Natl.Acad.Sci.U.S.A.98：15089-15094，2001)。然而，同转移型HCC患者预后特征相关的分子信号还不清楚。

使用基于cDNA微阵列的基因表达图谱，可研究同转移相关的所有改变。起初的目的是为了鉴定能区分原发性肿瘤和其匹配的肝内转移损伤的基因。已揭示，肝内转移损伤同原发性肿瘤是不可区分的，它与肿瘤大小、微囊化和患者的年龄无关，尽管没有原发性转移的HCC能同具有原发性转移HCC区分开来。以上资料说明，有助于肝内转移的变化是在原发性HCC中启动的。另外，一个起重要作用的基因即骨桥蛋白(一种分泌型磷蛋白)出现在HCC转移中。在体外，骨桥蛋白的过表达同原发性HCC相关，其中该原发性HCC具有转移潜能和侵入肝脏肿瘤衍生细胞系的能力，而且可中和骨桥蛋白的抗体能在体外有效阻断HCC细胞的侵入并且也能在体内阻断肺内HCC细胞的转移。这些研究明确了，骨桥蛋白既可作为用来确定HCC患者是否有转移潜能的分子标记物，也可作为治疗转移型HCC的一个潜在的治疗靶点。

类似的方法被用于开发基因表达预测模型，以便预测那些慢性肝病患者发展成HCC的可能性。将流行病学上高危患HCC的病人基因表达图谱同流行病学上低危患HCC的病人基因表达图谱相比较，可鉴别出细胞标记物，从而能够鉴别出慢性肝病会高危险地向HCC发展的病人。那些有严重肝脏疾病患者包括那些被诊断为乙型肝炎、丙肝、色素性肝硬变、威尔逊疾病、酒精肝、自身免疫性肝炎和原发性肝胆硬化的人。高危险诱发早期癌症的疾病有慢性乙肝、慢性病肝、色素性肝硬变和威尔逊病。低危险诱发为早期癌症的疾病有酒精肝、自身免疫性肝炎和原发性肝胆硬化。在严重肝病的患者体内发现的EpCAM基因已被证实，它与诱发高危险HCC有关。通过抑制EpCAM的表达，肝癌细胞的生长抑制现象已被观察到，由此确定了EpCAM在HCC发展中所起的重要作用，并且可作为阻止慢性肝病患者发展成为HCC的治疗靶点。

本发明的一个具体方面就是提供了一种方法，它将疑似有转移型HCC或者有发展成HCC潜能的患者体内的共调节基因进行聚类分析，从而形成基因表达图谱。该节提供了对共调节基因进行聚类分析的更为详细的论述。

I.DNA微阵列分析

A.通过聚类分析基因表达图谱的分类

对于本发明的许多应用，有必要发现共调节的基本基因在非转移型HCC样本、转移型HCC样本、高危发展中的HCC样本和低危发展中的HCC样本中的表达图谱。确定这些基本的基因表达图谱的优选例子涉及聚类算法(对于聚类算法的综述，可以参阅Fukunaga，1990，Statistical Pattern Recognition，2版.，Academic Press，San Diego；Everitt，1974，Cluster Analysis，London：Heinemann Educ.Books；Hartigan，1975，Clustering Algorithms，New York：Wiley；Sneath和Sokal，1973，Numerical Taxonomy，Freeman；Anderberg，1973，Cluster Analysis for Applications，Academic Press：NewYork)。

在一些使用聚类分析的例子中，在不同来源的生物样本中，大量基因的表达能被监测到。含基因表达测量值的数据表已用于聚类分析。聚类分析会在m×k维数的数据表上运算，其中m指条件或波动因素的总数，k是已测量的基因数量。

有许多聚类算法可用于聚类分析。当需要形成簇时，聚类算法会运用物体间的不相似性或距离。在一些例子中，多维空间中使用的距离指欧几里得距离(Euclideandistance)。欧几里得距离可以被平方，从而对分开更远的物体上设置逐渐增大的权重。或者，距离的量度标准可以是曼哈顿距离。在其他例子中，对数据表进行未监管分级聚类分析，可以使用CLUSTER或TREEVIEW软件(Eisen等人，Proc.Natl.Acad.Sci.USA，95：14863-14868，1998)来执行，这些软件是利用了中值中心关联和完全连锁。

各种不同的簇连锁(linkage)规则可用于本发明的方法。单连锁是一种最近相邻法，它测定两个最靠近的物体间的距离。相反，完全连锁方法是通过不同簇中任二个物体间的最大距离来确定距离。这个方法特别适用于基因或其他细胞组分构成天然不同的“聚丛(clump)”的情况。或者，未加权的配对-组别(pair-group)的均值，界定了两个不同簇中所有配对物体间的平均距离。在对基因或其他细胞成分进行聚类分析以形成自然不同的聚丛时，这方法也非常有用。最后，加权的配对-组别平均方法也可被使用。这种方法同未加权的配对-组别平均方法相同，不同点在于将各簇的大小用作权重。这种方法特别适用于簇大小可能有很大变化的情况。(Sneath和Sokal，1973，Numerical taxonomy，San Francisco.W.H.Freeman & Co.)。其他簇连锁规则，例如未加权的和加权的配对-组别矩心和Ward氏算法也可用于本发明的一些例子。可以参阅文献Ward，1963，J.Am.Stat Assn.58：236；Hartigan，1975，Clustering algorithms，NewYork：Wiley。

在一特别优选的例子中，使用的聚类分析为BRB-ArrayTools软件，这是由美国国家癌症研究所的生物统计研究分部开发的完整软件包，用于对cDNA微阵列基因表达数据进行可视化和统计分析，可用于无人监控的分析和监控的分析。基于单变量F检验的“类别比较工具(Class Comparison Tool)”可用于在显著性差异水平为P＜0.001或0.002的预定临床组别间寻找差异表达的基因。基于2000个随机的排列，F统计分析的排列分布状态也可用于确定统计学差异。通过使用2000个随机的P值小于0.001显著差异水平的排列，同时根据基因表达图谱，可使用具有“省略单因素(leave-one-out)”交叉确认测试的多变量复合共变预测工具(Compound Covariate Predictor，CCP)，对预定的临床组别进行分类。在每一交叉确认的步骤中，一个样本被省略，并且基于基因创建一个多变量CCP，其中所述基因是在由未被省略的样本所组成的训练组中，在特定水平下显著单变的基因。CCP被用于对省略后的样本分类，然后注明分类是正确还是错误。对于每次排除一个后的所有样本都要进行重复。总交叉确认的错误分类比率就这样被测定。交叉确认的错误分类比率在统计学上的显著性，通过对数据重复进行2000次的完整交叉确认程序来确定，其中分类成员是随机置换的。CCP建立在基因表达变量的加权线性组合基础上，其中所述变量在训练组中是显著单变的，其权重对应于t-统计，如Radmacher等人，Journal of Computational Biology(出版中)，2002中所述。聚类树输出的例子显示在图1和图3中(也可参阅下文的实施例1)。

基因表达谱可以基于树中许多更小的分支来定义，或者通过在不同水平上砍掉聚类树以许多更大的分支来定义。砍伐水平必须同所预期的不同临床组别数目相匹配。如果对于组别的数量而言仅有很少或没有在先信息，那么该聚类树应该被分成真实不同的许多分支。“真实不同”可用单分支间最小的距离值来定义。这个距离是连接两个分支的水平连线的纵坐标(参阅图1B)。典型值在0.2-0.4范围内，其中0是指完全关联，1是指零关联，但当训练集中良好数据较少或试验较少时，典型值可更大，或者当训练集中数据较好和试验较多时，典型值可更小。

更佳地，“真实不同”可用对聚类树中每一分叉的统计显著性的客观测试来定义。在本发明的一个方面，通过在预定显著性水平上，使用2000个随机置换，并用具有“省略单因素”交叉确认测试的复合共变预测工具，来定义客观测试。用CCP程序获得的牵引改进(tractional improvement)分布是在零假设理论(即特定分类是对或错)下对分布的评估值。

在本发明中聚类分析方法的另一方面是，提供了将基本载体的定义，用于在下文总所述的图谱规划。

B.谱的比对和分类

本发明的一个方面为提供了发现药物的方法。在一例子中，基因表达谱用聚类分析来定义。基因表达谱中的基因在感兴趣条件下被揭示是潜在共调节的。可进一步研究共调节基因是否涉及调节途径。鉴别出涉及调节途径的基因，可为设计和筛选新药提供有用信息。

在本发明的某些例子中，筛选候选药物用于治疗。在一个例子中，所期望的药物活性将能影响某个特定的遗传调节途径。在一个例子中，根据影响对应于调节途径的基因表达谱的能力，来筛选候选药物。在另一例子中，期望新药取代现存的药物。在一个例子中，候选药物的设计谱与现有药物相比较，以便确定哪个候选药物具有同现有药物相似的活性。

在某些例子中，本发明的方法被用于解释树形图和动力学。当受体被配体所激发(或阻断)时，下游通路的兴奋性可能会不同，这依赖于精确瞬时表达谱和配体与受体相互作用的分子结构域。不同配体导致不同效应的简单例子是表型差异，该差异产生于对激动剂、部分激动剂、反拮抗剂和拮抗剂的响应，而且预期该差异会产生于对共价键对非共价键的结合以及受体上不同分子区域的激活的响应。参阅Ross，Pharmacodynamics：Mechanisms of Drug Action and the Relationship between DrugConcentration and Effect in The Pharmacological Basis of Therapeutics(Gilman等人编辑，McGraw Hill，New York，1996)。图4A陈述了通路级联中两种可能的不同反应。

本发明的某些实施例中，像以OPN为配体的受体可以用本发明的设计方法进行研究，以便将观察到的瞬时反应简化为对应答基因作出的受体/配体作用。尤其在一些特别优选例中，发现了有关的基因表达谱和瞬时谱。大量基因的瞬时反应谱被投射(projected)到预定的基因表达谱，从而获得瞬时反应的规划谱。该规划过程简化了观察到的反应，因此不同的瞬时反应可以被更精确地检测和区分。

C.诊断应用的说明

本发明的一方面提供了诊断人类、动物和植物的疾病的方法。该方法同样可用于监测疾病发展的进程和治疗的有效性。

在本发明的一个实施例中，可对病人的细胞样本(如来自转移型HCC患者的患病组织的活检样本)进行大量的基因表达分析。根据基因表达谱的定义，该基因表达谱被规划成基因表达的表达值谱。把规划好的谱与含对照规划谱的对照数据库进行比对。如果在数据库中，患者的规划谱同癌症图谱匹配最佳，那么患者的病理组织被确诊为癌症。类似地，当最佳匹配是其他疾病的图谱，那就被确诊为该种疾病。

在另一实施例中，组织样本从患者的肿瘤组织中获得。对该组织样本进行大量相关基因表达分析。根据基因表达谱的定义，该基因表达谱被规划成基因表达的表达值谱。把规划好的谱与先前来自相同肿瘤的规划谱进行比对，以确定基因表达谱中的表达改变。用对照库来确定基因表达谱的改变是否预示着肿瘤发展(如转移)。类似的方法可用于确定其他疾病或紊乱的阶段。治疗中患者图谱中基因表达谱表达值的变化可用于监测治疗的有效性，例如，通过比较治疗前和治疗后的规划图谱。

D.分析试剂盒的实施

在优选例中，本发明的方法可以通过使用测定生物样本反应或状态的试剂盒来得以完成。这样的试剂盒含有微阵列，例如下面段落所述的微阵列(芯片)。在这些试剂盒中的芯片包括固相(例如一表面)，而探针杂交于或结合于固相的已知位置。较佳地，这些探针由已知的不同的核酸组成，而且每一个核酸能同来源于该核酸的RNA或cDNA分子杂交。特别地，本发明试剂盒中含有的探针是能特异性地杂交于源自RNA的核酸序列，其中已知该RNA的增加或减少对应于由本试剂盒测定活性的某特定蛋白的波动。本发明试剂盒中的探针宜基本上排除那些与无关RNA的杂交的核酸，对于由本试剂盒测定活性的某个特定蛋白(如骨桥蛋白)的波动，这些RNA不会增加。

在优选例中，本发明的试剂盒同时带有基因表达谱定义的数据库(如上述的数据库)、或允许远程网络计算机使用上述数据库的接入授权书。

在另一优选例上，本发明的试剂盒进一步包含用于表达图谱的规划和分析的软件，该软件能被下载到计算机系统的内存中，例如上面小节中所述的并在实施例1中阐述的那样。本发明试剂盒中的表达谱分析软件同上面实施例1中所述的表达谱分析软件本质上是等同的。

用于实施本发明的分析方法的其他试剂盒，对于本领域技术人员而言是显而易见的，因而被包括在所附的权利要求中。具体地，附随的权利要求用于包括用于执行本发明方法的、对本领域技术人员而言显而易见的其他程序结构。

E.测定生物反应图谱的方法

本发明利用了测定反应的能力，这些反应是生物体系针对大量不同波动而作出的。本节为测定生物反应提供了一些代表性方法。本领域技术人员会意识到，本发明不局限于下列特定的测定生物体系反应的方法。

1.利用DNA芯片进行转录分析

本发明特别适用于基因表达谱的分析。本发明一方面提供了基于基因表达关联性而确定共调节基因表达图谱的方法。本发明一些实施例基于对基因转录率的测量。

转录率可以通过核酸芯片或核酸模拟探针杂交技术而得到测定(如下一节所述)，或者通过其他基因表达技术而得到测定，例如在随后一节中所述的技术。然而，一旦被测定，结果要么是转录物的绝对量或相对量，要么是应答数据，包括表示RNA丰度率的数值，其中RNA丰度率经常用来反映DNA表达率(在没有RNA降解率的差异时)。

在本发明的各种不同实施例中，还可测定除了转录状态之外的生物状态方面如翻译状态，活性状态或混合状态。

较佳地，转录状态的测定可通过与DNA芯片杂交而获得，DNA芯片在本节被叙述。测定转录状态的某些其他方法将在该小节的后面叙述。

在优选例中，本发明使用了DNA芯片。DNA芯片可用于分析生物样本中的转录状态，而且尤其适合在暴露于各级梯度药物浓度下或在有关生物信号途径的梯度波动下，测定生物样本的转录状态。

在一个实施例中，DNA芯片的制备是通过将可检测的标记的寡核苷酸杂交于芯片，其中该寡核苷酸代表了存在于细胞中的mRNA转录本(如荧光标记的、从细胞总mRNA合成得来的cDNA)。芯片就是一个具有结合(如杂交)位点的有序阵列的表面，这些位点用于结合细胞或生物体基因组中大量基因，更佳地大部分或几乎全部基因的产物。芯片可以用许多方式制备，有几个将在下面叙述。然而，制备的芯片有一些优选特征：芯片有重现性，允许制备某个特定芯片的多个拷贝并且易于相互比较。优选的芯片是小型的，一般都小于5²cm，并且它们用在结合反应条件下(如核酸杂交)稳定的材料制成。芯片中某一结合位点或独特的结合位点集将会特异结合于细胞中单个基因的产物。尽管对于每个特定mRNA可有多个物理结合位点(后面称之为“位点”)，但为了便于清楚描述，下面论述会假定只有单个位点。

应理解，当和细胞RNA互补的cDNA被合成，并在适当的杂交条件下与微阵列(芯片)杂交时，芯片中对应于任一基因的位点的杂交水平，能反映出细胞内该基因转录的mRNA水平。比如，当可检测地标记的(如用荧光团)、与总细胞mRNA互补的cDNA和微阵列杂交时，阵列上对应于细胞内不转录的基因的位点(即能够与基因产物特异性结合)会信号很小或没有信号产生(如荧光信号)；而对于编码的mRNA广泛存在的基因，则可以产生较强的信号。

在优选例中，两种不同细胞的cDNA与微阵列的结合位点杂交。在药物反应中，一种生物样品与药物接触，同一类型的另一种生物样品不与药物接触。在通路反应中，一个细胞暴露于通路扰动，同一类型的另一个细胞不暴露于通路扰动。来自两种细胞的cDNA用不同方法标记，方便区分。在一个实施例中，比如，经一种药物处理(或暴露于通路扰动)的细胞的cDNA，用荧光素标记的dNTP合成；来自另一种未经药物处理的细胞的cDNA，则用若丹明标记物的dNTP合成。当两种cDNA混合并与微阵列杂交时，可测定阵列上每一位点的每种cDNA组的信号相对强度，从而检测特定mRNA丰度的相对差。

在上述的例子中，当荧光团被刺激时，药物处理过(或通路扰动的)的细胞的cDNA显绿色荧光，而未处理细胞的cDNA显红色荧光。结果是，当药物处理直接或间接地对细胞内某一特定mRNA的相对丰度无效时，此mRNA会同等分布在两种细胞中，并且一旦逆转录，红色标记的和绿色标记的cDNA会同等存在。当杂交于微阵列时，对应于该RNA的结合位点会发出两种荧光团特有的波长(并且组合后呈现棕色)。相反，当与药物接触的细胞是用一种可直接或间接增加细胞内mRNA水平的药物处理时，绿色荧光对红色荧光强度之比会增加。如果药物降低mRNA水平，该强度比会降低。

用双色荧光标记和检测方法以确定基因表达变化的方法，在例如Shena等人，″Quantitative monitoring of gene expression patterns with a complementary DNAmicroarray，″Science 270：467-470，1995中有描述，该文献在此全文引入作为参考。用两种不同荧光团标记的cDNA的优点在于，可得到对应于每种阵列基因mRNA水平的一个直接的内部对照比较值，而且试验条件(如杂交条件)微小差异所引起的变化不会影响随后的分析。但是应理解，可以使用单个细胞的cDNA，并比较例如在药物处理或通路扰动的细胞和未处理的细胞中特定mRNA的绝对数量。

2.微阵列的制备

微阵列(芯片)是本领域所熟知的，它含有一表面，在该表面上与基因产物(如cDNAs、mRNAs、cRNAs、多肽、及其片段)序列相应的探针特异性杂交于或结合于已知位点。在一个实施例中，微阵列是一种阵列(即矩阵)，其中每一位点代表一种基因编码的产物(如蛋白或RNA)的离散结合位点。同时，其中的结合位点代表了生物体基因组中大部分或几乎全部的基因产物。在一个优选实施例中，“结合位点”(下文的“位点”)是核酸或核酸类似物，它们能够和某一特定的同源cDNA特异性杂交。结合位点的核酸或类似物可以是，例如合成的寡聚物、全长cDNA、比全长短的cDNA、或基因片段。

尽管在优选例中，微阵列包括生物体靶基因组中所有或几乎所有基因产物的结合位点，都是这种全面性并不是必需的。通常，微阵列包含有基因组中至少50％左右，一般至少75％左右，更常见的至少85％左右，更普遍的至少90％左右，最普遍的至少99％左右的基因结合位点。微阵列宜有与药物或生物通路作用相关的基因结合位点。被鉴别为开放性阅读框(ORF)的“基因”宜含有至少50、75或99个氨基酸，并且其mRNA在生物体(例如，如果单细胞)或多细胞生物体的一些细胞中转录。基因组中的基因数目可以通过生物体表达的mRNA数量估计，或根据基因组已经充分研究的部分进行推断。当所研究的生物体基因组已被测序，ORFs的数量可以被确定并可通过分析DNA序列来确定mRNA编码区。比如，酿酒酵母的基因组已被完全测序，并报道约含有6275个长于99个氨基酸的开放性阅读框(ORFs)。对这些ORFs的分析显示5885个ORFs可能有蛋白产物(Goffeau等人，1996，Life with 6000 genes，Science274：546-567，该文献全文引入本文作为参考)。相对而言，人类基因组估计含有约5×10⁴个基因。

3.制备微阵列核酸

如上所述，一个与特定的同源cDNA特异性杂交的“结合位点”通常是附着在该结合位点上的核酸或核酸类似物。在一个实施例中，微阵列的结合位点是DNA多核苷酸，它对应于生物体基因组每个基因的至少一个片段。这些DNA可通过聚合酶链式反应(PCR)等对基因组DNA、cDNA(如通过RT-PCR)或克隆序列的扩增而获得。根据基因或cDNA的已知序列，选择PCR引物，从而扩增得到独特的片段(即，和阵列上的其它片段没有多于10个碱基的相同序列的片段)。可用计算机程序设计特异性引物和优化的扩增条件。参见如Oligo 5.0版(National Biosciences)。如果是很长的基因的结合位点，可以扩增基因近3′端的片段，这样当寡-dT引物cDNA探针与微阵列杂交时，短于全长的探针可有效结合。典型地，微阵列上每一个基因片段长度在50bp和2000bp之间，更典型地在100bp和1000bp之间，通常的长度为300bp和800bp之间。PCR的方法是熟知的，在如Innis等人编辑，1990，PCR Protocols：A Guide to Methods and Applications，Academic Press Inc.，San Diego，Calif.中有描述，该文献全文引用作为参考。很明显，计算机控制的自动系统可用于有效分离和扩增核酸。

合成微阵列核酸的另一方法是用N-膦酸酰或膦酸酰胺化学方法合成多核苷酸或寡聚核苷酸(Froehler等人，1986，Nucleic Acid，Res 14：5399-5407；McBride等人，1983，Tetrahedron Lett.24：245-248)。合成的序列长度约在15和500个碱基之间，较典型地在20和50个碱基之间。在一些实施例中，合成的核酸中含有非天然的碱基，如次黄苷。如上所述，核酸类似物可用作杂交的结合位点。一个合适的核酸类似物的例子是肽核酸(见Egholm等人，1993，PNA hybridizes to complementary oligonucleotides obeying theWatson-Crick hydrogen-bonding rules，Nature 365：566-568；也可参见美国专利No.5,539,083)。

在另一个实施例中，结合(杂交)位点来自基因的质粒或噬菌体克隆、cDNA(如表达序列标签)或其插入序列(Nguyen等人，1995，Differential gene expression in the murine thymusassayed by quantitative hybridization of arrayed cDNA clones，Genomics 29：207-209)。在另一实施例中，结合位点的多核苷酸是RNA。

4.核酸与固相表面的粘附

核酸或类似物附着在固相载体上，固相载体可以是用玻璃，塑料(如聚丙烯、尼龙)，聚丙烯酰胺，硝酸纤维素或其它材料制成。将核酸粘附到表面的一种优选的方法是影印到玻璃板上，如Schena等人，1995，Quantitative monitoring ofgene expressionpatterns with a complementary DNA microarray，Science 270：467-470中所描述的那样。此法特别适用于制备cDNA的微阵列。参见DeRisi等人，1996，Use of a cDNAmicroarray to analyze gene expression patterns in human cancer，Nature Genetics 14：457-460；Shalon等人，1996，A DNA microarray system for analyzing complex DNA samplesusing two-color fluorescent probe hybridization，Genome Res.6：639-645；以及Schena等人，1995，Parallel human genome analysis；microarray-based expression of 1000 genes，Proc.Natl.Acad.Sci.USA 93：10539-11286。

第二种制备微阵列的优选方法是制备高密度的寡聚核苷酸阵列。产生在限定位点上含成千上万种与确定序列互补的寡聚核苷酸的阵列的技术是熟知的，可用照相平版印刷法技术进行表面原位合成(见Fodor等人，1991，Light-directed spatiallyaddressable parallel chemical synthesis，Science 251：767-773；Pease等人，1994，Light-directed oligonucleotide arrays for rapid DNA序列analysis，Proc.Natl.Acad.Sci.USA91：5022-5026；Lockhart等人，1996，Expression monitoring by hybridization to high-density oligonucleotide arrays，Nature Biotech 14：1675；美国专利Nos.5,578,832；5,556,752；和5,510,270，每篇文献均全文引用作为参考)，也可用其它快速合成和沉积限定的寡聚核苷酸的方法(Blanchard等人，1996，High-Density，Oligonucleotide arrays，Biosensors & Bioelectronics 11：687-90)。当应用这些方法时，已知序列的寡聚核苷酸(如20-聚物)在表面(如一块衍生玻片)上直接合成。通常，产生的阵列包括针对每种靶转录子的多种探针。寡聚核苷酸探针可用于检测剪接mRNAs或作为各种不同类型的对照。

另一种制备微阵列的较佳方法是通过使用喷墨印刷过程在固相上直接合成寡聚核苷酸。

也可采用其它制备微阵列的方法，如掩模(Maskos和Southern，1992，Nuc.Acids Res.20：1679-1684)。理论上，任何类型的阵列，如尼龙杂交膜上的点杂交(见Sambrook andRussell，Molecular Cloning：A Laboratory Manual 3版，Cold Spring Harbor Laboratory，ColdSpring Harbor，N.Y.，2001)都可以采用。然而正如本领域技术人所认识的那样，非常小的芯片是优选的，因为杂交体积更小。

5.合成标记的探针

制备总RNA和聚(A)+RNA的方法是熟知的，在Sambrook等人(同上)中有描述。在一个实施例中，从本发明感兴趣的多种生物样品中抽提RNA，其中用硫氰酸胍裂解后用CsCl离心(Chirgwin等人，1979，Biochemistry 18：5294-5299)。或着，可以用TRIzol试剂(Life Technologies)，根据操作手册从样品中提取总RNA。Poly(A)+RNA用寡-dT纤维素选择(见Sambrook和Russell，同上)。有用的生物样品包括正常的肝样品、非癌变的肝样品以及来自确诊的临床样本的样品。

可用寡dT-引物或随机引物逆转录mRNA来制备标记的cDNA，这两种逆转录的方法都是熟知的(参见，如Klug和Berger，1987，Methods Enzymol.152：316-325)。逆转录可在有dNTP存在时进行，所用的dNTP和可检测的标记物连接，最好是荧光标记的dNTP。或着，单链mRNA可在标记的dNTPs存在的条件下经双链cDNA体外转录合成标记的反义RNA(Lockhart等人，1996，Expression monitoring by hybridization to high-density oligonucleotide arrays，Nature Biotech.14：1675，该文献全文引入作为参考)。在另一个实施例中，cDNA或RNA探针可在没有可检测标记物存在下合成，然后再标记，如通过结合生物素标记的dNTPs或rNTP，或用一些相似的方法(如将生物素的补骨脂素衍生物与RNA进行光交联)，然后加入标记的链亲和素(如偶连有藻红蛋白的链亲和素)或其等价物。

如果使用荧光标记的探针，有许多合适的荧光团是已知的，包括荧光素、丽丝胺若丹明、藻红蛋白、若丹明(Perkin ElmerCetus)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX(Amersham)等(参见，如Kricka，1992，Nonisotopic DNA Probe Techniques，Academic Press SanDiego，Calif.)。应理解，可选择有不同发射谱的荧光团，以便于区分。

在另一个实施例中，使用荧光标记物之外的标记物。比如，可使用放射性标记物、或有不同发射谱的一对放射性标记物(见Zhao等人，1995，High density cDNA filteranalysis：a novel approach for large-scale，quantitative analysis of gene expression，Gene156：207；Pietu等人，1996，Novel gene transcripts preferentially expressed in humanmuscles revealed by quantitative hybridization of a high density cDNA array，Genome Res.6：492)。但是，因为放射性微粒有散射因而需要间隔更大的结合位点，因此使用同位素标记物是次佳的实施例。

在一个实施例中，标记的cDNA在含有0.5mMdGTP，dATP，dCTP，0.1mM dTTP，荧光脱氧核苷酸(如，0.1mM若丹明110 UTP(Perken Elmer Cetus)或0.1mM Cy3 dUTP(Amersham))及逆转录酶(如SuperScriptTM II，LTIInc.)的混合物中，于42℃温育60分钟而得以合成。

6.与微阵列的杂交

选择优化的核酸杂交和洗涤条件，使得探针“特异性结合”或“特异性杂交”于特异的阵列位点，即探针杂交、连接或结合于互补核酸序列的序列阵列位点上，而不杂交于非互补核酸序列的位点。如本文所用，如果当两个多核苷酸中较短的那一个小于等于25个碱基时，在标准碱基配对原则下无错配，或如果大于25个碱基时，错配就不会超过5％，那么一个多核苷酸序列被认为和另一个是互补的。较佳地，寡核苷酸可以完全互补(没有错配)。很明显，通过使用含阴性对照的杂交分析，可以使特异性的杂交条件产生特异性杂交(参见，如Shalon等人，同上，以及Chee等人，同上)。

优化的杂交条件取决于标记探针和固定化多核苷酸或寡核苷酸的长度(如寡聚物对长度超过200碱基的多核苷酸)及类型(如RNA、DNA、PNA)。对于核酸的特异的(即严谨的)杂交条件的通用参数，在Sambrook等人，同上，和Ausubel等人，1987，CurrentProtocols in Molecular Biology，Greene Publishing and Wiley-Interscience，New York中有描述。若采用Schena等人的cDNA微阵列，典型的杂交条件是在5xSSC加0.2％SDS，65℃下杂交4小时，然后于25℃在低严谨的洗涤缓冲液中洗涤(1xSSC加0.2％SDS)，然后于25℃在高严谨的洗涤缓冲液中洗涤10分钟(0.1xSSC加0.2％SDS)(Shena等人，1996，Proc.Natl.Acad.Sci.USA，93：10614)。可用的杂交条件也可以参见如Tijessen，1993，Hybridization With Nucleic Acid Probes，Elsevier Science Publishers B.V.andKricka，1992，Nonisotopic DNA Probe Techniques，Academic Press San Diego，Calif。

7.信号检测和数据分析

若使用荧光标记的探针，转录本阵列的每一个位点上的荧光发射都可在共聚焦激光显微镜下观察到。荧光强度最好用Axon GenePix 4000扫描仪测量。在一个实施例中，使用适当的激发光对两个荧光团各进行一次独立的扫描。或者，可以使用一道激光在两种荧光团特定的波长下使样本同时发光，并且同时分析两个荧光团的发射(见Shalon等人，1996，A DNA microarray system for analyzing complex DNA samples usingtwo-color fluorescent probe hybridization，Genome Research 6：639-645，该文献全文引入作为参考)。在一个较佳实施例中，阵列使用一个带有计算机控制的X-Y坐标和一个显微镜物镜的激光荧光扫描仪进行扫描。两个荧光团用多线混合气体激光连续激发，发射的光按波长分离并由双光电倍增管检测。荧光激光扫描装置在Schena等人，1996，Genome Res.6：639-645及其所引参考文献中有描述。或者，Ferguson等人，1996，NatureBiotech.14：1681-1684中描述的光纤维束也可用于对大量的位点同时检测mRNA丰度水平。

信号被记录，并且在优选例中由计算机分析，如使用12比特模拟器至数字板。在一个实施例中，扫描的图像用图像程序(如Hijaak Graphics Suite)进行去斑点，然后用图像绘格程序分析建立一张各位点各波长的平均杂交数据表。如果必要，可以通过实验测定建立两个荧光通路间的“交叉对话”(或重叠)的修正。在一个较佳的实施例中，荧光强度可以通过GenePix Pro 3.0软件去掉背景信号，然后分析。然后基于通路强度、点的大小和“标志”(丢失的数据)，对表达数据进行过滤，并对每个阵列的所有基因计算Cy5/Cy3比值并以中值为中心对比值进行归一化。对转录物阵列的任一特定的杂交位点，可以计算两种荧光团的发射比。比值不依赖于同源基因的绝对表达水平，但是对那些表达受到给药、基因缺失或其他任何事件明显调控的基因很有用。

根据本发明的方法，两个生物样品中的某个mRNA的相对丰度可以作为扰动及扰动程度的评分(即mRNA在两种测试源中的浓度是不同的)，或认为没有扰动(即，相对浓度相等)。在不同的实施例中，两个RNA源在至少一个因素上相差至少约25％(一种来源的RNA的丰度比另一种来源的RNA丰度多25％)，更通常约有50％，更通常该因素甚至相差约2倍(两倍丰度)，3倍(3倍丰度)或5倍(5倍丰度)时，该差异被评为扰动。

较佳地，除了鉴定扰动是阳性还是阴性之外，测定扰动的大小是有利的。这可如上所述进行，如通过计算出用于差异标记的两种荧光团之间的发射比，或通过本领域技术人员显而易见的类似的方法。

8.通路反应和基因表达谱

在本发明的一个实施例中，通过观察临床感兴趣样品的基因表达谱测定基因表达谱。在本发明的一个实施例中，通过将两种不同标记的探针混合物与微阵列杂交，可建立反映感兴趣生物样品转录状态的DNA微阵列，其中每一种探针对应一种临床感兴趣的样品或标准样品的mRNA。根据本发明，两种样品是同一种类的，即同一品系和组织类型的，但在临床诊断上可不同。那些表达高度相关的基因可属于同一种基因表达谱。

此外，为降低实验误差，最好在双色差异杂交实验中交换两种荧光标记物以降低对各个基因或阵列位点的偏差。换言之，最好先用一种标记方法测量两种被测细胞的mRNA基因表达(即，用一种荧光团标记被扰动的细胞，用第二种荧光团标记未被扰动的细胞)，然后用相反的标记法测量两种细胞的基因表达(即，用第二种荧光团标记被扰动的细胞，用第一种荧光团标记未被扰动的细胞)。超过曝光水平和扰动对照参数水平的多个测量值，可提供额外的实验误差对照。如果充分取样，当选择仿样函数S的宽度(用于在反应函数中于平均误差和结构丢失之间内插反应数据)时，就可实现交换。

9.转录状态测量的其它方法

细胞的转录状态可以通过其它基因表达技术测量。这些技术中的一些产生许多有限复杂度的限制性片段用于电泳分析，如双限制酶消化和阶段引物相结合的方法(参见，如欧洲专利0534858 A1，1992年9月24日由Zabeau等人申请)，或选择位点最接近所述mRNA末端的限制性片段的方法(参见，如Prashar等人，1996，Proc.Natl.Acad.Sci.USA93：659-663)。其他的方法可对cDNA池进行统计学取样，如通过对每个cDNA测定足够多的碱基(如，20-50个碱基)来确定每一个cDNA，或测短标签的序列(如9-10个碱基)，其中该标签是在相对于某一mRNA末端的已知位点产生的(参见，如Velculescu，1995，Science 270：484-487)。

10.生物状态的其他方面的测定

在本发明的多个实施例中，可测定除了转录状态外生物状态，如翻译状态、活性状态或组合，以便获得对药物和通路的反应。这些实施例的细节在下文有描述。

11.转录状态测量的实施例

转录状态的测量可根据多种方法进行。比如，对蛋白的全基因组监测(即，“蛋白组”，Goffeau等人，同上)可以通过构建微阵列而实现，其中的结合位点包括固定化的、对细胞基因组所编码的众多蛋白有特异性的抗体(优选单克隆抗体)。较佳地，存在的抗体可针对编码蛋白的大部分，或至少针对那些与感兴趣药物相关的蛋白。制备单抗的方法是熟知的(参见，如Harlow和Lane，1988，Antibodies：A Laboratory Manual，Cold Spring Harbor，N.Y.该文献全文引入作为参考)。在一个较佳的实施例中，根据细胞的基因组序列设计合成肽段，并产生抗这些肽段的单克隆抗体。用这样的抗体阵列，将细胞蛋白与阵列接触，就可用本领域已知的分析方法来分析它们的结合情况。

或者，蛋白可以通过二维凝胶电泳体系分离。二维凝胶电泳本领域中是熟知的。典型的二维凝胶电泳包括沿着第一维的等电聚焦，然后沿第二维的SDS-PAGE电泳。参见，如Hames等人，1990，Gel Electrophoresis of Proteins：A Practical Approach，IRL Press，NewYork；Shevchenko等人，1996，Proc.Nat′l Acad.Sci.USA93：1440-1445；Sagliocco等人，1996，Yeast 12：1519-1533；Lander，1996，Science 274：536-539。形成的电泳图谱可通过多种技术分析，包括质谱技术、用单抗和多抗进行蛋白质印迹和免疫印迹分析，以及内部和N-末端微测序。应用这些技术，可以鉴定在给定物理条件下产生的所有蛋白的大片段，包括在和药物接触的细胞中(如在酵母中)、或通过缺失或过表达特定基因而修饰的细胞中产生的所有蛋白的大片段。

12.基于生物状态其它方面的实施例

尽管本发明的方法是通过基因表达模式的例子进行阐述的，但是本发明的方法可用于任何能够被监测的细胞成分。

具体地，在与某种扰动有关的蛋白活性(如药物作用)可被测定时，本发明的实施例就可以建立在这些测量的基础上。活性测定可以通过任何适用于所测活性的功能的，生化的或物理的方法来进行。当活性包括化学变化时，细胞蛋白能与天然底物接触然后测定变化率。当活性包括多聚单元间的结合时，如活化的DNA结合复合物与DNA之间的结合，可以测量结合蛋白的数量或测量结合后引发的二级结果，如转录的mRNA数量。如果只有一种功能活性是已知的(如在细胞周期调控中)，那么可以观察功能的行为表现。无论是已知的还是测定的，蛋白活性的变化可构成反应数据，而这些数据可通过本发明所述的方法进行分析。

在另一非限制性的实施例中，反应数据可以是细胞生物状态的混合因素构成。反应数据可以包括如某种mRNA丰度的变化、某种蛋白丰度的变化和某种蛋白活性的变化。

II.蛋白组分析

在另一方面，本发明提供了检测标记物的方法，这些标记物差异存在于转移性HCC肿瘤样品或有HCC易感性病人(即，极易发展为HCC但还未发现肿瘤的病人)的组织样品中。这些标记物可以在多种生物样品中检测到。样品最好是生物组织样品的裂解物。

任何适当的方法都可用来检测一种或多种本文中所述的标记物。例如，可用气相离子光谱测定法。这个技术包括，如激光解吸/电离质谱测定法。较佳地，样品在气相离子光谱测定法之前制备，如通过预分级分离、二维凝胶层析、高效液相层析等，以便有助于检测标记物。可用气相离子光谱测定法之外的方法检测标记物。例如，应用免疫分析法监测样品中的标记物。这些检测方法在下文中有详细描述。

A.气相离子光谱测定法

生物样品中的标记物可以用气相离子光谱测定法检测(质谱法更佳)。在一个实施例中，可以应用基质辅助激光解吸/电离(“MALDI”)质谱测定法。在另一个实施例中，可以应用表面增强激光解吸/电离(“SELDI”)质谱测定法。

1.气相离子光谱测定前的样品制备

可用一种或联用多种本领域熟知的标准技术来制备样品，以进一步协助对样品中标记物的监测和鉴定。比如，在气相离子光谱测定分析法之前，可以用一种或多种以下的方法将样品分级分离得到较小的复合物样品：大小排阻层析、阴离子交换层析、亲和层析、顺序提取、凝胶电泳、高效液相层析(HPLC)。

标记物也可以在分析前经过修饰提高其分辨率或确定其身份。比如，在分析前可将标记物蛋白水解消化。用适当的蛋白酶(如胰酶)消化得到的片段可以作为标记物的指纹，可以实现对它们的间接检测。

2.样品与一种底物接触后进行气相离子光谱测定法分析

生物样品可与底物接触，如适用于气相离子光谱测定仪的光谱测定探针。或者，底物可以是一种独立的材料，它可以放在适用于气相离子光谱测定仪的光谱测定探针上。

光谱测定仪探针可以是任何适当的形状，只要它可以在气相离子光谱测定仪上使用(如，可移除地插入气相离子光谱测定仪)。光谱测定仪探针底物可以用任何适当的固体的或多孔的材料制成。适用于本发明的实施例的光谱测定仪探针在如美国专利No.5,617,060(Hutchens和Yip)以及WO 98/59360(Hutchens和Yip)中有描述。

如果样品的复杂性已经像上文所说的被充分降低了，样品可以和任何气相离子光谱测定仪适用的底物接触。在进行气相离子光谱测定分析前，在底物表面的标记物上一般会使用一种能量吸收分子(“EAM”)或基质材料。能量吸收分子和含有标记物的样品可以在任何适当的状态下接触。

样品的复杂性可以用底物进一步降低，这种底物含有能够与一种或多种标记物结合的吸附剂。结合标记物的吸附剂可以任何适当的方式(如连续的或不连续的方式)应用于底物，样品也可以与含有吸附剂的底物在任何适当的状态下接触，如水浴、浸透、浸渍、喷射、溅泼或移液等。接触后，最好洗去底物表面未结合的物质，从而使底物表面只留下结合的物质。

3.解吸/电离和检测

底物表面的标记物可以在气相离子光谱测定术中去吸附并电离。任何适当的气相离子光谱测定仪都能使用，只要它可以使底物上的标记物解离。气相离子光谱测定仪最好可以对标记物定量分析。在一个实施例中，气相离子光谱测定仪是质谱仪，最好是激光解吸飞行时间质谱仪。在另一个实施例中，可用离子扩散光谱测定仪检测标记物。在另一个实施例中，总电子流测量装置可用于检测和鉴定标记物。

4.数据分析

通过解吸和检测标记物得到的数据可用任何适当的方法分析。在一个实施例中，用一个可编程的数字式计算机分析数据组。计算机程序一般包括一个可读媒体，用来存储代码。某些代码专用于记忆，其中包括光谱测定仪探针上每一个特性位点，在这个特征位点的吸附剂的种类和洗脱吸附物的洗脱条件。计算机同时包括这些代码，它们作为输入的数据。各个分子团的信号强度来自探针上特定的可寻址部位。这些数据表示被检测标记物的数量，包括每个标记物生成的信号的强度。

数据分析可包括以下步骤，测定被测标记物的信号强度(如峰值)和除去偏离预设统计分布的数据。观察的峰值归一化，这是相对于某一参照来计算每一个峰高度的过程。比如，参照可以是仪器和化学物质(如吸收能量的分子)所产生的背景噪音，一般设为零。然后，探测到的每个标记物或其它生物分子的信号强度在所需刻度(如100)上以相对强度表示。或者，针对样品设一个标准(如血清蛋白)，标准峰可作为参考计算每个被检测标记物或其他标记物的相对信号强度。

计算机可以将得到的数据转化为不同的显示格式。在一种称为“光谱图像或保留图谱”的格式中，可以显示标准的图谱，其中图像表明了到达探头的在每一个特定的分子量的标记物的数量。在另一称为“峰图谱”的格式中，光谱图像仅保留峰高和质量的有关信息，形成的图像比较简单明了，可更容易分辨分子量接近的标记物。在另一称为“凝胶图像”的格式中，峰图谱的每一个质量在每一个峰高的基础上转化为灰度图像，看上去和电泳凝胶上的条带相似。在另一称为“三维重叠”的格式中，可将几个光谱图重叠以比较它们在相对峰高度的微小差别。在另一称为“差异图谱”的格式中，可以比较两个或更多的波谱，更突出了不同的标记物和样品之间被上调或下调的标记物。任何两个样品的标记物模式(波谱)可以进行宏观地比较。在另一个格式中，可采用点火分散图(Spotfire Scatter Plot)，其中被测的标记物在图中以点标出，其中图的一个轴代表被测标记物的表观分子，另一个轴代表被测标记物的信号强度。每一个生物样品的被测标记物和样品中标记物的数量都保存在计算机可读介质中。这些数据可以与对照比较(如在对照中检测到的标记物图谱或数量，例如样品还未检测出的转移性HCC或HCC易感性的病人)。

预测HCC患者的转移可能性或者有慢性肝病患者发展为HCC的可能性的方法，可以通过具有处理数据集的数字计算机执行代码来具体实现，而该数据集是来源于与患者样本接触后的芯片信号。代码通过数字计算机执行的目的是为了创建分析模型。该代码可以以任何适宜的电脑编程语言来书写，这些编程语言有Visual Basic，Fortran，C，C⁺⁺等。数字计算机可以是使用任一标准或专业化操作系统，如基于Windows的操作系统的、微型的、迷你型或大型的计算机。标准PC(个人电脑)可以按照本发明的实施例来执行分析方法。

B.通过免疫分析来测定

免疫分析可被用来检测和分析样本中的标记物。这个方法由以下组成：(a)提供能特异结合于标记物的抗体；(b)将抗体和样本接触；和(c)检测样本中结合于标记物的抗体复合物的存在与否。

制备能与细胞标记物发生特异反应的多克隆和单克隆抗体的方法，是本领域技术人员已知的。参阅文献Coligan，Current Protocols in Immunology(1991)；Harlow &Lane，Antibodies：A Laboratory Manual(1988)；Goding，Monoclonal Antibodies：Principles and Practice(2d ed.1986)；以及Kohler & Milstein，Nature 256：495-497(1975)。例如，为了制备多抗，将已纯化的靶蛋白同佐剂相混合，然后用来免疫动物。当高滴度的靶蛋白抗体产生后，从动物收集血液，制备抗血清用于免疫分析。为制备单抗，将用靶蛋白免疫的动物脾细胞制成无限繁殖系，这通常通过与骨髓瘤细胞融合(参阅，Kohler和Milstein，Eur.J.Immunol.，6：511-519，1976)。根据是否产生对靶蛋白有预期特异性和亲和性的抗体，对由单个永久细胞所产生的细胞克隆进行筛选。

如果标记物不是数据库中已知蛋白，即使只有标记物的一部分，可用该知识来确定核酸和氨基酸序列。例如，基于标记物N端氨基酸的序列，来制备简并的探针。然后用这些探针来筛选基因组或cDNA文库，其中该文库是用起初检测到标记物的样本创建的。使用已知的技术，阳性克隆可被鉴定、扩增，而且其重组DNA序列可被亚克隆。参阅，例如，Ausubel等人，Current Protocols for Molecular Biology，1994 andSambrook and Russell，同上。基于编码标记物的寡核苷酸，抗标记物的抗体可用本领域已知的任何合适方法制备。参阅例如，Huse等人，Science 246：1275-1281(1989)；Ward等人，Nature 341：544-546(1989).

提供了抗体后，标记物可以用合适的免疫结合技术进行检测和/或定量(参见，例如，美国专利No.4,366,241；4,376,110；4,517,288；和4,837,168)。可用的分析包括：如酶免疫分析(EIA)像酶联免疫吸收分析(ELISA)、反射性免疫分析(RIA)、Western印迹分析、狭缝斑点分析。这些方法在Methods in Cell Biology：Antibodies in Cell Biology，vol 37(Asai编辑.1993)；Basic and Clinical Immunology(Stites & Terr，eds.，7th ed.1991)；和Harlow & Lane(同上)中有叙述。

C、转移型HCC或HCC易感性的诊断

另一方面，本发明提供了一种方法，该方法通过使用表2-7中已鉴定的一个或多个标记物，对HCC患者发展为转移型肿瘤可能性或慢性肝病患者转变为HCC趋势作出诊断。尽管少到只有一个从表2-7标记物中选出的标记物，也能作出正确的诊断，但是优选使用多个标记物，因为多标记物可以获得更多可靠的结果。较佳地，表2中至少10个细胞标记物被包含在标记物集中，并用于预测HCC患者的转移可能性，例如更佳地表2中至少15个、20个、25个、30个、40个、50个、60个、70个、80个90个或100个，甚至最优选的所有153个标记物被用作标记物。类似地，更佳地表5中至少有15个、20个、25个、30个、40个、50个、60个、70个、80个90个或100个，甚至最优选的所有273个标记物被用作标记物，用于测定慢性肝病患者患HCC的风险。表2-7中已鉴定的标记物可单独使用，也可同表中其他表格中的标记物联用，或同完全不同的标记物联用，以便协助诊断患转移型HCC或慢性肝病患者发展为HCC的易感性。与非转移型HCC和无HCC易感性的患者组织样本相比，在转移型HCC样本或HCC易感性患者组织样本中，表2-7中的标记物是分别差别存在的。例如，与非转移型HCC和无HCC易感性的患者组织样本相比，一些标记物高水平表达于和/或较高频率出现于转移型HCC或HCC易感性患者组织样本中。因此，检测人体内一个或多个这样标记物，可提供了某人患转移型HCC或易患HCC的可能性方面的有用信息。

因此，发明的例子包括辅助分析诊断HCC转移可能性的方法，以及辅助分析诊断慢性肝病患者发展为HCC可能性的方法，其中该方法包括：(a)检测在样品中的至少一个标志物，该标志物选自表2-7已鉴定的标志物；(b)将一个或多个检测的标志物与转移性HCC的诊断或肝病患者发展为HCC的可能性相关联。该相关性可考虑与标志物的对照量(如非转移型HCC或无HCC易感性的个体)相比较时样品中的标记物数量。相关性可以考虑待检样品中标志物的出现与否和同一标志物在对照样品中检测频率。相关性可以兼顾这些因素，以便判断某人是否患转移性HCC和患可能发展为HCC的严重肝病。

用来检测标志物的合适样品可以从任一个体获得。较佳地，样品是从个体获得的肝组织样品。如果需要，样品可以按照上述方法制备以增强标志物的可检测性。

可以采用任何适当方法来检测样品中的标志物。比如，如上所述可以采用气相离子光谱测定法。应用这些方法，可以检测一个或多个标志物。较佳地，检测样品是否存在多个标志物。检测多个标志物而不是单个标志物的存在，能为诊断提供更多信息。明确地说，在一个样品中检测多个标志物可增加诊断中的真阳性和真阴性，同时将减少诊断中的假阳性和假阴性。

接着，标志物的检测结果与发展为转移型HCC的可能性相关联，或者与严重肝病患者发展为HCC易感性相关联。在某些例子中，仅检测标志物存在与否而不定量标志物数量就是有用的，并可与发展为转移型HCC或严重肝病患者发展为HCC的易感性的大概诊断结果相关联。

另外，检测标志物可包括定量标志物，并将标志物检测结果与发展为转移型HCC或严重肝病患者发展为HCC的易感性的大概诊断结果相关联。例如，已检测到转移型HCC患者中OPN水平增加。这样，如果某待检个体的标志物量高于正常量，那么该个体有高度可能性发展为转移型HCC或者对于严重肝病患者而言有发展为HCC的倾向。

当标志物被定量时，可与对照相比较。对照可以是，例如正常个体的类似样品中的标志物平均值，其中该正常个体无发展为转移型HCC的倾向，或对于慢性肝病患者而言无发展为HCC的倾向。对照组数量与待检样品数量在相同或基本相似的实验条件下测定。例如，如果待检样品为某个体的血清样品而且是采用特定的探针来检测某标志物的话，那么该标志物的对照数量优选应用同样的探针对患者的血清样本进行测定。较佳地，标志物的对照数量，是在大量的无HCC转移的正常个体的样品或无HCC易感性的个体的组织样品的基础上确定的，以便反映在该人群中标志物数量的变异。

计算机软件可以分析质谱测得的资料。该软件的代码可将质谱分析信号转变为计算机可读的形式。该软件还可包括代码，该代码用于应用算法来分析前述信号，以明确这个信号中是否代表了对应于本发明标志物或其他有用的标志物信号“峰”。该软件还可包括代码，该代码用于执行算法，从而将测试样品信号与“正常的”和转移型HCC或HCC易感性的严重肝疾病病人的典型信号特征进行比较，并确定在两个信号间的密切性。该软件还可包括代码，该代码提示待检样品最接近哪一种情况，并提供大概的诊断。

III.治疗靶点生物学活性的调节

骨桥蛋白(OPN)和EpCAM与HCC患者的转移和慢性肝病患者发展为HCC均呈正相关。因此，本发明的一个目的就是鉴别调节，尤其是抑制，OPN或EpCAM活性的化合物。

A.生物学功能的测定

OPN及其等位基因和多种变异物均是分泌性磷蛋白，其由SEQ ID NO：1编码而且其氨基酸序列示于SEQ ID NO：2。可采用多种体内和体外的方法来测定OPN多肽的功能、化学和物理作用，如测定受体结合(如与放射性受体结合)等，从而评价OPN多肽的活性。更下游的事件(如改变诸如细胞分裂、细胞分化等细胞事件)，也可用作间接表示OPN活性的改变。此外，这些方法可用来检测和筛选OPN活性的拮抗剂。拮抗剂可从基因角度改变OPN的形式，如蛋白质的显性阴性形式。这些OPN活性拮抗剂可用于治疗转移型HCC。

用于分析的OPN可选自有SEQ ID NO：2序列的多肽，或其保守修饰的变异体或片段。普遍地，氨基酸序列的相同性至少70％，任选地至少80％，或任选地至少90-95％。任选地，用于分析的多肽可包含OPN结构域，如受体结合域、胞外基质结合域等。OPN或它的结构域可共价结合于异源蛋白以形成用于本分析的嵌合蛋白。

采用如上所述的重组或天然的OPN多肽，可测试OPN活性的调节剂。这种蛋白质可以重组或天然的形式在细胞中表达、从细胞中分泌、在组织或动物中表达，并且被分离。例如，可使用肝脏切片、分离的肝细胞或转化的细胞。采用本文所述的一种体内或体外方法可检测对OPN的拮抗性。此外，在体外的液相或固相反应中可用OPN蛋白的受体结合域来检测受体结合。

受体与OPN、结构域或嵌合蛋白的结合，可在溶液中、双分子膜上、固相载体上、脂质单层上或小泡上测试。可应用光谱特性的变化(如荧光、吸光度、折射率)、流体(如形态)、层析或溶解特性来测试拮抗剂的结合情况。

用潜在的OPN抑制剂处理的样品或分析，通过与不含待检化合物的对照样品相比，来检验拮抗程度。对照样品(未用拮抗剂处理)被定为相对OPN活性值为100。当与对照相比，OPN活性值为约90％、任选地50％、任选地25-0％时，就认为实现了对OPN的拮抗。

在拮抗剂存在的情况下，可通过检测OPN与玻连蛋白受体的结合能力的变化，来评估OPN受体结合的改变。总之，待检化合物的范围为1pM到100mM。

待检化合物对多肽功能的影响可通过测量上述任一参数而测定。任何影响OPN活性的相应生理学变化，可用来评价待检化合物对本发明多肽的影响。当应用完整细胞或动物测定功能结果时，人们还可测量各种不同的效果，如已知和未知遗传标志物的转录变化(如Northern印迹)，如细胞代谢的变化(如细胞生长或pH变化)。

类似地，可在如上所述的相同原理和方法学的基础上监测EpCAM的生物学功能。例如，已知EpCAM在上皮源性细胞的粘附中发挥作用，其正常功能依靠其胞外和胞内结构域。因此，可基于诸如细胞聚集、与其已知的结合配对物的特异作用(如通过胞内结构域与肌动蛋白作用)以及信号转导的中断(已知这是EpCAM调节的)，来检测EpCAM的功能。各种不同的细胞事件可作为EpCAM的活性的指示物，并有助于筛选作为EpCAM拮抗剂的化合物。

A.拮抗剂

作为OPN或EpCAM拮抗剂而测试的化合物可以是任何小的化学物质，或生物物质，例如蛋白、糖、核酸或脂类。抗蛋白的不同抗体是可能的拮抗剂候选物。例如，许多单克隆抗体，如17-1A和GA733，已知道可以特异性地结合EpCAM，因而可通过恰当的分析来测试它们干扰EpCAM生物学功能的能力。

另外，拮抗剂可以是遗传上改变的OPN或EpCAM的形式，例如所谓的“显性阴性(dominant negative)”形式，一种无生物活性的形式，它通过竞争有限的结合伴侣来抑制野生型副本的正常功能。通常，测试化合物是化学小分子和肽。虽然化合物多溶解于水溶液或有机溶剂(特别是基于DMSO的)，但是基本上任何化合物可用作本发明分析方法中的潜在拮抗剂。通过检测过程自动化和为分析提供来自任何方便来源的化合物，本分析方法被设计成用于筛选大的化学库，通常分析是进行平行进行的(例如在自动检测中，在微孔滴定板上采用微孔滴定的格式)。应理解，有许多的化合物供应商，包括Sigma(St.Louis，MO)，Aldrich(St.Louis，MO)，Sigma-Aldrich(St.Louis，MO)，Fluka Chemika-BiochemicaAnalytika(Buchs Switzerland)等等。

在一个优选的实例中，高通量筛选的方法包括提供一个组合的化学库或肽库，该库包含大量的具有潜在治疗性的化合物(潜在的调节剂或配体化合物)。如本文所用，通过一种或多种分析方法筛选该“组合化学库”或“配体库”，从而鉴别出具有所需的特征活性的库成员(具体的化学种类或亚组)。这样鉴别出的化合物可作为常规的“先导化合物”，或者本身可用作潜在的或实际的治疗剂。

组合化学库是不同化合物的集成，可以是通过化学合成或生物合成，综合许多化学的“建筑砖块(building blocks)”，如试剂。例如，线性组合的化学库(如多肽库)，是对于给定的化合物长度(如多肽化合物的氨基酸数量)，通过在任一可能方向上组合一组化学建筑砖块(氨基酸)而形成的。通过化学建筑砖块的这种组合式混合，就可以合成上百万种化学化合物。

如何准备和筛选组合化学库，是本领域技术人员熟知的。这些组合化学库包括(但并不限于)多肽库(见美国专利5,010,175；Furka，Int.J.Pept.Prot.Res.37：487-493，1991；和Houghton等人，Nature 354：84-88，1991)。其它制造化学多样性库的化学方法也可以用。这些化学方法包括(但并不限于)：类肽(如：PCT出版物No.WO 91/19735)，编码的多肽(如：PCT出版物WO 93/20242)，随机的生物寡聚物(如：PCT出版物No.WO 92/00091)，苯并二氮类(如美国专利号5,288,514)，多样体(diversomer)例如乙内酰脲类，苯并二氮类和二肽类(Hobbs等人，Proc.Nat.Acad.Sci.USA 90：6909-6913，1993)，联乙烯多肽(Hagihara等人，J.Amer.Chem.Soc.114：6568，1992)，具有葡萄糖骨架的非肽类的多肽模拟物(Hirschmann等人，J.Amer.Chem.Soc.114：9217-9218，1992)，小化合物的模拟有机合成库(Chen等人，J.Amer.Chem.Soc.116：2661，1994)，寡聚氨基甲酸(Cho等人，Science 261：1303，1993)，和/或肽酰膦酸酯(Campbell等人，J.Org.Chem.59：658，1994)，核酸库(参见Ausubel，Berger和Sambrook，都同上)，肽核酸库(参见，例如，美国专利5,539,083)，抗体库(参见，例如，Vaughn等人，Nature Biotechnology，14(3)：309-314，1996和PCT/US96/10287)，碳水化合物库(参见，例如，Liang等人，Science 274：1520-1522，1996和美国专利5,593,853)，小有机分子库(参见，例如，苯并二氮，Baum C&EN，1月18日，p33，1993；类异戊二烯，美国专利5,569,588；噻唑和三聚噻唑，美国专利5,549,974；吡咯烷，美国专利5,525,735和5,519,134；吗啉化合物，美国专利5,506,337；苯并二氮，5,288,514，等等)。

制备组合库的设备已商品化了(参见，例如，357 MPS，390 MPS，Advanced Chem Tech，Louisville KY，Symphony，Rainin，Woburn，MA，433A Applied Biosystems，Foster City，CA，9050Plus，Millipore，Bedford，MA)。另外，许多组合库也已商品化了(参见，例如，ComGenex，Princeton，N.J.，Tripos，Inc.，St.Louis，MO，3D Pharmaceuticals，Exton，PA，Martek Biosciences，Columbia，MD，etc.)。

C.固态和可溶性的高通量分析

在一个实施例中，本发明提供了可溶性分析方法，其中使用分子，例如结构域(如受体结合结构域、胞外基质结合结构域等等)；共价连于异源蛋白以形成嵌合分子的结构域；OPN或EpCAM；或自然或重组表达OPN或EpCAM的细胞或组织。在另一实施例中，本发明提供了基于固相的高通量格式的体外分析方法，其中结构域、嵌合分子、OPN或EpCAM、或者表达OPN或EpCAM的细胞或组织，被附着于固相载体基质。

在本发明的高通量分析中，一天可以筛选高达数千个不同的拮抗剂。具体地，每个微孔滴定板的孔可以针对所选的潜在调节剂单独分析，或者，如果要考虑浓度或孵育时间的影响，每个调节剂可以用5-10个孔进行检测。因此，一个标准的微孔滴定板可以检测约100(如96)种调节剂。如果使用1536孔的板，那么一块板很容易分析100到1500个不同的化合物。如果使用本发明的整套系统，每天可能分析几块不同的板，可能筛选多达6,000-20,000个不同的化合物。最近，Caliper Technologies(Palo Alto，CA)公司已开发了试剂操作的微液方式。

感兴趣的分子可以直接或间接通过共价或非共价连接方式(如通过标签)而连于固相成分上。标签可以是各种不同的成分。通常，结合了标签的分子(标签结合体)被固定在固相载体上，而感兴趣的结合了标签的分子(如感兴趣的信号转导分子)通过与标签及标签结合物的相互作用而连于固相载体。

基于文献中充分描述的分子相互作用，可以使用许多种标签及其结合物。例如，当标签具有诸如生物素、蛋白A、或蛋白G等天然结合物时，它可以与合适的标签结合物(亲合素、链亲合素、中性亲合素、免疫球蛋白Fc段等等)偶联。用天然结合物(如生物素)偶联于分子的抗体，是供应充足的并且是合适的标签结合物；见SIGMA Immunochemicals1998目录(SIGMA，St.Louis MO)。

类似地，任何半抗原或抗原性化合物可用于与合适的抗体结合形成标签/标签结合物配对。数以千计的特异性抗体已经商品化，并且许多额外的抗体在文献中有描述。例如，在常用形式中，标签是第一抗体而标签结合物是识别第一抗体的二抗。除了抗体-抗原的相互作用之外，受体-配体间相互作用也适合作为标签和标签结合物对。例如，细胞膜受体结合剂和拮抗剂(例如细胞受体-配体相互作用，如转铁蛋白、c-kit、病毒受体配体、细胞因子受体、化学因子受体、白介素受体、免疫球蛋白受体和抗体、钙粘合素家族、整联蛋白家族、选择素家族等等；见例如，Pigott & Power，The Adhesion Molecule Facts Book I(1993))。同样地，毒素和毒液，病毒的抗原表位，激素(如鸦片、类固醇等等)，胞内受体(如介导不同小配体作用的受体，这些小配体包括类固醇、甲状腺激素、类维生素A和维生素D、多肽)，药物，植物凝集素，糖，核酸(线性或环状多聚物结构)，寡糖，蛋白，磷脂，和抗体都能够和各种不同的细胞受体相互作用。

合成的多聚物，如聚亚胺酯、聚酯、聚碳酯、聚尿素、聚酰胺、聚乙烯亚胺、聚硫化苯乙烯、聚硅氧烷、聚酰亚胺、和聚乙酸酯也可以形成合适的标签或标签结合物。许多标签/标签结合物配对也可用于本文所述的分析系统，这对于阅读了公开内容后的技术人员而言是显而易见的。

常用的连接体如肽、聚醚、和类似物也可以作为标签，并且包含多肽序列，如约5-200氨基酸的多聚甘氨酸序列。对本领域技术人员而言，这些柔性的连接体都是已知的。例如，聚(乙二醇)连接体可以从Shearwater Polymers，Inc.Huntsville，Alabama购得。这些连接物可任选地含有酰胺键、巯基键、或异功能键。

标签结合物可用已有的各种不同方法固定于固相基质上。通常，通过将全部或部分基质暴露于化学试剂而使固相基质衍生化或功能化，其中该化学试剂将化学基团固定于表面，而该化学基团可与标签结合物的一部分反应。例如，适合连接长链部分的基团包括胺、羟基、巯基、和羰基。氨基烷基硅烷和羟基烷基硅烷可用于活化多种表面，如玻璃表面。该种固相生物多聚物阵列的结构，在文献中有充分描述。见例如，Merrifield，J.Am.Chem.Soc.85：2149-2154(1963)(描述了固相合成诸如肽等物质)；Geysen等人，J.Immun.Meth.102：259-274(1987)(描述了在针尖上合成固相成分)；Frank & Doring，Tetrahedron44：60316040(1988)(描述了在赛璐珞片上合成不同的肽序列)；Fodor等人，Science，251：767-777(1991)；Sheldon等人，Clinical Chemistry 39(4)：718-719(1993)；和Kozal等人，Nature Medicine2(7)：753759(1996)(都描述了固定于固相基质的生物多聚物阵列)。将标签结合物固定于基质的非化学方法包括：加热、通过紫外线照射交联等等。

D.基于计算机的分析

另一种筛选调节OPN或EpCAM活性的化合物的方法是计算机辅助的药物设计，其中基于氨基酸序列产生的结构信息，利用计算机产生OPN或EpCAM的三维结构。输入的氨基酸序列直接地和积极地通过计算机程序已建立的算法，来产生二级、三级和四级蛋白质结构模型。然后，检查这些蛋白质结构，以确认具有结合活性的结构区域(如结合于配体)。这些区域被用于鉴别结合于蛋白质的配体。

通过在计算机系统中输入至少10个氨基酸残基或相应编码的OPN或EpCAM多肽的核酸序列，可产生蛋白质的三维结构模型。例如，OPN多肽的氨基酸序列或编码该多肽的核酸选自SEQ ID NO：1或2，及其保守性修饰形式。氨基酸序列表示了蛋白质的一级序列或亚序列，它编码了蛋白质的结构信息。由计算机键盘输入至少10个氨基酸序列残基(或编码10氨基酸的核苷酸序列)，计算机可读的介质包括(但不局限于)：电子存储介质(如磁盘、磁带、磁盒和芯片)，光学介质(如CD ROM)、因特网网站发布的信息、或通过RAM。然后，使用本领域技术人员已知的软件，通过计算机系统和氨基酸序列的相互作用，可产生蛋白质的三维结构模型。

氨基酸序列是一级结构，它编码了形成感兴趣蛋白的二级、三级和四级结构所需的信息。软件察看产生结构模型的由一级序列编码的某些参数。这些参数被称为“能量项”，主要包括静电势、疏水势、溶剂可达到的表面和氢键。二级能量项包括范德华力。生物分子形成的结构以累积形式减少能量项。因此，计算机程序可利用一级结构或氨基酸序列编码的能量项来产生二级结构模型。

然后，基于二级结构的能量项，形成由蛋白质二级结构所编码的三级结构。这时使用者可以输入额外的参数，例如蛋白是否是膜结合或可溶的、在体内的定位、细胞定位(如细胞质、表面、核)。这些变量结合二级结构的能量项可形成三级结构模型。在模拟三级结构时，计算机程序将二级结构的疏水性面相互匹配，将亲水性面相互匹配。

一旦产生化合物结构，蛋白配体结合区域可被计算机系统识别。潜在配体的三维结构可通过输入化合物的氨基酸或核苷酸序列或化学式而生成，如上所述。将该潜在配体的三维结构与OPN或EpCAM蛋白相比较，可确定出与OPN或EpCAM的结合的配体。蛋白和配体的亲和结合可用能量项来确定哪一种配体与蛋白结合的可能性更大。

计算机系统也被用于筛选OPN基因或EpCAM基因的突变体、多态性变异体、等位基因和种间同源物。这些突变体与病状或遗传特性有关。如上所述，基因芯片和相似的技术可以用来筛选突变体、多态性变异体、等位基因和种间同源物。一旦变异体被确认，可将诊断方法用于鉴别具有这种突变基因的病人。例如，鉴别突变的OPN基因包括接受输入的选自SEQ ID NO：1和2的第一氨基酸序列或编码OPN的核酸序列，及其保守性修饰形式。如上所述，将序列输入计算机系统。然后，将第一核酸或氨基酸序列与第二核酸或氨基酸序列相比较，其中第二序列与第一序列基本相同。如上所述，将第二序列输入计算机系统。一旦第一和第二序列被对照后，序列间不同的核苷酸或氨基酸就被确认。这些序列可表示OPN基因的等位差异，以及与病症和遗传特性有关的突变。同样的通用策略也可用于检测EpCAM变异体和突变体。

D.试剂盒

感兴趣蛋白及其同源物是确定拮抗剂的有效工具。例如，与OPN核酸特异杂交的OPN-特异性物质(如OPN探针和引物)，以及与OPN蛋白特异结合的OPN特异性物质(如OPN抗体)，可用于检测肝细胞表达、信号传导调节和HCC转移的诊断。相同的通用方法对EpCAM同样适用。

鉴定样本中是否存在OPN或EpCAM的多核苷酸的核酸分析技术包括本领域技术人员所熟知的许多技术，如Southern印迹分析、Northern印迹分析、点杂交、RNase保护、S1分析、扩增技术如PCR(含RT-PCR)、LCR、和原位杂交。在原位杂交中，例如，将目标核酸(如编码OPN的核酸)从胞内环境中释放出来，同时保持细胞形态用于随后的阐明和分析(见实施例1)。下列文章提供了原位杂交的综述：Singer等人，Biotechniques4：230-250(1986)；Haase等人，Methods in Virology，vol.VII，pp.189-226(1984)；和NucleicAcid Hybridization：A Practical Approach(Hames等人编.1987)。另外，OPN或EpCAM蛋白可以用前述各种不同的免疫分析技术检测。测试样品通常与阳性对照(如样品中含有重组的OPN或EpCAM)和阴性对照进行比较。

本发明还提供了用于筛选OPN或EpCAM调节剂的试剂盒。该试剂盒可以从很现成的材料和试剂来准备。例如，该试剂盒包含下列材料的一种或多种：OPN(或EpCAM)、试管、检测OPN(或EpCAM)活性的说明书。任选地，试剂盒可含有具生物活性的OPN(或EpCAM)。各种不同的试剂盒及其组分，可以按照使用者的不同需要和特殊需求的使用者来制备。

II抑制治疗靶点的表达

对HCC病人而言，另一种通过抑制OPN活性来抑制HCC转移的手段是抑制OPN的表达。同样，通过抑制EpCAM表达可以减缓慢性肝病患者发展为HCC。本领域技术人员熟知的各种不同方法，可用来特异性地抑制特定基因的表达。

A反义多核苷酸

反义技术已经是在方案中描述最广的、用于实现基因特异性失活的方法，并且是研究和诊断中的有用工具。例如，反义寡聚核苷酸能够高度特异性地抑制基因的表达，并经常作为生物科学的常规手段来阐明特定基因的功能。

反义多核苷酸的特异性和灵敏性使得其适合用于治疗途径。大量的美国专利和科学发表作品设计了利用反义多核苷酸作为治疗动物和人的治疗剂。参见，例如美国专利No.6,080,580；6,180,403；6,255,111；6,306,655；6,440,739；和6,524,854。一个反义多核苷酸包含一个与待失活的基因序列(如SEQ ID NO：1或SEQ ID NO：5)互补的序列，并且长度可以变化，如从小于10个核苷酸到大于100个核苷酸，能够安全有效地施用于对象(如人)。反义核苷酸可以是寡聚的或多聚的核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物。它可以由天然存在的核碱基、糖和共价的核苷间键合(骨架)，以及功能相似的非天然存在的寡核苷酸所构成。这些修饰的或替代的反义寡聚核苷酸常常比天然形式更优选，因为具有一些有利特性，如提高细胞的摄取、提高与靶核酸的亲和性，以及在核酸酶存在下提高稳定性。本发明的反义寡聚核苷酸也可以包括修饰后的骨架或非天然的核苷间的键合。优选的修饰后的寡聚核苷酸骨架包括：例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基膦酸酯和其他的烃基膦酸酯(包括包括3′-链烯基膦酸酯和手性膦酸酯)、次磷酸酯、氨基磷酸酯(包括3′-氨基磷酸酰胺和氨基烷基磷酰胺)、巯碳氨基磷酸酯、巯碳烷基膦酸酯、巯碳烷基磷酸三酯、和硼烷-磷酸酯，它们可具有正常3′-5′键合，2′-5′的类似键合，以及极性相反的键合，其中相邻核苷单元以3′-5′至5′-3′或2′-5′至5′-2′方式连接。同时也包括各种盐、混合盐，以及游离酸等形式。

另外，适用于本发明的反义核苷酸可对应于靶核酸(如OPN或EpCAM)的编码序列和非编码序列。

B.核酶

使用核酶可以减少感兴趣的基因(如OPN或EpCAM)的mRNA水平。核酶是有酶活性的RNA分子，能够以核苷酸序列特异方式切割或剪接其他独立的RNA分子。可用于本发明的核酶是一种具有催化或酶活性的RNA分子，其底物结合区与特定RNA靶目标(如OPN或EpCAM的mRNA)是互补的，并且具有在该靶目标中切割和/或剪接RNA的酶活性，从而抑制靶基因的表达。针对特定基因而设计和使用核酶的方法，对于本领域技术人员而言是已知的，并且在许多出版物中有阐述，包括美国专利No.6,069,007；6,107,027；6,225,291；6,307,041；6,482,803；和6,489,163。

C.小的抑制性RNA(siRNA)

另一种可减少目的mRNA和蛋白质水平的有用工具是小的抑制性RNA(siRNA)。siRNA分子是小的双链RNA分子，它可引起已知的RNA干扰过程，这是一种形式的序列特异性的基因失活。一种提出的RNA干扰机制假设，在mRNA和siRNA的反义链之间形成的短双链RNA，会激活依赖于ATP的mRNA分子剪切。Zamore等人，Cell101：25-33，2000。已表明，RNA干扰存在于哺乳类细胞系、卵母细胞、早期胚胎和某些细胞类型中。参见例如Elbashir，Sayda M.，等人，Nature 411：494-497，2001。siRNA编码序列可以基于靶基因序列(如OPN，或EpCAM)而设计，并且插入各种不同的合适载体(如质粒或病毒载体)，而这些载体具有正确放置的转录起始和终止元件。当用于所需的真核受体时，可使用真核的转录调控元件。用本领域技术人员熟知的转基因的通用方法，可将含siRNA的载体输送到所需的靶目标。因此，RNA干扰提供了另一种基于序列而特异性抑制基因表达的方法，即通过快速降解基因(如OPN或EpCAM)的mRNA。

D检测减少的靶基因表达

在服用了治疗性药物(其中该药物含有能抑制靶基因的表达(如OPN或EpCAM)表达的物质)之后，可通过比较服药前后靶基因的体内水平，评估治疗性药物的功效。后面的章节将阐述服用药物制剂的通用方法。

当在转录水平上抑制基因的表达(如减少靶基因的mRNA数量)时，可通过比较服用治疗性药物前后的靶基因(如OPN或EpCAM)的mRNA水平，如采用Northern印迹分析、点杂交、RT-PCR等等，从而确认靶基因的表达下降。进行这类分析的通用方法是本领域技术人员所熟知的，并且在许多文献中有阐述(见Sambrook和Russell，同上，以及Ausubel等人，同上)。

当在翻译水平抑制基因表达(如减少靶基因编码的蛋白量)时，可采用本领域专业人员熟知的各种测量组织样本中蛋白质水平的手段，来比较服用治疗性药物前后的靶基因(如OPN或EpCAM)编码的蛋白水平，从而确认靶基因的表达下降。如前所述，多种免疫分析方法可常规地用于检测感兴趣蛋白质(如OPN或EpCAM)的存在与否和数量。在Harlow和Lane，Antibodies，A Laboratory Manual，1988一书中对可用技术有全面的综述。

合适的抗靶蛋白(如OPN或EpCAM)的抗体是免疫分析所必需的。制备抗靶蛋白的特异性抗体的通用方法是本领域技术人员所熟知的，并且前面章节有描述。此外，已有一些具有所需特异性特异性的抗体用于免疫分析(如抗OPN或EpCAM的各种单克隆抗体)。

一旦得到靶蛋白(如OPN或EpCAM)的特异性抗体，病人的靶蛋白水平可以通过各种不同的免疫分析方法测定，从而为临床医生提供定性或定量的结果。病人的各种不同样品，如血液或肝组织，可以通过免疫分析按照前些章节描述的方法检测体内的靶蛋白水平。对于免疫学的和免疫分析方法的全面综述，可参见：Stites，同上；美国专利No.4,366,241；4,376,110；4,517,288；和4,837,168。

V.施用抑制靶蛋白活性的物质和药物组合物

抑制靶蛋白(如OPN或EpCAM)活性的物质可以直接施用于病人，从而调节体内的靶蛋白活性。给药方式可以是用于使拮抗剂或抑制剂化合物与待治疗组织最终接触的任何常用方法，例如通过舌或口。拮抗剂或抑制剂可以任选地与药学上可接受的载体一起，用任何合适的方式施用。诸如拮抗剂或抑制剂的合适的给药途径是本领域技术人员所熟知的，而且虽然对一特定组合物有多种给药途径，但是某一特定途径常常比其他途径提供更快速而有效的反应。

药学上可接受的载体，通常部分地由待施用的特定组合物以及施用该组合物的特定方法所决定。因此，本发明的药物组合物可以有各种不同的合适制剂(见RemingtonPharmaceutical Sciences，17版，1985)。

拮抗剂或抑制剂，单独地或与其他合适的组分一起，可以制成气雾剂制剂(即它们可以被喷雾化)，以便通过吸入而给药。气雾剂制剂可以置于加压的合适推进剂中，如二氯二氟甲烷、丙烷、氮气等等。

适合给药的制剂包含水性和非水性溶液，等渗的无菌溶液(它们可含有抗氧化剂、缓冲液、抑菌剂、和用于给制剂提供等渗性的溶质)，水性和非水性的无菌悬浮液(它们可含有混悬剂、增溶剂、增稠剂、稳定剂和防腐剂)。在本发明的实际应用中，组合物可通过口服、局部、静脉内、腹腔内、膀胱内或鞘内给药。任选地，组合物也可以通过口腔或鼻腔给药。化合物制剂可以存在于单剂量或多剂量的密封容器(如安瓿瓶、小瓶)中。溶液和悬浮液可以通过前述的无菌粉剂、颗粒剂、和片剂制备。调节剂也可以作为制备好的食物或药物的一部分而给药。

在本发明的上下文中，施用于病人的服药剂量应该足以在一段时间在该个体中产生有益效果。该剂量可由所采用的特定信号调节剂和个体状况(如体重或待治疗区域的表面积)所决定。剂量大小，还决定于将该特定化合物或载体施用于特定个体时所伴随的任何不利副反应的发生与否、性质和程度。

在确定病人服用拮抗剂和抑制剂的有效剂量时，可评估药物的血液循环情况、毒性以及是否产生抗该药物的抗体。一般地，对于典型个体而言，拮抗剂或抑制剂的剂量当量约为1ng/kg到10mg/kg。

对于给药，本发明的拮抗剂和抑制剂给药可以按测定的速率给药，该速率是由应用于个体的大部分和全身时的拮抗剂的LD₅₀和不同浓度下抑制剂的副反应所决定。给药可通过单剂量或分开剂量方式实现。

IV实例

这里所阐述的实施例和例子仅用于说明目的，各种修改或改变形式会提示给阅读了内容之后的本领域技术人员，因而这些修改或改变形式包括在本申请精神和范围之中，也包括在所附权利要求的范围之内。本文提及的所有出版物、专利和专利申请都毫无限制地全部引入本文作为参考。

A.实施例1：预测肝细胞癌(HCC)扩散的易感性

1.材料和方法

a)病人和组织样本

所有的HCC样品取自中国复旦大学附属中山医院肝癌研究所的知情同意的做过手术切除的病人。从中国复旦大学附属中山医院肝癌研究所(原上海医科大学)经过肝切除术且病理学诊断为HCC的40位病人中获得了107对原发性HCC、转移HCC和邻近的非肿瘤正常肝组织样品。手术前，所有病人均做了腹部CT和胸部X射线检查，部分患者根据需要还做了同位素扫描检查。在107对样本中，81对来自27位原发性HCC病人，包括相对应的相邻非肿瘤肝脏组织和转移HCC[15对存在肝内扩散(P组)，12对存在门静脉分支肿瘤血栓]，26对来自13位仅有原发性HCC的患者及其相对应的非肿瘤肝组织(在手术时没有可检测的转移)。肿瘤和非肿瘤组织在切除后切成小块，速冻于液氮中，贮藏在-70度直至使用前。我们用显微镜确认了肿瘤组织样品，其转移主要由癌细胞构成，而非肿瘤相邻肝脏样品中不存在任何入侵的癌细胞。40个病人中，男39人，女1人。病人年龄从36到74岁，中值为50岁。原发性HCC的直径大小范围从1.3-17.5cm，直径中值为7.2cm，其中65％(26/40)的直径大于5cm，其余的直径≤5cm。32个样本(80％)存在肝硬化。除一人外所有患者HBV阳性，但没有人HCV阳性。27名患者(68％)血液中甲胎蛋白浓度升高(AFP)(＞20ng/ml)。

b)RNA制备，cDNA点阵和杂交

参照制造商的说明，用TRIzol试剂(Life Technologies，Inc.)提取样品中总RNA。CDNA微阵列(芯片)是美国癌症研究所高级技术中心(NCI)制造的。每个阵列含有9180个cDNA克隆，其中有7102个已经命名的基因，1179个EST克隆，和122个Incyte的克隆。用直接标记法制备荧光标记的cDNA，cDNA微阵列的杂交基本上按照Wu等人，Oncogene20：3674-3682，2001中所述的方法。简而言之，荧光的靶物质按如下方法制备：采用SuperScript II逆转录酶(Life Technologies)，通过寡聚dT-引物聚合反应，将Cy3-偶联的脱氧核糖核酸(Amersham)标记到100μg非癌症肝脏组织的总RNA上，或将Cy5-偶联的脱氧核糖核酸(Amersham)标记到200μg原代的HCC或转移组织的总RNA上。将靶物质混合后加至微阵列中，42℃孵育过夜(12-16小时)。杂交之前，每个微阵列与含5×SSC，0.1％SDS和1％BSA的预杂交液在42℃预杂交至少1个小时。载玻片在室温分别用2xSSC，0.1％SDS和1xSSC和0.2xSSC各洗涤2min，然后用0.05xSSC洗涤1min。提到的绝大部分样品做双份。每个克隆的Cy3和Cy5荧光强度用Axon GenePix 4000扫描仪采集并且用GenePix Pro 3.0软件剔除背景信号。按照各通道的荧光强度、点大小和旗标(flag)过滤表达数据，然后计算Cy5/Cy3的比例，并且在每个芯片中通过以中值为中心的对数-比值(log-ratio)进行归一化处理。

c)数据分析和统计分析

利用CLUSTER和TREEVIEW软件，采用以中值为中心相关法和完全连锁法，进行无监督的分级聚类分析(Eisen等人，同上)。对于非监督和监督分析，我们还使用癌症研究所生物测量研究分公司(Biometric Research Branch of the National CancerInstitute)所开发的BEB-ArrayTools软件，这是用于对cDNA点阵基因表达数据进行可视化和统计分析的完整软件包。使用基于单变量F-测试的类别比较工具，在显著水平为P＜0.001或0.002的情况下，寻找预定临床组别之间差异表达的基因。基于2000个随机排列的F统计分析的排列分布状态，被用于证实统计的显著性。在比较同一病人的原发性至扩散性肿瘤时，以同样方法使用成对数值的t统计。通过使用2000个随机的P值小于0.001显著水平的排列，根据基因表达图谱，用具有“省略单因素(leave-one-out)”交叉确认测试的多变量复合共变预测工具(Compound Covariate Predictor，CCP)，对预定的临床组别进行分类。在每一交叉确认的步骤中，一个样本被省略，并且基于基因创建一个多变量CCP，其中所述基因是在由未被省略的样本所组成的训练组中，在特定水平下显著单变的基因。CCP被用于对省略后的样本分类，然后注明分类是正确还是错误。对于每次排除一个后的所有样本都要进行重复。总交叉确认的错误分类比率就这样被测定。交叉确认的错误分类比率在统计学上的显著性，通过对数据重复进行2000次的完整交叉确认程序来确定，其中分类成员是随机置换的。CCP建立在基因表达变量的加权线性组合基础上，其中所述变量在训练组中是显著单变的，其权重对应于t-统计，如Radmacher等人(同上)中所述。当CCP用于对成对的原发性和转移组织进行分类时，也进行交叉确认，其中每次省略一对数据，并且基于每个基因表达的成对差异进行分类。两个重复样本的基因表达均值被用于分析。

为产生用于对具有转移可能性的HCC进行分类的预测模型，我们随机选择10个PN样本和10个PT样本作为一个训练组。在测试组中总共包含20个双盲的新HCC样本。新样本分类基于下列线性组合的计算值：L＝∑_it_i*(x_i-m_i)，其中t_i＝分类中基因i的t值，x_i＝待分类的新样本中基因i的对数-比值，m_i＝基因I在PN和PT组的中值(见表2)。其他细节可在BRB-ArrayTools用户手册中找到。使用基于Excel的WinSTAT软件，通过Kaplan-Meier存活分析来比较病人的存活率。通过Cox-Mantel对数级测试，当PN与P或PT进行比较时得出统计P值。

d).半定量PT-PCR和Western印迹

总RNA用SUPERSCRIPT^TM II RNase H-逆转录酶和随机六聚体(Invitrogen Inc.)进行逆转录。PCR进行了26循环(94℃，30sec；53℃，30sec；72℃，1min)，随后是72℃，10分钟的一个额外循环，并采用下列引物：OPN正义5′-GACTCGAACGACTCTGATGATGTA-3′(SEQ ID NO：3)；OPN 反义5′-CTGGGCAACGGGGATGG-3′(SEQ ID NO：4)；以及HotStarTaq Master Mix(QLAGEN)试剂盒。Quantu mRNA ^TM 18S(Ambion)作为内部标准。OPN的定量采用密度测定法，用18S产物进行归一化。Western印迹分析基本上参照Wu等人，(同上)所述的方法。简而言之：用RIPA缓冲液(50mM Tris-HCl，pH7.4/150mM NaCl/1％ Triton X-100/1％去氧胆酸/1.0％ SDS/1％抑肽酶)从CCL13、SK-Hep-1和Hep3B细胞获得蛋白裂解液，用10％SDS-PAGE分离，转印到Immobilin-P膜(Millipore，Bedford，MA)，用大鼠的抗-OPN单克隆抗体(Chemicon International)检测，然后用基于ECL的测定(Amersham)显示。

e)细胞系和体外侵入分析

两种具有不同转移潜能的人肝癌细胞系SK-Hep-1和Hep3B，以及一个非转化性的肝细胞系CCL13(张氏肝细胞)，并用于确定OPN与转移可能性之间的功能相关性，其中按照制造商的说明使用BD BioCoat^TM Matrigel^TM侵入腔(BD Biosciences)参照产品说明。这些细胞来自美国典型培养物保藏中心。细胞常规地维持在37℃，5％ CO₂的潮湿环境中，用EMEM(GIBCOL)培养基，并补加了10％胎牛血清，1×非必须氨基酸，1×丙酮酸钠，2mM谷氨酸和青霉素/链霉素。对于侵入分析，将细胞放在含无血清EMEM的上层室中，并在使用或不用重组的鼠OPN(2μg/ml)(R&D Systems)或充分记载抗OPN的中和抗体(3μg/ml)(R&D Systems)情况下，孵育20小时。将含5％FBS的EMEM培养基加至下层室作为化学吸引剂。加入OPN或OPN抗体之前和之后，对侵入通过Matrigel^TM膜的细胞数目进行计数。

f)组织学分析

制备石蜡包埋的组织块，然后切成5微米厚的连续切片，并铺于带电荷的载玻片上。载玻片进行苏木精和伊红(H&E)染色。两个病理学家独立地进行组织学诊断性读片。对于免疫组织化学分析，对载玻片脱腊并进行免疫染色(按Forgues等人，J.Biol.Chem.276：22797-22803所述的方法)。简而言之，玻片在1x柠檬酸缓冲液，在微波炉中放置15分钟从而恢复抗原，然后用3％双氧水阻断内源性的过氧化物酶10分钟。接着用10％驴血清封闭非特异性结合，切片与鼠抗OPN抗体(Chemicon International)于4℃孵育过夜。使用生物素化的二抗和链亲和素过氧化物酶的复合物(ABC Elite kit，Vector Labs)。切片浸泡在3-3′二氨基联苯胺(DAB)溶液(0.25克/ml，并含3％过氧化氢酶)。玻片用Harris-苏木精复染并且用酒精到二甲苯脱水，用Permount(Sigma)封片。

2.结果

a)转移型肝损伤与其对应的原发性HCC无法辨别

为确定HCC转移过程中的精细改变，我们将个体的原发性HCC样品的基因表达图谱，与伴有匹配的转移损伤的肝内转移(P组)或门静脉肿瘤血栓(PT组)，即P-M或PT-M组，进行比较。同时比较了各样品相对应的非癌肝脏组织。最初，我们对50个来自30个患者随机抽样的原位的和转移的肿瘤样品进行了基因表达图谱比较[即10位无HCC转移患者(PN组)，10位PT患者和10位P患者]。我们试图用非监督的分级聚类算法将其分成临床组别，这些算法基于全表达相似性谱，其中使用全部的9180个基因，或者使用经基因筛选过滤器在排除了部分基因(这些基因与中值相比并不显著变化，p＜0.001)之后的大约2487个基因。然而，该聚类分析没有产生对应于临床分组的有意义的分组结果。类似地，我们使用107个基因也无法获得有意义的分组，这些基因是与中值相比基因表达比值变化大于2倍进行过滤而获得的。该分析结果意味着，原发性和转移的HCC只可通过较小的基因子集进行区分，而基因的聚类分析可能受许多其他基因变化的影响，从而妨碍了分类。

为研究这些微小差异，我们使用了监督的分类比较分析和单变量F-测试及全面的排列测试，来定义在预定临床组别中差异表达的基因。对5个临床组(即P，P-M，PT，PT-M和PN)的分析，得到了总计143个显著基因(P＜0.005)。基于143个显著基因的前三个主要组分的多维量表分析揭示，PN样品明显区别于其余样本，而P、P-M、PT、和PT-M样本是不可区分的(图1a)。意外的是，原发性的和匹配的转移HCC肿瘤的基因表达图谱不能显著地区分开来。

b)PN区别于PT和P

为了确认和拓展上述发现，我们对30个原代HCC样本(包括PN、PT和P病人)进行了类别比较分析。该分析产生了总共383个显著差异的基因(P＜0.0005)。基于这些383个基因的表达谱，通过分级聚类算法对这30个PN、P和PT样本进行分类(图1b)。在分级树上观察到两个主要分支，一个和PN样本有关，另一个与P和PT样本有关。P和PT样本没有完全分开(图1b)。因此，原发性的无转移HCC的基因表达谱，明显不同于在肝脏软组织的门静脉或其他地方有转移损伤的原发性HCC。

为进一步确定一个能够被准确区分成两个预定类别的基因集和为了鉴别转移相关基因，我们使用监督的机器学习分类算法，即已知的复合相关预测法(CCP)，该算法包含“省略单因素”的交叉验证测试，以避免过度评价预测的精确性这一统计学问题，该问题在模型是用相同样本训练和评价时会发生。这种分析也产生多变量预测值，该预测值用于决定某一给定样本到底属于这两类中的那一类，还产生了在给定统计显著性水平下呈现单变量显著的基因列表。我们使用整个基因集并且P值＜0.001，将来自30个病人的50个HCC样本按照不同的临床标准分成不同的配对，并将CCP用于每一配对(表1)。在此显著性水平下，在分类中期望的假阳性基因数目小于10。错误分类比率通过“省略单因素”的交叉验证法加以确认。对于交叉验证的每一步骤(其中省略一个样本)，重复选择有信息的基因和产生多基因分类。对于随机获得小的交叉验证的错误分类比率的概率，可通过重复整个交叉验证过程而得出，其中使用2000个随机排列的类别标志用于被评估的临床标准。这样得出了分类P值(表1)。采用监督机器学习分类算法，我们在PT和PT-M样本之间没有发现显著性差异(表1)。P和PT样本的基因表达图谱和配对的转移性P-M和PT-M样本几乎相同(表1)。在这些基因分类中的基因数目处于背景(假阳性)水平。这些数据与前述聚类和多维量表分析(multidimensional scaling analysis)是一致。

相反，我们用分类器中的153个显著基因准确地从PN和PT样本中预测了肿瘤(100％)(表2)。交叉验证法的分类误差远小于随机预测(p＜0.005)(表1)。相似地，我们用分类器中大量基因准确地预测了PN和P样品，以及PN和P/PT样本(表1)。然而，CCP没有在P、PT、PT-M和P-M中产生显著分类，在这些分类中的基因数目是不显著的。另外，我们发现，当肿瘤大小、年龄、肿瘤包裹性、或肝硬化等被用作临床分类时，并无统计上显著的分类。这些数值与类别比较分析(包括多维量表分析和分级聚类算法分析)的结果是一致的。我们认为，原发性和转移性肿瘤有非常相似的基因表达特征，而无转移的原发性HCC肿瘤可区别于伴有门静脉肿瘤血栓或肝内扩散的原发性HCC。

表1.在“省略单因素”的交叉验证过程中分类器(classifier)的性能^*

分类器类别^**	临床分组	病例总数	错误分类的病例数	分类器的P值	在分类器中的基因数
分类器类别^**	临床分组	病例总数	错误分类的病例数	分类器的P值	在分类器中的基因数	PN vs.PTPN vs.PPN vs.P/PTP vs.PTPT vs.PT-MP/PT vs.P-M/PT-MP vs.PT-MPT vs.P-M肿瘤大小年龄肿瘤包裹性肝硬化	PNPTPNPPNP和PTPPT配对样本配对样本PPT-MPTP-M＞5cm≤5cm＞45岁≤45岁有无有无	101010101020101010201010101016141713921146	0010203435432474572476	＜0.0005＜0.0005＜0.0010.2160.2960.1320.2480.1630.2340.3340.0370.798	153157256201714974131

^*用复合变量预测子和总共9180个基因表达数据，进行不同的临床组的分类，显著性差异水平P＝0.001。分类器基于2000个随机排列。分类器中假阳性基因的期望数为10。

^**PN，单个原发性HCC；PT，有门静脉肿瘤血栓的原发性HCC；PT-M，来自配对PT的肿瘤血栓；P，有肝内扩散的原发性HCC；P-M，来自配对P的肝内扩散；P/PT，同时有P和PT；P-M/PT-M，同时有P-M和PT-M；肿瘤大小是长度方向的直径。

c).来自监督学习算法的基于基因表达的模型可预测HCC病人的转移可能性

用CCP来成功地区分PN和PT，使得我们开发了基于基因表达的模型来预测HCC病人发展为转移的可能性。我们随机选择10个PN病人和10个PT病人的原发性HCC样品作为训练组，通过“省略单因素”的交叉验证分类法产生一个预测模型。训练样品的分类产生含153个基因的列表。通过产生出多因子(multi-因子ial)的L值，这提供了检测样本的预测基础，被称为“加权投票”练习(见材料与方法)。我们包括了所有剩余的20个原发性HCC样本作为一个测试集(15个P病人，3个额外PN病人，和2个额外PT病人)。图2显示了计算的“加权投票”L值，其中转移样品产生阴性值，而无转移样品产生阳性值。除了一个“P”样本(S29)外，所有的测试样本都归入转移组(图2a)。病人的跟踪数据显示，一个PN病人(S56)在手术后8个月发生肺转移，而第二个病人(S57)在手术后9个月无癌症，第三个病人(S55)没有回答跟踪问查。基于PN/PT比对所获得的153个基因构成的集合，我们还通过多维量表法分析了这些样本。结果显示，S29基因的表达谱更象P组和PT组，而不象PN组(图2b)。这提示S29应该属于P组和PT组。这样，我们准确地将20个双盲HCC患者中的18个(90％)归类为具有转移可能性。

表2 用于预测转移的153个显著基因及其在预测模型中计算多因子L值所需的值

UG簇	符号	描述	t-值	中值	p-值	独特标识
UG簇	符号	描述	t-值	中值	p-值	独特标识	Hs.36566	LIMK1	LIM结构域激酶1	-7.7122	-0.433	0.000000	160082
Hs.75573	CENPE	着丝点蛋白E(312kD)	-7.2301	0.217	0.000001	160128	Hs.36566	LIMK1	LIM结构域激酶1	-7.7122	-0.433	0.000000	160082
Hs.75573	CENPE	着丝点蛋白E(312kD)	-7.2301	0.217	0.000001	160128	Hs.81217	FZD2	蜷缩(果蝇属)同源物2	-7.0334	-0.499	0.000002	160028
Hs.146580	ENO2	烯醇化酶2，(Y，乙溴醋胺)	-6.9978	-0.238	0.000002	160068	Hs.81217	FZD2	蜷缩(果蝇属)同源物2	-7.0334	-0.499	0.000002	160028
Hs.146580	ENO2	烯醇化酶2，(Y，乙溴醋胺)	-6.9978	-0.238	0.000002	160068	Hs.222	ITGA9	整联蛋白，α9	-6.699	-0.159	0.000004	160135
Hs.75887	COPA	外被体蛋白复合物，亚基α	-6.4035	-0.241	0.000007	159890	Hs.222	ITGA9	整联蛋白，α9	-6.699	-0.159	0.000004	160135
Hs.75887	COPA	外被体蛋白复合物，亚基α	-6.4035	-0.241	0.000007	159890	Hs.6727	KIAA0660	Ras-GTP酶激活蛋白SH3结构域	-6.3742	-0.281	0.000007	160103
Hs.89578	GTF2H1	通用转录因子IIH，多肽1	-6.2909	-0.178	0.000006	164987	Hs.6727	KIAA0660	Ras-GTP酶激活蛋白SH3结构域	-6.3742	-0.281	0.000007	160103
Hs.89578	GTF2H1	通用转录因子IIH，多肽1	-6.2909	-0.178	0.000006	164987	Hs.180941	VPS41	分拣空泡蛋白41(酵母同源物)	-5.9459	-0.331	0.000013	159888
Hs.99236	RGS20	G-蛋白信号传导的调节物20	-5.8503	-0.264	0.000015	161959	Hs.180941	VPS41	分拣空泡蛋白41(酵母同源物)	-5.9459	-0.331	0.000013	159888
Hs.99236	RGS20	G-蛋白信号传导的调节物20	-5.8503	-0.264	0.000015	161959	Hs.274	MATK	巨核细胞相关的酪氨酸激酶	-5.8166	-0.366	0.000016	160015
Hs.194816	STOML1	溴化丙胺太林(EBP72)样蛋白1	-5.7855	-0.124	0.000018	162695	Hs.274	MATK	巨核细胞相关的酪氨酸激酶	-5.8166	-0.366	0.000016	160015
Hs.194816	STOML1	溴化丙胺太林(EBP72)样蛋白1	-5.7855	-0.124	0.000018	162695	Hs.79516	BASP1	膜附着信号蛋白1	-5.5974	-0.415	0.000026	159882
Hs.733	EPB42	红细胞膜蛋白带4.2	-5.5395	-0.378	0.000029	160067	Hs.79516	BASP1	膜附着信号蛋白1	-5.5974	-0.415	0.000026	159882
Hs.733	EPB42	红细胞膜蛋白带4.2	-5.5395	-0.378	0.000029	160067	Hs.87539	ALDH3B2	醛脱氢酶3家族，成员B2	-5.5356	-0.351	0.000030	166071

Hs.5947	MEL	Mel转化癌基因	-5.434	-0.452	0.000045	160104
Hs.5947	MEL	Mel转化癌基因	-5.434	-0.452	0.000045	160104	Hs.118354	CAT56	CAT56蛋白	-5.4077	-0.316	0.000047	165027
Hs.27744	RAB3A	RAB3A，成员RAS癌基因家族	-5.35	-0.338	0.000044	160099	Hs.118354	CAT56	CAT56蛋白	-5.4077	-0.316	0.000047	165027
Hs.27744	RAB3A	RAB3A，成员RAS癌基因家族	-5.35	-0.338	0.000044	160099	Hs.7984	PSCD3	普列克底物蛋白同源物	-5.3177	-0.143	0.000047	159887
Hs.104519	PLD2	磷脂酶D2	-5.2672	-0.275	0.000052	159999	Hs.7984	PSCD3	普列克底物蛋白同源物	-5.3177	-0.143	0.000047	159887
Hs.104519	PLD2	磷脂酶D2	-5.2672	-0.275	0.000052	159999	Hs.4748	ADCYAP1R1	腺苷酸环化酶激活多肽1	-5.2037	-0.166	0.000060	161460
Hs.83155	ALDH3B1	醛脱氢酶3家族，成员B1	-5.2005	-0.44	0.000088	159838	Hs.4748	ADCYAP1R1	腺苷酸环化酶激活多肽1	-5.2037	-0.166	0.000060	161460
Hs.83155	ALDH3B1	醛脱氢酶3家族，成员B1	-5.2005	-0.44	0.000088	159838	Hs.283822	RHD	恒河猴血型，D抗原	-5.1898	-0.369	0.000062	164821
Hs.2175	CSF3R	集落刺激因子3受体	-5.1684	-0.136	0.000065	160114	Hs.283822	RHD	恒河猴血型，D抗原	-5.1898	-0.369	0.000062	164821
Hs.2175	CSF3R	集落刺激因子3受体	-5.1684	-0.136	0.000065	160114	Hs.3094	KIAA0063	KIAA0063基因产物	-5.162	-0.325	0.000095	160091
Hs.119273	KIAA0296	KIAA0296基因产物	-5.132	-0.545	0.000070	159951	Hs.3094	KIAA0063	KIAA0063基因产物	-5.162	-0.325	0.000095	160091
Hs.119273	KIAA0296	KIAA0296基因产物	-5.132	-0.545	0.000070	159951	Hs.23672	LRP6	低密度脂蛋白受体相关蛋白6	-5.1081	-1.13	0.000074	162040
Hs.118804	ENO3	烯醇化酶3，(β，肌肉)	-5.0415	-0.76	0.000085	164468	Hs.23672	LRP6	低密度脂蛋白受体相关蛋白6	-5.1081	-1.13	0.000074	162040
Hs.118804	ENO3	烯醇化酶3，(β，肌肉)	-5.0415	-0.76	0.000085	164468	Hs.74502	CTRB1	胰凝乳蛋白酶原B1	-5.0381	-0.216	0.000086	159787
Hs.194148	YES1	v-yes-1 Yamaguchi肉瘤病毒癌基因	-5.0064	-0.413	0.000092	159875	Hs.74502	CTRB1	胰凝乳蛋白酶原B1	-5.0381	-0.216	0.000086	159787
Hs.194148	YES1	v-yes-1 Yamaguchi肉瘤病毒癌基因	-5.0064	-0.413	0.000092	159875			未知(IncytePD：1404153)	-4.9541	-0.155	0.000103	160122
Hs.772	GYS1	糖原合成酶1(肌肉)	-4.913	-0.478	0.000112	160222			未知(IncytePD：1404153)	-4.9541	-0.155	0.000103	160122
Hs.772	GYS1	糖原合成酶1(肌肉)	-4.913	-0.478	0.000112	160222	Hs.153203	MDFI	MyoD家族抑制物	-4.8908	-0.773	0.000138	163880
Hs.247423	ADD2	内收蛋白2(β)	-4.8064	-0.609	0.000141	162687	Hs.153203	MDFI	MyoD家族抑制物	-4.8908	-0.773	0.000138	163880
Hs.247423	ADD2	内收蛋白2(β)	-4.8064	-0.609	0.000141	162687	Hs.22785	GABRE	Y-氨酪酸(GABA)A受体	-4.8046	-0.188	0.000142	159794
		未知(IncytePD：2685601)	-4.7898	-0.307	0.000147	165108	Hs.22785	GABRE	Y-氨酪酸(GABA)A受体	-4.8046	-0.188	0.000142	159794
		未知(IncytePD：2685601)	-4.7898	-0.307	0.000147	165108	Hs.97087	CD3Z	CD3Z抗原，zeta多肽(TiT3复合物)	-4.7723	-0.487	0.000152	160043
Hs.79006	DTYMK	脱氧胸苷酸激酶(胸苷酸激酶)	-4.7693	0.254	0.000153	161858	Hs.97087	CD3Z	CD3Z抗原，zeta多肽(TiT3复合物)	-4.7723	-0.487	0.000152	160043
Hs.79006	DTYMK	脱氧胸苷酸激酶(胸苷酸激酶)	-4.7693	0.254	0.000153	161858	Hs.26915	SPTBN2	血影蛋白，β，非红细胞型2	-4.7666	-0.364	0.000154	160846
		未知(IncytePD：2509789)	-4.7523	-0.175	0.000159	164920	Hs.26915	SPTBN2	血影蛋白，β，非红细胞型2	-4.7666	-0.364	0.000154	160846
		未知(IncytePD：2509789)	-4.7523	-0.175	0.000159	164920	Hs.38586	HSD3B1	羟基-δ-5-类固醇脱氢酶	-4.7519	-0.392	0.000159	164787
Hs.32966	GUCA2B	鸟苷酸环化酶激活物2B(uroguanyin)	-4.7519	-0.368	0.000159	164851	Hs.38586	HSD3B1	羟基-δ-5-类固醇脱氢酶	-4.7519	-0.392	0.000159	164787
Hs.32966	GUCA2B	鸟苷酸环化酶激活物2B(uroguanyin)	-4.7519	-0.368	0.000159	164851	Hs.12773	ACOX3	乙酰-辅酶A氧化酶3，降植烷基(pristanoyl)	-4.7455	-0.25	0.000187	162487
Hs.2281	CHGB	嗜铬粒蛋白B(分泌粒蛋白1)	-4.7199	-0.269	0.000171	160078	Hs.12773	ACOX3	乙酰-辅酶A氧化酶3，降植烷基(pristanoyl)	-4.7455	-0.25	0.000187	162487
Hs.2281	CHGB	嗜铬粒蛋白B(分泌粒蛋白1)	-4.7199	-0.269	0.000171	160078	Hs.25197	STUB1	STIP1同源和含U-Box的蛋白1	-4.6897	-0.264	0.000183	160555
Hs.169536	RHAG	恒河猴血型相关的糖蛋白	-4.6648	-0.326	0.000193	164916	Hs.25197	STUB1	STIP1同源和含U-Box的蛋白1	-4.6897	-0.264	0.000183	160555
Hs.169536	RHAG	恒河猴血型相关的糖蛋白	-4.6648	-0.326	0.000193	164916	Hs.96	PMAIP1	PMA-诱导蛋白1	-4.6573	-0.124	0.000196	160112
Hs.153053	CD37	CD37抗原	-4.6051	-0.652	0.000220	160033	Hs.96	PMAIP1	PMA-诱导蛋白1	-4.6573	-0.124	0.000196	160112
Hs.153053	CD37	CD37抗原	-4.6051	-0.652	0.000220	160033	Hs.155227	EPHB4	EphB4	-4.5965	-0.276	0.000257	168938
Hs.92282	PITX2	配对样的同结构域转录因子2	-4.584	-0.149	0.000230	160123	Hs.155227	EPHB4	EphB4	-4.5965	-0.276	0.000257	168938
Hs.92282	PITX2	配对样的同结构域转录因子2	-4.584	-0.149	0.000230	160123	Hs.79123	KIAA0084	KIAA0084蛋白	-4.583	-0.296	0.000231	159886
Hs.180878	LPL	脂蛋白脂酶	-4.5304	-0.18	0.000259	160485	Hs.79123	KIAA0084	KIAA0084蛋白	-4.583	-0.296	0.000231	159886
Hs.180878	LPL	脂蛋白脂酶	-4.5304	-0.18	0.000259	160485	Hs.75658	PYGB	磷酸化酶，糖原；脑	-4.5152	0.027	0.000268	159778
Hs.286132	MN7	D15F37(假基因)	-4.503	-0.314	0.000275	167399	Hs.75658	PYGB	磷酸化酶，糖原；脑	-4.5152	0.027	0.000268	159778
Hs.286132	MN7	D15F37(假基因)	-4.503	-0.314	0.000275	167399	Hs.57600	AP1S1	衔接子相关蛋白复合物1	-4.4656	-0.26	0.000299	160042
Hs.67688		EST	-4.4472	-0.458	0.000311	162920	Hs.57600	AP1S1	衔接子相关蛋白复合物1	-4.4656	-0.26	0.000299	160042
Hs.67688		EST	-4.4472	-0.458	0.000311	162920	Hs.172458	IDS	艾杜糖2-硫酸酯酶(亨特综合征)	-4.4324	-0.259	0.000322	160243
Hs.80768	CLCN7	氯化物通道7	-4.4298	0.058	0.000324	161279	Hs.172458	IDS	艾杜糖2-硫酸酯酶(亨特综合征)	-4.4324	-0.259	0.000322	160243

Hs.347527	SLC20A2	溶质载体家族20，成员2	-4.4173	-0.308	0.000333	159936
Hs.347527	SLC20A2	溶质载体家族20，成员2	-4.4173	-0.308	0.000333	159936	Hs.72550	HMMR	透明质介导的运动性受体(RHAMM)	-4.3918	-0.443	0.000352	167575
		未知(IncytePD：1681876)	-4.3868	-0.275	0.000356	166536	Hs.72550	HMMR	透明质介导的运动性受体(RHAMM)	-4.3918	-0.443	0.000352	167575
		未知(IncytePD：1681876)	-4.3868	-0.275	0.000356	166536	Hs.242947	DGKI	二酰甘油激酶，iota	-4.3835	-0.369	0.000358	161826
Hs.158249	KIAA0406	KIAA0406基因产物	-4.3376	-0.066	0.000397	159825	Hs.242947	DGKI	二酰甘油激酶，iota	-4.3835	-0.369	0.000358	161826
Hs.158249	KIAA0406	KIAA0406基因产物	-4.3376	-0.066	0.000397	159825	Hs.182577	INPP5B	肌醇多磷酸-5-磷酸酶，75kD	-4.315	-0.269	0.000417	160074
Hs.37054	EFNA3	ephrin-A3	-4.3085	-0.355	0.000423	161846	Hs.182577	INPP5B	肌醇多磷酸-5-磷酸酶，75kD	-4.315	-0.269	0.000417	160074
Hs.37054	EFNA3	ephrin-A3	-4.3085	-0.355	0.000423	161846	Hs.334841	SELENBP1	硒结合蛋白1	-4.3016	-0.481	0.000430	169315
Hs.81454	KHK	己酮糖激酶(果糖激酶)	-4.2966	-0.36	0.000434	159931	Hs.334841	SELENBP1	硒结合蛋白1	-4.3016	-0.481	0.000430	169315
Hs.81454	KHK	己酮糖激酶(果糖激酶)	-4.2966	-0.36	0.000434	159931	Hs.84790	KIAA0225	KIAA0225蛋白	-4.2732	-0.151	0.000582	160472
Hs.94498	LILRA2	白细胞免疫球蛋白样受体	-4.2714	-0.308	0.000459	161424	Hs.84790	KIAA0225	KIAA0225蛋白	-4.2732	-0.151	0.000582	160472
Hs.94498	LILRA2	白细胞免疫球蛋白样受体	-4.2714	-0.308	0.000459	161424	Hs.151393	GCLC	谷胺酸半胱氨酸连接酶，催化亚基	-4.2523	-0.421	0.000479	166059
Hs.151738	MMP9	基质金属蛋白酶9	-4.2337	-0.473	0.000722	159912	Hs.151393	GCLC	谷胺酸半胱氨酸连接酶，催化亚基	-4.2523	-0.421	0.000479	166059
Hs.151738	MMP9	基质金属蛋白酶9	-4.2337	-0.473	0.000722	159912	Hs.69707	HCGII-7	HCGII-7蛋白	-4.2223	0.802	0.000512	161462
Hs.152251	FZD5	蜷缩(果蝇属)同源物5	-4.2088	-0.386	0.000528	164899	Hs.69707	HCGII-7	HCGII-7蛋白	-4.2223	0.802	0.000512	161462
Hs.152251	FZD5	蜷缩(果蝇属)同源物5	-4.2088	-0.386	0.000528	164899			未知(IncytePD：1570216)	-4.2019	-0.336	0.000536	159962
Hs.61712	PDK1	丙酮酸脱氢酶激酶，同工酶1	-4.1746	-0.251	0.000570	160462			未知(IncytePD：1570216)	-4.2019	-0.336	0.000536	159962
Hs.61712	PDK1	丙酮酸脱氢酶激酶，同工酶1	-4.1746	-0.251	0.000570	160462	Hs.66731	HOXB13	同源框(homeo box)B13	-4.1722	-0.739	0.000573	159868
Hs.80976	MKI67	单抗Ki-67所鉴别的抗原	-4.1699	-0.148	0.000642	160039	Hs.66731	HOXB13	同源框(homeo box)B13	-4.1722	-0.739	0.000573	159868
Hs.80976	MKI67	单抗Ki-67所鉴别的抗原	-4.1699	-0.148	0.000642	160039	Hs.283664	ASPH	天冬氨酸β-羟基酶	-4.1693	0.062	0.000576	160084
Hs.76688	CES1	羧酸酯酶1	-4.1577	-1.285	0.000591	164490	Hs.283664	ASPH	天冬氨酸β-羟基酶	-4.1693	0.062	0.000576	160084
Hs.76688	CES1	羧酸酯酶1	-4.1577	-1.285	0.000591	164490	Hs.154230	NDP52	核结构域10蛋白	-4.1483	-0.178	0.000604	159958
Hs.75596	IL2RB	白介素2受体，β	-4.1376	-0.268	0.000688	159942	Hs.154230	NDP52	核结构域10蛋白	-4.1483	-0.178	0.000604	159958
Hs.75596	IL2RB	白介素2受体，β	-4.1376	-0.268	0.000688	159942	Hs.4756	FEN1	挡板结构特异性的核酸内切酶1	-4.1222	0.195	0.000640	160035
Hs.673	IL12A	白介素12A	-4.0844	-0.082	0.000696	162579	Hs.4756	FEN1	挡板结构特异性的核酸内切酶1	-4.1222	0.195	0.000640	160035
Hs.673	IL12A	白介素12A	-4.0844	-0.082	0.000696	162579	Hs.89230	KCNN3	钾钙激活的通道	-4.0745	0.008	0.000711	161095
Hs.799	DTR	白喉毒素受体	-4.0616	-0.421	0.000812	167412	Hs.89230	KCNN3	钾钙激活的通道	-4.0745	0.008	0.000711	161095
Hs.799	DTR	白喉毒素受体	-4.0616	-0.421	0.000812	167412	Hs.120360	PLA2G6	磷脂酶A2，组VI	-4.0344	-0.577	0.000778	160058
Hs.171075	RFC5	复制因子C(激活物1)5(36.5kD)	-4.0263	0.114	0.000792	161332	Hs.120360	PLA2G6	磷脂酶A2，组VI	-4.0344	-0.577	0.000778	160058
Hs.171075	RFC5	复制因子C(激活物1)5(36.5kD)	-4.0263	0.114	0.000792	161332	Hs.99899	TNFSF7	肿瘤坏死因子超家族，成员7	-4.0211	-0.221	0.000801	159817
Hs.9605	CPSF5	切割和聚腺苷酸化的特异因子5	-4.0101	0.079	0.000821	159766	Hs.99899	TNFSF7	肿瘤坏死因子超家族，成员7	-4.0211	-0.221	0.000801	159817
Hs.9605	CPSF5	切割和聚腺苷酸化的特异因子5	-4.0101	0.079	0.000821	159766	Hs.95262	NFRKB	与kappa B结合蛋白有关的核因子	-4.0081	-0.162	0.000825	167698
Hs.37129	SCNN1B	钠通道，非电压门控型1	-4.0053	-0.244	0.000830	161191	Hs.95262	NFRKB	与kappa B结合蛋白有关的核因子	-4.0081	-0.162	0.000825	167698
Hs.37129	SCNN1B	钠通道，非电压门控型1	-4.0053	-0.244	0.000830	161191	Hs.296371	RAB28	RAB28，成员RAS癌基因家族	-4.0038	0.343	0.000833	160699
Hs.83795	IRF2	干扰素调节因子2	-3.9955	-0.527	0.000848	161188	Hs.296371	RAB28	RAB28，成员RAS癌基因家族	-4.0038	0.343	0.000833	160699
Hs.83795	IRF2	干扰素调节因子2	-3.9955	-0.527	0.000848	161188	Hs.85087	LTBP4	潜伏的TGF-β结合蛋白4	-3.9927	-0.34	0.000854	159923
Hs.267448	CGI-85	CGI-85蛋白	-3.986	0.219	0.000866	166502	Hs.85087	LTBP4	潜伏的TGF-β结合蛋白4	-3.9927	-0.34	0.000854	159923
Hs.267448	CGI-85	CGI-85蛋白	-3.986	0.219	0.000866	166502	Hs.121521	ABL2	v-abl鼠白血病病毒癌基因同源物2	-3.9746	-0.347	0.000889	166612
Hs.28166	CRSP8	Sp1转录激活的辅因子	-3.9714	0.07	0.000895	162996	Hs.121521	ABL2	v-abl鼠白血病病毒癌基因同源物2	-3.9746	-0.347	0.000889	166612
Hs.28166	CRSP8	Sp1转录激活的辅因子	-3.9714	0.07	0.000895	162996	Hs.239706	GAB1	GRB2相关的结合蛋白1	-3.9529	-0.347	0.000933	162416
Hs.177687	AKR1C4	醛-酮还原酶家族1，成员C4	-3.9499	0.145	0.000939	161753	Hs.239706	GAB1	GRB2相关的结合蛋白1	-3.9529	-0.347	0.000933	162416
Hs.177687	AKR1C4	醛-酮还原酶家族1，成员C4	-3.9499	0.145	0.000939	161753	Hs.25648	TNFRSF5	TNF受体超家族，成员5	-3.9371	-0.147	0.000966	166055
Hs.858	RELB	v-rel病毒癌基因同源物B	-3.935	-0.12	0.000971	164810	Hs.25648	TNFRSF5	TNF受体超家族，成员5	-3.9371	-0.147	0.000966	166055

Hs.155314	KIAA0095	KIAA0095基因产物	-3.9244	-0.206	0.000994	162213
Hs.155314	KIAA0095	KIAA0095基因产物	-3.9244	-0.206	0.000994	162213	Hs.8358	FLJ20366	假定的蛋白FLJ20366	3.9437	0.201	0.000952	164145
Hs.112819		EST	3.9573	0.217	0.000924	168969	Hs.8358	FLJ20366	假定的蛋白FLJ20366	3.9437	0.201	0.000952	164145
Hs.112819		EST	3.9573	0.217	0.000924	168969	Hs.126263		EST，与A38712纤维蛋白高度相似	3.9651	0.925	0.000908	167474
Hs.10669	DDEF1	发育分化增强因子1	3.9709	-0.062	0.000896	164026	Hs.126263		EST，与A38712纤维蛋白高度相似	3.9651	0.925	0.000908	167474
Hs.10669	DDEF1	发育分化增强因子1	3.9709	-0.062	0.000896	164026	Hs.99216		EST，类似于ALU8	3.9802	0.288	0.000878	169148
Hs.98738	GRTH	促性腺素调节的睾丸RNA解旋酶	3.9911	-0.198	0.000857	166657	Hs.99216		EST，类似于ALU8	3.9802	0.288	0.000878	169148
Hs.98738	GRTH	促性腺素调节的睾丸RNA解旋酶	3.9911	-0.198	0.000857	166657	Hs.28274		智人cDNA：FLJ22049 fis	3.9912	0.208	0.000857	163989
Hs.186564		EST	4.0128	0.177	0.000816	163409	Hs.28274		智人cDNA：FLJ22049 fis	3.9912	0.208	0.000857	163989
Hs.186564		EST	4.0128	0.177	0.000816	163409	Hs.34045	FLJ20764	假定的蛋白FLJ20764	4.0142	0.325	0.000814	168581
Hs.3686	KIAA0978	KIAA0978蛋白	4.0211	0.308	0.000801	164187	Hs.34045	FLJ20764	假定的蛋白FLJ20764	4.0142	0.325	0.000814	168581
Hs.3686	KIAA0978	KIAA0978蛋白	4.0211	0.308	0.000801	164187	Hs.172148		EST	4.0307	0.179	0.000784	163746
Hs.239499	KIAA0185	KIAA0185蛋白	4.0679	0.17	0.000722	168413	Hs.172148		EST	4.0307	0.179	0.000784	163746
Hs.239499	KIAA0185	KIAA0185蛋白	4.0679	0.17	0.000722	168413	Hs.169341	HTPAP	HTPAP蛋白	4.1104	0.608	0.000657	163274
Hs.44131	KIAA0974	KIAA0974蛋白	4.1179	0.828	0.000646	164589	Hs.169341	HTPAP	HTPAP蛋白	4.1104	0.608	0.000657	163274
Hs.44131	KIAA0974	KIAA0974蛋白	4.1179	0.828	0.000646	164589	Hs.2969	SKI	v-ski禽肉瘤病毒癌基因同源物	4.1484	0.323	0.000604	164039
Hs.80618	FLJ20015	假设蛋白	4.1716	0.258	0.000573	163363	Hs.2969	SKI	v-ski禽肉瘤病毒癌基因同源物	4.1484	0.323	0.000604	164039
Hs.80618	FLJ20015	假设蛋白	4.1716	0.258	0.000573	163363	Hs.136309	SH3GLB1	SH3-结构域，GRB2-样，内菲林(endophilin)B1	4.1832	0.339	0.000559	162621
Hs.274293		智人mRNA；cDNA DKFZp761G1111	4.1964	-0.013	0.000543	165504	Hs.136309	SH3GLB1	SH3-结构域，GRB2-样，内菲林(endophilin)B1	4.1832	0.339	0.000559	162621
Hs.274293		智人mRNA；cDNA DKFZp761G1111	4.1964	-0.013	0.000543	165504	Hs.21479	UBN1	遍核蛋白(ubinuclein)1	4.2096	0.554	0.000527	167995
Hs.155160	SRP46	剪接因子，富含精氨酸/丝氨酸，46kD	4.2889	0.291	0.000442	168577	Hs.21479	UBN1	遍核蛋白(ubinuclein)1	4.2096	0.554	0.000527	167995
Hs.155160	SRP46	剪接因子，富含精氨酸/丝氨酸，46kD	4.2889	0.291	0.000442	168577	Hs.105584	RPS6KA4	核糖体蛋白S6激酶，90kD，多肽4	4.3239	0.349	0.000409	168189
Hs.279886	RANBP9	RAN结合蛋白9	4.336	0.365	0.000398	168730	Hs.105584	RPS6KA4	核糖体蛋白S6激酶，90kD，多肽4	4.3239	0.349	0.000409	168189
Hs.279886	RANBP9	RAN结合蛋白9	4.336	0.365	0.000398	168730	Hs.197298	NS1-BP	NS1-结合蛋白	4.346	0.593	0.000389	168257
		未知(IncytePD：2895226)	4.3857	-0.2	0.000357	161881	Hs.197298	NS1-BP	NS1-结合蛋白	4.346	0.593	0.000389	168257
		未知(IncytePD：2895226)	4.3857	-0.2	0.000357	161881	Hs.36793	FLJ23188	假定的蛋白FLJ23188	4.3907	0.454	0.000353	168869
Hs.17384		EST	4.3978	-0.04	0.000347	163225	Hs.36793	FLJ23188	假定的蛋白FLJ23188	4.3907	0.454	0.000353	168869
Hs.17384		EST	4.3978	-0.04	0.000347	163225	Hs.78524	HTCD37	TcD37同源物	4.4097	0.381	0.000338	167570
Hs.2301	DBH	多巴胺β-羟基酶	4.4196	0.743	0.000375	168202	Hs.78524	HTCD37	TcD37同源物	4.4097	0.381	0.000338	167570
Hs.2301	DBH	多巴胺β-羟基酶	4.4196	0.743	0.000375	168202	Hs.118795	FLJ10008	假定的蛋白FLJ10008	4.4386	-0.064	0.000317	166653
Hs.33074		智人，克隆IMAGE：3606519	4.5036	0.135	0.000275	168589	Hs.118795	FLJ10008	假定的蛋白FLJ10008	4.4386	-0.064	0.000317	166653
Hs.33074		智人，克隆IMAGE：3606519	4.5036	0.135	0.000275	168589	Hs.4988		智人克隆24711 mRNA序列	4.5042	0.016	0.000274	160165
Hs.288872	FLJ21439	假定的蛋白FLJ21439	4.5242	0.29	0.000263	168393	Hs.4988		智人克隆24711 mRNA序列	4.5042	0.016	0.000274	160165
Hs.288872	FLJ21439	假定的蛋白FLJ21439	4.5242	0.29	0.000263	168393	Hs.323712	KIAA0615	KIAA0615基因产物	4.5292	0.024	0.000260	163625
Hs.14051		智人mRNA；cDNA DKFZp434A2417	4.5538	0.215	0.000246	168381	Hs.323712	KIAA0615	KIAA0615基因产物	4.5292	0.024	0.000260	163625
Hs.14051		智人mRNA；cDNA DKFZp434A2417	4.5538	0.215	0.000246	168381	Hs.296287		类似于含溴结构域4	4.5576	0.499	0.000244	169290
Hs.57847		EST，类似于CASPASE-4前体	4.63	0.264	0.000208	165194	Hs.296287		类似于含溴结构域4	4.5576	0.499	0.000244	169290
Hs.57847		EST，类似于CASPASE-4前体	4.63	0.264	0.000208	165194	Hs.26289		EST	4.7062	0.948	0.000176	169360
Hs.11123	DKFZP564G092	DKFZP564G092蛋白	4.9593	0.476	0.000101	163064	Hs.26289		EST	4.7062	0.948	0.000176	169360
Hs.11123	DKFZP564G092	DKFZP564G092蛋白	4.9593	0.476	0.000101	163064	Hs.288908		CDNA：FLJ21913 fis，克隆HEP03888	4.9597	0.556	0.000101	168395
Hs.77495	UBXD2	含UBX结构域2	4.9758	0.676	0.000098	160190	Hs.288908		CDNA：FLJ21913 fis，克隆HEP03888	4.9597	0.556	0.000101	168395
Hs.77495	UBXD2	含UBX结构域2	4.9758	0.676	0.000098	160190	Hs.24341	TAZ	具有PDZ结合基序的转录共激活物	5.0014	0.127	0.000093	164176
Hs.50133		EST	5.153	0.243	0.000067	168567	Hs.24341	TAZ	具有PDZ结合基序的转录共激活物	5.0014	0.127	0.000093	164176

Hs.262958	DKFZP4348044	假定的蛋白DKFZp434B044	5.1851	0.378	0.000075	169042
Hs.262958	DKFZP4348044	假定的蛋白DKFZp434B044	5.1851	0.378	0.000075	169042	Hs.53478		智人cDNA FLJ12366 fis	5.2202	0.111	0.000058	168383
Hs.80658	UCP2	解偶联蛋白2	5.2483	1.308	0.000054	168158	Hs.53478		智人cDNA FLJ12366 fis	5.2202	0.111	0.000058	168383
Hs.80658	UCP2	解偶联蛋白2	5.2483	1.308	0.000054	168158	Hs.209065	FLJ14225	假定的蛋白FLJ14225	5.3394	0.468	0.000045	164339
Hs.92357	GALK1	乳糖激酶1	5.6456	1.15	0.000037	169675	Hs.209065	FLJ14225	假定的蛋白FLJ14225	5.3394	0.468	0.000045	164339
Hs.92357	GALK1	乳糖激酶1	5.6456	1.15	0.000037	169675	Hs.50373		EST	5.7625	0.94	0.000029	165500
Hs.266959	HBG1	血红蛋白，YA	5.9704	1.164	0.000026	168326	Hs.50373		EST	5.7625	0.94	0.000029	165500
Hs.266959	HBG1	血红蛋白，YA	5.9704	1.164	0.000026	168326	Hs.25566		EST	6.1164	0.182	0.000009	168197
Hs.25277	FLJ21065	假定的蛋白FLJ21065	6.1957	0.116	0.000008	164202	Hs.25566		EST	6.1164	0.182	0.000009	168197

上述得出的预测结果将40个病人分成两组，一个为转移组，另一个为非转移组。Kaplan-Meier存活数据表示，与未发现转移的患者相比，预测会发生转移的患者生存时间明显缩短(图2C)。因为HCC患者死亡率很大程度上依赖于其是否在肝内发生转移，因此我们的结果表明，用于分类器的基因集提供了反映肝癌转移和存活的准确的基因表达特征。

d)骨桥蛋白促进HCC转移

上述研究表明，肝内转移所需的基因应当包括在预测模型内。然而，来自预测模型的153个基因的列表是基于严格的标准的(P值为0.001)，以便将分类器中假阳性的基因数减到最少，这是正确分类所必需的。这样严格的标准可能会将许多对于转移过程而言显著的基因排除在外。为了扩展我们的研究，我们对PN组和PT组中各10个原发性HCC样本，在P值小于0.002情况下，进行了总计2000个随机排列的单变量F-检验。这个分析产生了总共224个显著性基因而且预期的假阳性少于20个(见表3)。为了鉴定导致肝癌转移的基因，我们检测了含224个基因的列表，并且对主要在PT和PT-M组中表达发生大幅改变但在PN组中很少变化的30个主要基因，进行了分类(见表4)。通过使用以中值为中心的关联法和完全连锁法，通过分级聚类算法将这些基因按中值为中心进行排列和可视化(图3a)。

在PT组中过表达均值超过3倍但在PN中不表达的一个基因，经鉴定为骨桥蛋白(OPN)(SEQ ID NO：1)，骨桥蛋白属于分泌型磷蛋白，近来被发现它在转移型乳腺癌、恶性肺癌、结肠癌和前列腺癌中高度表达。芯片表达数据比对结果揭示，在大量的PT样本和对应的PT-M样本中，OPN的表达是升高的，但在PN样本中表达是极低的(图3b)。OPN在PT样本中过表达，但不在PN样本中表达，这一点已通过半定量RT-PCR分析得到确定(图3c和d)。对29例原发性HCC样本(包括16个新出现的HCC病例)和8个健康器官供体的正常肝样本，实施OPN的免疫组化分析(IHC)。这些样本的OPN免疫反应通过双盲模式被评价。唯有转移型肿瘤的细胞质OPN染色是阳性的，尤其是在高密度的脉管区(图4)。IHC结果基本上同芯片和RT-PCR得到的结果一致(61％的阳性例，18个转移HCC中的11个)(数据未显示)。综上所述，这些研究显示，OPN具有诊断转移型HCC患者的良好价值。

为测定OPN在转移中的所起的作用，我们通过Western印迹法和Matrigel体外侵入分析，比较了人HCC细胞系中OPN的表达水平。OPN的表达水平在SK-Hep-1中为高，在Hep3B中为中等，在CCL13中为低(图5a)，这同它们的侵入力相符(图5b)。抗OPN的中和抗体能显著地阻断SKHep-1(p＜0.001)和Hep3B细胞的侵入(p＜0.04)。然而，重组的鼠OPN在Hep3B和Sk-Hep-1细胞上没有显示出统计上显著的刺激作用，暗示要么肿瘤细胞所产生的OPN对于维持侵入的表型已经足够，要么说明因种间差异而导致低效。5个额外的HCC细胞系中也获得了类似的结果(图5c)。然而，中和抗体对细胞的生存和扩散只有很小影响(图5c，右侧)。

为拓展上面的发现，我们在裸鼠中测定了OPN对HCC细胞向肺部转移的作用。HCCLM3细胞株是通过皮下注射具有高度肺转移的MHCC97细胞而获得的一种克隆(Li等人，J.Cancer Res.Clin.Oncology，2002)。在皮下注射后的一周，可获得100％的肿瘤发生率，这同我们近期的数据一致。在原发性肿瘤的大小方面，对照组和抗OPN组没有显著差异(图5E)，这同我们抗OPN抗体在体外不会影响HCC细胞生长的结果相一致。在第五周，在大多数I-II级肿瘤簇和一些III-IV级肿瘤簇对照组中的每一只小鼠，都检测到有肺转移损害(图5E，F)。对照组小鼠每个肺中平均有11.1±2.9个肿瘤簇。相反，抗OPN抗体组中只有大约一半的小鼠发生了肺转移，并且剩下的小鼠大多数发展成I级肿瘤簇，且每个肺中综合平均有2.6±1.0个肿瘤簇，因而这个结果在统计学上是显著的(P＜0.01)。因此，抗OPN抗体显示出对HCCLM3细胞的肺转移有显著的抑制效应。

表3.用于预测转移的224个显著基因及其在预测模型中计算多因子L值所需的值

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.313	OPN	骨桥蛋白	1.07	3.29	0.00122	4	161923	IncytePD：4327691
Hs.69707	HCGII-7	HCGII-7蛋白	1.07	2.85	0.000512	6	161462	IncytePD：1656490	Hs.313	OPN	骨桥蛋白	1.07	3.29	0.00122	4	161923	IncytePD：4327691
Hs.69707	HCGII-7	HCGII-7蛋白	1.07	2.85	0.000512	6	161462	IncytePD：1656490	Hs.177687	AKR1C4	醛-酮还原酶家族1，成员C4	0.58	2.11	0.000939	10p15-p14	161753	IncytePD：5033671
		未知	0.82	1.74	0.0018		161371	IncytePD：3421817	Hs.177687	AKR1C4	醛-酮还原酶家族1，成员C4	0.58	2.11	0.000939	10p15-p14	161753	IncytePD：5033671
		未知	0.82	1.74	0.0018		161371	IncytePD：3421817	Hs.276916	NR1D1	核受体亚家族1，组D，成员1	0.74	1.71	0.00181	17q11.2	166707	IncytePD：1904760
Hs.211569	GPRK5	G蛋白-偶联受体激酶5	0.99	1.69	0.00147	10q24-qter	161133	IncytePD：1418741	Hs.276916	NR1D1	核受体亚家族1，组D，成员1	0.74	1.71	0.00181	17q11.2	166707	IncytePD：1904760
Hs.211569	GPRK5	G蛋白-偶联受体激酶5	0.99	1.69	0.00147	10q24-qter	161133	IncytePD：1418741	Hs.75573	CENPE	着丝点蛋白E(312kD)	0.82	1.65	1.00E-06	4q24-q25	160128	IncytePD：308 1067
Hs.283664	ASPH	天冬氨酸β-羟基酶	0.7	1.56	0.000576	8q12.1	160084	IncytePD：3693273	Hs.75573	CENPE	着丝点蛋白E(312kD)	0.82	1.65	1.00E-06	4q24-q25	160128	IncytePD：308 1067
Hs.283664	ASPH	天冬氨酸β-羟基酶	0.7	1.56	0.000576	8q12.1	160084	IncytePD：3693273	Hs.296371	RAB28	RAB28，成员RAS癌基因家族	1.07	1.5	0.000833	4p16.1	160699	IncytePD：1457948
Hs.89267		EST	2.49	1.48	0.00132	1	163570	IncytePD：1633393	Hs.296371	RAB28	RAB28，成员RAS癌基因家族	1.07	1.5	0.000833	4p16.1	160699	IncytePD：1457948
Hs.89267		EST	2.49	1.48	0.00132	1	163570	IncytePD：1633393	Hs.79411	RPA2	复制蛋白A2(32kD)	1.02	1.47	0.00135	1p35	167684	IncytePD：1729876
Hs.79006	DTYMK	脱氧胸苷酸激酶(胸苷酸激酶)	0.98	1.45	0.000153	2	161858	IncytePD：4818795	Hs.79411	RPA2	复制蛋白A2(32kD)	1.02	1.47	0.00135	1p35	167684	IncytePD：1729876
Hs.79006	DTYMK	脱氧胸苷酸激酶(胸苷酸激酶)	0.98	1.45	0.000153	2	161858	IncytePD：4818795	Hs.26289		EST	2.59	1.44	0.000176	17	169360	IncytePD：674211
Hs.4756	FEN1	挡板结构特异性的核酸内切酶1	0.91	1.44	0.00064	11q12	160035	IncytePD：2050085	Hs.26289		EST	2.59	1.44	0.000176	17	169360	IncytePD：674211
Hs.4756	FEN1	挡板结构特异性的核酸内切酶1	0.91	1.44	0.00064	11q12	160035	IncytePD：2050085	Hs.44131	KIAA0974	KIAA0974蛋白	2.19	1.44	0.000646	10	164589	IncytePD：4540
Hs.267448	CGI-85	CGI-85蛋白	0.96	1.42	0.000866	11q13	166502	IncytePD：2603232	Hs.44131	KIAA0974	KIAA0974蛋白	2.19	1.44	0.000646	10	164589	IncytePD：4540
Hs.267448	CGI-85	CGI-85蛋白	0.96	1.42	0.000866	11q13	166502	IncytePD：2603232	Hs.171075	RFC5	复制因子C(激活物1)5(36.5kD)	0.83	1.41	0.000792	12q24.2-q24.3	161332	IncytePD：3590056
Hs.77495	UBXD2	含UBX结构域2	1.88	1.36	9.78E-05	2p14-q21.3	160190	IncytePD：1940994	Hs.171075	RFC5	复制因子C(激活物1)5(36.5kD)	0.83	1.41	0.000792	12q24.2-q24.3	161332	IncytePD：3590056
Hs.77495	UBXD2	含UBX结构域2	1.88	1.36	9.78E-05	2p14-q21.3	160190	IncytePD：1940994	Hs.184175	C2orf3	染色体2开放阅读框3	0.84	1.36	0.00139	2p11.2-p11.1	166136	IncytePD：2779394
Hs.146580	ENO2	烯醇化酶2，(γ，乙溴醋胺1)	0.55	1.31	1.56E-06	12p13	160068	IncytePD：1672630	Hs.184175	C2orf3	染色体2开放阅读框3	0.84	1.36	0.00139	2p11.2-p11.1	166136	IncytePD：2779394
Hs.146580	ENO2	烯醇化酶2，(γ，乙溴醋胺1)	0.55	1.31	1.56E-06	12p13	160068	IncytePD：1672630	Hs.96	PMAIP1	佛波醇-12-豆蔻酸-13-乙酸酯-诱导蛋白1	0.64	1.31	0.000196	18q22	160112	IncytePD：1931117
Hs.80768	CLCN7	氯化物通道7	0.83	1.3	0.000323	16p13	161279	IncytePD：1522646	Hs.96	PMAIP1	佛波醇-12-豆蔻酸-13-乙酸酯-诱导蛋白1	0.64	1.31	0.000196	18q22	160112	IncytePD：1931117
Hs.80768	CLCN7	氯化物通道7	0.83	1.3	0.000323	16p13	161279	IncytePD：1522646			未知	0.8	1.3	0.00122		165687	IncytePD：404768
Hs.9605	CPSF5	切割和聚腺苷酸化的特异因子5，25kD亚基	0.87	1.29	0.000821	16	159766	IncytePD：1813371			未知	0.8	1.3	0.00122		165687	IncytePD：404768
Hs.9605	CPSF5	切割和聚腺苷酸化的特异因子5，25kD亚基	0.87	1.29	0.000821	16	159766	IncytePD：1813371	Hs.20295	CHEK1	CHK1(检查点，S.pombe)同源物	0.85	1.28	0.00185	11q24-q24	161544	IncytePD：2594058
Hs.37288	NRID2	核受体亚家族1，组D，成员2	0.66	1.27	0.00168	3	159975	IncytePD：2643094	Hs.20295	CHEK1	CHK1(检查点，S.pombe)同源物	0.85	1.28	0.00185	11q24-q24	161544	IncytePD：2594058

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.75658	PYGB	磷酸化酶，糖原；脑	0.83	1.26	0.000268	20p11.2-p11.1	159778	IncytePD：1975552
Hs.32058	C1orf19	染色体1开放阅读框19	1.85	1.26	0.00154	1q25	169022	IncytePD：2285569	Hs.75658	PYGB	磷酸化酶，糖原；脑	0.83	1.26	0.000268	20p11.2-p11.1	159778	IncytePD：1975552
Hs.32058	C1orf19	染色体1开放阅读框19	1.85	1.26	0.00154	1q25	169022	IncytePD：2285569	Hs.24994	LOC51098	CGI-53蛋白	1.75	1.25	0.0018	20	166179	IncytePD：2347842
Hs.11123	DKFZP564G092	DKFZP564G092蛋白	1.56	1.24	0.000101	10cen-q26.11	163064	IncvtePD：2071705	Hs.24994	LOC51098	CGI-53蛋白	1.75	1.25	0.0018	20	166179	IncytePD：2347842
Hs.11123	DKFZP564G092	DKFZP564G092蛋白	1.56	1.24	0.000101	10cen-q26.11	163064	IncvtePD：2071705	Hs.13421	KIAA0056	KIAA0056蛋白	0.9	1.24	0.00119	11	159874	IncytePD：1561606
Hs.28166	CRSP8	Sp1转录激活所需的辅因子，亚基8(34kD)	0.9	1.23	0.000895	5	162996	IncytePD：1283515	Hs.13421	KIAA0056	KIAA0056蛋白	0.9	1.24	0.00119	11	159874	IncytePD：1561606
Hs.28166	CRSP8	Sp1转录激活所需的辅因子，亚基8(34kD)	0.9	1.23	0.000895	5	162996	IncytePD：1283515	Hs.57973	CARD10	Caspase募集结构域蛋白10	1.7	1.23	0.00197	22q13.1	165430	IncytePD：3739467
Hs.274313	IGFBP6	胰岛素样生长因子结合蛋白6	0.87	1.21	0.00192	12q13	160319	IncytePD：1968126	Hs.57973	CARD10	Caspase募集结构域蛋白10	1.7	1.23	0.00197	22q13.1	165430	IncytePD：3739467
Hs.274313	IGFBP6	胰岛素样生长因子结合蛋白6	0.87	1.21	0.00192	12q13	160319	IncytePD：1968126	Hs.209065	FLJ14225	假定的蛋白FLJ14225	1.62	1.18	4.48E-05	1q21	164339	IncytePD：1486385
Hs.34526	TYMSTR	G蛋白-偶联受体	0.89	1.18	0.00101	3p21	161635	IncytePD：2610374	Hs.209065	FLJ14225	假定的蛋白FLJ14225	1.62	1.18	4.48E-05	1q21	164339	IncytePD：1486385
Hs.34526	TYMSTR	G蛋白-偶联受体	0.89	1.18	0.00101	3p21	161635	IncytePD：2610374	Hs.80658	UCP2	解偶联蛋白2(线粒体的，质子载体)	5.23	1.17	5.44E-05	11q13	168158	IncytePD：1907952
Hs.197298	NS1-BP	NS1-结合蛋白	1.95	1.17	0.000389	1q25.1-q31.1	168257	IncytePD：630045	Hs.80658	UCP2	解偶联蛋白2(线粒体的，质子载体)	5.23	1.17	5.44E-05	11q13	168158	IncytePD：1907952
Hs.197298	NS1-BP	NS1-结合蛋白	1.95	1.17	0.000389	1q25.1-q31.1	168257	IncytePD：630045	Hs.222	ITGA9	整联蛋白，α9	0.69	1.16	3.74E-06	3p21.3	160135	IncytePD：2487318
Hs.288908		智人cDNA：FLJ21913 fis，克隆HEP03888	1.87	1.16	0.000101		168395	IncytePD：1938947	Hs.222	ITGA9	整联蛋白，α9	0.69	1.16	3.74E-06	3p21.3	160135	IncytePD：2487318
Hs.288908		智人cDNA：FLJ21913 fis，克隆HEP03888	1.87	1.16	0.000101		168395	IncytePD：1938947	Hs.21479	UBN1	遍核蛋白(ubinuclein)1	1.86	1.16	0.000527	16p13.3	167995	IncytePD：1541201
Hs.152981	CDS1	CDP-二酰甘油合成酶(磷脂酸胞苷酰基转移酶)1	0.81	1.16	0.0011	4q21	165060	IncytePD：1406071	Hs.21479	UBN1	遍核蛋白(ubinuclein)1	1.86	1.16	0.000527	16p13.3	167995	IncytePD：1541201
Hs.152981	CDS1	CDP-二酰甘油合成酶(磷脂酸胞苷酰基转移酶)1	0.81	1.16	0.0011	4q21	165060	IncytePD：1406071			未知	0.68	1.15	0.000159		164920	IncytePD：2509789
Hs.155223	STC2	锡钙蛋白(stanniocalcin)2	0.88	1.15	0.00122	5p14.2-q15	160310	IncytePD：2823476			未知	0.68	1.15	0.000159		164920	IncytePD：2509789
Hs.155223	STC2	锡钙蛋白(stanniocalcin)2	0.88	1.15	0.00122	5p14.2-q15	160310	IncytePD：2823476	Hs.1309	CD1A	CD1A抗原，一种多肽	0.79	1.15	0.00161	1q22-q23	165058	IncytePD：2906655
Hs.89230	KCNN3	钾中间体/小导电的钙激活通道，亚家族N，成员3	0.89	1.14	0.000711	1q21.3	161095	IncytePD：1747441	Hs.1309	CD1A	CD1A抗原，一种多肽	0.79	1.15	0.00161	1q22-q23	165058	IncytePD：2906655
Hs.89230	KCNN3	钾中间体/小导电的钙激活通道，亚家族N，成员3	0.89	1.14	0.000711	1q21.3	161095	IncytePD：1747441	Hs.331328	FLJ13213	假定的蛋白FLJ13213	0.7	1.14	0.00136	15	166434	IncytePD：2382190
		未知	0.72	1.13	0.000103		160122	IncytePD：1404153	Hs.331328	FLJ13213	假定的蛋白FLJ13213	0.7	1.14	0.00136	15	166434	IncytePD：2382190
		未知	0.72	1.13	0.000103		160122	IncytePD：1404153	Hs.169341	HTPAP	HTPAP蛋白	2.05	1.13	0.000657	8	163274	IncytePD：2626340
Hs.78524	HTCD37	TcD37同源物	1.51	1.12	0.000338	1q21	167570	IncytePD：1430538	Hs.169341	HTPAP	HTPAP蛋白	2.05	1.13	0.000657	8	163274	IncytePD：2626340
Hs.78524	HTCD37	TcD37同源物	1.51	1.12	0.000338	1q21	167570	IncytePD：1430538	Hs.36793	FLJ23188	假定的蛋白FLJ23188	1.68	1.12	0.000353	3p13-q13.33	168869	IncytePD：2669866
Hs.154230	NDP52	核结构域10蛋白	0.7	1.12	0.000604	17q21.3	159958	IncytePD：1818836	Hs.36793	FLJ23188	假定的蛋白FLJ23188	1.68	1.12	0.000353	3p13-q13.33	168869	IncytePD：2669866

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.25648	TNFRSF5	肿瘤坏死因子受体超家族，成员5	0.83	1.12	0.00132	20q12-q13.2	160900	IncytePD：1638346
Hs.6727	KIAA0660	Ras-GTP酶激活蛋白SH3结构域-结合蛋白2	0.61	1.11	6.92E-06	4q21.1-q21.3	160103	IncytePD：1899625	Hs.25648	TNFRSF5	肿瘤坏死因子受体超家族，成员5	0.83	1.12	0.00132	20q12-q13.2	160900	IncytePD：1638346
Hs.6727	KIAA0660	Ras-GTP酶激活蛋白SH3结构域-结合蛋白2	0.61	1.11	6.92E-06	4q21.1-q21.3	160103	IncytePD：1899625	Hs.8402	ADCY3	腺苷酸环化酶3	0.77	1.11	0.00128	2p24-p22	167084	IncytePD：1966824
Hs.279886	RANBP9	RAN结合蛋白9	1.52	1.1	0.000398	6p23	168730	IncytePD：1781729	Hs.8402	ADCY3	腺苷酸环化酶3	0.77	1.11	0.00128	2p24-p22	167084	IncytePD：1966824
Hs.279886	RANBP9	RAN结合蛋白9	1.52	1.1	0.000398	6p23	168730	IncytePD：1781729	Hs.66718	RAD54L	RAD54(酿酒酵母)样蛋白	0.91	1.1	0.00103	1p32	166204	IncytePD：2645840
Hs.10095	LOC56930	假定的蛋白，来自EUROIMAGE 1669387	1.61	1.1	0.00129	19p13.3	168579	IncytePD：322585	Hs.66718	RAD54L	RAD54(酿酒酵母)样蛋白	0.91	1.1	0.00103	1p32	166204	IncytePD：2645840
Hs.10095	LOC56930	假定的蛋白，来自EUROIMAGE 1669387	1.61	1.1	0.00129	19p13.3	168579	IncytePD：322585	Hs.19348	FLJ13119	假定的蛋白FLJ13119	1.56	1.1	0.00131	15	169102	IncytePD：1978282
Hs.194816	STOML1	Stomatin(EBP72)样蛋白1	0.77	1.09	1.75E-05	15q24-q25	162695	IncytePD：1741526	Hs.19348	FLJ13119	假定的蛋白FLJ13119	1.56	1.1	0.00131	15	169102	IncytePD：1978282
Hs.194816	STOML1	Stomatin(EBP72)样蛋白1	0.77	1.09	1.75E-05	15q24-q25	162695	IncytePD：1741526			未知	0.6	1.09	0.000147		165108	IncytePD：2685601
Hs.84790	KIAA0225	KIAA0225蛋白	0.75	1.09	0.000582	7	160472	IncytePD：482519			未知	0.6	1.09	0.000147		165108	IncytePD：2685601
Hs.84790	KIAA0225	KIAA0225蛋白	0.75	1.09	0.000582	7	160472	IncytePD：482519	Hs.80976	MKI67	单抗Ki-67所鉴别的抗原	0.75	1.09	0.000642	10q25-qter	160039	IncytePD：2470485
Hs.89578	GTF2H1	通用转录因子IIH，多肽1(62kD亚基)	0.72	1.08	6.25E-06	11p15.1-p14	164987	IncytePD：37249	Hs.80976	MKI67	单抗Ki-67所鉴别的抗原	0.75	1.09	0.000642	10q25-qter	160039	IncytePD：2470485
Hs.89578	GTF2H1	通用转录因子IIH，多肽1(62kD亚基)	0.72	1.08	6.25E-06	11p15.1-p14	164987	IncytePD：37249	Hs.27744	RAB3A	RAB3A，成员RAS癌基因家族	0.58	1.08	4.38E-05	19p13.2	160099	IncytePD：1381611
Hs.2281	CHGB	嗜铬粒蛋白B(分泌粒蛋白1)	0.64	1.08	0.000171	20pter-p12	160078	IncytePD：2821341	Hs.27744	RAB3A	RAB3A，成员RAS癌基因家族	0.58	1.08	4.38E-05	19p13.2	160099	IncytePD：1381611
Hs.2281	CHGB	嗜铬粒蛋白B(分泌粒蛋白1)	0.64	1.08	0.000171	20pter-p12	160078	IncytePD：2821341	Hs.92282	PITX2	配对样的同结构域转录因子2	0.75	1.08	0.00023	4q25-q27	160123	IncytePD：2794019
Hs.194694	MAP3K6	促分裂原激活的蛋白激酶激酶激酶6	0.8	1.08	0.00119	1	161091	IncytePD：1650939	Hs.92282	PITX2	配对样的同结构域转录因子2	0.75	1.08	0.00023	4q25-q27	160123	IncytePD：2794019
Hs.194694	MAP3K6	促分裂原激活的蛋白激酶激酶激酶6	0.8	1.08	0.00119	1	161091	IncytePD：1650939	Hs.7984	PSCD3	普列克底物蛋白同源物，Sec7和卷曲/卷曲结构域3	0.77	1.07	4.69E-05	7	159887	IncytePD：3029341
Hs.158249	KIAA0406	KIAA0406基因产物	0.85	1.07	0.000397	20	159825	IncytePD：1618693	Hs.7984	PSCD3	普列克底物蛋白同源物，Sec7和卷曲/卷曲结构域3	0.77	1.07	4.69E-05	7	159887	IncytePD：3029341
Hs.158249	KIAA0406	KIAA0406基因产物	0.85	1.07	0.000397	20	159825	IncytePD：1618693	Hs.61712	PDK1	丙酮酸脱氢酶激酶，同工酶1	0.66	1.07	0.00057	2p14-q14.3	160462	IncytePD：268900
Hs.126263		EST，与A38712纤维蛋白高度相似	3.36	1.07	0.000908	5	167474	IncytePD：1266194	Hs.61712	PDK1	丙酮酸脱氢酶激酶，同工酶1	0.66	1.07	0.00057	2p14-q14.3	160462	IncytePD：268900
Hs.126263		EST，与A38712纤维蛋白高度相似	3.36	1.07	0.000908	5	167474	IncytePD：1266194	Hs.25648	TNFRSF5	肿瘤坏死因子受体超家族，成员5	0.76	1.07	0.000966	20q12-q13.2	166055	IncytePD：549096
Hs.239818	PIK3CB	磷酸肌醇-3-激酶，催化性，β多肽	0.78	1.07	0.00114	3q24	160414	IncytePD：267803	Hs.25648	TNFRSF5	肿瘤坏死因子受体超家族，成员5	0.76	1.07	0.000966	20q12-q13.2	166055	IncytePD：549096
Hs.239818	PIK3CB	磷酸肌醇-3-激酶，催化性，β多肽	0.78	1.07	0.00114	3q24	160414	IncytePD：267803	Hs.656	CDC25C	细胞分裂周期蛋白25C	0.79	1.07	0.00118	5q31	165792	IncytePD：876382
Hs.288319	SART1	被T细胞识别的鳞状细胞癌抗原	0.62	1.07	0.00164	11cen-q12.3	164720	IncytePD：2205225	Hs.656	CDC25C	细胞分裂周期蛋白25C	0.79	1.07	0.00118	5q31	165792	IncytePD：876382
Hs.288319	SART1	被T细胞识别的鳞状细胞癌抗原	0.62	1.07	0.00164	11cen-q12.3	164720	IncytePD：2205225	Hs.180878	LPL	脂蛋白脂酶	0.73	1.06	0.000259	8p22	160485	IncytePD：647128
Hs.136309	SH3GLB1	SH3-结构域，GRB2-样，内菲林(endophilin)B1	1.51	1.06	0.000559	1p22	162621	IncytePD：1552337	Hs.180878	LPL	脂蛋白脂酶	0.73	1.06	0.000259	8p22	160485	IncytePD：647128
Hs.136309	SH3GLB1	SH3-结构域，GRB2-样，内菲林(endophilin)B1	1.51	1.06	0.000559	1p22	162621	IncytePD：1552337	Hs.3686	KIAA0978	KIAA0978蛋白	1.44	1.06	0.000801	20	164187	IncytePD：2234421

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.146007		智人克隆IMAGE 21721	1.75	1.06	0.00173	2	162822	IncytePD：3143449
Hs.22785	GABRE	γ-氨酪酸(GABA)A受体，ε	0.73	1.05	0.000142	Xq28	159794	IncytePD：3213034	Hs.146007		智人克隆IMAGE 21721	1.75	1.06	0.00173	2	162822	IncytePD：3143449
Hs.22785	GABRE	γ-氨酪酸(GABA)A受体，ε	0.73	1.05	0.000142	Xq28	159794	IncytePD：3213034	Hs.296287		类似于含溴结构域4，克隆IMAGE：3542455	1.9	1.05	0.000244		169290	IncytePD：2310314
Hs.152251	FZD5	蜷缩(果蝇属)同源物5	0.56	1.05	0.000528	2q33-q34	164899	IncytePD：3129290	Hs.296287		类似于含溴结构域4，克隆IMAGE：3542455	1.9	1.05	0.000244		169290	IncytePD：2310314
Hs.152251	FZD5	蜷缩(果蝇属)同源物5	0.56	1.05	0.000528	2q33-q34	164899	IncytePD：3129290	Hs.673	IL12A	白介素12A(天然杀伤细胞刺激因子1)	0.85	1.05	0.000696	3p12-q13.2	162579	IncytePD：2760318
Hs.155160	SRP46	剪接因子，富含精氨酸/丝氨酸，46kD	1.43	1.04	0.000442	11q22	168577	IncytePD：886075	Hs.673	IL12A	白介素12A(天然杀伤细胞刺激因子1)	0.85	1.05	0.000696	3p12-q13.2	162579	IncytePD：2760318
Hs.155160	SRP46	剪接因子，富含精氨酸/丝氨酸，46kD	1.43	1.04	0.000442	11q22	168577	IncytePD：886075	Hs.151393	GCLC	谷胺酸半胱氨酸连接酶，催化亚基	0.53	1.04	0.000479	6p12	166059	IncytePD：818192
Hs.82927	AMPD2	腺苷单磷酸脱氨酶2(同工型L)	0.82	1.04	0.00163	1p13.3	162188	IncytePD：1968035	Hs.151393	GCLC	谷胺酸半胱氨酸连接酶，催化亚基	0.53	1.04	0.000479	6p12	166059	IncytePD：818192
Hs.82927	AMPD2	腺苷单磷酸脱氨酶2(同工型L)	0.82	1.04	0.00163	1p13.3	162188	IncytePD：1968035	Hs.2175	CSF3R	集落刺激因子3受体(粒细胞)	0.8	1.03	6.46E-05	1p35-p34.3	160114	IncytePD：1596060
Hs.286132	MN7	D15F37(假基因)	0.63	1.03	0.000275	15q11-q13	167399	IncytePD：2739109	Hs.2175	CSF3R	集落刺激因子3受体(粒细胞)	0.8	1.03	6.46E-05	1p35-p34.3	160114	IncytePD：1596060
Hs.286132	MN7	D15F37(假基因)	0.63	1.03	0.000275	15q11-q13	167399	IncytePD：2739109	Hs.5716	KIAA0310	KIAA0310基因产物	1.39	1.03	0.00185	9q34.2-9q34.3	169169	IncytePD：1880859
Hs.104519	PLD2	磷脂酶D2	0.67	1.02	5.23E-05	17p13.1	159999	IncytePD：3472725	Hs.5716	KIAA0310	KIAA0310基因产物	1.39	1.03	0.00185	9q34.2-9q34.3	169169	IncytePD：1880859
Hs.104519	PLD2	磷脂酶D2	0.67	1.02	5.23E-05	17p13.1	159999	IncytePD：3472725	Hs.74502	CTRB1	胰凝乳蛋白酶原B1	0.73	1.02	8.55E-05	16q23-q24.1	159787	IncytePD：2070278
Hs.288872	FLJ21439	假定的蛋白FLJ21439	1.46	1.02	0.000263	15q14	168393	IncytePD：1998519	Hs.74502	CTRB1	胰凝乳蛋白酶原B1	0.73	1.02	8.55E-05	16q23-q24.1	159787	IncytePD：2070278
Hs.288872	FLJ21439	假定的蛋白FLJ21439	1.46	1.02	0.000263	15q14	168393	IncytePD：1998519	Hs.57600	AP1S1	衔接子相关蛋白复合物1，sigma 1亚基	0.69	1.02	0.000299	7	160042	IncytePD：1804181
Hs.17409	CRIP1	富含半胱氨酸的蛋白1(肠的)	1.5	1.02	0.00123	7q11.23	169514	IncytePD：2121863	Hs.57600	AP1S1	衔接子相关蛋白复合物1，sigma 1亚基	0.69	1.02	0.000299	7	160042	IncytePD：1804181
Hs.17409	CRIP1	富含半胱氨酸的蛋白1(肠的)	1.5	1.02	0.00123	7q11.23	169514	IncytePD：2121863	Hs.4748	ADCYAP1RI	腺苷酸环化酶激活多肽1(垂体)受体，I性	0.79	1.01	5.99E-05	7p14	161460	IncytePD：3214293
Hs.25197	STUB1	STIP1同源和含U-Box的蛋白1	0.69	1.01	0.000183	16	160555	IncytePD：1315677	Hs.4748	ADCYAP1RI	腺苷酸环化酶激活多肽1(垂体)受体，I性	0.79	1.01	5.99E-05	7p14	161460	IncytePD：3214293
Hs.25197	STUB1	STIP1同源和含U-Box的蛋白1	0.69	1.01	0.000183	16	160555	IncytePD：1315677	Hs.34045	FLJ20764	假定的蛋白FLJ20764	1.56	1.01	0.000814	14	168581	IncytePD：901577
Hs.95262	NFRKB	与kappaB结合蛋白有关的核因子	0.79	1.01	0.000825	11q24-q25	167698	IncytePD：1685182	Hs.34045	FLJ20764	假定的蛋白FLJ20764	1.56	1.01	0.000814	14	168581	IncytePD：901577
Hs.95262	NFRKB	与kappaB结合蛋白有关的核因子	0.79	1.01	0.000825	11q24-q25	167698	IncytePD：1685182	Hs.858	RELB	v-rel禽网状内皮增殖病病毒癌基因同源物B(在B-细胞3中的κ轻链多肽基因增强子的核因子)	0.84	1.01	0.000971	19q13.2	164810	IncytePD：1859449
Hs.180941	VPS41	分拣空泡蛋白41(酵母同源物)	0.63	1	1.26E-05	7p14-p13	159888	IncytePD：2910949	Hs.858	RELB	v-rel禽网状内皮增殖病病毒癌基因同源物B(在B-细胞3中的κ轻链多肽基因增强子的核因子)	0.84	1.01	0.000971	19q13.2	164810	IncytePD：1859449
Hs.180941	VPS41	分拣空泡蛋白41(酵母同源物)	0.63	1	1.26E-05	7p14-p13	159888	IncytePD：2910949	Hs.80618	FLJ20015	假设蛋白	1.43	1	0.000573	17q25	163363	IncytePD：2043391
Hs.75596	IL2RB	白介素2受体，β	0.69	1	0.000688	22q13.1	159942	IncytePD：3936210	Hs.80618	FLJ20015	假设蛋白	1.43	1	0.000573	17q25	163363	IncytePD：2043391
Hs.75596	IL2RB	白介素2受体，β	0.69	1	0.000688	22q13.1	159942	IncytePD：3936210	Hs.99216		EST，类似于ALU8_人Alu亚家族SX序列	1.49	1	0.000878	15	169148	IncytePD：2285350
Hs.155314	KIAA0095	KIAA0095基因产物	0.75	1	0.000994	16q22.1-q22.3	162213	IncytePD：268942	Hs.99216		EST，类似于ALU8_人Alu亚家族SX序列	1.49	1	0.000878	15	169148	IncytePD：2285350

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.687	CYP4B1	细胞色素P450，亚家族IVB，多肽1	0.85	1	0.00114	1p34-p12	167183	IncytePD：856900
Hs.75807	PDLIM1	PDZ和LIM结构域1(elfin)	1.63	1	0.00145	10q22-q26.3	160215	IncytePD：2132217	Hs.687	CYP4B1	细胞色素P450，亚家族IVB，多肽1	0.85	1	0.00114	1p34-p12	167183	IncytePD：856900
Hs.75807	PDLIM1	PDZ和LIM结构域1(elfin)	1.63	1	0.00145	10q22-q26.3	160215	IncytePD：2132217			未知	0.66	1	0.00164		159927	IncytePD：2606307
Hs.41587	RAD50	RAD50(酿酒酵母)同源物	0.57	1	0.00183	5q31	160088	IncytePD：1515426			未知	0.66	1	0.00164		159927	IncytePD：2606307
Hs.41587	RAD50	RAD50(酿酒酵母)同源物	0.57	1	0.00183	5q31	160088	IncytePD：1515426	Hs.75887	COPA	外被体蛋白复合物，亚基α	0.73	0.99	6.55E-06	1q23-q25	159890	IncytePD：3296228
Hs.25566		EST	1.3	0.99	8.89E-06	22	168197	IncytePD：948796	Hs.75887	COPA	外被体蛋白复合物，亚基α	0.73	0.99	6.55E-06	1q23-q25	159890	IncytePD：3296228
Hs.25566		EST	1.3	0.99	8.89E-06	22	168197	IncytePD：948796	Hs.274	MATK	巨核细胞相关的酪氨酸激酶	0.61	0.99	1.64E-05	19p13.3	160015	IncytePD：1515980
Hs.347527	SLC20A2	溶质载体家族20(磷酸转运蛋白)，成员2	0.66	0.99	0.000333	8p12-q21	159936	IncytePD：2942938	Hs.274	MATK	巨核细胞相关的酪氨酸激酶	0.61	0.99	1.64E-05	19p13.3	160015	IncytePD：1515980
Hs.347527	SLC20A2	溶质载体家族20(磷酸转运蛋白)，成员2	0.66	0.99	0.000333	8p12-q21	159936	IncytePD：2942938	Hs.242947	DGKI	二酰甘油激酶，iota	0.61	0.99	0.000358	7q32.3-q33	161826	IncytePD：3108609
Hs.2301	DBH	多巴胺β-羟基酶(多巴胺β-单加氧酶)	2.82	0.99	0.000375	9q34	168202	IncytePD：1294466	Hs.242947	DGKI	二酰甘油激酶，iota	0.61	0.99	0.000358	7q32.3-q33	161826	IncytePD：3108609
Hs.2301	DBH	多巴胺β-羟基酶(多巴胺β-单加氧酶)	2.82	0.99	0.000375	9q34	168202	IncytePD：1294466	Hs.172148		EST	1.29	0.99	0.000784	5	163746	IncytePD：929090
Hs.99899	TNFSF7	肿瘤坏死因子(配体)超家族，成员7	0.74	0.99	0.000801	19p13	159817	IncytePD：2017463	Hs.172148		EST	1.29	0.99	0.000784	5	163746	IncytePD：929090
Hs.99899	TNFSF7	肿瘤坏死因子(配体)超家族，成员7	0.74	0.99	0.000801	19p13	159817	IncytePD：2017463	Hs.99236	RGS20	G-蛋白信号的调节物20	0.71	0.98	1.53E-05	8	161959	IncytePD：4711030
Hs.262958	DKFZP434B044	假定的蛋白DKFZp434B044	1.72	0.98	7.45E-05	16	169042	IncytePD：211389	Hs.99236	RGS20	G-蛋白信号的调节物20	0.71	0.98	1.53E-05	8	161959	IncytePD：4711030
Hs.262958	DKFZP434B044	假定的蛋白DKFZp434B044	1.72	0.98	7.45E-05	16	169042	IncytePD：211389	Hs.57847		EST，类似于ICE4_人CASPASE-4前体	1.47	0.98	0.000208	11	165194	IncytePD：1362601
Hs.155227	EPHB4	EphB4	0.7	0.98	0.000257	7q22	168938	IncytePD：2056923	Hs.57847		EST，类似于ICE4_人CASPASE-4前体	1.47	0.98	0.000208	11	165194	IncytePD：1362601
Hs.155227	EPHB4	EphB4	0.7	0.98	0.000257	7q22	168938	IncytePD：2056923	Hs.72550	HMMR	透明质介导的运动性受体(RHAMM)	0.55	0.98	0.000352	5q33.2-qter	167575	IncytePD：3622417
		未知	0.7	0.98	0.000356		166536	IncytePD：1681876	Hs.72550	HMMR	透明质介导的运动性受体(RHAMM)	0.55	0.98	0.000352	5q33.2-qter	167575	IncytePD：3622417
		未知	0.7	0.98	0.000356		166536	IncytePD：1681876			未知	0.64	0.98	0.000536		159962	IncytePD：1570216
Hs.296348	DLST	二氢硫辛酰胺S-琥珀酸转移酶	0.49	0.98	0.00151	14q24.3	165547	IncytePD：1830335			未知	0.64	0.98	0.000536		159962	IncytePD：1570216
Hs.296348	DLST	二氢硫辛酰胺S-琥珀酸转移酶	0.49	0.98	0.00151	14q24.3	165547	IncytePD：1830335	Hs.3094	KIAA0063	KIAA0063基因产物	0.66	0.97	9.45E-05	22q13.1	160091	IncytePD：3227603
Hs.32966	GUCA2B	鸟苷酸环化酶激活物2B(uroguanylin)	0.62	0.97	0.000159	1p34-p33	164851	IncytePD：1806219	Hs.3094	KIAA0063	KIAA0063基因产物	0.66	0.97	9.45E-05	22q13.1	160091	IncytePD：3227603
Hs.32966	GUCA2B	鸟苷酸环化酶激活物2B(uroguanylin)	0.62	0.97	0.000159	1p34-p33	164851	IncytePD：1806219			未知	0.79	0.97	0.00121		164791	IncytePD：3190386
Hs.190189		EST	1.33	0.97	0.00172	1	163286	IncytePD：1679304			未知	0.79	0.97	0.00121		164791	IncytePD：3190386
Hs.190189		EST	1.33	0.97	0.00172	1	163286	IncytePD：1679304	Hs.733	EPB42	红细胞膜蛋白条带4.2	0.62	0.96	2.93E-05	15q15-q21	160067	IncytePD：2052032
Hs.5947	MEL	mel转化癌基因-RAB8同源物	0.56	0.96	4.47E-05	19p13.1	160104	IncytePD：1553995	Hs.733	EPB42	红细胞膜蛋白条带4.2	0.62	0.96	2.93E-05	15q15-q21	160067	IncytePD：2052032

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.169536	RHAG	恒河猴血型相关的糖蛋白	0.67	0.96	0.000193	6p21.1-p11	164916	IncytePD：2048319
Hs.121521	ABL2	y-abl Abelson鼠白血病病毒癌基因同源物2	0.64	0.96	0.000889	1q24-q25	166612	IncytePD：1536149	Hs.169536	RHAG	恒河猴血型相关的糖蛋白	0.67	0.96	0.000193	6p21.1-p11	164916	IncytePD：2048319
Hs.121521	ABL2	y-abl Abelson鼠白血病病毒癌基因同源物2	0.64	0.96	0.000889	1q24-q25	166612	IncytePD：1536149	Hs.112819		EST	1.41	0.96	0.000924	1	168969	IncytePD：2445101
Hs.277445	DGKZ	二酰甘油激酶，zeta(104kD)	0.75	0.96	0.00194	11p11.2	159822	IncytePD：1875986	Hs.112819		EST	1.41	0.96	0.000924	1	168969	IncytePD：2445101
Hs.277445	DGKZ	二酰甘油激酶，zeta(104kD)	0.75	0.96	0.00194	11p11.2	159822	IncytePD：1875986	Hs.26915	SPTBN2	血影蛋白，β，非红细胞型2	0.63	0.95	0.000154	11q13	160846	IncytePD：1594108
Hs.12773	ACOX3	乙酰-辅酶A氧化酶3，降植烷基(pristanoyl)	0.74	0.95	0.000187	4p15.3	162487	IncytePD：3520054	Hs.26915	SPTBN2	血影蛋白，β，非红细胞型2	0.63	0.95	0.000154	11q13	160846	IncytePD：1594108
Hs.12773	ACOX3	乙酰-辅酶A氧化酶3，降植烷基(pristanoyl)	0.74	0.95	0.000187	4p15.3	162487	IncytePD：3520054	Hs.79123	KIAA0084	KIAA0084蛋白	0.7	0.95	0.000231	3p25.3-p25.1	159886	IncytePD：2697959
Hs.334841	SELENBP1	硒结合蛋白1	0.54	0.95	0.00043	1q21-q22	169315	IncytePD：2591494	Hs.79123	KIAA0084	KIAA0084蛋白	0.7	0.95	0.000231	3p25.3-p25.1	159886	IncytePD：2697959
Hs.334841	SELENBP1	硒结合蛋白1	0.54	0.95	0.00043	1q21-q22	169315	IncytePD：2591494	Hs.2969	SKI	v-ski禽肉瘤病毒癌基因同源物	1.65	0.95	0.000604	1q22-q24	164039	IncytePD：3283271
Hs.37129	SCNN1B	钠通道，非电压门控型1，β(Liddle综合症)	0.75	0.95	0.00083	16p12.2-p12.1	161191	IncytePD：1866654	Hs.2969	SKI	v-ski禽肉瘤病毒癌基因同源物	1.65	0.95	0.000604	1q22-q24	164039	IncytePD：3283271
Hs.37129	SCNN1B	钠通道，非电压门控型1，β(Liddle综合症)	0.75	0.95	0.00083	16p12.2-p12.1	161191	IncytePD：1866654	Hs.25277	FLJ21065	假定的蛋白FLJ21065	1.25	0.94	7.57E-06	5	164202	IncytePD：2419078
Hs.83155	ALDH3B1	醛脱氢酶3家族，成员B1	0.58	0.94	8.76E-05	11q13	159838	IncytePD：2610218	Hs.25277	FLJ21065	假定的蛋白FLJ21065	1.25	0.94	7.57E-06	5	164202	IncytePD：2419078
Hs.83155	ALDH3B1	醛脱氢酶3家族，成员B1	0.58	0.94	8.76E-05	11q13	159838	IncytePD：2610218	Hs.24341	TAZ	具有PDZ结合基序的转录共激活物(TAZ)	1.27	0.94	9.26E-05	3q23-q24	164176	IncytePD：2345776
Hs.172458	IDS	艾杜糖2-硫酸酯酶(亨特综合征)	0.74	0.94	0.000322	Xq28	160243	IncytePD：549290	Hs.24341	TAZ	具有PDZ结合基序的转录共激活物(TAZ)	1.27	0.94	9.26E-05	3q23-q24	164176	IncytePD：2345776
Hs.172458	IDS	艾杜糖2-硫酸酯酶(亨特综合征)	0.74	0.94	0.000322	Xq28	160243	IncytePD：549290	Hs.55279	SERPINB5	丝氨酸(或半胱氨酸)蛋白酶抑制物，成员5	0.62	0.94	0.00158	18q21.3	162215	IncytePD：460034
Hs.209587		EST，稍类似于138022假设蛋白	1.58	0.94	0.00167	11	163251	IncytePD：1875433	Hs.55279	SERPINB5	丝氨酸(或半胱氨酸)蛋白酶抑制物，成员5	0.62	0.94	0.00158	18q21.3	162215	IncytePD：460034
Hs.209587		EST，稍类似于138022假设蛋白	1.58	0.94	0.00167	11	163251	IncytePD：1875433	Hs.118354	CAT56	CAT56蛋白	0.69	0.93	4.71E-05	6	165027	IncytePD：3518549
Hs.182577	INPP5B	肌醇多磷酸-5-磷酸酶，75kD	0.74	0.93	0.000417	1p34	160074	IncytePD：1291948	Hs.118354	CAT56	CAT56蛋白	0.69	0.93	4.71E-05	6	165027	IncytePD：3518549
Hs.182577	INPP5B	肌醇多磷酸-5-磷酸酶，75kD	0.74	0.93	0.000417	1p34	160074	IncytePD：1291948	Hs.81454	KHK	己酮糖激酶(果糖激酶)	0.65	0.93	0.000434	2p23.3-p23.2	159931	IncytePD：2516508
Hs.76688	CES1	羧酸酯酶1(单核细胞/巨噬细胞丝氨酸脂酶1)	0.18	0.93	0.000591	16q13-q22.1	164490	IncytePD：1813269	Hs.81454	KHK	己酮糖激酶(果糖激酶)	0.65	0.93	0.000434	2p23.3-p23.2	159931	IncytePD：2516508
Hs.76688	CES1	羧酸酯酶1(单核细胞/巨噬细胞丝氨酸脂酶1)	0.18	0.93	0.000591	16q13-q22.1	164490	IncytePD：1813269	Hs.239499	KIAA0185	KIAA0185蛋白	1.36	0.93	0.000722	10	168413	IncytePD：514653
Hs.151738	MMP9	基质金属蛋白酶9(白明胶酶B，92kD)	0.56	0.93	0.000722	20q11.2-q13.1	159912	IncytePD：1274074	Hs.239499	KIAA0185	KIAA0185蛋白	1.36	0.93	0.000722	10	168413	IncytePD：514653
Hs.151738	MMP9	基质金属蛋白酶9(白明胶酶B，92kD)	0.56	0.93	0.000722	20q11.2-q13.1	159912	IncytePD：1274074	Hs.186564		EST	1.38	0.93	0.000816	10	163409	IncytePD：1640094
Hs.198166	ATF2	激活转录因子2	0.68	0.93	0.00106	2q32	160057	IncytePD：2208152	Hs.186564		EST	1.38	0.93	0.000816	10	163409	IncytePD：1640094
Hs.198166	ATF2	激活转录因子2	0.68	0.93	0.00106	2q32	160057	IncytePD：2208152	Hs.149957	RPS6KA1	核糖体蛋白S6激酶，90kD，多肽1	0.75	0.93	0.00166	3	160006	IncytePD：1822236
Hs.36566	LIMK1	LIM结构域激酶1	0.6	0.92	4.11E-07	7q11.23	160082	IncytePD：3373632	Hs.149957	RPS6KA1	核糖体蛋白S6激酶，90kD，多肽1	0.75	0.93	0.00166	3	160006	IncytePD：1822236
Hs.36566	LIMK1	LIM结构域激酶1	0.6	0.92	4.11E-07	7q11.23	160082	IncytePD：3373632	Hs.50133		EST	1.52	0.92	6.67E-05	4	168567	IncytePD：1214652

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.14051		智人mRNA；cDNA DKFZp434A2417	1.47	0.92	0.000246	10	168381	IncytePD：1431701
Hs.66731	HOXB13	同源框(homeo box)B13	0.39	0.92	0.000572	17q21.2	159868	IncytePD：1861743	Hs.14051		智人mRNA；cDNA DKFZp434A2417	1.47	0.92	0.000246	10	168381	IncytePD：1431701
Hs.66731	HOXB13	同源框(homeo box)B13	0.39	0.92	0.000572	17q21.2	159868	IncytePD：1861743	Hs.85087	LTBP4	潜伏转化生长因子β结合蛋白4	0.68	0.92	0.000854	19q13.1-q13.2	159923	IncytePD：1956831
Hs.239706	GAB1	GRB2相关的结合蛋白1	0.67	0.92	0.000933	4	162416	IncytePD：5066144	Hs.85087	LTBP4	潜伏转化生长因子β结合蛋白4	0.68	0.92	0.000854	19q13.1-q13.2	159923	IncytePD：1956831
Hs.239706	GAB1	GRB2相关的结合蛋白1	0.67	0.92	0.000933	4	162416	IncytePD：5066144	Hs.77554		cDNA FLJ14967 fis，类似于锌指蛋白84	4	0.92	0.0012	12	165454	IncytePD：1782052
Hs.14805	SLC21A11	溶质载体家族21(有机阴离子转运蛋白)，成员11	1.49	0.92	0.00159	15q26	168293	IncytePD：408522	Hs.77554		cDNA FLJ14967 fis，类似于锌指蛋白84	4	0.92	0.0012	12	165454	IncytePD：1782052
Hs.14805	SLC21A11	溶质载体家族21(有机阴离子转运蛋白)，成员11	1.49	0.92	0.00159	15q26	168293	IncytePD：408522	Hs.94498	LILRA2	白细胞免疫球蛋白样受体，亚家族A成员2	0.71	0.91	0.000459	19q13.4	161424	IncytePD：3336057
Hs.799	DTR	白喉毒素受体(肝素-结合EGF-样生长因子)	0.61	0.91	0.000811	5q23	167412	IncytePD：1862257	Hs.94498	LILRA2	白细胞免疫球蛋白样受体，亚家族A成员2	0.71	0.91	0.000459	19q13.4	161424	IncytePD：3336057
Hs.799	DTR	白喉毒素受体(肝素-结合EGF-样生长因子)	0.61	0.91	0.000811	5q23	167412	IncytePD：1862257	Hs.28274		智人cDNA：FLJ22049 fis，克隆HEP09444	1.47	0.91	0.000856	8	163989	IncytePD：2155690
Hs.8358	FLJ20366	假定的蛋白FLJ20366	1.46	0.91	0.000952	8p22-q22.3	164145	IncytePD：3361529	Hs.28274		智人cDNA：FLJ22049 fis，克隆HEP09444	1.47	0.91	0.000856	8	163989	IncytePD：2155690
Hs.8358	FLJ20366	假定的蛋白FLJ20366	1.46	0.91	0.000952	8p22-q22.3	164145	IncytePD：3361529	Hs.293264		EST	1.38	0.91	0.00107	11	168371	IncytePD：829521
Hs.37953	FANCC	凡科尼贫血，补充组C	0.62	0.91	0.00108	9q22.3	160036	IncytePD：3669589	Hs.293264		EST	1.38	0.91	0.00107	11	168371	IncytePD：829521
Hs.37953	FANCC	凡科尼贫血，补充组C	0.62	0.91	0.00108	9q22.3	160036	IncytePD：3669589	Hs.250671	FLJ10140	假定的蛋白FLJ10140	1.47	0.91	0.00142	22q13	168397	IncytePD：642133
Hs.72964	MKRN3	Makorin，环指蛋白，3	0.63	0.91	0.00151	15q11-q13	164803	IncytePD：3181021	Hs.250671	FLJ10140	假定的蛋白FLJ10140	1.47	0.91	0.00142	22q13	168397	IncytePD：642133
Hs.72964	MKRN3	Makorin，环指蛋白，3	0.63	0.91	0.00151	15q11-q13	164803	IncytePD：3181021	Hs.80683	MTRF1	线粒体的翻译释放因子1	1.24	0.91	0.00161	13q14.1-14.3	160533	IncytePD：1462246
Hs.79516	BASP1	脑丰富的，膜附着的信号蛋白1	0.62	0.9	2.60E-05	5p15.1-p14	159882	IncytePD：4008301	Hs.80683	MTRF1	线粒体的翻译释放因子1	1.24	0.91	0.00161	13q14.1-14.3	160533	IncytePD：1462246
Hs.79516	BASP1	脑丰富的，膜附着的信号蛋白1	0.62	0.9	2.60E-05	5p15.1-p14	159882	IncytePD：4008301	Hs.87539	ALDH3B2	醛脱氢酶3家族，成员B2	0.68	0.9	2.96E-05	11q13	166071	IncytePD：966447
Hs.38586	HSD3B1	羟基-δ-5-类固醇脱氢酶	0.64	0.9	0.000159	1p13.1	164787	IncytePD：182802	Hs.87539	ALDH3B2	醛脱氢酶3家族，成员B2	0.68	0.9	2.96E-05	11q13	166071	IncytePD：966447
Hs.38586	HSD3B1	羟基-δ-5-类固醇脱氢酶	0.64	0.9	0.000159	1p13.1	164787	IncytePD：182802	Hs.67688		EST	0.59	0.9	0.000311	6	162920	IncytePD：2789893
Hs.105584	RPS6KA4	核糖体蛋白S6激酶，90kD，多肽4	1.8	0.9	0.000409	11q11-q13	168189	IncytePD：2110163	Hs.67688		EST	0.59	0.9	0.000311	6	162920	IncytePD：2789893
Hs.105584	RPS6KA4	核糖体蛋白S6激酶，90kD，多肽4	1.8	0.9	0.000409	11q11-q13	168189	IncytePD：2110163	Hs.24719	MAP-1	凋亡调节蛋白1	1.45	0.9	0.00108	14q32	168618	IncytePD：1967338
Hs.6232	KIAA0764	KIAA0764基因产物	1.36	0.9	0.00117	2pter-p25.1	163561	IncytePD：2043486	Hs.24719	MAP-1	凋亡调节蛋白1	1.45	0.9	0.00108	14q32	168618	IncytePD：1967338
Hs.6232	KIAA0764	KIAA0764基因产物	1.36	0.9	0.00117	2pter-p25.1	163561	IncytePD：2043486	Hs.73792	CR2	补体成分(3d/Epstein Barr病毒)受体2	0.59	0.9	0.00181	1q32	160032	IncytePD：3055203
Hs.134342	LOC55915	针对睾丸特异的阿霉素敏感蛋白的TASP	1.44	0.9	0.00185	7q31.1-7q31.33	163421	IncytePD：1538396	Hs.73792	CR2	补体成分(3d/Epstein Barr病毒)受体2	0.59	0.9	0.00181	1q32	160032	IncytePD：3055203
Hs.134342	LOC55915	针对睾丸特异的阿霉素敏感蛋白的TASP	1.44	0.9	0.00185	7q31.1-7q31.33	163421	IncytePD：1538396	Hs.33074		智人，克隆IMAGE：3606519，mRNA，部分cds	1.36	0.89	0.000275	8	168589	IncytePD：1431969
Hs.83795	IRF2	干扰素调节因子2	0.54	0.89	0.000848	4q34.1-q35.1	161188	IncytePD：2174666	Hs.33074		智人，克隆IMAGE：3606519，mRNA，部分cds	1.36	0.89	0.000275	8	168589	IncytePD：1431969
Hs.83795	IRF2	干扰素调节因子2	0.54	0.89	0.000848	4q34.1-q35.1	161188	IncytePD：2174666	Hs.81217	FZD2	蜷缩(果蝇属)同源物2	0.57	0.88	1.46E-06	17q21.1	160028	IncytePD：2214002

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.92357	GALK1	乳糖激酶1	5.62	0.88	3.65E-05	17q24	169675	IncytePD：1215248
Hs.119273	KIAA0296	KIAA0296基因产物	0.53	0.88	6.98E-05	16p13.13-16p12.3	159951	IncytePD：3422646	Hs.92357	GALK1	乳糖激酶1	5.62	0.88	3.65E-05	17q24	169675	IncytePD：1215248
Hs.119273	KIAA0296	KIAA0296基因产物	0.53	0.88	6.98E-05	16p13.13-16p12.3	159951	IncytePD：3422646	Hs.194148	YES1	v-yes-1 Yamaguchi肉瘤病毒癌基因同源物1	0.64	0.88	9.16E-05	18p11.31-p11.21	159875	IncytePD：1887736
Hs.37054	EFNA3	ephrin-A3	0.69	0.88	0.000423	1q21-q22	161846	IncytePD：4178495	Hs.194148	YES1	v-yes-1 Yamaguchi肉瘤病毒癌基因同源物1	0.64	0.88	9.16E-05	18p11.31-p11.21	159875	IncytePD：1887736
Hs.37054	EFNA3	ephrin-A3	0.69	0.88	0.000423	1q21-q22	161846	IncytePD：4178495	Hs.23643	MST4	丝氨酸/苏氨酸蛋白激酶MASK	0.65	0.88	0.00108	X	163410	IncytePD：2793922
Hs.266959	HBG1	血红蛋白，γA	5.75	0.87	2.57E-05	11p15.5	168326	IncytePD：2156647	Hs.23643	MST4	丝氨酸/苏氨酸蛋白激酶MASK	0.65	0.88	0.00108	X	163410	IncytePD：2793922
Hs.266959	HBG1	血红蛋白，γA	5.75	0.87	2.57E-05	11p15.5	168326	IncytePD：2156647	Hs.53478		智人cDNA FLJ12366 fis，克隆MAMMA1002411	1.34	0.87	5.78E-05	21	168383	IncytePD：1366043
Hs.283822	RHD	恒河猴血型，D抗原	0.69	0.87	6.17E-05	1p36.2-p34.1	164821	IncytePD：1668024	Hs.53478		智人cDNA FLJ12366 fis，克隆MAMMA1002411	1.34	0.87	5.78E-05	21	168383	IncytePD：1366043
Hs.283822	RHD	恒河猴血型，D抗原	0.69	0.87	6.17E-05	1p36.2-p34.1	164821	IncytePD：1668024	Hs.118804	ENO3	烯醇化酶3，(β，肌肉)	0.4	0.87	8.49E-05	17pter-p11	164468	IncytePD：1719955
Hs.772	GYS1	糖原合成酶1(肌肉)	0.59	0.87	0.000112	19q13.3	160222	IncytePD：172916	Hs.118804	ENO3	烯醇化酶3，(β，肌肉)	0.4	0.87	8.49E-05	17pter-p11	164468	IncytePD：1719955
Hs.772	GYS1	糖原合成酶1(肌肉)	0.59	0.87	0.000112	19q13.3	160222	IncytePD：172916	Hs.77448	ALDH4A1	醛脱氢酶4家族，成员A1	0.66	0.87	0.00135	1p36	166147	IncytePD：831794
Hs.29640	RECK	回复诱导的、富含半胱氨酸的蛋白，具kazal基序	1.42	0.87	0.00172	9p13-p12	168569	IncytePD：2058483	Hs.77448	ALDH4A1	醛脱氢酶4家族，成员A1	0.66	0.87	0.00135	1p36	166147	IncytePD：831794
Hs.29640	RECK	回复诱导的、富含半胱氨酸的蛋白，具kazal基序	1.42	0.87	0.00172	9p13-p12	168569	IncytePD：2058483	Hs.93780		EST	1.12	0.87	0.00176		164377	IncytePD：2654539
Hs.11713	ELF5	E74-样因子5(ets结构域转录因子)	0.7	0.87	0.0018	11p13-p15	161000	IncytePD：2785892	Hs.93780		EST	1.12	0.87	0.00176		164377	IncytePD：2654539
Hs.11713	ELF5	E74-样因子5(ets结构域转录因子)	0.7	0.87	0.0018	11p13-p15	161000	IncytePD：2785892	Hs.97087	CD3Z	CD3Z抗原，zeta多肽(TiT3复合物)	0.6	0.85	0.000152	1q22-q23	160043	IncytePD：3227409
Hs.118795	FLJ10008	假定的蛋白FLJ10008	1.11	0.82	0.000317	14q22.1-q22.3	166653	IncytePD：2316425	Hs.97087	CD3Z	CD3Z抗原，zeta多肽(TiT3复合物)	0.6	0.85	0.000152	1q22-q23	160043	IncytePD：3227409
Hs.118795	FLJ10008	假定的蛋白FLJ10008	1.11	0.82	0.000317	14q22.1-q22.3	166653	IncytePD：2316425	Hs.17384		EST	1.16	0.82	0.000347	4	163225	IncytePD：2293931
Hs.1019	PTHR1	甲状旁腺激素受体1	0.66	0.82	0.00102	3p22-p21.1	160109	IncytePD：1375235	Hs.17384		EST	1.16	0.82	0.000347	4	163225	IncytePD：2293931
Hs.1019	PTHR1	甲状旁腺激素受体1	0.66	0.82	0.00102	3p22-p21.1	160109	IncytePD：1375235	Hs.77667	LY6E	淋巴细胞抗原6复合物，基因座E	0.56	0.82	0.00145	8q24.3	162145	IncytePD：1472042
Hs.4988		智人克隆24711 mRNA序列	1.26	0.81	0.000274	2	160165	IncytePD：2061405	Hs.77667	LY6E	淋巴细胞抗原6复合物，基因座E	0.56	0.82	0.00145	8q24.3	162145	IncytePD：1472042
Hs.4988		智人克隆24711 mRNA序列	1.26	0.81	0.000274	2	160165	IncytePD：2061405	Hs.10669	DDEF1	发育分化增强因子1	1.14	0.81	0.000896	8q24.1-q24.2	164026	IncytePD：2507108
Hs.5353	CASP10	Caspase 10，凋亡相关的半胱氨酸蛋白酶	1.01	0.81	0.00108	2q33-q34	164978	IncytePD：3984879	Hs.10669	DDEF1	发育分化增强因子1	1.14	0.81	0.000896	8q24.1-q24.2	164026	IncytePD：2507108
Hs.5353	CASP10	Caspase 10，凋亡相关的半胱氨酸蛋白酶	1.01	0.81	0.00108	2q33-q34	164978	IncytePD：3984879	Hs.33102	TFAP2B	转录因子AP-2β	0.58	0.81	0.00122	6p12	159845	IncytePD：2816550
Hs.144633	DKFZp434F232	假定的蛋白DKFZp434F2322	1.22	0.8	0.00132	17q24	163237	IncytePD：1473265	Hs.33102	TFAP2B	转录因子AP-2β	0.58	0.81	0.00122	6p12	159845	IncytePD：2816550

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.247423	ADD2	内收蛋白2(β)	0.55	0.79	0.000141	2p14-p13	162687	IncytePD：2112288
Hs.323712	KIAA0615	KIAA0615基因产物	1.3	0.79	0.00026	16q11.2-q12.2	163625	IncytePD：1217554	Hs.247423	ADD2	内收蛋白2(β)	0.55	0.79	0.000141	2p14-p13	162687	IncytePD：2112288
Hs.323712	KIAA0615	KIAA0615基因产物	1.3	0.79	0.00026	16q11.2-q12.2	163625	IncytePD：1217554	Hs.120360	PLA2G6	磷脂酶A2，组VI(胞质型，不依赖于钙的)	0.57	0.79	0.000778	22q13.1	160058	IncytePD：1849872
Hs.73800	SELP	选择蛋白P(颗粒膜蛋白140kD，抗原CD62)	0.65	0.79	0.00156	1q22-q25	160049	IncytePD：3688202	Hs.120360	PLA2G6	磷脂酶A2，组VI(胞质型，不依赖于钙的)	0.57	0.79	0.000778	22q13.1	160058	IncytePD：1849872
Hs.73800	SELP	选择蛋白P(颗粒膜蛋白140kD，抗原CD62)	0.65	0.79	0.00156	1q22-q25	160049	IncytePD：3688202	Hs.65135	KIAA0913	KIAA0913蛋白	1.16	0.78	0.00153	10	162465	IncytePD：2752015
		未知	0.99	0.77	0.000357		161881	IncytePD：2895226	Hs.65135	KIAA0913	KIAA0913蛋白	1.16	0.78	0.00153	10	162465	IncytePD：2752015
		未知	0.99	0.77	0.000357		161881	IncytePD：2895226	Hs.274293		智人mRNA；cDNA DKFZp761G1111	1.28	0.77	0.000542		165504	IncytePD：530360
Hs.153203	MDFI	MyoD家族抑制物	0.46	0.75	0.000138	6p21	163880	IncytePD：2645911	Hs.274293		智人mRNA；cDNA DKFZp761G1111	1.28	0.77	0.000542		165504	IncytePD：530360
Hs.153203	MDFI	MyoD家族抑制物	0.46	0.75	0.000138	6p21	163880	IncytePD：2645911	Hs.103393		EST	1.52	0.75	0.0014	16	163227	IncytePD：291636
Hs.153053	CD37	CD37抗原	0.55	0.74	0.00022	19p13-q13.4	160033	IncytePD：3041162	Hs.103393		EST	1.52	0.75	0.0014	16	163227	IncytePD：291636
Hs.153053	CD37	CD37抗原	0.55	0.74	0.00022	19p13-q13.4	160033	IncytePD：3041162	Hs.98738	GRTH	促性腺素调节的睾丸RNA解旋酶	1.06	0.72	0.000857	11q24	166657	IncytePD：2404557
Hs.180570	CYP4F12	细胞色素P450同工型4F12	0.55	0.72	0.0014	19p13.1	167601	IncytePD：1985566	Hs.98738	GRTH	促性腺素调节的睾丸RNA解旋酶	1.06	0.72	0.000857	11q24	166657	IncytePD：2404557
Hs.180570	CYP4F12	细胞色素P450同工型4F12	0.55	0.72	0.0014	19p13.1	167601	IncytePD：1985566	Hs.50373		EST	5.25	0.7	2.91E-05	9	165500	IncytePD：372922
Hs.131705		EST	1.01	0.7	0.00128	8	165368	IncytePD：1921768	Hs.50373		EST	5.25	0.7	2.91E-05	9	165500	IncytePD：372922
Hs.131705		EST	1.01	0.7	0.00128	8	165368	IncytePD：1921768	Hs.23672	LRP6	低密度脂蛋白受体相关蛋白6	0.3	0.69	7.35E-05	12p11-p13	162040	IncytePD：4290851

表4.用于预测转移的30个显著基因及其在预测模型中计算多因子L值所需的值

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.313	OPN	骨桥蛋白	1.07	3.29	0.00122	4	161923	IncytePD：4327691
Hs.69707	HCGII-7	HCGII-7蛋白	1.07	2.85	0.000512	6	161462	IncytePD：1656490	Hs.313	OPN	骨桥蛋白	1.07	3.29	0.00122	4	161923	IncytePD：4327691
Hs.69707	HCGII-7	HCGII-7蛋白	1.07	2.85	0.000512	6	161462	IncytePD：1656490	Hs.177687	AKR1C4	醛-酮还原酶家族1，成员C4	0.58	2.11	0.000939	10p15-p14	161753	IncytePD：5033671
		未知	0.82	1.74	0.0018		161371	IncytePD：3421817	Hs.177687	AKR1C4	醛-酮还原酶家族1，成员C4	0.58	2.11	0.000939	10p15-p14	161753	IncytePD：5033671
		未知	0.82	1.74	0.0018		161371	IncytePD：3421817	Hs.276916	NR1D1	核受体亚家族1，组D，成员1	0.74	1.71	0.00181	17q11.2	166707	IncytePD：1904760
Hs.211569	GPRK5	G蛋白-偶联受体激酶5	0.99	1.69	0.00147	10q24-qter	161133	IncytePD：1418741	Hs.276916	NR1D1	核受体亚家族1，组D，成员1	0.74	1.71	0.00181	17q11.2	166707	IncytePD：1904760
Hs.211569	GPRK5	G蛋白-偶联受体激酶5	0.99	1.69	0.00147	10q24-qter	161133	IncytePD：1418741	Hs.75573	CENPE	着丝点蛋白E(312kD)	0.82	1.65	1.00E-06	4q24-q25	160128	IncytePD：3081067
Hs.283664	ASPH	天冬氨酸β-羟基酶	0.7	1.56	0.000576	8q12.1	160084	IncytePD：3693273	Hs.75573	CENPE	着丝点蛋白E(312kD)	0.82	1.65	1.00E-06	4q24-q25	160128	IncytePD：3081067
Hs.283664	ASPH	天冬氨酸β-羟基酶	0.7	1.56	0.000576	8q12.1	160084	IncytePD：3693273	Hs.296371	RAB28	RAB28，成员RAS癌基因家族	1.07	1.5	0.000833	4p16.1	160699	IncytePD：1457948
Hs.274313	IGFBP6	胰岛素样生长因子结合蛋白6	0.87	1.21	0.00192	12q13	160319	IncytePD：1968126	Hs.296371	RAB28	RAB28，成员RAS癌基因家族	1.07	1.5	0.000833	4p16.1	160699	IncytePD：1457948
Hs.274313	IGFBP6	胰岛素样生长因子结合蛋白6	0.87	1.21	0.00192	12q13	160319	IncytePD：1968126	Hs.34526	TYMSTR	G蛋白-偶联受体	0.89	1.18	0.00101	3p21	161635	IncytePD：2610374
Hs.222	ITGA9	整联蛋白，α9	0.69	1.16	3.74E-06	3p21.3	160135	IncytePD：2487318	Hs.34526	TYMSTR	G蛋白-偶联受体	0.89	1.18	0.00101	3p21	161635	IncytePD：2610374
Hs.222	ITGA9	整联蛋白，α9	0.69	1.16	3.74E-06	3p21.3	160135	IncytePD：2487318	Hs.63984	CDH13	钙粘蛋白13，H-钙粘蛋白	0.72	1.13	0.000103	16q24.2-q24.3	160122	IncytePD：1404153
Hs.75596	IL2RB	白介素2受体，β	0.69	1	0.000688	22q13.1	159942	IncytePD：3936210	Hs.63984	CDH13	钙粘蛋白13，H-钙粘蛋白	0.72	1.13	0.000103	16q24.2-q24.3	160122	IncytePD：1404153
Hs.75596	IL2RB	白介素2受体，β	0.69	1	0.000688	22q13.1	159942	IncytePD：3936210	Hs.55279	SERPINB5	丝氨酸(或半胱氨酸)蛋白酶抑制物，成员5	0.62	0.94	0.00158	18q21.3	162215	IncytePD：460034
Hs.118354	CAT56	CAT56蛋白	0.69	0.93	4.71E-05	6	165027	IncytePD：3518549	Hs.55279	SERPINB5	丝氨酸(或半胱氨酸)蛋白酶抑制物，成员5	0.62	0.94	0.00158	18q21.3	162215	IncytePD：460034
Hs.118354	CAT56	CAT56蛋白	0.69	0.93	4.71E-05	6	165027	IncytePD：3518549	Hs.182577	INPP5B	肌醇多磷酸-5-磷酸酶，75kD	0.74	0.93	0.000417	1p34	160074	IncytePD：1291948
Hs.81454	KHK	己酮糖激酶(果糖激酶)	0.65	0.93	0.000434	2p23.3-p23.2	159931	IncytePD：2516508	Hs.182577	INPP5B	肌醇多磷酸-5-磷酸酶，75kD	0.74	0.93	0.000417	1p34	160074	IncytePD：1291948
Hs.81454	KHK	己酮糖激酶(果糖激酶)	0.65	0.93	0.000434	2p23.3-p23.2	159931	IncytePD：2516508	Hs.76688	CES1	羧酸酯酶1(单核细胞/巨噬细胞丝氨酸脂酶1)	0.18	0.93	0.000591	16q13-q22.1	164490	IncytePD：1813269
Hs.151738	MMP9	基质金属蛋白酶9(白明胶酶B，92kD)	0.56	0.93	0.000722	20q11.2-q13.1	159912	IncytePD：1274074	Hs.76688	CES1	羧酸酯酶1(单核细胞/巨噬细胞丝氨酸脂酶1)	0.18	0.93	0.000591	16q13-q22.1	164490	IncytePD：1813269

UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆
UG簇	名称	描述	PN	PT	p值	染色体定位	独特标号	克隆	Hs.94498	LILRA2	白细胞免疫球蛋白样受体，亚家族A成员2	0.71	0.91	0.000459	19q13.4	161424	IncytePD：3336057
Hs.83795	IRF2	干扰素调节因子2	0.54	0.89	0.000848	4q34.1-q35.1	161188	IncytePD：2174666	Hs.94498	LILRA2	白细胞免疫球蛋白样受体，亚家族A成员2	0.71	0.91	0.000459	19q13.4	161424	IncytePD：3336057
Hs.83795	IRF2	干扰素调节因子2	0.54	0.89	0.000848	4q34.1-q35.1	161188	IncytePD：2174666	Hs.81217	FZD2	蜷缩(果蝇属)同源物2	0.57	0.88	1.46E-06	17q21.1	160028	IncytePD：2214002
Hs.194148	YES1	v-yes-1 Yamaguchi肉瘤病毒癌基因同源物1	0.64	0.88	9.16E-05	18p11.31-p11.21	159875	IncytePD：1887736	Hs.81217	FZD2	蜷缩(果蝇属)同源物2	0.57	0.88	1.46E-06	17q21.1	160028	IncytePD：2214002
Hs.194148	YES1	v-yes-1 Yamaguchi肉瘤病毒癌基因同源物1	0.64	0.88	9.16E-05	18p11.31-p11.21	159875	IncytePD：1887736	Hs.23643	MST4	丝氨酸/苏氨酸蛋白激酶MASK	0.65	0.88	0.00108	X	163410	IncytePD：2793922
Hs.118804	ENO3	烯醇化酶3，(β，肌肉)	0.4	0.87	8.49E-05	17pter-p11	164468	IncytePD：1719955	Hs.23643	MST4	丝氨酸/苏氨酸蛋白激酶MASK	0.65	0.88	0.00108	X	163410	IncytePD：2793922
Hs.118804	ENO3	烯醇化酶3，(β，肌肉)	0.4	0.87	8.49E-05	17pter-p11	164468	IncytePD：1719955	Hs.153203	MDFI	MyoD家族抑制物	0.46	0.75	0.000138	6p21	163880	IncytePD：2645911
Hs.153053	CD37	CD37抗原	0.55	0.74	0.00022	19p13-q13.4	160033	IncytePD：3041162	Hs.153203	MDFI	MyoD家族抑制物	0.46	0.75	0.000138	6p21	163880	IncytePD：2645911
Hs.153053	CD37	CD37抗原	0.55	0.74	0.00022	19p13-q13.4	160033	IncytePD：3041162	Hs.180570	CYP4F12	细胞色素P450同工型4F12	0.55	0.72	0.0014	19p13.1	167601	IncytePD：1985566
Hs.23672	LRP6	低密度脂蛋白受体相关蛋白6	0.3	0.69	7.35E-05	12p11-p13	162040	IncytePD：4290851	Hs.180570	CYP4F12	细胞色素P450同工型4F12	0.55	0.72	0.0014	19p13.1	167601	IncytePD：1985566

实施例2：易患肝细胞性癌症体质的预测

1.材料与方法

a)患者和组织样本

预先通知明尼苏达大学研究院评论部(Institution Review Board)并征得同意，并按照规程收集外科手术样本。从59位患晚期慢性肝脏疾病并在1995-2001间接受了肝脏移植手术的患者上获取肝脏样本。从8位肝脏供者上获取正常肝脏样本作为对照。这些样本的收集主要是通过美国明尼苏达大学肝脏组织获取和分配系统(Liver TissueProcurement and Distribution System，LTPADS)来进行。64位患者的肿瘤和相匹配的非肿瘤的肝脏样本，通过LTPADS程序或中国复旦大学肝癌研究所而获得。一旦获得冰冻样本，立即在-80℃组织贮藏库中冻存。

b)cDNA芯片

冰冻样本的总RNA抽提采用Trizol试剂(Invitrogen，Gaithersburg，MD)并按照厂商提供的操作程序进行。抽提后的RNA质量控制采用分光光度测量方法，并在1％浓度的琼脂糖凝胶中观察特异性的28S和18S rRNA片段。每一份RNA样本等量分装在管子中，并在-80℃保存。对于cDNA芯片的共同对照，把8个正常肝脏的总RNA样本混合在一起，并均分到每个槽(tub)中。

从NIH的NCI高级技术中心购买cDNA芯片。这些人类UniGem v2.0芯片包含了9180个cDNA克隆，这些克隆被定位于8281个独特UniGene簇(基于2001年2月28日出版的Hs Unigene Build#131)，还包括了122个Incyte的EST克隆(Incyte Genomics，Palo Alto，CA)。杂交方法采用NCI建立的优化程序(Wu等人，Oncogene 20：3674-3682，2001；Ye等人，Nature Med.9：416-423，2003)。与芯片杂交后的荧光图象采用GenePix4000扫描仪和GenePix Pro软件(Axon Instruments，Foster City，CA)获得。按照推荐的关于芯片试验最低信息标准(Minimum Information About a Microarray Experiment Standards)(Brazma A等人，NatGenet 2001)所收集的详细信息，可通过NCBI的Gene Expression Ominibus公共数据库来获得。

c)统计分析

采用相关基因表达比率(Cy5/Cy3)，进行分级聚类分析来检测在几个基因列表和两个风险组之中表达方式的相关性。聚类分析采用Cluster软件并用Tree View软件来显现(Eisen等人，同上)。在以中值为中心进行归一化处理后，进行分级聚类。

分析采用BRB ArrayTools进行。BRB ArrayTools是由国家癌症研究所的生物测定研究分部的Richard Simon博士和Amy Peng建立的。对来自每个芯片上的数据进行测量是为了使数据标准化并进行芯片内比较。分类对比工具的使用是为了比较先前定义的风险组。F检验是对双样本分组中对比数据t检验的概括。用归一化的cDNA对数比率，采用分类对比工具分别计算每个基因的F检验。这个工具进行分组的随机排列。在这些随机排列的基础上，这个工具计算列表中每个基因相关的排列p值。

在采用几种运算方法来分析基因表达数据的基础上，样本被分类到两个预定的类别之一，这些方法包括复合变量预测、最邻近K值预测或支持载体机器预测(support vectormachine predictor)。这种预测的建立包括两个步骤。首先，进行标准的双样本t检验，用来鉴别出在两组中表达比率对数值有显著性差异(达到0.001水平)的基因。其次，每个样本的不同表达基因的对数表达比率被合并到一个复合变量中；这个复合变量可用于基本分类预测。样本i的复合变量i定义如下：

c_{i} = \underset{j}{Σ} t_{j} x_{ij},

式中，tj是基因j在两个组分类对比的t统计参数。xij是在样本i中测得的基因j的对数比率，总和是针对所有差异表达的基因。

我们通过计算如下的线性组合来预测新样本的分类：

L＝∑_it_i*(x_i-m_i)。

式中ti是基因i的t值，x_i是在待分类的新样本中基因i的对数比率，m_i是基因i在两个分类中的中点值。变量i包括在原始分析中所有显著的基因。当L是阳性时，新样本应被归类到第一个表型标记物，而当L是阴性时，新样本应归类到第二个表型标记物。

d)EpCAM的表达和体外抑制

EpCAM的表达采用半定量PCR来评估。总RNA用随机引物(Promega)进行反转录以生成单链cDNA，并按照厂商的操作程序使用Superscript II反转录酶(Invitrogen)。PCR的扩增采用QuantumRNA 18S内在标准(Ambion)，按照厂商的操作程序使用HotStarTaq DNA聚合酶(Qiagen)。引物的序列如下：正向，5′-TGC CGC AGC TCA GGAAGA ATG TGT-3′(SEQ ID NO：6)；反向，5′-CAT CAT TCT GAG TTT TTT GAG AAG-3′(SEQ ID NO：7)。

用siRNA来抑制EpCAM的表达。siRNA由Qiagen合成。EpCAM的有义链和反义链为：有义链：5′-GUU UGC GGA CUG CAC UUC AdTdT-3′(SEQ ID NO：8)；反义链：5′-ACG UGA CAC GUU CGG AGA AdTdT-3′(SEQ ID NO：11)。siRNA的转染根据厂商操作程序，使用TransIT-TKO转染试剂(Mirus)进行，并在每个实验中使用200nm吸收波长的siRNA双链体。细胞生长情况根据厂商所述使用Cell Counting Kit-8(Dojindo MolecularTech.)。实验重复三次。

2.结果

通过含有9128个人类cDNA克隆的芯片，对59位患有慢性肝脏疾病(CLD)患者和14位患有肝细胞癌的患者的肝脏样本中的基因表达图谱和8没有疾病的正常肝脏样本中的基因表达图谱进行比较。CLD样本中包括7例B型肝炎(HBV)、11例C型肝炎(HCV)、3例血色素沉着症(HHC)、5例Wilson氏病(WD)、10例酒精肝疾病(ALD)、16例原发性胆管硬化(PBC)和7例自体免疫性肝炎(AIH)。用2000个分类标志物的随机排列进行监督的单变量F检验运算，来搜寻区分这7组CLD样本的基因。这个分析得到了共计489个显著基因(p＜0.o005)。对489个基因的分级聚类分析(如Eisen等描述，同上)显示，这7种肝脏疾病组可分为两个大类，一类主要由HBV、HCV、HHC和WD的样本构成，另一类主要包括PBC、ALD和AIH的样本。这些结果提示，HBV、HCV、HHC和WD相互之间的相关性要比它们与PBC、ALD、或AIH构成一组时更强。通过特异性反映病因的分子特征对这些样本的分类结果，恰巧与它们发展成肝细胞癌症的风险相互关联，除了WD样本以外(数据没有显示)。为了进一步确定这些组别之间的差异程度，通过进行“省略单因素”的(“leave-one-out”)交叉验证和2000个随机排列测试，在7个组别中进行复合变量分析，在此基础上进行t检验。21个模拟试验共发现了500个复合基因。对这些基因的分级聚类结果与F检验的结果是一致的(数据没有显示)。与之相符的是，PBC、ALD或AIH显著不同于HBV、HCV、HHC或WD，但是病因间的差异不是很明显(数据没有显示)。这表明，WD样本属于高风险小组，至少对与该集合而言。对上述结果的解释是，按照发展成肝细胞癌症的能力来区分低风险组和高风险组的基因，占据了分子特征优势，而反映个体病因的基因则不占优势。

在HBV/HCV/HHC/WD样本中共同失调(disregulated)的但在ALD/PBC/AIH中不失调的基因，被假设为与HCC的分子特征更相关。为了全面地搜寻这个基因集，用“省略单因素”的(“leave-one-out”)交叉验证和对高风险组(HBV/HCV/HHC/WD)和低风险组(ALD/PBC/AIH)进行分类标记物测试的2000个随机排列测试，在P值小于0.001的情况下，进行了最邻近K值分析(K＝3)(3NN)或支持载体机器预测(SVM)运算，这个计算策略与我们最近的研究是相似的(Ye等人，同上)。这种分析产生了包括556个显著基因的复合分类器，它将这两个组别分得很好。它提供了在这些组别中显著的分类预测方法，采用3NN方法的整体正确率为78％，采用SVM方法整体正确率为86％，并且交叉验证地错误分类比率明显低于随机预期值(p＜0.0005)(数据没有显示)。然而，随机对这些样本分类会产生统计上不显著的分类(数据没有显示)。

令人注意的是，在556个基因构成的集合中的许多基因，可在被分析的14例HCC中发现(数据未示出)。为了区分在高风险组中和14例HCC中共同失调的基因，将14例HCC样本和高风险组的样本混合在一起，然后采用2000个随机排列，在P值小于0.001情况下，用3NN运算方法与低风险组进行比较。这个分析发现了416个基因，其中273个基因可在556个基因的集合中发现(49％重叠)。这些结果提示，大约一半能区分高风险组和低风险组的特征基因存在HCC样本中。为了确定是否273个基因的集合(表5)是肿瘤的共同特征，我们通过3NN和SVM预测方法把这基因集应用于两个独立的HCC基因表达图谱。一个集合包括来自24个HCC样本，并与上述使用过相同的正常肝脏对照进行比较；另一集合包括50个HCC样本，并与它配对的非癌症肝脏组织进行比较(Ye等人，同上)。在分类中采用SVM方法，273个基因特征提供了更高的适合度，24例HCC样本的整体正确率为92％，50例HCC样本的整体正确率为94％(数据没有显示)。与556个基因的集合相比，这个方法提高了整体性能。与之相符的是，非重叠的283个基因的集合不能提供任何令人满意的结果。因为绝大多数HCC相关基因在非重叠基因组中被排除了，283个基因的绝大多数或许属于病因外的特征。此外，从HBV/HCV/HHC/WD和ALD/PBC/AIH/HCC对比中选取的383个重叠基因，对于两个独立HCC组不能得出有意义的分类，其整体预测比率低于50％(随机事件)。273个基因在多种肝脏样本中可检测到，这些样本来自两个HBV的患者和来自扩散区域至少5cm直径的肝脏不同部分。来自两个患者不同肝脏部位的273个基因的图谱几乎完全相同(数据没有显示)。此外，参数p值最小(p＜0.000001)的前25个基因是从273个基因的集合中选出的。这个集合产生了与273个基因的集合相似的结果(数据未示出)。综合起来，这些结果表明，273个基因的集合包含了绝大多数与HCC相联系的基因，并与HCC进展有关，而且这些基因在患病肝脏的主实中是大范围扩散的而不是局限于原地保留。

为了检测273个基因的集合是否是人类其他肿瘤的常规标志物，运用SVM方法将该特征中的基因参数应用于从几个公共芯片数据库数据：98例肝细胞癌症(HCC)、53例肺癌、89例胃腺癌、37例软组织肿瘤、39例乳腺癌和27例弥漫性大B细胞淋巴瘤(DLBCL)(Alizadeh等人，同上；Perou等人，同上；Garber等人，Proc.NatlAcad.Sci.U.S.A.98：13784-13789，2001)。在273个基因的集合对额外的98例HCC样本表现良好(80％的样本符合这个特征)的同时，97％的乳腺癌(39例)和78％的DLBCL病例也共享类似的特征。相反，绝大多数来自肺、软组织和胃的肿瘤样本与这些特征的符合率很低(占所有病例的6-30％)(数据未示出)。作为对照，283个基因的集合(非HCC关联基因)也不能对这些样本提供令人满意的预测。由此认为，分类器中的HCC关联基因，在乳腺癌和DLBCL中似乎是共同失调的，但是在肺腺癌、软组织肿瘤和胃腺癌则没有失调。

上述研究表明，与HCC发病相关的基因可能存在273个基因的集合中。例如，对于在高风险组表达显著上升而在风险组则不上升的基因，可作为促进细胞生长的癌基因。为了验证这个“证据原则”(“proof-of-principle”)的假设，我们选择了273基因列表中位于顶部的主要基因。这个基因被鉴别为EpCAM，即肿瘤相关的钙离子传导信号1(TACSTD1，Hs.692)，它在高风险组中表达平均提高了3.6倍，但在低风险组中仅为1.7倍(图6a)，在HCC中的表达情况类似(数据未示出)。在高风险CLD样本中，EpCAM的高表达可通过定量RT-PCR分析来确证(图6b)。EpCAM在Hep3B细胞中为高表达，但在Huh1和Huh4细胞中的表达水平相对较低(图6c)，这总体上与细胞的生长率相关(图6d)。此外，用对EpCAM特异的两个不同siRNA寡链来抑制EpCAM表达，结果导致Hep3B细胞的生长明显受到抑制(图6f)。相反，作为对照的siRNA寡链却没有这种效应(图6e，数据未示出)。这些结果表明，EpCAM可以通过促进肿瘤细胞生长来提供致癌特性。

273个显著基因，其基因符号、染色体图谱位置和UG簇标(识)号列于表5。

表5.用于预测慢性肝病患者患HCC可能性的273个显著基因及其在预测模型中计算多因子L值所需的值

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	1	-7.28	p＜0.000001	0.603	0.903	160198	cofilin 2(肌肉)	Hs.180141	CFL2	14q
2	-6.53	p＜0.000001	0.985	1.607	168023	IgG的Fc片段，高亲和力Ia，(CD64)的受体	Hs.77424	FCGR1A	1q21.2-q21.3	1	-7.28	p＜0.000001	0.603	0.903	160198	cofilin 2(肌肉)	Hs.180141	CFL2	14q
2	-6.53	p＜0.000001	0.985	1.607	168023	IgG的Fc片段，高亲和力Ia，(CD64)的受体	Hs.77424	FCGR1A	1q21.2-q21.3	3	-6.46	p＜0.000001	0.643	1.175	162315	钙通道，电压依赖型，β3亚基	Hs.250712	CACNB3	12q13
4	-6.18	p＜0.000001	0.688	1.112	160302	肌凝蛋白IB	Hs.121576	MYO1B	2q12-q34	3	-6.46	p＜0.000001	0.643	1.175	162315	钙通道，电压依赖型，β3亚基	Hs.250712	CACNB3	12q13
4	-6.18	p＜0.000001	0.688	1.112	160302	肌凝蛋白IB	Hs.121576	MYO1B	2q12-q34	5	-6.16	p＜0.000001	0.473	1.161	169417	血蓝蛋白(铁氧化酶)	Hs.296634	CP	3q23-q25
6	-6.1	p＜0.000001	0.876	1.18	161756	白蛋白	Hs.184411	ALB	4q11-q13	5	-6.16	p＜0.000001	0.473	1.161	169417	血蓝蛋白(铁氧化酶)	Hs.296634	CP	3q23-q25
6	-6.1	p＜0.000001	0.876	1.18	161756	白蛋白	Hs.184411	ALB	4q11-q13	7	-6.04	p＜0.000001	0.719	1.224	162290	UDP-N-乙酰基葡糖胺焦磷酸化酶1	Hs.21293	UAP1	1q23.1
8	-6.01	p＜0.000001	0.534	1.141	162538	未知[智人]，mRNA序列	Hs.367982		16	7	-6.04	p＜0.000001	0.719	1.224	162290	UDP-N-乙酰基葡糖胺焦磷酸化酶1	Hs.21293	UAP1	1q23.1
8	-6.01	p＜0.000001	0.534	1.141	162538	未知[智人]，mRNA序列	Hs.367982		16	9	-5.94	p＜0.000001	0.491	0.714	168634	染色体20开放阅读框3	Hs.22391	C20orf3	20p11.22-p11.21
10	-5.93	p＜0.000001	0.756	1.276	164136	乙酰-辅酶A脱氢酶，长链	Hs.1209	ACADL	2q34-q35	9	-5.94	p＜0.000001	0.491	0.714	168634	染色体20开放阅读框3	Hs.22391	C20orf3	20p11.22-p11.21
10	-5.93	p＜0.000001	0.756	1.276	164136	乙酰-辅酶A脱氢酶，长链	Hs.1209	ACADL	2q34-q35	11	-5.9	p＜0.000001	0.864	1.181	163874	KIAA0092基因产物	Hs.151791	KIAA0092	11q21
12	-5.88	p＜0.000001	0.728	0.925	163096	CGI-26蛋白	Hs.24332	CGI-26	12p12.3	11	-5.9	p＜0.000001	0.864	1.181	163874	KIAA0092基因产物	Hs.151791	KIAA0092	11q21
12	-5.88	p＜0.000001	0.728	0.925	163096	CGI-26蛋白	Hs.24332	CGI-26	12p12.3	13	-5.73	p＜0.000001	0.616	1.133	160233	双特异性酪氨酸-(Y)-磷酸化调节的激酶3	Hs.38018	DYRK3	1q32
14	-5.67	p＜0.000001	0.786	1.071	160436	类似于假定的蛋白PRO2831[智人]，mRNA序列	Hs.406646		15	13	-5.73	p＜0.000001	0.616	1.133	160233	双特异性酪氨酸-(Y)-磷酸化调节的激酶3	Hs.38018	DYRK3	1q32
14	-5.67	p＜0.000001	0.786	1.071	160436	类似于假定的蛋白PRO2831[智人]，mRNA序列	Hs.406646		15	15	-5.65	p＜0.000001	0.761	1.382	160795	肝白血病因子	Hs.433707	HLF	17q22
16	-5.61	p＜0.000001	0.314	0.798	161944	补体成分9	Hs.1290	C9	5p14-p12	15	-5.65	p＜0.000001	0.761	1.382	160795	肝白血病因子	Hs.433707	HLF	17q22
16	-5.61	p＜0.000001	0.314	0.798	161944	补体成分9	Hs.1290	C9	5p14-p12	17	-5.6	p＜0.000001	0.506	0.703	167718	ATP-结合盒，亚家族A(ABC1)，成员1	Hs.211562	ABCA1	9q31.1
18	-5.58	p＜0.000001	0.65	0.912	168437	KIAA0843蛋白	Hs.26777	KIAA0843	5q32	17	-5.6	p＜0.000001	0.506	0.703	167718	ATP-结合盒，亚家族A(ABC1)，成员1	Hs.211562	ABCA1	9q31.1
18	-5.58	p＜0.000001	0.65	0.912	168437	KIAA0843蛋白	Hs.26777	KIAA0843	5q32	19	-5.57	p＜0.000001	0.843	1.087	162884	胞内膜相关的不依赖于钙的磷脂酶A2γ	Hs.44198	IPLA2(GAMM A)	7q31
20	-5.48	p＜0.000001	0.657	1.065	166910	SIPL蛋白	Hs.64322	SIPL	2p25.3	19	-5.57	p＜0.000001	0.843	1.087	162884	胞内膜相关的不依赖于钙的磷脂酶A2γ	Hs.44198	IPLA2(GAMM A)	7q31
20	-5.48	p＜0.000001	0.657	1.065	166910	SIPL蛋白	Hs.64322	SIPL	2p25.3	21	-5.46	1.00E-06	0.544	1.003	166192	EST，很类似于MT1B_人金属硫蛋白-IB(MT-1B)[智人]	Hs.36102		16
22	-5.46	1.00E-06	0.46	0.832	164779	N-乙酰转移酶2(芳基胺N-乙酰转移酶)	Hs.2	NAT2	8p22	21	-5.46	1.00E-06	0.544	1.003	166192	EST，很类似于MT1B_人金属硫蛋白-IB(MT-1B)[智人]	Hs.36102		16

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	23	-5.44	1.00E-06	0.707	1.191	166252	CD5抗原样蛋白(清除受体富含半胱氨酸的家族)	Hs.52002	CD5L	1q21-q23
24	-5.44	1.00E-06	0.861	1.512	162878	EST，很类似于α1型XI胶原蛋白，同工型B前原蛋白；胶原蛋白XI，α-1多肽[智人][H.sapiens]	Hs.7967		1	23	-5.44	1.00E-06	0.707	1.191	166252	CD5抗原样蛋白(清除受体富含半胱氨酸的家族)	Hs.52002	CD5L	1q21-q23
24	-5.44	1.00E-06	0.861	1.512	162878	EST，很类似于α1型XI胶原蛋白，同工型B前原蛋白；胶原蛋白XI，α-1多肽[智人][H.sapiens]	Hs.7967		1	25	-5.42	1.00E-06	0.767	1.181	164656	N-嵌合蛋白(AA 1-299)[智人]，mRNA序列	Hs.385460		2
26	-5.42	2.00E-06	0.803	1.296	161780	Incyte EST	3441835(IncytePD)			25	-5.42	1.00E-06	0.767	1.181	164656	N-嵌合蛋白(AA 1-299)[智人]，mRNA序列	Hs.385460		2
26	-5.42	2.00E-06	0.803	1.296	161780	Incyte EST	3441835(IncytePD)			27	-5.38	1.00E-06	0.352	0.745	160174	补体成分6	Hs.1282	C6	5p13
28	-5.35	2.00E-06	0.464	0.875	160280	羧肽酶B2(血浆，羧肽酶U)	Hs.75572	CPB2	13q14.11	27	-5.38	1.00E-06	0.352	0.745	160174	补体成分6	Hs.1282	C6	5p13
28	-5.35	2.00E-06	0.464	0.875	160280	羧肽酶B2(血浆，羧肽酶U)	Hs.75572	CPB2	13q14.11	29	-5.34	2.00E-06	0.779	0.978	163144	KIAA1724蛋白	Hs.127243	KIAA1724	2p23.3
30	-5.33	2.00E-06	0.694	1.361	169477	甘露糖受体，C型1	Hs.75182	MRC1	10p13	29	-5.34	2.00E-06	0.779	0.978	163144	KIAA1724蛋白	Hs.127243	KIAA1724	2p23.3
30	-5.33	2.00E-06	0.694	1.361	169477	甘露糖受体，C型1	Hs.75182	MRC1	10p13	31	-5.26	2.00E-06	0.669	0.896	162659	RAB6A，成员RAS癌基因家族	Hs.5636	RAB6A	11q13.3
32	-5.25	2.00E-06	0.768	1.052	161138	丝氨酸(或半胱氨酸)蛋白酶抑制物，clade A(α-1抗蛋白酶，抗胰蛋白酶)，成员1	Hs.297681	SERPINA1	14q32.1	31	-5.26	2.00E-06	0.669	0.896	162659	RAB6A，成员RAS癌基因家族	Hs.5636	RAB6A	11q13.3
32	-5.25	2.00E-06	0.768	1.052	161138	丝氨酸(或半胱氨酸)蛋白酶抑制物，clade A(α-1抗蛋白酶，抗胰蛋白酶)，成员1	Hs.297681	SERPINA1	14q32.1	33	-5.25	3.00E-06	0.685	1.043	169635	EST，稍类似于广泛转录的四三合肽(tetratricopeptide)重复基因，Y染色体；Y染色体上广泛转录的TPR基因[智人][H.sapiens]	Hs.87980		2
34	-5.21	3.00E-06	0.598	0.815	162745	溶质载体家族1(对神经元/上皮高亲和力谷氨酸转运蛋白，系统Xag)，成员1	Hs.91139	SLC1A1	9p24	33	-5.25	3.00E-06	0.685	1.043	169635		Hs.87980		2
34	-5.21	3.00E-06	0.598	0.815	162745	溶质载体家族1(对神经元/上皮高亲和力谷氨酸转运蛋白，系统Xag)，成员1	Hs.91139	SLC1A1	9p24	35	-5.2	3.00E-06	0.371	0.725	160366	泛素特异的蛋白酶10	Hs.78829	USP10	16q24.1
36	-5.16	3.00E-06	0.515	0.932	166426	蛋白S(α)	Hs.64016	PROS1	3p11-q11.2	35	-5.2	3.00E-06	0.371	0.725	160366	泛素特异的蛋白酶10	Hs.78829	USP10	16q24.1
36	-5.16	3.00E-06	0.515	0.932	166426	蛋白S(α)	Hs.64016	PROS1	3p11-q11.2	38	-5.14	4.00E-06	0.627	1.044	162301	白介素1受体辅助蛋白	Hs.173880	IL1RAP	3q28
39	-5.11	4.00E-06	0.534	0.919	167159	类固醇-5-α-还原酶，α多肽2(3-氧代-5α-类固醇δ4-脱氢酶α2)	Hs.1989	SRD5A2	2p23	38	-5.14	4.00E-06	0.627	1.044	162301	白介素1受体辅助蛋白	Hs.173880	IL1RAP	3q28
39	-5.11	4.00E-06	0.534	0.919	167159	类固醇-5-α-还原酶，α多肽2(3-氧代-5α-类固醇δ4-脱氢酶α2)	Hs.1989	SRD5A2	2p23	40	-5.04	5.00E-06	0.474	0.9	167129	金属硫蛋白1L	Hs.380778	MT1L	16q13
41	-5.02	5.00E-06	0.87	2.237	163633	Ieptin受体	Hs.226627	LEPR	1p31	40	-5.04	5.00E-06	0.474	0.9	167129	金属硫蛋白1L	Hs.380778	MT1L	16q13
41	-5.02	5.00E-06	0.87	2.237	163633	Ieptin受体	Hs.226627	LEPR	1p31	42	-5.02	5.00E-06	0.506	1.137	162311	丝氨酸(或半胱氨酸)蛋白酶抑制物，clade C(抗凝血酶)，成员1	Hs.75599	SERPINC1	1q23-q25.1

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	43	-5.01	6.00E-06	0.622	1.035	166915	假定的蛋白FLJ12666	Hs.23767	FLJ12666	1p34.2
44	-5	6.00E-06	0.741	1.14	163572	假定的蛋白DKFZp564D0462	Hs.44197	DKFZP564D0 46	6q23.1-q24.3	43	-5.01	6.00E-06	0.622	1.035	166915	假定的蛋白FLJ12666	Hs.23767	FLJ12666	1p34.2
44	-5	6.00E-06	0.741	1.14	163572	假定的蛋白DKFZp564D0462	Hs.44197	DKFZP564D0 46	6q23.1-q24.3	45	-5	6.00E-06	0.842	1.141	163676	肌醇(myo)-1(或4)-单磷酸酶1	Hs.171776	IMPA1	8q21.13-q21.3
46	-5	6.00E-06	0.903	1.145	163549	EST，稍类似于ARF蛋白[智人][H.sapiens]	Hs.422650		17	45	-5	6.00E-06	0.842	1.141	163676	肌醇(myo)-1(或4)-单磷酸酶1	Hs.171776	IMPA1	8q21.13-q21.3
46	-5	6.00E-06	0.903	1.145	163549	EST，稍类似于ARF蛋白[智人][H.sapiens]	Hs.422650		17	47	-4.99	6.00E-06	0.357	0.608	168690	促皮质素释放激素结合蛋白	Hs.115617	CRHBP	5q11.2-q13.3
48	-4.99	6.00E-06	0.52	0.846	169399	怀孕区蛋白	Hs.74094	PZP	12p13-p12.2	47	-4.99	6.00E-06	0.357	0.608	168690	促皮质素释放激素结合蛋白	Hs.115617	CRHBP	5q11.2-q13.3
48	-4.99	6.00E-06	0.52	0.846	169399	怀孕区蛋白	Hs.74094	PZP	12p13-p12.2	49	-4.98	6.00E-06	0.681	0.994	162636	信号识别颗粒54kDa	Hs.49346	SRP54	14q13.1
50	-4.98	6.00E-06	0.633	0.933	166021	肌醇多磷酸-5-磷酸酶，145kDa	Hs.155939	INPP5D	2q36-q37	49	-4.98	6.00E-06	0.681	0.994	162636	信号识别颗粒54kDa	Hs.49346	SRP54	14q13.1
50	-4.98	6.00E-06	0.633	0.933	166021	肌醇多磷酸-5-磷酸酶，145kDa	Hs.155939	INPP5D	2q36-q37	51	-4.93	7.00E-06	0.972	1.427	159896	神经前体细胞表达的，发育下调型4	Hs.1565	NEDD4	15q
52	-4.92	8.00E-06	0.73	1.087	163778	N-脱乙酰酶/N-磺基转移酶(乙酰肝素葡糖氨基))1	Hs.20894	NDST1	5q32-q33.1	51	-4.93	7.00E-06	0.972	1.427	159896	神经前体细胞表达的，发育下调型4	Hs.1565	NEDD4	15q
52	-4.92	8.00E-06	0.73	1.087	163778	N-脱乙酰酶/N-磺基转移酶(乙酰肝素葡糖氨基))1	Hs.20894	NDST1	5q32-q33.1	53	-4.9	8.00E-06	0.705	1.067	159807	肾的含有锚蛋白重复的蛋白	Hs.77546	KANK	9p24.3
54	-4.9	8.00E-06	0.307	0.676	167252	羟基前列腺素脱氢酶15-(NAD)	Hs.77348	HPGD	4q34-q35	53	-4.9	8.00E-06	0.705	1.067	159807	肾的含有锚蛋白重复的蛋白	Hs.77546	KANK	9p24.3
54	-4.9	8.00E-06	0.307	0.676	167252	羟基前列腺素脱氢酶15-(NAD)	Hs.77348	HPGD	4q34-q35	55	-4.88	9.00E-06	0.724	1.417	163254	脂酶A，溶酶体酸，胆固醇酯酶(Wolman氏疾病)	Hs.85226	LIPA	10q23.2-q23.3
56	-4.87	1.00E-05	0.576	0.923	162307	蛋白质-L-异天冬氨酸(D-天冬氨酸)O-甲基转移酶	Hs.79137	PCMT1	6q24-q25	55	-4.88	9.00E-06	0.724	1.417	163254	脂酶A，溶酶体酸，胆固醇酯酶(Wolman氏疾病)	Hs.85226	LIPA	10q23.2-q23.3
56	-4.87	1.00E-05	0.576	0.923	162307	蛋白质-L-异天冬氨酸(D-天冬氨酸)O-甲基转移酶	Hs.79137	PCMT1	6q24-q25	57	-4.87	9.00E-06	0.64	1.076	164602	补体成分1，s亚组分	Hs.169756	C1S	12p13
58	-4.83	1.10E-05	1.057	1.872	164576	叉头盒O1A(横纹肌肉瘤)	Hs.170133	FOXO1A	13q14.1	57	-4.87	9.00E-06	0.64	1.076	164602	补体成分1，s亚组分	Hs.169756	C1S	12p13
58	-4.83	1.10E-05	1.057	1.872	164576	叉头盒O1A(横纹肌肉瘤)	Hs.170133	FOXO1A	13q14.1	59	-4.8	1.20E-05	0.78	1.259	165739	假定的基因CG018	Hs.22174	CG018	13q12-q13
60	-4.8	1.20E-05	0.719	1.091	167087	溶质载体家族31(铜转运蛋白)，成员2	Hs.24030	SLC31A2	9q31-q32	59	-4.8	1.20E-05	0.78	1.259	165739	假定的基因CG018	Hs.22174	CG018	13q12-q13
60	-4.8	1.20E-05	0.719	1.091	167087	溶质载体家族31(铜转运蛋白)，成员2	Hs.24030	SLC31A2	9q31-q32	61	-4.79	1.20E-05	0.716	0.987	165277	磷酸化酶，糖原；肝(Hers氏疾病，糖原储存疾病型VI)	Hs.771	PYGL	14q21-q22
62	-4.7	1.70E-05	0.766	1.43	161801	溶质载体家族10(钠/胆汁酸共转运蛋白家族)，成员1	Hs.952	SLC10A1	14q24.1	61	-4.79	1.20E-05	0.716	0.987	165277	磷酸化酶，糖原；肝(Hers氏疾病，糖原储存疾病型VI)	Hs.771	PYGL	14q21-q22
62	-4.7	1.70E-05	0.766	1.43	161801	溶质载体家族10(钠/胆汁酸共转运蛋白家族)，成员1	Hs.952	SLC10A1	14q24.1	63	-4.7	1.80E-05	0.355	0.917	162617	FK506结合蛋白5	Hs.7557	FKBP5	6p21.3-21.2
64	-4.68	1.80E-05	0.918	1.294	163597	假定的蛋白FLJ20366	Hs.8358	FLJ20366	8q23.2	63	-4.7	1.80E-05	0.355	0.917	162617	FK506结合蛋白5	Hs.7557	FKBP5	6p21.3-21.2
64	-4.68	1.80E-05	0.918	1.294	163597	假定的蛋白FLJ20366	Hs.8358	FLJ20366	8q23.2	65	-4.67	1.90E-05	0.598	0.848	160741	醛脱氢酶8家族，成员A1	Hs.18443	ALDH8A1	6q23.2
86	-4.67	1.90E-05	0.392	0.742	167158	补体成分5	Hs.1281	C5	9q32-q34	65	-4.67	1.90E-05	0.598	0.848	160741	醛脱氢酶8家族，成员A1	Hs.18443	ALDH8A1	6q23.2
86	-4.67	1.90E-05	0.392	0.742	167158	补体成分5	Hs.1281	C5	9q32-q34	67	-4.65	2.00E-05	1.003	1.661	165565	磷脂酰肌醇(4，5)二磷酸5-磷酸酶同源物；磷脂酰肌	Hs.25156	PPI5PIV	9q34.3

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置							醇多磷酸5-磷酸酶型IV
68	-4.65	2.00E-05	0.996	1.169	160476	可能是在息肉病1中缺失的鼠同源物	Hs.178112	DP1	5q22-q23							醇多磷酸5-磷酸酶型IV
68	-4.65	2.00E-05	0.996	1.169	160476	可能是在息肉病1中缺失的鼠同源物	Hs.178112	DP1	5q22-q23	69	-4.65	2.50E-05	0.93	1.204	161778	蛋白磷酸酶1D镁依赖型，δ同工型	Hs.100980	PPM1D	17q23.2
70	-4.62	2.20E-05	0.875	1.013	164997	N-乙酰半乳糖胺酶，α-	Hs.75372	NAGA	22q13-qter	69	-4.65	2.50E-05	0.93	1.204	161778	蛋白磷酸酶1D镁依赖型，δ同工型	Hs.100980	PPM1D	17q23.2
70	-4.62	2.20E-05	0.875	1.013	164997	N-乙酰半乳糖胺酶，α-	Hs.75372	NAGA	22q13-qter	71	-4.62	2.30E-05	1.04	1.351	160731	组蛋白脱乙酰酶6	Hs.6764	HDAC6	Xp11.23
72	-4.62	2.30E-05	0.98	1.326	168995	环指蛋白13	Hs.6900	RNF13	3q25.1	71	-4.62	2.30E-05	1.04	1.351	160731	组蛋白脱乙酰酶6	Hs.6764	HDAC6	Xp11.23
72	-4.62	2.30E-05	0.98	1.326	168995	环指蛋白13	Hs.6900	RNF13	3q25.1	73	-4.6	2.40E-05	0.536	0.805	163500	凝血因子XI(血浆凝血激酶前体)	Hs.1430	F11	4q35
74	-4.59	2.50E-05	0.359	0.544	159810	C-型凝集素BIMLEC前体	Hs.2441	BIMLEC	2q24.2	73	-4.6	2.40E-05	0.536	0.805	163500	凝血因子XI(血浆凝血激酶前体)	Hs.1430	F11	4q35
74	-4.59	2.50E-05	0.359	0.544	159810	C-型凝集素BIMLEC前体	Hs.2441	BIMLEC	2q24.2	75	-4.57	2.60E-05	0.912	1.66	168655	补体成分1，q亚组分，β多肽	Hs.8986	C1QB	1p36.3-p34.1
76	-4.57	2.70E-05	0.529	1.031	166497	组氨酸氨裂解酶	Hs.276590	HAL	12q22-q24.1	75	-4.57	2.60E-05	0.912	1.66	168655	补体成分1，q亚组分，β多肽	Hs.8986	C1QB	1p36.3-p34.1
76	-4.57	2.70E-05	0.529	1.031	166497	组氨酸氨裂解酶	Hs.276590	HAL	12q22-q24.1	77	-4.57	3.60E-05	0.421	0.88	161748	乙酰辅酶A乙酰转移酶1(醋酸乙酰辅酶A硫解酶)	Hs.37	ACAT1	11q22.3-q23.1
78	-4.56	2.70E-05	0.636	1.205	164394	CD163抗原	Hs.74076	CD163	12p13.3	77	-4.57	3.60E-05	0.421	0.88	161748	乙酰辅酶A乙酰转移酶1(醋酸乙酰辅酶A硫解酶)	Hs.37	ACAT1	11q22.3-q23.1
78	-4.56	2.70E-05	0.636	1.205	164394	CD163抗原	Hs.74076	CD163	12p13.3	79	-4.54	2.90E-05	0.926	1.178	160011	通用转录因子IIA，2，12kDa	Hs.76362	GTF2A2	15q21.3
80	-4.54	3.10E-05	0.634	0.922	161895	核受体亚家族1，组I，成员2	Hs.118138	NR1I2	3q12-q13.3	79	-4.54	2.90E-05	0.926	1.178	160011	通用转录因子IIA，2，12kDa	Hs.76362	GTF2A2	15q21.3
80	-4.54	3.10E-05	0.634	0.922	161895	核受体亚家族1，组I，成员2	Hs.118138	NR1I2	3q12-q13.3	81	-4.54	3.00E-05	0.907	1.181	167754	智人mRNA全长插入cDNA克隆EUROIMAGE926491，mRNA序列	Hs.98401		19
82	-4.54	4.10E-05	0.988	1.3	161838	NADH脱氢酶(泛醌)1，亚复合物，未知，1,6kDa	Hs.84549	NDUFC1	4q28.2-q31.1	81	-4.54	3.00E-05	0.907	1.181	167754	智人mRNA全长插入cDNA克隆EUROIMAGE926491，mRNA序列	Hs.98401		19
82	-4.54	4.10E-05	0.988	1.3	161838	NADH脱氢酶(泛醌)1，亚复合物，未知，1,6kDa	Hs.84549	NDUFC1	4q28.2-q31.1	83	-4.47	3.70E-05	1.124	1.642	161856	谷胱甘肽-S-转移酶样蛋白；谷胱甘肽转移酶omega	Hs.11465	GSTTLp28	10q24.33
84	-4.47	3.80E-05	0.893	1.216	163456	植烷基-CoA羟基化酶(Refsum氏疾病)	Hs.172887	PHYH	10pter-p11.2	83	-4.47	3.70E-05	1.124	1.642	161856	谷胱甘肽-S-转移酶样蛋白；谷胱甘肽转移酶omega	Hs.11465	GSTTLp28	10q24.33
84	-4.47	3.80E-05	0.893	1.216	163456	植烷基-CoA羟基化酶(Refsum氏疾病)	Hs.172887	PHYH	10pter-p11.2	85	-4.46	3.90E-05	0.51	0.865	168256	B-因子，备解素	Hs.69771	BF	6p21.3
86	-4.43	4.30E-05	0.611	1.011	162472	血管生成素，核糖核酸酶，RNase A家族，5	Hs.332764	ANG	14q11.1-q11.2	85	-4.46	3.90E-05	0.51	0.865	168256	B-因子，备解素	Hs.69771	BF	6p21.3
86	-4.43	4.30E-05	0.611	1.011	162472	血管生成素，核糖核酸酶，RNase A家族，5	Hs.332764	ANG	14q11.1-q11.2	87	-4.41	4.80E-05	0.593	0.906	167629	N-乙酰转移酶1(芳基胺N-乙酰转移酶)	Hs.155956	NAT1	8p23.1-p21.3
88	-4.39	5.90E-05	0.884	1.231	162036	Dombrock血型	Hs.13776	DO	12q13.2-q13.3	87	-4.41	4.80E-05	0.593	0.906	167629	N-乙酰转移酶1(芳基胺N-乙酰转移酶)	Hs.155956	NAT1	8p23.1-p21.3
88	-4.39	5.90E-05	0.884	1.231	162036	Dombrock血型	Hs.13776	DO	12q13.2-q13.3	90	-4.39	5.00E-05	0.448	0.831	159972	前B细胞集落增强因子	Hs.239138	PBEF	7q22.1
91	-4.38	5.10E-05	0.892	1.14	160759	葡糖醛酸糖苷酶，β	Hs.183868	GUSB	7q21.11	90	-4.39	5.00E-05	0.448	0.831	159972	前B细胞集落增强因子	Hs.239138	PBEF	7q22.1
91	-4.38	5.10E-05	0.892	1.14	160759	葡糖醛酸糖苷酶，β	Hs.183868	GUSB	7q21.11	92	-4.37	5.20E-05	0.797	1.284	162192	乙酰-辅酶A脱氢酶，C-4至C-12直链	Hs.79158	ACADM	1p31

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	93	-4.37	5.40E-05	0.811	1.062	161636	智人克隆24405 mRNA序列	Hs.23729		1
94	-4.34	5.80E-05	0.746	1.211	168452	甲叉四氢叶酸脱氢酶(NADP+依赖型)，甲川四氢叶酸环水解酶，甲酰四氢叶酸合成酶	Hs.172665	MTHFD1	14q24	93	-4.37	5.40E-05	0.811	1.062	161636	智人克隆24405 mRNA序列	Hs.23729		1
94	-4.34	5.80E-05	0.746	1.211	168452	甲叉四氢叶酸脱氢酶(NADP+依赖型)，甲川四氢叶酸环水解酶，甲酰四氢叶酸合成酶	Hs.172665	MTHFD1	14q24	95	-4.33	6.10E-05	0.541	0.906	165666	核糖核酸酶，RNase A家族，4	Hs.283749	RNASE4	14q11.1
96	-4.33	6.20E-05	0.482	0.939	167394	丁酰胆碱酯酶	Hs.1327	BCHE	3q26.1-q26.2	95	-4.33	6.10E-05	0.541	0.906	165666	核糖核酸酶，RNase A家族，4	Hs.283749	RNASE4	14q11.1
96	-4.33	6.20E-05	0.482	0.939	167394	丁酰胆碱酯酶	Hs.1327	BCHE	3q26.1-q26.2	97	-4.3	6.80E-05	0.62	0.767	167501	丙酰辅酶A羧化酶，α多肽	Hs.80741	PCCA	13q32
98	-4.3	6.80E-05	0.809	2.181	165974	胰岛素样生长因子结合蛋白1	Hs.102122	IGFBP1	7p13-p12	97	-4.3	6.80E-05	0.62	0.767	167501	丙酰辅酶A羧化酶，α多肽	Hs.80741	PCCA	13q32
98	-4.3	6.80E-05	0.809	2.181	165974	胰岛素样生长因子结合蛋白1	Hs.102122	IGFBP1	7p13-p12	99	-4.29	7.00E-05	0.622	0.933	161234	嗜斑蛋白(plakophilin)2	Hs.25051	PKP2	12p11
100	-4.29	7.00E-05	0.852	1.098	166532	卵磷脂转移蛋白	Hs.285218	PCTP	17q21-q24	99	-4.29	7.00E-05	0.622	0.933	161234	嗜斑蛋白(plakophilin)2	Hs.25051	PKP2	12p11
100	-4.29	7.00E-05	0.852	1.098	166532	卵磷脂转移蛋白	Hs.285218	PCTP	17q21-q24	101	-4.28	7.40E-05	0.567	0.815	167750	腺苷激酶	Hs.432422	ADK	10cen-q24
102	-4.27	7.80E-05	0.479	0.766	165890	纤维蛋白原，Bβ多肽	Hs.7645	FGB	4q28	101	-4.28	7.40E-05	0.567	0.815	167750	腺苷激酶	Hs.432422	ADK	10cen-q24
102	-4.27	7.80E-05	0.479	0.766	165890	纤维蛋白原，Bβ多肽	Hs.7645	FGB	4q28	103	-4.26	7.70E-05	0.406	0.89	161362	色氨酸2，3-二加氧酶	Hs.183671	TDO2	4q31-q32
104	-4.25	8.00E-05	0.739	1.044	159764	膜联蛋白A7	Hs.386741	ANXA7	10q21.1-q21.2	103	-4.26	7.70E-05	0.406	0.89	161362	色氨酸2，3-二加氧酶	Hs.183671	TDO2	4q31-q32
104	-4.25	8.00E-05	0.739	1.044	159764	膜联蛋白A7	Hs.386741	ANXA7	10q21.1-q21.2	105	-4.25	8.10E-05	0.642	0.88	164249	氨基羧基粘康酸半醛脱羧酶	Hs.114088	ACMSD	2q21.2
106	-4.24	8.30E-05	0.91	1.142	162711	裂融素(mitofusin)2	Hs.3363	MFN2	1p36.21	105	-4.25	8.10E-05	0.642	0.88	164249	氨基羧基粘康酸半醛脱羧酶	Hs.114088	ACMSD	2q21.2
106	-4.24	8.30E-05	0.91	1.142	162711	裂融素(mitofusin)2	Hs.3363	MFN2	1p36.21	107	-4.24	8.30E-05	0.784	1.391	160370	血清/糖皮质激素调节的激酶	Hs.296323	SGK	6q23
108	-4.24	8.40E-05	0.483	0.867	161146	3-羟基类固醇表位酶	Hs.11958	RODH	12q13	107	-4.24	8.30E-05	0.784	1.391	160370	血清/糖皮质激素调节的激酶	Hs.296323	SGK	6q23
108	-4.24	8.40E-05	0.483	0.867	161146	3-羟基类固醇表位酶	Hs.11958	RODH	12q13	109	-4.23	9.10E-05	0.476	0.846	161986	肿瘤排斥抗原(gp96)1	Hs.82689	TRA1	12q24.2-q24.3
110	-4.23	8.60E-05	0.807	1.049	165670	toll样受体2	Hs.63668	TLR2	4q32	109	-4.23	9.10E-05	0.476	0.846	161986	肿瘤排斥抗原(gp96)1	Hs.82689	TRA1	12q24.2-q24.3
110	-4.23	8.60E-05	0.807	1.049	165670	toll样受体2	Hs.63668	TLR2	4q32	111	-4.22	8.80E-05	0.577	0.78	166820	KIAA0212基因产物	Hs.154332	KIAA0212	3p26.1
112	-4.21	9.10E-05	0.604	0.838	164495	智人，克隆IMAGE：3833472，mRNA，mRNA序列	Hs.234898		12	111	-4.22	8.80E-05	0.577	0.78	166820	KIAA0212基因产物	Hs.154332	KIAA0212	3p26.1
112	-4.21	9.10E-05	0.604	0.838	164495	智人，克隆IMAGE：3833472，mRNA，mRNA序列	Hs.234898		12	113	-4.21	9.10E-05	0.407	0.592	163893	纤维蛋白原样蛋白1	Hs.107	FGL1	8p22-p21.3
114	-4.2	9.30E-05	0.651	1.058	167287	细胞色素b-5	Hs.83834	CYB5	18q23	113	-4.21	9.10E-05	0.407	0.592	163893	纤维蛋白原样蛋白1	Hs.107	FGL1	8p22-p21.3
114	-4.2	9.30E-05	0.651	1.058	167287	细胞色素b-5	Hs.83834	CYB5	18q23	115	-4.2	9.40E-05	0.597	1.015	162446	转移电子的黄素蛋白脱氢酶	Hs.323468	ETFDH	4q32-q35
116	-4.19	9.90E-05	0.507	1.102	169375	细胞色素P450，亚家族IIC(美芬妥英4-羟基化酶)，多肽9	Hs.167529	CYP2C9	10q24	115	-4.2	9.40E-05	0.597	1.015	162446	转移电子的黄素蛋白脱氢酶	Hs.323468	ETFDH	4q32-q35
116	-4.19	9.90E-05	0.507	1.102	169375	细胞色素P450，亚家族IIC(美芬妥英4-羟基化酶)，多肽9	Hs.167529	CYP2C9	10q24	117	-4.18	0.000103	0.523	0.963	160720	山梨糖醇脱氢酶	Hs.878	SORD	15q15.3

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	118	-4.17	0.000107	0.992	1.266	162067	剪接因子3b，亚基1,155kDa	Hs.334826	SF3B1	2q33.1
119	-4.15	0.000115	0.639	0.936	164393	智人mRNA；cDNA DKFZp762O1615(来自克隆DKFZp762O1615)，mRNA序列	Hs.284252		5	118	-4.17	0.000107	0.992	1.266	162067	剪接因子3b，亚基1,155kDa	Hs.334826	SF3B1	2q33.1
119	-4.15	0.000115	0.639	0.936	164393	智人mRNA；cDNA DKFZp762O1615(来自克隆DKFZp762O1615)，mRNA序列	Hs.284252		5	120	-4.15	0.000114	0.794	1.029	162329	雌激素受体结合位点相关的抗原，9	Hs.9222	EBAG9	8q23
121	-4.14	0.000116	0.59	1.176	164863	溶质载体家族2(辅助的葡萄糖转运蛋白)，成员2	Hs.167584	SLC2A2	3q26.1-q26.2	120	-4.15	0.000114	0.794	1.029	162329	雌激素受体结合位点相关的抗原，9	Hs.9222	EBAG9	8q23
121	-4.14	0.000116	0.59	1.176	164863	溶质载体家族2(辅助的葡萄糖转运蛋白)，成员2	Hs.167584	SLC2A2	3q26.1-q26.2	122	-4.14	0.000117	0.767	1.029	163052	融合的toes同源物(小鼠)	Hs.288929	FTS	16q12.1
123	-4.12	0.000124	0.712	0.997	160399	cullin 3	Hs.78946	CUL3	2q36.3	122	-4.14	0.000117	0.767	1.029	163052	融合的toes同源物(小鼠)	Hs.288929	FTS	16q12.1
123	-4.12	0.000124	0.712	0.997	160399	cullin 3	Hs.78946	CUL3	2q36.3	124	-4.12	0.000124	0.649	0.837	165894	蛋白激酶，cAMP依赖型，调控的，II型，β	Hs.77439	PRKAR2B	7q22-q31.1
125	-4.11	0.000126	0.941	1.258	162938	PTD013蛋白	Hs.22679	PTD013	6q13-q22.33	124	-4.12	0.000124	0.649	0.837	165894	蛋白激酶，cAMP依赖型，调控的，II型，β	Hs.77439	PRKAR2B	7q22-q31.1
125	-4.11	0.000126	0.941	1.258	162938	PTD013蛋白	Hs.22679	PTD013	6q13-q22.33	126	-4.09	0.000137	0.622	0.958	160328	前α(球蛋白)抑制物，H3多肽	Hs.76716	ITIH3	3p21.2-p21.1
127	-4.08	0.000142	0.718	1.057	165794	环氧化物水解酶2，细胞质型	Hs.113	EPHX2	8p21-p12	126	-4.09	0.000137	0.622	0.958	160328	前α(球蛋白)抑制物，H3多肽	Hs.76716	ITIH3	3p21.2-p21.1
127	-4.08	0.000142	0.718	1.057	165794	环氧化物水解酶2，细胞质型	Hs.113	EPHX2	8p21-p12	128	-4.07	0.000149	0.405	0.709	162561	RNA解旋酶相关蛋白[智人]，mRNA序列	Hs.381097		16
129	-4.06	0.000149	0.447	0.743	168811	乙酰辅酶A乙酰转移酶1(乙酸乙酰辅酶A硫解酶)	Hs.37	ACAT1	11q22.3-q23.1	128	-4.07	0.000149	0.405	0.709	162561	RNA解旋酶相关蛋白[智人]，mRNA序列	Hs.381097		16
129	-4.06	0.000149	0.447	0.743	168811	乙酰辅酶A乙酰转移酶1(乙酸乙酰辅酶A硫解酶)	Hs.37	ACAT1	11q22.3-q23.1	130	-4.06	0.000152	0.949	1.293	169563	锌指蛋白103同源物(小鼠)	Hs.155968	ZFP103	2p11.2
131	-4.05	0.000155	0.565	1.142	162666	激肽原	Hs.77741	KNG	3q27	130	-4.06	0.000152	0.949	1.293	169563	锌指蛋白103同源物(小鼠)	Hs.155968	ZFP103	2p11.2
131	-4.05	0.000155	0.565	1.142	162666	激肽原	Hs.77741	KNG	3q27	132	-4.05	0.000156	0.353	0.729	168282	组特异性组分(维生素D结合蛋白)	Hs.198246	GC	4q12-q13
133	-4.05	0.000157	0.678	0.841	168476	核孔素88kDa	Hs.172108	NUP88	17p13.2	132	-4.05	0.000156	0.353	0.729	168282	组特异性组分(维生素D结合蛋白)	Hs.198246	GC	4q12-q13
133	-4.05	0.000157	0.678	0.841	168476	核孔素88kDa	Hs.172108	NUP88	17p13.2	134	-4.04	0.000161	0.66	1.011	167801	Sec23同源物A(酿酒酵母)	Hs.272927	SEC23A	14q13.2
135	-4.01	0.00018	0.624	0.786	165731	肿瘤蛋白D52样蛋白1	Hs.16611	TPD52L1	6q22-q23	134	-4.04	0.000161	0.66	1.011	167801	Sec23同源物A(酿酒酵母)	Hs.272927	SEC23A	14q13.2
135	-4.01	0.00018	0.624	0.786	165731	肿瘤蛋白D52样蛋白1	Hs.16611	TPD52L1	6q22-q23	136	-4.01	0.000177	0.586	0.97	169253	芳香烷基磷酸酯酶3	Hs.335322	PON3	7q21.3
137	-4.01	0.000179	0.841	1.036	159850	智人cDNA FLJ34315 fis，克隆FEBRA2008341，mRNA序列	Hs.376655		14	136	-4.01	0.000177	0.586	0.97	169253	芳香烷基磷酸酯酶3	Hs.335322	PON3	7q21.3
137	-4.01	0.000179	0.841	1.036	159850	智人cDNA FLJ34315 fis，克隆FEBRA2008341，mRNA序列	Hs.376655		14	138	-4	0.000182	0.69	1.057	167281	细胞分裂周期蛋白2-样蛋白5(胆碱酯酶相关细胞分裂控制物)	Hs.59498	CDC2L5	7p13
139	-4	0.000185	0.589	0.913	165590	转运蛋白1	Hs.8146	TLOC1	3q26.2-q27	138	-4	0.000182	0.69	1.057	167281	细胞分裂周期蛋白2-样蛋白5(胆碱酯酶相关细胞分裂控制物)	Hs.59498	CDC2L5	7p13
139	-4	0.000185	0.589	0.913	165590	转运蛋白1	Hs.8146	TLOC1	3q26.2-q27	140	-3.99	0.00019	0.69	0.939	162599	触珠蛋白	Hs.75990	HP	16q22.1
141	-3.97	0.000202	0.79	0.997	164028	EST，稍类似于ATDA_人二氨乙酰转移酶(精脒/精	Hs.356269		X	140	-3.99	0.00019	0.69	0.939	162599	触珠蛋白	Hs.75990	HP	16q22.1

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置							胺N(1)-乙酰转移酶)(SSAT)(腐胺乙酰转移酶)[H.sapiens]
142	-3.97	0.000205	0.418	0.896	166007	酪氨酸氨基转移酶	Hs.161640	TAT	16q22.1							胺N(1)-乙酰转移酶)(SSAT)(腐胺乙酰转移酶)[H.sapiens]
142	-3.97	0.000205	0.418	0.896	166007	酪氨酸氨基转移酶	Hs.161640	TAT	16q22.1	143	-3.95	0.000219	0.828	1.188	165559	c-mer原癌基因酪氨酸激酶	Hs.306178	MERTK	2q14.1
144	-3.95	0.000221	0.816	1.224	165133	基本亮氨基酸拉链和W2结构域1	Hs.155291	BZW1	2q33	143	-3.95	0.000219	0.828	1.188	165559	c-mer原癌基因酪氨酸激酶	Hs.306178	MERTK	2q14.1
144	-3.95	0.000221	0.816	1.224	165133	基本亮氨基酸拉链和W2结构域1	Hs.155291	BZW1	2q33	145	-3.94	0.000223	0.334	0.522	167542	KIAA0062蛋白	Hs.89868	KIAA0062	8p21.2
146	-3.93	0.00023	0.504	0.902	169449	精氨酸酶，肝脏	166337(1ncytePD)			145	-3.94	0.000223	0.334	0.522	167542	KIAA0062蛋白	Hs.89868	KIAA0062	8p21.2
146	-3.93	0.00023	0.504	0.902	169449	精氨酸酶，肝脏	166337(1ncytePD)			147	-3.93	0.000231	0.649	0.78	167543	凝血因子VIII，原促凝剂组分(血友病A)	Hs.79345	F8	Xq28
148	-3.93	0.000235	0.491	0.61	163368	CDw92抗原	Hs.179902	CDW92	9q31.2	147	-3.93	0.000231	0.649	0.78	167543	凝血因子VIII，原促凝剂组分(血友病A)	Hs.79345	F8	Xq28
148	-3.93	0.000235	0.491	0.61	163368	CDw92抗原	Hs.179902	CDW92	9q31.2	149	-3.91	0.000244	1.059	1.761	168931	热休克蛋白105kD	Hs.36927	HSP105B	13q12.2
150	-3.91	0.000245	0.406	0.687	165009	血清粘蛋白1	Hs.572	ORM1	9q31-q32	149	-3.91	0.000244	1.059	1.761	168931	热休克蛋白105kD	Hs.36927	HSP105B	13q12.2
150	-3.91	0.000245	0.406	0.687	165009	血清粘蛋白1	Hs.572	ORM1	9q31-q32	151	-3.89	0.000264	0.37	0.662	162162	补体成分8，α多肽	Hs.93210	C8A	1p32
152	-3.89	0.000265	0.746	1.159	166110	2，4-二烯酰CoA还原酶1，线粒体的	Hs.81548	DECR1	8q21.3	151	-3.89	0.000264	0.37	0.662	162162	补体成分8，α多肽	Hs.93210	C8A	1p32
152	-3.89	0.000265	0.746	1.159	166110	2，4-二烯酰CoA还原酶1，线粒体的	Hs.81548	DECR1	8q21.3	153	-3.88	0.000277	0.749	0.985	161689	生长激素受体	Hs.125180	GHR	5p13-p12
154	-3.87	0.000282	0.899	1.223	167617	硒蛋白P，血浆，1	Hs.275775	SEPP1	5q31	153	-3.88	0.000277	0.749	0.985	161689	生长激素受体	Hs.125180	GHR	5p13-p12
154	-3.87	0.000282	0.899	1.223	167617	硒蛋白P，血浆，1	Hs.275775	SEPP1	5q31	155	-3.86	0.000291	0.644	0.938	161484	细胞色素P450，亚家族IVF，多肽3(白三烯B4omega羟基化酶)	Hs.106242	CYP4F3	19p13.2
156	-3.85	0.000298	0.91	1.172	167551	微管相关的蛋白7	Hs.146388	MAP7	6q23.2	155	-3.86	0.000291	0.644	0.938	161484	细胞色素P450，亚家族IVF，多肽3(白三烯B4omega羟基化酶)	Hs.106242	CYP4F3	19p13.2
156	-3.85	0.000298	0.91	1.172	167551	微管相关的蛋白7	Hs.146388	MAP7	6q23.2	157	-3.85	0.000299	0.604	0.895	169703	磷酸葡糖变位酶1	Hs.1869	PGM1	1p31
158	-3.85	0.000305	0.673	0.909	163040	Incyte EST	2593385(IncytePD)			157	-3.85	0.000299	0.604	0.895	169703	磷酸葡糖变位酶1	Hs.1869	PGM1	1p31
158	-3.85	0.000305	0.673	0.909	163040	Incyte EST	2593385(IncytePD)			159	-3.84	0.000311	0.602	0.807	165566	L-3-羟基乙酰-辅酶A脱氢酶，短链	1550727(IncytePD)
160	-3.83	0.000322	1.017	1.192	162707	智人克隆25038mRNA序列	Hs.306359		15	159	-3.84	0.000311	0.602	0.807	165566	L-3-羟基乙酰-辅酶A脱氢酶，短链	1550727(IncytePD)
160	-3.83	0.000322	1.017	1.192	162707	智人克隆25038mRNA序列	Hs.306359		15	161	-3.83	0.000322	0.423	0.652	166674	配对的基本氨基酸切割系统4	Hs.170414	PACE4	15q26
162	-3.82	0.000327	0.732	1.378	165737	脂肪酸结合蛋白1，肝脏	Hs.380135	FABP1	2p11	161	-3.83	0.000322	0.423	0.652	166674	配对的基本氨基酸切割系统4	Hs.170414	PACE4	15q26

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	163	-3.82	0.000334	0.596	0.86	168366	甾醇载体蛋白2	Hs.75760	SCP2	1p32
164	-3.82	0.000334	0.809	1.044	165115	乌头酸酶1，可溶型	Hs.154721	ACO1	9p22-p13	163	-3.82	0.000334	0.596	0.86	168366	甾醇载体蛋白2	Hs.75760	SCP2	1p32
164	-3.82	0.000334	0.809	1.044	165115	乌头酸酶1，可溶型	Hs.154721	ACO1	9p22-p13	165	-3.82	0.000389	0.718	1.152	161732	plexin B1	Hs.278311	PLXNB1	3p21.31
166	-3.8	0.000349	0.854	1.28	162202	转铁蛋白	Hs.396489	TF	3q21	165	-3.82	0.000389	0.718	1.152	161732	plexin B1	Hs.278311	PLXNB1	3p21.31
166	-3.8	0.000349	0.854	1.28	162202	转铁蛋白	Hs.396489	TF	3q21	167	-3.79	0.000361	0.553	0.886	167991	羟基类固醇(17-β)脱氢酶4	Hs.75441	HSD17B4	5q21
168	-3.79	0.000365	0.662	0.953	169717	孕酮受体膜组分1	Hs.90061	PGRMC1	Xq22-q24	167	-3.79	0.000361	0.553	0.886	167991	羟基类固醇(17-β)脱氢酶4	Hs.75441	HSD17B4	5q21
168	-3.79	0.000365	0.662	0.953	169717	孕酮受体膜组分1	Hs.90061	PGRMC1	Xq22-q24	169	-3.79	0.000367	0.554	1.088	165457	溶质载体家族27(脂肪酸转运蛋白)，成员2	Hs.11729	SLC27A2	15q21.2
170	-3.77	0.000389	0.687	1.101	164532	过氧化氢酶	Hs.395771	CAT	11p13	169	-3.79	0.000367	0.554	1.088	165457	溶质载体家族27(脂肪酸转运蛋白)，成员2	Hs.11729	SLC27A2	15q21.2
170	-3.77	0.000389	0.687	1.101	164532	过氧化氢酶	Hs.395771	CAT	11p13	171	-3.77	0.000401	0.969	1.28	162934	亮氨酸羧基甲基转移酶	Hs.8054	LCMT	16p12.3-16p12.1
172	-3.77	0.000391	0.583	0.822	160051	淋巴细胞胞质型蛋白1(L-网质)	Hs.381099	LCP1	13q14.3	171	-3.77	0.000401	0.969	1.28	162934	亮氨酸羧基甲基转移酶	Hs.8054	LCMT	16p12.3-16p12.1
172	-3.77	0.000391	0.583	0.822	160051	淋巴细胞胞质型蛋白1(L-网质)	Hs.381099	LCP1	13q14.3	173	-3.77	0.000394	0.701	0.97	168394	羟基乙酰-辅酶A脱氢酶/3-酮乙酰-辅酶A硫解酶/烯酰辅酶A水合酶(三功能蛋白)，β亚基	Hs.146812	HADHB	2p23
174	-3.75	0.000411	0.964	1.164	162323	EST	Hs.426542		4	173	-3.77	0.000394	0.701	0.97	168394	羟基乙酰-辅酶A脱氢酶/3-酮乙酰-辅酶A硫解酶/烯酰辅酶A水合酶(三功能蛋白)，β亚基	Hs.146812	HADHB	2p23
174	-3.75	0.000411	0.964	1.164	162323	EST	Hs.426542		4	175	-3.75	0.000419	0.689	1.067	160471	翻译抑制物蛋白p14.5	Hs.18426	UK114	8q22
176	-3.75	0.00042	0.624	0.823	163224	DC2蛋白	Hs.103180	DC2	4q25	175	-3.75	0.000419	0.689	1.067	160471	翻译抑制物蛋白p14.5	Hs.18426	UK114	8q22
176	-3.75	0.00042	0.624	0.823	163224	DC2蛋白	Hs.103180	DC2	4q25	177	-3.73	0.000444	0.998	1.308	162773	钙通道，电压依赖型，β2亚基	Hs.30941	CACNB2	10p12
178	-3.73	0.000454	0.88	1.1	166579	白介素18受体1	Hs.159301	IL18R1	2q12	177	-3.73	0.000444	0.998	1.308	162773	钙通道，电压依赖型，β2亚基	Hs.30941	CACNB2	10p12
178	-3.73	0.000454	0.88	1.1	166579	白介素18受体1	Hs.159301	IL18R1	2q12	179	-3.72	0.00046	0.665	1.113	161872	丝氨酸(或半胱氨酸)蛋白酶抑制物，clade A(α-1抗蛋白酶，抗胰蛋白酶)，成员7	Hs.76838	SERPINA7	Xq22.2
180	-3.71	0.000467	0.659	1.159	162012	脂蛋白，Lp(a)	Hs.119520	LPA	6q26-q27	179	-3.72	0.00046	0.665	1.113	161872	丝氨酸(或半胱氨酸)蛋白酶抑制物，clade A(α-1抗蛋白酶，抗胰蛋白酶)，成员7	Hs.76838	SERPINA7	Xq22.2
180	-3.71	0.000467	0.659	1.159	162012	脂蛋白，Lp(a)	Hs.119520	LPA	6q26-q27	181	-3.71	0.000469	0.859	1.179	163509	Hermansky-Pudlak综合症3	Hs.282804	HPS3	3q24
182	-3.68	0.000532	0.523	0.732	165011	酪氨酰蛋白磺基转移酶1	Hs.421194	TPST1	7q11.21	181	-3.71	0.000469	0.859	1.179	163509	Hermansky-Pudlak综合症3	Hs.282804	HPS3	3q24
182	-3.68	0.000532	0.523	0.732	165011	酪氨酰蛋白磺基转移酶1	Hs.421194	TPST1	7q11.21	183	-3.65	0.000577	0.649	0.875	164314	KIAA1450蛋白	Hs.83243	KIAA1450	4q32.1
184	-3.64	0.000582	0.935	1.054	162882	RAB3A相互作用蛋白(rabin3)样蛋白1	Hs.13759	RAB3IL1	11q12-q13.1	183	-3.65	0.000577	0.649	0.875	164314	KIAA1450蛋白	Hs.83243	KIAA1450	4q32.1
184	-3.64	0.000582	0.935	1.054	162882	RAB3A相互作用蛋白(rabin3)样蛋白1	Hs.13759	RAB3IL1	11q12-q13.1	185	-3.62	0.000636	0.769	1.162	165530	细胞色素P450，亚家族IIJ(花生四烯酸环氧化酶(epoxygenase))多肽2	Hs.152096	CYP2J2	1p31.3-p31.2

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	186	-3.59	0.000679	0.487	0.924	166057	POU结构域，1类，转录因子1(Pit1，生长激素因子1)	Hs.89394	POU1F1	3p11
187	-3.59	0.000703	0.95	1.228	167868	通用转录因子IIB	Hs.258561	GTF2B	1p22-p21	186	-3.59	0.000679	0.487	0.924	166057	POU结构域，1类，转录因子1(Pit1，生长激素因子1)	Hs.89394	POU1F1	3p11
187	-3.59	0.000703	0.95	1.228	167868	通用转录因子IIB	Hs.258561	GTF2B	1p22-p21	188	-3.58	0.000706	0.942	1.096	167779	通用转录因子IIE，多肽2，β34kDa	Hs.77100	GTF2E2	8p21-p12
189	-3.58	0.000727	0.947	1.225	165329	Rab9效应子p40	Hs.19012	RAB9P40	9q34.11	188	-3.58	0.000706	0.942	1.096	167779	通用转录因子IIE，多肽2，β34kDa	Hs.77100	GTF2E2	8p21-p12
189	-3.58	0.000727	0.947	1.225	165329	Rab9效应子p40	Hs.19012	RAB9P40	9q34.11	190	-3.57	0.000735	0.62	1.11	166857	纤溶酶原	Hs.75576	PLG	6q26
191	-3.55	0.000775	0.838	1.215	165788	钾内向整流通道，亚家族J，成员8	Hs.102308	KCNJ8	12p11.23	190	-3.57	0.000735	0.62	1.11	166857	纤溶酶原	Hs.75576	PLG	6q26
191	-3.55	0.000775	0.838	1.215	165788	钾内向整流通道，亚家族J，成员8	Hs.102308	KCNJ8	12p11.23	192	-3.55	0.000778	0.862	1.001	167386	烟酰胺N-甲基转移酶	604856(IncytePD)
193	-3.55	0.000795	0.671	0.802	163088	假定的蛋白FLJ21918	Hs.282093	FLJ21918	16q22.1	192	-3.55	0.000778	0.862	1.001	167386	烟酰胺N-甲基转移酶	604856(IncytePD)
193	-3.55	0.000795	0.671	0.802	163088	假定的蛋白FLJ21918	Hs.282093	FLJ21918	16q22.1	194	-3.55	0.00079	0.795	1.166	167385	电子转移黄素蛋白，α多肽(戊二酸尿症II)	Hs.169919	ETFA	15q23-q25
195	-3.54	0.000799	1.068	1.459	169569	精脒/精胺N1-乙酰转移酶	Hs.28491	SAT	Xp22.1	194	-3.55	0.00079	0.795	1.166	167385	电子转移黄素蛋白，α多肽(戊二酸尿症II)	Hs.169919	ETFA	15q23-q25
195	-3.54	0.000799	1.068	1.459	169569	精脒/精胺N1-乙酰转移酶	Hs.28491	SAT	Xp22.1	196	-3.54	0.000812	1.04	1.362	160982	ras应答元件结合蛋白1	Hs.171942	RREB1	6p25
197	-3.53	0.00083	0.756	0.967	166818	原肌球调节蛋白	Hs.374849	TMOD	9q22.3	196	-3.54	0.000812	1.04	1.362	160982	ras应答元件结合蛋白1	Hs.171942	RREB1	6p25
197	-3.53	0.00083	0.756	0.967	166818	原肌球调节蛋白	Hs.374849	TMOD	9q22.3	198	-3.52	0.000844	0.79	1.057	164368	类似于RIKEN cDNA 1810013D05基因[智人]，mRNA序列	Hs.32699		12
199	-3.52	0.000848	0.609	1.001	160667	山梨糖醇脱氢酶	Hs.878	SORD	15q15.3	198	-3.52	0.000844	0.79	1.057	164368	类似于RIKEN cDNA 1810013D05基因[智人]，mRNA序列	Hs.32699		12
199	-3.52	0.000848	0.609	1.001	160667	山梨糖醇脱氢酶	Hs.878	SORD	15q15.3	200	-3.52	0.000851	0.713	0.894	160956	假定的蛋白A-211C6.1	Hs.28607	LOC57149	16p11.2
201	-3.52	0.000858	0.625	0.933	166778	磷酸烯醇丙酮酸羧基激酶2(线粒体的)	Hs.75812	PCK2	14q11.2	200	-3.52	0.000851	0.713	0.894	160956	假定的蛋白A-211C6.1	Hs.28607	LOC57149	16p11.2
201	-3.52	0.000858	0.625	0.933	166778	磷酸烯醇丙酮酸羧基激酶2(线粒体的)	Hs.75812	PCK2	14q11.2	202	-3.52	0.000859	0.958	1.507	167552	溶酶体相关的膜蛋白2	Hs.8262	LAMP2	Xq24
203	-3.51	0.000891	1.012	1.281	160125	肿瘤蛋白，翻译受控型1	Hs.401448	TPT1	13q12-q14	202	-3.52	0.000859	0.958	1.507	167552	溶酶体相关的膜蛋白2	Hs.8262	LAMP2	Xq24
203	-3.51	0.000891	1.012	1.281	160125	肿瘤蛋白，翻译受控型1	Hs.401448	TPT1	13q12-q14	204	-3.5	0.000901	0.991	1.197	161606	IgG的Fc片段，受体，转运蛋白，α	Hs.111903	FCGRT	19q13.3
205	-3.5	0.000914	1.005	1.238	165593	跨膜7超家族成员1(在肾中上调)	Hs.15791	TM7SF1	1q42-q43	204	-3.5	0.000901	0.991	1.197	161606	IgG的Fc片段，受体，转运蛋白，α	Hs.111903	FCGRT	19q13.3
205	-3.5	0.000914	1.005	1.238	165593	跨膜7超家族成员1(在肾中上调)	Hs.15791	TM7SF1	1q42-q43	206	-3.5	0.000915	1.009	1.267	160129	MAP/微管亲和力调节的激酶2	Hs.157199	MARK2	11q12-q13
207	-3.47	0.000997	0.457	0.74	168320	乳酸脱氢酶A	Hs.2795	LDHA	11p15.4	206	-3.5	0.000915	1.009	1.267	160129	MAP/微管亲和力调节的激酶2	Hs.157199	MARK2	11q12-q13
207	-3.47	0.000997	0.457	0.74	168320	乳酸脱氢酶A	Hs.2795	LDHA	11p15.4	208	3.47	0.000996	1.098	0.826	160605	P311蛋白	Hs.142827	P311	5q22.1
209	3.48	0.000971	0.938	0.81	165174	智人cDNA FLJ35787 fis，克隆TESTI2005672，很类似于泛醇-细胞色素C还原酶复合物核心蛋白2前	Hs.265591		16	208	3.47	0.000996	1.098	0.826	160605	P311蛋白	Hs.142827	P311	5q22.1

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置							体(EC 1.10.2.2)，mRNA序列
210	3.49	0.000953	1.083	0.92	166833	溶质载体家族17(阴离子/糖转运蛋白)，成员5	Hs.117865	SLC17A5	6q14-q15							体(EC 1.10.2.2)，mRNA序列
210	3.49	0.000953	1.083	0.92	166833	溶质载体家族17(阴离子/糖转运蛋白)，成员5	Hs.117865	SLC17A5	6q14-q15	211	3.53	0.000822	1.111	0.953	165413	WIRE蛋白	Hs.13996	WIRE	17q21.1
212	3.56	0.000759	1.08	0.941	166348	表皮生长因子受体途径底物8相关蛋白1	Hs.28907	EPS8R1	19q13.42	211	3.53	0.000822	1.111	0.953	165413	WIRE蛋白	Hs.13996	WIRE	17q21.1
212	3.56	0.000759	1.08	0.941	166348	表皮生长因子受体途径底物8相关蛋白1	Hs.28907	EPS8R1	19q13.42	213	3.57	0.000725	1.048	0.9	163115	EST，中等类似于假定的蛋白FLJ20234[智人][H.sapiens]	Hs.119629		14
214	3.59	0.000684	1.124	0.963	163579	EST	Hs.194441		6	213	3.57	0.000725	1.048	0.9	163115	EST，中等类似于假定的蛋白FLJ20234[智人][H.sapiens]	Hs.119629		14
214	3.59	0.000684	1.124	0.963	163579	EST	Hs.194441		6	215	3.59	0.00068	1.835	1.306	161090	KIAA1641蛋白	Hs.44566	KIAA1641	2q11.1
216	3.6	0.000688	1.173	0.981	161354	p21/Cdc42/Rac1激活的激酶1(STE20同源物，酵母)	Hs.64056	PAK1	11q13-q14	215	3.59	0.00068	1.835	1.306	161090	KIAA1641蛋白	Hs.44566	KIAA1641	2q11.1
216	3.6	0.000688	1.173	0.981	161354	p21/Cdc42/Rac1激活的激酶1(STE20同源物，酵母)	Hs.64056	PAK1	11q13-q14	217	3.61	0.000661	0.947	0.82	162677	人BRCA2区，mRNA序列CG011	Hs.142907		13
218	3.64	0.000582	0.853	0.653	161085	聚合酶(DNA定向的)，δ1，催化亚基125kDa	Hs.99890	POLD1	19q13.3	217	3.61	0.000661	0.947	0.82	162677	人BRCA2区，mRNA序列CG011	Hs.142907		13
218	3.64	0.000582	0.853	0.653	161085	聚合酶(DNA定向的)，δ1，催化亚基125kDa	Hs.99890	POLD1	19q13.3	219	3.65	0.000572	1.141	0.985	161518	H2A组蛋白家族，成员A	Hs.121017	H2AFA	6p22.2-p21.1
220	3.65	0.000571	1.232	1.062	163109	线粒体的核糖体蛋白L43	Hs.151945	MRPL43	10q24.1-q24.3	219	3.65	0.000572	1.141	0.985	161518	H2A组蛋白家族，成员A	Hs.121017	H2AFA	6p22.2-p21.1
220	3.65	0.000571	1.232	1.062	163109	线粒体的核糖体蛋白L43	Hs.151945	MRPL43	10q24.1-q24.3	221	3.67	0.000537	1.014	0.841	164845	含硫氧还蛋白结构域4(内质网)	Hs.154023	TXNDC4	9q22.33
222	3.67	0.000538	0.677	0.528	162564	A激酶(PRKA)锚蛋白(yotiao)9	Hs.58103	AKAP9	7q21-q22	221	3.67	0.000537	1.014	0.841	164845	含硫氧还蛋白结构域4(内质网)	Hs.154023	TXNDC4	9q22.33
222	3.67	0.000538	0.677	0.528	162564	A激酶(PRKA)锚蛋白(yotiao)9	Hs.58103	AKAP9	7q21-q22	223	3.68	0.000522	1.301	1.059	164727	EST	Hs.125038		8
224	3.68	0.00052	0.898	0.781	161620	H4组蛋白家族，成员A[智人]，mRNA序列	Hs.278483		3	223	3.68	0.000522	1.301	1.059	164727	EST	Hs.125038		8
224	3.68	0.00052	0.898	0.781	161620	H4组蛋白家族，成员A[智人]，mRNA序列	Hs.278483		3	225	3.7	0.000484	0.976	0.854	161334	假定的蛋白20D7-FC4	Hs.128702	20D7-FC4	19q13.3
226	3.74	0.000428	1.081	0.871	163536	ERBB2的转导蛋白，2	Hs.4994	TOB2	22q13.2-q13.31	225	3.7	0.000484	0.976	0.854	161334	假定的蛋白20D7-FC4	Hs.128702	20D7-FC4	19q13.3
226	3.74	0.000428	1.081	0.871	163536	ERBB2的转导蛋白，2	Hs.4994	TOB2	22q13.2-q13.31	227	3.77	0.000411	1.376	1.018	162152	claudin 4	Hs.5372	CLDN4	7q11.23
228	3.83	0.00033	1.138	0.936	169742	EST，中等类似于假定的蛋白FLJ20378[智人][H.sapiens]	Hs.143992		2	227	3.77	0.000411	1.376	1.018	162152	claudin 4	Hs.5372	CLDN4	7q11.23
228	3.83	0.00033	1.138	0.936	169742	EST，中等类似于假定的蛋白FLJ20378[智人][H.sapiens]	Hs.143992		2	229	3.84	0.000311	1.234	1.035	161058	多发性内分泌瘤病I	Hs.423348	MEN1	11q13
230	3.84	0.000311	0.765	0.619	161813	KIAA0874蛋白	Hs.27973	KIAA0874	18p11.21	229	3.84	0.000311	1.234	1.035	161058	多发性内分泌瘤病I	Hs.423348	MEN1	11q13
230	3.84	0.000311	0.765	0.619	161813	KIAA0874蛋白	Hs.27973	KIAA0874	18p11.21	231	3.84	0.000311	1.227	1.01	168511	mutS同源物2，结肠癌，非息肉病型1(E.coli)	Hs.78934	MSH2	2p22-p21
232	3.84	0.000309	1.265	1.031	161873	Incyte EST	3031912			231	3.84	0.000311	1.227	1.01	168511	mutS同源物2，结肠癌，非息肉病型1(E.coli)	Hs.78934	MSH2	2p22-p21

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置								(IncytePD)
233	3.89	0.000263	1.174	1.002	169310	核孔素62kDa	Hs.9877	NUP62	19q13.33								(IncytePD)
233	3.89	0.000263	1.174	1.002	169310	核孔素62kDa	Hs.9877	NUP62	19q13.33	234	3.9	0.000259	2.07	1.521	168933	中因子(midkine)(轴突生长促进因子2)	Hs.82045	MDK	11p11.2
235	3.96	0.000213	1.058	0.893	163495	假定的蛋白FLJ11280	Hs.3346	FLJ11280	1q21.2	234	3.9	0.000259	2.07	1.521	168933	中因子(midkine)(轴突生长促进因子2)	Hs.82045	MDK	11p11.2
235	3.96	0.000213	1.058	0.893	163495	假定的蛋白FLJ11280	Hs.3346	FLJ11280	1q21.2	236	3.96	0.000209	0.749	0.557	168500	智人cDNA：FLJ21930 fis，克隆HEP04301，很类似于HSU90916人克隆23815 mRNA序列	Hs.82845		11
237	3.96	0.000207	1.258	0.984	168246	甲状腺激素受体相互作用蛋白13	Hs.6566	TRIP13	5p15.33	236	3.96	0.000209	0.749	0.557	168500	智人cDNA：FLJ21930 fis，克隆HEP04301，很类似于HSU90916人克隆23815 mRNA序列	Hs.82845		11
237	3.96	0.000207	1.258	0.984	168246	甲状腺激素受体相互作用蛋白13	Hs.6566	TRIP13	5p15.33	238	3.98	0.000199	1.087	0.914	164713	智人全长插入cDNA克隆ZC18H06，mRNA序列	Hs.384561		19
239	4.03	0.000168	1.324	0.862	169559	E74-样因子3(ets结构域转录因子，上皮特异型)	Hs.166096	ELF3	1q32.2	238	3.98	0.000199	1.087	0.914	164713	智人全长插入cDNA克隆ZC18H06，mRNA序列	Hs.384561		19
239	4.03	0.000168	1.324	0.862	169559	E74-样因子3(ets结构域转录因子，上皮特异型)	Hs.166096	ELF3	1q32.2	240	4.04	0.000162	1.138	0.906	164262	膜蛋白，棕榈酰化型6(MAGUK p55亚家族成员6)	Hs.108931	MPP6	7p15
241	4.04	0.000164	1.187	0.998	161661	假定的蛋白FLJ10520	Hs.77510	FLJ10520	16q22.3	240	4.04	0.000162	1.138	0.906	164262	膜蛋白，棕榈酰化型6(MAGUK p55亚家族成员6)	Hs.108931	MPP6	7p15
241	4.04	0.000164	1.187	0.998	161661	假定的蛋白FLJ10520	Hs.77510	FLJ10520	16q22.3	242	4.05	0.000159	1.15	0.926	163071	智人cDNA：FLJ21409 fis，克隆COL03924，mRNA序列	Hs.172129		5
243	4.12	0.000126	1.058	0.922	165465	KIAA0195基因产物	Hs.301132	KIAA0195	17q25.2	242	4.05	0.000159	1.15	0.926	163071	智人cDNA：FLJ21409 fis，克隆COL03924，mRNA序列	Hs.172129		5
243	4.12	0.000126	1.058	0.922	165465	KIAA0195基因产物	Hs.301132	KIAA0195	17q25.2	244	4.14	0.000117	1.265	1.023	164085	EST	Hs.107845		2
245	4.14	0.000119	1.301	1.049	166229	假定的蛋白FLJ11362	Hs.8929	FLJ11362	Xq25-q26.1	244	4.14	0.000117	1.265	1.023	164085	EST	Hs.107845		2
245	4.14	0.000119	1.301	1.049	166229	假定的蛋白FLJ11362	Hs.8929	FLJ11362	Xq25-q26.1	246	4.18	0.000102	1.027	0.872	166228	亨廷顿蛋白(huntingtin)(Huntington氏疾病)	Hs.79391	HD	4p16.3
247	4.21	9.10E-05	0.614	0.427	169583	神经粒蛋白(neurogranin)(蛋白激酶C底物，RC3)	Hs.26944	NRGN	11q24	246	4.18	0.000102	1.027	0.872	166228	亨廷顿蛋白(huntingtin)(Huntington氏疾病)	Hs.79391	HD	4p16.3
247	4.21	9.10E-05	0.614	0.427	169583	神经粒蛋白(neurogranin)(蛋白激酶C底物，RC3)	Hs.26944	NRGN	11q24	248	4.3	6.80E-05	1.37	1.01	160913	claudin 4	Hs.5372	CLDN4	7q11.23
249	4.31	6.60E-05	1.063	0.844	168965	形成素结合蛋白3	Hs.107213	FNBP3	2q23.3	248	4.3	6.80E-05	1.37	1.01	160913	claudin 4	Hs.5372	CLDN4	7q11.23
249	4.31	6.60E-05	1.063	0.844	168965	形成素结合蛋白3	Hs.107213	FNBP3	2q23.3	250	4.35	5.80E-05	1.154	0.878	166849	p53-响应基因5	1510581(IncytePD)
251	4.37	5.30E-05	1.021	0.816	167919	KIAA1361蛋白	Hs.15119	KIAA1361	17q11.1	250	4.35	5.80E-05	1.154	0.878	166849	p53-响应基因5	1510581(IncytePD)
251	4.37	5.30E-05	1.021	0.816	167919	KIAA1361蛋白	Hs.15119	KIAA1361	17q11.1	252	4.45	4.00E-05	1.219	0.977	166837	EST	Hs.279482		2
253	4.45	4.10E-05	1.278	0.974	168977	智人cDNA FLJ34031 fis，克隆FCBBF2003895，mRNA序列	Hs.340316		19	252	4.45	4.00E-05	1.219	0.977	166837	EST	Hs.279482		2
253	4.45	4.10E-05	1.278	0.974	168977	智人cDNA FLJ34031 fis，克隆FCBBF2003895，mRNA序列	Hs.340316		19	254	4.49	3.50E-05	1.06	0.93	166408	假定的蛋白FLJ39514	Hs.48565	FLJ39514	4q11

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	255	4.49	3.50E-05	1.233	0.952	167009	蛋白激酶C，iota	Hs.1904	PRKCI	3q26.3
256	4.6	2.40E-05	1.237	1.011	168029	小核的核糖核蛋白多肽A	Hs.173255	SNRPA	19q13.1	255	4.49	3.50E-05	1.233	0.952	167009	蛋白激酶C，iota	Hs.1904	PRKCI	3q26.3
256	4.6	2.40E-05	1.237	1.011	168029	小核的核糖核蛋白多肽A	Hs.173255	SNRPA	19q13.1	257	4.61	2.40E-05	0.838	0.632	169587	v-Ki-ras2 Kirsten rat肉瘤2病毒癌基因同源物	Hs.433714	KRAS2	12p12.1
258	4.61	2.40E-05	1.425	0.974	163235	FLJ00005蛋白	Hs.367690	FLJ00005	15q22.33	257	4.61	2.40E-05	0.838	0.632	169587	v-Ki-ras2 Kirsten rat肉瘤2病毒癌基因同源物	Hs.433714	KRAS2	12p12.1
258	4.61	2.40E-05	1.425	0.974	163235	FLJ00005蛋白	Hs.367690	FLJ00005	15q22.33	259	4.63	2.20E-05	1.153	0.953	161066	假定的蛋白来自克隆24796	Hs.27191	LOC57146	16p12
260	4.67	1.90E-05	0.967	0.784	165515	3-磷酸肌醇依赖型蛋白激酶-1	Hs.154729	PDPK1	16p13.3	259	4.63	2.20E-05	1.153	0.953	161066	假定的蛋白来自克隆24796	Hs.27191	LOC57146	16p12
260	4.67	1.90E-05	0.967	0.784	165515	3-磷酸肌醇依赖型蛋白激酶-1	Hs.154729	PDPK1	16p13.3	261	4.67	1.90E-05	1.035	0.775	169403	蛋白磷酸酶1，调节(抑制物)亚基12A	Hs.16533	PPP1R12A	12q15-q21
262	4.71	1.60E-05	1.14	0.951	169490	假定的蛋白DKFZp564K0322	Hs.97876	DKFZP564K0 32	19q13.32	261	4.67	1.90E-05	1.035	0.775	169403	蛋白磷酸酶1，调节(抑制物)亚基12A	Hs.16533	PPP1R12A	12q15-q21
262	4.71	1.60E-05	1.14	0.951	169490	假定的蛋白DKFZp564K0322	Hs.97876	DKFZP564K0 32	19q13.32	263	4.71	1.60E-05	3.6	1.727	160089	肿瘤相关的钙信号转导蛋白1	Hs.692	TACSTD1	2p21
264	4.73	1.50E-05	1.055	0.889	169508	ATP酶，转运Cu++，α多肽(Menkes氏综合症)	Hs.606	ATP7A	Xq13.2-q13.3	263	4.71	1.60E-05	3.6	1.727	160089	肿瘤相关的钙信号转导蛋白1	Hs.692	TACSTD1	2p21
264	4.73	1.50E-05	1.055	0.889	169508	ATP酶，转运Cu++，α多肽(Menkes氏综合症)	Hs.606	ATP7A	Xq13.2-q13.3	265	4.8	1.20E-05	1.478	1.137	163214	假定的蛋白FLJ22548，类似于基因阱PAT 12	Hs.103267	FLJ22548	12q14.3
266	5.16	3.00E-06	1.12	0.89	168509	EST，稍类似于KHLX_人Kelch-样蛋白X[H.sapiens]	Hs.99398		14	265	4.8	1.20E-05	1.478	1.137	163214	假定的蛋白FLJ22548，类似于基因阱PAT 12	Hs.103267	FLJ22548	12q14.3
266	5.16	3.00E-06	1.12	0.89	168509	EST，稍类似于KHLX_人Kelch-样蛋白X[H.sapiens]	Hs.99398		14	267	5.17	3.00E-06	0.855	0.668	166434	假定的蛋白FLJ13213	Hs.331328	FLJ13213	15q21.2
268	5.37	1.00E-06	1.164	0.929	161233	Incyte EST	1602194(IncytePD)			267	5.17	3.00E-06	0.855	0.668	166434	假定的蛋白FLJ13213	Hs.331328	FLJ13213	15q21.2
268	5.37	1.00E-06	1.164	0.929	161233	Incyte EST	1602194(IncytePD)			269	5.55	p＜0.000001	1.449	0.963	167498	原钙粘蛋白17	Hs.106511	PCDH17	13q14.3
270	5.99	p＜0.000001	1.201	0.896	160943	智人克隆24630 mRNA序列	Hs.171553		3	269	5.55	p＜0.000001	1.449	0.963	167498	原钙粘蛋白17	Hs.106511	PCDH17	13q14.3
270	5.99	p＜0.000001	1.201	0.896	160943	智人克隆24630 mRNA序列	Hs.171553		3	271	6.36	p＜0.000001	1.345	1.012	165379	假定的蛋白BC008647	Hs.102480	LOC91875	14q11.1
272	6.36	p＜0.000001	1.376	0.962	167992	KIAA1557蛋白	Hs.6185	KIAA1557	12p11.21	271	6.36	p＜0.000001	1.345	1.012	165379	假定的蛋白BC008647	Hs.102480	LOC91875	14q11.1
272	6.36	p＜0.000001	1.376	0.962	167992	KIAA1557蛋白	Hs.6185	KIAA1557	12p11.21	273	6.37	p＜0.000001	1.229	0.824	166068	外胚层神经皮质(具有BTB-样结构域)	Hs.104925	ENC1	5q12-q13.3

具有最低参数p值(p＜0.000001)的前25个基因，被从273个基因的集合中选出，并且这25个基因的集合可产生与273个基因的集合相类似的结果。在表6中列出了这25个基因(它们在指示肝病患者发展为HCC的风险方面有显著性)、其基因符号、其染色体图谱位置、其UG簇标识号。用类似方式确定了进一步的由10个在预测严重肝病患者患HCC风险方面有显著的基因所构成的集合，并在表7中列出。

表6.用于通过复合多变量预测法鉴别可能患HCC的病人的25个显著基因及其在预测模型中计算多因子L值所需的值

	t-值	参数p-值	％CV支持	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	％CV支持	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	1	-7.28	0.0000001	100	0.603	0.903	160198	cofilin 2(肌肉)	Hs.180141	CFL2	14q
2	-6.53	0.0000001	100	0.985	1.607	168023	IgG的Fc片段，高亲和力Ia，(CD64)的受体	Hs.77424	FCGR1A	1q21.2-q21.3	1	-7.28	0.0000001	100	0.603	0.903	160198	cofilin 2(肌肉)	Hs.180141	CFL2	14q
2	-6.53	0.0000001	100	0.985	1.607	168023	IgG的Fc片段，高亲和力Ia，(CD64)的受体	Hs.77424	FCGR1A	1q21.2-q21.3	3	-6.46	0.0000001	100	0.643	1.175	162315	钙通道，电压依赖型，β3亚基	Hs.250712	CACNB3	12q13
4	-6.18	0.0000001	100	0.688	1.112	160302	肌凝蛋白IB	Hs.121576	MYO1B	2q12-q34	3	-6.46	0.0000001	100	0.643	1.175	162315	钙通道，电压依赖型，β3亚基	Hs.250712	CACNB3	12q13
4	-6.18	0.0000001	100	0.688	1.112	160302	肌凝蛋白IB	Hs.121576	MYO1B	2q12-q34	5	-6.16	0.0000001	100	0.473	1.161	169417	血蓝蛋白(铁氧化酶)	Hs.296634	CP	3q23-q25
6	-6.1	0.0000001	100	0.876	1.18	161756	白蛋白	Hs.184411	ALB	4q11-q13	5	-6.16	0.0000001	100	0.473	1.161	169417	血蓝蛋白(铁氧化酶)	Hs.296634	CP	3q23-q25
6	-6.1	0.0000001	100	0.876	1.18	161756	白蛋白	Hs.184411	ALB	4q11-q13	7	-6.04	0.0000001	100	0.719	1.224	162290	UDP-N-乙酰基葡糖胺焦磷酸化酶1	Hs.21293	UAP1	1q23.1
8	-6.01	0.0000001	100	0.534	1.141	162538	未知[智人]，mRNA序列	Hs.367982		16	7	-6.04	0.0000001	100	0.719	1.224	162290	UDP-N-乙酰基葡糖胺焦磷酸化酶1	Hs.21293	UAP1	1q23.1
8	-6.01	0.0000001	100	0.534	1.141	162538	未知[智人]，mRNA序列	Hs.367982		16	9	-5.94	0.0000001	100	0.491	0.714	168634	染色体20开放阅读框3	Hs.22391	C20orf3	20p11.22-p11.21
10	-5.93	0.0000001	100	0.756	1.276	164136	乙酰-辅酶A脱氢酶，长链	Hs.1209	ACADL	2q34-q35	9	-5.94	0.0000001	100	0.491	0.714	168634	染色体20开放阅读框3	Hs.22391	C20orf3	20p11.22-p11.21
10	-5.93	0.0000001	100	0.756	1.276	164136	乙酰-辅酶A脱氢酶，长链	Hs.1209	ACADL	2q34-q35	11	-5.9	0.0000001	100	0.864	1.181	163874	KIAA0092基因产物	Hs.151791	KIAA0092	11q21
12	-5.88	0.0000001	100	0.728	0.925	163096	CGI-26蛋白	Hs.24332	CGI-26	12p12.3	11	-5.9	0.0000001	100	0.864	1.181	163874	KIAA0092基因产物	Hs.151791	KIAA0092	11q21
12	-5.88	0.0000001	100	0.728	0.925	163096	CGI-26蛋白	Hs.24332	CGI-26	12p12.3	13	-5.73	0.0000001	100	0.616	1.133	160233	双特异性酪氨酸-(Y)-磷酸化调节的激酶3	Hs.38018	DYRK3	1q32
14	-5.67	0.0000001	100	0.786	1.071	160436	类似于假定的蛋白PRO2831[智人]，mRNA序列	Hs.406646		15	13	-5.73	0.0000001	100	0.616	1.133	160233	双特异性酪氨酸-(Y)-磷酸化调节的激酶3	Hs.38018	DYRK3	1q32

	t-值	参数p-值	％CV支持	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	％CV支持	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	独特标号	描述	UG簇	基因符号	染色体位置	15	-5.65	0.0000001	100	0.761	1.382	160795	肝白血病因子	Hs.433707	HLF	17q22
16	-5.61	0.0000001	100	0.314	0.798	161944	补体成分9	Hs.1290	C9	5p14-p12	15	-5.65	0.0000001	100	0.761	1.382	160795	肝白血病因子	Hs.433707	HLF	17q22
16	-5.61	0.0000001	100	0.314	0.798	161944	补体成分9	Hs.1290	C9	5p14-p12	17	-5.6	0.0000001	100	0.506	0.703	167718	ATP-结合盒，亚家族A(ABC1)，成员1	Hs.211562	ABCA1	9q31.1
18	-5.58	0.0000001	100	0.65	0.912	168437	KIAA0843蛋白	Hs.26777	KIAA0843	5q32	17	-5.6	0.0000001	100	0.506	0.703	167718	ATP-结合盒，亚家族A(ABC1)，成员1	Hs.211562	ABCA1	9q31.1
18	-5.58	0.0000001	100	0.65	0.912	168437	KIAA0843蛋白	Hs.26777	KIAA0843	5q32	19	-5.57	0.0000001	100	0.843	1.087	162884	胞内膜相关的不依赖于钙的磷脂酶A2γ	Hs.44198	IPLA2(GAM MA)	7q31
20	-5.48	0.0000001	100	0.657	1.065	166910	SIPL蛋白	Hs.64322	SIPL	2p25.3	19	-5.57	0.0000001	100	0.843	1.087	162884	胞内膜相关的不依赖于钙的磷脂酶A2γ	Hs.44198	IPLA2(GAM MA)	7q31
20	-5.48	0.0000001	100	0.657	1.065	166910	SIPL蛋白	Hs.64322	SIPL	2p25.3	269	5.55	0.0000001	100	1.449	0.963	167498	原钙粘蛋白17	Hs.106511	PCDH17	13q14.3
270	5.99	0.0000001	100	1.201	0.896	160943	智人克隆24630mRNA序列	Hs.171553		3	269	5.55	0.0000001	100	1.449	0.963	167498	原钙粘蛋白17	Hs.106511	PCDH17	13q14.3
270	5.99	0.0000001	100	1.201	0.896	160943	智人克隆24630mRNA序列	Hs.171553		3	271	6.36	0.0000001	100	1.345	1.012	165379	假定的蛋白BC008647	Hs.102480	LOC91875	14q11.1
272	6.36	0.0000001	100	1.376	0.962	167992	KIAA1557蛋白	Hs.6185	KIAA1557	12p11.21	271	6.36	0.0000001	100	1.345	1.012	165379	假定的蛋白BC008647	Hs.102480	LOC91875	14q11.1
272	6.36	0.0000001	100	1.376	0.962	167992	KIAA1557蛋白	Hs.6185	KIAA1557	12p11.21	273	6.37	0.0000001	100	1.229	0.824	166068	外胚层神经皮质(具有BTB-样结构域)	Hs.104925	ENC1	5q12-q13.3

这25个基因是通过最小参数p值(p＜0.000001)选出的。

表7.用于预测患HCC的10个显著基因及其在预测模型中计算多因子L值所需的值

	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	高/低	独特标号	描述	UG簇	基因符号	染色体位置
	t-值	参数p-值	在高风险组1中比率的几何均值	在低风险组2中比率的几何均值	高/低	独特标号	描述	UG簇	基因符号	染色体位置	103	-4.26	7.70E-05	0.406	0.89	0.45618	161362	色氨酸2，3-二加氧酶	Hs.183671	TDO2	4q31-q32
77	-4.57	3.60E-05	0.421	0.88	0.478409	161748	乙酰辅酶A乙酰转移酶1(乙酸乙酰辅酶A硫解酶)	Hs.37	ACAT1	11q22.3-q23.1	103	-4.26	7.70E-05	0.406	0.89	0.45618	161362	色氨酸2，3-二加氧酶	Hs.183671	TDO2	4q31-q32
77	-4.57	3.60E-05	0.421	0.88	0.478409	161748	乙酰辅酶A乙酰转移酶1(乙酸乙酰辅酶A硫解酶)	Hs.37	ACAT1	11q22.3-q23.1	42	-5.02	5.00E-06	0.506	1.137	0.445031	162311	丝氨酸(或半胱氨酸)蛋白酶抑制物，clade C(抗凝血酶)，成员1	Hs.75599	SERPINC1	1q23-q25.1
8	-6.01	p＜0.000001	0.534	1.141	0.468011	162538	未知[智人]，mRNA序列	Hs.367982		16	42	-5.02	5.00E-06	0.506	1.137	0.445031	162311	丝氨酸(或半胱氨酸)蛋白酶抑制物，clade C(抗凝血酶)，成员1	Hs.75599	SERPINC1	1q23-q25.1
8	-6.01	p＜0.000001	0.534	1.141	0.468011	162538	未知[智人]，mRNA序列	Hs.367982		16	63	-4.7	1.80E-05	0.355	0.917	0.387132	162617	FK506结合蛋白5	Hs.7557	FKBP5	6p21.3-21.2
131	-4.05	0.000155	0.565	1.142	0.494746	162666	激肽原	Hs.77741	KNG	3q27	63	-4.7	1.80E-05	0.355	0.917	0.387132	162617	FK506结合蛋白5	Hs.7557	FKBP5	6p21.3-21.2
131	-4.05	0.000155	0.565	1.142	0.494746	162666	激肽原	Hs.77741	KNG	3q27	121	-4.14	0.000116	0.59	1.176	0.501701	164863	溶质载体家族2(辅助的葡萄糖转运蛋白)，成员2	Hs.167584	SLC2A2	3q26.1-q26.2
142	-3.97	0.000205	0.418	0.896	0.466518	166007	酪氨酸氨基转移酶	Hs.161640	TAT	16q22.1	121	-4.14	0.000116	0.59	1.176	0.501701	164863	溶质载体家族2(辅助的葡萄糖转运蛋白)，成员2	Hs.167584	SLC2A2	3q26.1-q26.2
142	-3.97	0.000205	0.418	0.896	0.466518	166007	酪氨酸氨基转移酶	Hs.161640	TAT	16q22.1	116	-4.19	9.90E-05	0.507	1.102	0.460073	169375	细胞色素P450，亚家族IIC(美芬妥英4-羟基化酶)，多肽9	Hs.167529	CYP2C9	10q24
5	-6.16	p＜0.000001	0.473	1.161	0.407407	169417	血蓝蛋白(铁氧化酶)	Hs.296634	CP	3q23-q25	116	-4.19	9.90E-05	0.507	1.102	0.460073	169375	细胞色素P450，亚家族IIC(美芬妥英4-羟基化酶)，多肽9	Hs.167529	CYP2C9	10q24

Claims

1.一种鉴别抑制肝细胞癌HCC患者中癌细胞转移的潜在治疗靶点的方法，其特征在于，包括以下步骤：

a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触；

b)从样品中捕获标志物并产生第一个信号；

c)用非转移的HCC患者的样品重复步骤a)和步骤b)从而产生第二信号；

d)比较第一和第二信号，从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组，此亚组细胞标记物就是治疗HCC病人HCC转移的潜在治疗靶点。

2.如权利要求1所述的方法，其特征在于，

在步骤b)和步骤c)中扣除正常非癌组织样品在与步骤a)的芯片相同的芯片上所产生的信号，从而产生第一和第二信号。

3.一种预测肝细胞癌HCC患者癌细胞转移的方法，其特征在于，包括下述步骤：

a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触，这组细胞标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白；

b)从样品中捕获标志物；

c)从步骤b)的被捕获标志物中产生第一信号；

d)用非转移的HCC患者的样品重复步骤a)至步骤c)从而产生第二信号；

e)用不明确有无转移可能的HCC患者样品重复步骤a)至步骤c)从而产生第三信号；

f)将第三信号与第一和第二信号进行比较，从而确定步骤e)的HCC患者的转移可能性。

4.如权利要求3所述的方法，其特征在于，这组细胞标志物包括从表2基因中独立选出的至少20个基因或基因所编码的蛋白。

5.如权利要求4所述的方法，其特征在于，这组细胞标志物包括从表2基因中独立选出的至少50个基因或基因所编码的蛋白。

6.如权利要求5所述的方法，其特征在于，这组细胞标志物包括从表2基因中独立选出的至少100个基因或基因所编码的蛋白。

7.如权利要求6所述的方法，其特征在于，这组细胞标志物包括表2的基因或基因所编码的蛋白。

8.如权利要求3所述的方法，其特征在于，这组细胞标志物包括表4的基因或基因所编码的蛋白。

9.如权利要求3所述的方法，其特征在于，这组细胞标志物包括单基因编号为Hs.313、Hs.69707、Hs.222、Hs.63984、Hs.75573、Hs.177687、Hs.69707、Hs.222、Hs.323712、和Hs.63984的基因或基因所编码的蛋白。

10.如权利要求3所述的方法，其特征在于，步骤a)和b)的样品、步骤d)的样品和步骤e)的样品是肝组织提取物。

11.如权利要求3所述的方法，其特征在于，步骤a)中的芯片是基因组芯片。

12.如权利要求3所述的方法，其特征在于，步骤a)中的芯片是蛋白质组芯片。

13.一种鉴别用于防止慢性肝病患者发展为肝细胞癌HCC的潜在治疗靶点的方法，其特征在于，包括以下步骤：

a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触；

b)从样品中捕获标志物并产生第一个信号；

c)用HCC低危的慢性肝病患者样品重复步骤a)和步骤b)，从而产生第二信号；

d)比较第一和第二信号，从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组，此亚组的细胞标记物就是防止慢性肝病患者发展为HCC的潜在治疗靶点。

14.如权利要求13所述方法，其特征在于，在步骤b)和步骤c)中扣除正常非癌组织样本在与步骤a)的芯片相同的芯片上所产生的信号，从而产生第一和第二信号。

15.一种预测慢性肝病患者发展为肝细胞癌HCC的危险性的方法，其特征在于，包括以下步骤：

a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触，这组细胞标志物包括由表5基因中独立选出的至少10个基因或基因所编码的蛋白；

b)从样品中捕获标志物；

c)从步骤b)被捕获的标志物中产生第一信号；

d)用HCC低危的慢性肝病患者样品重复步骤a)至步骤c)从而产生第二信号；

e)用不明确有无HCC危险的慢性肝病患者样品重复步骤a)至步骤c)从而产生第三信号；

f)将第三信号和第一、第二信号进行比较，从而确定步骤e)的患者发展为HCC的危险性。

16.如权利要求15所述的方法，其特征在于，这组细胞标志物包括从表5基因中独立选出的至少20个基因或基因所编码的蛋白。

17.如权利要求16所述的方法，其特征在于，这组细胞标志物包括从表5基因中独立选出的至少50个基因或基因所编码的蛋白。

18.如权利要求17所述的方法，其特征在于，这组细胞标志物包括从表5基因中独立选出的至少100个基因或基因所编码的蛋白。

19.如权利要求18所述的方法，其特征在于，这组细胞标志物包括表5的基因或基因所编码的蛋白。

20.如权利要求15所述的方法，其特征在于，这组细胞标志物包括表6的基因或基因所编码的蛋白。

21.如权利要求15所述的方法，其特征在于，这组细胞标志物包括表7的基因或基因所编码的蛋白。

22.如权利要求15所述的方法，其特征在于，步骤a)和b)的样品、步骤d)的样品和步骤e)的样品是肝组织提取物。

23.如权利要求15所述的方法，其特征在于，步骤a)中的芯片是基因组芯片。

24.如权利要求15所述的方法，其特征在于，步骤a)中的芯片是蛋白质组芯片。

25.如权利要求15所述的方法，其特征在于，步骤a)中的患者所患的疾病选自下组：乙肝、丙肝、血色病和Wilson氏病。

26.如权利要求15所述的方法，其特征在于，步骤d)中的患者所患的疾病选自下组：酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。

27.如权利要求15所述的方法，其特征在于，步骤e)中的病人所患的疾病选自下组：乙肝、丙肝、血色病、Wilson氏病、酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。

28.一种计算机可读介质，其特征在于，包括：

a)第一数据集的代码，该数据集来源于第一信号，该信号来自与转移性HCC患者的样品接触的芯片，所述芯片包含针对一组细胞标志物的捕获试剂，这组细胞标志物包括由表2基因中独立选出的至少10个基因或基因所编码的蛋白；

b)第二数据集的代码，该数据集来源于第二信号，该信号来自与非转移性HCC患者的样品接触的芯片，所述芯片与a)的芯片相同；

c)第三数据集的代码，该数据集来源于第三信号，该信号来自与未知转移的HCC患者的样品接触的芯片，所述芯片与a)的芯片相同；

d)将第三数据集与第一和第二数据集进行比较的代码。

29.一个数字式计算机，其特征在于，它包括权利要求28所述的计算机可读介质。

30.一个系统，其特征在于，包括：

a)权利要求29所述的数字式计算机；

b)包含针对一组细胞标志物的捕获试剂的阵列的芯片，所述标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白；

c)能在与样品接触后从芯片上读取信号的阅读器。

31.一种计算机可读介质，其特征在于，它包括：

a)第一数据集的代码，该数据集来源于第一信号，该信号来自与患慢性肝病且HCC高危的患者的样品接触的芯片，所述芯片包含针对一组细胞标志物的捕获试剂，这组细胞标志物包括由表5基因中独立选出的至少10个基因或基因所编码的蛋白；

b)第二数据集的代码，该数据集来源于第二信号，该信号来自与慢性肝病且HCC低危的患者的样品接触的芯片，所述芯片与a)的芯片相同；

c)第三数据集的代码，所述数据集来源于第三信号，该信号来自与慢性肝病且发展为HCC的危险度未知的患者的样品接触的芯片，所述芯片与a)的芯片相同；

d)将第三数据集和第一和第二数据集进行比较的代码。

32.一个数字式计算机，其特征在于，它包括权利要求31所述的计算机可读介质。

33.一个系统，其特征在于，包括：

a)权利要求32所述的数字式计算机；

b)包含针对一组细胞标志物的捕获试剂的阵列的芯片，所述标志物包括从表5基因中独立选出的至少10个基因或基因所编码的蛋白；

c)能在与样品接触后从芯片上读取信号的阅读器。

34.一种抑制肝细胞癌HCC患者中癌转移的方法，其特征在于，该方法包括步骤：抑制骨桥蛋白(OPN)活性。

35.如权利要求34所述的方法，其特征在于，抑制骨桥蛋白活性的步骤是通过抑制OPN表达来完成。

36.如权利要求35所述的方法，其特征在于，用反义多核苷酸用来抑制OPN的表达。

37.如权利要求34所述的方法，其特征在于，抑制骨桥蛋白活性的步骤是通过抑制OPN和OPN受体之间的特异结合来完成。

38.如权利要求37所述的方法，其特征在于，采用OPN拮抗剂来抑制OPN和OPN受体之间的特异结合。

39.如权利要求37所述的方法，其特征在于，采用抗OPN抗体来抑制OPN和OPN受体之间的特异结合。

40一种抑制慢性肝病患者发展为肝细胞癌HCC的方法，其特征在于，包括步骤：抑制EpCAM的活性。

41.如权利要求40所述的方法，其特征在于，抑制EpCAM活性的步骤是通过抑制EpCAM表达来完成。

42.如权利要求41所述的方法，其特征在于，采用反义多核苷酸来抑制EpCAM的表达。

43.如权利要求41所述的方法，其特征在于，采用小的抑制性RNA来抑制EpCAM的表达。

44.如权利要求40所述的方法，其特征在于，抑制EpCAM活性的步骤是通过抑制EpCAM和EpCAM受体之间的特异结合来完成。

45.如权利要求44所述的方法，其特征在于，采用抗EpCAM抗体来抑制EpCAM和EpCAM受体之间的特异结合。