Nothing Special   »   [go: up one dir, main page]

CN1659287A - 诊断肝癌转移或发病可能性及鉴定治疗靶点的方法 - Google Patents

诊断肝癌转移或发病可能性及鉴定治疗靶点的方法 Download PDF

Info

Publication number
CN1659287A
CN1659287A CN038129825A CN03812982A CN1659287A CN 1659287 A CN1659287 A CN 1659287A CN 038129825 A CN038129825 A CN 038129825A CN 03812982 A CN03812982 A CN 03812982A CN 1659287 A CN1659287 A CN 1659287A
Authority
CN
China
Prior art keywords
gene
hcc
sample
chip
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN038129825A
Other languages
English (en)
Inventor
王心伟
叶青海
J·W·金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goverment Of United States, AS REPRESENTED BY SECRETARY D
US Government
Original Assignee
Goverment Of United States, AS REPRESENTED BY SECRETARY D
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goverment Of United States, AS REPRESENTED BY SECRETARY D filed Critical Goverment Of United States, AS REPRESENTED BY SECRETARY D
Publication of CN1659287A publication Critical patent/CN1659287A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57438Specifically defined cancers of liver, pancreas or kidney
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Genetics & Genomics (AREA)
  • Urology & Nephrology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Oncology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Software Systems (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Gastroenterology & Hepatology (AREA)

Abstract

本发明涉及诊断HCC患者的肝细胞癌(HCC)转移可能性和慢性肝病患者发展为HCC可能性的方法。还提供了用于上述分析的计算机可读介质、数字式计算机和系统。还公开了确定治疗HCC患者转移的潜在治疗靶点的方法和防止慢性肝病患者发展为HCC的方法。此外,本发明提供了通过抑制HCC患者的一个治疗靶点(骨桥蛋白)的功能而抑制HCC转移的方法,以及通过抑制慢性肝病患者的一个治疗靶点(EpCAM)的功能而防止其发展为HCC的方法。还公开了包含能抑制OPN或EpCAM功能的药物组合物。

Description

诊断肝癌转移或发病可能性及鉴定治疗靶点的方法
相关申请的交叉引用关系
该申请要求2002年4月5日提交的美国临时专利申请No.60/370,895的优先权,此申请的全部内容被引入本文作为参考。
对联邦政府资助的研究或开发下完成的发明的权力声明
本发明归美国政府(以健康及人类服务部秘书为代表)所有。
背景技术
肝细胞癌(HCC)是世界范围内最常见和最具侵入性的恶性肿瘤之一,治愈率低于5%。死亡率高的主要原因在于癌细胞在肝内出现转移。人们对有关肝内转移的分子机制或此类病人的特异性治疗靶点知之甚少。
在过去的十年内,许多技术使得监测在任一时间点的大量转录子(transcripts)的表达水平成为可能(见例如,Schena等人,Science 270:467-470,1995;Lockhart等人,NatureBiotechnology 14:1675-1680,1996;Blanchard等人,Nature Biotechnology 14:1649,1996;和美国专利No.5,569,588)。对于已经知道完整基因组的生物体而言,分析细胞内所有基因的转录子是可能的。对于其他生物体,如人,随着对人类基因组信息的逐渐了解,有可能在细胞内同时监测大量的基因。这些监测技术一般应用于鉴定在不同病理或生理状态下上调或下调的基因,应用于分析传递细胞状态信号的成员,以及应用于鉴定各种药物靶点。
本发明人分析了HCC组织中9180个基因的表达,病理组织来自伴随有肝内癌细胞转移或没有伴随转移的40个病人。使用监督机器学习算法(supervised machinelearning algorithm)对病人的基因表达特征进行分类,已经首次产生一分子信号特征(signature),该信号特征可以正确地将转移病人和非转移病人分类,而且已经鉴别出了与预后(包括病人存活率)密切相关的一些基因。伴有转移的原发HCCs病灶的基因表达信号与相应转移病灶的基因表达信号非常相似,这表明有利于扩散的基因在原发肿瘤内已启动。而且在伴有肝内转移的原发性HCC内,骨桥蛋白过度表达,并且体外侵入实验表明,抗骨桥蛋白的中和抗体可阻止高转移性肝癌细胞的侵入。这些资料表明,骨桥蛋白既可以用于诊断,又可以作为转移性HCC的治疗靶点。
该研究对肿瘤样品中9180个基因的表达进行了分析,样品来自54个HCC患者的肿瘤组织和59个有严重肝病(含高度危险发展为HCC和低度危险发展为HCC两类)但未癌变的肝脏组织。高危组包括乙肝、丙肝、血色病和Wilson氏病患者。低危组包括酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。高危组和低危组之间基因表达水平的比较已鉴别出一组重要的基因,可以用这些基因来对高危组和低危组进行区分。用来自HCC样品的表达数据对这组显著基因进行过滤,已识别出具有多重HCC相关分子特征的且可用于样品分类的亚组基因。此外,EpCAM作为最显著基因之一,其过度表达与严重肝病患者继发HCC的危险性呈正相关,抑制其表达可使HCC细胞生长受抑制。因此,EpCAM是预测发展为HCC危险性的诊断标志,同时也是阻止慢性肝病患者发展为HCC的治疗靶点。
发明概述
本发明一方面涉及一种方法,该方法对于HCC患者而言,可以鉴定抑制转移的潜在治疗靶点;对于慢性肝病患者而言可以阻止发展成为HCC。
一种鉴定抑制HCC患者转移的潜在治疗靶点的方法,包括以下步骤:a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触;b)从样品中捕获标志物并产生第一个信号;c)用非转移的HCC患者的样品重复步骤a)和步骤b)从而产生第二信号;d)比较第一和第二信号,从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组,此亚组的细胞标记物就是治疗HCC转移的潜在治疗靶点。在某些具体实施例中,在步骤b)和步骤c)中扣除正常非癌组织样品在芯片(与步骤a)的芯片相同)上所产生的信号,从而产生第一和第二信号。
一种鉴别防止慢性肝病患者发展为HCC的潜在治疗靶点的方法,包括以下步骤:a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触;b)从样品中捕获标志物并产生第一个信号;c)用HCC低危的慢性肝病患者样品重复步骤a)和步骤b),从而产生第二信号;d)比较第一和第二信号,从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组,此亚组的细胞标记物就是防止慢性肝病患者发展为HCC的潜在治疗靶点。在某些具体实施例中,在步骤b)和步骤c)中扣除正常非癌组织样本在芯片(与步骤a)的芯片相同)上所产生的信号,从而产生第一和第二信号。
本发明另一方面涉及预测HCC患者转移可能性或预测慢性肝病患者发展为HCC的危险性的方法。
一种预测HCC患者癌转移可能性的方法,包括下述步骤:a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触,这组细胞标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白;b)从样品中捕获标志物;c)从步骤b)的被捕获标志物中产生第一信号;d)用非转移的HCC患者的样品重复步骤a)至步骤c)从而产生第二信号;e)用不明确有无转移可能的HCC患者样品重复步骤a)至步骤c)从而产生第三信号;f)将第三信号和第一、第二信号进行比较,从而明确步骤e)的HCC患者是否有转移可能。在某些具体实施例中,进行上述实验的细胞标志物包括至少20个,较佳地50,更佳地100,最佳地全部的基因或由基因编码的蛋白,这些基因从表2中独立选出。在其他具体实施例中,这组细胞标志物包括来自表4的基因或基因所编码的蛋白,或编号为Hs.313、Hs.69707、Hs.222、Hs.63984、Hs.75573、Hs.177687、Hs.69707、Hs.222、Hs.323712、和Hs.63984的单基因(Unigene)。较佳地,步骤a)、b)、d)、e)所用样品最好为肝组织抽提物。在一优选例中,步骤a)的芯片是基因组芯片。在另一优选例中,步骤a)的芯片是蛋白组芯片。
一种预测慢性肝病患者发展为HCC的危险性的方法,包括以下步骤:a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触,这组细胞标志物至少包括10个基因或基因所编码的蛋白(由表5基因中独立选出);b)从样品中捕获标志物;c)从步骤b)被捕获的标志物中产生第一信号;d)用HCC低危的慢性肝病患者样品重复步骤a)至步骤c)从而产生第二信号;e)用不明确有无HCC危险的慢性肝病患者样品重复步骤a)至步骤c)从而产生第三信号;f)将第三信号和第一、第二信号进行比较,从而确定步骤e)的患者发展为HCC的危险性。在某些具体实施例中,进行上述实验的细胞标志物包括至少20、较佳地50、更佳地100、最佳地全部的基因或基因所编码的蛋白,这些基因从表5中独立选出。有时,细胞标志物来自表6或表7的基因或基因所编码的蛋白。较佳地,步骤a)、b)、d)、e)所用样品为肝组织抽提物。在一优选例中,步骤a)的芯片是基因组芯片。在另一优选例中,步骤a)的芯片是蛋白组芯片。在某些实施例中,有高度危险发展为HCC的病人患乙肝感染、丙肝、血色病和Wilson氏病。在另一些例子中,发展为HCC危险性较低的病人患有酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。在另一些例子中,待评估患HCC的危险度的病人患有乙肝、丙肝、血色病、Wilson氏病、酒精性肝病、自身免疫性肝炎或原发性胆汁性肝硬化。
本发明的另一方面涉及抑制HCC患者癌转移的方法和抑制慢性肝病患者发展为HCC的方法。抑制HCC患者癌转移的方法包含步骤:抑制OPN的活性。在某些实施例中,可通过抑制OPN的表达来抑制OPN的活性,较佳地是采用OPN特异的反义多核苷酸。此外,可通过抑制OPN与其受体间的特异性结合来抑制OPN的活性,较佳地是采用抗OPN抗体。防止慢性肝病患者发展为HCC的方法包括步骤:抑制EpCAM的活性。在某些实施例中,可通过抑制EpCAM的表达来抑制EpCAM的活性,较佳地是采用EpCAM特异的反义多核苷酸或者小的干扰性RNA。此外,可通过抑制EpCAM与其受体间的特异性结合来抑制EpCAM的活性,较佳地是采用抗EpCAM抗体。
本发明的再一方面涉及用于评估HCC患者癌细胞转移可能性或评估慢性肝病患者发展为HCC危险性的计算机可读介质、数字式计算机和系统。
评估HCC患者癌细胞转移可能性的计算机可读介质包括:a)第一数据集的代码,该数据集来源于第一信号,该信号来自与转移性HCC患者的样品接触的芯片,所述芯片包含针对一组细胞标志物的捕获试剂,这组细胞标志物包括至少10个基因或基因所编码的蛋白(由表2基因中独立选出);b)第二数据集的代码,该数据集来源于第二信号,该信号来自与非转移性HCC患者的样品接触的芯片,所述芯片与a)的芯片相同;c)第三数据集的代码,该数据集来源于第三信号,该信号来自与未知转移的HCC患者的样品接触的芯片,所述芯片与a)的芯片相同;d)将第三数据集与第一和第二数据集进行比较的代码。还提供了一种数字式计算机,它包含用来评估HCC患者癌细胞转移可能性的所述计算机可读介质。还提供了一个系统,它包括这样的数字式计算机、包含针对一组细胞标志物(所述标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白)的捕获试剂的阵列的芯片和能在与样品接触后从芯片上读取信号的阅读器。
评估慢性肝病患者发展为HCC危险的计算机可读介质包括:a)第一数据集的代码,该数据集来源于第一信号,该信号来自与患慢性肝病且HCC高危的患者的样品接触的芯片,所述芯片包含针对一组细胞标志物的捕获试剂,这组细胞标志物包括至少10个基因或基因所编码的蛋白(由表5基因中独立选出);b)第二数据集的代码,该数据集来源于第二信号,该信号来自与慢性肝病且HCC低危的患者的样品接触的芯片,所述芯片与a)的芯片相同;c)第三数据集的代码,所述数据集来源于第三信号,该信号来自与慢性肝病且发展为HCC的危险度未知的患者的样品接触的芯片,所述芯片与a)的芯片相同;d)将第三数据集和第一和第二数据集进行比较的代码。还提供了数字式计算机,它包含用来评估慢性肝病发展为HCC的危险性的所述计算机可读介质。还提供一个系统,它包括这样的数字式计算机、包含针对一组细胞标志物(所述标志物包括从表5基因中独立选出的至少10个基因或基因所编码的蛋白)的捕获试剂的阵列的芯片和能在与样品接触后从芯片上读取信号的阅读器。
定义
除非另有说明,此处所用科学和技术术语为该发明所属领域专业人士通常所理解的意义。下述文献提供了本发明中所用许多术语的一般定义:Singleton等人,Dictionary of Microbiology and Molecular Biology(第2版,1994);The CambridgeDictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,第5版,R.Rieger等人(eds.),Springer Verlag(1991);和Hale & Marham,The Harper CollinsDictionary of Biology(1991)。如本文所用,除非另有说明,下列术语具有其所属的含义。
如本文所用,术语“肝细胞癌”或“HCC”指占原发性肝癌的90%以上的主要类型的肝癌。肝癌细胞状态包括从高度分化的到高度退行性变而未分化的损伤。肝癌可以为单病灶肝内病变(非转移的)、多发性肝内转移或肝外转移。
“癌前高危疾病”指一组流行病学定义的疾病,这些疾病有高度危险发展为HCC。这些疾病包括慢性乙肝、丙肝、血色病和Wilson氏病。
“癌前低危疾病”指一组流行病学定义的疾病,这些疾病有低度危险发展为HCC。这些疾病包括酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。
术语“转移”或“转移的”指单个癌细胞浸润(侵入)周围组织、进入循环系统和在新的部位恶性增生的能力。
“非转移”指肿瘤未扩散到原发病灶以外,而且具体地指其未进入循环系统并在新的部位恶性增生。
术语“非癌”指一生物学或组织样品,其中的细胞呈正常或非病理形态,可采用肉眼、通过显微镜、免疫组织学、免疫学或应用检测病理状况的抗体或核酸探针在分子水平上进行分析。
术语“正常”指从未患HCC、高危癌前疾病、低危癌前疾病任一种病的个体采集而来的生物学样品或组织样品。
术语“捕获试剂”指任一能与特异性核酸或蛋白标志物结合的物质。典型地,可通过结合过程中的条件来控制具有标志物与捕获试剂的结合。如,核酸标志物与寡核苷酸的结合可被所用的杂交条件控制。严格的杂交条件仅允许有高度同源性(如与寡核苷酸有95%-100%的同源性)的核酸标志物与寡核苷酸结合。
“阵列”指结合于基片(如固相支持物)的多个捕获试剂,这些捕获试剂能结合于相关的标志物。例如,阵列可以由核酸分子、蛋白分子或其它试剂组成,可以特异性地结合从生物学样品中分离的核酸、蛋白或多肽。捕获试剂优先以可寻址方式结合,这样当相关标志物结合于捕获试剂时,可确定结合量。
“DNA微阵列”指捕获试剂是核酸分子的阵列。典型地,DNA阵列由一定长度的DNA寡核苷酸组成,在一定条件下能与DNA、cDNA或RNA分子杂交。DNA寡核苷酸可以是15~50碱基的短片段核苷酸,也可以是为500~1000碱基或更长片段的核苷酸。DNA微阵列可以由数百或数千个不同的核酸分子组成,每个核酸分子在阵列上处于固定的位置。当标志物被可检测分子标记后,标志物与DNA微阵列的结合通常可以被定量。术语DNA微阵列与术语“基因组阵列”可互换使用。
“蛋白质阵列”指捕获试剂能结合蛋白质标志物的阵列。典型地,捕获试剂为多克隆或单克隆抗体,可以与特异的蛋白质结合。换句话说,可以特异性结合蛋白的任何蛋白、多肽、核酸或其他分子或表面都可以被应用于蛋白阵列中。这些阵列通常包括数百或数千个位于可寻址区域的不同捕获试剂。当标志物被可检测分子标记后,蛋白质阵列上的捕获试剂与标志物的结合通常被定量。术语蛋白质阵列与术语“蛋白质组阵列”可互换使用。
“基因表达谱”指与标准样品比较,所有在组织样中表达的基因。基因表达谱中基因的表达水平,可通过比较标准样品和待检样品如HCC肿瘤样品或严重肝病患者样品的表达水平而确定。用于确定HCC肿瘤转移可能性的标准样品,为非癌肝脏组织或者为未诊断为HCC的病人的肝脏组织。用于确定严重肝病患者发展为HCC可能性的标准样品,为未诊断为严重肝病的病人的肝脏组织。与标准样品相比,待检样品中的基因可能过表达或低表达。
“转移性基因表达预测子(predictor)”指与转移性HCC的诊断相关的一簇特异基因的表达。转移性基因表达预测子可这样得出:比较非转移HCC样品和和转移的HCC样品的基因表达谱,继而运用一个明确的运算法则或一组运算法则进行聚类分析和分类分析。基因数可随所用的聚类运算法则或运算法则中的参数(如p-水平=0.001vs.0.022)而变动。
“HCC基因表达预测子”指与诊断可能发展为HCC的患者相关的一簇特异基因的表达。HCC基因表达预测子可这样得出:比较有发展为HCC高危的病人的非转移性肝脏样品与有发展为HCC低危的病人的非转移性肝脏样品的基因表达谱,继而运用一个明确的运算法则或一组运算法则进行聚类分析和分类分析。基因数可随所用的聚类运算法则或运算法则中的参数(如p-水平=0.001vs.0.022)而变动。
表2-7所用“UG簇”指由国家生物信息中心(NCBI)编辑的UniGene数据库。UniGene数据库中的每个登录号是所有核苷酸和氨基酸序列数据的汇编,可用于一特定的核酸序列。如,每个UG簇登录号可提供与GeneBank或其他数据库的链接,后者会提供编码基因的部分或全长cDNA的核苷酸序列。换句话说,链接可以提供基因组或EST序列资料或氨基酸序列信息。每个UG簇登录号为所鉴定的特定基因、核酸或氨基酸序列提供独一无二的序列信息。
“骨桥蛋白”指由SEQ ID NO:1编码的分泌型磷蛋白质或者其保守变异物,其Genebank登录号为NM_000582。在NCBI的UniGene数据库也可找到它的核酸和氨基酸序列信息,它在NCBI网址上的登录号为Hs.313。NCBI网址列出了9个mRNA/基因组DNA序列和900以上的表达序列标签(EST)。骨桥蛋白是一胞外蛋白,与骨基质和动脉粥样硬化斑块相关。全长的骨桥蛋白包括一个RGD氨基酸序列,该RGD氨基酸序列是整联蛋白的结合位点。骨桥蛋白是玻联蛋白受体的主要配体。“OPN”可与骨桥蛋白互换使用,都指蛋白、编码蛋白的基因或其片段。
“EpCAM”为一种40kDa的糖蛋白,功能是上皮细胞粘附分子。被确定为与肿瘤的钙离子信号转导物(也称为TACSTD1),UniGene簇登录号为Hs.692,EpCAM由基因GA733-2编码,该基因位于人类染色体4q上。EpCAM是在上皮来源的细胞中表达的跨膜蛋白,可介导不依赖于钙离子的同型细胞之间的粘附,能被许多已知的单克隆抗体特异识别,如17-1A、323/A3、KS1/4、GA733、MOC31等。
本发明中的术语“标志物”指编码多肽(有特定的表观分子量)的核酸序列或基因,其在转移性HCC患者或易患HCC个体样品中与对照个体(如非转移性HCC患者、未诊断为癌症或未检测出癌症的个体,正常或健康人)的相应样品中是差异性存在的。标志物也可以指由核酸序列或基因编码的多肽或蛋白质,其在转移性HCC患者或易患HCC个体样品中与对照个体(如非转移性HCC患者、未诊断为癌症或未检测出癌症的个体,正常或健康人)的相应样品中是差异性存在的。本发明中的标志物包括下文表2-7中有UG簇登录号的基因和其编码的蛋白质。
如本文所用,术语“样品”指生物学组织或组织液样品,它们可用于确定基因表达谱、标志物的来源、或包含有关蛋白(如骨桥蛋白或EpCAM)或编码该蛋白的核酸。这样的样品包括(但并不限于)从人体分离来的各种类型的组织,也可以包括组织切片如冷冻切片或石蜡切片。组织包括肝脏样品和体液样品(血、血清、血浆、尿以及其他体液。本发明所用的优选样品是从感兴趣组织(如肝脏)抽提得到的细胞溶解产物,这样的细胞溶解产物可本领域技术人员熟知的各种方法制备,这取决于待检测和检查的细胞标志物的形式,如作为核酸(如mRNA)、蛋白或具有其他可检测生物特性(如酶活性)的分子。
对于分析测定那些具有调节象骨桥蛋白或EpCAM等重要蛋白生物活性的化合物而言,上下文提到的术语“功能效应”应该包括测定间接或直接地受OPN或EpCAM影响的相关参数,例如编码蛋白的mRNA水平、蛋白水平和它们在功能上的,以及物理和化学的效应(例如它们与其天然结合物,例如其他蛋白、核酸或其他分子,进行特异性相互作用的能力;以及它们调节信号转导引起细胞的一系列活动的能力,例如细胞增值、分化、凋亡、分泌、粘连等)。
“核酸”指的是脱氧核糖核酸或者是核糖核酸及其聚合物,可以是单链或是双链形式。这个术语应该包括有含已知核酸类似物的核酸或基本骨架残基被修饰过的核酸或是作为联接物的核酸,它们可以是合成的、自然存在的以及非自然存在的,与对照核酸相比,它们拥有相似的结合特性,并且以类似于对照核苷酸的方式被代谢。这些类似物的例子有硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性的甲基膦酸酯、2-O-甲基核糖核苷酸、肽核酸(PNAs)。该术语还包括从生物标本中分离获得的核酸以及人工合成的寡核苷酸。
除非另外说明,一个特定的核酸序列也隐含地包含其保守修饰的核酸变异体(例如简并密码子取代)以及它们的互补序列,还包括明示的序列。具体地,简并密码子的取代可以通过生成序列而获得,在该生成的序列中,一个或多个选定的(或全部)密码子的第三个位置被混合碱基和/或脱氧肌苷残基所取代(Batzer等人,Nucleic AcidRes.19:5081,1991;Ohtsuka等人,J.Biol.Chem.260:2605-2608,1985;Rossolini等人,Mol.Cell.Probes 8:91-98,1994)。核酸这一术语可与基因、cDNA、mRNA、寡核苷酸及多核苷酸互换使用。
术语“多肽”、“肽”及“蛋白”在本文可互换使用,指氨基酸残基的聚合物。该术语可指这样的氨基酸聚合物,其中一个或多个氨基酸残基是对相应天然存在氨基酸的人工化学模拟物,还可指天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。
术语“氨基酸”指的是天然存在的及人工合成的氨基酸,以及与天然存在的氨基酸发挥相同作用的氨基酸类似物和氨基酸模拟物,。天然存在的氨基酸是由遗传密码编码的氨基酸和那些后来被修饰的氨基酸,例如羟基脯氨酸,γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指的是这些化合物,它们具有同天然存在的氨基酸相同的基本化学结构,例如结合于H的α碳原子、羧基、氨基和R基,例如高丝氨酸、正亮氨酸(己氨酸)、甲硫氨酸亚砜、甲硫氨酸甲基锍。这些类似物具有修饰过的R基团(如正亮氨酸)或修饰过的多肽骨架,但保留了与天然氨基酸相同的基本化学结构。氨基酸模拟物是指这样化学化合物,它们的结构不同于氨基酸的通用化学结构,但在功能上与天然的氨基酸相似。
氨基酸可以通过它们通常已知的IUPAC-IUB生化命名委员会推荐的三字符,或通过单字符表示。同样,核酸可以通过通常已被接受的单字母密码表示。
“保守修饰的变异体”对氨基酸序列和核酸序列都适用。对于特定的核酸序列,保守修饰的变异体指编码相同或本质上相同的氨基酸序列的核酸,或者当核酸不编码氨基酸序列时指本质上相同的序列。由于遗传密码的简并性,有大量功能相同的核酸可编码任一特定的蛋白。例如,密码子GCA、GCC、GCG和GCU都编码丙氨酸。因此,在丙氨酸由一密码子限定的每个位置,该密码子能变为上述的相应密码子中的任一种而不会改变被编码的多肽。这样的核酸变异体是“沉默变异体”,它们是保守修饰变异体的一种。本文的编码多肽的每一个核酸序列也指该核酸的每种可能的沉默变异体。技术人员会认识到,核酸中的每个密码子都能被修饰,从而产生功能上相同的分子(除了AUG和TGG之外,AUG是编码甲硫氨酸的唯一密码子,TGG是编码色氨酸的唯一密码子)。因此,编码多肽的沉默的核酸变异体在每个被描述的序列中都是暗含的。
至于氨基酸序列,技术人员会认识到,通过对核酸、肽类、多肽或蛋白序列进行单个取代、缺失或插入,从而在编码序列中改变、添加或缺失单个氨基酸或小部分百分比的氨基酸,这是“保守修饰的变异体”,其中该改变导致了氨基酸被化学相似的氨基酸所取代。提供功能相似的氨基酸的保守取代表是本领域熟知的。这些保守修饰的变异体是本发明的多态变异体、种间同源物和等位基因之外的,而且并不排除本发明的多态变异体、种间同源物和等位基因。
下面8组的每一组都含有可相互保守取代的氨基酸:
1)丙氨酸(A),甘氨酸(G)
2)天冬氨酸(D),谷氨酸(E)
3)天冬酰胺(N),谷氨酰胺(Q)
4)精氨酸(R),赖氨酸(K)
5)异亮氨酸(I),亮氨酸(L),甲硫氨酸(M),缬氨酸(V)
6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W)
7)丝氨酸(S),苏氨酸(T);和
8)半胱氨酸(C),甲硫氨酸(M)
(参见,例如Creighton,Proteins,1984)
对于诸如多肽结构等大分子结构,可以根据不同结构水平进行描述。对于该结构的综述,可以参阅例如Alberts等人,Molecular Biology of the Cell(3rd ed.,1994)以及Cantor和Schimmel,Biophysical Chemistry Part I:The Conformation of BiologicalMacromolecules(1980))。“一级结构”指一特定肽的氨基酸序列。“二级结构”指多肽中局部的有序三维结构。这些结构一般被称为(结构)域。结构域是多肽的一部分,它形成多肽紧凑单元并且通常长50到350个氨基酸。典型的结构域由更小的结构部件(如β-折叠和α-螺旋)构成。“三级结构”指多肽单体的完整三维结构。“四级结构”指独立的三级结构单元通过非共价键而形成的三维结构。各向异性术语也被认为是能量术语。
“抗体”指一多肽,它具有来自免疫球蛋白基因或其片段的骨架区域,并能特异性结合和识别抗原。具有识别功能的免疫球蛋白基因包括κ、λ、α、γ、δ(σ)、ε、μ恒定区基因以及成千上万的免疫球蛋白可变区基因。轻链被分为κ或σ。重链分成γ、μ、α、σ或ε,这依次限定了免疫球蛋白的种类,IgG、IgM、IgA、IgD和IgE。
一个典型的免疫球蛋白(抗体)的结构单元应包含四聚体。每个四聚体由两对相同的多肽链组成,每一对含有一条轻链(大约25KD)和一条重链(大约50-70KD)。每条链的N端界定了约100-110个或更多氨基酸组成的可变区,该可变区主要负责识别抗原。术语可变轻链(VL)和可变重链(VH)分别指这些轻链和重链。
抗体以完整的免疫球蛋白形式存在或以大量已充分表征的片段形式存在,这些片段是由不同的肽酶消化免疫球蛋白而产生的。因此,例如胃蛋白酶在铰链区中的二硫键下方消化抗体,从而产生F(ab)′2,一个F(ab)的二聚物(Fab本身是通过二硫键连于VH-CH1区的轻链)。通过在柔和条件下打断铰链区二硫键,可使F(ab)′2还原,由此将F(ab)′2二聚物转变成Fab′单体。Fab′单体本质上是具有部分铰链区的Fab(参见Fundamental Immunology(Paul编,第3版,1993)。尽管各种抗体片段是按照完整抗体被酶消化的方式命名的,但技术人员会理解,这些片段可用化学法或DNA重组法从头合成。因此,如本文所用,术语抗体也应包括完整抗体通过修饰所产生的抗体片段,或者用DNA重组技术从头合成的抗体片段(例如,单链Fv)或使用噬菌体显示文库鉴定出的抗体片段(参见,例如McCafferty等人,Nature 348:552-554,1990)
对于单克隆或多克隆抗体的制备,本领域中任一已知的技术都能被使用(参见,例如Kohler & Milstein,Nature 256:495-497(1975);Kozbor等人,Immunology Today 4:72(1983);Cole等人,pp.77-96,Monoclonal Antibodies and Cancer Therapy(1985))。生产单链抗体的技术(美国专利4946778)能用于生产本发明的多肽抗体。转基因小鼠或其他生物体(如其他哺乳动物)也能被用于表达人源化抗体。同样,噬菌体显示技术能用于鉴定特异性结合于选定抗原的抗体和异聚体的Fab片段(参见,例如McCafferty等人,同上;Marks等人,Biotechnology 10:779-783,1992)。
“嵌合抗体”是一种抗体分子,在该抗体分子中,(a)恒定区或恒定区中的一部分被改变、取代或交换,以致抗原结合位点(可变区)被连接于不同类别或已改变类别的抗体恒定区、效应子官能团或种类、或者赋予嵌合抗体新性质的完全不同的分子,例如酶、毒素、激素、生长因子、药物等;或者(b)可变区或者其中一部分被改变、取代或与具有不同或已改变的抗原特异性的可变区进行交换。
“抗骨桥蛋白抗体”是一种抗体或抗体片段,它特异结合于骨桥蛋白基因、cDNA、或其亚序列所编码的多肽。抗EpCAM抗体以类似方式被定义。
如本文所用,“受体”包括能特异性结合于特定蛋白(如OPN或EpCAM)的任一分子,并且因此包括蛋白、核酸、碳水化合物或任何其他分子。
术语“免疫分析”是使用抗体对抗原进行特异性结合的一种分析。免疫分析的特征是利用特定抗体的特异结合性来分离、靶向和/或定量分析抗原。
当指蛋白或肽时,术语“特异性(或选择性)结合于”抗体或“特异性(或选择性)免疫反应于”抗体指结合反应,该结合反应是测定某蛋白是否存在于异源蛋白群或其他生物体中的决定因素。因此,在指定的免疫分析条件下,特异性抗体结合于特定蛋白至少是本底的两倍,而基本上不会大量结合于样本中的其他蛋白。在这种条件下抗体的特异结合,会需要因对特定蛋白有特异性而选出的抗体。例如,从大鼠、小鼠或人这些特定物种获得的抗OPN多克隆抗体,可被选择从而获得那些与OPN特异性免疫反应而不与其它蛋白(除了OPN的多态变异体和等位基因)反应的多克隆抗体。这个筛选可以通过扣减与其他种属的OPN分子有交叉反应的抗体而得以完成。各种不同的免疫分析方式可用于筛选与特定蛋白进行特异性反应的抗体。例如,固相ELISA免疫分析被常规用于筛选与蛋白进行特异反应的抗体,(对于能用于确定特异性免疫反应的免疫分析方式和条件的描述,可参见,例如Harlow & Lane,Antibodies,A LaboratoryManual,1988)。典型地,特异性或选择性反应至少两倍于本底信号或噪音,而且更典型地是高出本底10-100倍。
术语“差异存在”指:分别与非转移的HCC样本或低危HCC病人的肝组织样本相比,在取自转移的HCC肿瘤或高危HCC病人的肝组织样本中的生物标记物在数量和/或频率上有差异。例如,标记物可以是多肽或核酸,与非转移的HCC样本或低危HCC病人的肝组织样本相比,这些标记物在取自转移的HCC肿瘤或高危HCC病人的肝组织样本中会高水平或低水平地出现。或者,标记物是多肽,与非转移的HCC样本或低危HCC病人的肝组织样本相比,该多肽在取自转移的HCC肿瘤或高危HCC病人的肝组织样本中被频率更高或更低地检测到。标记物的差异存在可以是数量、频率、或兼而有之。
如果在一个样本中多肽的数量在统计学上显著不同于同另一个样本中的数量,那么该多肽或核酸在两个样本中就是差别存在的。例如,如果多肽出现在某个样本中比另一个样本高出至少120%、至少130%、至少150%、至少180%、至少200%、至少300%、至少500%、至少700%、至少900%、或者至少1000%,或者如果多肽在其中一个样本中被检测到而在另一个样本中检测不到,那么该多肽就差别存在于两个样本中。
作为替换或作为附加,如果在转移的HCC肿瘤或高危HCC病人的肝组织样本中多肽被检测到的频率,在统计学上显著性地高于或低于在非转移的HCC样本或低危HCC病人的肝组织样本中检测到的多肽频率,那么该多肽就差别存在于两组样本。例如,如果在某组样本中观察到的多肽检测频率比其他组样本高出或低于至少120%、至少130%、至少150%、至少180%、至少200%至少300%、至少500%、至少700%、至少900%、或者至少1000%,或者如果多肽能在其中一个样本中被检测到而在另一个样本中检测不到,那么多肽就差别存在于两个样本。
“诊断”意思就是:确定病理症状或病理症状易感性的存在与否或本质属性,如HCC或HCC转移。在灵敏性和特异性方面,诊断方法可有所不同。诊断分析的灵敏性就是检测为阳性的患者百分率(真阳性的百分比)。没有被检测到的患者称为假阴性。没有患病并且在分析中检测为阴性的人称为真阴性。诊断分析的特异性就是1减去假阳性率,其中假阳性率就是没有得病的人被检测出阳性的比例。虽然一个特定诊断方法可能不提供疾病的确定的诊断结果,但是如果该方法提供有助于诊断的阳性指示,那么就足够了。
标记物的测定量就是指标记物分布在被检测样本中的数量。测定量要么是以绝对数量表示(如ug/ml),要么以相对值表示(例如信号的相对强度)。
标记物的诊断量就是在人样本中的标记物数量,它与转移的HCC肿瘤或高危险的HCC患者的组织样本的诊断相符合。诊断量可以是以绝对数量表示(如ug/ml),也可以以相对值表示(例如信号的相对强度)。
标记物的对照量可以是任一数量或者是在某个范围的数量,这个数量被用于同标记物的测定量相比较。例如标记物的对照量就是在没有转移HCC肿瘤的人或低危险HCC患者组织样本中出现的标记物数量。对照量可以是以绝对数量表示(如ug/ml),也可以以相对值表示(例如信号的相对强度)。
分光光度计探测器指一种设备,它能以可拆除的方式插进气相离子分光光度计,包括一个基质,该基质具有可放置用于测定的标记物的表面。分光光度计探测器可以含有单个基质或多个基质。名称有ProteinChip,ProteinChip阵列或芯片在本文也指特定种类的分光光度计探测器。
“基质”或“探测器基质”指在其表面提供吸附剂(如通过附着、沉积等)的固相载体。
“吸附剂”指能用于吸附标记物的任何物质。在这里使用的吸附剂术语既指与标记物接触的单一物质(单式吸附剂)(例如一个化合物或一个官能团),又指与标记物接触的多种不同的物质(复式吸附剂)。复式吸附剂中的吸附剂材料被称为“吸附剂种类”。例如,在探测器基质上可寻址的位置可以包括复式吸附剂,其特征是具有许多不同的、有不同的结合特性的吸附剂种类(如阴离子交换物质、金属鳌合剂或抗体)。基质材料本身也能用于吸附标记物并可被认为是吸附剂的一部分。
“吸附”或“保留”指在用洗脱剂(选择性阈值调节剂)或洗涤溶液进行洗脱之前或之后,在吸附剂和标记物之间的可检测的结合。
“洗脱剂”或“洗涤溶液”指的是能用于调节标记物对吸附剂进行吸附的试剂。洗脱剂和洗涤溶液都被称为选择性阈值调节剂。洗脱剂和洗涤溶液都能用于洗脱和去除掉探测器基质表面没有被结合的物质。
“标记物的分辨”,“辨析”或“解析”指在某个样本中,至少有一个标记物被检测到。分辨的意思包含:在某个样本中经分离检测多个标记物,以及随后随后的差别检测。解析并不需要把一个或多个标记物同混合物中其他生物分子完全分离开来。相反,分离只要使至少一个标记物和其他生物分子区别开就足够了。
“气相离子分光光度计”指当样品被蒸发和电离时,测量参数能被转换成离子形式荷质比的仪器。一般地,离子带一个电荷,并且质荷比一般被称作质量。例如,气相离子分光光度计包括质谱仪、离子迁移分光光度计、以及全离子流测量仪。
“质谱仪”指气相离子分光光度计,它包括一个进样系统、一个电离源、一个离子光学装置、一个质谱分析仪以及一个检测器。
“激光解吸质谱仪”指利用以激光为手段解吸、蒸发和电离被分析物的质谱仪。
“检测”指确定被检测物的存在、不存在或数量。
“可检测成分”或“标记物”指可通过分光光谱、光化学、生物化学、免疫化学、化学手段检测出的物质。例如,有用的标记物包括32P、35S、荧光染料、电子致密试剂、酶(例如常用在ELISA中的酶,如辣根过氧化物酶)、生物素-抗生物素蛋白链菌素、地高辛、半抗原和蛋白质(已有针对它们的抗血清或单克隆抗体)、或与靶目标有互补序列的核酸分子。可检测成分一般会产生可测量的信号,如放射性、发色的、或荧光信号,该信号能用于定量样品中已结合的可检测成分。信号定量可通过例如液体闪烁计数、密度测量或流式细胞测量术而获得。
如在该申请书中所用,“活性”指分子如由某个基因编码的蛋白(如骨桥蛋白或EpCAM)的生物学功能。该词包含生物学功能,如酶活性,同其它分子的特异性作用,在细胞或分子水平上对生物活动的调节效应等等。
如本文所用,术语“抑制的”或“抑制作用”指对有关靶点分子功能或活性的负调节作用,以致于功能或活性(如酶活性或与其他分子的特异作用)发生可检测的下降,或有效丧失。
如本文所用,术语“拮抗剂”指能够对靶分子(如骨桥蛋白或EpCAM)的生物活性进行负调节的化合物。拮抗剂可以通过不同方式完成负调节,如在转录或翻译水平通过抑制靶基因的表达,或干扰靶分子与其他分子的特异性相互作用。
如在描述多核苷酸的上下文中所使用的那样,术语“反义”指单链核酸的核苷酸序列互补于编码有关蛋白(如骨桥蛋白或EpCAM)的靶核酸的至少一部分,即与“正义”序列互补。两个单链多核苷酸之间的互补性是基于“A-T G-C”碱基配对原则的。如序列“5′-AGAT-3′”同序列“5′-ATCT-3′”互补。靶序列与其反义多核苷酸之间的互补性典型地为100%,即反义多核苷酸的所有碱基同靶核苷酸碱基相匹配,但也可有不同的互补程度,即可以有某些错配的碱基。靶核酸同它的反义多核苷酸之间互补的程度,对杂交的效率和强度有显著的影响。在本申请中的反义多核苷酸序列,可对应于靶核酸的编码区(即外显子)或非编码区。
图表的简要描述
图1.按照基因表达对转移的或没有转移的肝细胞癌进行分类。A)通过对所有5个临床组(即P、P-M、PT、PT-M、PN)的监测类别比较分析,获得143个显著性基因(P<0.0005),利用这些基因对50个原发性和转移HCC样本进行多维量表分析。轴代表这些基因中前三个主要组分。P,为肝内扩散的原发性HCC;P-M,P的转移损伤;PT,在门静脉有肿瘤血栓的原发性HCC;PN,无转移的原发性HCC样本。B)用来自于监测类别比对得到的383个显著性基因(P<0.0005),对来自P、PT、和PN组的30个原发性HCC样本的分级聚类分析。
图2.利用源于“省略单因素(leave-one-out)”的交叉验证复合共变预测分类法的转移预测模型,对转移和存活进行的预测结果。A)用于40个训练的和测试的HCC患者的转移预测模型。预测是基于训练集(圈)的,它包括先前在复合共变预测分类中使用过的10个PN和10个PT的原发性HCC样本,和20个没有在训练程序中使用过的原发性双盲HCC样本。该预测使用了153个在这两组中有区别的显著性基因。B)用153个有显著性基因,通过预测对40例原发性HCC样本进行多维量表分析。标出了病人的身份(ID)。C)40例PN、PT和P患者的Kaplan-Meier生存曲线。交叉符号表示检查时间。
图3.同转移HCC相关的候选基因。A)主要的30个候选基因分级聚类,这些基因的表达在PT和PT-M组中大部分已改变,但在PN组的却很少。每一排代表单个基因,每一列代表单个肿瘤样本。在所有肿瘤样本中,按照某一基因的丰度对所有基因丰度中值的比例,各基因就按中心关联和完全连锁(complete linkage)而排序。伪彩暗示差别表达:绿色正方形,表示低于中值的转录水平;黑色正方形,表示等于中值的转录水平;红色正方形,表示高于中值的转录水平;灰色正方形,无数据。树状图是建立在10个原发性PN(绿色)和10个原发性PT(红色)样本之上的。B)在伴随有转移(黑色棒)的10个原发性PN样本(绿色棒)和10个原发性PT样本(红色棒)中,通过cDNA微阵列分析得到的OPN相对表达率。C)和D)是在有或没有转移的原发性HCC样本中,OPNmRNA水平的半定量RT-PCR分析结果。
图4.正常肝组织和肝细胞癌中骨桥蛋白的免疫组织化学分析。原发性肿瘤细胞(S30肿瘤细胞)显示了细胞质骨桥蛋白的免疫反应,尤其在脉管系统高致密区(图b和d),但在纤维隔膜区(图b和d)或正常的肝实质细胞没有出现免疫反应(图a和c;正常肝914)。放大倍率50倍(H&E,x50)。
图5.骨桥蛋白在促进HCC转移中的作用。A)用大鼠的单克隆抗OPN抗体做Western印迹,确定了CCL 13、SK-Hep-1、和Hep3B细胞中骨桥蛋白的浓度。单克隆β-肌动蛋白抗体被作为内对照。密度测量仪用于OPN的定量,并相对肌动蛋白进行归一化处理。OPN水平表示为相对倍数。B)在有或没有重组的鼠骨桥蛋白,或者有或没有中和抗骨桥蛋白的抗体中的情况下,孵育CCL 13、SK-Hep-1、和Hep3B细胞,并通过Matrigel基膜细胞侵入腔(Cell Invasion Chamber)来测定其侵入情况。在每个条件下,数值为三次测量值的平均值,且表示为相对于穿过对照膜(对照室)的扩散而言,侵入Matrigel基质和膜(matrigel腔)的平均百分比(加上一个标准偏差)。C)五个额外HCC细胞系(SMMC7721、MHCC97、HuH1、HuH4和HuH7)通过matrigel基质与骨桥蛋白中和抗体发生反应,在该反应中的侵入情况如上进行测定。D)皮下注射HCCLM3细胞加抗OPN中和抗体(下图)或不加抗OPN中和抗体(上图),从之后35天的小鼠获得的代表性肺组织切片(H&E染色,放大100倍)。箭头表示肿瘤细胞等级。E)在给裸鼠皮下注射HCCLM3细胞后的不同周数,监测原发性肿瘤的大小。数据是10只小鼠的均值。F)在裸鼠皮下注射HCCLM3细胞,并且注射或不注射抗OPN中和抗体,在35天后,在裸鼠中检测到转移灶在肺部形成。基于转移的等级,定量转移灶的数目。数值是每组10只小鼠的均值。具有显著性p值(<0.05)的组用星号表示。
图6.EpCAM在HCC发展中潜在的致癌作用。a)和b)通过微阵列(a)或RT-PCR(b)分析,获得的EpCAM在不同慢性肝脏疾病的肝组织样本中的表达浓度。c)通过抗EpCAM的单克隆抗体的Western印迹分析,EpCAM在源于正常人的成纤维细胞(NHF-hTERT)、正常肝细胞(CCL13)和肝癌细胞(SK-Hep-1、Hep3B、Huh1、Huh4、Huh7、和HepG2)中的表达。抗β-肌动蛋白的单克隆抗体被用作内对照。d)由MTT分析获得的Hep3B、Huh1、和Huh4细胞的增值情况,数值为三个独立实验的平均值。e)通过Western印迹分析,测定siRNA对EpCAM表达有效的抑制作用。f)由MTT分析测定EpCAM siRNA对Hep3B细胞生长的抑制作用。
发明详述
在当今世界上,肝细胞癌(HCC)是最为普遍和最具攻击性的恶性肿瘤之一,在亚非十分盛行,而在欧洲和北美相对少(Parkin等人,CA Cancer J.Clin.49:33-64,1999;Pisani等人,Int.J.Cancer 83:18-29,1999)。近期研究表明,在过去的二十年,HCC在美国和英国的发生率显著增加(Taylor-Robinson等人,Lancet 350:1142-1143,1997;El-Serag and Mason,N.Eng.J.Med.340:745-750,1999)。大多数HCC患者由于落后的预测而导致无法救治。尽管通过对发展中的HCC患者例行检查可以使某些患者获得延长的寿命,但还是有许多患者被诊断为晚期HCC而被剥夺生存(参见,例如,Yang等人,J.Cancer Res.Clin.Oncol.123:357-360,1997;Izzo等人,Ann.Surg.227:513-518,1998)。虽然一小部分HCC患者有资格进行外科手术介入治疗,但对于长期生存质量的提高是不大的。极端落后的HCC预测主要是由于手术切除后的高复发率,或者是由于门静脉的侵入发展成肝内次生肿瘤,或者是由于扩散到肝内的其他部位,然而肝外次生肿瘤的发生并不普遍(参见,例如,Genda等人,Hepatology 30:1027-1036,1999)。这些文献说明肝脏是HCC转移的主要靶器官。这已经在动物模型系统以及门静脉是转移HCC细胞发生肝内次生肿瘤的主要路线的患者中得到证实(参见,例如,Mitsunobu等人,Clin.Exp.Metastasis 14:520-529,1996)。HCC的专一特征强调发展一种精确的分子模拟模型的必要性,目的是为了对那些有肝内次生肿瘤的患者提供更好的诊断和治疗靶点。
近期研究主要集中在单个候选基因上(参见,例如,Osada等人,Hepatology24:1460-1467,1996;Guo等人,Hepatology 28:1481-1488,1998;Hui等人,Int.J.Cancer84:604-608,1999)。这可能没有足够精确地反映转移型HCC的生物学本质。微阵列技术提供了在全基因组中探寻疾病相关基因表达的契机(参见,例如,Schena等人,Science 270:467-470,1995)。在关于肿瘤的发展进程、预后结果或治疗后的反应方面,这条途径已经对多种人类恶性肿瘤进行了成功的分子分类(Alizadeh等人,Nature403:503-511,2000;Bittner等人,Nature 406:536-540,2000;Perou等人,Nature406:747-752,2000;Khan等人,Nat.Med.7:673-679,2001;Pomeroy等人,Nature 415:436-442,2002;Shipp等人,Nat.Med.8:68-74,2002)。多个报告已经涉及原发性HCC样本的基因表达谱(Okabe等人,Cancer Res.61:2129-2137,2001;Xu等人,Proc.Natl.Acad.Sci.U.S.A.98:15089-15094,2001)。然而,同转移型HCC患者预后特征相关的分子信号还不清楚。
使用基于cDNA微阵列的基因表达图谱,可研究同转移相关的所有改变。起初的目的是为了鉴定能区分原发性肿瘤和其匹配的肝内转移损伤的基因。已揭示,肝内转移损伤同原发性肿瘤是不可区分的,它与肿瘤大小、微囊化和患者的年龄无关,尽管没有原发性转移的HCC能同具有原发性转移HCC区分开来。以上资料说明,有助于肝内转移的变化是在原发性HCC中启动的。另外,一个起重要作用的基因即骨桥蛋白(一种分泌型磷蛋白)出现在HCC转移中。在体外,骨桥蛋白的过表达同原发性HCC相关,其中该原发性HCC具有转移潜能和侵入肝脏肿瘤衍生细胞系的能力,而且可中和骨桥蛋白的抗体能在体外有效阻断HCC细胞的侵入并且也能在体内阻断肺内HCC细胞的转移。这些研究明确了,骨桥蛋白既可作为用来确定HCC患者是否有转移潜能的分子标记物,也可作为治疗转移型HCC的一个潜在的治疗靶点。
类似的方法被用于开发基因表达预测模型,以便预测那些慢性肝病患者发展成HCC的可能性。将流行病学上高危患HCC的病人基因表达图谱同流行病学上低危患HCC的病人基因表达图谱相比较,可鉴别出细胞标记物,从而能够鉴别出慢性肝病会高危险地向HCC发展的病人。那些有严重肝脏疾病患者包括那些被诊断为乙型肝炎、丙肝、色素性肝硬变、威尔逊疾病、酒精肝、自身免疫性肝炎和原发性肝胆硬化的人。高危险诱发早期癌症的疾病有慢性乙肝、慢性病肝、色素性肝硬变和威尔逊病。低危险诱发为早期癌症的疾病有酒精肝、自身免疫性肝炎和原发性肝胆硬化。在严重肝病的患者体内发现的EpCAM基因已被证实,它与诱发高危险HCC有关。通过抑制EpCAM的表达,肝癌细胞的生长抑制现象已被观察到,由此确定了EpCAM在HCC发展中所起的重要作用,并且可作为阻止慢性肝病患者发展成为HCC的治疗靶点。
本发明的一个具体方面就是提供了一种方法,它将疑似有转移型HCC或者有发展成HCC潜能的患者体内的共调节基因进行聚类分析,从而形成基因表达图谱。该节提供了对共调节基因进行聚类分析的更为详细的论述。
I.DNA微阵列分析
A.通过聚类分析基因表达图谱的分类
对于本发明的许多应用,有必要发现共调节的基本基因在非转移型HCC样本、转移型HCC样本、高危发展中的HCC样本和低危发展中的HCC样本中的表达图谱。确定这些基本的基因表达图谱的优选例子涉及聚类算法(对于聚类算法的综述,可以参阅Fukunaga,1990,Statistical Pattern Recognition,2版.,Academic Press,San Diego;Everitt,1974,Cluster Analysis,London:Heinemann Educ.Books;Hartigan,1975,Clustering Algorithms,New York:Wiley;Sneath和Sokal,1973,Numerical Taxonomy,Freeman;Anderberg,1973,Cluster Analysis for Applications,Academic Press:NewYork)。
在一些使用聚类分析的例子中,在不同来源的生物样本中,大量基因的表达能被监测到。含基因表达测量值的数据表已用于聚类分析。聚类分析会在m×k维数的数据表上运算,其中m指条件或波动因素的总数,k是已测量的基因数量。
有许多聚类算法可用于聚类分析。当需要形成簇时,聚类算法会运用物体间的不相似性或距离。在一些例子中,多维空间中使用的距离指欧几里得距离(Euclideandistance)。欧几里得距离可以被平方,从而对分开更远的物体上设置逐渐增大的权重。或者,距离的量度标准可以是曼哈顿距离。在其他例子中,对数据表进行未监管分级聚类分析,可以使用CLUSTER或TREEVIEW软件(Eisen等人,Proc.Natl.Acad.Sci.USA,95:14863-14868,1998)来执行,这些软件是利用了中值中心关联和完全连锁。
各种不同的簇连锁(linkage)规则可用于本发明的方法。单连锁是一种最近相邻法,它测定两个最靠近的物体间的距离。相反,完全连锁方法是通过不同簇中任二个物体间的最大距离来确定距离。这个方法特别适用于基因或其他细胞组分构成天然不同的“聚丛(clump)”的情况。或者,未加权的配对-组别(pair-group)的均值,界定了两个不同簇中所有配对物体间的平均距离。在对基因或其他细胞成分进行聚类分析以形成自然不同的聚丛时,这方法也非常有用。最后,加权的配对-组别平均方法也可被使用。这种方法同未加权的配对-组别平均方法相同,不同点在于将各簇的大小用作权重。这种方法特别适用于簇大小可能有很大变化的情况。(Sneath和Sokal,1973,Numerical taxonomy,San Francisco.W.H.Freeman & Co.)。其他簇连锁规则,例如未加权的和加权的配对-组别矩心和Ward氏算法也可用于本发明的一些例子。可以参阅文献Ward,1963,J.Am.Stat Assn.58:236;Hartigan,1975,Clustering algorithms,NewYork:Wiley。
在一特别优选的例子中,使用的聚类分析为BRB-ArrayTools软件,这是由美国国家癌症研究所的生物统计研究分部开发的完整软件包,用于对cDNA微阵列基因表达数据进行可视化和统计分析,可用于无人监控的分析和监控的分析。基于单变量F检验的“类别比较工具(Class Comparison Tool)”可用于在显著性差异水平为P<0.001或0.002的预定临床组别间寻找差异表达的基因。基于2000个随机的排列,F统计分析的排列分布状态也可用于确定统计学差异。通过使用2000个随机的P值小于0.001显著差异水平的排列,同时根据基因表达图谱,可使用具有“省略单因素(leave-one-out)”交叉确认测试的多变量复合共变预测工具(Compound Covariate Predictor,CCP),对预定的临床组别进行分类。在每一交叉确认的步骤中,一个样本被省略,并且基于基因创建一个多变量CCP,其中所述基因是在由未被省略的样本所组成的训练组中,在特定水平下显著单变的基因。CCP被用于对省略后的样本分类,然后注明分类是正确还是错误。对于每次排除一个后的所有样本都要进行重复。总交叉确认的错误分类比率就这样被测定。交叉确认的错误分类比率在统计学上的显著性,通过对数据重复进行2000次的完整交叉确认程序来确定,其中分类成员是随机置换的。CCP建立在基因表达变量的加权线性组合基础上,其中所述变量在训练组中是显著单变的,其权重对应于t-统计,如Radmacher等人,Journal of Computational Biology(出版中),2002中所述。聚类树输出的例子显示在图1和图3中(也可参阅下文的实施例1)。
基因表达谱可以基于树中许多更小的分支来定义,或者通过在不同水平上砍掉聚类树以许多更大的分支来定义。砍伐水平必须同所预期的不同临床组别数目相匹配。如果对于组别的数量而言仅有很少或没有在先信息,那么该聚类树应该被分成真实不同的许多分支。“真实不同”可用单分支间最小的距离值来定义。这个距离是连接两个分支的水平连线的纵坐标(参阅图1B)。典型值在0.2-0.4范围内,其中0是指完全关联,1是指零关联,但当训练集中良好数据较少或试验较少时,典型值可更大,或者当训练集中数据较好和试验较多时,典型值可更小。
更佳地,“真实不同”可用对聚类树中每一分叉的统计显著性的客观测试来定义。在本发明的一个方面,通过在预定显著性水平上,使用2000个随机置换,并用具有“省略单因素”交叉确认测试的复合共变预测工具,来定义客观测试。用CCP程序获得的牵引改进(tractional improvement)分布是在零假设理论(即特定分类是对或错)下对分布的评估值。
在本发明中聚类分析方法的另一方面是,提供了将基本载体的定义,用于在下文总所述的图谱规划。
B.谱的比对和分类
本发明的一个方面为提供了发现药物的方法。在一例子中,基因表达谱用聚类分析来定义。基因表达谱中的基因在感兴趣条件下被揭示是潜在共调节的。可进一步研究共调节基因是否涉及调节途径。鉴别出涉及调节途径的基因,可为设计和筛选新药提供有用信息。
在本发明的某些例子中,筛选候选药物用于治疗。在一个例子中,所期望的药物活性将能影响某个特定的遗传调节途径。在一个例子中,根据影响对应于调节途径的基因表达谱的能力,来筛选候选药物。在另一例子中,期望新药取代现存的药物。在一个例子中,候选药物的设计谱与现有药物相比较,以便确定哪个候选药物具有同现有药物相似的活性。
在某些例子中,本发明的方法被用于解释树形图和动力学。当受体被配体所激发(或阻断)时,下游通路的兴奋性可能会不同,这依赖于精确瞬时表达谱和配体与受体相互作用的分子结构域。不同配体导致不同效应的简单例子是表型差异,该差异产生于对激动剂、部分激动剂、反拮抗剂和拮抗剂的响应,而且预期该差异会产生于对共价键对非共价键的结合以及受体上不同分子区域的激活的响应。参阅Ross,Pharmacodynamics:Mechanisms of Drug Action and the Relationship between DrugConcentration and Effect in The Pharmacological Basis of Therapeutics(Gilman等人编辑,McGraw Hill,New York,1996)。图4A陈述了通路级联中两种可能的不同反应。
本发明的某些实施例中,像以OPN为配体的受体可以用本发明的设计方法进行研究,以便将观察到的瞬时反应简化为对应答基因作出的受体/配体作用。尤其在一些特别优选例中,发现了有关的基因表达谱和瞬时谱。大量基因的瞬时反应谱被投射(projected)到预定的基因表达谱,从而获得瞬时反应的规划谱。该规划过程简化了观察到的反应,因此不同的瞬时反应可以被更精确地检测和区分。
C.诊断应用的说明
本发明的一方面提供了诊断人类、动物和植物的疾病的方法。该方法同样可用于监测疾病发展的进程和治疗的有效性。
在本发明的一个实施例中,可对病人的细胞样本(如来自转移型HCC患者的患病组织的活检样本)进行大量的基因表达分析。根据基因表达谱的定义,该基因表达谱被规划成基因表达的表达值谱。把规划好的谱与含对照规划谱的对照数据库进行比对。如果在数据库中,患者的规划谱同癌症图谱匹配最佳,那么患者的病理组织被确诊为癌症。类似地,当最佳匹配是其他疾病的图谱,那就被确诊为该种疾病。
在另一实施例中,组织样本从患者的肿瘤组织中获得。对该组织样本进行大量相关基因表达分析。根据基因表达谱的定义,该基因表达谱被规划成基因表达的表达值谱。把规划好的谱与先前来自相同肿瘤的规划谱进行比对,以确定基因表达谱中的表达改变。用对照库来确定基因表达谱的改变是否预示着肿瘤发展(如转移)。类似的方法可用于确定其他疾病或紊乱的阶段。治疗中患者图谱中基因表达谱表达值的变化可用于监测治疗的有效性,例如,通过比较治疗前和治疗后的规划图谱。
D.分析试剂盒的实施
在优选例中,本发明的方法可以通过使用测定生物样本反应或状态的试剂盒来得以完成。这样的试剂盒含有微阵列,例如下面段落所述的微阵列(芯片)。在这些试剂盒中的芯片包括固相(例如一表面),而探针杂交于或结合于固相的已知位置。较佳地,这些探针由已知的不同的核酸组成,而且每一个核酸能同来源于该核酸的RNA或cDNA分子杂交。特别地,本发明试剂盒中含有的探针是能特异性地杂交于源自RNA的核酸序列,其中已知该RNA的增加或减少对应于由本试剂盒测定活性的某特定蛋白的波动。本发明试剂盒中的探针宜基本上排除那些与无关RNA的杂交的核酸,对于由本试剂盒测定活性的某个特定蛋白(如骨桥蛋白)的波动,这些RNA不会增加。
在优选例中,本发明的试剂盒同时带有基因表达谱定义的数据库(如上述的数据库)、或允许远程网络计算机使用上述数据库的接入授权书。
在另一优选例上,本发明的试剂盒进一步包含用于表达图谱的规划和分析的软件,该软件能被下载到计算机系统的内存中,例如上面小节中所述的并在实施例1中阐述的那样。本发明试剂盒中的表达谱分析软件同上面实施例1中所述的表达谱分析软件本质上是等同的。
用于实施本发明的分析方法的其他试剂盒,对于本领域技术人员而言是显而易见的,因而被包括在所附的权利要求中。具体地,附随的权利要求用于包括用于执行本发明方法的、对本领域技术人员而言显而易见的其他程序结构。
E.测定生物反应图谱的方法
本发明利用了测定反应的能力,这些反应是生物体系针对大量不同波动而作出的。本节为测定生物反应提供了一些代表性方法。本领域技术人员会意识到,本发明不局限于下列特定的测定生物体系反应的方法。
1.利用DNA芯片进行转录分析
本发明特别适用于基因表达谱的分析。本发明一方面提供了基于基因表达关联性而确定共调节基因表达图谱的方法。本发明一些实施例基于对基因转录率的测量。
转录率可以通过核酸芯片或核酸模拟探针杂交技术而得到测定(如下一节所述),或者通过其他基因表达技术而得到测定,例如在随后一节中所述的技术。然而,一旦被测定,结果要么是转录物的绝对量或相对量,要么是应答数据,包括表示RNA丰度率的数值,其中RNA丰度率经常用来反映DNA表达率(在没有RNA降解率的差异时)。
在本发明的各种不同实施例中,还可测定除了转录状态之外的生物状态方面如翻译状态,活性状态或混合状态。
较佳地,转录状态的测定可通过与DNA芯片杂交而获得,DNA芯片在本节被叙述。测定转录状态的某些其他方法将在该小节的后面叙述。
在优选例中,本发明使用了DNA芯片。DNA芯片可用于分析生物样本中的转录状态,而且尤其适合在暴露于各级梯度药物浓度下或在有关生物信号途径的梯度波动下,测定生物样本的转录状态。
在一个实施例中,DNA芯片的制备是通过将可检测的标记的寡核苷酸杂交于芯片,其中该寡核苷酸代表了存在于细胞中的mRNA转录本(如荧光标记的、从细胞总mRNA合成得来的cDNA)。芯片就是一个具有结合(如杂交)位点的有序阵列的表面,这些位点用于结合细胞或生物体基因组中大量基因,更佳地大部分或几乎全部基因的产物。芯片可以用许多方式制备,有几个将在下面叙述。然而,制备的芯片有一些优选特征:芯片有重现性,允许制备某个特定芯片的多个拷贝并且易于相互比较。优选的芯片是小型的,一般都小于52cm,并且它们用在结合反应条件下(如核酸杂交)稳定的材料制成。芯片中某一结合位点或独特的结合位点集将会特异结合于细胞中单个基因的产物。尽管对于每个特定mRNA可有多个物理结合位点(后面称之为“位点”),但为了便于清楚描述,下面论述会假定只有单个位点。
应理解,当和细胞RNA互补的cDNA被合成,并在适当的杂交条件下与微阵列(芯片)杂交时,芯片中对应于任一基因的位点的杂交水平,能反映出细胞内该基因转录的mRNA水平。比如,当可检测地标记的(如用荧光团)、与总细胞mRNA互补的cDNA和微阵列杂交时,阵列上对应于细胞内不转录的基因的位点(即能够与基因产物特异性结合)会信号很小或没有信号产生(如荧光信号);而对于编码的mRNA广泛存在的基因,则可以产生较强的信号。
在优选例中,两种不同细胞的cDNA与微阵列的结合位点杂交。在药物反应中,一种生物样品与药物接触,同一类型的另一种生物样品不与药物接触。在通路反应中,一个细胞暴露于通路扰动,同一类型的另一个细胞不暴露于通路扰动。来自两种细胞的cDNA用不同方法标记,方便区分。在一个实施例中,比如,经一种药物处理(或暴露于通路扰动)的细胞的cDNA,用荧光素标记的dNTP合成;来自另一种未经药物处理的细胞的cDNA,则用若丹明标记物的dNTP合成。当两种cDNA混合并与微阵列杂交时,可测定阵列上每一位点的每种cDNA组的信号相对强度,从而检测特定mRNA丰度的相对差。
在上述的例子中,当荧光团被刺激时,药物处理过(或通路扰动的)的细胞的cDNA显绿色荧光,而未处理细胞的cDNA显红色荧光。结果是,当药物处理直接或间接地对细胞内某一特定mRNA的相对丰度无效时,此mRNA会同等分布在两种细胞中,并且一旦逆转录,红色标记的和绿色标记的cDNA会同等存在。当杂交于微阵列时,对应于该RNA的结合位点会发出两种荧光团特有的波长(并且组合后呈现棕色)。相反,当与药物接触的细胞是用一种可直接或间接增加细胞内mRNA水平的药物处理时,绿色荧光对红色荧光强度之比会增加。如果药物降低mRNA水平,该强度比会降低。
用双色荧光标记和检测方法以确定基因表达变化的方法,在例如Shena等人,″Quantitative monitoring of gene expression patterns with a complementary DNAmicroarray,″Science 270:467-470,1995中有描述,该文献在此全文引入作为参考。用两种不同荧光团标记的cDNA的优点在于,可得到对应于每种阵列基因mRNA水平的一个直接的内部对照比较值,而且试验条件(如杂交条件)微小差异所引起的变化不会影响随后的分析。但是应理解,可以使用单个细胞的cDNA,并比较例如在药物处理或通路扰动的细胞和未处理的细胞中特定mRNA的绝对数量。
2.微阵列的制备
微阵列(芯片)是本领域所熟知的,它含有一表面,在该表面上与基因产物(如cDNAs、mRNAs、cRNAs、多肽、及其片段)序列相应的探针特异性杂交于或结合于已知位点。在一个实施例中,微阵列是一种阵列(即矩阵),其中每一位点代表一种基因编码的产物(如蛋白或RNA)的离散结合位点。同时,其中的结合位点代表了生物体基因组中大部分或几乎全部的基因产物。在一个优选实施例中,“结合位点”(下文的“位点”)是核酸或核酸类似物,它们能够和某一特定的同源cDNA特异性杂交。结合位点的核酸或类似物可以是,例如合成的寡聚物、全长cDNA、比全长短的cDNA、或基因片段。
尽管在优选例中,微阵列包括生物体靶基因组中所有或几乎所有基因产物的结合位点,都是这种全面性并不是必需的。通常,微阵列包含有基因组中至少50%左右,一般至少75%左右,更常见的至少85%左右,更普遍的至少90%左右,最普遍的至少99%左右的基因结合位点。微阵列宜有与药物或生物通路作用相关的基因结合位点。被鉴别为开放性阅读框(ORF)的“基因”宜含有至少50、75或99个氨基酸,并且其mRNA在生物体(例如,如果单细胞)或多细胞生物体的一些细胞中转录。基因组中的基因数目可以通过生物体表达的mRNA数量估计,或根据基因组已经充分研究的部分进行推断。当所研究的生物体基因组已被测序,ORFs的数量可以被确定并可通过分析DNA序列来确定mRNA编码区。比如,酿酒酵母的基因组已被完全测序,并报道约含有6275个长于99个氨基酸的开放性阅读框(ORFs)。对这些ORFs的分析显示5885个ORFs可能有蛋白产物(Goffeau等人,1996,Life with 6000 genes,Science274:546-567,该文献全文引入本文作为参考)。相对而言,人类基因组估计含有约5×104个基因。
3.制备微阵列核酸
如上所述,一个与特定的同源cDNA特异性杂交的“结合位点”通常是附着在该结合位点上的核酸或核酸类似物。在一个实施例中,微阵列的结合位点是DNA多核苷酸,它对应于生物体基因组每个基因的至少一个片段。这些DNA可通过聚合酶链式反应(PCR)等对基因组DNA、cDNA(如通过RT-PCR)或克隆序列的扩增而获得。根据基因或cDNA的已知序列,选择PCR引物,从而扩增得到独特的片段(即,和阵列上的其它片段没有多于10个碱基的相同序列的片段)。可用计算机程序设计特异性引物和优化的扩增条件。参见如Oligo 5.0版(National Biosciences)。如果是很长的基因的结合位点,可以扩增基因近3′端的片段,这样当寡-dT引物cDNA探针与微阵列杂交时,短于全长的探针可有效结合。典型地,微阵列上每一个基因片段长度在50bp和2000bp之间,更典型地在100bp和1000bp之间,通常的长度为300bp和800bp之间。PCR的方法是熟知的,在如Innis等人编辑,1990,PCR Protocols:A Guide to Methods and Applications,Academic Press Inc.,San Diego,Calif.中有描述,该文献全文引用作为参考。很明显,计算机控制的自动系统可用于有效分离和扩增核酸。
合成微阵列核酸的另一方法是用N-膦酸酰或膦酸酰胺化学方法合成多核苷酸或寡聚核苷酸(Froehler等人,1986,Nucleic Acid,Res 14:5399-5407;McBride等人,1983,Tetrahedron Lett.24:245-248)。合成的序列长度约在15和500个碱基之间,较典型地在20和50个碱基之间。在一些实施例中,合成的核酸中含有非天然的碱基,如次黄苷。如上所述,核酸类似物可用作杂交的结合位点。一个合适的核酸类似物的例子是肽核酸(见Egholm等人,1993,PNA hybridizes to complementary oligonucleotides obeying theWatson-Crick hydrogen-bonding rules,Nature 365:566-568;也可参见美国专利No.5,539,083)。
在另一个实施例中,结合(杂交)位点来自基因的质粒或噬菌体克隆、cDNA(如表达序列标签)或其插入序列(Nguyen等人,1995,Differential gene expression in the murine thymusassayed by quantitative hybridization of arrayed cDNA clones,Genomics 29:207-209)。在另一实施例中,结合位点的多核苷酸是RNA。
4.核酸与固相表面的粘附
核酸或类似物附着在固相载体上,固相载体可以是用玻璃,塑料(如聚丙烯、尼龙),聚丙烯酰胺,硝酸纤维素或其它材料制成。将核酸粘附到表面的一种优选的方法是影印到玻璃板上,如Schena等人,1995,Quantitative monitoring ofgene expressionpatterns with a complementary DNA microarray,Science 270:467-470中所描述的那样。此法特别适用于制备cDNA的微阵列。参见DeRisi等人,1996,Use of a cDNAmicroarray to analyze gene expression patterns in human cancer,Nature Genetics 14:457-460;Shalon等人,1996,A DNA microarray system for analyzing complex DNA samplesusing two-color fluorescent probe hybridization,Genome Res.6:639-645;以及Schena等人,1995,Parallel human genome analysis;microarray-based expression of 1000 genes,Proc.Natl.Acad.Sci.USA 93:10539-11286。
第二种制备微阵列的优选方法是制备高密度的寡聚核苷酸阵列。产生在限定位点上含成千上万种与确定序列互补的寡聚核苷酸的阵列的技术是熟知的,可用照相平版印刷法技术进行表面原位合成(见Fodor等人,1991,Light-directed spatiallyaddressable parallel chemical synthesis,Science 251:767-773;Pease等人,1994,Light-directed oligonucleotide arrays for rapid DNA序列analysis,Proc.Natl.Acad.Sci.USA91:5022-5026;Lockhart等人,1996,Expression monitoring by hybridization to high-density oligonucleotide arrays,Nature Biotech 14:1675;美国专利Nos.5,578,832;5,556,752;和5,510,270,每篇文献均全文引用作为参考),也可用其它快速合成和沉积限定的寡聚核苷酸的方法(Blanchard等人,1996,High-Density,Oligonucleotide arrays,Biosensors & Bioelectronics 11:687-90)。当应用这些方法时,已知序列的寡聚核苷酸(如20-聚物)在表面(如一块衍生玻片)上直接合成。通常,产生的阵列包括针对每种靶转录子的多种探针。寡聚核苷酸探针可用于检测剪接mRNAs或作为各种不同类型的对照。
另一种制备微阵列的较佳方法是通过使用喷墨印刷过程在固相上直接合成寡聚核苷酸。
也可采用其它制备微阵列的方法,如掩模(Maskos和Southern,1992,Nuc.Acids Res.20:1679-1684)。理论上,任何类型的阵列,如尼龙杂交膜上的点杂交(见Sambrook andRussell,Molecular Cloning:A Laboratory Manual 3版,Cold Spring Harbor Laboratory,ColdSpring Harbor,N.Y.,2001)都可以采用。然而正如本领域技术人所认识的那样,非常小的芯片是优选的,因为杂交体积更小。
5.合成标记的探针
制备总RNA和聚(A)+RNA的方法是熟知的,在Sambrook等人(同上)中有描述。在一个实施例中,从本发明感兴趣的多种生物样品中抽提RNA,其中用硫氰酸胍裂解后用CsCl离心(Chirgwin等人,1979,Biochemistry 18:5294-5299)。或着,可以用TRIzol试剂(Life Technologies),根据操作手册从样品中提取总RNA。Poly(A)+RNA用寡-dT纤维素选择(见Sambrook和Russell,同上)。有用的生物样品包括正常的肝样品、非癌变的肝样品以及来自确诊的临床样本的样品。
可用寡dT-引物或随机引物逆转录mRNA来制备标记的cDNA,这两种逆转录的方法都是熟知的(参见,如Klug和Berger,1987,Methods Enzymol.152:316-325)。逆转录可在有dNTP存在时进行,所用的dNTP和可检测的标记物连接,最好是荧光标记的dNTP。或着,单链mRNA可在标记的dNTPs存在的条件下经双链cDNA体外转录合成标记的反义RNA(Lockhart等人,1996,Expression monitoring by hybridization to high-density oligonucleotide arrays,Nature Biotech.14:1675,该文献全文引入作为参考)。在另一个实施例中,cDNA或RNA探针可在没有可检测标记物存在下合成,然后再标记,如通过结合生物素标记的dNTPs或rNTP,或用一些相似的方法(如将生物素的补骨脂素衍生物与RNA进行光交联),然后加入标记的链亲和素(如偶连有藻红蛋白的链亲和素)或其等价物。
如果使用荧光标记的探针,有许多合适的荧光团是已知的,包括荧光素、丽丝胺若丹明、藻红蛋白、若丹明(Perkin ElmerCetus)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX(Amersham)等(参见,如Kricka,1992,Nonisotopic DNA Probe Techniques,Academic Press SanDiego,Calif.)。应理解,可选择有不同发射谱的荧光团,以便于区分。
在另一个实施例中,使用荧光标记物之外的标记物。比如,可使用放射性标记物、或有不同发射谱的一对放射性标记物(见Zhao等人,1995,High density cDNA filteranalysis:a novel approach for large-scale,quantitative analysis of gene expression,Gene156:207;Pietu等人,1996,Novel gene transcripts preferentially expressed in humanmuscles revealed by quantitative hybridization of a high density cDNA array,Genome Res.6:492)。但是,因为放射性微粒有散射因而需要间隔更大的结合位点,因此使用同位素标记物是次佳的实施例。
在一个实施例中,标记的cDNA在含有0.5mMdGTP,dATP,dCTP,0.1mM dTTP,荧光脱氧核苷酸(如,0.1mM若丹明110 UTP(Perken Elmer Cetus)或0.1mM Cy3 dUTP(Amersham))及逆转录酶(如SuperScriptTM II,LTIInc.)的混合物中,于42℃温育60分钟而得以合成。
6.与微阵列的杂交
选择优化的核酸杂交和洗涤条件,使得探针“特异性结合”或“特异性杂交”于特异的阵列位点,即探针杂交、连接或结合于互补核酸序列的序列阵列位点上,而不杂交于非互补核酸序列的位点。如本文所用,如果当两个多核苷酸中较短的那一个小于等于25个碱基时,在标准碱基配对原则下无错配,或如果大于25个碱基时,错配就不会超过5%,那么一个多核苷酸序列被认为和另一个是互补的。较佳地,寡核苷酸可以完全互补(没有错配)。很明显,通过使用含阴性对照的杂交分析,可以使特异性的杂交条件产生特异性杂交(参见,如Shalon等人,同上,以及Chee等人,同上)。
优化的杂交条件取决于标记探针和固定化多核苷酸或寡核苷酸的长度(如寡聚物对长度超过200碱基的多核苷酸)及类型(如RNA、DNA、PNA)。对于核酸的特异的(即严谨的)杂交条件的通用参数,在Sambrook等人,同上,和Ausubel等人,1987,CurrentProtocols in Molecular Biology,Greene Publishing and Wiley-Interscience,New York中有描述。若采用Schena等人的cDNA微阵列,典型的杂交条件是在5xSSC加0.2%SDS,65℃下杂交4小时,然后于25℃在低严谨的洗涤缓冲液中洗涤(1xSSC加0.2%SDS),然后于25℃在高严谨的洗涤缓冲液中洗涤10分钟(0.1xSSC加0.2%SDS)(Shena等人,1996,Proc.Natl.Acad.Sci.USA,93:10614)。可用的杂交条件也可以参见如Tijessen,1993,Hybridization With Nucleic Acid Probes,Elsevier Science Publishers B.V.andKricka,1992,Nonisotopic DNA Probe Techniques,Academic Press San Diego,Calif。
7.信号检测和数据分析
若使用荧光标记的探针,转录本阵列的每一个位点上的荧光发射都可在共聚焦激光显微镜下观察到。荧光强度最好用Axon GenePix 4000扫描仪测量。在一个实施例中,使用适当的激发光对两个荧光团各进行一次独立的扫描。或者,可以使用一道激光在两种荧光团特定的波长下使样本同时发光,并且同时分析两个荧光团的发射(见Shalon等人,1996,A DNA microarray system for analyzing complex DNA samples usingtwo-color fluorescent probe hybridization,Genome Research 6:639-645,该文献全文引入作为参考)。在一个较佳实施例中,阵列使用一个带有计算机控制的X-Y坐标和一个显微镜物镜的激光荧光扫描仪进行扫描。两个荧光团用多线混合气体激光连续激发,发射的光按波长分离并由双光电倍增管检测。荧光激光扫描装置在Schena等人,1996,Genome Res.6:639-645及其所引参考文献中有描述。或者,Ferguson等人,1996,NatureBiotech.14:1681-1684中描述的光纤维束也可用于对大量的位点同时检测mRNA丰度水平。
信号被记录,并且在优选例中由计算机分析,如使用12比特模拟器至数字板。在一个实施例中,扫描的图像用图像程序(如Hijaak Graphics Suite)进行去斑点,然后用图像绘格程序分析建立一张各位点各波长的平均杂交数据表。如果必要,可以通过实验测定建立两个荧光通路间的“交叉对话”(或重叠)的修正。在一个较佳的实施例中,荧光强度可以通过GenePix Pro 3.0软件去掉背景信号,然后分析。然后基于通路强度、点的大小和“标志”(丢失的数据),对表达数据进行过滤,并对每个阵列的所有基因计算Cy5/Cy3比值并以中值为中心对比值进行归一化。对转录物阵列的任一特定的杂交位点,可以计算两种荧光团的发射比。比值不依赖于同源基因的绝对表达水平,但是对那些表达受到给药、基因缺失或其他任何事件明显调控的基因很有用。
根据本发明的方法,两个生物样品中的某个mRNA的相对丰度可以作为扰动及扰动程度的评分(即mRNA在两种测试源中的浓度是不同的),或认为没有扰动(即,相对浓度相等)。在不同的实施例中,两个RNA源在至少一个因素上相差至少约25%(一种来源的RNA的丰度比另一种来源的RNA丰度多25%),更通常约有50%,更通常该因素甚至相差约2倍(两倍丰度),3倍(3倍丰度)或5倍(5倍丰度)时,该差异被评为扰动。
较佳地,除了鉴定扰动是阳性还是阴性之外,测定扰动的大小是有利的。这可如上所述进行,如通过计算出用于差异标记的两种荧光团之间的发射比,或通过本领域技术人员显而易见的类似的方法。
8.通路反应和基因表达谱
在本发明的一个实施例中,通过观察临床感兴趣样品的基因表达谱测定基因表达谱。在本发明的一个实施例中,通过将两种不同标记的探针混合物与微阵列杂交,可建立反映感兴趣生物样品转录状态的DNA微阵列,其中每一种探针对应一种临床感兴趣的样品或标准样品的mRNA。根据本发明,两种样品是同一种类的,即同一品系和组织类型的,但在临床诊断上可不同。那些表达高度相关的基因可属于同一种基因表达谱。
此外,为降低实验误差,最好在双色差异杂交实验中交换两种荧光标记物以降低对各个基因或阵列位点的偏差。换言之,最好先用一种标记方法测量两种被测细胞的mRNA基因表达(即,用一种荧光团标记被扰动的细胞,用第二种荧光团标记未被扰动的细胞),然后用相反的标记法测量两种细胞的基因表达(即,用第二种荧光团标记被扰动的细胞,用第一种荧光团标记未被扰动的细胞)。超过曝光水平和扰动对照参数水平的多个测量值,可提供额外的实验误差对照。如果充分取样,当选择仿样函数S的宽度(用于在反应函数中于平均误差和结构丢失之间内插反应数据)时,就可实现交换。
9.转录状态测量的其它方法
细胞的转录状态可以通过其它基因表达技术测量。这些技术中的一些产生许多有限复杂度的限制性片段用于电泳分析,如双限制酶消化和阶段引物相结合的方法(参见,如欧洲专利0534858 A1,1992年9月24日由Zabeau等人申请),或选择位点最接近所述mRNA末端的限制性片段的方法(参见,如Prashar等人,1996,Proc.Natl.Acad.Sci.USA93:659-663)。其他的方法可对cDNA池进行统计学取样,如通过对每个cDNA测定足够多的碱基(如,20-50个碱基)来确定每一个cDNA,或测短标签的序列(如9-10个碱基),其中该标签是在相对于某一mRNA末端的已知位点产生的(参见,如Velculescu,1995,Science 270:484-487)。
10.生物状态的其他方面的测定
在本发明的多个实施例中,可测定除了转录状态外生物状态,如翻译状态、活性状态或组合,以便获得对药物和通路的反应。这些实施例的细节在下文有描述。
11.转录状态测量的实施例
转录状态的测量可根据多种方法进行。比如,对蛋白的全基因组监测(即,“蛋白组”,Goffeau等人,同上)可以通过构建微阵列而实现,其中的结合位点包括固定化的、对细胞基因组所编码的众多蛋白有特异性的抗体(优选单克隆抗体)。较佳地,存在的抗体可针对编码蛋白的大部分,或至少针对那些与感兴趣药物相关的蛋白。制备单抗的方法是熟知的(参见,如Harlow和Lane,1988,Antibodies:A Laboratory Manual,Cold Spring Harbor,N.Y.该文献全文引入作为参考)。在一个较佳的实施例中,根据细胞的基因组序列设计合成肽段,并产生抗这些肽段的单克隆抗体。用这样的抗体阵列,将细胞蛋白与阵列接触,就可用本领域已知的分析方法来分析它们的结合情况。
或者,蛋白可以通过二维凝胶电泳体系分离。二维凝胶电泳本领域中是熟知的。典型的二维凝胶电泳包括沿着第一维的等电聚焦,然后沿第二维的SDS-PAGE电泳。参见,如Hames等人,1990,Gel Electrophoresis of Proteins:A Practical Approach,IRL Press,NewYork;Shevchenko等人,1996,Proc.Nat′l Acad.Sci.USA93:1440-1445;Sagliocco等人,1996,Yeast 12:1519-1533;Lander,1996,Science 274:536-539。形成的电泳图谱可通过多种技术分析,包括质谱技术、用单抗和多抗进行蛋白质印迹和免疫印迹分析,以及内部和N-末端微测序。应用这些技术,可以鉴定在给定物理条件下产生的所有蛋白的大片段,包括在和药物接触的细胞中(如在酵母中)、或通过缺失或过表达特定基因而修饰的细胞中产生的所有蛋白的大片段。
12.基于生物状态其它方面的实施例
尽管本发明的方法是通过基因表达模式的例子进行阐述的,但是本发明的方法可用于任何能够被监测的细胞成分。
具体地,在与某种扰动有关的蛋白活性(如药物作用)可被测定时,本发明的实施例就可以建立在这些测量的基础上。活性测定可以通过任何适用于所测活性的功能的,生化的或物理的方法来进行。当活性包括化学变化时,细胞蛋白能与天然底物接触然后测定变化率。当活性包括多聚单元间的结合时,如活化的DNA结合复合物与DNA之间的结合,可以测量结合蛋白的数量或测量结合后引发的二级结果,如转录的mRNA数量。如果只有一种功能活性是已知的(如在细胞周期调控中),那么可以观察功能的行为表现。无论是已知的还是测定的,蛋白活性的变化可构成反应数据,而这些数据可通过本发明所述的方法进行分析。
在另一非限制性的实施例中,反应数据可以是细胞生物状态的混合因素构成。反应数据可以包括如某种mRNA丰度的变化、某种蛋白丰度的变化和某种蛋白活性的变化。
II.蛋白组分析
在另一方面,本发明提供了检测标记物的方法,这些标记物差异存在于转移性HCC肿瘤样品或有HCC易感性病人(即,极易发展为HCC但还未发现肿瘤的病人)的组织样品中。这些标记物可以在多种生物样品中检测到。样品最好是生物组织样品的裂解物。
任何适当的方法都可用来检测一种或多种本文中所述的标记物。例如,可用气相离子光谱测定法。这个技术包括,如激光解吸/电离质谱测定法。较佳地,样品在气相离子光谱测定法之前制备,如通过预分级分离、二维凝胶层析、高效液相层析等,以便有助于检测标记物。可用气相离子光谱测定法之外的方法检测标记物。例如,应用免疫分析法监测样品中的标记物。这些检测方法在下文中有详细描述。
A.气相离子光谱测定法
生物样品中的标记物可以用气相离子光谱测定法检测(质谱法更佳)。在一个实施例中,可以应用基质辅助激光解吸/电离(“MALDI”)质谱测定法。在另一个实施例中,可以应用表面增强激光解吸/电离(“SELDI”)质谱测定法。
1.气相离子光谱测定前的样品制备
可用一种或联用多种本领域熟知的标准技术来制备样品,以进一步协助对样品中标记物的监测和鉴定。比如,在气相离子光谱测定分析法之前,可以用一种或多种以下的方法将样品分级分离得到较小的复合物样品:大小排阻层析、阴离子交换层析、亲和层析、顺序提取、凝胶电泳、高效液相层析(HPLC)。
标记物也可以在分析前经过修饰提高其分辨率或确定其身份。比如,在分析前可将标记物蛋白水解消化。用适当的蛋白酶(如胰酶)消化得到的片段可以作为标记物的指纹,可以实现对它们的间接检测。
2.样品与一种底物接触后进行气相离子光谱测定法分析
生物样品可与底物接触,如适用于气相离子光谱测定仪的光谱测定探针。或者,底物可以是一种独立的材料,它可以放在适用于气相离子光谱测定仪的光谱测定探针上。
光谱测定仪探针可以是任何适当的形状,只要它可以在气相离子光谱测定仪上使用(如,可移除地插入气相离子光谱测定仪)。光谱测定仪探针底物可以用任何适当的固体的或多孔的材料制成。适用于本发明的实施例的光谱测定仪探针在如美国专利No.5,617,060(Hutchens和Yip)以及WO 98/59360(Hutchens和Yip)中有描述。
如果样品的复杂性已经像上文所说的被充分降低了,样品可以和任何气相离子光谱测定仪适用的底物接触。在进行气相离子光谱测定分析前,在底物表面的标记物上一般会使用一种能量吸收分子(“EAM”)或基质材料。能量吸收分子和含有标记物的样品可以在任何适当的状态下接触。
样品的复杂性可以用底物进一步降低,这种底物含有能够与一种或多种标记物结合的吸附剂。结合标记物的吸附剂可以任何适当的方式(如连续的或不连续的方式)应用于底物,样品也可以与含有吸附剂的底物在任何适当的状态下接触,如水浴、浸透、浸渍、喷射、溅泼或移液等。接触后,最好洗去底物表面未结合的物质,从而使底物表面只留下结合的物质。
3.解吸/电离和检测
底物表面的标记物可以在气相离子光谱测定术中去吸附并电离。任何适当的气相离子光谱测定仪都能使用,只要它可以使底物上的标记物解离。气相离子光谱测定仪最好可以对标记物定量分析。在一个实施例中,气相离子光谱测定仪是质谱仪,最好是激光解吸飞行时间质谱仪。在另一个实施例中,可用离子扩散光谱测定仪检测标记物。在另一个实施例中,总电子流测量装置可用于检测和鉴定标记物。
4.数据分析
通过解吸和检测标记物得到的数据可用任何适当的方法分析。在一个实施例中,用一个可编程的数字式计算机分析数据组。计算机程序一般包括一个可读媒体,用来存储代码。某些代码专用于记忆,其中包括光谱测定仪探针上每一个特性位点,在这个特征位点的吸附剂的种类和洗脱吸附物的洗脱条件。计算机同时包括这些代码,它们作为输入的数据。各个分子团的信号强度来自探针上特定的可寻址部位。这些数据表示被检测标记物的数量,包括每个标记物生成的信号的强度。
数据分析可包括以下步骤,测定被测标记物的信号强度(如峰值)和除去偏离预设统计分布的数据。观察的峰值归一化,这是相对于某一参照来计算每一个峰高度的过程。比如,参照可以是仪器和化学物质(如吸收能量的分子)所产生的背景噪音,一般设为零。然后,探测到的每个标记物或其它生物分子的信号强度在所需刻度(如100)上以相对强度表示。或者,针对样品设一个标准(如血清蛋白),标准峰可作为参考计算每个被检测标记物或其他标记物的相对信号强度。
计算机可以将得到的数据转化为不同的显示格式。在一种称为“光谱图像或保留图谱”的格式中,可以显示标准的图谱,其中图像表明了到达探头的在每一个特定的分子量的标记物的数量。在另一称为“峰图谱”的格式中,光谱图像仅保留峰高和质量的有关信息,形成的图像比较简单明了,可更容易分辨分子量接近的标记物。在另一称为“凝胶图像”的格式中,峰图谱的每一个质量在每一个峰高的基础上转化为灰度图像,看上去和电泳凝胶上的条带相似。在另一称为“三维重叠”的格式中,可将几个光谱图重叠以比较它们在相对峰高度的微小差别。在另一称为“差异图谱”的格式中,可以比较两个或更多的波谱,更突出了不同的标记物和样品之间被上调或下调的标记物。任何两个样品的标记物模式(波谱)可以进行宏观地比较。在另一个格式中,可采用点火分散图(Spotfire Scatter Plot),其中被测的标记物在图中以点标出,其中图的一个轴代表被测标记物的表观分子,另一个轴代表被测标记物的信号强度。每一个生物样品的被测标记物和样品中标记物的数量都保存在计算机可读介质中。这些数据可以与对照比较(如在对照中检测到的标记物图谱或数量,例如样品还未检测出的转移性HCC或HCC易感性的病人)。
预测HCC患者的转移可能性或者有慢性肝病患者发展为HCC的可能性的方法,可以通过具有处理数据集的数字计算机执行代码来具体实现,而该数据集是来源于与患者样本接触后的芯片信号。代码通过数字计算机执行的目的是为了创建分析模型。该代码可以以任何适宜的电脑编程语言来书写,这些编程语言有Visual Basic,Fortran,C,C++等。数字计算机可以是使用任一标准或专业化操作系统,如基于Windows的操作系统的、微型的、迷你型或大型的计算机。标准PC(个人电脑)可以按照本发明的实施例来执行分析方法。
B.通过免疫分析来测定
免疫分析可被用来检测和分析样本中的标记物。这个方法由以下组成:(a)提供能特异结合于标记物的抗体;(b)将抗体和样本接触;和(c)检测样本中结合于标记物的抗体复合物的存在与否。
制备能与细胞标记物发生特异反应的多克隆和单克隆抗体的方法,是本领域技术人员已知的。参阅文献Coligan,Current Protocols in Immunology(1991);Harlow &Lane,Antibodies:A Laboratory Manual(1988);Goding,Monoclonal Antibodies:Principles and Practice(2d ed.1986);以及Kohler & Milstein,Nature 256:495-497(1975)。例如,为了制备多抗,将已纯化的靶蛋白同佐剂相混合,然后用来免疫动物。当高滴度的靶蛋白抗体产生后,从动物收集血液,制备抗血清用于免疫分析。为制备单抗,将用靶蛋白免疫的动物脾细胞制成无限繁殖系,这通常通过与骨髓瘤细胞融合(参阅,Kohler和Milstein,Eur.J.Immunol.,6:511-519,1976)。根据是否产生对靶蛋白有预期特异性和亲和性的抗体,对由单个永久细胞所产生的细胞克隆进行筛选。
如果标记物不是数据库中已知蛋白,即使只有标记物的一部分,可用该知识来确定核酸和氨基酸序列。例如,基于标记物N端氨基酸的序列,来制备简并的探针。然后用这些探针来筛选基因组或cDNA文库,其中该文库是用起初检测到标记物的样本创建的。使用已知的技术,阳性克隆可被鉴定、扩增,而且其重组DNA序列可被亚克隆。参阅,例如,Ausubel等人,Current Protocols for Molecular Biology,1994 andSambrook and Russell,同上。基于编码标记物的寡核苷酸,抗标记物的抗体可用本领域已知的任何合适方法制备。参阅例如,Huse等人,Science 246:1275-1281(1989);Ward等人,Nature 341:544-546(1989).
提供了抗体后,标记物可以用合适的免疫结合技术进行检测和/或定量(参见,例如,美国专利No.4,366,241;4,376,110;4,517,288;和4,837,168)。可用的分析包括:如酶免疫分析(EIA)像酶联免疫吸收分析(ELISA)、反射性免疫分析(RIA)、Western印迹分析、狭缝斑点分析。这些方法在Methods in Cell Biology:Antibodies in Cell Biology,vol 37(Asai编辑.1993);Basic and Clinical Immunology(Stites & Terr,eds.,7th ed.1991);和Harlow & Lane(同上)中有叙述。
C、转移型HCC或HCC易感性的诊断
另一方面,本发明提供了一种方法,该方法通过使用表2-7中已鉴定的一个或多个标记物,对HCC患者发展为转移型肿瘤可能性或慢性肝病患者转变为HCC趋势作出诊断。尽管少到只有一个从表2-7标记物中选出的标记物,也能作出正确的诊断,但是优选使用多个标记物,因为多标记物可以获得更多可靠的结果。较佳地,表2中至少10个细胞标记物被包含在标记物集中,并用于预测HCC患者的转移可能性,例如更佳地表2中至少15个、20个、25个、30个、40个、50个、60个、70个、80个90个或100个,甚至最优选的所有153个标记物被用作标记物。类似地,更佳地表5中至少有15个、20个、25个、30个、40个、50个、60个、70个、80个90个或100个,甚至最优选的所有273个标记物被用作标记物,用于测定慢性肝病患者患HCC的风险。表2-7中已鉴定的标记物可单独使用,也可同表中其他表格中的标记物联用,或同完全不同的标记物联用,以便协助诊断患转移型HCC或慢性肝病患者发展为HCC的易感性。与非转移型HCC和无HCC易感性的患者组织样本相比,在转移型HCC样本或HCC易感性患者组织样本中,表2-7中的标记物是分别差别存在的。例如,与非转移型HCC和无HCC易感性的患者组织样本相比,一些标记物高水平表达于和/或较高频率出现于转移型HCC或HCC易感性患者组织样本中。因此,检测人体内一个或多个这样标记物,可提供了某人患转移型HCC或易患HCC的可能性方面的有用信息。
因此,发明的例子包括辅助分析诊断HCC转移可能性的方法,以及辅助分析诊断慢性肝病患者发展为HCC可能性的方法,其中该方法包括:(a)检测在样品中的至少一个标志物,该标志物选自表2-7已鉴定的标志物;(b)将一个或多个检测的标志物与转移性HCC的诊断或肝病患者发展为HCC的可能性相关联。该相关性可考虑与标志物的对照量(如非转移型HCC或无HCC易感性的个体)相比较时样品中的标记物数量。相关性可以考虑待检样品中标志物的出现与否和同一标志物在对照样品中检测频率。相关性可以兼顾这些因素,以便判断某人是否患转移性HCC和患可能发展为HCC的严重肝病。
用来检测标志物的合适样品可以从任一个体获得。较佳地,样品是从个体获得的肝组织样品。如果需要,样品可以按照上述方法制备以增强标志物的可检测性。
可以采用任何适当方法来检测样品中的标志物。比如,如上所述可以采用气相离子光谱测定法。应用这些方法,可以检测一个或多个标志物。较佳地,检测样品是否存在多个标志物。检测多个标志物而不是单个标志物的存在,能为诊断提供更多信息。明确地说,在一个样品中检测多个标志物可增加诊断中的真阳性和真阴性,同时将减少诊断中的假阳性和假阴性。
接着,标志物的检测结果与发展为转移型HCC的可能性相关联,或者与严重肝病患者发展为HCC易感性相关联。在某些例子中,仅检测标志物存在与否而不定量标志物数量就是有用的,并可与发展为转移型HCC或严重肝病患者发展为HCC的易感性的大概诊断结果相关联。
另外,检测标志物可包括定量标志物,并将标志物检测结果与发展为转移型HCC或严重肝病患者发展为HCC的易感性的大概诊断结果相关联。例如,已检测到转移型HCC患者中OPN水平增加。这样,如果某待检个体的标志物量高于正常量,那么该个体有高度可能性发展为转移型HCC或者对于严重肝病患者而言有发展为HCC的倾向。
当标志物被定量时,可与对照相比较。对照可以是,例如正常个体的类似样品中的标志物平均值,其中该正常个体无发展为转移型HCC的倾向,或对于慢性肝病患者而言无发展为HCC的倾向。对照组数量与待检样品数量在相同或基本相似的实验条件下测定。例如,如果待检样品为某个体的血清样品而且是采用特定的探针来检测某标志物的话,那么该标志物的对照数量优选应用同样的探针对患者的血清样本进行测定。较佳地,标志物的对照数量,是在大量的无HCC转移的正常个体的样品或无HCC易感性的个体的组织样品的基础上确定的,以便反映在该人群中标志物数量的变异。
计算机软件可以分析质谱测得的资料。该软件的代码可将质谱分析信号转变为计算机可读的形式。该软件还可包括代码,该代码用于应用算法来分析前述信号,以明确这个信号中是否代表了对应于本发明标志物或其他有用的标志物信号“峰”。该软件还可包括代码,该代码用于执行算法,从而将测试样品信号与“正常的”和转移型HCC或HCC易感性的严重肝疾病病人的典型信号特征进行比较,并确定在两个信号间的密切性。该软件还可包括代码,该代码提示待检样品最接近哪一种情况,并提供大概的诊断。
III.治疗靶点生物学活性的调节
骨桥蛋白(OPN)和EpCAM与HCC患者的转移和慢性肝病患者发展为HCC均呈正相关。因此,本发明的一个目的就是鉴别调节,尤其是抑制,OPN或EpCAM活性的化合物。
A.生物学功能的测定
OPN及其等位基因和多种变异物均是分泌性磷蛋白,其由SEQ ID NO:1编码而且其氨基酸序列示于SEQ ID NO:2。可采用多种体内和体外的方法来测定OPN多肽的功能、化学和物理作用,如测定受体结合(如与放射性受体结合)等,从而评价OPN多肽的活性。更下游的事件(如改变诸如细胞分裂、细胞分化等细胞事件),也可用作间接表示OPN活性的改变。此外,这些方法可用来检测和筛选OPN活性的拮抗剂。拮抗剂可从基因角度改变OPN的形式,如蛋白质的显性阴性形式。这些OPN活性拮抗剂可用于治疗转移型HCC。
用于分析的OPN可选自有SEQ ID NO:2序列的多肽,或其保守修饰的变异体或片段。普遍地,氨基酸序列的相同性至少70%,任选地至少80%,或任选地至少90-95%。任选地,用于分析的多肽可包含OPN结构域,如受体结合域、胞外基质结合域等。OPN或它的结构域可共价结合于异源蛋白以形成用于本分析的嵌合蛋白。
采用如上所述的重组或天然的OPN多肽,可测试OPN活性的调节剂。这种蛋白质可以重组或天然的形式在细胞中表达、从细胞中分泌、在组织或动物中表达,并且被分离。例如,可使用肝脏切片、分离的肝细胞或转化的细胞。采用本文所述的一种体内或体外方法可检测对OPN的拮抗性。此外,在体外的液相或固相反应中可用OPN蛋白的受体结合域来检测受体结合。
受体与OPN、结构域或嵌合蛋白的结合,可在溶液中、双分子膜上、固相载体上、脂质单层上或小泡上测试。可应用光谱特性的变化(如荧光、吸光度、折射率)、流体(如形态)、层析或溶解特性来测试拮抗剂的结合情况。
用潜在的OPN抑制剂处理的样品或分析,通过与不含待检化合物的对照样品相比,来检验拮抗程度。对照样品(未用拮抗剂处理)被定为相对OPN活性值为100。当与对照相比,OPN活性值为约90%、任选地50%、任选地25-0%时,就认为实现了对OPN的拮抗。
在拮抗剂存在的情况下,可通过检测OPN与玻连蛋白受体的结合能力的变化,来评估OPN受体结合的改变。总之,待检化合物的范围为1pM到100mM。
待检化合物对多肽功能的影响可通过测量上述任一参数而测定。任何影响OPN活性的相应生理学变化,可用来评价待检化合物对本发明多肽的影响。当应用完整细胞或动物测定功能结果时,人们还可测量各种不同的效果,如已知和未知遗传标志物的转录变化(如Northern印迹),如细胞代谢的变化(如细胞生长或pH变化)。
类似地,可在如上所述的相同原理和方法学的基础上监测EpCAM的生物学功能。例如,已知EpCAM在上皮源性细胞的粘附中发挥作用,其正常功能依靠其胞外和胞内结构域。因此,可基于诸如细胞聚集、与其已知的结合配对物的特异作用(如通过胞内结构域与肌动蛋白作用)以及信号转导的中断(已知这是EpCAM调节的),来检测EpCAM的功能。各种不同的细胞事件可作为EpCAM的活性的指示物,并有助于筛选作为EpCAM拮抗剂的化合物。
A.拮抗剂
作为OPN或EpCAM拮抗剂而测试的化合物可以是任何小的化学物质,或生物物质,例如蛋白、糖、核酸或脂类。抗蛋白的不同抗体是可能的拮抗剂候选物。例如,许多单克隆抗体,如17-1A和GA733,已知道可以特异性地结合EpCAM,因而可通过恰当的分析来测试它们干扰EpCAM生物学功能的能力。
另外,拮抗剂可以是遗传上改变的OPN或EpCAM的形式,例如所谓的“显性阴性(dominant negative)”形式,一种无生物活性的形式,它通过竞争有限的结合伴侣来抑制野生型副本的正常功能。通常,测试化合物是化学小分子和肽。虽然化合物多溶解于水溶液或有机溶剂(特别是基于DMSO的),但是基本上任何化合物可用作本发明分析方法中的潜在拮抗剂。通过检测过程自动化和为分析提供来自任何方便来源的化合物,本分析方法被设计成用于筛选大的化学库,通常分析是进行平行进行的(例如在自动检测中,在微孔滴定板上采用微孔滴定的格式)。应理解,有许多的化合物供应商,包括Sigma(St.Louis,MO),Aldrich(St.Louis,MO),Sigma-Aldrich(St.Louis,MO),Fluka Chemika-BiochemicaAnalytika(Buchs Switzerland)等等。
在一个优选的实例中,高通量筛选的方法包括提供一个组合的化学库或肽库,该库包含大量的具有潜在治疗性的化合物(潜在的调节剂或配体化合物)。如本文所用,通过一种或多种分析方法筛选该“组合化学库”或“配体库”,从而鉴别出具有所需的特征活性的库成员(具体的化学种类或亚组)。这样鉴别出的化合物可作为常规的“先导化合物”,或者本身可用作潜在的或实际的治疗剂。
组合化学库是不同化合物的集成,可以是通过化学合成或生物合成,综合许多化学的“建筑砖块(building blocks)”,如试剂。例如,线性组合的化学库(如多肽库),是对于给定的化合物长度(如多肽化合物的氨基酸数量),通过在任一可能方向上组合一组化学建筑砖块(氨基酸)而形成的。通过化学建筑砖块的这种组合式混合,就可以合成上百万种化学化合物。
如何准备和筛选组合化学库,是本领域技术人员熟知的。这些组合化学库包括(但并不限于)多肽库(见美国专利5,010,175;Furka,Int.J.Pept.Prot.Res.37:487-493,1991;和Houghton等人,Nature 354:84-88,1991)。其它制造化学多样性库的化学方法也可以用。这些化学方法包括(但并不限于):类肽(如:PCT出版物No.WO 91/19735),编码的多肽(如:PCT出版物WO 93/20242),随机的生物寡聚物(如:PCT出版物No.WO 92/00091),苯并二氮类(如美国专利号5,288,514),多样体(diversomer)例如乙内酰脲类,苯并二氮类和二肽类(Hobbs等人,Proc.Nat.Acad.Sci.USA 90:6909-6913,1993),联乙烯多肽(Hagihara等人,J.Amer.Chem.Soc.114:6568,1992),具有葡萄糖骨架的非肽类的多肽模拟物(Hirschmann等人,J.Amer.Chem.Soc.114:9217-9218,1992),小化合物的模拟有机合成库(Chen等人,J.Amer.Chem.Soc.116:2661,1994),寡聚氨基甲酸(Cho等人,Science 261:1303,1993),和/或肽酰膦酸酯(Campbell等人,J.Org.Chem.59:658,1994),核酸库(参见Ausubel,Berger和Sambrook,都同上),肽核酸库(参见,例如,美国专利5,539,083),抗体库(参见,例如,Vaughn等人,Nature Biotechnology,14(3):309-314,1996和PCT/US96/10287),碳水化合物库(参见,例如,Liang等人,Science 274:1520-1522,1996和美国专利5,593,853),小有机分子库(参见,例如,苯并二氮,Baum C&EN,1月18日,p33,1993;类异戊二烯,美国专利5,569,588;噻唑和三聚噻唑,美国专利5,549,974;吡咯烷,美国专利5,525,735和5,519,134;吗啉化合物,美国专利5,506,337;苯并二氮,5,288,514,等等)。
制备组合库的设备已商品化了(参见,例如,357 MPS,390 MPS,Advanced Chem Tech,Louisville KY,Symphony,Rainin,Woburn,MA,433A Applied Biosystems,Foster City,CA,9050Plus,Millipore,Bedford,MA)。另外,许多组合库也已商品化了(参见,例如,ComGenex,Princeton,N.J.,Tripos,Inc.,St.Louis,MO,3D Pharmaceuticals,Exton,PA,Martek Biosciences,Columbia,MD,etc.)。
C.固态和可溶性的高通量分析
在一个实施例中,本发明提供了可溶性分析方法,其中使用分子,例如结构域(如受体结合结构域、胞外基质结合结构域等等);共价连于异源蛋白以形成嵌合分子的结构域;OPN或EpCAM;或自然或重组表达OPN或EpCAM的细胞或组织。在另一实施例中,本发明提供了基于固相的高通量格式的体外分析方法,其中结构域、嵌合分子、OPN或EpCAM、或者表达OPN或EpCAM的细胞或组织,被附着于固相载体基质。
在本发明的高通量分析中,一天可以筛选高达数千个不同的拮抗剂。具体地,每个微孔滴定板的孔可以针对所选的潜在调节剂单独分析,或者,如果要考虑浓度或孵育时间的影响,每个调节剂可以用5-10个孔进行检测。因此,一个标准的微孔滴定板可以检测约100(如96)种调节剂。如果使用1536孔的板,那么一块板很容易分析100到1500个不同的化合物。如果使用本发明的整套系统,每天可能分析几块不同的板,可能筛选多达6,000-20,000个不同的化合物。最近,Caliper Technologies(Palo Alto,CA)公司已开发了试剂操作的微液方式。
感兴趣的分子可以直接或间接通过共价或非共价连接方式(如通过标签)而连于固相成分上。标签可以是各种不同的成分。通常,结合了标签的分子(标签结合体)被固定在固相载体上,而感兴趣的结合了标签的分子(如感兴趣的信号转导分子)通过与标签及标签结合物的相互作用而连于固相载体。
基于文献中充分描述的分子相互作用,可以使用许多种标签及其结合物。例如,当标签具有诸如生物素、蛋白A、或蛋白G等天然结合物时,它可以与合适的标签结合物(亲合素、链亲合素、中性亲合素、免疫球蛋白Fc段等等)偶联。用天然结合物(如生物素)偶联于分子的抗体,是供应充足的并且是合适的标签结合物;见SIGMA Immunochemicals1998目录(SIGMA,St.Louis MO)。
类似地,任何半抗原或抗原性化合物可用于与合适的抗体结合形成标签/标签结合物配对。数以千计的特异性抗体已经商品化,并且许多额外的抗体在文献中有描述。例如,在常用形式中,标签是第一抗体而标签结合物是识别第一抗体的二抗。除了抗体-抗原的相互作用之外,受体-配体间相互作用也适合作为标签和标签结合物对。例如,细胞膜受体结合剂和拮抗剂(例如细胞受体-配体相互作用,如转铁蛋白、c-kit、病毒受体配体、细胞因子受体、化学因子受体、白介素受体、免疫球蛋白受体和抗体、钙粘合素家族、整联蛋白家族、选择素家族等等;见例如,Pigott & Power,The Adhesion Molecule Facts Book I(1993))。同样地,毒素和毒液,病毒的抗原表位,激素(如鸦片、类固醇等等),胞内受体(如介导不同小配体作用的受体,这些小配体包括类固醇、甲状腺激素、类维生素A和维生素D、多肽),药物,植物凝集素,糖,核酸(线性或环状多聚物结构),寡糖,蛋白,磷脂,和抗体都能够和各种不同的细胞受体相互作用。
合成的多聚物,如聚亚胺酯、聚酯、聚碳酯、聚尿素、聚酰胺、聚乙烯亚胺、聚硫化苯乙烯、聚硅氧烷、聚酰亚胺、和聚乙酸酯也可以形成合适的标签或标签结合物。许多标签/标签结合物配对也可用于本文所述的分析系统,这对于阅读了公开内容后的技术人员而言是显而易见的。
常用的连接体如肽、聚醚、和类似物也可以作为标签,并且包含多肽序列,如约5-200氨基酸的多聚甘氨酸序列。对本领域技术人员而言,这些柔性的连接体都是已知的。例如,聚(乙二醇)连接体可以从Shearwater Polymers,Inc.Huntsville,Alabama购得。这些连接物可任选地含有酰胺键、巯基键、或异功能键。
标签结合物可用已有的各种不同方法固定于固相基质上。通常,通过将全部或部分基质暴露于化学试剂而使固相基质衍生化或功能化,其中该化学试剂将化学基团固定于表面,而该化学基团可与标签结合物的一部分反应。例如,适合连接长链部分的基团包括胺、羟基、巯基、和羰基。氨基烷基硅烷和羟基烷基硅烷可用于活化多种表面,如玻璃表面。该种固相生物多聚物阵列的结构,在文献中有充分描述。见例如,Merrifield,J.Am.Chem.Soc.85:2149-2154(1963)(描述了固相合成诸如肽等物质);Geysen等人,J.Immun.Meth.102:259-274(1987)(描述了在针尖上合成固相成分);Frank & Doring,Tetrahedron44:60316040(1988)(描述了在赛璐珞片上合成不同的肽序列);Fodor等人,Science,251:767-777(1991);Sheldon等人,Clinical Chemistry 39(4):718-719(1993);和Kozal等人,Nature Medicine2(7):753759(1996)(都描述了固定于固相基质的生物多聚物阵列)。将标签结合物固定于基质的非化学方法包括:加热、通过紫外线照射交联等等。
D.基于计算机的分析
另一种筛选调节OPN或EpCAM活性的化合物的方法是计算机辅助的药物设计,其中基于氨基酸序列产生的结构信息,利用计算机产生OPN或EpCAM的三维结构。输入的氨基酸序列直接地和积极地通过计算机程序已建立的算法,来产生二级、三级和四级蛋白质结构模型。然后,检查这些蛋白质结构,以确认具有结合活性的结构区域(如结合于配体)。这些区域被用于鉴别结合于蛋白质的配体。
通过在计算机系统中输入至少10个氨基酸残基或相应编码的OPN或EpCAM多肽的核酸序列,可产生蛋白质的三维结构模型。例如,OPN多肽的氨基酸序列或编码该多肽的核酸选自SEQ ID NO:1或2,及其保守性修饰形式。氨基酸序列表示了蛋白质的一级序列或亚序列,它编码了蛋白质的结构信息。由计算机键盘输入至少10个氨基酸序列残基(或编码10氨基酸的核苷酸序列),计算机可读的介质包括(但不局限于):电子存储介质(如磁盘、磁带、磁盒和芯片),光学介质(如CD ROM)、因特网网站发布的信息、或通过RAM。然后,使用本领域技术人员已知的软件,通过计算机系统和氨基酸序列的相互作用,可产生蛋白质的三维结构模型。
氨基酸序列是一级结构,它编码了形成感兴趣蛋白的二级、三级和四级结构所需的信息。软件察看产生结构模型的由一级序列编码的某些参数。这些参数被称为“能量项”,主要包括静电势、疏水势、溶剂可达到的表面和氢键。二级能量项包括范德华力。生物分子形成的结构以累积形式减少能量项。因此,计算机程序可利用一级结构或氨基酸序列编码的能量项来产生二级结构模型。
然后,基于二级结构的能量项,形成由蛋白质二级结构所编码的三级结构。这时使用者可以输入额外的参数,例如蛋白是否是膜结合或可溶的、在体内的定位、细胞定位(如细胞质、表面、核)。这些变量结合二级结构的能量项可形成三级结构模型。在模拟三级结构时,计算机程序将二级结构的疏水性面相互匹配,将亲水性面相互匹配。
一旦产生化合物结构,蛋白配体结合区域可被计算机系统识别。潜在配体的三维结构可通过输入化合物的氨基酸或核苷酸序列或化学式而生成,如上所述。将该潜在配体的三维结构与OPN或EpCAM蛋白相比较,可确定出与OPN或EpCAM的结合的配体。蛋白和配体的亲和结合可用能量项来确定哪一种配体与蛋白结合的可能性更大。
计算机系统也被用于筛选OPN基因或EpCAM基因的突变体、多态性变异体、等位基因和种间同源物。这些突变体与病状或遗传特性有关。如上所述,基因芯片和相似的技术可以用来筛选突变体、多态性变异体、等位基因和种间同源物。一旦变异体被确认,可将诊断方法用于鉴别具有这种突变基因的病人。例如,鉴别突变的OPN基因包括接受输入的选自SEQ ID NO:1和2的第一氨基酸序列或编码OPN的核酸序列,及其保守性修饰形式。如上所述,将序列输入计算机系统。然后,将第一核酸或氨基酸序列与第二核酸或氨基酸序列相比较,其中第二序列与第一序列基本相同。如上所述,将第二序列输入计算机系统。一旦第一和第二序列被对照后,序列间不同的核苷酸或氨基酸就被确认。这些序列可表示OPN基因的等位差异,以及与病症和遗传特性有关的突变。同样的通用策略也可用于检测EpCAM变异体和突变体。
D.试剂盒
感兴趣蛋白及其同源物是确定拮抗剂的有效工具。例如,与OPN核酸特异杂交的OPN-特异性物质(如OPN探针和引物),以及与OPN蛋白特异结合的OPN特异性物质(如OPN抗体),可用于检测肝细胞表达、信号传导调节和HCC转移的诊断。相同的通用方法对EpCAM同样适用。
鉴定样本中是否存在OPN或EpCAM的多核苷酸的核酸分析技术包括本领域技术人员所熟知的许多技术,如Southern印迹分析、Northern印迹分析、点杂交、RNase保护、S1分析、扩增技术如PCR(含RT-PCR)、LCR、和原位杂交。在原位杂交中,例如,将目标核酸(如编码OPN的核酸)从胞内环境中释放出来,同时保持细胞形态用于随后的阐明和分析(见实施例1)。下列文章提供了原位杂交的综述:Singer等人,Biotechniques4:230-250(1986);Haase等人,Methods in Virology,vol.VII,pp.189-226(1984);和NucleicAcid Hybridization:A Practical Approach(Hames等人编.1987)。另外,OPN或EpCAM蛋白可以用前述各种不同的免疫分析技术检测。测试样品通常与阳性对照(如样品中含有重组的OPN或EpCAM)和阴性对照进行比较。
本发明还提供了用于筛选OPN或EpCAM调节剂的试剂盒。该试剂盒可以从很现成的材料和试剂来准备。例如,该试剂盒包含下列材料的一种或多种:OPN(或EpCAM)、试管、检测OPN(或EpCAM)活性的说明书。任选地,试剂盒可含有具生物活性的OPN(或EpCAM)。各种不同的试剂盒及其组分,可以按照使用者的不同需要和特殊需求的使用者来制备。
II抑制治疗靶点的表达
对HCC病人而言,另一种通过抑制OPN活性来抑制HCC转移的手段是抑制OPN的表达。同样,通过抑制EpCAM表达可以减缓慢性肝病患者发展为HCC。本领域技术人员熟知的各种不同方法,可用来特异性地抑制特定基因的表达。
A反义多核苷酸
反义技术已经是在方案中描述最广的、用于实现基因特异性失活的方法,并且是研究和诊断中的有用工具。例如,反义寡聚核苷酸能够高度特异性地抑制基因的表达,并经常作为生物科学的常规手段来阐明特定基因的功能。
反义多核苷酸的特异性和灵敏性使得其适合用于治疗途径。大量的美国专利和科学发表作品设计了利用反义多核苷酸作为治疗动物和人的治疗剂。参见,例如美国专利No.6,080,580;6,180,403;6,255,111;6,306,655;6,440,739;和6,524,854。一个反义多核苷酸包含一个与待失活的基因序列(如SEQ ID NO:1或SEQ ID NO:5)互补的序列,并且长度可以变化,如从小于10个核苷酸到大于100个核苷酸,能够安全有效地施用于对象(如人)。反义核苷酸可以是寡聚的或多聚的核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物。它可以由天然存在的核碱基、糖和共价的核苷间键合(骨架),以及功能相似的非天然存在的寡核苷酸所构成。这些修饰的或替代的反义寡聚核苷酸常常比天然形式更优选,因为具有一些有利特性,如提高细胞的摄取、提高与靶核酸的亲和性,以及在核酸酶存在下提高稳定性。本发明的反义寡聚核苷酸也可以包括修饰后的骨架或非天然的核苷间的键合。优选的修饰后的寡聚核苷酸骨架包括:例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基膦酸酯和其他的烃基膦酸酯(包括包括3′-链烯基膦酸酯和手性膦酸酯)、次磷酸酯、氨基磷酸酯(包括3′-氨基磷酸酰胺和氨基烷基磷酰胺)、巯碳氨基磷酸酯、巯碳烷基膦酸酯、巯碳烷基磷酸三酯、和硼烷-磷酸酯,它们可具有正常3′-5′键合,2′-5′的类似键合,以及极性相反的键合,其中相邻核苷单元以3′-5′至5′-3′或2′-5′至5′-2′方式连接。同时也包括各种盐、混合盐,以及游离酸等形式。
另外,适用于本发明的反义核苷酸可对应于靶核酸(如OPN或EpCAM)的编码序列和非编码序列。
B.核酶
使用核酶可以减少感兴趣的基因(如OPN或EpCAM)的mRNA水平。核酶是有酶活性的RNA分子,能够以核苷酸序列特异方式切割或剪接其他独立的RNA分子。可用于本发明的核酶是一种具有催化或酶活性的RNA分子,其底物结合区与特定RNA靶目标(如OPN或EpCAM的mRNA)是互补的,并且具有在该靶目标中切割和/或剪接RNA的酶活性,从而抑制靶基因的表达。针对特定基因而设计和使用核酶的方法,对于本领域技术人员而言是已知的,并且在许多出版物中有阐述,包括美国专利No.6,069,007;6,107,027;6,225,291;6,307,041;6,482,803;和6,489,163。
C.小的抑制性RNA(siRNA)
另一种可减少目的mRNA和蛋白质水平的有用工具是小的抑制性RNA(siRNA)。siRNA分子是小的双链RNA分子,它可引起已知的RNA干扰过程,这是一种形式的序列特异性的基因失活。一种提出的RNA干扰机制假设,在mRNA和siRNA的反义链之间形成的短双链RNA,会激活依赖于ATP的mRNA分子剪切。Zamore等人,Cell101:25-33,2000。已表明,RNA干扰存在于哺乳类细胞系、卵母细胞、早期胚胎和某些细胞类型中。参见例如Elbashir,Sayda M.,等人,Nature 411:494-497,2001。siRNA编码序列可以基于靶基因序列(如OPN,或EpCAM)而设计,并且插入各种不同的合适载体(如质粒或病毒载体),而这些载体具有正确放置的转录起始和终止元件。当用于所需的真核受体时,可使用真核的转录调控元件。用本领域技术人员熟知的转基因的通用方法,可将含siRNA的载体输送到所需的靶目标。因此,RNA干扰提供了另一种基于序列而特异性抑制基因表达的方法,即通过快速降解基因(如OPN或EpCAM)的mRNA。
D检测减少的靶基因表达
在服用了治疗性药物(其中该药物含有能抑制靶基因的表达(如OPN或EpCAM)表达的物质)之后,可通过比较服药前后靶基因的体内水平,评估治疗性药物的功效。后面的章节将阐述服用药物制剂的通用方法。
当在转录水平上抑制基因的表达(如减少靶基因的mRNA数量)时,可通过比较服用治疗性药物前后的靶基因(如OPN或EpCAM)的mRNA水平,如采用Northern印迹分析、点杂交、RT-PCR等等,从而确认靶基因的表达下降。进行这类分析的通用方法是本领域技术人员所熟知的,并且在许多文献中有阐述(见Sambrook和Russell,同上,以及Ausubel等人,同上)。
当在翻译水平抑制基因表达(如减少靶基因编码的蛋白量)时,可采用本领域专业人员熟知的各种测量组织样本中蛋白质水平的手段,来比较服用治疗性药物前后的靶基因(如OPN或EpCAM)编码的蛋白水平,从而确认靶基因的表达下降。如前所述,多种免疫分析方法可常规地用于检测感兴趣蛋白质(如OPN或EpCAM)的存在与否和数量。在Harlow和Lane,Antibodies,A Laboratory Manual,1988一书中对可用技术有全面的综述。
合适的抗靶蛋白(如OPN或EpCAM)的抗体是免疫分析所必需的。制备抗靶蛋白的特异性抗体的通用方法是本领域技术人员所熟知的,并且前面章节有描述。此外,已有一些具有所需特异性特异性的抗体用于免疫分析(如抗OPN或EpCAM的各种单克隆抗体)。
一旦得到靶蛋白(如OPN或EpCAM)的特异性抗体,病人的靶蛋白水平可以通过各种不同的免疫分析方法测定,从而为临床医生提供定性或定量的结果。病人的各种不同样品,如血液或肝组织,可以通过免疫分析按照前些章节描述的方法检测体内的靶蛋白水平。对于免疫学的和免疫分析方法的全面综述,可参见:Stites,同上;美国专利No.4,366,241;4,376,110;4,517,288;和4,837,168。
V.施用抑制靶蛋白活性的物质和药物组合物
抑制靶蛋白(如OPN或EpCAM)活性的物质可以直接施用于病人,从而调节体内的靶蛋白活性。给药方式可以是用于使拮抗剂或抑制剂化合物与待治疗组织最终接触的任何常用方法,例如通过舌或口。拮抗剂或抑制剂可以任选地与药学上可接受的载体一起,用任何合适的方式施用。诸如拮抗剂或抑制剂的合适的给药途径是本领域技术人员所熟知的,而且虽然对一特定组合物有多种给药途径,但是某一特定途径常常比其他途径提供更快速而有效的反应。
药学上可接受的载体,通常部分地由待施用的特定组合物以及施用该组合物的特定方法所决定。因此,本发明的药物组合物可以有各种不同的合适制剂(见RemingtonPharmaceutical Sciences,17版,1985)。
拮抗剂或抑制剂,单独地或与其他合适的组分一起,可以制成气雾剂制剂(即它们可以被喷雾化),以便通过吸入而给药。气雾剂制剂可以置于加压的合适推进剂中,如二氯二氟甲烷、丙烷、氮气等等。
适合给药的制剂包含水性和非水性溶液,等渗的无菌溶液(它们可含有抗氧化剂、缓冲液、抑菌剂、和用于给制剂提供等渗性的溶质),水性和非水性的无菌悬浮液(它们可含有混悬剂、增溶剂、增稠剂、稳定剂和防腐剂)。在本发明的实际应用中,组合物可通过口服、局部、静脉内、腹腔内、膀胱内或鞘内给药。任选地,组合物也可以通过口腔或鼻腔给药。化合物制剂可以存在于单剂量或多剂量的密封容器(如安瓿瓶、小瓶)中。溶液和悬浮液可以通过前述的无菌粉剂、颗粒剂、和片剂制备。调节剂也可以作为制备好的食物或药物的一部分而给药。
在本发明的上下文中,施用于病人的服药剂量应该足以在一段时间在该个体中产生有益效果。该剂量可由所采用的特定信号调节剂和个体状况(如体重或待治疗区域的表面积)所决定。剂量大小,还决定于将该特定化合物或载体施用于特定个体时所伴随的任何不利副反应的发生与否、性质和程度。
在确定病人服用拮抗剂和抑制剂的有效剂量时,可评估药物的血液循环情况、毒性以及是否产生抗该药物的抗体。一般地,对于典型个体而言,拮抗剂或抑制剂的剂量当量约为1ng/kg到10mg/kg。
对于给药,本发明的拮抗剂和抑制剂给药可以按测定的速率给药,该速率是由应用于个体的大部分和全身时的拮抗剂的LD50和不同浓度下抑制剂的副反应所决定。给药可通过单剂量或分开剂量方式实现。
IV实例
这里所阐述的实施例和例子仅用于说明目的,各种修改或改变形式会提示给阅读了内容之后的本领域技术人员,因而这些修改或改变形式包括在本申请精神和范围之中,也包括在所附权利要求的范围之内。本文提及的所有出版物、专利和专利申请都毫无限制地全部引入本文作为参考。
A.实施例1:预测肝细胞癌(HCC)扩散的易感性
1.材料和方法
a)病人和组织样本
所有的HCC样品取自中国复旦大学附属中山医院肝癌研究所的知情同意的做过手术切除的病人。从中国复旦大学附属中山医院肝癌研究所(原上海医科大学)经过肝切除术且病理学诊断为HCC的40位病人中获得了107对原发性HCC、转移HCC和邻近的非肿瘤正常肝组织样品。手术前,所有病人均做了腹部CT和胸部X射线检查,部分患者根据需要还做了同位素扫描检查。在107对样本中,81对来自27位原发性HCC病人,包括相对应的相邻非肿瘤肝脏组织和转移HCC[15对存在肝内扩散(P组),12对存在门静脉分支肿瘤血栓],26对来自13位仅有原发性HCC的患者及其相对应的非肿瘤肝组织(在手术时没有可检测的转移)。肿瘤和非肿瘤组织在切除后切成小块,速冻于液氮中,贮藏在-70度直至使用前。我们用显微镜确认了肿瘤组织样品,其转移主要由癌细胞构成,而非肿瘤相邻肝脏样品中不存在任何入侵的癌细胞。40个病人中,男39人,女1人。病人年龄从36到74岁,中值为50岁。原发性HCC的直径大小范围从1.3-17.5cm,直径中值为7.2cm,其中65%(26/40)的直径大于5cm,其余的直径≤5cm。32个样本(80%)存在肝硬化。除一人外所有患者HBV阳性,但没有人HCV阳性。27名患者(68%)血液中甲胎蛋白浓度升高(AFP)(>20ng/ml)。
b)RNA制备,cDNA点阵和杂交
参照制造商的说明,用TRIzol试剂(Life Technologies,Inc.)提取样品中总RNA。CDNA微阵列(芯片)是美国癌症研究所高级技术中心(NCI)制造的。每个阵列含有9180个cDNA克隆,其中有7102个已经命名的基因,1179个EST克隆,和122个Incyte的克隆。用直接标记法制备荧光标记的cDNA,cDNA微阵列的杂交基本上按照Wu等人,Oncogene20:3674-3682,2001中所述的方法。简而言之,荧光的靶物质按如下方法制备:采用SuperScript II逆转录酶(Life Technologies),通过寡聚dT-引物聚合反应,将Cy3-偶联的脱氧核糖核酸(Amersham)标记到100μg非癌症肝脏组织的总RNA上,或将Cy5-偶联的脱氧核糖核酸(Amersham)标记到200μg原代的HCC或转移组织的总RNA上。将靶物质混合后加至微阵列中,42℃孵育过夜(12-16小时)。杂交之前,每个微阵列与含5×SSC,0.1%SDS和1%BSA的预杂交液在42℃预杂交至少1个小时。载玻片在室温分别用2xSSC,0.1%SDS和1xSSC和0.2xSSC各洗涤2min,然后用0.05xSSC洗涤1min。提到的绝大部分样品做双份。每个克隆的Cy3和Cy5荧光强度用Axon GenePix 4000扫描仪采集并且用GenePix Pro 3.0软件剔除背景信号。按照各通道的荧光强度、点大小和旗标(flag)过滤表达数据,然后计算Cy5/Cy3的比例,并且在每个芯片中通过以中值为中心的对数-比值(log-ratio)进行归一化处理。
c)数据分析和统计分析
利用CLUSTER和TREEVIEW软件,采用以中值为中心相关法和完全连锁法,进行无监督的分级聚类分析(Eisen等人,同上)。对于非监督和监督分析,我们还使用癌症研究所生物测量研究分公司(Biometric Research Branch of the National CancerInstitute)所开发的BEB-ArrayTools软件,这是用于对cDNA点阵基因表达数据进行可视化和统计分析的完整软件包。使用基于单变量F-测试的类别比较工具,在显著水平为P<0.001或0.002的情况下,寻找预定临床组别之间差异表达的基因。基于2000个随机排列的F统计分析的排列分布状态,被用于证实统计的显著性。在比较同一病人的原发性至扩散性肿瘤时,以同样方法使用成对数值的t统计。通过使用2000个随机的P值小于0.001显著水平的排列,根据基因表达图谱,用具有“省略单因素(leave-one-out)”交叉确认测试的多变量复合共变预测工具(Compound Covariate Predictor,CCP),对预定的临床组别进行分类。在每一交叉确认的步骤中,一个样本被省略,并且基于基因创建一个多变量CCP,其中所述基因是在由未被省略的样本所组成的训练组中,在特定水平下显著单变的基因。CCP被用于对省略后的样本分类,然后注明分类是正确还是错误。对于每次排除一个后的所有样本都要进行重复。总交叉确认的错误分类比率就这样被测定。交叉确认的错误分类比率在统计学上的显著性,通过对数据重复进行2000次的完整交叉确认程序来确定,其中分类成员是随机置换的。CCP建立在基因表达变量的加权线性组合基础上,其中所述变量在训练组中是显著单变的,其权重对应于t-统计,如Radmacher等人(同上)中所述。当CCP用于对成对的原发性和转移组织进行分类时,也进行交叉确认,其中每次省略一对数据,并且基于每个基因表达的成对差异进行分类。两个重复样本的基因表达均值被用于分析。
为产生用于对具有转移可能性的HCC进行分类的预测模型,我们随机选择10个PN样本和10个PT样本作为一个训练组。在测试组中总共包含20个双盲的新HCC样本。新样本分类基于下列线性组合的计算值:L=∑iti*(xi-mi),其中ti=分类中基因i的t值,xi=待分类的新样本中基因i的对数-比值,mi=基因I在PN和PT组的中值(见表2)。其他细节可在BRB-ArrayTools用户手册中找到。使用基于Excel的WinSTAT软件,通过Kaplan-Meier存活分析来比较病人的存活率。通过Cox-Mantel对数级测试,当PN与P或PT进行比较时得出统计P值。
d).半定量PT-PCR和Western印迹
总RNA用SUPERSCRIPTTM II RNase H-逆转录酶和随机六聚体(Invitrogen Inc.)进行逆转录。PCR进行了26循环(94℃,30sec;53℃,30sec;72℃,1min),随后是72℃,10分钟的一个额外循环,并采用下列引物:OPN正义5′-GACTCGAACGACTCTGATGATGTA-3′(SEQ ID NO:3);OPN 反义5′-CTGGGCAACGGGGATGG-3′(SEQ ID NO:4);以及HotStarTaq Master Mix(QLAGEN)试剂盒。Quantu mRNA TM 18S(Ambion)作为内部标准。OPN的定量采用密度测定法,用18S产物进行归一化。Western印迹分析基本上参照Wu等人,(同上)所述的方法。简而言之:用RIPA缓冲液(50mM Tris-HCl,pH7.4/150mM NaCl/1% Triton X-100/1%去氧胆酸/1.0% SDS/1%抑肽酶)从CCL13、SK-Hep-1和Hep3B细胞获得蛋白裂解液,用10%SDS-PAGE分离,转印到Immobilin-P膜(Millipore,Bedford,MA),用大鼠的抗-OPN单克隆抗体(Chemicon International)检测,然后用基于ECL的测定(Amersham)显示。
e)细胞系和体外侵入分析
两种具有不同转移潜能的人肝癌细胞系SK-Hep-1和Hep3B,以及一个非转化性的肝细胞系CCL13(张氏肝细胞),并用于确定OPN与转移可能性之间的功能相关性,其中按照制造商的说明使用BD BioCoatTM MatrigelTM侵入腔(BD Biosciences)参照产品说明。这些细胞来自美国典型培养物保藏中心。细胞常规地维持在37℃,5% CO2的潮湿环境中,用EMEM(GIBCOL)培养基,并补加了10%胎牛血清,1×非必须氨基酸,1×丙酮酸钠,2mM谷氨酸和青霉素/链霉素。对于侵入分析,将细胞放在含无血清EMEM的上层室中,并在使用或不用重组的鼠OPN(2μg/ml)(R&D Systems)或充分记载抗OPN的中和抗体(3μg/ml)(R&D Systems)情况下,孵育20小时。将含5%FBS的EMEM培养基加至下层室作为化学吸引剂。加入OPN或OPN抗体之前和之后,对侵入通过MatrigelTM膜的细胞数目进行计数。
f)组织学分析
制备石蜡包埋的组织块,然后切成5微米厚的连续切片,并铺于带电荷的载玻片上。载玻片进行苏木精和伊红(H&E)染色。两个病理学家独立地进行组织学诊断性读片。对于免疫组织化学分析,对载玻片脱腊并进行免疫染色(按Forgues等人,J.Biol.Chem.276:22797-22803所述的方法)。简而言之,玻片在1x柠檬酸缓冲液,在微波炉中放置15分钟从而恢复抗原,然后用3%双氧水阻断内源性的过氧化物酶10分钟。接着用10%驴血清封闭非特异性结合,切片与鼠抗OPN抗体(Chemicon International)于4℃孵育过夜。使用生物素化的二抗和链亲和素过氧化物酶的复合物(ABC Elite kit,Vector Labs)。切片浸泡在3-3′二氨基联苯胺(DAB)溶液(0.25克/ml,并含3%过氧化氢酶)。玻片用Harris-苏木精复染并且用酒精到二甲苯脱水,用Permount(Sigma)封片。
2.结果
a)转移型肝损伤与其对应的原发性HCC无法辨别
为确定HCC转移过程中的精细改变,我们将个体的原发性HCC样品的基因表达图谱,与伴有匹配的转移损伤的肝内转移(P组)或门静脉肿瘤血栓(PT组),即P-M或PT-M组,进行比较。同时比较了各样品相对应的非癌肝脏组织。最初,我们对50个来自30个患者随机抽样的原位的和转移的肿瘤样品进行了基因表达图谱比较[即10位无HCC转移患者(PN组),10位PT患者和10位P患者]。我们试图用非监督的分级聚类算法将其分成临床组别,这些算法基于全表达相似性谱,其中使用全部的9180个基因,或者使用经基因筛选过滤器在排除了部分基因(这些基因与中值相比并不显著变化,p<0.001)之后的大约2487个基因。然而,该聚类分析没有产生对应于临床分组的有意义的分组结果。类似地,我们使用107个基因也无法获得有意义的分组,这些基因是与中值相比基因表达比值变化大于2倍进行过滤而获得的。该分析结果意味着,原发性和转移的HCC只可通过较小的基因子集进行区分,而基因的聚类分析可能受许多其他基因变化的影响,从而妨碍了分类。
为研究这些微小差异,我们使用了监督的分类比较分析和单变量F-测试及全面的排列测试,来定义在预定临床组别中差异表达的基因。对5个临床组(即P,P-M,PT,PT-M和PN)的分析,得到了总计143个显著基因(P<0.005)。基于143个显著基因的前三个主要组分的多维量表分析揭示,PN样品明显区别于其余样本,而P、P-M、PT、和PT-M样本是不可区分的(图1a)。意外的是,原发性的和匹配的转移HCC肿瘤的基因表达图谱不能显著地区分开来。
b)PN区别于PT和P
为了确认和拓展上述发现,我们对30个原代HCC样本(包括PN、PT和P病人)进行了类别比较分析。该分析产生了总共383个显著差异的基因(P<0.0005)。基于这些383个基因的表达谱,通过分级聚类算法对这30个PN、P和PT样本进行分类(图1b)。在分级树上观察到两个主要分支,一个和PN样本有关,另一个与P和PT样本有关。P和PT样本没有完全分开(图1b)。因此,原发性的无转移HCC的基因表达谱,明显不同于在肝脏软组织的门静脉或其他地方有转移损伤的原发性HCC。
为进一步确定一个能够被准确区分成两个预定类别的基因集和为了鉴别转移相关基因,我们使用监督的机器学习分类算法,即已知的复合相关预测法(CCP),该算法包含“省略单因素”的交叉验证测试,以避免过度评价预测的精确性这一统计学问题,该问题在模型是用相同样本训练和评价时会发生。这种分析也产生多变量预测值,该预测值用于决定某一给定样本到底属于这两类中的那一类,还产生了在给定统计显著性水平下呈现单变量显著的基因列表。我们使用整个基因集并且P值<0.001,将来自30个病人的50个HCC样本按照不同的临床标准分成不同的配对,并将CCP用于每一配对(表1)。在此显著性水平下,在分类中期望的假阳性基因数目小于10。错误分类比率通过“省略单因素”的交叉验证法加以确认。对于交叉验证的每一步骤(其中省略一个样本),重复选择有信息的基因和产生多基因分类。对于随机获得小的交叉验证的错误分类比率的概率,可通过重复整个交叉验证过程而得出,其中使用2000个随机排列的类别标志用于被评估的临床标准。这样得出了分类P值(表1)。采用监督机器学习分类算法,我们在PT和PT-M样本之间没有发现显著性差异(表1)。P和PT样本的基因表达图谱和配对的转移性P-M和PT-M样本几乎相同(表1)。在这些基因分类中的基因数目处于背景(假阳性)水平。这些数据与前述聚类和多维量表分析(multidimensional scaling analysis)是一致。
相反,我们用分类器中的153个显著基因准确地从PN和PT样本中预测了肿瘤(100%)(表2)。交叉验证法的分类误差远小于随机预测(p<0.005)(表1)。相似地,我们用分类器中大量基因准确地预测了PN和P样品,以及PN和P/PT样本(表1)。然而,CCP没有在P、PT、PT-M和P-M中产生显著分类,在这些分类中的基因数目是不显著的。另外,我们发现,当肿瘤大小、年龄、肿瘤包裹性、或肝硬化等被用作临床分类时,并无统计上显著的分类。这些数值与类别比较分析(包括多维量表分析和分级聚类算法分析)的结果是一致的。我们认为,原发性和转移性肿瘤有非常相似的基因表达特征,而无转移的原发性HCC肿瘤可区别于伴有门静脉肿瘤血栓或肝内扩散的原发性HCC。
表1.在“省略单因素”的交叉验证过程中分类器(classifier)的性能*
 分类器类别**     临床分组   病例总数 错误分类的病例数   分类器的P值  在分类器中的基因数
 PN vs.PTPN vs.PPN vs.P/PTP vs.PTPT vs.PT-MP/PT vs.P-M/PT-MP vs.PT-MPT vs.P-M肿瘤大小年龄肿瘤包裹性肝硬化     PNPTPNPPNP和PTPPT配对样本配对样本PPT-MPTP-M>5cm≤5cm>45岁≤45岁有无有无     101010101020101010201010101016141713921146     0010203435432474572476   <0.0005<0.0005<0.0010.2160.2960.1320.2480.1630.2340.3340.0370.798     153157256201714974131
*用复合变量预测子和总共9180个基因表达数据,进行不同的临床组的分类,显著性差异水平P=0.001。分类器基于2000个随机排列。分类器中假阳性基因的期望数为10。
**PN,单个原发性HCC;PT,有门静脉肿瘤血栓的原发性HCC;PT-M,来自配对PT的肿瘤血栓;P,有肝内扩散的原发性HCC;P-M,来自配对P的肝内扩散;P/PT,同时有P和PT;P-M/PT-M,同时有P-M和PT-M;肿瘤大小是长度方向的直径。
c).来自监督学习算法的基于基因表达的模型可预测HCC病人的转移可能性
用CCP来成功地区分PN和PT,使得我们开发了基于基因表达的模型来预测HCC病人发展为转移的可能性。我们随机选择10个PN病人和10个PT病人的原发性HCC样品作为训练组,通过“省略单因素”的交叉验证分类法产生一个预测模型。训练样品的分类产生含153个基因的列表。通过产生出多因子(multi-因子ial)的L值,这提供了检测样本的预测基础,被称为“加权投票”练习(见材料与方法)。我们包括了所有剩余的20个原发性HCC样本作为一个测试集(15个P病人,3个额外PN病人,和2个额外PT病人)。图2显示了计算的“加权投票”L值,其中转移样品产生阴性值,而无转移样品产生阳性值。除了一个“P”样本(S29)外,所有的测试样本都归入转移组(图2a)。病人的跟踪数据显示,一个PN病人(S56)在手术后8个月发生肺转移,而第二个病人(S57)在手术后9个月无癌症,第三个病人(S55)没有回答跟踪问查。基于PN/PT比对所获得的153个基因构成的集合,我们还通过多维量表法分析了这些样本。结果显示,S29基因的表达谱更象P组和PT组,而不象PN组(图2b)。这提示S29应该属于P组和PT组。这样,我们准确地将20个双盲HCC患者中的18个(90%)归类为具有转移可能性。
表2  用于预测转移的153个显著基因及其在预测模型中计算多因子L值所需的值
UG簇     符号     描述  t-值     中值   p-值  独特标识
 Hs.36566   LIMK1     LIM结构域激酶1 -7.7122   -0.433  0.000000  160082
 Hs.75573   CENPE     着丝点蛋白E(312kD) -7.2301    0.217  0.000001  160128
 Hs.81217   FZD2     蜷缩(果蝇属)同源物2 -7.0334   -0.499  0.000002  160028
 Hs.146580   ENO2     烯醇化酶2,(Y,乙溴醋胺) -6.9978   -0.238  0.000002  160068
 Hs.222   ITGA9     整联蛋白,α9 -6.699   -0.159  0.000004  160135
 Hs.75887   COPA     外被体蛋白复合物,亚基α -6.4035   -0.241  0.000007  159890
 Hs.6727   KIAA0660     Ras-GTP酶激活蛋白SH3结构域 -6.3742   -0.281  0.000007  160103
 Hs.89578   GTF2H1     通用转录因子IIH,多肽1 -6.2909   -0.178  0.000006  164987
 Hs.180941   VPS41     分拣空泡蛋白41(酵母同源物) -5.9459   -0.331  0.000013  159888
 Hs.99236   RGS20     G-蛋白信号传导的调节物20 -5.8503   -0.264  0.000015  161959
 Hs.274   MATK     巨核细胞相关的酪氨酸激酶 -5.8166   -0.366  0.000016  160015
 Hs.194816   STOML1     溴化丙胺太林(EBP72)样蛋白1 -5.7855   -0.124  0.000018  162695
 Hs.79516   BASP1     膜附着信号蛋白1 -5.5974   -0.415  0.000026  159882
 Hs.733   EPB42     红细胞膜蛋白带4.2 -5.5395   -0.378  0.000029  160067
 Hs.87539   ALDH3B2     醛脱氢酶3家族,成员B2 -5.5356   -0.351  0.000030  166071
 Hs.5947     MEL     Mel转化癌基因   -5.434     -0.452  0.000045  160104
 Hs.118354     CAT56     CAT56蛋白   -5.4077     -0.316  0.000047  165027
 Hs.27744     RAB3A     RAB3A,成员RAS癌基因家族   -5.35     -0.338  0.000044  160099
 Hs.7984     PSCD3     普列克底物蛋白同源物   -5.3177     -0.143  0.000047  159887
 Hs.104519     PLD2     磷脂酶D2   -5.2672     -0.275  0.000052  159999
 Hs.4748     ADCYAP1R1     腺苷酸环化酶激活多肽1   -5.2037     -0.166  0.000060  161460
 Hs.83155     ALDH3B1     醛脱氢酶3家族,成员B1   -5.2005     -0.44  0.000088  159838
 Hs.283822     RHD     恒河猴血型,D抗原   -5.1898     -0.369  0.000062  164821
 Hs.2175     CSF3R     集落刺激因子3受体   -5.1684     -0.136  0.000065  160114
 Hs.3094     KIAA0063     KIAA0063基因产物   -5.162     -0.325  0.000095  160091
 Hs.119273     KIAA0296     KIAA0296基因产物   -5.132     -0.545  0.000070  159951
 Hs.23672     LRP6     低密度脂蛋白受体相关蛋白6   -5.1081     -1.13  0.000074  162040
 Hs.118804     ENO3     烯醇化酶3,(β,肌肉)   -5.0415     -0.76  0.000085  164468
 Hs.74502     CTRB1     胰凝乳蛋白酶原B1   -5.0381     -0.216  0.000086  159787
 Hs.194148     YES1     v-yes-1 Yamaguchi肉瘤病毒癌基因   -5.0064     -0.413  0.000092  159875
    未知(IncytePD:1404153)   -4.9541     -0.155  0.000103  160122
 Hs.772     GYS1     糖原合成酶1(肌肉)   -4.913     -0.478  0.000112  160222
 Hs.153203     MDFI     MyoD家族抑制物   -4.8908     -0.773  0.000138  163880
 Hs.247423     ADD2     内收蛋白2(β)   -4.8064     -0.609  0.000141  162687
 Hs.22785     GABRE     Y-氨酪酸(GABA)A受体   -4.8046     -0.188  0.000142  159794
    未知(IncytePD:2685601)   -4.7898     -0.307  0.000147  165108
 Hs.97087     CD3Z     CD3Z抗原,zeta多肽(TiT3复合物)   -4.7723     -0.487  0.000152  160043
 Hs.79006     DTYMK     脱氧胸苷酸激酶(胸苷酸激酶)   -4.7693      0.254  0.000153  161858
 Hs.26915     SPTBN2     血影蛋白,β,非红细胞型2   -4.7666     -0.364  0.000154  160846
    未知(IncytePD:2509789)   -4.7523     -0.175  0.000159  164920
 Hs.38586     HSD3B1     羟基-δ-5-类固醇脱氢酶   -4.7519     -0.392  0.000159  164787
 Hs.32966     GUCA2B     鸟苷酸环化酶激活物2B(uroguanyin)   -4.7519     -0.368  0.000159  164851
 Hs.12773     ACOX3     乙酰-辅酶A氧化酶3,降植烷基(pristanoyl)   -4.7455     -0.25  0.000187  162487
 Hs.2281     CHGB     嗜铬粒蛋白B(分泌粒蛋白1)   -4.7199     -0.269  0.000171  160078
 Hs.25197     STUB1     STIP1同源和含U-Box的蛋白1   -4.6897     -0.264  0.000183  160555
 Hs.169536     RHAG     恒河猴血型相关的糖蛋白   -4.6648     -0.326  0.000193  164916
 Hs.96     PMAIP1     PMA-诱导蛋白1   -4.6573     -0.124  0.000196  160112
 Hs.153053     CD37     CD37抗原   -4.6051     -0.652  0.000220  160033
 Hs.155227     EPHB4     EphB4   -4.5965     -0.276  0.000257  168938
 Hs.92282     PITX2     配对样的同结构域转录因子2   -4.584     -0.149  0.000230  160123
 Hs.79123     KIAA0084     KIAA0084蛋白   -4.583     -0.296  0.000231  159886
 Hs.180878     LPL     脂蛋白脂酶   -4.5304     -0.18  0.000259  160485
 Hs.75658     PYGB     磷酸化酶,糖原;脑   -4.5152      0.027  0.000268  159778
 Hs.286132     MN7     D15F37(假基因)   -4.503     -0.314  0.000275  167399
 Hs.57600     AP1S1     衔接子相关蛋白复合物1   -4.4656     -0.26  0.000299  160042
 Hs.67688     EST   -4.4472     -0.458  0.000311  162920
 Hs.172458     IDS     艾杜糖2-硫酸酯酶(亨特综合征)   -4.4324     -0.259  0.000322  160243
 Hs.80768     CLCN7     氯化物通道7   -4.4298      0.058  0.000324  161279
 Hs.347527     SLC20A2     溶质载体家族20,成员2 -4.4173   -0.308  0.000333  159936
 Hs.72550     HMMR     透明质介导的运动性受体(RHAMM) -4.3918   -0.443  0.000352  167575
    未知(IncytePD:1681876) -4.3868   -0.275  0.000356  166536
 Hs.242947     DGKI     二酰甘油激酶,iota -4.3835   -0.369  0.000358  161826
 Hs.158249     KIAA0406     KIAA0406基因产物 -4.3376   -0.066  0.000397  159825
 Hs.182577     INPP5B     肌醇多磷酸-5-磷酸酶,75kD -4.315   -0.269  0.000417  160074
 Hs.37054     EFNA3     ephrin-A3 -4.3085   -0.355  0.000423  161846
 Hs.334841     SELENBP1     硒结合蛋白1 -4.3016   -0.481  0.000430  169315
 Hs.81454     KHK     己酮糖激酶(果糖激酶) -4.2966   -0.36  0.000434  159931
 Hs.84790     KIAA0225     KIAA0225蛋白 -4.2732   -0.151  0.000582  160472
 Hs.94498     LILRA2     白细胞免疫球蛋白样受体 -4.2714   -0.308  0.000459  161424
 Hs.151393     GCLC     谷胺酸半胱氨酸连接酶,催化亚基 -4.2523   -0.421  0.000479  166059
 Hs.151738     MMP9     基质金属蛋白酶9 -4.2337   -0.473  0.000722  159912
 Hs.69707     HCGII-7     HCGII-7蛋白 -4.2223    0.802  0.000512  161462
 Hs.152251     FZD5     蜷缩(果蝇属)同源物5 -4.2088   -0.386  0.000528  164899
    未知(IncytePD:1570216) -4.2019   -0.336  0.000536  159962
 Hs.61712     PDK1     丙酮酸脱氢酶激酶,同工酶1 -4.1746   -0.251  0.000570  160462
 Hs.66731     HOXB13     同源框(homeo box)B13 -4.1722   -0.739  0.000573  159868
 Hs.80976     MKI67     单抗Ki-67所鉴别的抗原 -4.1699   -0.148  0.000642  160039
 Hs.283664     ASPH     天冬氨酸β-羟基酶 -4.1693    0.062  0.000576  160084
 Hs.76688     CES1     羧酸酯酶1 -4.1577   -1.285  0.000591  164490
 Hs.154230     NDP52     核结构域10蛋白 -4.1483   -0.178  0.000604  159958
 Hs.75596     IL2RB     白介素2受体,β -4.1376   -0.268  0.000688  159942
 Hs.4756     FEN1     挡板结构特异性的核酸内切酶1 -4.1222    0.195  0.000640  160035
 Hs.673     IL12A     白介素12A -4.0844   -0.082  0.000696  162579
 Hs.89230     KCNN3     钾钙激活的通道 -4.0745    0.008  0.000711  161095
 Hs.799     DTR     白喉毒素受体 -4.0616   -0.421  0.000812  167412
 Hs.120360     PLA2G6     磷脂酶A2,组VI -4.0344   -0.577  0.000778  160058
 Hs.171075     RFC5     复制因子C(激活物1)5(36.5kD) -4.0263    0.114  0.000792  161332
 Hs.99899     TNFSF7     肿瘤坏死因子超家族,成员7 -4.0211   -0.221  0.000801  159817
 Hs.9605     CPSF5     切割和聚腺苷酸化的特异因子5 -4.0101    0.079  0.000821  159766
 Hs.95262     NFRKB     与kappa B结合蛋白有关的核因子 -4.0081   -0.162  0.000825  167698
 Hs.37129     SCNN1B     钠通道,非电压门控型1 -4.0053   -0.244  0.000830  161191
 Hs.296371     RAB28     RAB28,成员RAS癌基因家族 -4.0038    0.343  0.000833  160699
 Hs.83795     IRF2     干扰素调节因子2 -3.9955   -0.527  0.000848  161188
 Hs.85087     LTBP4     潜伏的TGF-β结合蛋白4 -3.9927   -0.34  0.000854  159923
 Hs.267448     CGI-85     CGI-85蛋白 -3.986    0.219  0.000866  166502
 Hs.121521     ABL2     v-abl鼠白血病病毒癌基因同源物2 -3.9746   -0.347  0.000889  166612
 Hs.28166     CRSP8     Sp1转录激活的辅因子 -3.9714    0.07  0.000895  162996
 Hs.239706     GAB1     GRB2相关的结合蛋白1 -3.9529   -0.347  0.000933  162416
 Hs.177687     AKR1C4     醛-酮还原酶家族1,成员C4 -3.9499    0.145  0.000939  161753
 Hs.25648     TNFRSF5     TNF受体超家族,成员5 -3.9371   -0.147  0.000966  166055
 Hs.858     RELB     v-rel病毒癌基因同源物B -3.935   -0.12  0.000971  164810
Hs.155314     KIAA0095     KIAA0095基因产物  -3.9244    -0.206  0.000994  162213
Hs.8358     FLJ20366     假定的蛋白FLJ20366   3.9437     0.201  0.000952  164145
Hs.112819     EST   3.9573     0.217  0.000924  168969
Hs.126263     EST,与A38712纤维蛋白高度相似   3.9651     0.925  0.000908  167474
Hs.10669     DDEF1     发育分化增强因子1   3.9709    -0.062  0.000896  164026
Hs.99216     EST,类似于ALU8   3.9802     0.288  0.000878  169148
Hs.98738     GRTH     促性腺素调节的睾丸RNA解旋酶   3.9911    -0.198  0.000857  166657
Hs.28274     智人cDNA:FLJ22049 fis   3.9912     0.208  0.000857  163989
Hs.186564     EST   4.0128     0.177  0.000816  163409
Hs.34045     FLJ20764     假定的蛋白FLJ20764   4.0142     0.325  0.000814  168581
Hs.3686     KIAA0978     KIAA0978蛋白   4.0211     0.308  0.000801  164187
Hs.172148     EST   4.0307     0.179  0.000784  163746
Hs.239499     KIAA0185     KIAA0185蛋白   4.0679     0.17  0.000722  168413
Hs.169341     HTPAP     HTPAP蛋白   4.1104     0.608  0.000657  163274
Hs.44131     KIAA0974     KIAA0974蛋白   4.1179     0.828  0.000646  164589
Hs.2969     SKI     v-ski禽肉瘤病毒癌基因同源物   4.1484     0.323  0.000604  164039
Hs.80618     FLJ20015     假设蛋白   4.1716     0.258  0.000573  163363
Hs.136309     SH3GLB1   SH3-结构域,GRB2-样,内菲林(endophilin)B1   4.1832     0.339  0.000559  162621
Hs.274293     智人mRNA;cDNA DKFZp761G1111   4.1964    -0.013  0.000543  165504
Hs.21479     UBN1     遍核蛋白(ubinuclein)1   4.2096     0.554  0.000527  167995
Hs.155160     SRP46     剪接因子,富含精氨酸/丝氨酸,46kD   4.2889     0.291  0.000442  168577
Hs.105584     RPS6KA4     核糖体蛋白S6激酶,90kD,多肽4   4.3239     0.349  0.000409  168189
Hs.279886     RANBP9     RAN结合蛋白9   4.336     0.365  0.000398  168730
Hs.197298     NS1-BP     NS1-结合蛋白   4.346     0.593  0.000389  168257
    未知(IncytePD:2895226)   4.3857    -0.2  0.000357  161881
Hs.36793     FLJ23188     假定的蛋白FLJ23188   4.3907     0.454  0.000353  168869
Hs.17384     EST   4.3978    -0.04  0.000347  163225
Hs.78524     HTCD37     TcD37同源物   4.4097     0.381  0.000338  167570
Hs.2301     DBH     多巴胺β-羟基酶   4.4196     0.743  0.000375  168202
Hs.118795     FLJ10008     假定的蛋白FLJ10008   4.4386    -0.064  0.000317  166653
Hs.33074     智人,克隆IMAGE:3606519   4.5036     0.135  0.000275  168589
Hs.4988     智人克隆24711 mRNA序列   4.5042     0.016  0.000274  160165
Hs.288872     FLJ21439     假定的蛋白FLJ21439   4.5242     0.29  0.000263  168393
Hs.323712     KIAA0615     KIAA0615基因产物   4.5292     0.024  0.000260  163625
Hs.14051     智人mRNA;cDNA DKFZp434A2417   4.5538     0.215  0.000246  168381
Hs.296287     类似于含溴结构域4   4.5576     0.499  0.000244  169290
Hs.57847     EST,类似于CASPASE-4前体   4.63     0.264  0.000208  165194
Hs.26289     EST   4.7062     0.948  0.000176  169360
Hs.11123   DKFZP564G092     DKFZP564G092蛋白   4.9593     0.476  0.000101  163064
Hs.288908     CDNA:FLJ21913 fis,克隆HEP03888   4.9597     0.556  0.000101  168395
Hs.77495     UBXD2     含UBX结构域2   4.9758     0.676  0.000098  160190
Hs.24341     TAZ     具有PDZ结合基序的转录共激活物   5.0014     0.127  0.000093  164176
Hs.50133     EST   5.153     0.243  0.000067  168567
 Hs.262958   DKFZP4348044     假定的蛋白DKFZp434B044  5.1851   0.378  0.000075  169042
 Hs.53478     智人cDNA FLJ12366 fis  5.2202   0.111  0.000058  168383
 Hs.80658   UCP2     解偶联蛋白2  5.2483   1.308  0.000054  168158
 Hs.209065   FLJ14225     假定的蛋白FLJ14225  5.3394   0.468  0.000045  164339
 Hs.92357   GALK1     乳糖激酶1  5.6456   1.15  0.000037  169675
 Hs.50373     EST  5.7625   0.94  0.000029  165500
 Hs.266959   HBG1     血红蛋白,YA  5.9704   1.164  0.000026  168326
 Hs.25566     EST  6.1164   0.182  0.000009  168197
 Hs.25277   FLJ21065     假定的蛋白FLJ21065  6.1957   0.116  0.000008  164202
上述得出的预测结果将40个病人分成两组,一个为转移组,另一个为非转移组。Kaplan-Meier存活数据表示,与未发现转移的患者相比,预测会发生转移的患者生存时间明显缩短(图2C)。因为HCC患者死亡率很大程度上依赖于其是否在肝内发生转移,因此我们的结果表明,用于分类器的基因集提供了反映肝癌转移和存活的准确的基因表达特征。
d)骨桥蛋白促进HCC转移
上述研究表明,肝内转移所需的基因应当包括在预测模型内。然而,来自预测模型的153个基因的列表是基于严格的标准的(P值为0.001),以便将分类器中假阳性的基因数减到最少,这是正确分类所必需的。这样严格的标准可能会将许多对于转移过程而言显著的基因排除在外。为了扩展我们的研究,我们对PN组和PT组中各10个原发性HCC样本,在P值小于0.002情况下,进行了总计2000个随机排列的单变量F-检验。这个分析产生了总共224个显著性基因而且预期的假阳性少于20个(见表3)。为了鉴定导致肝癌转移的基因,我们检测了含224个基因的列表,并且对主要在PT和PT-M组中表达发生大幅改变但在PN组中很少变化的30个主要基因,进行了分类(见表4)。通过使用以中值为中心的关联法和完全连锁法,通过分级聚类算法将这些基因按中值为中心进行排列和可视化(图3a)。
在PT组中过表达均值超过3倍但在PN中不表达的一个基因,经鉴定为骨桥蛋白(OPN)(SEQ ID NO:1),骨桥蛋白属于分泌型磷蛋白,近来被发现它在转移型乳腺癌、恶性肺癌、结肠癌和前列腺癌中高度表达。芯片表达数据比对结果揭示,在大量的PT样本和对应的PT-M样本中,OPN的表达是升高的,但在PN样本中表达是极低的(图3b)。OPN在PT样本中过表达,但不在PN样本中表达,这一点已通过半定量RT-PCR分析得到确定(图3c和d)。对29例原发性HCC样本(包括16个新出现的HCC病例)和8个健康器官供体的正常肝样本,实施OPN的免疫组化分析(IHC)。这些样本的OPN免疫反应通过双盲模式被评价。唯有转移型肿瘤的细胞质OPN染色是阳性的,尤其是在高密度的脉管区(图4)。IHC结果基本上同芯片和RT-PCR得到的结果一致(61%的阳性例,18个转移HCC中的11个)(数据未显示)。综上所述,这些研究显示,OPN具有诊断转移型HCC患者的良好价值。
为测定OPN在转移中的所起的作用,我们通过Western印迹法和Matrigel体外侵入分析,比较了人HCC细胞系中OPN的表达水平。OPN的表达水平在SK-Hep-1中为高,在Hep3B中为中等,在CCL13中为低(图5a),这同它们的侵入力相符(图5b)。抗OPN的中和抗体能显著地阻断SKHep-1(p<0.001)和Hep3B细胞的侵入(p<0.04)。然而,重组的鼠OPN在Hep3B和Sk-Hep-1细胞上没有显示出统计上显著的刺激作用,暗示要么肿瘤细胞所产生的OPN对于维持侵入的表型已经足够,要么说明因种间差异而导致低效。5个额外的HCC细胞系中也获得了类似的结果(图5c)。然而,中和抗体对细胞的生存和扩散只有很小影响(图5c,右侧)。
为拓展上面的发现,我们在裸鼠中测定了OPN对HCC细胞向肺部转移的作用。HCCLM3细胞株是通过皮下注射具有高度肺转移的MHCC97细胞而获得的一种克隆(Li等人,J.Cancer Res.Clin.Oncology,2002)。在皮下注射后的一周,可获得100%的肿瘤发生率,这同我们近期的数据一致。在原发性肿瘤的大小方面,对照组和抗OPN组没有显著差异(图5E),这同我们抗OPN抗体在体外不会影响HCC细胞生长的结果相一致。在第五周,在大多数I-II级肿瘤簇和一些III-IV级肿瘤簇对照组中的每一只小鼠,都检测到有肺转移损害(图5E,F)。对照组小鼠每个肺中平均有11.1±2.9个肿瘤簇。相反,抗OPN抗体组中只有大约一半的小鼠发生了肺转移,并且剩下的小鼠大多数发展成I级肿瘤簇,且每个肺中综合平均有2.6±1.0个肿瘤簇,因而这个结果在统计学上是显著的(P<0.01)。因此,抗OPN抗体显示出对HCCLM3细胞的肺转移有显著的抑制效应。
表3.用于预测转移的224个显著基因及其在预测模型中计算多因子L值所需的值
 UG簇 名称 描述   PN     PT   p值     染色体定位  独特标号 克隆
  Hs.313 OPN 骨桥蛋白   1.07     3.29   0.00122     4   161923 IncytePD:4327691
  Hs.69707 HCGII-7 HCGII-7蛋白   1.07     2.85   0.000512     6   161462 IncytePD:1656490
  Hs.177687 AKR1C4 醛-酮还原酶家族1,成员C4   0.58     2.11   0.000939     10p15-p14   161753 IncytePD:5033671
未知   0.82     1.74   0.0018   161371 IncytePD:3421817
  Hs.276916 NR1D1 核受体亚家族1,组D,成员1   0.74     1.71   0.00181     17q11.2   166707 IncytePD:1904760
  Hs.211569 GPRK5 G蛋白-偶联受体激酶5   0.99     1.69   0.00147     10q24-qter   161133 IncytePD:1418741
  Hs.75573 CENPE 着丝点蛋白E(312kD)   0.82     1.65   1.00E-06     4q24-q25   160128 IncytePD:308 1067
  Hs.283664 ASPH 天冬氨酸β-羟基酶   0.7     1.56   0.000576     8q12.1   160084 IncytePD:3693273
  Hs.296371 RAB28 RAB28,成员RAS癌基因家族   1.07     1.5   0.000833     4p16.1   160699 IncytePD:1457948
  Hs.89267 EST   2.49     1.48   0.00132     1   163570 IncytePD:1633393
  Hs.79411 RPA2 复制蛋白A2(32kD)   1.02     1.47   0.00135     1p35   167684 IncytePD:1729876
  Hs.79006 DTYMK 脱氧胸苷酸激酶(胸苷酸激酶)   0.98     1.45   0.000153     2   161858 IncytePD:4818795
  Hs.26289 EST   2.59     1.44   0.000176     17   169360 IncytePD:674211
  Hs.4756 FEN1 挡板结构特异性的核酸内切酶1   0.91     1.44   0.00064     11q12   160035 IncytePD:2050085
  Hs.44131 KIAA0974 KIAA0974蛋白   2.19     1.44   0.000646     10   164589 IncytePD:4540
  Hs.267448 CGI-85 CGI-85蛋白   0.96     1.42   0.000866     11q13   166502 IncytePD:2603232
  Hs.171075 RFC5 复制因子C(激活物1)5(36.5kD)   0.83     1.41   0.000792     12q24.2-q24.3   161332 IncytePD:3590056
  Hs.77495 UBXD2 含UBX结构域2   1.88     1.36   9.78E-05     2p14-q21.3   160190 IncytePD:1940994
  Hs.184175 C2orf3 染色体2开放阅读框3   0.84     1.36   0.00139     2p11.2-p11.1   166136 IncytePD:2779394
  Hs.146580 ENO2 烯醇化酶2,(γ,乙溴醋胺1)   0.55     1.31   1.56E-06     12p13   160068 IncytePD:1672630
  Hs.96 PMAIP1 佛波醇-12-豆蔻酸-13-乙酸酯-诱导蛋白1   0.64     1.31   0.000196     18q22   160112 IncytePD:1931117
  Hs.80768 CLCN7 氯化物通道7   0.83     1.3   0.000323     16p13   161279 IncytePD:1522646
未知   0.8     1.3   0.00122   165687 IncytePD:404768
  Hs.9605 CPSF5 切割和聚腺苷酸化的特异因子5,25kD亚基   0.87     1.29   0.000821     16   159766 IncytePD:1813371
  Hs.20295 CHEK1 CHK1(检查点,S.pombe)同源物   0.85     1.28   0.00185     11q24-q24   161544 IncytePD:2594058
  Hs.37288 NRID2 核受体亚家族1,组D,成员2   0.66     1.27   0.00168     3   159975 IncytePD:2643094
 UG簇 名称 描述   PN   PT   p值     染色体定位  独特标号 克隆
  Hs.75658 PYGB 磷酸化酶,糖原;脑   0.83   1.26   0.000268     20p11.2-p11.1   159778 IncytePD:1975552
  Hs.32058 C1orf19 染色体1开放阅读框19   1.85   1.26   0.00154     1q25   169022 IncytePD:2285569
  Hs.24994 LOC51098 CGI-53蛋白   1.75   1.25   0.0018     20   166179 IncytePD:2347842
  Hs.11123 DKFZP564G092 DKFZP564G092蛋白   1.56   1.24   0.000101     10cen-q26.11   163064 IncvtePD:2071705
  Hs.13421 KIAA0056 KIAA0056蛋白   0.9   1.24   0.00119     11   159874 IncytePD:1561606
  Hs.28166 CRSP8 Sp1转录激活所需的辅因子,亚基8(34kD)   0.9   1.23   0.000895     5   162996 IncytePD:1283515
  Hs.57973 CARD10 Caspase募集结构域蛋白10   1.7   1.23   0.00197     22q13.1   165430 IncytePD:3739467
  Hs.274313 IGFBP6 胰岛素样生长因子结合蛋白6   0.87   1.21   0.00192     12q13   160319 IncytePD:1968126
  Hs.209065 FLJ14225 假定的蛋白FLJ14225   1.62   1.18   4.48E-05     1q21   164339 IncytePD:1486385
  Hs.34526 TYMSTR G蛋白-偶联受体   0.89   1.18   0.00101     3p21   161635 IncytePD:2610374
  Hs.80658 UCP2 解偶联蛋白2(线粒体的,质子载体)   5.23   1.17   5.44E-05     11q13   168158 IncytePD:1907952
  Hs.197298 NS1-BP NS1-结合蛋白   1.95   1.17   0.000389     1q25.1-q31.1   168257 IncytePD:630045
  Hs.222 ITGA9 整联蛋白,α9   0.69   1.16   3.74E-06     3p21.3   160135 IncytePD:2487318
  Hs.288908 智人cDNA:FLJ21913 fis,克隆HEP03888   1.87   1.16   0.000101   168395 IncytePD:1938947
  Hs.21479 UBN1 遍核蛋白(ubinuclein)1   1.86   1.16   0.000527     16p13.3   167995 IncytePD:1541201
  Hs.152981 CDS1 CDP-二酰甘油合成酶(磷脂酸胞苷酰基转移酶)1   0.81   1.16   0.0011     4q21   165060 IncytePD:1406071
未知   0.68   1.15   0.000159   164920 IncytePD:2509789
  Hs.155223 STC2 锡钙蛋白(stanniocalcin)2   0.88   1.15   0.00122     5p14.2-q15   160310 IncytePD:2823476
  Hs.1309 CD1A CD1A抗原,一种多肽   0.79   1.15   0.00161     1q22-q23   165058 IncytePD:2906655
  Hs.89230 KCNN3 钾中间体/小导电的钙激活通道,亚家族N,成员3   0.89   1.14   0.000711     1q21.3   161095 IncytePD:1747441
  Hs.331328 FLJ13213 假定的蛋白FLJ13213   0.7   1.14   0.00136     15   166434 IncytePD:2382190
未知   0.72   1.13   0.000103   160122 IncytePD:1404153
  Hs.169341 HTPAP HTPAP蛋白   2.05   1.13   0.000657     8   163274 IncytePD:2626340
  Hs.78524 HTCD37 TcD37同源物   1.51   1.12   0.000338     1q21   167570 IncytePD:1430538
  Hs.36793 FLJ23188 假定的蛋白FLJ23188   1.68   1.12   0.000353     3p13-q13.33   168869 IncytePD:2669866
  Hs.154230 NDP52 核结构域10蛋白   0.7   1.12   0.000604     17q21.3   159958 IncytePD:1818836
 UG簇 名称 描述   PN   PT   p值   染色体定位  独特标号 克隆
  Hs.25648 TNFRSF5 肿瘤坏死因子受体超家族,成员5   0.83   1.12   0.00132   20q12-q13.2   160900 IncytePD:1638346
  Hs.6727 KIAA0660 Ras-GTP酶激活蛋白SH3结构域-结合蛋白2   0.61   1.11   6.92E-06   4q21.1-q21.3   160103 IncytePD:1899625
  Hs.8402 ADCY3 腺苷酸环化酶3   0.77   1.11   0.00128   2p24-p22   167084 IncytePD:1966824
  Hs.279886 RANBP9 RAN结合蛋白9   1.52   1.1   0.000398   6p23   168730 IncytePD:1781729
  Hs.66718 RAD54L RAD54(酿酒酵母)样蛋白   0.91   1.1   0.00103   1p32   166204 IncytePD:2645840
  Hs.10095 LOC56930 假定的蛋白,来自EUROIMAGE 1669387   1.61   1.1   0.00129   19p13.3   168579 IncytePD:322585
  Hs.19348 FLJ13119 假定的蛋白FLJ13119   1.56   1.1   0.00131   15   169102 IncytePD:1978282
  Hs.194816 STOML1 Stomatin(EBP72)样蛋白1   0.77   1.09   1.75E-05   15q24-q25   162695 IncytePD:1741526
未知   0.6   1.09   0.000147   165108 IncytePD:2685601
  Hs.84790 KIAA0225 KIAA0225蛋白   0.75   1.09   0.000582   7   160472 IncytePD:482519
  Hs.80976 MKI67 单抗Ki-67所鉴别的抗原   0.75   1.09   0.000642   10q25-qter   160039 IncytePD:2470485
  Hs.89578 GTF2H1 通用转录因子IIH,多肽1(62kD亚基)   0.72   1.08   6.25E-06   11p15.1-p14   164987 IncytePD:37249
  Hs.27744 RAB3A RAB3A,成员RAS癌基因家族   0.58   1.08   4.38E-05   19p13.2   160099 IncytePD:1381611
  Hs.2281 CHGB 嗜铬粒蛋白B(分泌粒蛋白1)   0.64   1.08   0.000171   20pter-p12   160078 IncytePD:2821341
  Hs.92282 PITX2 配对样的同结构域转录因子2   0.75   1.08   0.00023   4q25-q27   160123 IncytePD:2794019
  Hs.194694 MAP3K6 促分裂原激活的蛋白激酶激酶激酶6   0.8   1.08   0.00119   1   161091 IncytePD:1650939
  Hs.7984 PSCD3 普列克底物蛋白同源物,Sec7和卷曲/卷曲结构域3   0.77   1.07   4.69E-05   7   159887 IncytePD:3029341
  Hs.158249 KIAA0406 KIAA0406基因产物   0.85   1.07   0.000397   20   159825 IncytePD:1618693
  Hs.61712 PDK1 丙酮酸脱氢酶激酶,同工酶1   0.66   1.07   0.00057   2p14-q14.3   160462 IncytePD:268900
  Hs.126263 EST,与A38712纤维蛋白高度相似   3.36   1.07   0.000908   5   167474 IncytePD:1266194
  Hs.25648 TNFRSF5 肿瘤坏死因子受体超家族,成员5   0.76   1.07   0.000966   20q12-q13.2   166055 IncytePD:549096
  Hs.239818 PIK3CB 磷酸肌醇-3-激酶,催化性,β多肽   0.78   1.07   0.00114   3q24   160414 IncytePD:267803
  Hs.656 CDC25C 细胞分裂周期蛋白25C   0.79   1.07   0.00118   5q31   165792 IncytePD:876382
  Hs.288319 SART1 被T细胞识别的鳞状细胞癌抗原   0.62   1.07   0.00164   11cen-q12.3   164720 IncytePD:2205225
  Hs.180878 LPL 脂蛋白脂酶   0.73   1.06   0.000259   8p22   160485 IncytePD:647128
  Hs.136309 SH3GLB1 SH3-结构域,GRB2-样,内菲林(endophilin)B1   1.51   1.06   0.000559   1p22   162621 IncytePD:1552337
  Hs.3686 KIAA0978 KIAA0978蛋白   1.44   1.06   0.000801   20   164187 IncytePD:2234421
UG簇 名称 描述   PN   PT   p值     染色体定位  独特标号 克隆
Hs.146007 智人克隆IMAGE 21721   1.75   1.06  0.00173     2   162822 IncytePD:3143449
Hs.22785 GABRE γ-氨酪酸(GABA)A受体,ε   0.73   1.05  0.000142     Xq28   159794 IncytePD:3213034
Hs.296287 类似于含溴结构域4,克隆IMAGE:3542455   1.9   1.05  0.000244   169290 IncytePD:2310314
Hs.152251 FZD5 蜷缩(果蝇属)同源物5   0.56   1.05  0.000528     2q33-q34   164899 IncytePD:3129290
Hs.673 IL12A 白介素12A(天然杀伤细胞刺激因子1)   0.85   1.05  0.000696     3p12-q13.2   162579 IncytePD:2760318
Hs.155160 SRP46 剪接因子,富含精氨酸/丝氨酸,46kD   1.43   1.04  0.000442     11q22   168577 IncytePD:886075
Hs.151393 GCLC 谷胺酸半胱氨酸连接酶,催化亚基   0.53   1.04  0.000479     6p12   166059 IncytePD:818192
Hs.82927 AMPD2 腺苷单磷酸脱氨酶2(同工型L)   0.82   1.04  0.00163     1p13.3   162188 IncytePD:1968035
Hs.2175 CSF3R 集落刺激因子3受体(粒细胞)   0.8   1.03  6.46E-05     1p35-p34.3   160114 IncytePD:1596060
Hs.286132 MN7 D15F37(假基因)   0.63   1.03  0.000275     15q11-q13   167399 IncytePD:2739109
Hs.5716 KIAA0310 KIAA0310基因产物   1.39   1.03  0.00185     9q34.2-9q34.3   169169 IncytePD:1880859
Hs.104519 PLD2 磷脂酶D2   0.67   1.02  5.23E-05     17p13.1   159999 IncytePD:3472725
Hs.74502 CTRB1 胰凝乳蛋白酶原B1   0.73   1.02  8.55E-05     16q23-q24.1   159787 IncytePD:2070278
Hs.288872 FLJ21439 假定的蛋白FLJ21439   1.46   1.02  0.000263     15q14   168393 IncytePD:1998519
Hs.57600 AP1S1 衔接子相关蛋白复合物1,sigma 1亚基   0.69   1.02  0.000299     7   160042 IncytePD:1804181
Hs.17409 CRIP1 富含半胱氨酸的蛋白1(肠的)   1.5   1.02  0.00123     7q11.23   169514 IncytePD:2121863
Hs.4748 ADCYAP1RI 腺苷酸环化酶激活多肽1(垂体)受体,I性   0.79   1.01  5.99E-05     7p14   161460 IncytePD:3214293
Hs.25197 STUB1 STIP1同源和含U-Box的蛋白1   0.69   1.01  0.000183     16   160555 IncytePD:1315677
Hs.34045 FLJ20764 假定的蛋白FLJ20764   1.56   1.01  0.000814     14   168581 IncytePD:901577
Hs.95262 NFRKB 与kappaB结合蛋白有关的核因子   0.79   1.01  0.000825     11q24-q25   167698 IncytePD:1685182
Hs.858 RELB v-rel禽网状内皮增殖病病毒癌基因同源物B(在B-细胞3中的κ轻链多肽基因增强子的核因子)   0.84   1.01  0.000971     19q13.2   164810 IncytePD:1859449
Hs.180941 VPS41 分拣空泡蛋白41(酵母同源物)   0.63   1  1.26E-05     7p14-p13   159888 IncytePD:2910949
Hs.80618 FLJ20015 假设蛋白   1.43   1  0.000573     17q25   163363 IncytePD:2043391
Hs.75596 IL2RB 白介素2受体,β   0.69   1  0.000688     22q13.1   159942 IncytePD:3936210
Hs.99216 EST,类似于ALU8_人Alu亚家族SX序列   1.49   1  0.000878     15   169148 IncytePD:2285350
Hs.155314 KIAA0095 KIAA0095基因产物   0.75   1  0.000994     16q22.1-q22.3   162213 IncytePD:268942
 UG簇 名称 描述   PN     PT   p值     染色体定位   独特标号 克隆
  Hs.687 CYP4B1 细胞色素P450,亚家族IVB,多肽1   0.85     1   0.00114     1p34-p12   167183 IncytePD:856900
  Hs.75807 PDLIM1 PDZ和LIM结构域1(elfin)   1.63     1   0.00145     10q22-q26.3   160215 IncytePD:2132217
未知   0.66     1   0.00164   159927 IncytePD:2606307
  Hs.41587 RAD50 RAD50(酿酒酵母)同源物   0.57     1   0.00183     5q31   160088 IncytePD:1515426
  Hs.75887 COPA 外被体蛋白复合物,亚基α   0.73     0.99   6.55E-06     1q23-q25   159890 IncytePD:3296228
  Hs.25566 EST   1.3     0.99   8.89E-06     22   168197 IncytePD:948796
  Hs.274 MATK 巨核细胞相关的酪氨酸激酶   0.61     0.99   1.64E-05     19p13.3   160015 IncytePD:1515980
  Hs.347527 SLC20A2 溶质载体家族20(磷酸转运蛋白),成员2   0.66     0.99   0.000333     8p12-q21   159936 IncytePD:2942938
  Hs.242947 DGKI 二酰甘油激酶,iota   0.61     0.99   0.000358     7q32.3-q33   161826 IncytePD:3108609
  Hs.2301 DBH 多巴胺β-羟基酶(多巴胺β-单加氧酶)   2.82     0.99   0.000375     9q34   168202 IncytePD:1294466
  Hs.172148 EST   1.29     0.99   0.000784     5   163746 IncytePD:929090
  Hs.99899 TNFSF7 肿瘤坏死因子(配体)超家族,成员7   0.74     0.99   0.000801     19p13   159817 IncytePD:2017463
  Hs.99236 RGS20 G-蛋白信号的调节物20   0.71     0.98   1.53E-05     8   161959 IncytePD:4711030
  Hs.262958 DKFZP434B044 假定的蛋白DKFZp434B044   1.72     0.98   7.45E-05     16   169042 IncytePD:211389
  Hs.57847 EST,类似于ICE4_人CASPASE-4前体   1.47     0.98   0.000208     11   165194 IncytePD:1362601
  Hs.155227 EPHB4 EphB4   0.7     0.98   0.000257     7q22   168938 IncytePD:2056923
  Hs.72550 HMMR 透明质介导的运动性受体(RHAMM)   0.55     0.98   0.000352     5q33.2-qter   167575 IncytePD:3622417
未知   0.7     0.98   0.000356   166536 IncytePD:1681876
未知   0.64     0.98   0.000536   159962 IncytePD:1570216
  Hs.296348 DLST 二氢硫辛酰胺S-琥珀酸转移酶   0.49     0.98   0.00151     14q24.3   165547 IncytePD:1830335
  Hs.3094 KIAA0063 KIAA0063基因产物   0.66     0.97   9.45E-05     22q13.1   160091 IncytePD:3227603
  Hs.32966 GUCA2B 鸟苷酸环化酶激活物2B(uroguanylin)   0.62     0.97   0.000159     1p34-p33   164851 IncytePD:1806219
未知   0.79     0.97   0.00121   164791 IncytePD:3190386
  Hs.190189 EST   1.33     0.97   0.00172     1   163286 IncytePD:1679304
  Hs.733 EPB42 红细胞膜蛋白条带4.2   0.62     0.96   2.93E-05     15q15-q21   160067 IncytePD:2052032
  Hs.5947 MEL mel转化癌基因-RAB8同源物   0.56     0.96   4.47E-05     19p13.1   160104 IncytePD:1553995
UG簇 名称 描述   PN   PT   p值     染色体定位  独特标号 克隆
Hs.169536 RHAG 恒河猴血型相关的糖蛋白   0.67   0.96   0.000193     6p21.1-p11   164916 IncytePD:2048319
Hs.121521 ABL2 y-abl Abelson鼠白血病病毒癌基因同源物2   0.64   0.96   0.000889     1q24-q25   166612 IncytePD:1536149
Hs.112819 EST   1.41   0.96   0.000924     1   168969 IncytePD:2445101
Hs.277445 DGKZ 二酰甘油激酶,zeta(104kD)   0.75   0.96   0.00194     11p11.2   159822 IncytePD:1875986
Hs.26915 SPTBN2 血影蛋白,β,非红细胞型2   0.63   0.95   0.000154     11q13   160846 IncytePD:1594108
Hs.12773 ACOX3 乙酰-辅酶A氧化酶3,降植烷基(pristanoyl)   0.74   0.95   0.000187     4p15.3   162487 IncytePD:3520054
Hs.79123 KIAA0084 KIAA0084蛋白   0.7   0.95   0.000231     3p25.3-p25.1   159886 IncytePD:2697959
Hs.334841 SELENBP1 硒结合蛋白1   0.54   0.95   0.00043     1q21-q22   169315 IncytePD:2591494
Hs.2969 SKI v-ski禽肉瘤病毒癌基因同源物   1.65   0.95   0.000604     1q22-q24   164039 IncytePD:3283271
Hs.37129 SCNN1B 钠通道,非电压门控型1,β(Liddle综合症)   0.75   0.95   0.00083     16p12.2-p12.1   161191 IncytePD:1866654
Hs.25277 FLJ21065 假定的蛋白FLJ21065   1.25   0.94   7.57E-06     5   164202 IncytePD:2419078
Hs.83155 ALDH3B1 醛脱氢酶3家族,成员B1   0.58   0.94   8.76E-05     11q13   159838 IncytePD:2610218
Hs.24341 TAZ 具有PDZ结合基序的转录共激活物(TAZ)   1.27   0.94   9.26E-05     3q23-q24   164176 IncytePD:2345776
Hs.172458 IDS 艾杜糖2-硫酸酯酶(亨特综合征)   0.74   0.94   0.000322     Xq28   160243 IncytePD:549290
Hs.55279 SERPINB5 丝氨酸(或半胱氨酸)蛋白酶抑制物,成员5   0.62   0.94   0.00158     18q21.3   162215 IncytePD:460034
Hs.209587 EST,稍类似于138022假设蛋白   1.58   0.94   0.00167     11   163251 IncytePD:1875433
Hs.118354 CAT56 CAT56蛋白   0.69   0.93   4.71E-05     6   165027 IncytePD:3518549
Hs.182577 INPP5B 肌醇多磷酸-5-磷酸酶,75kD   0.74   0.93   0.000417     1p34   160074 IncytePD:1291948
Hs.81454 KHK 己酮糖激酶(果糖激酶)   0.65   0.93   0.000434     2p23.3-p23.2   159931 IncytePD:2516508
Hs.76688 CES1 羧酸酯酶1(单核细胞/巨噬细胞丝氨酸脂酶1)   0.18   0.93   0.000591     16q13-q22.1   164490 IncytePD:1813269
Hs.239499 KIAA0185 KIAA0185蛋白   1.36   0.93   0.000722     10   168413 IncytePD:514653
Hs.151738 MMP9 基质金属蛋白酶9(白明胶酶B,92kD)   0.56   0.93   0.000722     20q11.2-q13.1   159912 IncytePD:1274074
Hs.186564 EST   1.38   0.93   0.000816     10   163409 IncytePD:1640094
Hs.198166 ATF2 激活转录因子2   0.68   0.93   0.00106     2q32   160057 IncytePD:2208152
Hs.149957 RPS6KA1 核糖体蛋白S6激酶,90kD,多肽1   0.75   0.93   0.00166     3   160006 IncytePD:1822236
Hs.36566 LIMK1 LIM结构域激酶1   0.6   0.92   4.11E-07     7q11.23   160082 IncytePD:3373632
Hs.50133 EST   1.52   0.92   6.67E-05     4   168567 IncytePD:1214652
 UG簇 名称 描述   PN   PT   p值     染色体定位  独特标号 克隆
  Hs.14051 智人mRNA;cDNA DKFZp434A2417   1.47   0.92   0.000246     10   168381 IncytePD:1431701
  Hs.66731 HOXB13 同源框(homeo box)B13   0.39   0.92   0.000572     17q21.2   159868 IncytePD:1861743
  Hs.85087 LTBP4 潜伏转化生长因子β结合蛋白4   0.68   0.92   0.000854     19q13.1-q13.2   159923 IncytePD:1956831
  Hs.239706 GAB1 GRB2相关的结合蛋白1   0.67   0.92   0.000933     4   162416 IncytePD:5066144
  Hs.77554 cDNA FLJ14967 fis,类似于锌指蛋白84   4   0.92   0.0012     12   165454 IncytePD:1782052
  Hs.14805 SLC21A11 溶质载体家族21(有机阴离子转运蛋白),成员11   1.49   0.92   0.00159     15q26   168293 IncytePD:408522
  Hs.94498 LILRA2 白细胞免疫球蛋白样受体,亚家族A成员2   0.71   0.91   0.000459     19q13.4   161424 IncytePD:3336057
  Hs.799 DTR 白喉毒素受体(肝素-结合EGF-样生长因子)   0.61   0.91   0.000811     5q23   167412 IncytePD:1862257
  Hs.28274 智人cDNA:FLJ22049 fis,克隆HEP09444   1.47   0.91   0.000856     8   163989 IncytePD:2155690
  Hs.8358 FLJ20366 假定的蛋白FLJ20366   1.46   0.91   0.000952     8p22-q22.3   164145 IncytePD:3361529
  Hs.293264 EST   1.38   0.91   0.00107     11   168371 IncytePD:829521
  Hs.37953 FANCC 凡科尼贫血,补充组C   0.62   0.91   0.00108     9q22.3   160036 IncytePD:3669589
  Hs.250671 FLJ10140 假定的蛋白FLJ10140   1.47   0.91   0.00142     22q13   168397 IncytePD:642133
  Hs.72964 MKRN3 Makorin,环指蛋白,3   0.63   0.91   0.00151     15q11-q13   164803 IncytePD:3181021
  Hs.80683 MTRF1 线粒体的翻译释放因子1   1.24   0.91   0.00161     13q14.1-14.3   160533 IncytePD:1462246
  Hs.79516 BASP1 脑丰富的,膜附着的信号蛋白1   0.62   0.9   2.60E-05     5p15.1-p14   159882 IncytePD:4008301
  Hs.87539 ALDH3B2 醛脱氢酶3家族,成员B2   0.68   0.9   2.96E-05     11q13   166071 IncytePD:966447
  Hs.38586 HSD3B1 羟基-δ-5-类固醇脱氢酶   0.64   0.9   0.000159     1p13.1   164787 IncytePD:182802
  Hs.67688 EST   0.59   0.9   0.000311     6   162920 IncytePD:2789893
  Hs.105584 RPS6KA4 核糖体蛋白S6激酶,90kD,多肽4   1.8   0.9   0.000409     11q11-q13   168189 IncytePD:2110163
  Hs.24719 MAP-1 凋亡调节蛋白1   1.45   0.9   0.00108     14q32   168618 IncytePD:1967338
  Hs.6232 KIAA0764 KIAA0764基因产物   1.36   0.9   0.00117     2pter-p25.1   163561 IncytePD:2043486
  Hs.73792 CR2 补体成分(3d/Epstein Barr病毒)受体2   0.59   0.9   0.00181     1q32   160032 IncytePD:3055203
  Hs.134342 LOC55915 针对睾丸特异的阿霉素敏感蛋白的TASP   1.44   0.9   0.00185     7q31.1-7q31.33   163421 IncytePD:1538396
  Hs.33074 智人,克隆IMAGE:3606519,mRNA,部分cds   1.36   0.89   0.000275     8   168589 IncytePD:1431969
  Hs.83795 IRF2 干扰素调节因子2   0.54   0.89   0.000848     4q34.1-q35.1   161188 IncytePD:2174666
  Hs.81217 FZD2 蜷缩(果蝇属)同源物2   0.57   0.88   1.46E-06     17q21.1   160028 IncytePD:2214002
 UG簇 名称 描述   PN   PT   p值     染色体定位   独特标号 克隆
  Hs.92357 GALK1 乳糖激酶1   5.62   0.88   3.65E-05     17q24   169675 IncytePD:1215248
  Hs.119273 KIAA0296 KIAA0296基因产物   0.53   0.88   6.98E-05     16p13.13-16p12.3   159951 IncytePD:3422646
  Hs.194148 YES1 v-yes-1 Yamaguchi肉瘤病毒癌基因同源物1   0.64   0.88   9.16E-05     18p11.31-p11.21   159875 IncytePD:1887736
  Hs.37054 EFNA3 ephrin-A3   0.69   0.88   0.000423     1q21-q22   161846 IncytePD:4178495
  Hs.23643 MST4 丝氨酸/苏氨酸蛋白激酶MASK   0.65   0.88   0.00108     X   163410 IncytePD:2793922
  Hs.266959 HBG1 血红蛋白,γA   5.75   0.87   2.57E-05     11p15.5   168326 IncytePD:2156647
  Hs.53478 智人cDNA FLJ12366 fis,克隆MAMMA1002411   1.34   0.87   5.78E-05     21   168383 IncytePD:1366043
  Hs.283822 RHD 恒河猴血型,D抗原   0.69   0.87   6.17E-05     1p36.2-p34.1   164821 IncytePD:1668024
  Hs.118804 ENO3 烯醇化酶3,(β,肌肉)   0.4   0.87   8.49E-05     17pter-p11   164468 IncytePD:1719955
  Hs.772 GYS1 糖原合成酶1(肌肉)   0.59   0.87   0.000112     19q13.3   160222 IncytePD:172916
  Hs.77448 ALDH4A1 醛脱氢酶4家族,成员A1   0.66   0.87   0.00135     1p36   166147 IncytePD:831794
  Hs.29640 RECK 回复诱导的、富含半胱氨酸的蛋白,具kazal基序   1.42   0.87   0.00172     9p13-p12   168569 IncytePD:2058483
  Hs.93780 EST   1.12   0.87   0.00176   164377 IncytePD:2654539
  Hs.11713 ELF5 E74-样因子5(ets结构域转录因子)   0.7   0.87   0.0018     11p13-p15   161000 IncytePD:2785892
  Hs.97087 CD3Z CD3Z抗原,zeta多肽(TiT3复合物)   0.6   0.85   0.000152     1q22-q23   160043 IncytePD:3227409
  Hs.118795 FLJ10008 假定的蛋白FLJ10008   1.11   0.82   0.000317     14q22.1-q22.3   166653 IncytePD:2316425
  Hs.17384 EST   1.16   0.82   0.000347     4   163225 IncytePD:2293931
  Hs.1019 PTHR1 甲状旁腺激素受体1   0.66   0.82   0.00102     3p22-p21.1   160109 IncytePD:1375235
  Hs.77667 LY6E 淋巴细胞抗原6复合物,基因座E   0.56   0.82   0.00145     8q24.3   162145 IncytePD:1472042
  Hs.4988 智人克隆24711 mRNA序列   1.26   0.81   0.000274     2   160165 IncytePD:2061405
  Hs.10669 DDEF1 发育分化增强因子1   1.14   0.81   0.000896     8q24.1-q24.2   164026 IncytePD:2507108
  Hs.5353 CASP10 Caspase 10,凋亡相关的半胱氨酸蛋白酶   1.01   0.81   0.00108     2q33-q34   164978 IncytePD:3984879
  Hs.33102 TFAP2B 转录因子AP-2β   0.58   0.81   0.00122     6p12   159845 IncytePD:2816550
  Hs.144633 DKFZp434F232 假定的蛋白DKFZp434F2322   1.22   0.8   0.00132     17q24   163237 IncytePD:1473265
UG簇 名称 描述   PN   PT   p值     染色体定位   独特标号 克隆
Hs.247423 ADD2 内收蛋白2(β)   0.55   0.79   0.000141     2p14-p13   162687 IncytePD:2112288
Hs.323712 KIAA0615 KIAA0615基因产物   1.3   0.79   0.00026     16q11.2-q12.2   163625 IncytePD:1217554
Hs.120360 PLA2G6 磷脂酶A2,组VI(胞质型,不依赖于钙的)   0.57   0.79   0.000778     22q13.1   160058 IncytePD:1849872
Hs.73800 SELP 选择蛋白P(颗粒膜蛋白140kD,抗原CD62)   0.65   0.79   0.00156     1q22-q25   160049 IncytePD:3688202
Hs.65135 KIAA0913 KIAA0913蛋白   1.16   0.78   0.00153     10   162465 IncytePD:2752015
未知   0.99   0.77   0.000357   161881 IncytePD:2895226
Hs.274293 智人mRNA;cDNA DKFZp761G1111   1.28   0.77   0.000542   165504 IncytePD:530360
Hs.153203 MDFI MyoD家族抑制物   0.46   0.75   0.000138     6p21   163880 IncytePD:2645911
Hs.103393 EST   1.52   0.75   0.0014     16   163227 IncytePD:291636
Hs.153053 CD37 CD37抗原   0.55   0.74   0.00022     19p13-q13.4   160033 IncytePD:3041162
Hs.98738 GRTH 促性腺素调节的睾丸RNA解旋酶   1.06   0.72   0.000857     11q24   166657 IncytePD:2404557
Hs.180570 CYP4F12 细胞色素P450同工型4F12   0.55   0.72   0.0014     19p13.1   167601 IncytePD:1985566
Hs.50373 EST   5.25   0.7   2.91E-05     9   165500 IncytePD:372922
Hs.131705 EST   1.01   0.7   0.00128     8   165368 IncytePD:1921768
Hs.23672 LRP6 低密度脂蛋白受体相关蛋白6   0.3   0.69   7.35E-05     12p11-p13   162040 IncytePD:4290851
表4.用于预测转移的30个显著基因及其在预测模型中计算多因子L值所需的值
 UG簇 名称 描述 PN PT p值  染色体定位 独特标号 克隆
  Hs.313 OPN 骨桥蛋白 1.07 3.29 0.00122  4 161923 IncytePD:4327691
  Hs.69707 HCGII-7 HCGII-7蛋白 1.07 2.85 0.000512  6 161462 IncytePD:1656490
  Hs.177687 AKR1C4 醛-酮还原酶家族1,成员C4 0.58 2.11 0.000939  10p15-p14 161753 IncytePD:5033671
未知 0.82 1.74 0.0018 161371 IncytePD:3421817
  Hs.276916 NR1D1 核受体亚家族1,组D,成员1 0.74 1.71 0.00181  17q11.2 166707 IncytePD:1904760
  Hs.211569 GPRK5 G蛋白-偶联受体激酶5 0.99 1.69 0.00147  10q24-qter 161133 IncytePD:1418741
  Hs.75573 CENPE 着丝点蛋白E(312kD) 0.82 1.65 1.00E-06  4q24-q25 160128 IncytePD:3081067
  Hs.283664 ASPH 天冬氨酸β-羟基酶 0.7 1.56 0.000576  8q12.1 160084 IncytePD:3693273
  Hs.296371 RAB28 RAB28,成员RAS癌基因家族 1.07 1.5 0.000833  4p16.1 160699 IncytePD:1457948
  Hs.274313 IGFBP6 胰岛素样生长因子结合蛋白6 0.87 1.21 0.00192  12q13 160319 IncytePD:1968126
  Hs.34526 TYMSTR G蛋白-偶联受体 0.89 1.18 0.00101  3p21 161635 IncytePD:2610374
  Hs.222 ITGA9 整联蛋白,α9 0.69 1.16 3.74E-06  3p21.3 160135 IncytePD:2487318
  Hs.63984 CDH13 钙粘蛋白13,H-钙粘蛋白 0.72 1.13 0.000103  16q24.2-q24.3 160122 IncytePD:1404153
  Hs.75596 IL2RB 白介素2受体,β 0.69 1 0.000688  22q13.1 159942 IncytePD:3936210
  Hs.55279 SERPINB5 丝氨酸(或半胱氨酸)蛋白酶抑制物,成员5 0.62 0.94 0.00158  18q21.3 162215 IncytePD:460034
  Hs.118354 CAT56 CAT56蛋白 0.69 0.93 4.71E-05  6 165027 IncytePD:3518549
  Hs.182577 INPP5B 肌醇多磷酸-5-磷酸酶,75kD 0.74 0.93 0.000417  1p34 160074 IncytePD:1291948
  Hs.81454 KHK 己酮糖激酶(果糖激酶) 0.65 0.93 0.000434  2p23.3-p23.2 159931 IncytePD:2516508
Hs.76688 CES1 羧酸酯酶1(单核细胞/巨噬细胞丝氨酸脂酶1) 0.18 0.93 0.000591 16q13-q22.1 164490 IncytePD:1813269
  Hs.151738 MMP9 基质金属蛋白酶9(白明胶酶B,92kD) 0.56 0.93 0.000722  20q11.2-q13.1 159912 IncytePD:1274074
UG簇 名称 描述 PN PT  p值 染色体定位 独特标号 克隆
Hs.94498 LILRA2 白细胞免疫球蛋白样受体,亚家族A成员2 0.71 0.91  0.000459 19q13.4 161424 IncytePD:3336057
Hs.83795 IRF2 干扰素调节因子2 0.54 0.89  0.000848 4q34.1-q35.1 161188 IncytePD:2174666
Hs.81217 FZD2 蜷缩(果蝇属)同源物2 0.57 0.88  1.46E-06 17q21.1 160028 IncytePD:2214002
Hs.194148 YES1 v-yes-1 Yamaguchi肉瘤病毒癌基因同源物1 0.64 0.88  9.16E-05 18p11.31-p11.21 159875 IncytePD:1887736
Hs.23643 MST4 丝氨酸/苏氨酸蛋白激酶MASK 0.65 0.88  0.00108 X 163410 IncytePD:2793922
Hs.118804 ENO3 烯醇化酶3,(β,肌肉) 0.4 0.87  8.49E-05 17pter-p11 164468 IncytePD:1719955
Hs.153203 MDFI MyoD家族抑制物 0.46 0.75  0.000138 6p21 163880 IncytePD:2645911
Hs.153053 CD37 CD37抗原 0.55 0.74  0.00022 19p13-q13.4 160033 IncytePD:3041162
Hs.180570 CYP4F12 细胞色素P450同工型4F12 0.55 0.72  0.0014 19p13.1 167601 IncytePD:1985566
Hs.23672 LRP6 低密度脂蛋白受体相关蛋白6 0.3 0.69  7.35E-05 12p11-p13 162040 IncytePD:4290851
实施例2:易患肝细胞性癌症体质的预测
1.材料与方法
a)患者和组织样本
预先通知明尼苏达大学研究院评论部(Institution Review Board)并征得同意,并按照规程收集外科手术样本。从59位患晚期慢性肝脏疾病并在1995-2001间接受了肝脏移植手术的患者上获取肝脏样本。从8位肝脏供者上获取正常肝脏样本作为对照。这些样本的收集主要是通过美国明尼苏达大学肝脏组织获取和分配系统(Liver TissueProcurement and Distribution System,LTPADS)来进行。64位患者的肿瘤和相匹配的非肿瘤的肝脏样本,通过LTPADS程序或中国复旦大学肝癌研究所而获得。一旦获得冰冻样本,立即在-80℃组织贮藏库中冻存。
b)cDNA芯片
冰冻样本的总RNA抽提采用Trizol试剂(Invitrogen,Gaithersburg,MD)并按照厂商提供的操作程序进行。抽提后的RNA质量控制采用分光光度测量方法,并在1%浓度的琼脂糖凝胶中观察特异性的28S和18S rRNA片段。每一份RNA样本等量分装在管子中,并在-80℃保存。对于cDNA芯片的共同对照,把8个正常肝脏的总RNA样本混合在一起,并均分到每个槽(tub)中。
从NIH的NCI高级技术中心购买cDNA芯片。这些人类UniGem v2.0芯片包含了9180个cDNA克隆,这些克隆被定位于8281个独特UniGene簇(基于2001年2月28日出版的Hs Unigene Build#131),还包括了122个Incyte的EST克隆(Incyte Genomics,Palo Alto,CA)。杂交方法采用NCI建立的优化程序(Wu等人,Oncogene 20:3674-3682,2001;Ye等人,Nature Med.9:416-423,2003)。与芯片杂交后的荧光图象采用GenePix4000扫描仪和GenePix Pro软件(Axon Instruments,Foster City,CA)获得。按照推荐的关于芯片试验最低信息标准(Minimum Information About a Microarray Experiment Standards)(Brazma A等人,NatGenet 2001)所收集的详细信息,可通过NCBI的Gene Expression Ominibus公共数据库来获得。
c)统计分析
采用相关基因表达比率(Cy5/Cy3),进行分级聚类分析来检测在几个基因列表和两个风险组之中表达方式的相关性。聚类分析采用Cluster软件并用Tree View软件来显现(Eisen等人,同上)。在以中值为中心进行归一化处理后,进行分级聚类。
分析采用BRB ArrayTools进行。BRB ArrayTools是由国家癌症研究所的生物测定研究分部的Richard Simon博士和Amy Peng建立的。对来自每个芯片上的数据进行测量是为了使数据标准化并进行芯片内比较。分类对比工具的使用是为了比较先前定义的风险组。F检验是对双样本分组中对比数据t检验的概括。用归一化的cDNA对数比率,采用分类对比工具分别计算每个基因的F检验。这个工具进行分组的随机排列。在这些随机排列的基础上,这个工具计算列表中每个基因相关的排列p值。
在采用几种运算方法来分析基因表达数据的基础上,样本被分类到两个预定的类别之一,这些方法包括复合变量预测、最邻近K值预测或支持载体机器预测(support vectormachine predictor)。这种预测的建立包括两个步骤。首先,进行标准的双样本t检验,用来鉴别出在两组中表达比率对数值有显著性差异(达到0.001水平)的基因。其次,每个样本的不同表达基因的对数表达比率被合并到一个复合变量中;这个复合变量可用于基本分类预测。样本i的复合变量i定义如下:
c i = Σ j t j x ij ,
式中,tj是基因j在两个组分类对比的t统计参数。xij是在样本i中测得的基因j的对数比率,总和是针对所有差异表达的基因。
我们通过计算如下的线性组合来预测新样本的分类:
                          L=∑iti*(xi-mi)。
式中ti是基因i的t值,xi是在待分类的新样本中基因i的对数比率,mi是基因i在两个分类中的中点值。变量i包括在原始分析中所有显著的基因。当L是阳性时,新样本应被归类到第一个表型标记物,而当L是阴性时,新样本应归类到第二个表型标记物。
d)EpCAM的表达和体外抑制
EpCAM的表达采用半定量PCR来评估。总RNA用随机引物(Promega)进行反转录以生成单链cDNA,并按照厂商的操作程序使用Superscript II反转录酶(Invitrogen)。PCR的扩增采用QuantumRNA 18S内在标准(Ambion),按照厂商的操作程序使用HotStarTaq DNA聚合酶(Qiagen)。引物的序列如下:正向,5′-TGC CGC AGC TCA GGAAGA ATG TGT-3′(SEQ ID NO:6);反向,5′-CAT CAT TCT GAG TTT TTT GAG AAG-3′(SEQ ID NO:7)。
用siRNA来抑制EpCAM的表达。siRNA由Qiagen合成。EpCAM的有义链和反义链为:有义链:5′-GUU UGC GGA CUG CAC UUC AdTdT-3′(SEQ ID NO:8);反义链:5′-ACG UGA CAC GUU CGG AGA AdTdT-3′(SEQ ID NO:11)。siRNA的转染根据厂商操作程序,使用TransIT-TKO转染试剂(Mirus)进行,并在每个实验中使用200nm吸收波长的siRNA双链体。细胞生长情况根据厂商所述使用Cell Counting Kit-8(Dojindo MolecularTech.)。实验重复三次。
2.结果
通过含有9128个人类cDNA克隆的芯片,对59位患有慢性肝脏疾病(CLD)患者和14位患有肝细胞癌的患者的肝脏样本中的基因表达图谱和8没有疾病的正常肝脏样本中的基因表达图谱进行比较。CLD样本中包括7例B型肝炎(HBV)、11例C型肝炎(HCV)、3例血色素沉着症(HHC)、5例Wilson氏病(WD)、10例酒精肝疾病(ALD)、16例原发性胆管硬化(PBC)和7例自体免疫性肝炎(AIH)。用2000个分类标志物的随机排列进行监督的单变量F检验运算,来搜寻区分这7组CLD样本的基因。这个分析得到了共计489个显著基因(p<0.o005)。对489个基因的分级聚类分析(如Eisen等描述,同上)显示,这7种肝脏疾病组可分为两个大类,一类主要由HBV、HCV、HHC和WD的样本构成,另一类主要包括PBC、ALD和AIH的样本。这些结果提示,HBV、HCV、HHC和WD相互之间的相关性要比它们与PBC、ALD、或AIH构成一组时更强。通过特异性反映病因的分子特征对这些样本的分类结果,恰巧与它们发展成肝细胞癌症的风险相互关联,除了WD样本以外(数据没有显示)。为了进一步确定这些组别之间的差异程度,通过进行“省略单因素”的(“leave-one-out”)交叉验证和2000个随机排列测试,在7个组别中进行复合变量分析,在此基础上进行t检验。21个模拟试验共发现了500个复合基因。对这些基因的分级聚类结果与F检验的结果是一致的(数据没有显示)。与之相符的是,PBC、ALD或AIH显著不同于HBV、HCV、HHC或WD,但是病因间的差异不是很明显(数据没有显示)。这表明,WD样本属于高风险小组,至少对与该集合而言。对上述结果的解释是,按照发展成肝细胞癌症的能力来区分低风险组和高风险组的基因,占据了分子特征优势,而反映个体病因的基因则不占优势。
在HBV/HCV/HHC/WD样本中共同失调(disregulated)的但在ALD/PBC/AIH中不失调的基因,被假设为与HCC的分子特征更相关。为了全面地搜寻这个基因集,用“省略单因素”的(“leave-one-out”)交叉验证和对高风险组(HBV/HCV/HHC/WD)和低风险组(ALD/PBC/AIH)进行分类标记物测试的2000个随机排列测试,在P值小于0.001的情况下,进行了最邻近K值分析(K=3)(3NN)或支持载体机器预测(SVM)运算,这个计算策略与我们最近的研究是相似的(Ye等人,同上)。这种分析产生了包括556个显著基因的复合分类器,它将这两个组别分得很好。它提供了在这些组别中显著的分类预测方法,采用3NN方法的整体正确率为78%,采用SVM方法整体正确率为86%,并且交叉验证地错误分类比率明显低于随机预期值(p<0.0005)(数据没有显示)。然而,随机对这些样本分类会产生统计上不显著的分类(数据没有显示)。
令人注意的是,在556个基因构成的集合中的许多基因,可在被分析的14例HCC中发现(数据未示出)。为了区分在高风险组中和14例HCC中共同失调的基因,将14例HCC样本和高风险组的样本混合在一起,然后采用2000个随机排列,在P值小于0.001情况下,用3NN运算方法与低风险组进行比较。这个分析发现了416个基因,其中273个基因可在556个基因的集合中发现(49%重叠)。这些结果提示,大约一半能区分高风险组和低风险组的特征基因存在HCC样本中。为了确定是否273个基因的集合(表5)是肿瘤的共同特征,我们通过3NN和SVM预测方法把这基因集应用于两个独立的HCC基因表达图谱。一个集合包括来自24个HCC样本,并与上述使用过相同的正常肝脏对照进行比较;另一集合包括50个HCC样本,并与它配对的非癌症肝脏组织进行比较(Ye等人,同上)。在分类中采用SVM方法,273个基因特征提供了更高的适合度,24例HCC样本的整体正确率为92%,50例HCC样本的整体正确率为94%(数据没有显示)。与556个基因的集合相比,这个方法提高了整体性能。与之相符的是,非重叠的283个基因的集合不能提供任何令人满意的结果。因为绝大多数HCC相关基因在非重叠基因组中被排除了,283个基因的绝大多数或许属于病因外的特征。此外,从HBV/HCV/HHC/WD和ALD/PBC/AIH/HCC对比中选取的383个重叠基因,对于两个独立HCC组不能得出有意义的分类,其整体预测比率低于50%(随机事件)。273个基因在多种肝脏样本中可检测到,这些样本来自两个HBV的患者和来自扩散区域至少5cm直径的肝脏不同部分。来自两个患者不同肝脏部位的273个基因的图谱几乎完全相同(数据没有显示)。此外,参数p值最小(p<0.000001)的前25个基因是从273个基因的集合中选出的。这个集合产生了与273个基因的集合相似的结果(数据未示出)。综合起来,这些结果表明,273个基因的集合包含了绝大多数与HCC相联系的基因,并与HCC进展有关,而且这些基因在患病肝脏的主实中是大范围扩散的而不是局限于原地保留。
为了检测273个基因的集合是否是人类其他肿瘤的常规标志物,运用SVM方法将该特征中的基因参数应用于从几个公共芯片数据库数据:98例肝细胞癌症(HCC)、53例肺癌、89例胃腺癌、37例软组织肿瘤、39例乳腺癌和27例弥漫性大B细胞淋巴瘤(DLBCL)(Alizadeh等人,同上;Perou等人,同上;Garber等人,Proc.NatlAcad.Sci.U.S.A.98:13784-13789,2001)。在273个基因的集合对额外的98例HCC样本表现良好(80%的样本符合这个特征)的同时,97%的乳腺癌(39例)和78%的DLBCL病例也共享类似的特征。相反,绝大多数来自肺、软组织和胃的肿瘤样本与这些特征的符合率很低(占所有病例的6-30%)(数据未示出)。作为对照,283个基因的集合(非HCC关联基因)也不能对这些样本提供令人满意的预测。由此认为,分类器中的HCC关联基因,在乳腺癌和DLBCL中似乎是共同失调的,但是在肺腺癌、软组织肿瘤和胃腺癌则没有失调。
上述研究表明,与HCC发病相关的基因可能存在273个基因的集合中。例如,对于在高风险组表达显著上升而在风险组则不上升的基因,可作为促进细胞生长的癌基因。为了验证这个“证据原则”(“proof-of-principle”)的假设,我们选择了273基因列表中位于顶部的主要基因。这个基因被鉴别为EpCAM,即肿瘤相关的钙离子传导信号1(TACSTD1,Hs.692),它在高风险组中表达平均提高了3.6倍,但在低风险组中仅为1.7倍(图6a),在HCC中的表达情况类似(数据未示出)。在高风险CLD样本中,EpCAM的高表达可通过定量RT-PCR分析来确证(图6b)。EpCAM在Hep3B细胞中为高表达,但在Huh1和Huh4细胞中的表达水平相对较低(图6c),这总体上与细胞的生长率相关(图6d)。此外,用对EpCAM特异的两个不同siRNA寡链来抑制EpCAM表达,结果导致Hep3B细胞的生长明显受到抑制(图6f)。相反,作为对照的siRNA寡链却没有这种效应(图6e,数据未示出)。这些结果表明,EpCAM可以通过促进肿瘤细胞生长来提供致癌特性。
273个显著基因,其基因符号、染色体图谱位置和UG簇标(识)号列于表5。
表5.用于预测慢性肝病患者患HCC可能性的273个显著基因及其在预测模型中计算多因子L值所需的值
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
    1   -7.28  p<0.000001     0.603     0.903  160198 cofilin 2(肌肉)    Hs.180141    CFL2     14q
    2   -6.53  p<0.000001     0.985     1.607  168023 IgG的Fc片段,高亲和力Ia,(CD64)的受体    Hs.77424    FCGR1A     1q21.2-q21.3
    3   -6.46  p<0.000001     0.643     1.175  162315 钙通道,电压依赖型,β3亚基    Hs.250712    CACNB3     12q13
    4   -6.18  p<0.000001     0.688     1.112  160302 肌凝蛋白IB    Hs.121576    MYO1B     2q12-q34
    5   -6.16  p<0.000001     0.473     1.161  169417 血蓝蛋白(铁氧化酶)    Hs.296634    CP     3q23-q25
    6   -6.1  p<0.000001     0.876     1.18  161756 白蛋白    Hs.184411    ALB     4q11-q13
    7   -6.04  p<0.000001     0.719     1.224  162290 UDP-N-乙酰基葡糖胺焦磷酸化酶1    Hs.21293    UAP1     1q23.1
    8   -6.01  p<0.000001     0.534     1.141  162538 未知[智人],mRNA序列    Hs.367982     16
    9   -5.94  p<0.000001     0.491     0.714  168634 染色体20开放阅读框3    Hs.22391    C20orf3     20p11.22-p11.21
    10   -5.93  p<0.000001     0.756     1.276  164136 乙酰-辅酶A脱氢酶,长链    Hs.1209    ACADL     2q34-q35
    11   -5.9  p<0.000001     0.864     1.181  163874 KIAA0092基因产物    Hs.151791    KIAA0092     11q21
    12   -5.88  p<0.000001     0.728     0.925  163096 CGI-26蛋白    Hs.24332    CGI-26     12p12.3
    13   -5.73  p<0.000001     0.616     1.133  160233 双特异性酪氨酸-(Y)-磷酸化调节的激酶3    Hs.38018    DYRK3     1q32
    14   -5.67  p<0.000001     0.786     1.071  160436 类似于假定的蛋白PRO2831[智人],mRNA序列    Hs.406646     15
    15   -5.65  p<0.000001     0.761     1.382  160795 肝白血病因子    Hs.433707    HLF     17q22
    16   -5.61  p<0.000001     0.314     0.798  161944 补体成分9    Hs.1290    C9     5p14-p12
    17   -5.6  p<0.000001     0.506     0.703  167718 ATP-结合盒,亚家族A(ABC1),成员1    Hs.211562    ABCA1     9q31.1
    18   -5.58  p<0.000001     0.65     0.912  168437 KIAA0843蛋白    Hs.26777    KIAA0843     5q32
    19   -5.57  p<0.000001     0.843     1.087  162884 胞内膜相关的不依赖于钙的磷脂酶A2γ    Hs.44198    IPLA2(GAMM A)     7q31
    20   -5.48  p<0.000001     0.657     1.065  166910 SIPL蛋白    Hs.64322    SIPL     2p25.3
    21   -5.46  1.00E-06     0.544     1.003  166192 EST,很类似于MT1B_人金属硫蛋白-IB(MT-1B)[智人]    Hs.36102     16
    22   -5.46  1.00E-06     0.46     0.832  164779 N-乙酰转移酶2(芳基胺N-乙酰转移酶)    Hs.2    NAT2     8p22
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
  23   -5.44   1.00E-06     0.707     1.191  166252 CD5抗原样蛋白(清除受体富含半胱氨酸的家族)    Hs.52002    CD5L   1q21-q23
  24   -5.44   1.00E-06     0.861     1.512  162878 EST,很类似于α1型XI胶原蛋白,同工型B前原蛋白;胶原蛋白XI,α-1多肽[智人][H.sapiens]    Hs.7967   1
  25   -5.42   1.00E-06     0.767     1.181  164656 N-嵌合蛋白(AA 1-299)[智人],mRNA序列    Hs.385460   2
  26   -5.42   2.00E-06     0.803     1.296  161780 Incyte EST   3441835(IncytePD)
  27   -5.38   1.00E-06     0.352     0.745  160174 补体成分6    Hs.1282    C6   5p13
  28   -5.35   2.00E-06     0.464     0.875  160280 羧肽酶B2(血浆,羧肽酶U)    Hs.75572    CPB2   13q14.11
  29   -5.34   2.00E-06     0.779     0.978  163144 KIAA1724蛋白    Hs.127243    KIAA1724   2p23.3
  30   -5.33   2.00E-06     0.694     1.361  169477 甘露糖受体,C型1    Hs.75182    MRC1   10p13
  31   -5.26   2.00E-06     0.669     0.896  162659 RAB6A,成员RAS癌基因家族    Hs.5636    RAB6A   11q13.3
  32   -5.25   2.00E-06     0.768     1.052  161138 丝氨酸(或半胱氨酸)蛋白酶抑制物,clade A(α-1抗蛋白酶,抗胰蛋白酶),成员1    Hs.297681    SERPINA1   14q32.1
  33   -5.25   3.00E-06     0.685     1.043  169635 EST,稍类似于广泛转录的四三合肽(tetratricopeptide)重复基因,Y染色体;Y染色体上广泛转录的TPR基因[智人][H.sapiens]    Hs.87980   2
  34   -5.21   3.00E-06     0.598     0.815  162745 溶质载体家族1(对神经元/上皮高亲和力谷氨酸转运蛋白,系统Xag),成员1    Hs.91139    SLC1A1   9p24
  35   -5.2   3.00E-06     0.371     0.725  160366 泛素特异的蛋白酶10    Hs.78829    USP10   16q24.1
  36   -5.16   3.00E-06     0.515     0.932  166426 蛋白S(α)    Hs.64016    PROS1   3p11-q11.2
  38   -5.14   4.00E-06     0.627     1.044  162301 白介素1受体辅助蛋白    Hs.173880    IL1RAP   3q28
  39   -5.11   4.00E-06     0.534     0.919  167159 类固醇-5-α-还原酶,α多肽2(3-氧代-5α-类固醇δ4-脱氢酶α2)    Hs.1989    SRD5A2   2p23
  40   -5.04   5.00E-06     0.474     0.9  167129 金属硫蛋白1L    Hs.380778    MT1L   16q13
  41   -5.02   5.00E-06     0.87     2.237  163633 Ieptin受体    Hs.226627    LEPR   1p31
  42   -5.02   5.00E-06     0.506     1.137  162311 丝氨酸(或半胱氨酸)蛋白酶抑制物,clade C(抗凝血酶),成员1    Hs.75599    SERPINC1   1q23-q25.1
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
  43   -5.01   6.00E-06     0.622     1.035  166915 假定的蛋白FLJ12666    Hs.23767    FLJ12666   1p34.2
  44   -5   6.00E-06     0.741     1.14  163572 假定的蛋白DKFZp564D0462    Hs.44197    DKFZP564D0 46   6q23.1-q24.3
  45   -5   6.00E-06     0.842     1.141  163676 肌醇(myo)-1(或4)-单磷酸酶1    Hs.171776    IMPA1   8q21.13-q21.3
  46   -5   6.00E-06     0.903     1.145  163549 EST,稍类似于ARF蛋白[智人][H.sapiens]    Hs.422650   17
  47   -4.99   6.00E-06     0.357     0.608  168690 促皮质素释放激素结合蛋白    Hs.115617    CRHBP   5q11.2-q13.3
  48   -4.99   6.00E-06     0.52     0.846  169399 怀孕区蛋白    Hs.74094    PZP   12p13-p12.2
  49   -4.98   6.00E-06     0.681     0.994  162636 信号识别颗粒54kDa    Hs.49346    SRP54   14q13.1
  50   -4.98   6.00E-06     0.633     0.933  166021 肌醇多磷酸-5-磷酸酶,145kDa    Hs.155939    INPP5D   2q36-q37
  51   -4.93   7.00E-06     0.972     1.427  159896 神经前体细胞表达的,发育下调型4    Hs.1565    NEDD4   15q
  52   -4.92   8.00E-06     0.73     1.087  163778 N-脱乙酰酶/N-磺基转移酶(乙酰肝素葡糖氨基))1    Hs.20894    NDST1   5q32-q33.1
  53   -4.9   8.00E-06     0.705     1.067  159807 肾的含有锚蛋白重复的蛋白    Hs.77546    KANK   9p24.3
  54   -4.9   8.00E-06     0.307     0.676  167252 羟基前列腺素脱氢酶15-(NAD)    Hs.77348    HPGD   4q34-q35
  55   -4.88   9.00E-06     0.724     1.417  163254 脂酶A,溶酶体酸,胆固醇酯酶(Wolman氏疾病)    Hs.85226    LIPA   10q23.2-q23.3
  56   -4.87   1.00E-05     0.576     0.923  162307 蛋白质-L-异天冬氨酸(D-天冬氨酸)O-甲基转移酶    Hs.79137    PCMT1   6q24-q25
  57   -4.87   9.00E-06     0.64     1.076  164602 补体成分1,s亚组分    Hs.169756    C1S   12p13
  58   -4.83   1.10E-05     1.057     1.872  164576 叉头盒O1A(横纹肌肉瘤)    Hs.170133    FOXO1A   13q14.1
  59   -4.8   1.20E-05     0.78     1.259  165739 假定的基因CG018    Hs.22174    CG018   13q12-q13
  60   -4.8   1.20E-05     0.719     1.091  167087 溶质载体家族31(铜转运蛋白),成员2    Hs.24030    SLC31A2   9q31-q32
  61   -4.79   1.20E-05     0.716     0.987  165277 磷酸化酶,糖原;肝(Hers氏疾病,糖原储存疾病型VI)    Hs.771    PYGL   14q21-q22
  62   -4.7   1.70E-05     0.766     1.43  161801 溶质载体家族10(钠/胆汁酸共转运蛋白家族),成员1    Hs.952    SLC10A1   14q24.1
  63   -4.7   1.80E-05     0.355     0.917  162617 FK506结合蛋白5    Hs.7557    FKBP5   6p21.3-21.2
  64   -4.68   1.80E-05     0.918     1.294  163597 假定的蛋白FLJ20366    Hs.8358    FLJ20366   8q23.2
  65   -4.67   1.90E-05     0.598     0.848  160741 醛脱氢酶8家族,成员A1    Hs.18443    ALDH8A1   6q23.2
  86   -4.67   1.90E-05     0.392     0.742  167158 补体成分5    Hs.1281    C5   9q32-q34
  67   -4.65   2.00E-05     1.003     1.661  165565 磷脂酰肌醇(4,5)二磷酸5-磷酸酶同源物;磷脂酰肌    Hs.25156    PPI5PIV   9q34.3
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
醇多磷酸5-磷酸酶型IV
  68   -4.65   2.00E-05     0.996     1.169   160476 可能是在息肉病1中缺失的鼠同源物    Hs.178112      DP1  5q22-q23
  69   -4.65   2.50E-05     0.93     1.204   161778 蛋白磷酸酶1D镁依赖型,δ同工型    Hs.100980      PPM1D  17q23.2
  70   -4.62   2.20E-05     0.875     1.013   164997 N-乙酰半乳糖胺酶,α-    Hs.75372      NAGA  22q13-qter
  71   -4.62   2.30E-05     1.04     1.351   160731 组蛋白脱乙酰酶6    Hs.6764      HDAC6  Xp11.23
  72   -4.62   2.30E-05     0.98     1.326   168995 环指蛋白13    Hs.6900      RNF13  3q25.1
  73   -4.6   2.40E-05     0.536     0.805   163500 凝血因子XI(血浆凝血激酶前体)    Hs.1430      F11  4q35
  74   -4.59   2.50E-05     0.359     0.544   159810 C-型凝集素BIMLEC前体    Hs.2441      BIMLEC  2q24.2
  75   -4.57   2.60E-05     0.912     1.66   168655 补体成分1,q亚组分,β多肽    Hs.8986      C1QB  1p36.3-p34.1
  76   -4.57   2.70E-05     0.529     1.031   166497 组氨酸氨裂解酶    Hs.276590      HAL  12q22-q24.1
  77   -4.57   3.60E-05     0.421     0.88   161748 乙酰辅酶A乙酰转移酶1(醋酸乙酰辅酶A硫解酶)    Hs.37      ACAT1  11q22.3-q23.1
  78   -4.56   2.70E-05     0.636     1.205   164394 CD163抗原    Hs.74076      CD163  12p13.3
  79   -4.54   2.90E-05     0.926     1.178   160011 通用转录因子IIA,2,12kDa    Hs.76362      GTF2A2  15q21.3
  80   -4.54   3.10E-05     0.634     0.922   161895 核受体亚家族1,组I,成员2    Hs.118138      NR1I2  3q12-q13.3
  81   -4.54   3.00E-05     0.907     1.181   167754 智人mRNA全长插入cDNA克隆EUROIMAGE926491,mRNA序列    Hs.98401  19
  82   -4.54   4.10E-05     0.988     1.3   161838 NADH脱氢酶(泛醌)1,亚复合物,未知,1,6kDa    Hs.84549      NDUFC1  4q28.2-q31.1
  83   -4.47   3.70E-05     1.124     1.642   161856 谷胱甘肽-S-转移酶样蛋白;谷胱甘肽转移酶omega    Hs.11465      GSTTLp28  10q24.33
  84   -4.47   3.80E-05     0.893     1.216   163456 植烷基-CoA羟基化酶(Refsum氏疾病)    Hs.172887      PHYH  10pter-p11.2
  85   -4.46   3.90E-05     0.51     0.865   168256 B-因子,备解素    Hs.69771      BF  6p21.3
  86   -4.43   4.30E-05     0.611     1.011   162472 血管生成素,核糖核酸酶,RNase A家族,5    Hs.332764      ANG  14q11.1-q11.2
  87   -4.41   4.80E-05     0.593     0.906   167629 N-乙酰转移酶1(芳基胺N-乙酰转移酶)    Hs.155956      NAT1  8p23.1-p21.3
  88   -4.39   5.90E-05     0.884     1.231   162036 Dombrock血型    Hs.13776      DO  12q13.2-q13.3
  90   -4.39   5.00E-05     0.448     0.831   159972 前B细胞集落增强因子    Hs.239138      PBEF  7q22.1
  91   -4.38   5.10E-05     0.892     1.14   160759 葡糖醛酸糖苷酶,β    Hs.183868      GUSB  7q21.11
  92   -4.37   5.20E-05     0.797     1.284   162192 乙酰-辅酶A脱氢酶,C-4至C-12直链    Hs.79158      ACADM  1p31
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
  93   -4.37   5.40E-05     0.811     1.062  161636 智人克隆24405 mRNA序列    Hs.23729     1
  94   -4.34   5.80E-05     0.746     1.211  168452 甲叉四氢叶酸脱氢酶(NADP+依赖型),甲川四氢叶酸环水解酶,甲酰四氢叶酸合成酶    Hs.172665      MTHFD1     14q24
  95   -4.33   6.10E-05     0.541     0.906  165666 核糖核酸酶,RNase A家族,4    Hs.283749      RNASE4     14q11.1
  96   -4.33   6.20E-05     0.482     0.939  167394 丁酰胆碱酯酶    Hs.1327      BCHE     3q26.1-q26.2
  97   -4.3   6.80E-05     0.62     0.767  167501 丙酰辅酶A羧化酶,α多肽    Hs.80741      PCCA     13q32
  98   -4.3   6.80E-05     0.809     2.181  165974 胰岛素样生长因子结合蛋白1    Hs.102122      IGFBP1     7p13-p12
  99   -4.29   7.00E-05     0.622     0.933  161234 嗜斑蛋白(plakophilin)2    Hs.25051      PKP2     12p11
  100   -4.29   7.00E-05     0.852     1.098  166532 卵磷脂转移蛋白    Hs.285218      PCTP     17q21-q24
  101   -4.28   7.40E-05     0.567     0.815  167750 腺苷激酶    Hs.432422      ADK     10cen-q24
  102   -4.27   7.80E-05     0.479     0.766  165890 纤维蛋白原,Bβ多肽    Hs.7645      FGB     4q28
  103   -4.26   7.70E-05     0.406     0.89  161362 色氨酸2,3-二加氧酶    Hs.183671      TDO2     4q31-q32
  104   -4.25   8.00E-05     0.739     1.044  159764 膜联蛋白A7    Hs.386741      ANXA7     10q21.1-q21.2
  105   -4.25   8.10E-05     0.642     0.88  164249 氨基羧基粘康酸半醛脱羧酶    Hs.114088      ACMSD     2q21.2
  106   -4.24   8.30E-05     0.91     1.142  162711 裂融素(mitofusin)2    Hs.3363      MFN2     1p36.21
  107   -4.24   8.30E-05     0.784     1.391  160370 血清/糖皮质激素调节的激酶    Hs.296323      SGK     6q23
  108   -4.24   8.40E-05     0.483     0.867  161146 3-羟基类固醇表位酶    Hs.11958      RODH     12q13
  109   -4.23   9.10E-05     0.476     0.846  161986 肿瘤排斥抗原(gp96)1    Hs.82689      TRA1     12q24.2-q24.3
  110   -4.23   8.60E-05     0.807     1.049  165670 toll样受体2    Hs.63668      TLR2     4q32
  111   -4.22   8.80E-05     0.577     0.78  166820 KIAA0212基因产物    Hs.154332      KIAA0212     3p26.1
  112   -4.21   9.10E-05     0.604     0.838  164495 智人,克隆IMAGE:3833472,mRNA,mRNA序列    Hs.234898     12
  113   -4.21   9.10E-05     0.407     0.592  163893 纤维蛋白原样蛋白1    Hs.107      FGL1     8p22-p21.3
  114   -4.2   9.30E-05     0.651     1.058  167287 细胞色素b-5    Hs.83834      CYB5     18q23
  115   -4.2   9.40E-05     0.597     1.015  162446 转移电子的黄素蛋白脱氢酶    Hs.323468      ETFDH     4q32-q35
  116   -4.19   9.90E-05     0.507     1.102  169375 细胞色素P450,亚家族IIC(美芬妥英4-羟基化酶),多肽9    Hs.167529      CYP2C9     10q24
  117   -4.18   0.000103     0.523     0.963  160720 山梨糖醇脱氢酶    Hs.878      SORD     15q15.3
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
 118 -4.17  0.000107     0.992     1.266  162067 剪接因子3b,亚基1,155kDa    Hs.334826    SF3B1     2q33.1
 119 -4.15  0.000115     0.639     0.936  164393 智人mRNA;cDNA DKFZp762O1615(来自克隆DKFZp762O1615),mRNA序列    Hs.284252     5
 120 -4.15  0.000114     0.794     1.029  162329 雌激素受体结合位点相关的抗原,9    Hs.9222    EBAG9     8q23
 121 -4.14  0.000116     0.59     1.176  164863 溶质载体家族2(辅助的葡萄糖转运蛋白),成员2    Hs.167584    SLC2A2     3q26.1-q26.2
 122 -4.14  0.000117     0.767     1.029  163052 融合的toes同源物(小鼠)    Hs.288929    FTS     16q12.1
 123 -4.12  0.000124     0.712     0.997  160399 cullin 3    Hs.78946    CUL3     2q36.3
 124 -4.12  0.000124     0.649     0.837  165894 蛋白激酶,cAMP依赖型,调控的,II型,β    Hs.77439    PRKAR2B     7q22-q31.1
 125 -4.11  0.000126     0.941     1.258  162938 PTD013蛋白    Hs.22679    PTD013     6q13-q22.33
 126 -4.09  0.000137     0.622     0.958  160328 前α(球蛋白)抑制物,H3多肽    Hs.76716    ITIH3     3p21.2-p21.1
 127 -4.08  0.000142     0.718     1.057  165794 环氧化物水解酶2,细胞质型    Hs.113    EPHX2     8p21-p12
 128 -4.07  0.000149     0.405     0.709  162561 RNA解旋酶相关蛋白[智人],mRNA序列    Hs.381097     16
 129 -4.06  0.000149     0.447     0.743  168811 乙酰辅酶A乙酰转移酶1(乙酸乙酰辅酶A硫解酶)    Hs.37    ACAT1     11q22.3-q23.1
 130 -4.06  0.000152     0.949     1.293  169563 锌指蛋白103同源物(小鼠)    Hs.155968    ZFP103     2p11.2
 131 -4.05  0.000155     0.565     1.142  162666 激肽原    Hs.77741    KNG     3q27
 132 -4.05  0.000156     0.353     0.729  168282 组特异性组分(维生素D结合蛋白)    Hs.198246    GC     4q12-q13
 133 -4.05  0.000157     0.678     0.841  168476 核孔素88kDa    Hs.172108    NUP88     17p13.2
 134 -4.04  0.000161     0.66     1.011  167801 Sec23同源物A(酿酒酵母)    Hs.272927    SEC23A     14q13.2
 135 -4.01  0.00018     0.624     0.786  165731 肿瘤蛋白D52样蛋白1    Hs.16611    TPD52L1     6q22-q23
 136 -4.01  0.000177     0.586     0.97  169253 芳香烷基磷酸酯酶3    Hs.335322    PON3     7q21.3
 137 -4.01  0.000179     0.841     1.036  159850 智人cDNA FLJ34315 fis,克隆FEBRA2008341,mRNA序列    Hs.376655     14
 138 -4  0.000182     0.69     1.057  167281 细胞分裂周期蛋白2-样蛋白5(胆碱酯酶相关细胞分裂控制物)    Hs.59498    CDC2L5     7p13
 139 -4  0.000185     0.589     0.913  165590 转运蛋白1    Hs.8146    TLOC1     3q26.2-q27
 140 -3.99  0.00019     0.69     0.939  162599 触珠蛋白    Hs.75990    HP     16q22.1
 141 -3.97  0.000202     0.79     0.997  164028 EST,稍类似于ATDA_人二氨乙酰转移酶(精脒/精    Hs.356269     X
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
胺N(1)-乙酰转移酶)(SSAT)(腐胺乙酰转移酶)[H.sapiens]
 142 -3.97   0.000205     0.418     0.896  166007 酪氨酸氨基转移酶    Hs.161640    TAT     16q22.1
 143 -3.95   0.000219     0.828     1.188  165559 c-mer原癌基因酪氨酸激酶    Hs.306178    MERTK     2q14.1
 144 -3.95   0.000221     0.816     1.224  165133 基本亮氨基酸拉链和W2结构域1    Hs.155291    BZW1     2q33
 145 -3.94   0.000223     0.334     0.522  167542 KIAA0062蛋白    Hs.89868    KIAA0062     8p21.2
 146 -3.93   0.00023     0.504     0.902  169449 精氨酸酶,肝脏   166337(1ncytePD)
 147 -3.93   0.000231     0.649     0.78  167543 凝血因子VIII,原促凝剂组分(血友病A)    Hs.79345    F8     Xq28
 148 -3.93   0.000235     0.491     0.61  163368 CDw92抗原    Hs.179902    CDW92     9q31.2
 149 -3.91   0.000244     1.059     1.761  168931 热休克蛋白105kD    Hs.36927    HSP105B     13q12.2
 150 -3.91   0.000245     0.406     0.687  165009 血清粘蛋白1    Hs.572    ORM1     9q31-q32
 151 -3.89   0.000264     0.37     0.662  162162 补体成分8,α多肽    Hs.93210    C8A     1p32
 152 -3.89   0.000265     0.746     1.159  166110 2,4-二烯酰CoA还原酶1,线粒体的    Hs.81548    DECR1     8q21.3
 153 -3.88   0.000277     0.749     0.985  161689 生长激素受体    Hs.125180    GHR     5p13-p12
 154 -3.87   0.000282     0.899     1.223  167617 硒蛋白P,血浆,1    Hs.275775    SEPP1     5q31
 155 -3.86   0.000291     0.644     0.938  161484 细胞色素P450,亚家族IVF,多肽3(白三烯B4omega羟基化酶)    Hs.106242    CYP4F3     19p13.2
 156 -3.85   0.000298     0.91     1.172  167551 微管相关的蛋白7    Hs.146388    MAP7     6q23.2
 157 -3.85   0.000299     0.604     0.895  169703 磷酸葡糖变位酶1    Hs.1869    PGM1     1p31
 158 -3.85   0.000305     0.673     0.909  163040 Incyte EST   2593385(IncytePD)
 159 -3.84   0.000311     0.602     0.807  165566 L-3-羟基乙酰-辅酶A脱氢酶,短链   1550727(IncytePD)
 160 -3.83   0.000322     1.017     1.192  162707 智人克隆25038mRNA序列    Hs.306359     15
 161 -3.83   0.000322     0.423     0.652  166674 配对的基本氨基酸切割系统4    Hs.170414    PACE4     15q26
 162 -3.82   0.000327     0.732     1.378  165737 脂肪酸结合蛋白1,肝脏    Hs.380135    FABP1     2p11
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
 163 -3.82  0.000334     0.596     0.86  168366 甾醇载体蛋白2    Hs.75760      SCP2     1p32
 164 -3.82  0.000334     0.809     1.044  165115 乌头酸酶1,可溶型    Hs.154721      ACO1     9p22-p13
 165 -3.82  0.000389     0.718     1.152  161732 plexin B1    Hs.278311      PLXNB1     3p21.31
 166 -3.8  0.000349     0.854     1.28  162202 转铁蛋白    Hs.396489      TF     3q21
 167 -3.79  0.000361     0.553     0.886  167991 羟基类固醇(17-β)脱氢酶4    Hs.75441      HSD17B4     5q21
 168 -3.79  0.000365     0.662     0.953  169717 孕酮受体膜组分1    Hs.90061      PGRMC1     Xq22-q24
 169 -3.79  0.000367     0.554     1.088  165457 溶质载体家族27(脂肪酸转运蛋白),成员2    Hs.11729      SLC27A2     15q21.2
 170 -3.77  0.000389     0.687     1.101  164532 过氧化氢酶    Hs.395771      CAT     11p13
 171 -3.77  0.000401     0.969     1.28  162934 亮氨酸羧基甲基转移酶    Hs.8054      LCMT     16p12.3-16p12.1
 172 -3.77  0.000391     0.583     0.822  160051 淋巴细胞胞质型蛋白1(L-网质)    Hs.381099      LCP1     13q14.3
 173 -3.77  0.000394     0.701     0.97  168394 羟基乙酰-辅酶A脱氢酶/3-酮乙酰-辅酶A硫解酶/烯酰辅酶A水合酶(三功能蛋白),β亚基    Hs.146812      HADHB     2p23
 174 -3.75  0.000411     0.964     1.164  162323 EST    Hs.426542     4
 175 -3.75  0.000419     0.689     1.067  160471 翻译抑制物蛋白p14.5    Hs.18426      UK114     8q22
 176 -3.75  0.00042     0.624     0.823  163224 DC2蛋白    Hs.103180      DC2     4q25
 177 -3.73  0.000444     0.998     1.308  162773 钙通道,电压依赖型,β2亚基    Hs.30941      CACNB2     10p12
 178 -3.73  0.000454     0.88     1.1  166579 白介素18受体1    Hs.159301      IL18R1     2q12
 179 -3.72  0.00046     0.665     1.113  161872 丝氨酸(或半胱氨酸)蛋白酶抑制物,clade A(α-1抗蛋白酶,抗胰蛋白酶),成员7    Hs.76838      SERPINA7     Xq22.2
 180 -3.71  0.000467     0.659     1.159  162012 脂蛋白,Lp(a)    Hs.119520      LPA     6q26-q27
 181 -3.71  0.000469     0.859     1.179  163509 Hermansky-Pudlak综合症3    Hs.282804      HPS3     3q24
 182 -3.68  0.000532     0.523     0.732  165011 酪氨酰蛋白磺基转移酶1    Hs.421194      TPST1     7q11.21
 183 -3.65  0.000577     0.649     0.875  164314 KIAA1450蛋白    Hs.83243      KIAA1450     4q32.1
 184 -3.64  0.000582     0.935     1.054  162882 RAB3A相互作用蛋白(rabin3)样蛋白1    Hs.13759      RAB3IL1     11q12-q13.1
 185 -3.62  0.000636     0.769     1.162  165530 细胞色素P450,亚家族IIJ(花生四烯酸环氧化酶(epoxygenase))多肽2    Hs.152096      CYP2J2     1p31.3-p31.2
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
 186 -3.59  0.000679     0.487     0.924  166057 POU结构域,1类,转录因子1(Pit1,生长激素因子1)    Hs.89394    POU1F1     3p11
 187 -3.59  0.000703     0.95     1.228  167868 通用转录因子IIB    Hs.258561    GTF2B     1p22-p21
 188 -3.58  0.000706     0.942     1.096  167779 通用转录因子IIE,多肽2,β34kDa    Hs.77100    GTF2E2     8p21-p12
 189 -3.58  0.000727     0.947     1.225  165329 Rab9效应子p40    Hs.19012    RAB9P40     9q34.11
 190 -3.57  0.000735     0.62     1.11  166857 纤溶酶原    Hs.75576    PLG     6q26
 191 -3.55  0.000775     0.838     1.215  165788 钾内向整流通道,亚家族J,成员8    Hs.102308    KCNJ8     12p11.23
 192 -3.55  0.000778     0.862     1.001  167386 烟酰胺N-甲基转移酶   604856(IncytePD)
 193 -3.55  0.000795     0.671     0.802  163088 假定的蛋白FLJ21918    Hs.282093    FLJ21918     16q22.1
 194 -3.55  0.00079     0.795     1.166  167385 电子转移黄素蛋白,α多肽(戊二酸尿症II)    Hs.169919    ETFA     15q23-q25
 195 -3.54  0.000799     1.068     1.459  169569 精脒/精胺N1-乙酰转移酶    Hs.28491    SAT     Xp22.1
 196 -3.54  0.000812     1.04     1.362  160982 ras应答元件结合蛋白1    Hs.171942    RREB1     6p25
 197 -3.53  0.00083     0.756     0.967  166818 原肌球调节蛋白    Hs.374849    TMOD     9q22.3
 198 -3.52  0.000844     0.79     1.057  164368 类似于RIKEN cDNA 1810013D05基因[智人],mRNA序列    Hs.32699     12
 199 -3.52  0.000848     0.609     1.001  160667 山梨糖醇脱氢酶    Hs.878    SORD     15q15.3
 200 -3.52  0.000851     0.713     0.894  160956 假定的蛋白A-211C6.1    Hs.28607    LOC57149     16p11.2
 201 -3.52  0.000858     0.625     0.933  166778 磷酸烯醇丙酮酸羧基激酶2(线粒体的)    Hs.75812    PCK2     14q11.2
 202 -3.52  0.000859     0.958     1.507  167552 溶酶体相关的膜蛋白2    Hs.8262    LAMP2     Xq24
 203 -3.51  0.000891     1.012     1.281  160125 肿瘤蛋白,翻译受控型1    Hs.401448    TPT1     13q12-q14
 204 -3.5  0.000901     0.991     1.197  161606 IgG的Fc片段,受体,转运蛋白,α    Hs.111903    FCGRT     19q13.3
 205 -3.5  0.000914     1.005     1.238  165593 跨膜7超家族成员1(在肾中上调)    Hs.15791    TM7SF1     1q42-q43
 206 -3.5  0.000915     1.009     1.267  160129 MAP/微管亲和力调节的激酶2    Hs.157199    MARK2     11q12-q13
 207 -3.47  0.000997     0.457     0.74  168320 乳酸脱氢酶A    Hs.2795    LDHA     11p15.4
 208  3.47  0.000996     1.098     0.826  160605 P311蛋白    Hs.142827    P311     5q22.1
 209  3.48  0.000971     0.938     0.81  165174 智人cDNA FLJ35787 fis,克隆TESTI2005672,很类似于泛醇-细胞色素C还原酶复合物核心蛋白2前    Hs.265591     16
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
体(EC 1.10.2.2),mRNA序列
  210   3.49  0.000953     1.083     0.92  166833 溶质载体家族17(阴离子/糖转运蛋白),成员5    Hs.117865    SLC17A5     6q14-q15
  211   3.53  0.000822     1.111     0.953  165413 WIRE蛋白    Hs.13996    WIRE     17q21.1
  212   3.56  0.000759     1.08     0.941  166348 表皮生长因子受体途径底物8相关蛋白1    Hs.28907    EPS8R1     19q13.42
  213   3.57  0.000725     1.048     0.9  163115 EST,中等类似于假定的蛋白FLJ20234[智人][H.sapiens]    Hs.119629     14
  214   3.59  0.000684     1.124     0.963  163579 EST    Hs.194441     6
  215   3.59  0.00068     1.835     1.306  161090 KIAA1641蛋白    Hs.44566    KIAA1641     2q11.1
  216   3.6  0.000688     1.173     0.981  161354 p21/Cdc42/Rac1激活的激酶1(STE20同源物,酵母)    Hs.64056    PAK1     11q13-q14
  217   3.61  0.000661     0.947     0.82  162677 人BRCA2区,mRNA序列CG011    Hs.142907     13
  218   3.64  0.000582     0.853     0.653  161085 聚合酶(DNA定向的),δ1,催化亚基125kDa    Hs.99890    POLD1     19q13.3
  219   3.65  0.000572     1.141     0.985  161518 H2A组蛋白家族,成员A    Hs.121017    H2AFA     6p22.2-p21.1
  220   3.65  0.000571     1.232     1.062  163109 线粒体的核糖体蛋白L43    Hs.151945    MRPL43     10q24.1-q24.3
  221   3.67  0.000537     1.014     0.841  164845 含硫氧还蛋白结构域4(内质网)    Hs.154023    TXNDC4     9q22.33
  222   3.67  0.000538     0.677     0.528  162564 A激酶(PRKA)锚蛋白(yotiao)9    Hs.58103    AKAP9     7q21-q22
  223   3.68  0.000522     1.301     1.059  164727 EST    Hs.125038     8
  224   3.68  0.00052     0.898     0.781  161620 H4组蛋白家族,成员A[智人],mRNA序列    Hs.278483     3
  225   3.7  0.000484     0.976     0.854  161334 假定的蛋白20D7-FC4    Hs.128702    20D7-FC4     19q13.3
  226   3.74  0.000428     1.081     0.871  163536 ERBB2的转导蛋白,2    Hs.4994    TOB2     22q13.2-q13.31
  227   3.77  0.000411     1.376     1.018  162152 claudin 4    Hs.5372    CLDN4     7q11.23
  228   3.83  0.00033     1.138     0.936  169742 EST,中等类似于假定的蛋白FLJ20378[智人][H.sapiens]    Hs.143992     2
  229   3.84  0.000311     1.234     1.035  161058 多发性内分泌瘤病I    Hs.423348    MEN1     11q13
  230   3.84  0.000311     0.765     0.619  161813 KIAA0874蛋白    Hs.27973    KIAA0874     18p11.21
  231   3.84  0.000311     1.227     1.01  168511 mutS同源物2,结肠癌,非息肉病型1(E.coli)    Hs.78934    MSH2     2p22-p21
  232   3.84  0.000309     1.265     1.031  161873 Incyte EST   3031912
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
  (IncytePD)
 233  3.89  0.000263     1.174     1.002  169310 核孔素62kDa    Hs.9877    NUP62   19q13.33
 234  3.9  0.000259     2.07     1.521  168933 中因子(midkine)(轴突生长促进因子2)    Hs.82045    MDK   11p11.2
 235  3.96  0.000213     1.058     0.893  163495 假定的蛋白FLJ11280    Hs.3346    FLJ11280   1q21.2
 236  3.96  0.000209     0.749     0.557  168500 智人cDNA:FLJ21930 fis,克隆HEP04301,很类似于HSU90916人克隆23815 mRNA序列    Hs.82845   11
 237  3.96  0.000207     1.258     0.984  168246 甲状腺激素受体相互作用蛋白13    Hs.6566    TRIP13   5p15.33
 238  3.98  0.000199     1.087     0.914  164713 智人全长插入cDNA克隆ZC18H06,mRNA序列    Hs.384561   19
 239  4.03  0.000168     1.324     0.862  169559 E74-样因子3(ets结构域转录因子,上皮特异型)    Hs.166096    ELF3   1q32.2
 240  4.04  0.000162     1.138     0.906  164262 膜蛋白,棕榈酰化型6(MAGUK p55亚家族成员6)    Hs.108931    MPP6   7p15
 241  4.04  0.000164     1.187     0.998  161661 假定的蛋白FLJ10520    Hs.77510    FLJ10520   16q22.3
 242  4.05  0.000159     1.15     0.926  163071 智人cDNA:FLJ21409 fis,克隆COL03924,mRNA序列    Hs.172129   5
 243  4.12  0.000126     1.058     0.922  165465 KIAA0195基因产物    Hs.301132    KIAA0195   17q25.2
 244  4.14  0.000117     1.265     1.023  164085 EST    Hs.107845   2
 245  4.14  0.000119     1.301     1.049  166229 假定的蛋白FLJ11362    Hs.8929    FLJ11362   Xq25-q26.1
 246  4.18  0.000102     1.027     0.872  166228 亨廷顿蛋白(huntingtin)(Huntington氏疾病)    Hs.79391    HD   4p16.3
 247  4.21  9.10E-05     0.614     0.427  169583 神经粒蛋白(neurogranin)(蛋白激酶C底物,RC3)    Hs.26944    NRGN   11q24
 248  4.3  6.80E-05     1.37     1.01  160913 claudin 4    Hs.5372    CLDN4   7q11.23
 249  4.31  6.60E-05     1.063     0.844  168965 形成素结合蛋白3    Hs.107213    FNBP3   2q23.3
 250  4.35  5.80E-05     1.154     0.878  166849 p53-响应基因5   1510581(IncytePD)
 251  4.37  5.30E-05     1.021     0.816  167919 KIAA1361蛋白    Hs.15119    KIAA1361   17q11.1
 252  4.45  4.00E-05     1.219     0.977  166837 EST    Hs.279482   2
 253  4.45  4.10E-05     1.278     0.974  168977 智人cDNA FLJ34031 fis,克隆FCBBF2003895,mRNA序列    Hs.340316   19
 254  4.49  3.50E-05     1.06     0.93  166408 假定的蛋白FLJ39514    Hs.48565    FLJ39514   4q11
t-值 参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号 描述 UG簇 基因符号 染色体位置
 255  4.49  3.50E-05     1.233     0.952  167009 蛋白激酶C,iota    Hs.1904    PRKCI   3q26.3
 256  4.6  2.40E-05     1.237     1.011  168029 小核的核糖核蛋白多肽A    Hs.173255    SNRPA   19q13.1
 257  4.61  2.40E-05     0.838     0.632  169587 v-Ki-ras2 Kirsten rat肉瘤2病毒癌基因同源物    Hs.433714    KRAS2   12p12.1
 258  4.61  2.40E-05     1.425     0.974  163235 FLJ00005蛋白    Hs.367690    FLJ00005   15q22.33
 259  4.63  2.20E-05     1.153     0.953  161066 假定的蛋白来自克隆24796    Hs.27191    LOC57146   16p12
 260  4.67  1.90E-05     0.967     0.784  165515 3-磷酸肌醇依赖型蛋白激酶-1    Hs.154729    PDPK1   16p13.3
 261  4.67  1.90E-05     1.035     0.775  169403 蛋白磷酸酶1,调节(抑制物)亚基12A    Hs.16533    PPP1R12A   12q15-q21
 262  4.71  1.60E-05     1.14     0.951  169490 假定的蛋白DKFZp564K0322    Hs.97876    DKFZP564K0 32   19q13.32
 263  4.71  1.60E-05     3.6     1.727  160089 肿瘤相关的钙信号转导蛋白1    Hs.692    TACSTD1   2p21
 264  4.73  1.50E-05     1.055     0.889  169508 ATP酶,转运Cu++,α多肽(Menkes氏综合症)    Hs.606    ATP7A   Xq13.2-q13.3
 265  4.8  1.20E-05     1.478     1.137  163214 假定的蛋白FLJ22548,类似于基因阱PAT 12    Hs.103267    FLJ22548   12q14.3
 266  5.16  3.00E-06     1.12     0.89  168509 EST,稍类似于KHLX_人Kelch-样蛋白X[H.sapiens]    Hs.99398   14
 267  5.17  3.00E-06     0.855     0.668  166434 假定的蛋白FLJ13213    Hs.331328    FLJ13213   15q21.2
 268  5.37  1.00E-06     1.164     0.929  161233 Incyte EST   1602194(IncytePD)
 269  5.55  p<0.000001     1.449     0.963  167498 原钙粘蛋白17    Hs.106511    PCDH17   13q14.3
 270  5.99  p<0.000001     1.201     0.896  160943 智人克隆24630 mRNA序列    Hs.171553   3
 271  6.36  p<0.000001     1.345     1.012  165379 假定的蛋白BC008647    Hs.102480    LOC91875   14q11.1
 272  6.36  p<0.000001     1.376     0.962  167992 KIAA1557蛋白    Hs.6185    KIAA1557   12p11.21
 273  6.37  p<0.000001     1.229     0.824  166068 外胚层神经皮质(具有BTB-样结构域)    Hs.104925    ENC1   5q12-q13.3
具有最低参数p值(p<0.000001)的前25个基因,被从273个基因的集合中选出,并且这25个基因的集合可产生与273个基因的集合相类似的结果。在表6中列出了这25个基因(它们在指示肝病患者发展为HCC的风险方面有显著性)、其基因符号、其染色体图谱位置、其UG簇标识号。用类似方式确定了进一步的由10个在预测严重肝病患者患HCC风险方面有显著的基因所构成的集合,并在表7中列出。
表6.用于通过复合多变量预测法鉴别可能患HCC的病人的25个显著基因及其在预测模型中计算多因子L值所需的值
     t-值   参数p-值 %CV支持 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号             描述     UG簇   基因符号 染色体位置
    1     -7.28     0.0000001     100     0.603     0.903   160198 cofilin 2(肌肉)    Hs.180141    CFL2   14q
    2     -6.53     0.0000001     100     0.985     1.607   168023 IgG的Fc片段,高亲和力Ia,(CD64)的受体    Hs.77424    FCGR1A   1q21.2-q21.3
    3     -6.46     0.0000001     100     0.643     1.175   162315 钙通道,电压依赖型,β3亚基    Hs.250712    CACNB3   12q13
    4     -6.18     0.0000001     100     0.688     1.112   160302 肌凝蛋白IB    Hs.121576    MYO1B   2q12-q34
    5     -6.16     0.0000001     100     0.473     1.161   169417 血蓝蛋白(铁氧化酶)    Hs.296634    CP   3q23-q25
    6     -6.1     0.0000001     100     0.876     1.18   161756 白蛋白    Hs.184411    ALB   4q11-q13
    7     -6.04     0.0000001     100     0.719     1.224   162290 UDP-N-乙酰基葡糖胺焦磷酸化酶1    Hs.21293    UAP1   1q23.1
    8     -6.01     0.0000001     100     0.534     1.141   162538 未知[智人],mRNA序列    Hs.367982   16
    9     -5.94     0.0000001     100     0.491     0.714   168634 染色体20开放阅读框3    Hs.22391    C20orf3   20p11.22-p11.21
    10     -5.93     0.0000001     100     0.756     1.276   164136 乙酰-辅酶A脱氢酶,长链    Hs.1209    ACADL   2q34-q35
    11     -5.9     0.0000001     100     0.864     1.181   163874 KIAA0092基因产物    Hs.151791    KIAA0092   11q21
    12     -5.88     0.0000001     100     0.728     0.925   163096 CGI-26蛋白    Hs.24332    CGI-26   12p12.3
    13     -5.73     0.0000001     100     0.616     1.133   160233 双特异性酪氨酸-(Y)-磷酸化调节的激酶3    Hs.38018    DYRK3   1q32
    14     -5.67     0.0000001     100     0.786     1.071   160436 类似于假定的蛋白PRO2831[智人],mRNA序列    Hs.406646   15
   t-值   参数p-值 %CV支持 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值 独特标号             描述     UG簇   基因符号 染色体位置
  15    -5.65   0.0000001   100     0.761     1.382   160795 肝白血病因子    Hs.433707    HLF   17q22
  16    -5.61   0.0000001   100     0.314     0.798   161944 补体成分9    Hs.1290    C9   5p14-p12
  17    -5.6   0.0000001   100     0.506     0.703   167718 ATP-结合盒,亚家族A(ABC1),成员1    Hs.211562    ABCA1   9q31.1
  18    -5.58   0.0000001   100     0.65     0.912   168437 KIAA0843蛋白    Hs.26777    KIAA0843   5q32
  19    -5.57   0.0000001   100     0.843     1.087   162884 胞内膜相关的不依赖于钙的磷脂酶A2γ    Hs.44198    IPLA2(GAM MA)   7q31
  20    -5.48   0.0000001   100     0.657     1.065   166910 SIPL蛋白    Hs.64322    SIPL   2p25.3
  269     5.55   0.0000001   100     1.449     0.963   167498 原钙粘蛋白17    Hs.106511    PCDH17   13q14.3
  270     5.99   0.0000001   100     1.201     0.896   160943 智人克隆24630mRNA序列    Hs.171553   3
  271     6.36   0.0000001   100     1.345     1.012   165379 假定的蛋白BC008647    Hs.102480    LOC91875   14q11.1
  272     6.36   0.0000001   100     1.376     0.962   167992 KIAA1557蛋白    Hs.6185    KIAA1557   12p11.21
  273     6.37   0.0000001   100     1.229     0.824   166068 外胚层神经皮质(具有BTB-样结构域)    Hs.104925    ENC1   5q12-q13.3
这25个基因是通过最小参数p值(p<0.000001)选出的。
表7.用于预测患HCC的10个显著基因及其在预测模型中计算多因子L值所需的值
  t-值  参数p-值 在高风险组1中比率的几何均值 在低风险组2中比率的几何均值   高/低 独特标号              描述     UG簇 基因符号     染色体位置
    103   -4.26  7.70E-05     0.406     0.89   0.45618  161362 色氨酸2,3-二加氧酶   Hs.183671    TDO2     4q31-q32
    77   -4.57  3.60E-05     0.421     0.88   0.478409  161748 乙酰辅酶A乙酰转移酶1(乙酸乙酰辅酶A硫解酶)   Hs.37    ACAT1     11q22.3-q23.1
    42   -5.02  5.00E-06     0.506     1.137   0.445031  162311 丝氨酸(或半胱氨酸)蛋白酶抑制物,clade C(抗凝血酶),成员1   Hs.75599    SERPINC1     1q23-q25.1
    8   -6.01  p<0.000001     0.534     1.141   0.468011  162538 未知[智人],mRNA序列   Hs.367982     16
    63   -4.7  1.80E-05     0.355     0.917   0.387132  162617 FK506结合蛋白5   Hs.7557    FKBP5     6p21.3-21.2
    131   -4.05  0.000155     0.565     1.142   0.494746  162666 激肽原   Hs.77741    KNG     3q27
    121   -4.14  0.000116     0.59     1.176   0.501701  164863 溶质载体家族2(辅助的葡萄糖转运蛋白),成员2   Hs.167584    SLC2A2     3q26.1-q26.2
    142   -3.97  0.000205     0.418     0.896   0.466518  166007 酪氨酸氨基转移酶   Hs.161640    TAT     16q22.1
    116   -4.19  9.90E-05     0.507     1.102   0.460073  169375 细胞色素P450,亚家族IIC(美芬妥英4-羟基化酶),多肽9   Hs.167529    CYP2C9     10q24
    5   -6.16  p<0.000001     0.473     1.161   0.407407  169417 血蓝蛋白(铁氧化酶)   Hs.296634    CP     3q23-q25

Claims (45)

1.一种鉴别抑制肝细胞癌HCC患者中癌细胞转移的潜在治疗靶点的方法,其特征在于,包括以下步骤:
a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触;
b)从样品中捕获标志物并产生第一个信号;
c)用非转移的HCC患者的样品重复步骤a)和步骤b)从而产生第二信号;
d)比较第一和第二信号,从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组,此亚组细胞标记物就是治疗HCC病人HCC转移的潜在治疗靶点。
2.如权利要求1所述的方法,其特征在于,
在步骤b)和步骤c)中扣除正常非癌组织样品在与步骤a)的芯片相同的芯片上所产生的信号,从而产生第一和第二信号。
3.一种预测肝细胞癌HCC患者癌细胞转移的方法,其特征在于,包括下述步骤:
a)将来自转移性HCC患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触,这组细胞标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白;
b)从样品中捕获标志物;
c)从步骤b)的被捕获标志物中产生第一信号;
d)用非转移的HCC患者的样品重复步骤a)至步骤c)从而产生第二信号;
e)用不明确有无转移可能的HCC患者样品重复步骤a)至步骤c)从而产生第三信号;
f)将第三信号与第一和第二信号进行比较,从而确定步骤e)的HCC患者的转移可能性。
4.如权利要求3所述的方法,其特征在于,这组细胞标志物包括从表2基因中独立选出的至少20个基因或基因所编码的蛋白。
5.如权利要求4所述的方法,其特征在于,这组细胞标志物包括从表2基因中独立选出的至少50个基因或基因所编码的蛋白。
6.如权利要求5所述的方法,其特征在于,这组细胞标志物包括从表2基因中独立选出的至少100个基因或基因所编码的蛋白。
7.如权利要求6所述的方法,其特征在于,这组细胞标志物包括表2的基因或基因所编码的蛋白。
8.如权利要求3所述的方法,其特征在于,这组细胞标志物包括表4的基因或基因所编码的蛋白。
9.如权利要求3所述的方法,其特征在于,这组细胞标志物包括单基因编号为Hs.313、Hs.69707、Hs.222、Hs.63984、Hs.75573、Hs.177687、Hs.69707、Hs.222、Hs.323712、和Hs.63984的基因或基因所编码的蛋白。
10.如权利要求3所述的方法,其特征在于,步骤a)和b)的样品、步骤d)的样品和步骤e)的样品是肝组织提取物。
11.如权利要求3所述的方法,其特征在于,步骤a)中的芯片是基因组芯片。
12.如权利要求3所述的方法,其特征在于,步骤a)中的芯片是蛋白质组芯片。
13.一种鉴别用于防止慢性肝病患者发展为肝细胞癌HCC的潜在治疗靶点的方法,其特征在于,包括以下步骤:
a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触;
b)从样品中捕获标志物并产生第一个信号;
c)用HCC低危的慢性肝病患者样品重复步骤a)和步骤b),从而产生第二信号;
d)比较第一和第二信号,从而鉴定出第一信号和第二信号的水平不同的细胞标志物亚组,此亚组的细胞标记物就是防止慢性肝病患者发展为HCC的潜在治疗靶点。
14.如权利要求13所述方法,其特征在于,在步骤b)和步骤c)中扣除正常非癌组织样本在与步骤a)的芯片相同的芯片上所产生的信号,从而产生第一和第二信号。
15.一种预测慢性肝病患者发展为肝细胞癌HCC的危险性的方法,其特征在于,包括以下步骤:
a)将来自HCC高危的慢性肝病患者的样品与包含针对一组细胞标志物的捕获试剂的芯片接触,这组细胞标志物包括由表5基因中独立选出的至少10个基因或基因所编码的蛋白;
b)从样品中捕获标志物;
c)从步骤b)被捕获的标志物中产生第一信号;
d)用HCC低危的慢性肝病患者样品重复步骤a)至步骤c)从而产生第二信号;
e)用不明确有无HCC危险的慢性肝病患者样品重复步骤a)至步骤c)从而产生第三信号;
f)将第三信号和第一、第二信号进行比较,从而确定步骤e)的患者发展为HCC的危险性。
16.如权利要求15所述的方法,其特征在于,这组细胞标志物包括从表5基因中独立选出的至少20个基因或基因所编码的蛋白。
17.如权利要求16所述的方法,其特征在于,这组细胞标志物包括从表5基因中独立选出的至少50个基因或基因所编码的蛋白。
18.如权利要求17所述的方法,其特征在于,这组细胞标志物包括从表5基因中独立选出的至少100个基因或基因所编码的蛋白。
19.如权利要求18所述的方法,其特征在于,这组细胞标志物包括表5的基因或基因所编码的蛋白。
20.如权利要求15所述的方法,其特征在于,这组细胞标志物包括表6的基因或基因所编码的蛋白。
21.如权利要求15所述的方法,其特征在于,这组细胞标志物包括表7的基因或基因所编码的蛋白。
22.如权利要求15所述的方法,其特征在于,步骤a)和b)的样品、步骤d)的样品和步骤e)的样品是肝组织提取物。
23.如权利要求15所述的方法,其特征在于,步骤a)中的芯片是基因组芯片。
24.如权利要求15所述的方法,其特征在于,步骤a)中的芯片是蛋白质组芯片。
25.如权利要求15所述的方法,其特征在于,步骤a)中的患者所患的疾病选自下组:乙肝、丙肝、血色病和Wilson氏病。
26.如权利要求15所述的方法,其特征在于,步骤d)中的患者所患的疾病选自下组:酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。
27.如权利要求15所述的方法,其特征在于,步骤e)中的病人所患的疾病选自下组:乙肝、丙肝、血色病、Wilson氏病、酒精性肝病、自身免疫性肝炎和原发性胆汁性肝硬化。
28.一种计算机可读介质,其特征在于,包括:
a)第一数据集的代码,该数据集来源于第一信号,该信号来自与转移性HCC患者的样品接触的芯片,所述芯片包含针对一组细胞标志物的捕获试剂,这组细胞标志物包括由表2基因中独立选出的至少10个基因或基因所编码的蛋白;
b)第二数据集的代码,该数据集来源于第二信号,该信号来自与非转移性HCC患者的样品接触的芯片,所述芯片与a)的芯片相同;
c)第三数据集的代码,该数据集来源于第三信号,该信号来自与未知转移的HCC患者的样品接触的芯片,所述芯片与a)的芯片相同;
d)将第三数据集与第一和第二数据集进行比较的代码。
29.一个数字式计算机,其特征在于,它包括权利要求28所述的计算机可读介质。
30.一个系统,其特征在于,包括:
a)权利要求29所述的数字式计算机;
b)包含针对一组细胞标志物的捕获试剂的阵列的芯片,所述标志物包括从表2基因中独立选出的至少10个基因或基因所编码的蛋白;
c)能在与样品接触后从芯片上读取信号的阅读器。
31.一种计算机可读介质,其特征在于,它包括:
a)第一数据集的代码,该数据集来源于第一信号,该信号来自与患慢性肝病且HCC高危的患者的样品接触的芯片,所述芯片包含针对一组细胞标志物的捕获试剂,这组细胞标志物包括由表5基因中独立选出的至少10个基因或基因所编码的蛋白;
b)第二数据集的代码,该数据集来源于第二信号,该信号来自与慢性肝病且HCC低危的患者的样品接触的芯片,所述芯片与a)的芯片相同;
c)第三数据集的代码,所述数据集来源于第三信号,该信号来自与慢性肝病且发展为HCC的危险度未知的患者的样品接触的芯片,所述芯片与a)的芯片相同;
d)将第三数据集和第一和第二数据集进行比较的代码。
32.一个数字式计算机,其特征在于,它包括权利要求31所述的计算机可读介质。
33.一个系统,其特征在于,包括:
a)权利要求32所述的数字式计算机;
b)包含针对一组细胞标志物的捕获试剂的阵列的芯片,所述标志物包括从表5基因中独立选出的至少10个基因或基因所编码的蛋白;
c)能在与样品接触后从芯片上读取信号的阅读器。
34.一种抑制肝细胞癌HCC患者中癌转移的方法,其特征在于,该方法包括步骤:抑制骨桥蛋白(OPN)活性。
35.如权利要求34所述的方法,其特征在于,抑制骨桥蛋白活性的步骤是通过抑制OPN表达来完成。
36.如权利要求35所述的方法,其特征在于,用反义多核苷酸用来抑制OPN的表达。
37.如权利要求34所述的方法,其特征在于,抑制骨桥蛋白活性的步骤是通过抑制OPN和OPN受体之间的特异结合来完成。
38.如权利要求37所述的方法,其特征在于,采用OPN拮抗剂来抑制OPN和OPN受体之间的特异结合。
39.如权利要求37所述的方法,其特征在于,采用抗OPN抗体来抑制OPN和OPN受体之间的特异结合。
40一种抑制慢性肝病患者发展为肝细胞癌HCC的方法,其特征在于,包括步骤:抑制EpCAM的活性。
41.如权利要求40所述的方法,其特征在于,抑制EpCAM活性的步骤是通过抑制EpCAM表达来完成。
42.如权利要求41所述的方法,其特征在于,采用反义多核苷酸来抑制EpCAM的表达。
43.如权利要求41所述的方法,其特征在于,采用小的抑制性RNA来抑制EpCAM的表达。
44.如权利要求40所述的方法,其特征在于,抑制EpCAM活性的步骤是通过抑制EpCAM和EpCAM受体之间的特异结合来完成。
45.如权利要求44所述的方法,其特征在于,采用抗EpCAM抗体来抑制EpCAM和EpCAM受体之间的特异结合。
CN038129825A 2002-04-05 2003-04-04 诊断肝癌转移或发病可能性及鉴定治疗靶点的方法 Pending CN1659287A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US37089502P 2002-04-05 2002-04-05
US60/370,895 2002-04-05

Publications (1)

Publication Number Publication Date
CN1659287A true CN1659287A (zh) 2005-08-24

Family

ID=29250601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038129825A Pending CN1659287A (zh) 2002-04-05 2003-04-04 诊断肝癌转移或发病可能性及鉴定治疗靶点的方法

Country Status (3)

Country Link
CN (1) CN1659287A (zh)
AU (1) AU2003230838A1 (zh)
WO (1) WO2003087766A2 (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101457254B (zh) * 2008-10-09 2011-04-06 北京大学人民医院 用于肝癌预后的基因芯片和试剂盒
CN102507938A (zh) * 2011-10-08 2012-06-20 复旦大学附属中山医院 一种肝癌转移预测定量抗体芯片及试剂盒
CN102507936A (zh) * 2011-11-09 2012-06-20 北京正旦国际科技有限责任公司 一种肝癌标志物多抗免疫质谱试剂盒
CN101891814B (zh) * 2009-05-21 2012-11-07 中国科学院上海生命科学研究院 抗骨桥蛋白opn单克隆抗体及其应用
CN104769168A (zh) * 2012-09-05 2015-07-08 亚利桑那州评议委员会,亚利桑那州法人团体,代理和代表亚利桑那州立大学 发现治疗靶标的方法
CN105917230A (zh) * 2013-11-11 2016-08-31 伊缪诺维亚公司 用于确定胰腺癌的方法、阵列和其用途
CN106957893A (zh) * 2016-01-11 2017-07-18 中国科学院上海生命科学研究院 一种肿瘤免疫治疗药物靶点及其应用
CN107818242A (zh) * 2013-05-28 2018-03-20 凡弗3基因组有限公司 对从细胞的组学数据导出的数据集的硅中分析方法和系统
WO2018077225A1 (en) * 2016-10-28 2018-05-03 Mao Ying Genetech Inc. The primary site of metastatic cancer identification method and system thereof
CN109234394A (zh) * 2018-09-30 2019-01-18 深圳市南山区人民医院 一种肝癌诊断标志物及其筛选方法
WO2019015549A1 (en) * 2017-07-17 2019-01-24 Mao Ying Genetech Inc. METHOD AND SYSTEM OF CELLULAR TYPE IDENTIFICATION
CN109364249A (zh) * 2018-11-05 2019-02-22 安徽医科大学 以manf为靶点的物质在制备治疗肝内胆管癌产品中的应用
CN109632773A (zh) * 2019-01-08 2019-04-16 贵州大学 一种二氢硫辛酸琥珀酰转移酶抑制剂的筛选方法
CN109870576A (zh) * 2017-12-05 2019-06-11 中国科学院大连化学物理研究所 Usp10蛋白的定量检测在原发性肝癌预后判断试剂盒中的应用
CN110029168A (zh) * 2019-05-09 2019-07-19 山东省立医院 基因fgl1在制备结直肠癌和肺癌诊断试剂盒的应用及试剂盒
CN110261619A (zh) * 2019-06-14 2019-09-20 上海四核生物科技有限公司 Prkar2b蛋白作为胃癌血清生物标志物的应用及其试剂盒
CN110782954A (zh) * 2019-10-31 2020-02-11 哈尔滨工业大学 一种预测癌细胞株中药物反应的权重模块化映射方法
US10758886B2 (en) 2015-09-14 2020-09-01 Arizona Board Of Regents On Behalf Of Arizona State University Conditioned surfaces for in situ molecular array synthesis
CN112002374A (zh) * 2020-06-14 2020-11-27 北京臻知医学科技有限责任公司 基于深度学习的mhc-i表位亲和力预测方法
CN112567051A (zh) * 2018-06-14 2021-03-26 给科生物研究室株式会社 肝癌特异性生物标志物
CN113652480A (zh) * 2021-06-28 2021-11-16 武汉大学 Cat在制备肝细胞癌早期诊断试剂盒及制备或筛选抗肝癌药物中的应用
CN114480574A (zh) * 2015-11-06 2022-05-13 文塔纳医疗系统公司 代表性诊断
WO2022105774A1 (zh) 2020-11-17 2022-05-27 圣湘生物科技股份有限公司 一种用于检测肝癌的试剂组合,试剂盒及其用途
CN114699405A (zh) * 2022-03-15 2022-07-05 四川轻化工大学 化合物在制备治疗非酒精性脂肪肝药物中的应用
CN115992244A (zh) * 2022-11-28 2023-04-21 武汉大学 Sart1在肝癌治疗中的作用
CN117238369A (zh) * 2023-09-19 2023-12-15 华中科技大学同济医学院附属同济医院 一种基于去透明细胞分化相关基因的肾透明细胞癌患者预后及药物敏感性评估模型
CN118389693A (zh) * 2024-06-24 2024-07-26 广州医科大学 Orp9基因作为靶点在筛选肝细胞肝癌防治药物中的应用

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1496928A4 (en) * 2002-04-08 2005-08-10 Ciphergen Biosystems Inc SERUM BIOMARKERS IN HEPATOCELLULAR CARCINOMA
EP1661991A4 (en) * 2003-08-24 2007-10-10 Univ Nihon WITH HEPATOCELLULAR CARCINOMA ASSOCIATED GEN
JP2007534772A (ja) * 2004-04-27 2007-11-29 イルミジェン バイオサイエンシーズ, インコーポレイテッド ヒト肝細胞癌細胞を特異的に標的化するための方法および組成物
EP2468889A3 (en) * 2004-07-09 2012-07-11 University of Pittsburgh of the Commonwealth System of Higher Education Identification of markers in lung and breast cancer
US20080213269A1 (en) * 2005-02-24 2008-09-04 Hideaki Tojo Preventive and/or Treating Agent for Cancer
WO2007149948A2 (en) 2006-06-20 2007-12-27 The Gov. Of The Usa As Represented By The Secretary Of The Department Of Health And Human Services Compositions and methods for diagnosis and treatment of tumors
DE602007013405D1 (de) 2006-07-14 2011-05-05 Us Government Verfahren zur bestimmung der prognose eines adenokarzinoms
CN101812507B (zh) * 2009-12-04 2012-07-04 复旦大学附属中山医院 用于预测肝癌转移与复发风险的基因芯片及其制作和使用方法
CN102690784B (zh) * 2011-03-22 2015-10-28 上海市肿瘤研究所 肝癌细胞系hcc-ly10的建立及应用
CN103808944B (zh) * 2014-03-07 2016-04-20 高平 生物标志物vwf和adamts13及其在肝硬化诊断试剂中的用途
US12025615B2 (en) 2017-09-15 2024-07-02 Arizona Board Of Regents On Behalf Of Arizona State University Methods of classifying response to immunotherapy for cancer
EP4038222A4 (en) 2019-10-02 2023-10-18 Arizona Board of Regents on behalf of Arizona State University METHODS AND COMPOSITIONS FOR IDENTIFYING NEOANTIGENS FOR USE IN THE TREATMENT AND PREVENTION OF CANCER

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5175084A (en) * 1987-10-30 1992-12-29 Fuji Yakuhin Kogyo Kabushiki Kaisha Method for the diagnosis of hepatic carcinoma
US6524787B1 (en) * 1999-08-30 2003-02-25 Mary J. C. Hendrix Diagnostics and therapy based on vascular mimicry
US8815517B2 (en) * 1999-12-28 2014-08-26 Ribonomics, Inc. Methods for identifying functionally related genes and drug targets

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101457254B (zh) * 2008-10-09 2011-04-06 北京大学人民医院 用于肝癌预后的基因芯片和试剂盒
CN101891814B (zh) * 2009-05-21 2012-11-07 中国科学院上海生命科学研究院 抗骨桥蛋白opn单克隆抗体及其应用
CN102507938A (zh) * 2011-10-08 2012-06-20 复旦大学附属中山医院 一种肝癌转移预测定量抗体芯片及试剂盒
CN102507938B (zh) * 2011-10-08 2014-12-24 复旦大学附属中山医院 一种肝癌转移预测定量抗体芯片及试剂盒
CN102507936A (zh) * 2011-11-09 2012-06-20 北京正旦国际科技有限责任公司 一种肝癌标志物多抗免疫质谱试剂盒
CN102507936B (zh) * 2011-11-09 2013-10-23 北京正旦国际科技有限责任公司 一种肝癌标志物多抗免疫质谱试剂盒
CN107817348A (zh) * 2012-09-05 2018-03-20 亚利桑那州评议委员会,亚利桑那州法人团体,代理和代表亚利桑那州立大学 发现治疗靶标的方法
CN104769168A (zh) * 2012-09-05 2015-07-08 亚利桑那州评议委员会,亚利桑那州法人团体,代理和代表亚利桑那州立大学 发现治疗靶标的方法
CN110187122A (zh) * 2012-09-05 2019-08-30 亚利桑那州评议委员会,亚利桑那州法人团体,代理和代表亚利桑那州立大学 发现治疗靶标的方法
CN107818242B (zh) * 2013-05-28 2022-01-04 凡弗3基因组有限公司 对从细胞的组学数据导出的数据集的硅中分析方法和系统
CN107818242A (zh) * 2013-05-28 2018-03-20 凡弗3基因组有限公司 对从细胞的组学数据导出的数据集的硅中分析方法和系统
CN105917230A (zh) * 2013-11-11 2016-08-31 伊缪诺维亚公司 用于确定胰腺癌的方法、阵列和其用途
US10758886B2 (en) 2015-09-14 2020-09-01 Arizona Board Of Regents On Behalf Of Arizona State University Conditioned surfaces for in situ molecular array synthesis
US11959838B2 (en) 2015-11-06 2024-04-16 Ventana Medical Systems, Inc. Representative diagnostics
CN114480574A (zh) * 2015-11-06 2022-05-13 文塔纳医疗系统公司 代表性诊断
CN106957893A (zh) * 2016-01-11 2017-07-18 中国科学院上海生命科学研究院 一种肿瘤免疫治疗药物靶点及其应用
CN109844140A (zh) * 2016-10-28 2019-06-04 茂英基因科技股份有限公司 辨识转移性肿瘤的原发位置的方法及系统
WO2018077225A1 (en) * 2016-10-28 2018-05-03 Mao Ying Genetech Inc. The primary site of metastatic cancer identification method and system thereof
CN111094594A (zh) * 2017-07-17 2020-05-01 茂英基因科技股份有限公司 产生复数候选探针和鉴定哺乳动物中细胞类型的方法
WO2019015549A1 (en) * 2017-07-17 2019-01-24 Mao Ying Genetech Inc. METHOD AND SYSTEM OF CELLULAR TYPE IDENTIFICATION
TWI676688B (zh) * 2017-07-17 2019-11-11 茂英基因科技股份有限公司 辨識細胞種類型之方法及系統
CN109870576A (zh) * 2017-12-05 2019-06-11 中国科学院大连化学物理研究所 Usp10蛋白的定量检测在原发性肝癌预后判断试剂盒中的应用
CN112567051A (zh) * 2018-06-14 2021-03-26 给科生物研究室株式会社 肝癌特异性生物标志物
CN109234394A (zh) * 2018-09-30 2019-01-18 深圳市南山区人民医院 一种肝癌诊断标志物及其筛选方法
CN109364249B (zh) * 2018-11-05 2021-09-24 安徽医科大学 以manf为靶点的物质在制备治疗肝内胆管癌产品中的应用
CN109364249A (zh) * 2018-11-05 2019-02-22 安徽医科大学 以manf为靶点的物质在制备治疗肝内胆管癌产品中的应用
CN109632773B (zh) * 2019-01-08 2021-11-12 贵州大学 一种二氢硫辛酸琥珀酰转移酶抑制剂的筛选方法
CN109632773A (zh) * 2019-01-08 2019-04-16 贵州大学 一种二氢硫辛酸琥珀酰转移酶抑制剂的筛选方法
CN110029168A (zh) * 2019-05-09 2019-07-19 山东省立医院 基因fgl1在制备结直肠癌和肺癌诊断试剂盒的应用及试剂盒
CN110029168B (zh) * 2019-05-09 2020-02-14 山东省立医院 基因fgl1在制备结直肠癌和肺癌诊断试剂盒的应用及试剂盒
CN110261619B (zh) * 2019-06-14 2021-06-25 上海四核生物科技有限公司 Prkar2b蛋白作为胃癌血清生物标志物的应用及其试剂盒
CN110261619A (zh) * 2019-06-14 2019-09-20 上海四核生物科技有限公司 Prkar2b蛋白作为胃癌血清生物标志物的应用及其试剂盒
CN110782954B (zh) * 2019-10-31 2021-05-04 哈尔滨工业大学 一种预测癌细胞株中药物反应的权重模块化映射方法
CN110782954A (zh) * 2019-10-31 2020-02-11 哈尔滨工业大学 一种预测癌细胞株中药物反应的权重模块化映射方法
CN112002374A (zh) * 2020-06-14 2020-11-27 北京臻知医学科技有限责任公司 基于深度学习的mhc-i表位亲和力预测方法
WO2022105774A1 (zh) 2020-11-17 2022-05-27 圣湘生物科技股份有限公司 一种用于检测肝癌的试剂组合,试剂盒及其用途
CN113652480A (zh) * 2021-06-28 2021-11-16 武汉大学 Cat在制备肝细胞癌早期诊断试剂盒及制备或筛选抗肝癌药物中的应用
CN114699405A (zh) * 2022-03-15 2022-07-05 四川轻化工大学 化合物在制备治疗非酒精性脂肪肝药物中的应用
CN115992244A (zh) * 2022-11-28 2023-04-21 武汉大学 Sart1在肝癌治疗中的作用
CN115992244B (zh) * 2022-11-28 2024-06-04 武汉大学 Sart1在肝癌治疗中的作用
CN117238369A (zh) * 2023-09-19 2023-12-15 华中科技大学同济医学院附属同济医院 一种基于去透明细胞分化相关基因的肾透明细胞癌患者预后及药物敏感性评估模型
CN117238369B (zh) * 2023-09-19 2024-04-09 华中科技大学同济医学院附属同济医院 一种基于去透明细胞分化相关基因的肾透明细胞癌患者预后及药物敏感性评估模型
CN118389693A (zh) * 2024-06-24 2024-07-26 广州医科大学 Orp9基因作为靶点在筛选肝细胞肝癌防治药物中的应用

Also Published As

Publication number Publication date
AU2003230838A8 (en) 2003-10-27
WO2003087766A3 (en) 2004-07-29
AU2003230838A1 (en) 2003-10-27
WO2003087766A2 (en) 2003-10-23

Similar Documents

Publication Publication Date Title
CN1659287A (zh) 诊断肝癌转移或发病可能性及鉴定治疗靶点的方法
EP2619574B1 (en) Molecular test for predicting responsiveness to dna-damage therapeutic agents in individuals having cancer
Sültmann et al. Gene expression in kidney cancer is associated with cytogenetic abnormalities, metastasis formation, and patient survival
US20050202451A1 (en) Methods and apparatuses for diagnosing AML and MDS
US20090047656A1 (en) Molecular analysis of primary cells
EP1470247A2 (en) Novel genetic markers for leukemias
Kim et al. Clinical circulating tumor DNA testing for precision oncology
CN101039951A (zh) 肝癌生物标志物
WO2012166899A2 (en) Biomarkers for predicting and assessing responsiveness of thyroid and kidney cancer subjects to lenvatinib compounds
US20090181394A1 (en) Diagnostic methods and kits for hepatocellular carcinoma using comparative genomic hybridization
US20060240441A1 (en) Gene expression profiles and methods of use
Mithani et al. Mitochondrial resequencing arrays detect tumor-specific mutations in salivary rinses of patients with head and neck cancer
CN1950701A (zh) 乳腺癌预后
CN115612734A (zh) 人食管鳞状细胞癌的分子标记物组及其应用
CN1845999A (zh) 在卵巢癌中作为预后和治疗靶标而被调控的基因
CN101068936A (zh) 用于实体瘤预后及治疗的方法和系统
EP1809765A2 (en) Classification of acute myeloid leukemia
WO2007043418A1 (ja) 肺腺癌患者の術後予後を予測するための方法及び組成物
Haider et al. Whole-genome informed circulating tumor DNA analysis by multiplex digital PCR for disease monitoring in B-cell lymphomas: a proof-of-concept study
WO2009123990A1 (en) Cancer risk biomarker
WO2009039190A1 (en) Cancer risk biomarker
CN1908189A (zh) 体外辅助鉴定肠型胃癌及其分化程度的方法与专用试剂盒
Urquidi et al. Genomic signatures of breast cancer metastasis
Khashei Varnamkhasti et al. Genetic evidence for predisposition to acute leukemias due to a missense mutation (p. Ser518Arg) in ZAP70 kinase: a case-control study
US20070292970A1 (en) Method for Distinguishing Aml-Specific Flt3 Length Mutations From Tkd Mutations

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication