Nothing Special   »   [go: up one dir, main page]

CN114072546A - 无细胞rna文库制备 - Google Patents

无细胞rna文库制备 Download PDF

Info

Publication number
CN114072546A
CN114072546A CN201980087396.9A CN201980087396A CN114072546A CN 114072546 A CN114072546 A CN 114072546A CN 201980087396 A CN201980087396 A CN 201980087396A CN 114072546 A CN114072546 A CN 114072546A
Authority
CN
China
Prior art keywords
rna
cdna
biological sample
genes
blood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980087396.9A
Other languages
English (en)
Inventor
尼拉杰·萨拉蒂亚
迈克尔·内伦伯格
阿凯茨·伊巴拉
庄嘉利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Molecular Stethoscope Inc
Original Assignee
Molecular Stethoscope Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Molecular Stethoscope Inc filed Critical Molecular Stethoscope Inc
Publication of CN114072546A publication Critical patent/CN114072546A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了由无细胞mRNA衍生的多样的cDNA文库及其制备方法。该文库可以如下制备:从体液如血清或血浆中提取RNA,将该RNA与污染物分离,用逆转录酶合成cDNA,以及富集蛋白质编码核苷酸序列。该文库可包括来自实体组织的多种转录物。Cf‑RNA可以通过qPCR、测序或其他合适的方法进行测量。

Description

无细胞RNA文库制备
交叉引用
本申请要求于2018年10月30日提交的第62/752,533号美国临时申请的权益,该临时申请通过引用整体并入本文。
背景技术
多种标志物可用于检测各种状况。然而,这些状况中有许多是可以影响不同组织的状况。在循环中(如在血液样品中)检测这些状况的标志物并不总是有助于确定哪些组织受到影响。例如,炎症的通用标志物可以指示身体某处的炎症应答,但可能不知道哪个组织正在遭受该应答,如肝脏、肾脏、肺或关节。组织特异性检测如活检通常是侵入性的,具有感染的风险,并且通常不能涵盖整个器官或组织。诸如MRI和CT扫描等成像技术可用来评估组织健康,但通常只能检测明显的特征和变化。因此,这些成像技术的灵敏度通常不足以发现状况的早期发作或状况的相对近期的发展。
援引并入
本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。
发明内容
无细胞mRNA为了解多种组织和器官的健康、表型和发育程序提供了潜在的窗口。本公开提供了富含非血液基因的多样的无细胞mRNA文库及其制备方法。
在一方面,本文提供了一种制备cf-RNA样品的方法,其包括:(a)以1,600g至16,000g离心生物样品;以及(b)从所述生物样品中分离RNA;其中至少50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400或1500个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因存在于所述cf-RNA样品中。所述生物样品可以是无细胞生物样品;并且可以是血清、血浆、唾液、尿液、组织液、脑脊液、精液、阴道液、羊水、眼泪、滑液、粘液或淋巴液。在一些实施方案中,所述生物样品是血清或血浆。
所述制备cf-RNA样品的方法可包括在从生物样品中分离RNA之前在所述生物样品中进行大小选择或免疫选择。在一些实施方案中,进行大小选择包括所述生物样品的离心。离心可以进行至少1分钟、至少10分钟、5分钟至20分钟、10分钟至15分钟或约10分钟。在一些实施方案中,所述生物样品以10,000g至15,000g离心。在一些实施方案中,所述生物样品以约12,000g离心。在一些实施方案中,进行大小选择包括过滤所述样品。
在一些实施方案中,从生物样品中分离RNA包括从生物样品中分离细胞外囊泡,该细胞外囊泡可以是外来体,以及从所述细胞外囊泡中分离RNA。在一些实施方案中,从生物样品中分离RNA包括从所述生物样品中分离核蛋白复合物以及从所述核蛋白复合物中分离RNA。
所述制备cf-RNA样品的方法可以进一步包括用脱氧核糖核酸酶处理所述RNA。在一些方面,所述脱氧核糖核酸酶是TurboDNase I。在一些实施方案中,在溶液中用脱氧核糖核酸酶处理所述RNA。
在一些实施方案中,从生物样品中分离RNA包括使所述RNA与亲和柱、脱盐柱或硅胶膜中的至少一种接触。在另外的实施方案中,使所述RNA与亲和柱、脱盐柱和硅胶膜接触。
在一些实施方案中,所述制备cf-RNA样品的方法进一步包括富集至少一种蛋白质编码核苷酸序列。在其他实施方案中,所述制备cf-RNA样品的方法包括从所述RNA中消耗核糖体RNA序列。
在另一方面,本文提供了一种鉴定cf-RNA分子的方法,其包括:(a)从生物样品中分离RNA;(b)由所述RNA制备cDNA文库;(c)对所述cDNA文库进行测序;以及(d)鉴定所述cDNA文库中的至少一个基因,其中所述生物样品基本上是无细胞的,并且其中检测至少50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400或1500个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因。在一些实施方案中,所述鉴定cf-RNA分子的方法进一步包括将来自所述cDNA文库的序列与参考基因组进行比对。
在这种鉴定cf-RNA分子的方法中,在一些方面,所述生物样品是无细胞的。在一些实施方案中,所述生物样品是血清、血浆、唾液、尿液、组织液、脑脊液、精液、阴道液、羊水、眼泪、滑液、粘液或淋巴液。在其他实施方案中,所述生物样品是血清或血浆。
在一些实施方案中,所述鉴定cf-mRNA分子的方法鉴定至少1、5、10、20、50、100、200、300、400或500个选自表2的组织特异性基因;至少1、5、10、20、50、100或150个选自表6的脑特异性基因;至少1、5、10、20或50个选自表7的肝脏特异性基因或来自表8的肝脏诊断基因;或其任意组合。
在一些方面,本文提供的鉴定cf-RNA分子的方法包括鉴定第一基因,其中所述RNA包含少于500、200、150、100、50、25或15个与所述第一基因对齐的cf-mRNA多核苷酸。
在鉴定cf-mRNA分子的方法的一些实施方案中,每100次读取检测至少2、4、6、8或10个独特片段。在一些实施方案中,每10,000次读取检测至少2、4、6、8或10个蛋白质编码基因。
在一些实施方案中,所述鉴定cf-mRNA分子的方法进一步包括在从生物样品中分离RNA之前在所述生物样品中进行大小选择或免疫选择。在一些方面,所述大小选择包括所述生物样品的离心。所述生物样品可以以1,600g至16,000g离心;并且可以离心至少1分钟、至少5分钟、至少10分钟、5分钟至20分钟、10分钟至15分钟或约10分钟。在一些实施方案中,所述生物样品以10,000g至15,000g或以约12,000g离心。在其他实施方案中,进行大小选择包括过滤所述样品。
在本文提供的鉴定cf-RNA分子的方法的一些实施方案中,从生物样品中分离RNA包括从所述生物样品中分离细胞外囊泡,以及从所述细胞外囊泡中分离RNA。在一些实施方案中,所述细胞外囊泡是外来体。
在一些实施方案中,从生物样品中分离RNA包括从所述生物样品中分离核蛋白复合物,以及从所述核蛋白复合物中分离RNA。在一些实施方案中,所述鉴定cf-RNA分子的方法进一步包括将包含第一核苷酸序列的外源RNA多核苷酸添加至所述生物样品,并检测包含所述第一核苷酸序列的cDNA多核苷酸,其中所述cDNA多核苷酸的第一核苷酸序列在所述RNA多核苷酸的第一核苷酸序列包含尿嘧啶的每个位置包含胸腺嘧啶。
在一些实施方案中,所述鉴定cf-RNA分子的方法进一步包括用脱氧核糖核酸酶处理所述RNA。在一些实施方案中,所述脱氧核糖核酸酶是TurboDNase I。在一些实施方案中,当用所述脱氧核糖核酸酶处理时,所述RNA在溶液中。
在一些实施方案中,从生物样品中分离RNA的步骤包括使所述RNA与亲和柱、脱盐柱或硅胶膜中的至少一种接触。在进一步的实施方案中,使所述RNA与亲和柱、脱盐柱和硅胶膜接触。
在一些方面,由包含随机序列的RNA制备cDNA文库,所述随机序列可以是随机六核苷酸。在一些实施方案中,所述随机六核苷酸的浓度为至少60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μM或1500μM。
在一些实施方案中,鉴定cf-mRNA分子的由RNA制备cDNA文库的步骤包括形成单链cDNA。在一些方面,所述方法进一步包括使所述RNA与逆转录酶接触,以形成单链cDNA。在另外的方面,双链cDNA由所述单链cDNA形成。在更进一步的方面,使所述单链DNA与NEBNextDNA聚合酶接触,以形成双链cDNA。在一些实施方案中,所述方法进一步包括将独特的双重索引连接至所述双链cDNA的两端。
在一些实施方案中,所述鉴定cf-RNA分子的方法进一步包括富集至少一种蛋白质编码核苷酸序列。在一些实施方案中,所述富集包括从所述RNA中消耗核糖体RNA序列,以及在一些实施方案中,从所述cDNA文库中消耗核糖体RNA序列。在一些实施方案中,富集至少一种蛋白质编码核苷酸序列包括从所述RNA或从所述cDNA中分离所述至少一种蛋白质编码序列。在一些实施方案中,富集至少一种蛋白质编码核苷酸序列包括使全外显子组诱饵与所述cDNA杂交。所述全外显子诱饵可以是RNA多核苷酸或DNA多核苷酸。
本文提供的本公开的其他方面是cf-mRNA测序文库,其包含由以下基因产生的cDNA分子:至少50、100、200、300、400、500、600、700、800、900或1000个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因;每1,000,000个cDNA多核苷酸至少1、10、20、50、100、200、300、400、500、600、700、800、900或1000个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因;至少5、10、20、50、100、200、300、400或500个选自表2的组织特异性基因;至少1、5、10、20、50或100个选自表6的脑特异性基因;或至少1、5、10、20或50个选自表7的肝脏特异性基因。
本公开的又一方面是一种cf-mRNA测序文库,其包含由至少2000、3000、4000、5000或6000个蛋白质编码基因产生的cDNA多核苷酸,其中至少8%、15%或24%的所述蛋白质编码基因是非血液基因。
附图说明
本公开的新颖特征在所附权利要求书中具体阐述。通过参考以下对利用本公开的原理的说明性实施方案加以阐述的详细描述以及附图,将会对本公开的特征和优点获得更好的理解:
图1描绘了根据本公开的一些实施方案的cf-mRNA分析方法的流程图。
图2A-2E的图形显示了以1,900g至16,000g范围内的力离心血浆或通过孔径范围为0.2um至0.8um的膜过滤血浆消耗了来源于红细胞(图2A)、血小板(图2B)、嗜中性粒细胞(图2C)、肝脏(图2D)和脑(图2E)的cf-mRNA转录物。
图3A-3B的图形显示了随着离心力逐渐增加,非血液cf-mRNA转录物的富集。血液转录物的消耗速度低于非血液转录物。图3A显示了血液和非血液转录物的拷贝数。对于1900g旋转,将转录物的数目归一化为1.0。图3B显示了每百万个中的血液和非血液转录物的归一化数目。对于每组,将每百万个中的最高转录物数目归一化为1.0。
图4的图形描绘了用1,900g至16,000g范围内的力离心后,从cf-mRNA转录物检测到的非血液基因的数目。
图5的图形描绘了如通过对β-肌动蛋白cf-mRNA的qPCR所确定的,三种RNA提取试剂盒的cf-RNA产量。
图6A-6B的图形显示了如在生物分析仪上通过毛细管电泳所确定的,与制造商的标准核酸提取方案(图6B)相比,使用优化的miRNA提取方案(图6A),采用QIAampCirculating Nucleic Acid试剂盒,较短cf-RNA多核苷酸片段的提高的产量。
图7的图形描绘了与QIAamp ccfDNA/RNA试剂盒相比,使用优化的miRNA提取方案,采用QIAamp Circulating Nucleic Acid试剂盒,提高的cf-RNA产量。
图8的图形示出,如在生物分析仪上通过毛细管电泳所确定的,在溶液中用TurboDNase I处理提取的c-RNA消除了DNA多核苷酸的痕量污染。
图9的图形显示了如通过18S rRNA的qPCR所确定的,从样品中去除抑制剂提高了cf-RNA的表观产量。
图10A-10B的图形显示,如在生物分析仪上通过毛细管电泳所确定的,OneStepPCR抑制剂去除柱(当前脱盐柱)比其他柱Micro-Bio-Spin柱(脱盐柱1)保留更少的RNA。
图11的图形显示,与较老的方法(先前)相比,使用实施例1中描述的方法(现在)减少了cf-RNA提取失败。
图12的图形显示,如通过β-肌动蛋白cf-mRNA的qPCR所确定的,使用实施例1中描述的方法的cf-RNA回收率是线性的、一致的并且随着血浆输入的增加而增加。
图13是如通过18S cDNA的qPCR所确定的,用不同逆转录酶量化RNA产量的图形。
图14的图形描绘了如通过18S cDNA的qPCR所确定的,RNA从不同量的输入cf-RNA转化为cDNA。
图15A-15B的图形描绘了使用Accel-NGS 1S Plus(Swift 1)和Accel-NGS 2SPlus(Swift 2)(图15A)以及标准和优化的Accel-NGS 2S Plus方案(图15B)制备的cDNA文库中的独特序列片段。
图16A-16B的图形显示了与标准索引(图16B)相比,使用独特双索引(图16A)的错误分配的序列。
图17描绘了如通过DNA测序所确定的,总cf-RNA(ver1)中、rRNA耗尽的cf-RNA(Ver2)中和mRNA的全外显子组捕获(Ver3)后的RNA形式的丰度。
图18A-18C的图形显示了与采用rRNA消耗的SMARTer试剂盒相比,使用实施例1中描述的方法(Swift 1S)进行的cf-mRNA测序的灵敏度。ERCC标准品的检测灵敏度(图18A)。检测到的基因数(图18B)。ERCC标准品的检测灵敏度的示例性确定(图18C)。ERCC是掺加到来自四名患者(Pt 7171、Pt 7131、Pt 7139和Pt 7l55)的样品中的标准品。
图19A-19E的图形示出了通过实施例1的方法制备的cf-mRNA文库与Pan等人描述的cf-mRNA文库的比较:(图19A)测序读取数;(图19B)检测到的独特片段数;(图19C)检测到的蛋白质编码基因数;(图19D)>80%覆盖的基因数;(图19E)检测到的肝脏基因数。
具体实施方式
本文提供了可以采用预先离心以减少来自cf-mRNA测序数据的不需要的“血液”转录物的污染的方法。本文的方法可以减少由血细胞RNA(“血液成分”)引起的背景噪音。这样的噪音可增加测序深度要求,并稀释来自组织特异性cf-mRNA的信号。
本文公开的方案、方法和试剂盒可与广泛的离心力范围一致,例如跨越、低于或大于1,500g至20,000g、1,900g至16,000g、4,000g至16,000g、8,000g至16,000、10,000g至14,000g、11,000g至13,000g、11,500g至12,500g、约12,000g、基本12,000g、实质12,000g或约12,000g的范围。一些范围跨越约12,000g。一些范围在12,000g的100g以内。一些离心方案与12,000g没有明显差异,例如以12,000g离心。一些范围在16,000g的100g以内。一些离心方案与16,000g没有明显差异,例如以16,000g离心。还设想了在以上列出的低数值处具有起点或终止于以上列出的高数值的替代范围。此类离心方案可能有助于用于处理的提取的cf-RNA样品多样性的改善,如2.5x(例如,1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9.40或大于4.0x)改善。
通过离心施加的重力在颗粒悬浮液中的分离速率通常取决于颗粒大小和密度。更高密度或更大尺寸的颗粒通常以较快的速度移动,并且在某些点可以与密度较低或较小的颗粒分离。根据颗粒大小分离颗粒的替代技术包括但不限于凝胶过滤色谱法和通过大小选择性膜的过滤。所有这些技术都在本公开的范围内。
一些可商购获得的提取方案可能表现出高样品提取失败率,提取少量的cf-mRNA,并且无法消除许多导致下游测定步骤表现不佳的污染物。此类试剂盒和方案可能仅提取较小或较大cf-mRNA片段的亚群。因此,本文提供了从血液中提取cf-mRNA的方法,这有助于生成可能富含生物信息的高质量测序数据。本文的方法可以使用以低失败率和提高的cf-mRNA产量从血液中一致地提取cf-mRNA的试剂盒。这样的产量可以保留较小和较大的cf-mRNA片段以产生可扩增的cf-mRNA。
如本文所公开的,一些方法可以通过保留至少一个提取洗涤步骤的洗脱物来提高样品提取成功率或RNA文库多样性,使得否则在洗涤步骤洗脱物中将会丢失的小RNA多核苷酸得以保留,以促进RNA文库的多样性以供加工。
低水平的DNA污染可能是基因表达定量错误的来源,而血液中的污染物可抑制下游测定生物化学。此外,可商购获得的RNA提取试剂盒可能省略去除DNA的步骤或推荐柱上DNA酶处理,这可能不是稳健去除DNA的最佳选择。例如,在低产量的cf-mRNA样品中,低水平的污染会导致明显的数据错误表示。因此,本文提供了配置有cf-mRNA洗涤条件以去除血液中的污染物质的方法和系统。此外,此类方法可以消除cf-mRNA样品的零星基因组DNA污染。
备选地或组合地,本文公开的方法和系统可以通过添加去除DNA污染和/或遗留物的酶促DNA酶步骤来去除污染物质。许多酶促和非酶促DNA去除处理与本文的公开内容一致,通常共有从cf-RNA样品中去除DNA的效果。本文的方法可以提供脱盐净化柱,该柱增强样品可扩增性(例如通过去除抑制剂)和cf-mRNA的富集、多样性和产量。
用于cDNA合成的寡聚dT引发对于片段化和/或降解的mRNA可能不是最佳的。特别是,降解的样品可包含缺少聚A尾的片段,而不完全的逆转录可导致缺少5'区域的逆转录产物。因此,与本文公开内容一致的一些系统、方法和试剂盒可包括添加用于随机引发逆转录的试剂的步骤,如使用包含多达4、5、6、7、8、9、10个或超过10个碱基的寡核苷酸,如五聚体、六聚体、七聚体、八聚体、九聚体或十聚体。在一些实施方案中,可以使用六聚体来引发逆转录。
此外,由于来自先前步骤的抑制剂,一些商业酶可抑制cDNA的产生,而当使用已知的RNA输入时,逆转录酶的cDNA定量可表现出较差的定量准确性。
本文提供了可改善RNA至cDNA的转化效率和cf-mRNA的定量准确性的系统和方法。本文的方法可采用相对较高浓度(例如大于一些市售试剂盒中推荐的浓度的浓度)的寡核苷酸,如六聚体,代替用于cDNA合成的寡聚dT引发,而选择最佳逆转录酶以从RNA输入产生最高量的cDNA。寡核苷酸如随机六聚体或其他长度的寡核苷酸可以在与本文公开内容一致的浓度范围内使用。例如,考虑高达、至少约或基本上60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μM或1500μM,或大于1500μM的浓度,或与以上范围一致的浓度。这些范围内的浓度也与本文的公开内容一致,例如至少60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μM或1500μM,或大于1500μM。也就是说,在一些情况下,可以以约200μM使用随机寡核苷酸,如随机六聚体。在一些情况下,可以以约500μM使用随机寡核苷酸,如随机六聚体。在一些情况下,可以以约1000μM使用随机寡核苷酸,如随机六聚体。在一些情况下,可以以约1500μM使用随机寡核苷酸,如随机六聚体。在一些情况下,可以以约2000μM使用随机寡核苷酸,如随机六聚体。还考虑了分数浓度。
或者,可以以相对于试剂盒中推荐的量更高的浓度使用随机寡核苷酸,例如随机六聚体或其他长度的寡核苷酸。例如在2x、3x、4x、5x、6x、7x、8x、9x、10x、11x、12x、13x、14x、15x、16x、17x、18x、19x、20x、21x、22x、23x、24x、25x、26x、27x、28x、29x、30x、31x、32x、33x、34x、35x、36x、37x、38x、39x、40x、41x、42x、43x、44x、45x、46x、47x、48x、49x、50x或大于50x范围内的浓度被考虑与本文的方法、系统和试剂盒一起使用。在一些情况下,使用15x至40x、20x至35x、25x至35x、28x至32x,或至少25x、26x、27x、28x、29x、30x、31x、32x、33x、34x、35x,或大于35x的浓度,例如30x。
大量随机六聚体和特定逆转录酶的使用可以使稳定和准确量的cDNA能够用于文库制备。本文的方法和系统可以利用改进的cDNA合成过程来确定改进的文库制备方案,以减少样品失败的次数,并提高生物数据和组织特异性转录物鉴定的丰富性和稳健性。此类方法可以减少浪费在无信息读取如核糖体RNA上的测序资源的量,核糖体RNA可占转录组的>80%。因此,本文的方法和系统可包括全外显子组富集以仅捕获cf-mRNA。可以显示测定灵敏度RNA分子检测的改进。此外,本文的方法和系统可以利用通常不用于RNA制备的富集方案,并获得定制探针来捕获掺加的转录物cDNA。
在一些实施方案中,可以通过与代表某些器官或组织如脑、肝、肺、膀胱、肾、心脏、乳房、胃、肠、结肠、胆囊、胰腺、肺、前列腺、卵巢、上皮、结缔组织、神经或肌肉的诱饵杂交来富集cf-mRNA的选定群体和/或由cf-mRNA衍生的cDNA。在一些实施方案中,可以通过与区分某些器官或组织或者对于疾病或状况为诊断性或预后性的诱饵杂交来富集cf-mRNA的选定群体和/或由cf-mRNA衍生的cDNA。
在一些情况下,本文提供的方法可以通过例如选择表现出提高的效率的DNA-seq文库试剂盒来提高将RNA转化为可测序的cDNA文库的效率。为了便于将逆转录cf-RNA试剂盒应用于测序文库方案,在一些情况下,可以使用第二链合成酶或方案处理cDNA文库,以生成代表样品中的cf-RNA的双链cDNA分子群体。如此生成的双链DNA分子然后可以使用针对DNA文库生成而不是RNA或单链DNA文库生成的方案进行分析或测序文库生成。在一些情况下,相对于通过针对从cf-RNA或单链逆转录产物生成文库的方案所产生的,观察到针对双链DNA的文库生成方案产生更高质量的用于下游分析的文库,如测序文库。在某些实施方案中,在包含例如NEBNext聚合酶的第二链合成方案之前,在针对双链DNA的测序文库方案开始之前,可以使用包括使RNA样品与逆转录酶如Superscript IV接触的方法处理cf-RNA。
本文还提供了可以减少将测序读取错误分配给错误样品的方法、系统和试剂盒。所述方法和系统可以使富集过程中严格性净化条件造成的cf-mRNA文库损失最小化。可能需要严格性条件来防止索引化引物的残留,这些引物可以参与cf-mRNA衍生文库的后续PCR扩增。该方法可包括使用具有独特双索引(UDI)的来自IDT technologies的试剂来防止测序读取的错误对齐。当使用标准索引时,测序读取被错误地分配给阴性对照(NTC)。
由于血液中发现的大多数转录物可能来源于血细胞,因此本文提供了可在血液中检测到的“非血液”基因的列表。该列表是通过合并样品处理(离心速度)和用来鉴定“非血液”和组织特异性特征的生物信息学工具来确定的。确定了随离心速度而变化的非血液与血液转录物。范围为8,000g至16,000g的离心速度在检测到的转录物和基因的数目与信噪比之间取得平衡。
与鉴定血液中的非血液cf-RNA转录物相关的基因的部分列表包括以下:基因IDSEMA3F;HSPB6;MEOX1;CX3CL1;CDKL3;SEMA3G;DCN;IGF1;WWTR1;PHLDB1;SNAI2;CPS1;RAI14;PREX2;KITLG;ELN;BCAR1;ITIH1;LIMCH1;WISP2;CALCRL;EML1;KIF26A;ACSM2B;ADGRF5;GAL;PTPN21;LMCD1;LNX1;FERMT2;CD5L;NTN4;NUAK1;RASAL2;CTTNBP2;RARB;FBLN1;MAP2;NEBL;HOXA9;RAPGEF3;RIMS1;PTPRH;CADPS2;COL16A1;MECOM;MMP2;PIR;EPB41L1;ARHGAP28;NOS1;FXYD3;RAPGEF4;TF;APOH;PITPNM3;ZFHX4;CCDC80;TGFB2;GABRP;FMO2;CRTAC1;PALMD;PALM;CARD10;RASL10A;RBFOX2;GALNT16;CCM2L;PLS3;ASB9;GABRE;FLT1;ZNF423;NDRG4;CD276;TJP1;PLAT;TUSC3;CLEC4M;NOVA2;SYDE1;RASIP1;ATP6V0A4;CAV1;MET;HOXA5;TSPAN12;SFRP4;MEOX2;RARRES2;GLI3;OGN;LHX6;PTGR1;AMBP;MPDZ;GLIS3;APBA1;ATRNL1;CXCL12;PALD1;CCL2;COL1A1;HLF;KIAA1211;SOD3;CRYAB;APOA4;APOC3;ART4;MGP;CDCA3;AICDA;TPD52L1;LAMA4;C7;FGF1;LIFR;DPYSL3;HRG;AMOTL2;RBP1;FGF12;EVA1A;EFEMP1;IGFBP5;EFHD1;TPO;SDC1;RND3;PARD3B;PRRX1;PRG4;PLA2G4A;NR5A2;ADGRL2;MFAP2;KIF17;HSD11B1;PROX1;APOA1;TTR;ELOVL4;FILIP1;PCDH17;ELOVL3;NKX2-3;TEK;KIAA1217;IQSEC3;TBX2;FABP3;TMEM54;HOXA7;DNAI1;RASSF8;IL13RA2;SLC12A5;PTGIS;POF1B;HIF3A;HIST1H1A;NRN1;SSUH2;MT1G;ID1;F10;RHOJ;AIF1L;MASP1;PTPRB;KDR;RFPL1;A4GALT;KRT17;CPA4;FLNC;MYO1B;CHN1;MYO5C;CGNL1;ISLR;RNASE1;SHC2;DOCK6;APOE;APOC1;USHBP1;UNC13A;PXDN;ASS1;GALNT15;PDLIM4;RAMP2;KHDRBS3;RAI2;NR0B2;RHPN2;PPARG;REEP2;HSPA12B;NES;ALDH3B2;BHMT2;STARD13;BEX1;PDZD2;SPINK5;LYVE1;MRO;MEIS2;CABLES1;APLNR;COL4A2;TBX3;AMHR2;HEY2;PKIB;STAB2;THSD1;EDNRB;RAPGEF5;ALPK3;GATA4;DAB2IP;ALDOB;NR5A1;IL33;CCL21;SLCO2B1;LRRC32;SULF1;YAP1;SMAD6;ARHGAP29;TACC2;RBP4;OIT3;AOX1;DUOXA1;GCSH;GATA6;CCDC40;FKBP10;MMEL1;PRDM16;FCN3;TINAGL1;RGS5;RGL1;MALL;RBMS3;IL17RD;SHROOM2;DENND2A;CXorf36;AWAT2;FAM13C;ADIRF;ROM1;OOSP2;CLEC1A;ADGRL3;CCDC102B;DOCK1;MAGI1;THRSP;AKR1C2;PTPN14;HSPB8;TMEM178A;SPARCL1;GJA1;PLOD2;FBXL2;SEMA3D;CABYR;ROBO4;ABI3BP;CEP112;UCHL1;ENAH;PDLIM3;JAM2;FGD5;GNA14;KCNMA1;NMNAT2;CCNB2;AFAP1L1;ERG;HPD;SHROOM4;LAD1;C1QC;CIART;FCN2;AZGP1;COX7A1;CYGB;MPP3;BCL6B;SHANK2;PLPP3;FBLIM1;ADGRL4;SNX7;VCAM1;DDR2;C1orf115;PIGR;RFTN2;FAM84A;NOSTRIN;FABP1;ALB;PRICKLE2;ADAMTS9;APBB2;TM4SF18;EMCN;SPINK1;MYOZ3;BMPER;ZNF704;COL1A2;SOX17;DEFB1;AQP7;KIAA1462;SMCO2;FBN1;LARP6;SPIC;CYYR1;TMEM100;MFAP4;NNMT;GPR182;IGF2;MYO5B;CDC42EP5;SEMA6B;GGT6;KLK4;ACER1;GSDMA;DNASE1L2;ACOX2;FAM107A;COL3A1;FAM178B;CPLX1;EFNA1;SHE;ANTXR1;ROBO1;CTNND2;TM4SF1;MYRIP;FABP4;GPRC5C;GSTA4;PRKCDBP;SOX7;TMEM37;KRT19;PDE7B;KRT20;MAP6;FGA;FGB;PAH;ARNT2;SYNPO2;AGXT;MUCL1;SNTG2;GXYLT2;SNCG;STOX2;C1QTNF1;CD34;PHLDA3;PODN;SLCO2A1;DES;LPL;NR2F1;HOXD8;NUPR1;CIDEA;CLEC14A;C8orf4;C8G;CASKIN2;PTRF;CALML3;PSAPL1;LGALS7B;WSCD1;PIPOX;CDH5;TMEM45A;OR6S1;C1S;BGN;CLEC4G;PYCR1;CTNNA3;FBXL7;FAM167B;MAATS1;DGAT2L6;ALDH1A3;TACSTD2;TCEAL2;WBP5;NR2F2;KRT79;RGS7BP;KRT14;KRTAP23-1;LYPD6;FAM9C;C11orf96;GJA4;NANOS3;PLA2G2A;C15orf52;S100A16;FSIP2;AADACL3;APOD;S100A13;KIF19;HRCT1;ADH1B;CLPSL2;SRGAP1;KIAA1671;FAM177B;HOXA4;MFAP5;PARVA;TEAD4;SULT1C4;ADH4;HMGN5;ZNF442;ARHGEF15;DMD;C1orf53;SMIM9;SOX18;AWAT1;IGFL2;ERICH4;MT1M;C2CD4B;FAM127C;KLHL23;EMP2;UBD;NEURL1B;C1QTNF5;APOC4-APOC2;CFLAR-AS1;PLCL2-AS1;LA16c-395F10.1;C14orf132;AC046143.3;PPP5D1;RP11-14N7.2;HLA-DQB2;PHGR1;RP1-67K17.3;APOC2;RP11-758P17.3;TDGF1;INMT;GSTA1;ETV5;RP11-148B6.1;ECSCR;RP11-548K23.11;IQCJ-SCHIP1;SHANK3;RP11-116G8.5;CTD-2135J3.4;RP11-923I11.5;RP11-315D16.2;HOXB7;RP11-521L9.1;RP11-680G10.1;RP11-1260E13.4;GJA5;CTD-2350C19.2;AP000275.65;RP11-452I5.2;APOC4;AC003002.4;AC007193.8;DOC2B;CCL14;PIK3R3;RP5-1042K10.14;MATR3;RP11-717K11.2;CDR1-AS;和AL365273.1。
本文提供了可以优先消耗血细胞cf-mRNA从而增强检测器官来源的cf-mRNA的能力的方法,器官来源的cf-mRNA可以提供更多用于诊断目的的信息。可以针对每种组织优化离心速度和时间,以收集相关器官特异性转录物,并从不同器官类型中分离cf-mRNA部分。这种从血液中分离“非血液”器官特异性cf-mRNA可以允许提取有意义的生物信息。
通过实施上述方法中的至少一种,直至并包括使用本文中的大多数或所有方法的使用上述方法的组合的方法、系统和试剂盒,人们可以获得cf-RNA文库制备中的改进,或实质性改进。这样的改进可以通过文库多样性增加中的至少一种而观察到,例如RNA文库多样性的2.5x(例如,1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0或大于4.Ox)改进。增加的文库多样性可以允许使用较少数目的测序读取检测相同数目的独特基因,或者在相同数目的测序读取中观察到更多独特转录物。类似地,可以在各种情况下观察到在cf-mRNA文库中测序的非血液转录物的增加或实质性增加,例如高达或至少10%、20%、30%、40%、50%、60%、70%或超过70%的增加。一些系统、方法或试剂盒可表现出例如约50%的增加。这样的增加可以在选择性去除被鉴定为血液相关转录物的序列之前观察到,或与之均被观察到。相对于一些标准方案,这样的增加可以促进或可以在具有减小的体积、减小的测序深度或减小的体积和测序深度两者的样品中观察到。在一些情况下,测序深度可以减少多达或至少10%、20%、30%、40%、50%、60%、70%或超过70%,而检测到的独特转录物的数目没有相应减少。一些系统、方法或试剂盒可表现出例如约50%的降低,但仍可提供上述多样性的改进。在一些情况下,样品体积可以减少多达或至少10%、20%、30%、33%、40%、50%、60%、70%或大于70%。一些系统、方法或试剂盒表现出例如约33%的降低,尽管有上述多样性的改进。
在一些情况下,在绝对规模上,与本文公开内容一致的方法、系统和试剂盒可提高由本文提供的样品分析产生的序列读取文库中低丰度转录物序列的分辨率。如通过同时或独立测定的样品转录物或内部标准RNA分子或外部处理的分子所测量的,可以观察到在最终序列数据集中包含每个初始样品以低范围的分子存在的转录物,例如每个样品至少或不超过900、800、700、600、500、400、300、200、100、90、80、70、60、50、40、30、20、15或10个分子。也就是说,在一些情况下,人们可以观察到在最终序列数据集中包含总量例如为每个样品10-100个分子的转录物。这可以代表相对于某些其他方法的改进。
用于产生cf-mRNA的生物样品可以是任何生物流体。示例性流体包括血液、唾液、尿液、组织液、脑脊液、精液、阴道液、羊水、眼泪、滑液、粘液或淋巴液。细胞可以通过离心或包括过滤在内的其他手段从生物流体中去除。在血液内,cf-RNA可能与蛋白质、脂质、盐或其他成分缔合。一些cf-RNA从细胞外囊泡如外来体中的细胞中释放。外来体可以通过例如但不限于离心沉降、大小排阻、过滤、平衡密度离心、免疫分离、免疫消耗及其组合的方法来分离。
在一些实施方案中,本公开的方法可以允许检测生物样品(例如,生物流体)中的一种或多种细胞外RNA转录物。生物样品可以是血清、血浆、唾液、尿液、组织液、脑脊液、精液、阴道液、羊水、眼泪、滑液、粘液、淋巴液或其他合适的生物样品。在多个实施方案中,该方法能够检测血清样品中来源于非血细胞的一种或多种无细胞mRNA分子。除了造血转录物之外,该方法还能够检测血清样品中来源于非血细胞的一种或多种无细胞mRNA分子。
在cf-mRNA中检测到的基因可以追溯到起源组织和/或器官(例如,组织特异性基因;见表2-7),或者可能对诊断疾病或状况特别有意义(见表8-9)。此外,本文提供的方法可能是灵敏的,使得可以检测到生物样品(例如,生物流体)中以低至10、15、25、50、100、150、200或500的拷贝数存在的细胞外RNA分子。RNA分子可以通过测序、qPCR、ddPCR、微阵列或其他任何合适的方法来检测。
本文提供的方法可以检测和/或测量在生物样品中存在的(例如,在生物流体中循环的)细胞外RNA分子。在多个实施方案中,该方法可以检测和/或测量来源于造血和/或非造血细胞的无细胞mRNA转录物(参见,例如,表1或表10的非血液基因)。该方法可以生成纯化的cf-RNA样品,其中可以检测和/或测量来自表1或表10的1、5、10、20、50、100、200、300、400、500、600、700、800、900或1000个或更多个非血液基因。该方法可以测量或检测至少1、5、10、20、50、100、200、300、400或500个组织特异性、器官特异性或诊断上重要的基因,例如来自表2-9,来自从生物样品中提取的cf-RNA。该方法可以从生物样品产生cf-RNA样品,其中可以检测到以不超过10、15、25、50、100、150、200或500或更少的拷贝数存在的RNA分子。
本文还提供了检测生物样品中的至少10、20、30、50或100个非血液cf-mRNA基因的方法。所述方法可包括但不限于:(a)将血清或血浆样品以8,000g至16,000g(或本文提供的其他范围)离心至少10分钟,以形成上清液;(b)从上清液中提取RNA;(c)使所述RNA与脱氧核糖核酸酶接触;(d)由所述RNA形成cDNA;(f)由所述cDNA制备cDNA文库;(g)对所述cDNA文库进行测序;以及/或者(h)将序列与参考基因组进行比对,以鉴定每个生物样品由至少10、20、30、50或100个非血液cf-mRNA基因产生的序列。
所述方法还可包括(h)使所述cDNA文库与包含来自至少10、20、30、50或100个目的基因的多核苷酸片段的诱饵接触,以富集翻译的基因。在一些情况下,方法(d)可包括使所述RNA与逆转录酶接触以形成单链cDNA,并使所述单链cDNA与第二链合成酶接触以形成双链cDNA。所述方法还可包括(j)将独特的双重索引连接至所述cDNA文库,以形成索引化的cDNA文库。在一些实施方案中,所述方法可包括(k)合并至多2、3、4、5、6、7、8、9、10个或更多个索引化的cDNA文库。所述方法还可包括(l)对合并的cDNA文库进行大规模平行测序。
在一些实施方案中,在生物样品中检测至少25、50、75、100、200、300、400、500、600、700、800、900或1000个基因。在不同的实施方案中,可以将所述序列与参考基因组进行比对,以鉴定每个生物样品由至少25、50、75、100、200、300、400、500、600、700、800、900或1000个非血液cf-mRNA基因产生的序列。所述方法可以进一步包括使所述单链cDNA与第二链合成酶接触,以形成双链cDNA。在一些情况下,(c)可以在溶液中进行。
在某些实施方案中,检测生物样品中的至少10、20、30、50或100个非血液cf-mRNA基因的方法可包括但不限于:(a)以1,900g至16,000g(或本文提供的其他范围)离心或过滤血清或血浆样品;(b)从上清液中提取RNA样品;(c)使所述RNA样品与脱氧核糖核酸酶接触;(d)使所述RNA与逆转录酶接触,以形成单链cDNA;(e)由所述RNA形成双链cDNA;(f)由所述双链cDNA制备cDNA文库;(g)使索引化的cDNA文库与包含多核苷酸片段的诱饵接触,以富集翻译的基因;(h)对所述cDNA文库进行测序;以及/或者(i)将序列与参考基因组进行比对,以鉴定每个生物样品由至少10、20、30、50或100个非血液cf-mRNA基因产生的序列。
所述方法可以进一步包括(j)将独特的双重索引连接至所述cDNA文库,以形成索引化的cDNA文库(例如,通过连接、PCR等)。在一些实施方案中,所述方法可包括(k)合并至多十个索引化的cDNA文库。所述方法可以进一步包括(l)对合并的cDNA文库进行大规模平行测序。在一些情况下,所述方法可以进一步包括使所述单链cDNA与第二链合成酶接触,以形成双链cDNA。在一些实施方案中,(c)可以在溶液中进行。
与基因“比对”的多核苷酸序列通常与该基因的部分或全部的序列具有约100%的同一性。
除非上下文另外明确指出,否则如本文所用的,单数形式“一种”、“一个”和“该”包括复数指示物。除非另有说明,否则本文对“或”的任何提及旨在涵盖“和/或”。
虽然本文已经示出并描述了本公开的优选实施方案,但对于本领域技术人员明显的是,这些实施方案仅以示例的方式提供。在不脱离本公开内容的情况下,本领域技术人员将会想到许多变化、改变和替换。应当理解,在实施本公开时可以采用本文所述本公开的实施方案的各种替代方案。
实施例
通过参考作为本申请的示例性实施方案而提供的以下非限制性实施例,可以更好地理解本申请。提出以下实施例是为了更全面地说明实施方案,然而绝不应解释为限制本申请的宽泛范围。
实施例1:方法
用于无细胞mRNA(cf-mRNA)分析的过程包括生物样品处理、cf-mRNA提取、cf-mRNA纯化、cDNA合成、文库制备、DNA测序和生物信息学(图1)。
将血液采集在EDTA真空采血管(BD)中用于血浆处理,或采集在红顶真空采血管(BD)中用于血清处理。对于血清处理,将血液在室温下孵育至少30分钟。在采集后室温储存少于2小时后,将血液以1600g离心10分钟以产生血浆或血清(上清液)。样品可以在-80℃下进行处理或冷冻保存。为了从冷冻或新鲜样品中去除残留细胞,根据应用,将血浆/血清以10,000g至16,000g第二次离心10分钟。
使用来自QIAamp Circulating Nucleic Acid试剂盒(Qiagen目录号55114)的试剂提取并纯化无细胞RNA。以下条件用于至多1ml的血浆或血清。将上清液转移到新管中,与130μl蛋白酶K、1.1ml缓冲液ACL(无载体)和330μl缓冲液ATL混合,并在60℃下孵育45分钟。将产物与3ml缓冲液ACB、1μl稀释的ERCC RNA掺加混合物(Life Technologies目录号4456740)和2.5ml冷却的异丙醇混合,并在冰上孵育5分钟。使用真空歧管将样品加载到QiAmp Mini柱上,然后先后用600μl缓冲液ACW1、750μl缓冲液ACW2和2X 750μl EtOH洗涤。将柱在56℃下干燥10分钟。然后通过每次在室温下孵育3分钟,随后以16,000g离心1分钟,用50μl缓冲液AVE洗脱RNA两次。洗脱物(约100μl)用3μl Turbo DNA酶(Life Technologies目录号AM1907)在1X Turbo DNA缓冲液中在37℃下处理20分钟。用10μl DNA酶灭活混合物终止反应,在室温下孵育5分钟,然后以10,000g离心90秒。
如有必要,将上清液中的RNA用水补至100μl,并使用OneStep PCR InhibitorRemoval试剂盒(Zymo目录号D6030)清洁。Zymo旋转柱用600μl Prep缓冲液、随后用400μl和100μl水准备,全部以8000g离心3分钟。然后通过以8000g离心3分钟使样品过柱。然后使用来自RNeasy MinElute Cleanup试剂盒(Qiagen目录号74204)的试剂对样品进行第二次清洁。将RNA样品与350μl RLT缓冲液和900μl EtOH混合,并通过以>8,000g离心加载到RNeasyMinElute柱上。将柱用500μl RPE洗涤缓冲液洗涤,然后用500μl 80%乙醇洗涤,然后按照制造商的推荐干燥。对于洗脱,向柱中加入15μl水,在室温下孵育1分钟,然后通过以16,000g离心1分钟将其收集在微量离心管中。对于质量控制,使用RNA 6000Pico试剂(Agilent)在生物分析仪上分析(15μl的)1μl。
使用Superscript IV逆转录酶(Life Technologies目录号18090050)合成cDNA,随后用
Figure BDA0003141281300000191
Second Strand Synthesis试剂盒(New England BioLabs目录号E6111L)处理。将RNA(最多10μl)与1.12μl随机六聚体引物(3mg/μl)和0.56μl dNTP(各10mM)混合,总体积为14μl,在65℃下孵育5分钟,然后冷却到4℃。然后将样品与0.43μl水、4μl SSIV缓冲液、0.57μl DTT(0.1M)和1μl逆转录酶(200U/μl)混合,并在23℃下孵育10分钟,在50℃下孵育50分钟,在80℃下孵育10分钟,然后保持在4℃。对于第二链合成,向反应中补充4μl反应缓冲液、2μl NEBNext酶,用水使总体积达到40μl,并在16℃下孵育1小时。dsDNA用AMPure XP SPRI珠子(Beckman Coulter Inc.目录号A63882)清洁。将40μl dsDNA与40μl Low EDTA TE(Swift Biosciences目录号90296)和144μl SPRI珠子混合2分钟,随后在室温下孵育3分钟。使用磁力架收集珠子,用200μl 80%乙醇洗涤两次,并风干5分钟。
使用来自Accel-NGS 2S Plus DNA Library试剂盒(Swift Biosciences目录号SP-2014-96)的试剂和独特双索引(UDI)(Integrated DNA Technologies)制备文库。将SPRI珠子悬浮于53μl Low EDTA TE、6μl缓冲液W1和1μl酶W2中,并在37℃下孵育10分钟。添加108μl PEG NaCl溶液(Swift Biosciences目录号90196)。将珠子混合2分钟,在室温下孵育3分钟,然后在磁力架上收集5分钟。去除上清液后,将珠子用180μl 80%乙醇洗涤两次各30秒,然后风干。将珠子重新悬浮在30μl Low EDTA TE、5μl缓冲液G1、13μl试剂G2、1μl酶G3和1μl酶G4中,并在20℃下孵育20分钟。添加82.5μl PEG NaCl溶液,然后混合2分钟,室温孵育3分钟,并在磁力架上收集5分钟。去除上清液后,将珠子用180μl 80%乙醇洗涤两次各30秒,然后风干1分钟。将珠子重悬于20μl Low EDTA TE、5μl试剂Y2、3μl缓冲液Y1和2μl酶Y3中,并在25℃下孵育15分钟。添加49.5μl PEG NaCl溶液,然后混合2分钟,室温孵育3分钟,并在磁力架上收集5分钟。去除上清液后,将珠子用180μl 80%乙醇洗涤两次各30秒,然后风干1分钟。将珠子重悬于30μl Low EDTA TE、5μl缓冲液B1、2μl试剂B2、9μl试剂B3、1μl酶B4、2μl酶B5和1μl酶B6中,在40℃下孵育10分钟,然后回到25℃。添加70μl PEG NaCl溶液,然后混合2分钟,室温孵育3分钟,并在磁力架上收集5分钟。去除上清液后,将珠子用180μl80%乙醇洗涤两次各30秒,然后风干1分钟。通过混合2分钟,然后孵育2分钟,将珠子重悬于21μl low EDTA TE中。将珠子收集在磁力架上,将上清液转移到新板中,并与5μl IlluminaUDI Primer Mix(1-72)(Integrated DNA Technologies)、10μl Low EDTA TE、4μl试剂R2、10μl缓冲液R3和1μl酶R4混合。将PCR反应加热至98℃30秒,于98℃10秒、60℃30秒和68℃60秒循环16次,然后保持在4℃。添加70μl SPRI珠子。将珠子和样品混合2分钟,再孵育2分钟,并在磁力架上收集5分钟。去除上清液后,将珠子用180μl 80%乙醇洗涤两次各30秒,然后风干1分钟。在21μl水中洗脱核酸。
使用Sure Select XT V6全外显子组+UTR捕获探针和ERCC捕获探针结合SureSelect Custom Reagent试剂盒(Agilent Technologies目录号931170)富集cDNA和ERCC DNA,以形成cf-mRNA测序文库。合并总cDNA文库质量为750-1000ng的最多10个索引化样品。使用真空离心将体积减少至3.4μl。然后将样品与5.6μl SureSelect XT2 Block Mix混合。将9μl样品转移到PCR带管中,密封,在95℃下孵育5分钟,然后在65℃下保持至少5分钟。添加1.5μl水、0.5μl SureSelect RNase Block、6.63μl Hyb1、0.27μl Hyb2、2.65μlHyb3、3.45μl Hyb 4、1μl ERCC捕获文库(Agilent)和5μl捕获文库≥3Mb(均为Exon V660Mb),并将样品在65℃下用加热盖孵育过夜。MyOne链霉亲和素珠(50μl)通过用200μlSureSelect结合缓冲液洗涤四次来制备。将合并的样品加入链霉亲和素珠中,并以1800rpm混合30分钟。用磁体收集珠子,用200μl SureSelect洗涤缓冲液1洗涤15分钟,然后在65℃下用200μl SureSelect洗涤缓冲液2洗涤3次各10分钟。通过在95℃下在20μl水中孵育5分钟从珠子上洗脱核酸,转移到新管中,并与6μl水、25μl 2X Herculase Master Mix和1μlXT2 Primer Mix混合。将样品在98℃下孵育2分钟,于98℃30秒、60℃30秒、72℃1分钟循环15次,在72℃下延伸10分钟,然后保持在4℃。将反应用90μl AMPureXP珠子清洁,并在15μl水中洗脱。通过Kapa qPCR和毛细管电泳分析产物。对于Kapa qPCR,在10mM Tris-HCl,pH 8中制备稀释液。毛细管电泳在生物分析仪上进行。
定量后,测序池根据其大小并按照Illumina的建议进行变性和稀释,以获得最佳聚类。将PhiX对照添加到样品中作为参考。根据NextSeq 500(Illumina)说明书,使用1000uL移液器将所有稀释的文库加载到储库#10中。根据他们的说明书,使用IlluminaBasespace进行测序运行。测序采用配对末端进行,并将读取循环设置为76。选择NextSeq作为测序仪。根据制造商的说明,在NextSeq 500上启动测序运行。
使用FASTQ Generation Application,在BaseSpace平台(Illumina Inc)上进行碱基判定。对于测序数据分析,去除衔接子序列,并使用cutadapt(v1.11)修剪低质量碱基。修剪后短于15个碱基对的读取被排除在后续分析之外。使用STAR(v2.5.2b)与GENCODE v24基因模型,将长于15个碱基对的读取序列与人类参考基因组GRCh38进行比对。使用samtools(v1.3.1)rmdup命令去除重复的读取。
对于细胞类型去卷积,实施归一化,其中每个基因的表达水平除以其在样品中的最大值。此步骤重新调整不同基因之间的表达水平,以避免一些高表达基因对分解过程的支配。然后使用sklearn.decomposition对归一化的表达矩阵进行非负矩阵分解(NMF)分解。Python库Scikit-learn内的NMF。NMF分解通过将表达矩阵分解为两个矩阵的乘积X=WH来实现数据的更简约表示;其中X是具有n个行(n个样品)和m个列(m个基因)的表达矩阵;W是具有n个行(n个样品)和p个列(p个成分)的系数矩阵;而H是具有p个行(p个成分)和m个列(m个基因)的荷载矩阵。从某种意义上说,W是原始矩阵H的汇总,其具有减少的维数。H包含关于每个基因对成分的贡献程度的信息。衍生的成分的生物学解释是通过对最大贡献于每个成分的排名前列的基因进行途径分析来实现的。
对全血和匹配的血浆样品进行测序以鉴定“非血液”基因。如果一个基因在血浆中的归一化表达(每百万个中的转录物,TPM)是全血(含血细胞)中的三倍,则该基因被认为是“非血液”基因。“非血液”基因可能来源于组织和/或器官,而不是血细胞。血细胞多核苷酸具有与血细胞基因对齐的序列,而不是具有与非血液基因对齐的序列的非血液多核苷酸。非血液基因平均代表文库中TPM的18%,范围从11%到24%。非血液基因代表检测到的所有基因的15%(如果TPM≥3,则基因被计为检测到的),范围为8%-24%。表1中列出了本研究中检测到的2,855个非血液基因的列表。本研究中检测到的较低严格性非血液基因的列表在表10中列出。
表1:在无细胞mRNA中检测到的非血液基因
Figure BDA0003141281300000231
Figure BDA0003141281300000241
Figure BDA0003141281300000251
Figure BDA0003141281300000261
Figure BDA0003141281300000271
Figure BDA0003141281300000281
Figure BDA0003141281300000291
Figure BDA0003141281300000301
Figure BDA0003141281300000311
Figure BDA0003141281300000321
Figure BDA0003141281300000331
Figure BDA0003141281300000341
Figure BDA0003141281300000351
Figure BDA0003141281300000361
表10:在无细胞mRNA中检测到的低严格性非血液基因
Figure BDA0003141281300000362
Figure BDA0003141281300000371
Figure BDA0003141281300000381
Figure BDA0003141281300000391
Figure BDA0003141281300000401
Figure BDA0003141281300000411
Figure BDA0003141281300000421
Figure BDA0003141281300000431
Figure BDA0003141281300000441
Figure BDA0003141281300000451
Figure BDA0003141281300000461
Figure BDA0003141281300000471
Figure BDA0003141281300000481
Figure BDA0003141281300000491
Figure BDA0003141281300000501
Figure BDA0003141281300000511
Figure BDA0003141281300000521
Figure BDA0003141281300000531
Figure BDA0003141281300000541
Figure BDA0003141281300000551
Figure BDA0003141281300000561
Figure BDA0003141281300000571
Figure BDA0003141281300000581
Figure BDA0003141281300000591
Figure BDA0003141281300000601
Figure BDA0003141281300000611
Figure BDA0003141281300000621
Figure BDA0003141281300000631
Figure BDA0003141281300000641
Figure BDA0003141281300000651
Figure BDA0003141281300000661
Figure BDA0003141281300000671
Figure BDA0003141281300000681
Figure BDA0003141281300000691
Figure BDA0003141281300000701
Figure BDA0003141281300000711
Figure BDA0003141281300000721
Figure BDA0003141281300000731
Figure BDA0003141281300000741
Figure BDA0003141281300000751
Figure BDA0003141281300000761
Figure BDA0003141281300000771
Figure BDA0003141281300000781
Figure BDA0003141281300000791
实施例2:通过大小分级分离对组织衍生的cf-mRNA的富集
通常,血液中的大多数RNA在血细胞内被发现。制备血清和血浆的方法通常涉及低速旋转,以除去大多数血细胞。然而,残留的血细胞是可能干扰cf-RNA分析的噪音的重要来源。
使用GTEx组织表达数据库来鉴定组织特异性和器官特异性基因。如果基因在一个组织或器官中的表达是在所有其他组织和器官中的表达的至少五倍,则该基因被认为是组织或器官特异性的。本研究中检测的组织特异性和器官特异性基因呈现于表2-7中。
表2:在无细胞mRNA中检测到的组织特异性基因(455)
Figure BDA0003141281300000801
Figure BDA0003141281300000811
Figure BDA0003141281300000821
表3:在无细胞mRNA中检测到的红细胞特异性基因(23)
SPTA1 ALAS2 TRIM10 ANKLE1 SLC6A9 ABCB10
CENPF SPTB HMBS AHSP RHCE YPEL4
ANK1 FHDC1 HBD TRAK2 ATP1B2 CA1
EPB42 ACHE ACSL6 MICALCL IFIT1B
表4:在无细胞mRNA中检测到的血小板特异性基因(326)
Figure BDA0003141281300000822
Figure BDA0003141281300000831
Figure BDA0003141281300000841
表5:在无细胞mRNA中检测到的嗜中性粒细胞特异性基因(239)
Figure BDA0003141281300000842
Figure BDA0003141281300000851
表6:在无细胞mRNA中检测到的脑特异性基因(163)
Figure BDA0003141281300000852
Figure BDA0003141281300000861
表7:在无细胞mRNA中检测到的肝脏特异性基因(63)
PON1 VTN A1BG CYP2C8 APOA2 FGA COLEC10
FMO3 HPX AKR1D1 RBP4 FTCD FGB ADH1A
CPS1 APOC3 C4BPB SLC25A47 CYP3A7 PAH CYP2B6
HSD17B6 KNG1 CYP2E1 NR1I3 PGLYRP2 AGXT ADH4
ITIH1 HRG G6PC AHSG ITIH3 CA5A TAT
GCKR PROC CRP GC ALB INHBC APOC2
APOH SERPINC1 SAA2 MAT1A LIPC PIPOX CFHR1
CLEC4M APOA1 BAAT TDO2 SERPINA6 CYP8B1 HULC
AMBP TTR SLC22A7 HPD FGG ACSM5 CYP2A6
表8和表9列出了用于诊断肝脏特异性疾病和妊娠,但不符合非血液基因的严格标准的目的基因。
表8:在无细胞mRNA中检测到的其他肝脏特异性基因
MBOAT7 PPP1R3B PNPLA3 TM6SF2
表9:在无细胞mRNA中检测到的妊娠相关基因
ALPP CAPN6 CGA CGB CSHL1 LGALS14 PAPPA
FABP1 FGA FGB ITIH2 KNG1 OTC SLC38A4
PLAC4 PSG7 ADAM12 CSH1 GH2
实施例2:通过大小分级分离对组织衍生的cf-mRNA的富集
通常,血液中的大多数RNA在血细胞内被发现。制备血清和血浆的方法通常涉及低速旋转,以除去大多数血细胞。然而,残留的血细胞是可能干扰cf-RNA分析的噪音的重要来源。
对血清或血浆进行的大小选择可以增加实体组织来源的cf-mRNA与血细胞来源的cf-mRNA的比例。为了制备血清或血浆,将细胞以1,600g离心沉降。实施第二个离心步骤以富集组织来源的cf-mRNA。将血浆以不同速度离心10分钟,产生的沉降力范围为1,900g至16,000g,然后进行cf-RNA分离、cDNA合成、文库制备和测序。随着离心速度的增加,来自血细胞成分的RNA转录物——血小板和嗜中性粒细胞转录物(代表来自血细胞的转录物)——比组织特异性转录物如来自肝脏或脑的转录物更快地减少,导致非血液cf-mRNA与血细胞来源的cf-mRNA之比增加(图2A-3B)。这种富集被可检测的组织来源基因数目的减少所抵消(图4)。制备低噪音但具有代表性和多样性的cf-mRNA文库的最佳速度取决于应用,通常范围从10,000g到16,000g。例如,与脑cf-mRNA转录物相比,肝cf-mRNA转录物的分析优选更高的离心速度。16,000g g用于下面给出的结果。
大小选择也通过经由大小截止值为0.8μm、0.45μm或0.2μm的滤膜过滤来进行(图2)。随着孔径的减小,来自血细胞成分的RNA转录物——血小板和嗜中性粒细胞转录物(代表来自血细胞的转录物)——比组织特异性转录物如来自肝脏或脑的转录物更快地减少,导致非血液cf-mRNA与血细胞来源的cf-mRNA之比增加(图2)。
实施例3:cf-mRNA提取方法的选择
评价了各种试剂盒和方法以优化cf-mRNA提取,包括基于苯酚的总cf-RNA提取:TRIzol、miRNeasy(Qiagen)、Direct-zol(Zymo Research)、nucleoZOL(Macherey-Nagel)、mirVana(Life Technologies);基于细胞外囊泡捕获的方法后进行裂解(无论是否基于苯酚):exoRNeasy(Qiagen)、ExoComplete(Hitachi);囊泡的免疫选择或免疫消耗后提取核酸;裂解后进行总RNA/核酸分离:Plasma/Serum RNA Purification Mini试剂盒(Norgen)、QIAamp Circulating Nucleic Acids试剂盒(“CNA试剂盒”)、QIAamp ccfDNA/RNA试剂盒(Qiagen);等等。选择CNA试剂盒是因为它在cf-RNA提取的效率、可扩展性、线性和一致性之间表现出最佳平衡(见图5)。CNA试剂盒是一种总cf-RNA提取试剂盒,它与循环cf-RNA是作为游离RNA进行还是受蛋白质、脂质或囊泡保护无关。
cf-RNA往往在体内降解,并在提取过程中进一步片段化。miRNA通常也比mRNA更短。因此选择了Qiagen的“miRNA纯化”方案,而不是他们的标准“核酸纯化”方案。
对CNA试剂盒提供的方案进行了多种更改,以最大限度地提高提取的效率和一致性。该方案如下调整:(1)不向裂解缓冲液中添加载体RNA,因为它会干扰测序结果;(2)在裂解过程中掺加ERCC外部参考RNA;(3)将裂解缓冲液预热至裂解温度(60℃而不是25℃);(4)将裂解时间从30分钟延长至最少45分钟;(5)增加第二个100%乙醇洗涤步骤,以更好地去除样品中的抑制剂;以及(6)增加第二个核酸洗脱步骤,以更彻底地从柱中去除RNA。与标准核酸纯化方案相比,使用改进方法提取的多核苷酸的大小分布显示出片段化cf-RNA的产量提高(图6A-6B)。使用CNA试剂盒的改进提取方法比QIAamp ccfDNA/RNA试剂盒产生更多的cf-mRNA,并且随着血浆输入的增加或减少显示出更好的线性(图7)。
向方案中引入专门的酶促DNA酶步骤以去除DNA污染和残留。低水平的DNA污染可能是基因表达定量错误的来源,并且可能与cf-RNA分离相关,因为血清或血浆中的cf-RNA量极低。一些可商购获得的cf-RNA提取试剂盒要么省略去除DNA的步骤(例如,许多基于苯酚的试剂盒),要么推荐柱上DNA酶I处理,这对于完全去除DNA可能不是最佳的。事实上,DNA酶I可能对RNA提取过程中富含的盐敏感,并且在DNA浓度低时可能效率低下,这在采用无细胞生物流体时可能会发生。Turbo DNase(Ambion)是DNA酶I的突变形式,对DNA具有提高的亲和力,因为在去除痕量DNA方面特别有效并且对抑制剂具有更强的抗性而使用。DNA酶处理按照Ambion方案进行,不同之处是酶量增加至每个样品2.5-3μl酶。DNA酶I处理消除了大量污染核酸,否则其会干扰cf-RNA分析(图8)。
滴定提取的材料向下游反应中的输入揭示了来自血液的抑制剂的不同痕迹,这些抑制剂降低生化反应的效率。因此,在DNA酶处理后进行抑制剂去除和基于硅胶膜的纯化步骤。使用OneStep PCR Inhibitor Removal试剂盒(Zymo)进行了抑制剂去除,并进行额外的柱洗涤以确保制备缓冲液的完全去除。在该柱上的净化通过去除干扰酶的污染物增加了cf-RNA的表观产量,并且OneStep柱的表观产量高于Micro Bio-Spin柱(Bio-Rad)(图9)。使用OneStep PCR Inhibitor Removal试剂盒进行的净化也保留了片段化的cf-RNA多核苷酸的回收率(图10A-10B)。使用较大体积的乙醇,用MinElute PCR纯化试剂盒(Qiagen)进行硅胶膜纯化,以使回收率最大化。
最终的cf-RNA提取和纯化过程显著降低了由于低于20pg RNA的次优产量而导致的测定失败频率,并使用一系列输入体积(100ul至3ml)提供了无细胞mRNA的有效且线性的回收(图11-12)。
实施例4:cDNA合成、文库制备和全外显子组捕获
可商购获得的低输入RNA测序试剂盒通常包括用于cDNA合成和去除非信息性RNA物质的试剂。发现SMARTer(Takara)中的cDNA合成步骤效率低下。因此,开发了三步策略,其中包括专门的初始cDNA合成步骤、第二链合成反应和针对从低水平dsDNA制备文库优化的市售试剂盒,随后捕获全外显子组。
选择SuperScript IV(Invitrogen)作为逆转录酶,因为与iScript(Bio-Rad)、qScript(Quantabio)、Superscript III(Invitrogen)和SMARTScribe(Takara)相比,它表现出随cf-RNA输入提高的酶效率、线性和对痕量抑制剂的抗性。采用SuperScript IV的转化效率通过以下方式进一步优化:(1)使用随机六聚体而不是寡聚dT进行引发,(2)将引物浓度增加30倍至3mg/ml,以及(3)将反应时间从10分钟延长到50分钟作为预防措施。优化的SuperScript IV方法比iScript产生更多的cDNA(图13),并且具有比SMARTScribe更好的线性度(图14)。
使用NEBNext酶在第二链合成反应中生成双链cDNA。在第一链和第二链合成之间不进行净化。通过将使用的试剂和总反应体积减少50%来优化第二链合成反应。
与Accel-NGS 1S Plus(Swift Biosciences)和其他如
Figure BDA0003141281300000901
UltraLow DNALibrary Preparation试剂盒(Lucigen)相比,发现Accel-NGS 2S Plus是由少量输入cDNA生成测序文库的最稳健且可扩展的文库制备方法。特别是,与Accel-NGS 1S Plus相比,使用Accel-NGS2S Plus的独特序列片段数增加了大约30%(图15A)。来自NEBNext第二链合成步骤的剩余的试剂与Accel-NGS 2S Plus的修复I步骤的化学不相容。因此,在修复I之前使用1.8X SPRI珠清洁cDNA。为了使样品损失最小化,在溶液中用SPRI珠进行修复I,并在修复I后添加聚乙二醇(PEG)以促进DNA与珠子的结合。为了使回收率最大化,同时避免包括适体和二聚体在内的污染物,将珠子的量调整为对于修复I为1.8X,对于修复II为1.65,对于连接I为1.65,而对于连接II为1.4。对Accel-NGS 2S Plus方案的这些修改使独特序列片段数增加了大约20%(图15B)。
在PCR期间和富集之前,每个文库制备物的两端都用UDI独特地标记。选择UDI而不是标准索引,以使索引跳跃最小化,鉴于输入材料的低拷贝数,这对于cf-RNA文库尤其重要。当使用标准索引时,测序读取被错误地分配给阴性对照(NTC)。通过使用UDI可以减少这种污染(图16A-16B)。
通过全外显子组捕获从总cf-RNA中富集cf-mRNA。选择该方法而不是rRNA消耗是因为mRNA占循环中RNA分子的不到10%。使用RNA诱饵(Agilent)或DNA捕获探针(IDT)进行捕获。由于对特定目的区域的覆盖率更高,因此RNA诱饵是优选的。但是,这两者都可以使用。为了归一化和质量控制,全外显子组探针与另一组探针相组合,所述另一组探针旨在捕获35个ERCC标准品,涵盖宽范围的拷贝数和大小,在提取步骤过程中掺加。根据Agilent方案的修改形式,使用XT2阻断剂和试剂与XT探针,对多达10个cDNA样品的池进行捕获。由mRNA和其他来源如核糖体RNA、线粒体RNA、非编码RNA和其他RNA物质产生的RNA多核苷酸的百分比通过测序来确定,以比较不同的富集策略。与通过rRNA消耗和总RNA起始池进行的负富集相比,全外显子组捕获的mRNA分数要高得多(图17)。特别是,来自全外显子捕获材料的序列读取中大约80%是mRNA序列,rRNA消耗后大约45%的序列是mRNA序列,来自总RNA的序列中不到5%是mRNA序列。
与使用SMARTer试剂盒构建并消耗rRNA的文库相比,本节中介绍的cDNA合成、文库制备和全外显子组捕获方法产生的测序读取更能代表广谱cf-mRNA。检测少量掺加ERCC标准品的灵敏度提高了5到20倍(图18A)。这种增加的灵敏度促进了对明显更多蛋白质编码基因的检测(图18B)。使用已知浓度的掺加ERCC标准品,检测灵敏度估计为大约14个拷贝(图18C)。
实施例5:与其他cf-mRNA文库的比较
通过实施例1的方法制备的无细胞mRNA文库优于“Pan等人”的无细胞mRNA文库(Pan等人,Clin Chem.2017年11月;63(11):1695-1704)。对于该分析,来自这两项研究的原始测序数据均使用实施例1中描述的生物信息学管道进行加工。Pan文库由每次制备相当于500μl的血清来制备,而每次制备仅使用165μl血清来制备实施例1文库。尽管每次制备的测序读取减少了大约两倍(图19A),但实施例1方案(通过以16,000g离心和采用DNA捕获探针进行富集来修改)产生了大约6倍的独特片段(图19B),大约三倍的蛋白质编码基因(图19C),大约四倍的>80%覆盖的基因(图19D),以及大约8倍的肝脏基因(图19E)。
虽然本文已经示出并描述了本公开的优选实施方案,但对于本领域技术人员明显的是,这些实施方案仅以示例的方式提供。在不脱离本公开内容的情况下,本领域技术人员将会想到许多变化、改变和替换。应当理解,在实施本公开时可以采用本文所述本公开的实施方案的各种替代方案。旨在以所附权利要求书限定本公开的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同物。

Claims (86)

1.一种制备cf-RNA样品的方法,该方法包括:
(a)以1,600g至16,000g离心生物样品;以及
(b)从所述生物样品中分离RNA;
其中至少500、600、700、800、900、1000、1100、1200、1300、1400或1500个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因存在于所述cf-RNA样品中。
2.根据权利要求1所述的方法,其中所述生物样品是无细胞的。
3.根据权利要求1或2所述的方法,其中所述生物样品是血清、血浆、唾液、尿液、组织液、脑脊液、精液、阴道液、羊水、眼泪、滑液、粘液或淋巴液。
4.根据权利要求1-3中任一项所述的方法,其中所述生物样品是血清或血浆。
5.根据权利要求1-4中任一项所述的方法,其进一步包括在(b)之前在所述生物样品中进行大小选择或免疫选择。
6.根据权利要求5所述的方法,其中进行大小选择包括所述生物样品的离心。
7.根据权利要求6所述的方法,其中所述离心进行至少1分钟、至少10分钟、5分钟至20分钟、10分钟至15分钟或约10分钟。
8.根据权利要求5所述的方法,其中进行大小选择包括过滤所述样品。
9.根据权利要求1-8中任一项所述的方法,其中所述生物样品以10,000g至15,000g离心。
10.根据权利要求1-9中任一项所述的方法,其中所述生物样品以约12,000g离心。
11.根据权利要求1-10中任一项所述的方法,其中(b)包括从所述生物样品中分离细胞外囊泡,以及从所述细胞外囊泡中分离RNA。
12.根据权利要求11所述的方法,其中所述细胞外囊泡是外来体。
13.根据权利要求1-12中任一项所述的方法,其中(b)包括从所述生物样品中分离核蛋白复合物,以及从所述核蛋白复合物中分离RNA。
14.根据权利要求1-13中任一项所述的方法,其进一步包括用脱氧核糖核酸酶处理所述RNA。
15.根据权利要求14所述的方法,其中所述脱氧核糖核酸酶是TurboDNase I。
16.根据权利要求14或15所述的方法,其中当用所述脱氧核糖核酸酶处理时,所述RNA在溶液中。
17.根据权利要求1-16中任一项所述的方法,其中(b)包括使所述RNA与亲和柱、脱盐柱或硅胶膜中的至少一种接触。
18.根据权利要求17所述的方法,其中(b)包括使所述RNA与亲和柱、脱盐柱和硅胶膜接触。
19.根据权利要求1-18中任一项所述的方法,其进一步包括富集至少一种蛋白质编码核苷酸序列。
20.根据权利要求1-19中任一项所述的方法,其包括从所述RNA中消耗核糖体RNA序列。
21.一种鉴定cf-RNA分子的方法,该方法包括:
(a)从生物样品中分离RNA;
(b)由所述RNA制备cDNA文库;
(c)对所述cDNA文库进行测序;以及
(d)鉴定所述cDNA文库中的至少一个基因,其中所述生物样品基本上是无细胞的,并且其中检测至少500、600、700、800、900、1000、1100、1200、1300、1400或1500个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因。
22.根据权利要求21所述的方法,其中所述生物样品是无细胞的。
23.根据权利要求21或22所述的方法,其进一步包括(e)将来自所述cDNA文库的序列与参考基因组进行比对。
24.根据权利要求21-23中任一项所述的方法,其中所述生物样品是血清、血浆、唾液、尿液、组织液、脑脊液、精液、阴道液、羊水、眼泪、滑液、粘液或淋巴液。
25.根据权利要求21-23中任一项所述的方法,其中所述生物样品是血清或血浆。
26.根据权利要求21-25中任一项所述的方法,其中鉴定至少35、50、75、100、200、300、400或500个选自表2的组织特异性基因。
27.根据权利要求21-25中任一项所述的方法,其中鉴定至少20、30、40、50、100或150个选自表6的脑特异性基因。
28.根据权利要求21-25中任一项所述的方法,其中鉴定至少3、5、10、20或50个选自表7的肝脏特异性基因或一个选自表8的肝脏诊断基因。
29.根据权利要求21-25中任一项所述的方法,其中鉴定至少3、5、10或15个选自表9的妊娠相关基因。
30.根据权利要求21-28中任一项所述的方法,其中鉴定第一基因,并且其中所述RNA包含少于500、200、150、100、50、25或15个与所述第一基因对齐的cf-mRNA多核苷酸。
31.根据权利要求21-30中任一项所述的方法,其中每100次读取检测至少2、4、6、8或10个独特片段。
32.根据权利要求21-31中任一项所述的方法,其中每10,000次读取检测至少2、4、6、8或10个蛋白质编码基因。
33.根据权利要求21-32中任一项所述的方法,其进一步包括在(b)之前在所述生物样品中进行大小选择或免疫选择。
34.根据权利要求33所述的方法,其中进行大小选择包括所述生物样品的离心。
35.根据权利要求34所述的方法,其进一步包括以1,600g至16,000g离心所述生物样品。
36.根据权利要求35所述的方法,其中所述离心进行至少1分钟、至少5分钟、至少10分钟、5分钟至20分钟、10分钟至15分钟或约10分钟。
37.根据权利要求35或36所述的方法,其中所述生物样品以10,000g至15,000g离心。
38.根据权利要求35或36所述的方法,其中所述生物样品以约12,000g离心。
39.根据权利要求34所述的方法,其中进行大小选择包括过滤所述样品。
40.根据权利要求21-39中任一项所述的方法,其中(a)包括从所述生物样品中分离细胞外囊泡,以及从所述细胞外囊泡中分离RNA。
41.根据权利要求40所述的方法,其中所述细胞外囊泡是外来体。
42.根据权利要求21-41中任一项所述的方法,其中(a)包括从所述生物样品中分离核蛋白复合物,以及从所述核蛋白复合物中分离RNA。
43.根据权利要求21-42中任一项所述的方法,其进一步包括将包含第一核苷酸序列的外源RNA多核苷酸添加至所述生物样品,并检测包含所述第一核苷酸序列的cDNA多核苷酸,其中所述cDNA多核苷酸的第一核苷酸序列在所述RNA多核苷酸的第一核苷酸序列包含尿嘧啶的每个位置包含胸腺嘧啶。
44.根据权利要求21-43中任一项所述的方法,其进一步包括用脱氧核糖核酸酶处理所述RNA。
45.根据权利要求44所述的方法,其中所述脱氧核糖核酸酶是TurboDNase I。
46.根据权利要求44或45所述的方法,其中当用所述脱氧核糖核酸酶处理时,所述RNA在溶液中。
47.根据权利要求21-46中任一项所述的方法,其中(a)包括使所述RNA与亲和柱、脱盐柱或硅胶膜中的至少一种接触。
48.根据权利要求47所述的方法,其中(a)包括使所述RNA与亲和柱、脱盐柱和硅胶膜接触。
49.根据权利要求21-48中任一项所述的方法,其中(b)包括使所述RNA与包含随机序列的引物接触。
50.根据权利要求49所述的方法,其中所述引物是六核苷酸。
51.根据权利要求50所述的方法,其中所述六核苷酸的浓度为至少60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μM或1500μM。
52.根据权利要求21-51中任一项所述的方法,其中(b)包括形成单链cDNA。
53.根据权利要求52所述的方法,其进一步包括使所述RNA与逆转录酶接触,以形成所述单链cDNA。
54.根据权利要求51-53中任一项所述的方法,其进一步包括由所述单链cDNA形成双链cDNA。
55.根据权利要求54所述的方法,其进一步包括使所述单链DNA与NEBNext DNA聚合酶接触,以形成所述双链cDNA。
56.根据权利要求55所述的方法,其进一步包括将独特的双重索引连接至所述双链cDNA的两端。
57.根据权利要求21-56中任一项所述的方法,其进一步包括富集至少一种蛋白质编码核苷酸序列。
58.根据权利要求57所述的方法,其包括从所述RNA中消耗核糖体RNA序列。
59.根据权利要求57所述的方法,其包括从所述cDNA文库中消耗核糖体RNA序列。
60.根据权利要求57-59中任一项所述的方法,其包括从所述RNA中分离所述至少一种蛋白质编码序列。
61.根据权利要求57-59中任一项所述的方法,其包括从所述cDNA中分离所述至少一种蛋白质编码序列。
62.根据权利要求61所述的方法,其包括使全外显子组诱饵与所述cDNA杂交。
63.根据权利要求62所述的方法,其中所述全外显子诱饵包含RNA多核苷酸。
64.根据权利要求62所述的方法,其中所述全外显子诱饵包含DNA多核苷酸。
65.一种检测生物样品中的至少10、20、30、50或100个非血液cf-mRNA基因的方法,该方法包括:
(a)将血清或血浆样品以8,000g至16,000g离心至少10分钟,以形成上清液;
(b)从所述上清液中提取RNA;
(c)使所述RNA与脱氧核糖核酸酶接触;
(d)由所述RNA形成cDNA;
(e)由所述cDNA制备cDNA文库;
(f)对所述cDNA文库进行测序;以及
(g)将序列与参考基因组进行比对,以鉴定每个生物样品由至少10、20、30、50或100个非血液cf-mRNA基因产生的序列。
66.根据权利要求65所述的方法,其进一步包括(h)使所述cDNA文库与包含来自至少10、20、30、50或100个目的基因的多核苷酸片段的诱饵接触,以富集翻译的基因。
67.根据权利要求65所述的方法,其中(d)包括使所述RNA与逆转录酶接触以形成单链cDNA,并使所述单链cDNA与第二链合成酶接触以形成双链cDNA。
68.根据权利要求65所述的方法,其中(e)进一步包括将独特的双重索引连接至所述cDNA文库,以形成索引化的cDNA文库。
69.根据权利要求68所述的方法,其进一步包括合并至多十个索引化的cDNA文库。
70.根据权利要求69所述的方法,其中(f)包括对合并的cDNA文库进行大规模平行测序。
71.根据权利要求65-70中任一项所述的方法,其中在所述生物样品中检测至少25、50、75、100、200、300、400、500、600、700、800、900或1000个基因。
72.根据权利要求65-71中任一项所述的方法,其中将所述序列与参考基因组进行比对,以鉴定每个生物样品由至少25、50、75、100、200、300、400、500、600、700、800、900或1000个非血液cf-mRNA基因产生的序列。
73.根据权利要求65-70中任一项所述的方法,其进一步包括使所述单链cDNA与第二链合成酶接触,以形成所述双链cDNA。
74.根据权利要求65-70中任一项所述的方法,其中(c)在溶液中进行。
75.一种检测生物样品中的至少10、20、30、50或100个非血液cf-mRNA基因的方法,该方法包括:
(a)以1,900g至16,000g离心或过滤血清或血浆样品;
(b)从上清液中提取RNA样品;
(c)使所述RNA样品与脱氧核糖核酸酶接触;
(d)使所述RNA与逆转录酶接触,以形成单链cDNA;
(e)使所述单链cDNA与第二链合成酶接触,以形成双链cDNA;
(f)由所述双链cDNA制备cDNA文库;
(g)使索引化的cDNA文库与包含多核苷酸片段的诱饵接触,以富集翻译的基因;
(h)对所述cDNA文库进行测序;以及
(i)将序列与参考基因组进行比对,以鉴定每个生物样品由至少10、20、30、50或100个非血液cf-mRNA基因产生的序列。
76.根据权利要求65所述的方法,其进一步包括(j)将独特的双重索引连接至所述cDNA文库,以形成索引化的cDNA文库。
77.根据权利要求66所述的方法,其进一步包括(k)合并至多十个索引化的cDNA文库。
78.根据权利要求77所述的方法,其进一步包括(l)对合并的cDNA文库进行大规模平行测序。
79.根据权利要求75-78中任一项所述的方法,其中(c)在溶液中进行。
80.一种cf-mRNA测序文库,其包含由至少500、600、700、800、900、1000、1250或1500个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因产生的cDNA分子。
81.一种cf-mRNA测序文库,其包含至少一个cDNA分子,该cDNA分子由每1,000,000个cDNA多核苷酸至少25、50、100、200、300、400、500、600、700、800、900或1000个选自表1中的列表的非血液基因或选自表10的低严格性非血液基因产生。
82.根据权利要求80或81所述的cf-mRNA测序文库,其包含由至少35、50、100、200、300、400或500个选自表2的组织特异性基因产生的cDNA分子。
83.根据权利要求80或81所述的cf-mRNA测序文库,其包含由至少18、20、50或100个选自表6的脑特异性基因产生的cDNA分子。
84.根据权利要求80或81所述的cf-mRNA测序文库,其包含由至少3、5、10、20或50个选自表7的肝脏特异性基因或选自表8的目的肝脏基因产生的cDNA分子。
85.根据权利要求80或81所述的cf-mRNA测序文库,其包含由至少3、5、10或15个选自表9的妊娠相关基因产生的cDNA分子。
86.一种cf-mRNA测序文库,其包含由至少2000、3000、4000、5000或6000个蛋白质编码基因产生的cDNA多核苷酸,其中至少8%、15%或24%的所述蛋白质编码基因是非血液基因。
CN201980087396.9A 2018-10-30 2019-10-30 无细胞rna文库制备 Pending CN114072546A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862752533P 2018-10-30 2018-10-30
US62/752,533 2018-10-30
PCT/US2019/058961 WO2020092646A1 (en) 2018-10-30 2019-10-30 Cell-free rna library preparations

Publications (1)

Publication Number Publication Date
CN114072546A true CN114072546A (zh) 2022-02-18

Family

ID=70463885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980087396.9A Pending CN114072546A (zh) 2018-10-30 2019-10-30 无细胞rna文库制备

Country Status (7)

Country Link
US (1) US20220081685A1 (zh)
EP (1) EP3874079A4 (zh)
JP (1) JP2022509535A (zh)
CN (1) CN114072546A (zh)
AU (1) AU2019372123A1 (zh)
CA (1) CA3117675A1 (zh)
WO (1) WO2020092646A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12112833B2 (en) 2020-02-04 2024-10-08 10X Genomics, Inc. Systems and methods for index hopping filtering
WO2023048713A1 (en) * 2021-09-23 2023-03-30 Genomic Testing Cooperative, LCA Compositions and methods for targeted ngs sequencing of cfrna and cftna
US11866707B2 (en) 2022-05-18 2024-01-09 Zhejiang Cancer Hospital Use of non-coding RNA SNHG17 as biomarker and therapeutic target
CN114959041B (zh) * 2022-06-19 2023-08-22 瓯江实验室 抑制结直肠癌增殖转移的新靶标与诊断标志物及其应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130012405A1 (en) * 2011-06-17 2013-01-10 Genisphere, Llc Circulating miRNA Biomaker Signatures
CN105518151A (zh) * 2013-03-15 2016-04-20 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
CN107002132A (zh) * 2014-11-14 2017-08-01 液体基因有限公司 循环无细胞rna用于诊断和/或监测癌症的用途
WO2018057928A1 (en) * 2016-09-23 2018-03-29 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
CN108603232A (zh) * 2015-12-03 2018-09-28 阿尔佛雷德医疗集团 监测骨髓瘤的治疗或进展
WO2019060369A1 (en) * 2017-09-20 2019-03-28 Molecular Stethoscope, Inc. METHODS AND SYSTEMS FOR DETECTION OF TISSUE DISORDERS

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180126003A1 (en) * 2016-05-04 2018-05-10 Curevac Ag New targets for rna therapeutics

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130012405A1 (en) * 2011-06-17 2013-01-10 Genisphere, Llc Circulating miRNA Biomaker Signatures
CN105518151A (zh) * 2013-03-15 2016-04-20 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
CN107002132A (zh) * 2014-11-14 2017-08-01 液体基因有限公司 循环无细胞rna用于诊断和/或监测癌症的用途
CN108603232A (zh) * 2015-12-03 2018-09-28 阿尔佛雷德医疗集团 监测骨髓瘤的治疗或进展
WO2018057928A1 (en) * 2016-09-23 2018-03-29 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
WO2019060369A1 (en) * 2017-09-20 2019-03-28 Molecular Stethoscope, Inc. METHODS AND SYSTEMS FOR DETECTION OF TISSUE DISORDERS

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HONGGANG LI等: "Cell-Free Seminal mRNA and MicroRNA Exist in Different Forms", PLOS ONE, vol. 7, no. 4, pages 1 - 8 *
王侦等: "血浆血清中游离核酸用于分子诊断的研究进展", 广东医学, vol. 32, no. 17, pages 2354 - 2356 *

Also Published As

Publication number Publication date
EP3874079A4 (en) 2022-11-09
WO2020092646A1 (en) 2020-05-07
US20220081685A1 (en) 2022-03-17
AU2019372123A1 (en) 2021-06-17
CA3117675A1 (en) 2020-05-07
EP3874079A1 (en) 2021-09-08
JP2022509535A (ja) 2022-01-20

Similar Documents

Publication Publication Date Title
CN114072546A (zh) 无细胞rna文库制备
JP6324962B2 (ja) 標的rna枯渇化組成物を調製するための方法およびキット
US8808990B2 (en) Serial isolation of multiple DNA targets from stool
EP3529374B1 (en) Sequencing and analysis of exosome associated nucleic acids
WO2014201273A1 (en) High-throughput rna-seq
EP3679135B1 (en) Normalization for sequencing libraries
WO2012002541A1 (ja) 標的分子の検出法
Quackenbush et al. Isolation of circulating microRNAs from microvesicles found in human plasma
JP2022160425A (ja) 次世代配列決定法を用いた標的タンパク質の集団的定量方法とその用途
CN111979307A (zh) 用于检测基因融合的靶向测序方法
CN106459965A (zh) 分离多聚(a)核酸的方法
EP2679689B1 (en) Method for improved quantification of miRNAs
KR20180041331A (ko) 분자결합핵산 선정과 표적분자 동정 방법 및 키드, 그리고 그들의 용도
US20230032847A1 (en) Method for performing multiple analyses on same nucleic acid sample
Carbonell Sala et al. Annotation of full-length long noncoding RNAs with capture long-read sequencing (CLS)
US20220002797A1 (en) Full-length rna sequencing
US10577645B2 (en) Methods and kits for improving global gene expression analysis of human blood, plasma and/or serum derived RNA
US10287625B2 (en) Methods and kits for separating nucleic acids by size
Fontanez et al. Intrinsic molecular identifiers enable robust molecular counting in single-cell sequencing
Fettke An error-corrected panel-based next-generation sequencing assay for ultra-sensitive somatic mutation detection in ctDNA
WO2024117970A1 (en) Method for efficient multiplex detection and quantification of genetic alterations
WO2004035785A1 (ja) ヒトハウスキーピング遺伝子とヒト組織特異的遺伝子
EP4392577A1 (en) Optimised set of oligonucleotides for bulk rna barcoding and sequencing
Acid et al. MA, USA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40070073

Country of ref document: HK

CB03 Change of inventor or designer information

Inventor after: Niraj salatia

Inventor after: Michael Nellenberg

Inventor after: Aketz Ibara

Inventor after: Zhuang Jiali

Inventor before: Niraj salatia

Inventor before: Michael Nellenberg

Inventor before: Aketz Ibara

Inventor before: Zhuang Jiali

CB03 Change of inventor or designer information
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220218

WD01 Invention patent application deemed withdrawn after publication