Nothing Special   »   [go: up one dir, main page]

CN118510907A - 诱饵多核苷酸在单细胞多组学中的应用 - Google Patents

诱饵多核苷酸在单细胞多组学中的应用 Download PDF

Info

Publication number
CN118510907A
CN118510907A CN202280073721.8A CN202280073721A CN118510907A CN 118510907 A CN118510907 A CN 118510907A CN 202280073721 A CN202280073721 A CN 202280073721A CN 118510907 A CN118510907 A CN 118510907A
Authority
CN
China
Prior art keywords
oligonucleotide
cell
target
target binding
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280073721.8A
Other languages
English (en)
Inventor
宋慧媛
乔迪·马丁
玛格丽特·纳卡莫托
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Becton Dickinson and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Becton Dickinson and Co filed Critical Becton Dickinson and Co
Publication of CN118510907A publication Critical patent/CN118510907A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6842Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/948Hydrolases (3) acting on peptide bonds (3.4)
    • G01N2333/95Proteinases, i.e. endopeptidases (3.4.21-3.4.99)
    • G01N2333/958Proteinases, i.e. endopeptidases (3.4.21-3.4.99) derived from fungi

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本文公开的内容包括用于在降低噪声中使用诱饵寡核苷酸的系统、方法、组合物和试剂盒。在一些实施方案中,本文提供的诱饵寡核苷酸可以防止或减少细胞内靶结合试剂特异性寡核苷酸或蛋白质靶结合试剂特异性寡核苷酸与非靶细胞/内源性核酸的不合意的非特异性结合,并且因此减少本文提供的方法中的噪声,诸如例如,单细胞多组学分析。

Description

诱饵多核苷酸在单细胞多组学中的应用
相关申请
本申请根据35U.S.C.§119(e)要求2021年8月31日提交的美国临时专利申请第63/239,367号的权益,该相关申请的内容出于所有目的通过引用以其整体并入本文。
对序列表的引用
本申请连同电子格式的序列表一起提交。序列表作为题为68EB-317321-WO的文件提供,该文件创建于2022年8月27日,大小是32.0千字节。将电子格式的序列表的信息通过引用以其整体并入本文。
背景
领域
本文公开的内容大体上涉及分子生物学领域,例如单细胞多组学。
对相关技术的描述
寡核苷酸缀合的抗体已用于许多基因组学应用,包括涉及细胞表面和/或细胞内蛋白质的单细胞多组学分析。在NGS应用中使用分子索引极大地提高了在样品中单个起始量的大动态范围内同时检测和定量许多核酸的准确性。对于NGS应用,在附接至高亲和力抗体的条形码化寡核苷酸上使用独特分子索引(UMI)提高了蛋白质基因组分析的准确性和动态范围。与抗体-荧光团缀合物不同,抗体-寡核苷酸缀合物容易发生非特异性结合,并且难以到达其特异性靶点。非特异性结合在被透化以接近细胞内蛋白质的细胞或组织中加剧。此外,抗体寡核苷酸上UMI的存在导致与内源性核酸的意外互补。需要开发解决这些与非特异性结合相关的问题的方法。
概述
本文公开的内容包括用于使用阻断试剂以减少条形码寡核苷酸与非靶核酸的不合意的非特异性结合的方法、组合物和试剂盒。
本文公开的内容包括用于检测细胞中蛋白质靶表达和核酸靶拷贝数的方法。该方法可以包括:使各自包含多于一种蛋白质靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定;使多于一个细胞透化;使多于一个细胞与包含能够与一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸的阻断试剂接触;使多于一种蛋白质靶结合试剂与多于一个细胞接触,其中多于一种蛋白质靶结合试剂中的每一种包含蛋白质靶结合试剂特异性寡核苷酸,该蛋白质靶结合试剂特异性寡核苷酸包含用于蛋白质靶结合试剂特异性寡核苷酸的独特蛋白质靶标识符,并且其中蛋白质靶结合试剂能够特异性结合多于一种蛋白质靶中的至少一种;将与蛋白质靶结合试剂关联的多于一个细胞分区至多于一个分区,其中多于一个分区中的分区包含来自与蛋白质靶结合试剂关联的多于一个细胞的单细胞;在包含单细胞的分区中,使多于一种寡核苷酸条形码与核酸靶的拷贝和蛋白质靶结合试剂特异性寡核苷酸接触进行杂交,其中寡核苷酸条形码各自包含第一分子标记;使与蛋白质靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸,所述多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸各自包含与独特蛋白质靶标识符序列的至少一部分互补的序列和第一分子标记;使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记;获得多于一种条形码化核酸分子或其产物的序列信息,以确定多于一个细胞中的一个或更多个细胞中核酸靶的拷贝数;以及获得多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定在多于一个细胞中的一个或更多个中存在多于一种蛋白质靶中的至少一种蛋白质靶。在一些实施方案中,多于一种蛋白质靶包括细胞表面蛋白质靶、细胞内蛋白质靶或其组合。在一些实施方案中,获得多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定在多于一个细胞中的一个或更多个中存在多于一种蛋白质靶中的至少一种蛋白质靶,包括确定在多于一个细胞中的一个或更多个中多于一种蛋白质靶中的至少一种蛋白质靶的拷贝数。
本文公开的内容包括用于测量细胞内靶表达和细胞中核酸靶的拷贝数的方法。该方法可以包括:使各自包含多于一种细胞内靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定;使多于一个细胞透化;使多于一个细胞与阻断试剂接触,所述阻断试剂包含能够与一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸;使多于一种细胞内靶结合试剂与多于一个细胞接触,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸。所述细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中细胞内靶结合试剂能够与多于一种细胞内靶中的至少一种特异性结合;将与细胞内靶结合试剂关联的多于一个细胞分区至多于一个分区,其中多于一个分区中的分区包含来自与细胞内靶结合试剂关联的多于一个细胞的单细胞;在包含单细胞的分区中,使多于一种寡核苷酸条形码与核酸靶的拷贝和细胞内靶结合试剂特异性寡核苷酸接触进行杂交,其中寡核苷酸条形码各自包含第一分子标记;使与细胞内靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞内靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸各自包含与独特细胞内靶标识符序列的至少一部分互补的序列和第一分子标记;使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记;获得多于一种条形码化核酸分子或其产物的序列信息,以确定多于一个细胞中的一个或更多个中核酸靶的拷贝数;以及获得多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定多于一个细胞中的一个或更多个中多于一种细胞内靶中的至少一种细胞内靶的拷贝数。
本文公开的内容包括用于测量细胞内靶表达、细胞表面靶表达和细胞中核酸靶的拷贝数的方法。该方法可以包括:使包含多于一种细胞内靶、多于一种细胞表面靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定;使多于一个细胞透化;使多于一个细胞与阻断试剂接触,所述阻断试剂包含能够与一种或更多种非靶核酸的至少一种杂交的多于一种诱饵寡核苷酸;使多于一种细胞内靶结合试剂与多于一个细胞接触,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,所述细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中细胞内靶结合试剂能够与多于一种细胞内靶中的至少一种特异性结合;使多于一种细胞表面靶结合试剂和与细胞内靶结合试剂关联的多于一个细胞接触,其中多于一种细胞表面靶结合试剂中的每一种包含细胞表面靶结合试剂特异性寡核苷酸,所述细胞表面靶结合试剂特异性寡核苷酸包含用于细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符,并且其中细胞表面靶结合试剂能够与多于一种细胞表面靶中的至少一种特异性结合;将与细胞内靶结合试剂和细胞表面靶结合试剂关联的多于一个细胞分区至多于一个分区,其中多于一个分区中的分区包含来自与细胞内靶结合试剂和细胞表面靶结合试剂关联的多于一个细胞的单细胞;在包含单细胞的分区中,使多于一种寡核苷酸条形码与细胞表面靶结合试剂特异性寡核苷酸和细胞内靶结合试剂特异性寡核苷酸和核酸靶的拷贝接触进行杂交,其中寡核苷酸条形码各自包含第一分子标记;使与细胞内靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化细胞内靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸各自包含与独特细胞内靶标识符序列的至少一部分互补的序列和第一分子标记;使与细胞表面靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸各自包含与独特细胞表面靶标识符序列的至少一部分互补的序列和第一分子标记;使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记;获得多于一种条形码化核酸分子或其产物的序列信息,以确定多于一个细胞中的一个或更多个中核酸靶的拷贝数;获得多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定多于一个细胞中的一个或更多个中多于一种细胞表面靶中的至少一种细胞表面靶的拷贝数;以及获得多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定多于一个细胞中的一个或更多个中多于一种细胞内靶中的至少一种细胞内靶的拷贝数。
使多于一个细胞与阻断试剂接触可以在使多于一个细胞固定和透化的同时或之后进行。在一些实施方案中,多于一个诱饵寡核苷酸中的每一个能够与非靶核酸的至少一部分杂交。诱饵寡核苷酸可以包含与非靶核酸的至少一部分互补的序列。在一些实施方案中,诱饵寡核苷酸包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的序列相同或基本相似的序列。序列长度可以是例如3-40个核苷酸。
诱饵寡核苷酸可以与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸具有至多50%的序列同一性。在一些实施方案中,诱饵寡核苷酸不包含UMI。诱饵寡核苷酸可以包含随机序列,并且任选地,随机序列的长度为约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸。在一些实施方案中,诱饵寡核苷酸不包含具有多于4个、5个、6个或7个连续T或A的任何序列。在一些实施方案中,诱饵寡核苷酸在每4个、5个、6个或7个连续的核苷酸中包含至少一个G或C。在一些实施方案中,诱饵寡核苷酸包含一种或更多种修饰的核苷酸。在一些实施方案中,诱饵寡核苷酸包含5’修饰,并且任选地,5’修饰包含5’氨基修饰物C12修饰(5AmMC12)。在一些实施方案中,诱饵寡核苷酸包含3’修饰,并且任选地,3’修饰包含3’双脱氧-C修饰(ddC)。诱饵寡核苷酸的长度可以是例如30个至65个核苷酸。
在一些实施方案中,在包含单细胞的分区中,在15℃-65℃使单细胞与裂解缓冲液接触以裂解单细胞,其中裂解缓冲液包含能够解离蛋白质-核酸复合体的剂。核酸靶可以是RNA,例如mRNA。在一些实施方案中,使多于一个细胞固定包括使多于一个细胞与固定剂接触。例如,固定剂可以包括非交联固定剂,任选地非交联固定剂包括甲醇。在一些实施方案中,固定剂包括交联剂。在一些实施方案中,交联剂包括可裂解交联剂。在一些实施方案中,可裂解交联剂包括或衍生自二硫代双(琥珀酰亚胺基丙酸酯)(DSP)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。在一些实施方案中,可裂解交联剂包含选自由以下组成的组的可裂解连接:化学可裂解连接、光可裂解连接、酸不稳定接头、热敏感性连接、酶促可裂解连接和其任何组合。在一些实施方案中,可裂解交联剂是硫醇可裂解交联剂或包含二硫化物接头。在一些实施方案中,固定剂包含多聚甲醛(PFA)、二硫代双(琥珀酰亚胺基丙酸酯(DSP)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、CellCover或其组合。
在一些实施方案中,使多于一个细胞固定和使多于一个细胞透化同时进行。在一些实施方案中,使多于一个细胞固定和透化是在存在能够固定和透化多于一个细胞的双重功能剂的情况下进行的。双重功能剂可以是甲醇。在一些实施方案中,使多于一个细胞透化包括使多于一个细胞与透化剂接触。在一些实施方案中,该方法包括在使多于一种蛋白质靶结合试剂或多于一个细胞内靶结合试剂与多于一个细胞接触后,从与多于一种蛋白质靶结合试剂或多于一个细胞内靶结合试剂关联的多于一个细胞中去除透化剂。
在一些实施方案中,透化剂能够(i)使多于一个细胞的细胞膜透化,(ii)使细胞膜对蛋白质靶结合试剂或细胞内靶结合试剂或两者都可渗透。透化剂可以包括(i)溶剂、去污剂或表面活性剂;(ii)BD Cytoperm;(iii)皂苷或其衍生物;(iv)Triton X-100,(v)甲醇或其衍生物,和/或(vi)毛地黄皂苷或其衍生物。
在一些实施方案中,能够解离蛋白质-核酸复合体的剂包含广谱丝氨酸蛋白酶,例如蛋白酶K。在一些实施方案中,裂解缓冲液包含解固定剂,例如包含硫醇、羟胺、高碘酸盐、碱或其任何组合的解固定剂。在一些实施方案中,裂解缓冲液包含DTT。能够解离蛋白质-核酸复合体的剂可以是本文提供的丝氨酸蛋白酶。如本文描述,术语“丝氨酸蛋白酶”应被赋予其普通含义,并且也应指裂解蛋白质中肽键的酶,其中丝氨酸在酶的活性位点充当亲核氨基酸。丝氨酸蛋白酶包括例如胰蛋白酶样蛋白酶、糜蛋白酶样蛋白酶、弹性蛋白酶样蛋白酶和枯草杆菌蛋白酶样蛋白酶。示例性丝氨酸蛋白酶包括但不限于糜蛋白酶A、二肽酶E、枯草杆菌蛋白酶、核孔蛋白、乳铁蛋白、菱形蛋白1(rhomboid 1)和蛋白酶K。本文提供的丝氨酸蛋白酶包括但不限于:超家族SB的丝氨酸蛋白酶,例如家族S8和S53的丝氨酸蛋白酶,包括枯草杆菌蛋白酶(地衣芽孢杆菌(Bacillus licheniformis));超家族SC的丝氨酸蛋白酶,例如家族S9、S10、S15、S28、S33和S37的丝氨酸蛋白酶,包括脯氨酰寡肽酶(猪(Susscrofa));超家族SE的丝氨酸蛋白酶,例如家族S11、S12和S13的丝氨酸蛋白酶,包括D-Ala-D-Ala肽酶C(大肠杆菌(Escherichia coli));超家族SF丝氨酸蛋白酶,例如家族S24和S26的丝氨酸蛋白酶,包括信号肽酶I(大肠杆菌);超家族SJ的丝氨酸蛋白酶,例如家族S16、S50和S69的丝氨酸蛋白酶,包括lon-A肽酶(大肠杆菌);超家族SK的丝氨酸蛋白酶,例如家族S14、S41和S49的丝氨酸蛋白酶,包括Clp蛋白酶(大肠杆菌);超家族SO的丝氨酸蛋白酶,例如家族S74的丝氨酸蛋白酶,包括噬菌体K1F内唾液酸酶CIMCD自裂解蛋白(肠杆菌噬菌体K1F);超家族SP的丝氨酸蛋白酶,例如家族S59的丝氨酸蛋白酶,包括核孔蛋白145(智人(Homo sapiens));超家族SR的丝氨酸蛋白酶,例如家族S60的丝氨酸蛋白酶,包括乳铁蛋白(智人);超家族SS的丝氨酸蛋白酶,S66家族的丝氨酸蛋白酶,包括细胞胞壁质四肽酶LD-羧肽酶(铜绿假单胞菌(Pseudomonas aeruginosa));超家族ST的丝氨酸蛋白酶,例如S54家族的丝氨酸蛋白酶,包括菱形蛋白-1(黑腹果蝇(Drosophila melanogaster));超家族PA的丝氨酸蛋白酶,例如家族S1、S3、S6、S7、S29、S30、531、S32、S39、S46、S55、S64、S65和S75的丝氨酸蛋白酶,包括糜蛋白酶A(家牛(Bos taurus));超家族PB的丝氨酸蛋白酶,例如家族S45和S63的丝氨酸蛋白酶,包括青霉素G酰化酶前体(大肠杆菌);超家族PC的丝氨酸蛋白酶,例如家族S51的丝氨酸蛋白酶,包括二肽酶E(大肠杆菌);和超家族PE的丝氨酸蛋白酶,例如家族P1的丝氨酸蛋白酶,包括DmpA氨肽酶(人苍白杆菌(Ochrobactrum anthropi))。
该方法可以包括使单细胞的固定逆转。在一些实施方案中,使单细胞的固定逆转包括UV光裂解、化学处理、加热、酶处理或其任何组合。使单细胞与裂解缓冲液接触的温度可以为25℃-55℃。使单细胞与裂解缓冲液接触还可以包括使单细胞与去污剂接触、改变pH或其组合。多于一种寡核苷酸条形码可以与固体支持物关联,并且其中多于一个分区中的分区包含单个固体支持物。分区可以是孔或液滴。
在一些实施方案中,每一种寡核苷酸条形码包含第一通用序列。在一些实施方案中,寡核苷酸条形码包含含有捕获序列的靶结合区,任选地,靶结合区包含多(dT)区,还任选地,与捕获序列互补的序列包含多(dA)区。在一些实施方案中,蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸包含与配置为捕获蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的捕获序列互补的序列,任选地,细胞表面靶结合试剂特异性寡核苷酸包含与配置为捕获细胞表面靶结合试剂特异性寡核苷酸的捕获序列互补的序列。在一些实施方案中,多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或多于一种条形码化细胞内靶结合试剂特异性寡核苷酸包含第一通用序列的互补物。在一些实施方案中,蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸包含第二通用序列和/或第二分子标记。
阻断试剂可以包含能够与细胞内靶结合试剂特异性寡核苷酸的至少一部分杂交的多于一种寡核苷酸。在一些实施方案中,多于一种寡核苷酸中的每一种包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的序列的一部分互补的序列。多于一种寡核苷酸可以各自包含随机序列,该随机序列具有与细胞内靶结合试剂特异性寡核苷酸或蛋白质靶结合试剂特异性寡核苷酸中的一种或更多种的第二分子标记的长度基本相同的长度。在一些实施方案中,多于一种寡核苷酸中的每一种包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的序列的一部分互补的序列。多于一种寡核苷酸可以各自包含随机序列,该随机序列具有与细胞内靶结合试剂特异性寡核苷酸或蛋白质靶结合试剂特异性寡核苷酸中的一种或更多种的第二分子标记的长度基本相同的长度。
获得多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的序列信息可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物,扩增多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞内靶结合试剂特异性寡核苷酸;以及获得多于一种扩增的条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的测序数据。
在一些实施方案中,多于一种细胞内靶结合试剂特异性寡核苷酸中的至少10种包含不同的第二分子标记序列,任选地(i)至少两种细胞内靶结合试剂特异性寡核苷酸的第二分子标记序列不同,并且其中至少两种细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符序列相同;或者(ii)至少两种细胞内靶结合试剂特异性寡核苷酸的第二分子标记序列不同,并且其中至少两种细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符序列不同。
在一些实施方案中,测序数据中与用于能够与至少一种细胞内靶特异性结合的细胞内靶结合试剂的独特细胞内靶标识符序列关联的独特第一分子标记序列的数目指示多于一个细胞中的一个或更多个中至少一种细胞内靶的拷贝数。在一些实施方案中,测序数据中与用于能够与至少一种细胞内靶特异性结合的细胞内靶结合试剂的独特细胞内靶标识符序列关联的独特第二分子标记序列的数目指示多于一个细胞中的一个或更多个中至少一种细胞内靶的拷贝数。在一些实施方案中,获得序列信息包括将测序衔接子附接至多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物。在一些实施方案中,细胞内靶包括:(i)细胞内蛋白质靶;(ii)糖类、脂质、蛋白质、肿瘤抗原或其任何组合;和/或(iii)细胞内的靶。在一些实施方案中,细胞内靶结合试剂特异性寡核苷酸(i)不包含分子标记;(ii)包含双链RNA或双链DNA;(iii)包含少于约110个核苷酸、约90个核苷酸、约75个核苷酸或约50个核苷酸的长度;和/或(iv)包含少于约四个CpG二核苷酸。在一些实施方案中,确定多于一个细胞中的一个或更多个中核酸靶的拷贝数包括基于与多于一种条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、其互补物或其组合的数目来确定多于一个细胞中核酸靶的拷贝数。
核酸靶可以包括核酸分子,例如核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA (siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸或其任何组合。
多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸可以包含第一通用序列的互补物,其中细胞表面靶结合试剂特异性寡核苷酸包含第四通用序列,并且其中获得多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的序列信息包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第四通用序列或其互补物杂交的引物,扩增多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞表面靶结合试剂特异性寡核苷酸;以及获得多于一种扩增的条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的测序数据。
方法可以包括延伸多于一种寡核苷酸条形码,包括使用逆转录酶和/或缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中至少一种的DNA聚合酶延伸多于一种寡核苷酸条形码,任选地DNA聚合酶包括Klenow片段,任选地逆转录酶包括病毒逆转录酶,任选地其中病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。在一些实施方案中,(i)第一通用序列、第二通用序列、第三通用序列和/或第四通用序列是相同的;和/或(ii)第一通用序列、第二通用序列、第三通用序列和/或第四通用序列是不同的。在一些实施方案中,第一通用序列、第二通用序列、第三通用序列和/或第四通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分,任选地测序衔接子包含P5序列、P7序列、其互补序列和/或其部分,还任选地其中测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。在一些实施方案中,多于一种寡核苷酸条形码中的至少10种包含不同的第一分子标记序列。多于一种寡核苷酸条形码可以各自包含细胞标记,任选地,多于一种寡核苷酸条形码的每种细胞标记包含至少6个核苷酸,还任选地,与同一固体支持物关联的寡核苷酸条形码包含相同的细胞标记,任选地,与不同固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
固体支持物可以包括合成颗粒或平面表面,任选地合成颗粒是可破坏的,并且还任选地合成颗粒包括可破坏的水凝胶颗粒。多于一种寡核苷酸条形码中的至少一种可以被固定在合成颗粒上、部分地固定在合成颗粒上、包封在合成颗粒中或部分地包封在合成颗粒中。合成颗粒可以包括珠,任选地珠包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合。多于一个细胞可以包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
本文还公开了试剂盒,其中试剂盒可以包含:多于一种细胞内靶结合试剂,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,该细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中该细胞内靶结合试剂能够特异性结合细胞的至少一种细胞内靶;多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;固定剂;裂解缓冲液;和阻断试剂,其中阻断试剂包含(a)能够与细胞内靶结合试剂特异性寡核苷酸的至少一部分杂交的多于一种寡核苷酸,(b)包含能够与一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸,或两者。在一些实施方案中,试剂盒还包含能够解离蛋白质-核酸复合体的剂,并且任选地裂解缓冲液包含能够解离蛋白质-核酸复合体的剂,例如蛋白酶K。
固定剂可以包括以下或可以衍生自以下:二硫代双(琥珀酰亚胺基丙酸酯)(DSP)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。该试剂盒还可以包含透化剂,任选地,透化剂是溶剂、去污剂或表面活性剂或包含溶剂、去污剂或表面活性剂,并且任选地,透化剂是皂苷、毛地黄皂苷、其衍生物或其任何组合或包含皂苷、毛地黄皂苷、其衍生物或其任何组合。试剂盒可以包含:缓冲液、盒、一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂或其组合。在一些实施方案中,靶结合区包括基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。在一些实施方案中,寡核苷酸条形码包含相同的样品标记和/或相同的细胞标记。在一些实施方案中,多于一种寡核苷酸条形码的每一种样品标记、细胞标记和/或分子标记包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被固定或被部分地固定在合成颗粒上;和/或多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在合成颗粒中,任选地合成颗粒是可破坏的。
附图简述
图1图示了非限制性示例性随机条形码。
图2示出了随机条形码化和数字计数的非限制性示例性工作流程。
图3是示出了用于从多于一种靶产生随机条形码化靶的索引文库的非限制性示例性方法的示意图。
图4示出了与包含用于蛋白结合试剂的独特标识符的寡核苷酸关联的示例性蛋白结合试剂(此处图示的抗体)的示意图。
图5示出了与包含用于确定细胞来自同一样品或不同样品的样品索引的独特标识符的寡核苷酸关联的示例性结合试剂(此处图示的抗体)的示意图。
图6示出了使用寡核苷酸关联的抗体以高通量方式同时确定细胞组分表达(例如,蛋白表达)和基因表达的示例性工作流程的示意图。
图7示出了使用寡核苷酸关联的抗体进行样品索引的示例性工作流程的示意图。
图8示出了与结合试剂(此处图示的抗体)关联的结合试剂寡核苷酸(此处图示出的抗体寡核苷酸)的条形码化的非限制性示例性工作流程的示意图。
图9A-图9D示出了用于同时确定蛋白表达和基因表达以及用于样品索引的寡核苷酸的非限制性示例性设计。
图10示出了用于同时确定蛋白表达和基因表达以及用于样品索引的非限制性示例性寡核苷酸序列的示意图。
图11A-图11B示出了用于同时确定蛋白表达和基因表达以及用于样品索引的寡核苷酸的非限制性示例性设计。
图12A-图12C示出了用于以高通量方式同时测量单细胞细胞内靶表达、细胞表面靶表达和mRNA表达的示例性工作流程的示意图。
图13示出了如本文描述的由诱饵寡核苷酸阻断的细胞内AbSeq的非限制性示意图。
图14A-图14B示出了本文描述的诱饵寡核苷酸的两种非限制性设计的示意图。
详述
以下详述中参考了形成本文的一部分的附图。在附图中,除非上下文另外指示,否则相似的符号通常标识相似的组成部分。在详述、附图和权利要求书中描述的说明性实施方案不意味着是限制性的。在不脱离本文提供的主题的精神或范围的情况下,可以利用其他实施方案,并且可以做出其他改变。将容易理解的是,如本文一般描述的以及附图中图示的本公开内容的方面能够以各种不同的配置来布置、替换、组合、分离和设计,所有这些都在本文中明确设想并且构成本公开内容的一部分。
本文提及的所有专利、公布的专利申请、其他出版物和来自GenBank的序列,以及其他数据库关于相关技术通过引用以其整体并入。
本文公开的内容包括可用于减少条形码寡核苷酸(例如,寡核苷酸缀合的抗体中的抗体特异性寡核苷酸)与非靶细胞蛋白(包括但不限于细胞表面蛋白和细胞内蛋白)的非特异性结合引起的噪声的方法、组合物和试剂盒。当暴露大量细胞/内源性核酸时,在涉及细胞内组分(例如,细胞内蛋白质)的单细胞分析中使用本文公开的方法、组合物和试剂盒可能是有利的。如本文描述,通过使用诱饵寡核苷酸可以减少由非特异性结合引起的噪声(包括部分减少、接近完全减少和完全减少)。在一些实施方案中,本文描述的方法、组合物和试剂盒可用于细胞内蛋白质染色的各种固定和透化工作流程。
对少量核酸(例如信使核糖核苷酸(mRNA)分子)进行定量对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因是重要(例如临床上重要)的。然而,确定核酸分子(例如,mRNA分子)的绝对数目也可以是非常具有挑战性的,尤其是当分子数目非常小时。确定样品中分子的绝对数目的一种方法是数字聚合酶链式反应(PCR)。理想地,PCR在每个循环中产生相同拷贝的分子。然而,PCR可具有缺点使得每个分子以随机概率复制,且此概率根据PCR循环和基因序列而变化,这导致扩增偏倚和不准确的基因表达测量。具有独特分子标记(molecular labels,也称为分子索引(molecular indexes,MI))的随机条形码可以用于计数分子数目和校正扩增偏倚。诸如PreciseTM测定(Cellular Research,Inc.,San Jose,CA)的随机条形码化可以通过使用分子标记(ML)在逆转录(RT)期间标记mRNA来纠正由PCR和文库制备步骤引起的偏倚。
PreciseTM测定可以利用具有在多(T)寡核苷酸上的大量(例如6561种至65536种)独特分子标记的随机条形码的非耗尽性池(non-depleting pool),以在RT步骤期间与样品中的所有多(A)-mRNA杂交。随机条形码可以包含通用PCR引发位点。在RT期间,靶基因分子与随机条形码随机反应。每种靶分子可以与随机条形码杂交,导致产生随机条形码化的互补核糖核苷酸(cDNA)分子。在标记后,可以将来自微孔板微孔的随机条形码化cDNA分子汇集到单个管中用于PCR扩增和测序。可以分析原始测序数据以产生读段的数目、具有独特分子标记的随机条形码的数目以及mRNA分子的数目。
用于确定单细胞的mRNA表达谱的方法可以以大规模并行的方式进行。例如,PreciseTM测定可以用于同时确定多于10000个细胞的mRNA表达谱。每个样品用于分析的单细胞数目(例如,数百个或数千个单细胞)可能低于当前单细胞技术的容量。汇集来自不同样品的细胞能够提高当前单细胞技术的容量利用,从而降低单细胞分析的试剂浪费和成本。本公开内容提供了用于区分用于cDNA文库制备的不同样品的细胞的样品索引方法,所述cDNA文库制备用于细胞分析,诸如单细胞分析。汇集来自不同样品的细胞可以使不同样品的细胞的cDNA文库制备的差异最小化,从而实现更准确地比较不同样品。
目前,许多单细胞平台和方案使用兼容mRNA的方法来固定细胞;然而,这些方法在只研究mRNA是合适的但与蛋白质谱分析不相容。本文提供的内容包括当使用蛋白质相容的细胞固定方法时,用于保存和/或回收RNA(例如mRNA)的方法、组合物和试剂盒。例如,蛋白酶K、加热、二硫苏糖醇(DTT)或其组合可用于本文描述的方法、组合物和试剂盒中,以例如逆转交联(例如甲醛交联),用于RNA(例如mRNA)的保存和/或回收。当使用蛋白质相容的细胞固定方法时,本文描述的方法、组合物和试剂盒可用于保存和/或回收RNA。非限制性示例性细胞固定方法包括通过甲醛、福尔马林、二硫代双(琥珀酰亚胺基丙酸酯(DSP)、CellCoverTM或其任何组合进行固定。在一些实施方案中,蛋白质相容的细胞固定方法包括甲醛固定,其被认为与RNA保存不相容。本文提供的内容包括适用于RNA回收的固定和逆转交联(reverse-crosslinking)方法,并且有利于在相同的工作流程中进行蛋白质检测和RNA回收。本文描述的一些实施方案可以保留细胞内的蛋白质表位和RNA完整性,以允许有效的单细胞分析,例如使用RhapsodyTM单细胞系统进行蛋白质和基因谱分析。
本文公开的内容包括用于检测细胞中蛋白质靶表达和核酸靶拷贝数的方法。该方法可以包括:使各自包含多于一种蛋白质靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定和/或透化;使多于一个细胞与包含能够与一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸的阻断试剂接触;使多于一种蛋白质靶结合试剂与多于一个细胞接触,其中多于一种蛋白质靶结合试剂中的每一种包含蛋白质靶结合试剂特异性寡核苷酸,该蛋白质靶结合试剂特异性寡核苷酸包含用于蛋白质靶结合试剂特异性寡核苷酸的独特蛋白质靶标识符,并且其中蛋白质靶结合试剂能够特异性结合多于一种蛋白质靶中的至少一种;将与蛋白质靶结合试剂关联的多于一个细胞分区至多于一个分区,其中多于一个分区的分区包含来自与蛋白质靶结合试剂关联的多于一个细胞的单细胞;在包含单细胞的分区中,使多于一种寡核苷酸条形码与核酸靶的拷贝和蛋白质靶结合试剂特异性寡核苷酸接触进行杂交,其中寡核苷酸条形码各自包含第一分子标记;使与蛋白质靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸,所述多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸各自包含与独特蛋白质靶标识符序列的至少一部分互补的序列和第一分子标记;使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记;获取多于一种条形码化核酸分子或其产物的信息(例如,序列信息),以确定多于一个细胞中的一个或更多个中核酸靶的拷贝数;以及获得多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或其产物的信息(例如,序列信息),以确定在多于一个细胞中的一个或更多个中存在多于一种蛋白质靶中的至少一种蛋白质靶。在一些实施方案中,多于一种蛋白质靶包括细胞表面蛋白质靶、细胞内蛋白质靶或其组合。在一些实施方案中,获得多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定在多于一个细胞中的一个或更多个中存在多于一种蛋白质靶中的至少一种蛋白质靶,包括确定在多于一个细胞中的一个或更多个中多于一种蛋白质靶中的至少一种蛋白质靶的拷贝数。在一些实施方案中,多于一种蛋白质靶包括细胞表面蛋白质靶、细胞内蛋白质靶或其组合。在一些实施方案中,获得多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定在多于一个细胞中的一个或更多个中存在多于一种蛋白质靶中的至少一种蛋白质靶,包括确定在多于一个细胞中的一个或更多个中多于一种蛋白质靶中的至少一种蛋白质靶的拷贝数。在一些实施方案中,多于一个细胞被固定并且没有被完全透化。在一些实施方案中,多于一个细胞被固定和透化。在一些实施方案中,多于一个细胞与用于固定的固定剂接触,但不与任何透化剂接触。在一些实施方案中,在与透化剂接触之前,使多于一个细胞与固定剂接触。固定剂可以不同于透化剂。在一些实施方案中,使多于一个细胞与具有细胞固定和透化双重功能的剂接触。在一些实施方案中,单细胞在或在约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃、65℃或者这些值中的任何两个之间的数字或范围内与裂解缓冲液接触。在一些实施方案中,单细胞在是至少或是至少约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃或65℃的温度与裂解缓冲液接触。
本文公开的内容包括用于测量细胞内靶表达和细胞中核酸靶的拷贝数的方法。该方法包括:使各自包含多于一种细胞内靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定和/或透化;使多于一个细胞与包含能够与一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸的阻断试剂接触;使多于一种细胞内靶结合试剂与多于一个细胞接触,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,该细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中细胞内靶结合试剂能够与多于一种细胞内靶中的至少一种特异性结合;将与细胞内靶结合试剂关联的多于一个细胞分区至多于一个分区,其中多于一个分区中的分区包含来自与细胞内靶结合试剂关联的多于一个细胞的单细胞;在包含单细胞的分区中,使多于一种寡核苷酸条形码与核酸靶的拷贝和细胞内靶结合试剂特异性寡核苷酸接触进行杂交,其中寡核苷酸条形码各自包含第一分子标记;使与细胞内靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化细胞内靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸各自包含与独特细胞内靶标识符序列的至少一部分互补的序列和第一分子标记;使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记;获得多于一种条形码化核酸分子或其产物的信息(例如,序列信息),以确定多于一个细胞中的一个或更多个中核酸靶的拷贝数;以及获得多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的信息(例如,序列信息),以确定多于一个细胞中的一个或更多个中多于一种细胞内靶中的至少一种细胞内靶的拷贝数。在一些实施方案中,多于一个细胞被固定并且没有被完全透化。在一些实施方案中,多于一个细胞被固定和透化。在一些实施方案中,多于一个细胞与用于固定的固定剂接触,但不与任何透化剂接触。在一些实施方案中,在与透化剂接触之前,使多于一个细胞与固定剂接触。固定剂可以不同于透化剂。在一些实施方案中,使多于一个细胞与具有细胞固定和透化双重功能的剂接触。在一些实施方案中,单细胞在或在约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃、65℃,或者这些值中的任何两个之间的数字或范围与裂解缓冲液接触。在一些实施方案中,单细胞在是至少或是至少约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃或65℃的温度与裂解缓冲液接触。
本文公开的内容包括用于测量细胞内靶表达、细胞表面靶表达和细胞中核酸靶的拷贝数的方法。该方法包括:使包含多于一种细胞内靶、多于一种细胞表面靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定和/或透化;使多于一种细胞与包含能够与一种或更多种非靶核酸的至少一种杂交的多于一种诱饵寡核苷酸的阻断试剂接触;使多于一种细胞内靶结合试剂与多于一个细胞接触,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,该细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中细胞内靶结合试剂能够与多于一种细胞内靶中的至少一种特异性结合;使多于一种细胞表面靶结合试剂和与细胞内靶结合试剂关联的多于一个细胞接触,其中多于一种细胞表面靶结合试剂中的每一种包含细胞表面靶结合试剂特异性寡核苷酸,该细胞表面靶结合试剂特异性寡核苷酸包含用于细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符,并且其中细胞表面靶结合试剂能够与多于一种细胞表面靶中的至少一种特异性结合;将与细胞内靶结合试剂和细胞表面靶结合试剂关联的多于一个细胞分区至多于一个分区,其中多于一个分区中的分区包含来自与细胞内靶结合试剂和细胞表面靶结合试剂关联的多于一个细胞的单细胞;在包含单细胞的分区中,将多于一种寡核苷酸条形码与细胞表面靶结合试剂特异性寡核苷酸和细胞内靶结合试剂特异性寡核苷酸和核酸靶的拷贝接触进行杂交,其中寡核苷酸条形码各自包含第一分子标记;使与细胞内靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞内靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸各自包含与独特细胞内靶标识符序列的至少一部分互补的序列和第一分子标记;使与细胞表面靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸各自包含与独特细胞表面靶标识符序列的至少一部分互补的序列和第一分子标记;使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记;获得多于一种条形码化核酸分子或其产物的信息(例如,序列信息),以确定多于一个细胞中的一个或更多个中核酸靶的拷贝数;获得多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的信息(例如,序列信息),以确定多于一个细胞中的一个或更多个中多于一种细胞表面靶中的至少一种细胞表面靶的拷贝数;以及获得多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的信息(例如,序列信息),以确定多于一个细胞中的一个或更多个中多于一种细胞内靶中的至少一种细胞内靶的拷贝数。在一些实施方案中,多于一个细胞被固定并且没有完全被透化。在一些实施方案中,多于一个细胞被固定和透化。在一些实施方案中,多于一个细胞与用于固定的固定剂接触,但不与任何透化剂接触。在一些实施方案中,在与透化剂接触之前,使多于一个细胞与固定剂接触。固定剂可以不同于透化剂。在一些实施方案中,使多于一个细胞与具有细胞固定和透化双重功能的剂接触。在一些实施方案中,单细胞在或在约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃、65℃或者这些值中的任何两个之间的数字或范围与裂解缓冲液接触。在一些实施方案中,单细胞在是至少或是至少约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃或65℃的温度与裂解缓冲液接触。
本文公开的内容包括试剂盒。在一些实施方案中,试剂盒包括:多于一种细胞内靶结合试剂,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,该细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中细胞内靶结合试剂能够特异性结合细胞的至少一种细胞内靶;多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;固定剂;裂解缓冲液;和能够解离蛋白质-核酸复合体的剂。
定义
除非另外定义,否则本文使用的技术术语和科学术语具有与本公开内容所属领域的普通技术人员通常所理解的相同意义。参见,例如,Singleton等人,Dictionary ofMicrobiology and Molecular Biology,第2版,J.Wiley&Sons(New York,NY 1994);Sambrook等人,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press(Cold Spring Harbor,NY 1989)。为了本公开内容的目的,下文定义了以下术语。
如本文使用的,术语“衔接子”可以意指促进关联的核酸的扩增或测序的序列。关联的核酸可以包括靶核酸。关联的核酸可以包括空间标记、靶标记、样品标记、索引标记或条形码序列(例如,分子标记)中的一种或更多种。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子。衔接子可以是双链或单链的。一种或更多种衔接子可以位于核酸的5’末端或3’末端。当衔接子在5’和3’末端包含已知序列时,已知序列可以是相同或不同的序列。位于多核苷酸的5’和/或3’末端的衔接子可以能够与固定在表面上的一种或更多种寡核苷酸杂交。在一些实施方案中,衔接子可以包含通用序列。通用序列可以是两种或更多种核酸分子共有的核苷酸序列的区域。两种或更多种核酸分子也可以具有不同序列的区域。因此,例如,5’衔接子可以包含相同和/或通用核酸序列,并且3’衔接子可以包含相同和/或通用序列。可以存在于多于一种核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单种通用引物复制或扩增多于一种不同序列。类似地,可以存在于核酸分子的集合中的不同成员中的至少一种、两种(例如,一对)或更多种通用序列可以允许使用与通用序列互补的至少一种、两种(例如,一对)或更多种单一通用引物复制或扩增多于一种不同序列。因此,通用引物包含可与此类通用序列杂交的序列。可以修饰具有靶核酸序列的分子以将通用衔接子(例如,非靶核酸序列)附接至不同靶核酸序列的一个末端或两个末端。与靶核酸附接的一种或更多种通用引物可以提供通用引物杂交的位点。附接至靶核酸的一种或更多种通用引物可以彼此相同或不同。
如本文使用的,抗体可以是全长(例如,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如,IgG抗体)或免疫球蛋白分子的免疫活性(即,特异性结合)部分,如抗体片段。
在一些实施方案中,抗体是功能性抗体片段。例如,抗体片段可以是抗体的一部分,诸如F(ab’)2、Fab’、Fab、Fv、sFv等。抗体片段可以与由全长抗体识别的同一抗原结合。抗体片段可以包括由抗体的可变区组成的分离的片段,诸如由重链和轻链的可变区组成的“Fv”片段和其中轻链和重链可变区通过肽接头连接的重组单链多肽分子(“scFv蛋白”)。示例性抗体可以包括但不限于癌细胞抗体、病毒抗体、结合至细胞表面受体(例如CD8、CD34和CD45)的抗体,和治疗性抗体。
如本文使用的,术语“关联”或“与...关联”可以意指,两个或更多个物质可以被鉴定为在某个时间点共定位。关联可以意指,两个或更多个物质在或曾经在相似的容器内。关联可以是信息学关联。例如,关于两个或更多个物质的数字信息可以被存储并且可以用于确定一种或更多种物质在某个时间点共定位。关联也可以是物理关联。在一些实施方案中,两个或更多个关联的物质彼此“拴系”、“附接”或“固定”或与共同的固体或半固体表面“拴系”、“附接”或“固定”。关联可以指用于将标记与固体或半固体支持物(诸如珠)附接的共价或非共价方式。关联可以是靶与标记之间的共价键。关联可以包括两个分子(诸如靶分子和标记)之间的杂交。
如本文使用的,术语“互补”可以指两个核苷酸之间精确配对的能力。例如,如果核酸在给定位置处的核苷酸能够与另一个核酸的核苷酸形成氢键,则这两个核酸被认为在该位置处是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在全部互补性时它可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则第一核苷酸序列可以被称为第二序列的“互补物”。如果第一核苷酸序列和与第二序列相反的序列(即,核苷酸顺序相反)互补,则第一核苷酸序列可以被称为第二序列的“反向互补物”。如本文使用的,术语“互补物”、“互补的”和“反向互补物”可以互换使用。从本公开内容理解,如果一个分子可以与另一个分子杂交,则其可以是其所杂交的分子的互补物。
如本文使用的,术语“数字计数”可以指用于估计样品中靶分子数目的方法。数字计数可以包括确定已经与样品中的靶关联的独特标记的数目的步骤。这种方法(其本质上可以是随机的)将计数分子的问题从相同分子的定位和鉴定问题转化为有关检测一组预定义标记的一系列是/否数字问题。
如本文使用的,术语“一种标记(label)”或“多于一种标记(labels)”可以指与样品中的靶关联的核酸代码。标记可以是例如核酸标记。标记可以是完全或部分可扩增的标记。标记可以是完全或部分可测序的标记。标记可以是可鉴定为有区别的天然核酸的一部分。标记可以是已知的序列。标记可以包括核酸序列的连接处,例如天然和非天然序列的连接处。如本文使用的,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在多种实施方案中,可以使用标记来确定样品的身份、样品的来源、细胞的身份和/或靶。
如本文使用的,术语“非耗尽性储库(non-depleting reservoir)”可以指由许多不同标记组成的条形码(例如,随机条形码)的池。非耗尽性储库可以包括大量不同的条形码,使得当非耗尽性储库与靶池关联时,每种靶可能与独特条形码关联。每种标记的靶分子的独特性可以通过随机选择的统计来确定,并且取决于与标记的多样性相比在集合中相同的靶分子的拷贝数。所得的标记的靶分子的集合的大小可以通过条形码化处理的随机性质来确定,并且然后对检测到的条形码的数目的分析允许计算原始集合或样品中存在的靶分子的数目。当存在的靶分子的拷贝数与独特条形码的数目的比率低时,标记的靶分子是高度独特的(即,多于一种靶分子被给定标记标记的概率非常低)。
如本文使用的,术语“核酸”是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包括一种或更多种类似物(例如,改变的主链、糖或核酸碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、非天然核酸(xeno nucleic acid)、吗啉代核酸(morpholinos)、锁核酸、二醇核酸、苏糖核酸、二脱氧核苷酸、虫草菌素、7-脱氮-GTP、荧光团(例如,罗丹明或与糖连接的荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿苷、二氢尿苷、辫苷以及怀俄苷。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。
核酸可以包括一种或更多种修饰(例如,碱基修饰、主链修饰),以为核酸提供新的或增强的特征(例如,改进的稳定性)。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两个最常见的类别是嘌呤和嘧啶。核苷酸可以是还包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括呋喃戊糖的那些核苷,磷酸基团可以连接到糖的2’、3’或5’羟基部分。在形成核酸时,磷酸基团可以将相邻的核苷彼此共价连接以形成线性聚合化合物。继而,此线性聚合化合物的各端可以进一步连接而形成环状化合物;然而,线性化合物通常是合适的。线性化合物可以具有内部核苷酸碱基互补性,并且因此可以按产生完全或部分双链化合物的方式折叠。在核酸中,磷酸基团通常可以称为形成核酸的核苷间主链。连接(linkage)或主链可以是3’到5’磷酸二酯连接。
核酸可以包括经修饰的主链和/或经修饰的核苷间连接。经修饰的主链可以包括那些在主链中保留磷原子的主链和那些在主链中没有磷原子的主链。合适的其中含磷原子的经修饰的核酸主链可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基膦酸酯和其他烷基膦酸酯诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、亚膦酸酯、磷酰胺酯(phosphoramidate)(包括3’-氨基磷酰胺酯和氨基烷基磷酰胺酯、磷酸二酰胺酯(phosphorodiamidates)、硫代磷酰胺酯、硫代烷基磷酸酯(thionophosphoramidates)、硫代烷基磷酸三酯、硒代磷酸酯(selenophosphates)和硼磷酸酯(boranophosphates),具有正常3’-5’连接、2’-5’连接的类似物以及具有反向极性的类似物(其中一个或更多个核苷酸间连接是3’至3’、5’至5’或2’至2’连接)。
核酸可以包含由以下形成的多核苷酸主链:短链烷基或环烷基核苷间连接、混合杂原子和烷基或环烷基核苷间连接,或者一个或更多个短链杂原子核苷间连接或杂环核苷间连接。这些可以包括具有吗啉代连接的那些(部分地由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲乙酰基和硫代甲乙酰基主链;亚甲基甲乙酰基和硫代甲乙酰基主链;核糖乙酰基主链;含烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;和具有混合的N、O、S和CH2组分部分的其他的那些。
核酸可以包括核酸模拟物。术语“模拟物”可意在包括其中仅呋喃糖环或呋喃糖环和核苷酸间连接两者被非呋喃糖基团代替的多核苷酸,仅呋喃糖环的代替也可称为糖替代物。杂环碱基部分或修饰的杂环碱基部分可被保持以与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中,多核苷酸的糖主链可以被含酰胺的主链替代,特别是被氨基乙基甘氨酸主链替代。核苷酸可以被保留,并且直接或间接与主链的酰胺部分的氮杂氮原子结合。PNA化合物中的主链可以包含两个或更多个连接的氨基乙基甘氨酸单元,这使得PNA具有含酰胺的主链。杂环碱基部分可以直接或间接与主链的酰胺部分的氮杂氮原子结合。
核酸可以包括吗啉代主链结构。例如,核酸可以包含替代核糖环的6元吗啉代环。在这些实施方案的一些中,磷酸二酰胺酯或其他非磷酸二酯核苷间键可以替代磷酸二酯键。
核酸可以包括具有附接至吗啉代环的杂环碱基的连接的吗啉代单元(例如,吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物与细胞蛋白可以具有较少的不合意的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代类别内的各种化合物可以使用不同的连接基团来连接。另一类多核苷酸模拟物可以称为环己烯基核酸(CeNA)。核酸分子中通常存在的呋喃糖环可以被环己烯基环代替。使用亚磷酰胺化学可以制备CeNA DMT保护的亚磷酰胺单体并用于寡聚化合物合成。将CeNA单体掺入核酸链可以增加DNA/RNA杂合体的稳定性。CeNA寡腺苷酸酯可以与核酸互补物形成复合体,具有与天然复合体相似的稳定性。另外的修饰可以包括锁核酸(LNA),其中2’-羟基基团连接到糖环的4’碳原子,从而形成2’-C,4’-C-氧亚甲基连接,从而形成双环糖部分。连接可以是桥接2’氧原子和4’碳原子的亚甲基(-CH2-)n基团,其中n是1或2。LNA和LNA类似物可以显示出与互补核酸的非常高的双链体热稳定性(Tm=+3℃至+10℃)、对3’-核酸外切酶降解的稳定性和良好的溶解度特性。
核酸还可以包括核碱基(也称为“碱基”)修饰或取代。如本文使用的,“未修饰的”或“天然的”核碱基可以包括嘌呤碱基(例如,腺嘌呤(A)和鸟嘌呤(G)),以及嘧啶碱基(例如,胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。经修饰的核碱基可以包括其他合成以及天然的核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物、2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤素尿嘧啶(5-halouracil)和胞嘧啶、5-丙炔基(-C≡C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶,8-卤素、8-氨基、8-硫代、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤素特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可以包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-夹类(G-clamps),诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-夹类,诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。
如本文使用的,术语“样品”可以指包含靶的组合物。用于通过所公开的方法、装置和系统进行分析的合适样品包括细胞、组织、器官或生物体。
如本文使用的,术语“采样装置”或“装置”可以指可以取样品的切片和/或将所述切片放置在基底上的装置。采样装置可以指例如荧光激活细胞分选(FACS)机、细胞分选机、活检针、活检装置、组织切片装置、微流体装置、刀片格栅和/或超薄切片机。
如本文使用的,术语“固体支持物”可以指可以附接多于一种条形码(例如,随机条形码)的离散固体或半固体表面。固体支持物可以包括任何类型的实心的、多孔的或空心的球体、球、承座(bearing)、圆柱体或由塑料、陶瓷、金属或聚合材料(例如,水凝胶)构成的其他类似配置,其上可以固定(例如,共价地或非共价地)核酸。固体支持物可以包括可以是球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多于一个固体支持物可以不包括基底。固体支持物可以与术语“珠”互换使用。
如本文使用的,术语“随机条形码”可以指本公开内容的包含标记的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如本文使用的,术语“基因特异性随机条形码”可以指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如本文使用的,术语“随机条形码化”可以指核酸的随机标记(例如,条形码化)。随机条形码化可以利用递归泊松策略来关联并对与靶关联的标记进行定量。如本文使用的,术语“随机条形码化”可以与“随机标记”互换使用。
如本文使用的,术语“靶”可以指可与条形码(例如,随机条形码)关联的组合物。用于通过所公开的方法、装置和系统进行分析的示例性合适的靶包括寡核苷酸、DNA、RNA、mRNA、微RNA、tRNA等。靶可以是单链的或双链的。在一些实施方案中,靶可以是蛋白、肽或多肽。在一些实施方案中,靶是脂质。如本文使用的,“靶”可以与“物质(species)”互换使用。
如本文使用的,术语“逆转录酶”可以指具有逆转录酶活性(即,催化从RNA模板合成DNA)的一组酶。通常,这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒(retroplasmid)逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II组内含子衍生的逆转录酶,及它们的突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和II组内含子逆转录酶。II组内含子逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)LI.LtrB内含子逆转录酶、细长嗜热聚球藻(Thermosynechococcus elongatus)TeI4c内含子逆转录酶或嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)GsI-IIC内含子逆转录酶。其他类别的逆转录酶可以包括许多类型的非逆转录病毒逆转录酶(即,尤其是逆转录子、II组内含子、以及多样性产生型逆转录元件)。
术语“通用衔接子引物”、“通用引物衔接子”或“通用衔接子序列”可互换地使用,以指可以用于与条形码(例如,随机条形码)杂交以产生基因特异性条形码的核苷酸序列。通用衔接子序列可以例如是在本公开内容的方法中使用的遍及所有条形码通用的已知序列。例如,当使用本文公开的方法标记多于一种靶时,每种靶特异性序列可以连接到相同的通用衔接子序列。在一些实施方案中,多于一种通用衔接子序列可以用于本文公开的方法中。例如,当使用本文公开的方法标记多于一种靶时,至少两种靶特异性序列连接到不同的通用衔接子序列。通用衔接子引物及其互补物可以被包括在两种寡核苷酸中,其中的一种寡核苷酸包含靶特异性序列且另一种寡核苷酸包含条形码。例如,通用衔接子序列可以是包含靶特异性序列的寡核苷酸的一部分以产生与靶核酸互补的核苷酸序列。包含条形码和通用衔接子序列的互补序列的第二寡核苷酸可与核苷酸序列杂交并产生靶特异性条形码(例如,靶特异性随机条形码)。在一些实施方案中,通用衔接子引物具有与本公开内容的方法中使用的通用PCR引物不同的序列。
条形码
条形码化,诸如随机条形码化,已经在例如,Fu等人,Proc Natl Acad SciU.S.A.,2011May 31,108(22):9026-31;US2011/0160078;Fan等人,Science,2015,347(6222):1258367;US2015/0299784;和WO2015/031691中描述;这些中的每一项的内容,包括任何支持或补充信息或材料,通过引用以其整体并入本文。在一些实施方案中,本文公开的条形码可以是随机条形码,所述随机条形码可以是可以用于对靶随机标记(例如,条形码化、加标签)的多核苷酸序列。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或在这些值中的任何两个之间的数字或范围,则条形码可以称为随机条形码。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1,则条形码可以称为随机条形码。随机条形码的条形码序列可以称为分子标记。
条形码(例如,随机条形码)可以包括一种或更多种标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如,分子标记)、样品标记、板标记、空间标记和/或前空间标记(pre-spatial label)。图1图示了具有空间标记的示例性条形码104。条形码104可以包含可以使条形码与固体支持物108连接的5’胺。条形码可以包含通用标记、维度标记、空间标记、细胞标记和/或分子标记。条形码中不同标记(包括但不限于通用标记、维度标记、空间标记、细胞标记和分子标记)的顺序可以变化。例如,如图1所示,通用标记可以是最5’侧的标记,分子标记可以是最3’侧的标记。空间标记、维度标记和细胞标记可以处于任何顺序。在一些实施方案中,通用标记、空间标记、维度标记、细胞标记和分子标记是处于任何顺序的。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如,靶核酸、RNA、mRNA、DNA)相互作用。例如,靶结合区可以包含可以与mRNA的多(A)尾相互作用的寡(dT)序列。在一些实施方案中,条形码的标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列)由1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个核苷酸隔开。
标记(例如,细胞标记)可以包含一组独特的定义长度的核酸子序列,例如每种七个核苷酸(相当于一些汉明错误校正代码中使用的比特数目),其可被设计成提供错误校正能力。可以设计包含七个核苷酸序列的错误校正子序列组,使得所述组中的序列的任何成对组合展现出定义的“遗传距离”(或错配碱基数),例如一组错误校正子序列可被设计成展现三个核苷酸的遗传距离。在这种情况下,对于标记的靶核酸分子的序列数据组中的错误校正序列的审查(在下文更详细地描述)可允许人们检测或校正扩增错误或测序错误。在一些实施方案中,用于产生错误校正代码的核酸子序列的长度可以变化,例如,它们的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、31个、40个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中,其他长度的核酸子序列可以用来产生错误校正代码。
条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是以下或包括以下:核糖核酸(RNA)、信使RNA(mRNA)、微小RNA、小干扰RNA(siRNA)、RNA降解产物、各自含有多(A)尾的RNA或其任何组合。在一些实施方案中,多于一种靶可以包括脱氧核糖核酸(DNA)。
在一些实施方案中,靶结合区可以包括可以与mRNA的多(A)尾相互作用的寡(dT)序列。条形码的一种或更多种标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列(例如,分子标记))可以通过间隔区(spacer)与条形码的另一种或两种剩余标记隔开。间隔区可以是例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸。在一些实施方案中,条形码的所有标记都未被间隔区隔开。
通用标记
条形码可以包含一种或更多种通用标记。在一些实施方案中,一种或更多种通用标记对于附接至给定固体支持物的条形码组中的所有条形码可以是相同的。在一些实施方案中,一种或更多种通用标记对于附接至多于一个珠的所有条形码可以是相同的。在一些实施方案中,通用标记可以包括能够与测序引物杂交的核酸序列。测序引物可以用于对包括通用标记的条形码进行测序。测序引物(例如,通用测序引物)可以包括与高通量测序平台关联的测序引物。在一些实施方案中,通用标记可以包括能够与PCR引物杂交的核酸序列。在一些实施方案中,通用标记可以包括能够与测序引物和PCR引物杂交的核酸序列。能够与测序引物或PCR引物杂交的通用标记的核酸序列可以被称为引物结合位点。通用标记可以包括可以用于引发条形码转录的序列。通用标记可以包括可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个、300个或在这些值中的任何两个之间的数字或范围。在一些实施方案中,可裂解接头或经修饰的核苷酸可以是通用标记序列的一部分,以使条形码能够从支持物上被裂解下来。
维度标记
条形码可以包含一种或更多种维度标记。在一些实施方案中,维度标记可以包括提供关于标记(例如,随机标记)发生的维度的信息的核酸序列。例如,维度标记可以提供关于靶被条形码化的时间的信息。维度标记可以与样品中条形码化(例如,随机条形码化)的时间关联。维度标记可以在标记的时间被激活。不同的维度标记可以在不同的时间被激活。维度标记提供关于靶、靶的组和/或样品被条形码化的顺序的信息。例如,在细胞周期的G0期可以将细胞的群体条形码化。在细胞周期的G1期,可以用条形码(例如,随机条形码)对细胞再次进行脉冲处理。在细胞周期的S期,可以用条形码对细胞再次进行脉冲处理,等等。每次脉冲(例如,细胞周期的每个期)时的条形码可以包含不同的维度标记。以这种方式,维度标记提供关于哪些靶在细胞周期的哪个期被标记的信息。维度标记可以探询许多不同的生物学时间。示例性的生物学时间可以包括但不限于细胞周期、转录(例如,转录起始)和转录物降解。在另一种实例中,样品(例如,细胞、细胞的群体)可以在用药物和/或疗法治疗之前和/或之后标记。不同靶的拷贝数的变化可以指示样品对药物和/或疗法的响应。
维度标记可以是可激活的。可激活的维度标记可以在特定时间点被激活。可激活的标记可以被例如组成型地激活(例如,不关闭)。可激活的维度标记可以被例如可逆地激活(例如,可激活的维度标记可以被打开和关闭)。维度标记可以被例如可逆地激活至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。在一些实施方案中,可以用荧光、光、化学事件(例如,裂解,连接另一种分子,添加修饰(例如,聚乙二醇化、类泛素化(sumoylate)、乙酰化、甲基化、去乙酰化、去甲基化)、光化学事件(例如,光罩(photocaging))以及引入非天然的核苷酸将维度标记激活。
在一些实施方案中,维度标记对于附接至给定固体支持物(例如,珠)的所有条形码(例如,随机条形码)可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上至少60%、70%、80%、85%、90%、95%、97%、99%或100%的条形码可以包含相同的维度标记。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特维度标记序列。维度标记的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、75个、100个、125个、150个、200个或在这些值中的任何两个之间的数字或范围。
空间标记
条形码可以包含一种或更多种空间标记。在一些实施方案中,空间标记可以包含提供关于与条形码关联的靶分子的空间取向的信息的核酸序列。空间标记可以与样品中的坐标关联。坐标可以是固定的坐标。例如,坐标可以相对于基底固定。空间标记可以参考二维或三维网格。坐标可以相对于界标(landmark)固定。界标可在空间中被鉴定。界标可以是可被成像的结构。界标可以是生物结构,例如解剖学界标。界标可以是细胞界标,例如细胞器。界标可以是非天然界标,诸如具有可鉴定标识(诸如色码、条形码、磁特性(magneticproperty)、荧光、放射性或独特尺寸或形状)的结构。空间标记可以与物理分区(例如,孔、容器或液滴)关联。在一些实施方案中,将多于一种空间标记一起用于编码空间中的一个或更多个位置。
空间标记对于附接至给定固体支持物(例如,珠)的所有条形码可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同空间标记的条形码的百分比可以是以下、是约以下、是至少以下或是至多以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值中的任何两个之间的数字或范围。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特空间标记序列。空间标记的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、125个、150个、175个、200个、250个或300个或者是这些值中任何两个之间的数字或范围。
细胞标记
条形码(例如,随机条形码)可以包含一种或更多种细胞标记。在一些实施方案中,细胞标记可以包含提供用于确定哪种靶核酸来源于哪种细胞的信息的核酸序列。在一些实施方案中,细胞标记对于附接至给定固体支持物(例如,珠)的所有条形码是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同细胞标记的条形码的百分比可以是以下、是约以下、至多以下或是至少以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值中的任何两个之间的数字或范围。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特细胞标记序列。细胞标记的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、125个、150个、175个、200个或在这些值中的任何两个之间的数字或范围。
条形码序列
条形码可以包含一种或更多种条形码序列。在一些实施方案中,条形码序列可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器(例如,提供粗略估计)的核酸序列。
在一些实施方案中,将一组相异的(diverse)条形码序列附接至给定固体支持物(例如,珠)。在一些实施方案中,可以存在以下或可以存在约以下:102种、103种、104种、105种、106种、107种、108种、109种独特分子标记序列或在这些值中的任何两个之间的数字或范围的独特分子标记序列。例如,多于一种条形码可以包括约6561种具有不同序列的条形码序列。作为另一种实例,多于一种条形码可以包括约65536种具有不同序列的条形码序列。在一些实施方案中,可以存在至少或至多102种、103种、104种、105种、106种、107种、108种或109种独特条形码序列。独特分子标记序列可以附接至给定的固体支持物(例如,珠)。
在不同实施方式中,条形码的长度可以是不同的。例如,条形码的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或者这些值中任何两个之间的数字或范围。
分子标记
条形码(例如,随机条形码)可以包含一种或更多种分子标记。分子标记可以包括条形码序列。在一些实施方案中,分子标记可以包括提供与条形码杂交的特定类型的靶核酸物质的鉴定信息的核酸序列。分子标记可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器的核酸序列。
在一些实施方案中,将一组相异的分子标记附接至给定固体支持物(例如,珠)。在一些实施方案中,可以存在以下或可以存在约以下:102种、103种、104种、105种、106种、107种、108种、109种或在这些值中的任何两个之间的数字或范围的独特分子标记序列。例如,多于一种条形码可以包括约6561种具有不同序列的分子标记。作为另一种实例,多于一种条形码可以包括约65536种具有不同序列的分子标记。在一些实施方案中,可以存在至少或至多102种、103种、104种、105种、106种、107种、108种或109种独特分子标记序列。具有独特分子标记序列的条形码可以附接至给定固体支持物(例如,珠)。
对于使用多于一种随机条形码的随机条形码,不同分子标记序列的数量与任何靶的出现的次数之比可以是、是约、是至少或是至多1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或这些值中任何两个之间的数字或范围。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。
分子标记的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或者是这些值中任何两个之间的数字或范围。
靶结合区
条形码可以包含一个或更多个靶结合区,诸如捕获探针。在一些实施方案中,靶结合区可以与感兴趣的靶杂交。在一些实施方案中,靶结合区可以包含与靶(例如,靶核酸、靶分子、待分析的细胞核酸)特异性杂交(例如,与特定基因序列特异性杂交)的核酸序列。在一些实施方案中,靶结合区可以包含可以附接(例如,杂交)至特定靶核酸的特定位置的核酸序列。在一些实施方案中,靶结合区可以包含能够与限制性酶位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。
在一些实施方案中,靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以指可以独立于靶核酸的特定序列结合多于一种靶核酸的序列。例如,靶结合区可以包括随机多聚体序列或与mRNA分子上的多(A)尾杂交的寡(dT)序列。随机多聚体序列可以是,例如,随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或任何长度的更高多聚体序列。在一些实施方案中,对于附接至给定珠的所有条形码,靶结合区是相同的。在一些实施方案中,对于附接至给定珠的多于一种条形码,靶结合区可以包括两种或更多种不同的靶结合序列。靶结合区的长度可以是以下、是约以下、至少约以下或是至多约以下的核苷酸:5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或这些值中任何两个之间的数字或范围。
在一些实施方案中,靶结合区可以包含寡(dT),所述寡(dT)可以与包含聚腺苷酸化末端的mRNA杂交。靶结合区可以是基因特异性的。例如,可以将靶结合区配置为与靶的特定区域杂交。靶结合区的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或这些值中任何两个之间的数字或范围。当条形码包含基因特异性靶结合区时,条形码在本文中可以称为基因特异性条形码。
通用衔接子引物
条形码可以包含一种或更多种通用衔接子引物。例如,基因特异性条形码(诸如基因特异性随机条形码)可以包含通用衔接子引物。通用衔接子引物可以指遍及所有条形码通用的核苷酸序列。通用衔接子引物可以用于构建基因特异性条形码。通用衔接子引物的长度可以是以下、是约以下、是至少以下或是至多以下的核苷酸:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或者这些值中任何两个之间的数字或范围。通用衔接子引物的长度可以是5-30个核苷酸。
接头
当条形码包含多于一种类型的标记(例如,多于一种细胞标记或多于一种条形码序列,诸如一种分子标记)时,标记之间可以散布有接头标记序列。接头标记序列的长度可以是以下、是约以下、是至少约以下或是至多约以下的核苷酸:5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个或更多个。接头标记序列可以用于促进条形码的合成。接头标记可以包括纠错(例如汉明)码。
固体支持物
在一些实施方案中,本文公开的条形码(诸如随机条形码)可以与固体支持物关联。固体支持物可以是例如合成颗粒。在一些实施方案中,固体支持物上的多于一种条形码(例如,第一多于一种条形码)的一些或所有条形码序列(诸如,随机条形码(例如,第一条形码序列)的分子标记)相差至少一个核苷酸。同一固体支持物上的条形码的细胞标记可以是相同的。不同固体支持物上的条形码的细胞标记可以相差至少一个核苷酸。例如,第一固体支持物上的第一多于一种条形码的第一细胞标记可以具有相同的序列,且第二固体支持物上的第二多于一种条形码的第二细胞标记可以具有相同的序列。第一固体支持物上的第一多于一种条形码的第一细胞标记和第二固体支持物上的第二多于一种条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记可以是例如约5-20个核苷酸长。条形码序列可以是例如约5-20个核苷酸长。合成颗粒可以是例如珠。
珠可以是例如硅胶珠、可控孔径玻璃珠、磁珠、Dynabead、交联葡聚糖/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。珠可以包括材料诸如聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮或其任何组合。
在一些实施方案中,珠可以是用条形码或随机条形码官能化的聚合物珠(例如可变形珠或凝胶珠)(诸如来自10X Genomics(San Francisco,CA)的凝胶珠)。在一些实施方式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如,四甲基乙二胺(TEMED))后,可以产生凝胶珠。
在一些实施方案中,颗粒可以是可降解的。例如,聚合物珠可以例如在期望的条件下溶解、熔化或降解。所期望的条件可以包括环境条件。所期望的条件可以导致聚合物珠以受控方式溶解、熔化或降解。凝胶珠可以由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。
例如,分析物和/或试剂(诸如寡核苷酸条形码)可以偶联/固定至凝胶珠的内表面(例如,经由寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散而可及的内部)和/或凝胶珠的外表面或本文描述的任何其他微胶囊。偶联/固定可以经由任何形式的化学键合(例如,共价键、离子键)或物理现象(例如,范德华力、偶极-偶极相互作用等)。在一些实施方案中,本文描述的试剂与凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的,诸如,例如经由不稳定型部分(例如,经由化学交联物,包括本文描述的化学交联物)。在施加刺激后,不稳定型部分可以被裂解并释放所固定的试剂。在一些实施方案中,不稳定型部分是二硫键。例如,在经由二硫键将寡核苷酸条形码固定至凝胶珠的情况下,使二硫键暴露于还原剂可以裂解二硫键并从珠释放寡核苷酸条形码。不稳定型部分可以作为凝胶珠或微胶囊的一部分、作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分被包括。在一些实施方案中,多于一种条形码的至少一种条形码可以被固定在颗粒上、被部分固定在颗粒上、被包封在颗粒中、被部分包封在颗粒中或其任何组合。
在一些实施方案中,凝胶珠可以包括宽范围的不同的聚合物,包括但不限于:聚合物、热敏聚合物、光敏聚合物、磁性聚合物、pH敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白和/或塑料。聚合物可以包括但不限于以下材料:诸如聚(N-异丙基丙烯酰胺)(PNIPAAm)、聚(苯乙烯磺酸酯)(PSS)、聚(烯丙基胺)(PAAm)、聚(丙烯酸)(PAA)、聚(乙烯亚胺)(PEI)、聚(双烯丙基二甲基-氯化铵)(PDADMAC)、聚(吡咯)(poly(pyrolle),PPy)、聚(乙烯基吡咯烷酮)(PVPON)、聚(乙烯基吡啶)(PVP)、聚(甲基丙烯酸)(PMAA)、聚(甲基丙烯酸甲酯)(PMMA)、聚苯乙烯(PS)、聚(四氢呋喃)(PTHF)、聚(邻苯二甲醛)(PPA)、聚(己基紫精)(PHV)、聚(L-赖氨酸)(PLL)、聚(L-精氨酸)(PARG)、聚(乳酸-共-羟基乙酸)(PLGA)。
许多化学刺激可以用于触发珠的破坏、溶解或降解。这些化学改变的实例可以包括但不限于pH介导的珠壁改变、经由交联键的化学裂解使珠壁崩解、珠壁的触发解聚和珠壁转换反应。批量(bulk)改变也可以用于触发珠的破坏。
通过各种刺激对微胶囊的批量或物理改变在设计胶囊以释放试剂方面也提供了许多优点。在宏观尺度上发生批量或物理改变,其中珠破裂是由刺激引起的机械-物理力的结果。这些过程可以包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率的改变。
生物刺激也可以用于触发珠的破坏、溶解或降解。通常,生物触发物类似于化学触发物,但是许多实例使用生物分子或生命系统中常见的分子,诸如酶、肽、糖、脂肪酸、核酸等。例如,珠可以包含具有对特定蛋白酶的裂解敏感的肽交联的聚合物。更特别地,一种实例可以包括包含GFLGK肽交联的微胶囊。在添加生物触发物(诸如蛋白酶组织蛋白酶B(Cathepsin B))后,壳壁的肽交联被裂解并且珠的内容物被释放。在其他情况下,蛋白酶可以是热激活的。在另一种实例中,珠包括包含纤维素的壳壁。壳聚糖水解酶的添加用作纤维素键裂解、壳壁解聚及其内部内容物释放的生物触发物。
还可以在施加热刺激后诱导珠释放其内容物。温度的改变可以引起珠的各种改变。热量的变化可能导致珠的熔化,使得珠壁崩解。在其他情况下,热量可以增加珠的内部组分的内部压力,使得珠破裂或爆炸。在又其他的情况下,热量可以使珠转化成收缩的脱水状态。热量还可以作用于珠壁内的热敏聚合物,从而引起珠的破坏。
将磁性纳米颗粒包括在微胶囊的珠壁中可以允许珠的触发破裂以及将珠引导呈阵列形式。本公开内容的装置可以包括用于任一目的的磁珠。例如,将Fe3O4纳米颗粒掺入含聚电解质的珠中,在存在振荡磁场刺激的情况下触发破裂。
珠也可以由于电刺激的结果被破坏、溶解或降解。与先前部分中描述的磁性颗粒类似,电敏珠可以允许珠的触发破裂以及其他功能,诸如电场中的对齐、电导率或氧化还原反应。在一种实例中,含电敏材料的珠在电场中对齐,从而可以控制内部试剂的释放。在其他实例中,电场可以在珠壁自身内引起氧化还原反应,这可以增加孔隙率。
也可以使用光刺激来破坏珠。许多光触发物是可能的,并且可以包括使用各种分子(诸如能够吸收特定波长范围的光子的纳米颗粒和发色团)的系统。例如,金属氧化物涂层可以用作胶囊触发物。涂覆有SiO2的聚电解质胶囊的UV照射可以导致珠壁的崩解。在又另一种实例中,可以将可光切换材料(诸如偶氮苯基团)掺入珠壁中。在施加UV或可见光后,诸如这些的化学物质在吸收光子后经历可逆的顺式-至-反式异构化。在此方面,光子开关(photon switch)的掺入产生在施加光触发后可以崩解或变得更多孔的珠壁。
例如,在图2图示的条形码化(例如,随机条形码化)的非限制性示例中,在框208处将诸如单细胞的细胞引入微孔阵列的多于一个微孔上之后,在框212处可以将珠引入微孔阵列的多于一个微孔上。每个微孔可以包含一个珠。珠可以包含多于一种条形码。条形码可以包含附接至珠的5’胺区域。条形码可以包含通用标记、条形码序列(例如,分子标记)、靶结合区或其任何组合。
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。与固体支持物关联的条形码可各自包含选自这样的组的条形码序列,所述组包括至少100种或1000种具有独特序列的条形码序列。在一些实施方案中,与固体支持物关联的不同条形码可以包含具有不同序列的条形码。在一些实施方案中,与固体支持物关联的条形码的一定百分比包含相同的细胞标记。例如,所述百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%,或在这些值中的任何两个值之间的数字或范围。作为另一个实例,所述百分比可以是至少以下,或至多以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,与固体支持物关联的条形码可以具有相同的细胞标记。与不同固体支持物关联的条形码可以具有选自这样的组的不同的细胞标记,所述组包括至少100种或1000种具有独特序列的细胞标记。
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。在一些实施方案中,可以用包括与多于一种条形码关联的多于一种合成颗粒的固体支持物将样品中的多于一种靶条形码化。在一些实施方案中,固体支持物可以包括与多于一种条形码关联的多于一个合成颗粒。不同固体支持物上的多于一种条形码的空间标记可以相差至少一个核苷酸。固体支持物可以例如在二维或三维包括多于一种条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔径玻璃珠、磁珠、Dynabead、交联葡聚糖/琼脂糖凝胶珠、珠状纤维素、聚苯乙烯珠或其任何组合。固体支持物可包括聚合物、基质、水凝胶、针阵列装置、抗体或其任何组合。在一些实施方案中,固体支持物可以自由浮动。在一些实施方案中,固体支持物可以包埋到半固体或固体阵列中。条形码可以不与固体支持物关联。条形码可以是单独的核苷酸。条形码可以与基底关联。
如本文使用的,术语“拴系的”、“附接的”和“固定的”可以互换使用,并且可以指用于将条形码附接至固体支持物的共价或非共价方式。可以将各种不同的固体支持物中的任何一种用作固体支持物,以用于附接预先合成的条形码或用于原位固相合成条形码。
固体支持物可以是珠。珠可以包括一种或更多种类型的实心的、多孔的或空心的球体、球、承座、圆柱体或可以固定(例如,共价地或非共价地)核酸的其他类似配置。珠可以由例如塑料、陶瓷、金属、聚合物材料或其任何组合构成。珠可以是或包括球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。在一些实施方案中,珠的形状可以是非球形的。
珠可以包含包括但不限于以下的各种材料:顺磁材料(例如,镁、钼、锂和钽)、超顺磁材料(例如,铁氧体(Fe3O4;磁铁矿)纳米颗粒)、铁磁材料(例如,铁、镍、钴,它们的一些合金,以及一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙或其任何组合。在一些实施方案中,珠(例如,标记所附接的珠)是水凝胶珠。在一些实施方案中,珠包括水凝胶。
本文公开的一些实施方案包括一个或更多个颗粒(例如,珠)。每个颗粒可以包含多于一种寡核苷酸(例如,条形码)。多于一种寡核苷酸中的每一种可以包含条形码序列(例如,分子标记序列)、细胞标记和靶结合区(例如,寡(dT)序列、基因特异性序列、随机多聚体或其组合)。多于一种寡核苷酸的每一种的细胞标记序列可以是相同的。不同颗粒上的寡核苷酸的细胞标记序列可以是不同的,使得可以鉴定不同颗粒上的寡核苷酸。在不同实施方式中,不同细胞标记序列的数目可以是不同的。在一些实施方案中,细胞标记序列的数目可以是以下、可以是约以下、可以是至少以下、或可以是至多以下:10种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、3000种、4000种、5000种、6000种、7000种、8000种、9000种、10000种、20000种、30000种、40000种、50000种、60000种、70000种、80000种、90000种、100000种、106种、107种、108种、109种或在这些值中的任何两个之间的数字或范围或更多。在一些实施方案中,多于一个颗粒中的不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多个颗粒包括具有相同细胞序列的寡核苷酸。在一些实施方案中,包括具有相同细胞序列的寡核苷酸的多于一个颗粒可以是至多0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更多。在一些实施方案中,多于一个颗粒中没有一个具有相同的细胞标记序列。
每个颗粒上的多于一种寡核苷酸可以包含不同的条形码序列(例如,分子标记)。在一些实施方案中,条形码序列的数目可以是以下、可以是约以下、可以是至少以下、或可以是至多以下:10种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、3000种、4000种、5000种、6000种、7000种、8000种、9000种、10000种、20000种、30000种、40000种、50000种、60000种、70000种、80000种、90000种、100000种、106种、107种、108种、109种或在这些值中的任何两个之间的数字或范围。例如,多于一种寡核苷酸中的至少100种包含不同的条形码序列。作为另一个实例,在单个颗粒中,多于一种寡核苷酸中的至少100种、500种、1000种、5000种、10000种、15000种、20000种、50000种,这些值中的任何两个之间的数字或范围,或更多种包含不同的条形码序列。一些实施方案提供了包含条形码的多于一个颗粒。在一些实施方案中,待标记的靶和不同条形码序列的出现(或拷贝或数目)的比例可以是至少1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90或更高。在一些实施方案中,多于一种寡核苷酸的每一种还包含样品标记、通用标记或二者。颗粒可以是例如纳米颗粒或微米颗粒。
珠的尺寸可以不同。例如,珠的直径的范围可以是0.1微米至50微米。在一些实施方案中,珠的直径可以是以下或可以是约以下:0.1微米、0.5微米、1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米或50微米或在这些值中的任何两个之间的数字或范围。
珠的直径可以与基底的孔的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短以下或者约以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或在这些值中的任何两个之间的数字或范围。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比细胞的直径长或短以下、约以下、至少以下或至多以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%或在这些值中的任何两个之间的数字或范围。
珠可以附接至基底和/或包埋到基底中。珠可以附接至凝胶、水凝胶、聚合物和/或基质和/或包埋到凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上的条形码上存在的空间标记来鉴定,该空间标记可以用作位置地址。
珠的实例可以包括但不限于链霉抗生物素蛋白珠、琼脂糖珠、磁珠、 微珠、抗体缀合的珠(例如,抗免疫球蛋白微珠)、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基封端磁珠。
珠可以与量子点或荧光染料关联(例如,用量子点或荧光染料浸渍),以使其在一个荧光光学通道或多于一个光学通道中发荧光。珠可以与氧化铁或氧化铬关联,使其成为顺磁性或铁磁性。珠可以是可鉴定的。例如,可以使用照相机对珠成像。珠可以具有与珠关联的可检测代码。例如,珠可以包含条形码。珠可以改变尺寸,例如由于在有机溶液或无机溶液中溶胀。珠可以是疏水的。珠可以是亲水的。珠可以是生物相容的。
固体支持物(例如,珠)可以被可视化。固体支持物可以包含可视化标签(例如,荧光染料)。固体支持物(例如,珠)可以蚀刻有标识符(例如,数字)。标识符可以通过对珠成像来可视化。
固体支持物可以包括可溶性、半溶性或不溶性材料。当固体支持物包括接头、支架、构建模块(building block)或其他与其附接的反应性部分时,固体支持物可以被称为“官能化的”,而当固体支持物缺少这种与其附接的反应性部分时,固体支持物可以被称为“非官能化的”。固体支持物可以以溶液中游离,诸如在微量滴定孔中的形式;以流通形式,诸如在柱中;或以浸量尺(dipstick)使用。
固体支持物可以包括膜、纸(paper)、塑料、涂覆表面、平坦表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以采取树脂、凝胶、微球或其他几何配置的形式。固体支持物可以包括二氧化硅芯片、微米颗粒、纳米颗粒、板、阵列、毛细管、平坦支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢、金、银、铝、硅和铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如,由聚乙烯、聚丙烯、聚酰胺、聚偏二氟乙烯形成),和/或晶片、梳、针或针头(例如,适于组合合成或分析的针阵列)或珠,平坦表面诸如晶片(例如,硅晶片)的凹陷或纳升孔阵列,具有凹陷的晶片(具有或不具有过滤器底部)。
固体支持物可以包括聚合物基质(例如,凝胶、水凝胶)。聚合物基质可以能够渗透细胞内空间(例如,细胞器周围)。聚合物基质可以能够被泵送到整个循环系统。
如本文使用的,基底可以指固体支持物类型。基底可以指可以包含本公开内容的条形码或随机条形码的固体支持物。基底可以例如包括多于一个微孔。基底可以例如是包括两个或更多个微孔的孔阵列。在一些实施方案中,微孔可以包括定义体积的小的反应室。在一些实施方案中,微孔可以捕获一个或更多个细胞。在一些实施方案中,微孔可以仅捕获一个细胞。在一些实施方案中,微孔可以捕获一个或更多个固体支持物。在一些实施方案中,微孔可以仅捕获一个固体支持物。在一些实施方案中,微孔捕获单细胞和单个固体支持物(例如,珠)。微孔可以包含本公开内容的条形码试剂。
条形码化的方法
本公开内容提供了用于估计身体样品(例如,组织、器官、肿瘤、细胞)中不同位置处的不同靶的数目的方法。方法可以包括将条形码(例如,随机条形码)紧密接近样品放置,裂解样品,将不同的靶与条形码关联,对靶进行扩增和/或对靶进行数字计数。方法还可以包括对从条形码上的空间标记获得的信息进行分析和/或将所述信息可视化。在一些实施方案中,方法包括使样品中的多于一种靶可视化。将多于一种靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一种靶条形码化(例如,随机条形码化)之前或之后产生二维映射图和三维映射图。将样品中的多于一种靶可视化可以包括将多于一种靶映射到样品的映射图上。将多于一种靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在对样品中的多于一种靶进行条形码化之前或之后生成二维映射图和三维映射图。在一些实施方案中,可以在裂解样品之前或之后生成二维映射图和三维映射图。在产生二维映射图或三维映射图之前或之后裂解样品可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。
将多于一种靶条形码化可以包括将多于一种条形码与多于一种靶杂交,以产生条形码化的靶(例如,随机条形码化的靶)。将多于一种靶条形码化可以包括产生条形码化靶的索引文库。产生条形码化靶的索引文库可以用包含多于一种条形码(例如,随机条形码)的固体支持物来进行。
使样品和条形码接触
本公开内容提供了用于使样品(例如,细胞)与本公开内容的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如,随机条形码)接触。细胞可以例如通过重力流来接触,其中可以使细胞沉淀并且产生单层。样品可以是组织薄切片。可以将薄切片放置于基底上。样品可以是一维的(例如,形成平坦表面)。可以使样品(例如,细胞)分散遍及基底,例如,通过在基底上生长/培养细胞。
当条形码紧密接近靶时,靶可以与条形码杂交。条形码可以按不可耗尽的比例接触,使得每种不同的靶可以与本公开内容的不同条形码关联。为了确保靶与条形码之间的有效关联,可以将靶与条形码交联。
细胞裂解
在细胞和条形码的分配之后,可以使细胞裂解以释放靶分子。细胞裂解可以通过各种手段中的任何一种来完成,例如通过化学或生化手段,通过渗透冲击,或通过热裂解、机械裂解或光学裂解的手段。可以通过添加包含去污剂(例如,SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)、有机溶剂(例如,甲醇或丙酮)或消化酶(例如,蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。为了增加靶与条形码的关联,可以通过例如降低裂解物的温度和/或增加裂解物的粘度来改变靶分子的扩散速率。
在一些实施方案中,可以使用滤纸来裂解样品。可以在滤纸上部用裂解缓冲液浸泡滤纸。可以通过压力将滤纸施加至样品,这可以促进样品的裂解以及样品的靶与基底的杂交。
在一些实施方案中,裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解来进行。化学裂解可以包括使用消化酶,诸如蛋白酶K、胃蛋白酶和胰蛋白酶。裂解可以通过将裂解缓冲液添加至基底来进行。裂解缓冲液可以包含Tris HCl。裂解缓冲液可以包含至少约或至多约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含约0.1MTris HCl。裂解缓冲液的pH可以是、是约、是至少约或是至多约1、2、3、4、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10,或者这些值中的任何两个之间的数字或范围。裂解缓冲液可以包含盐(例如,LiCl)。裂解缓冲液中的盐浓度可以是至少约0.1M、0.5M或1M或更高。裂解缓冲液中的盐浓度可以是至多约0.1M、0.5M或1M或更高。在一些实施方案中,裂解缓冲液中的盐浓度是约0.5M。裂解缓冲液可以包含去污剂(例如,SDS、十二烷基硫酸锂、triton X、tween、NP-40)。裂解缓冲液中的去污剂浓度可以是至少约或至多约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。在一些实施方案中,裂解缓冲液中的去污剂浓度是约1%的十二烷基硫酸锂。裂解方法中使用的时间可以取决于所使用的去污剂的量。在一些实施方案中,使用的去污剂越多,裂解所需的时间越少。裂解缓冲液可以包含螯合剂(例如,EDTA、EGTA)。裂解缓冲液中螯合剂的浓度可以是至少约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。裂解缓冲液中螯合剂的浓度可以是至多约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。在一些实施方案中,裂解缓冲液中的螯合剂浓度是约10mM。裂解缓冲液可以包含还原剂(例如,β-巯基乙醇、DTT)。裂解缓冲液中还原剂的浓度可以是至少约或至多约1mM、5mM、10mM、15mM或20mM或更高。在一些实施方案中,裂解缓冲液可以包含约0.1M Tris HCl,约pH 7.5,约0.5M LiCl,约1%十二烷基硫酸锂,约10mM EDTA和约5mM DTT。
裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度进行。裂解可以进行约1分钟、5分钟、10分钟、15分钟或20分钟或更多分钟。裂解的细胞可以包含至少约或至多约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多靶核酸分子。
将条形码附接至靶核酸分子
在细胞裂解和核酸分子从细胞释放之后,核酸分子可以与共定位的固体支持物的条形码随机关联。关联可以包括使条形码的靶识别区与靶核酸分子的互补部分杂交(例如,条形码的寡(dT)可以与靶的多(A)尾相互作用)。可以选择用于杂交的测定条件(例如,缓冲液pH、离子强度、温度)以促进形成特定的稳定的杂合体。在一些实施方案中,可以将从裂解的细胞释放的核酸分子与基底上的多于一种探针关联(例如,与基底上的探针杂交)。当探针包含寡(dT)时,可以将mRNA分子与探针杂交并且逆转录。寡核苷酸的寡(dT)部分可以充当用于cDNA分子的第一链合成的引物。例如,在图2中图示的条形码化的非限制性示例中,在框216处,mRNA分子可以与珠上的条形码杂交。例如,单链的核苷酸片段可以与条形码的靶结合区杂交。
附接还可以包括将条形码的靶识别区与靶核酸分子的一部分连接。例如,靶结合区可以包含可以能够与限制性位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。测定程序还可以包括用限制性酶(例如,EcoRI)处理靶核酸以产生限制性位点突出端。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。连接酶(例如,T4DNA连接酶)可以用于连接两个片段。
例如,在图2中图示的条形码化的非限制性示例中,在框220处,随后可以将来自多于一个细胞(或多于一个样品)的标记的靶(例如,靶-条形码分子)汇集至例如管中。标记的靶可以通过例如取回(retrieving)条形码和/或附接靶-条形码分子的珠来汇集。
可以通过使用磁珠和外部施加的磁场来实现附接的靶-条形码分子的基于固体支持物的集合的取回。汇集靶-条形码分子后,所有进一步的处理可以在单个反应容器中进行。进一步的处理可以包括,例如,逆转录反应、扩增反应、裂解反应、解离反应和/或核酸延伸反应。进一步的处理反应可以在微孔内进行,即,不先汇集来自多于一个细胞的标记的靶核酸分子。
逆转录
本公开内容提供了使用逆转录(例如,在图2的框224处)来产生靶-条形码缀合物的方法。靶-条形码缀合物可以包含条形码以及靶核酸的全部或一部分的互补序列(即,条形码化的cDNA分子,诸如随机条形码化的cDNA分子)。关联的RNA分子的逆转录可以通过添加逆转录引物连同逆转录酶而发生。逆转录引物可以是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。寡(dT)引物的长度可以是12-18个核苷酸或可以是约12-18个核苷酸,并且与哺乳动物mRNA的3’末端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。
在一些实施方案中,标记的RNA分子的逆转录可以通过添加逆转录引物而发生。在一些实施方案中,逆转录引物是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。通常,寡(dT)引物的长度是12-18个核苷酸,并且与哺乳动物mRNA的3’末端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。
逆转录可以重复地发生以产生多于一个标记的cDNA分子。本文公开的方法可以包括进行至少约或至多约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次逆转录反应。
扩增
可以进行一个或更多个核酸扩增反应(例如,在图2的框228处)以产生标记的靶核酸分子的多于一个拷贝。扩增可以以多重化方式进行,其中多于一种靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(如果存在)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如,分子标记)的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、条形码序列(例如,分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多于一种核酸的0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%或在这些值中的任何两个之间的范围或数字。方法还可以包括进行一个或更多个cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如,分子标记)的靶-条形码分子的一个或更多个cDNA拷贝。
在一些实施方案中,可以使用聚合酶链式反应(PCR)进行扩增。如本文使用的,PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。如本文使用的,PCR可以包括所述反应的衍生形式,包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR和组装PCR。
标记的核酸的扩增可以包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)和Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性核酸内切酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’核酸外切酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(RAM)。在一些实施方案中,扩增不产生环化转录物。
在一些实施方案中,本文公开的方法还包括对标记的核酸(例如,标记的RNA、标记的DNA、标记的cDNA)进行聚合酶链式反应以产生标记的扩增子(例如,随机标记的扩增子)。标记的扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如,分子标记)。标记的扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本公开内容的核酸可以包括合成的或改变的核酸。
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括,但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以退火至多于一种标记的靶(例如,随机标记的靶)的至少一部分。一种或更多种引物可以退火至多于一种标记的靶的3’末端或5’末端。一种或更多种引物可以退火至多于一种标记的靶的内部区域。内部区域可以与多于一种标记的靶的3’末端距离至少约以下或至多约以下:50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种基因特异性引物。
一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如,分子标记)、靶或其任何组合。一种或更多种引物可以包括通用引物和定制引物。定制引物可以设计成扩增一种或更多种靶。靶可以包括一个或更多个样品中总核酸的子集。靶可以包括一个或更多个样品中总标记靶的子集。一种或更多种引物可以包括至少96种或更多种定制引物、至少960种或更多种定制引物、或至少9600种或更多种定制引物。一种或更多种定制引物可以退火至两种或更多种不同的标记的核酸。两种或更多种不同的标记的核酸可以对应于一种或更多种基因。
可以在本公开内容的方法中使用任何扩增方案。例如,在一种方案中,第一轮PCR可以使用基因特异性引物和针对通用Illumina测序引物1序列的引物来扩增附接至珠的分子。第二轮PCR可以使用侧翼为Illumina测序引物2序列的巢式基因特异性引物和针对通用Illumina测序引物1序列的引物扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引,以使PCR产物变成Illumina测序文库。使用150bp×2测序的测序可以揭示读段1上的细胞标记和条形码序列(例如,分子标记)、读段2上的基因以及索引1读段上的样品索引。
在一些实施方案中,可以使用化学裂解将核酸从基底去除。例如,存在于核酸中的化学基团或经修饰的碱基可以用于促进将核酸从固体支持物去除。例如,酶可以用于将核酸从基底去除。例如,通过限制性核酸内切酶消化可以将核酸从基底去除。例如,用尿嘧啶-d-糖苷酶(UDG)处理含dUTP或ddUTP的核酸可以用于将核酸从基底去除。例如,可以使用进行核苷酸切除的酶(诸如,碱基切除修复酶,诸如无嘌呤/无嘧啶(apurinic/apyrimidinic,AP)核酸内切酶)将核酸从基底去除。在一些实施方案中,可以使用可光裂解基团以及光将核酸从基底去除。在一些实施方案中,可以使用可裂解接头将核酸从基底去除。例如,可裂解接头可以包括以下中的至少一种:生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、生物素/中性抗生物素蛋白、Ig蛋白A、光不稳定型接头、酸或碱不稳定型接头基团或适配体。
当探针是基因特异性时,可以将分子与探针杂交,并且逆转录和/或扩增。在一些实施方案中,在核酸已经合成(例如,逆转录)之后,核酸可以被扩增。扩增可以以多重方式进行,其中多种靶核酸序列同时扩增。扩增可以将测序衔接子添加至核酸。
在一些实施方案中,可以例如用桥接扩增在基底上进行扩增。cDNA可以加同聚物尾,以便产生相容末端,用于使用基底上的寡(dT)探针进行桥接扩增。在桥接扩增中,与模板核酸的3’末端互补的引物可以是共价地附接至固体颗粒的每对引物中的第一引物。当包含模板核酸的样品与颗粒接触并进行单个热循环时,可以将模板分子退火至第一引物,并且第一引物通过添加核苷酸而向前延长以形成双链体分子,所述双链体分子由模板分子和与模板互补的新形成的DNA链构成。在下一循环的加热步骤中,双链体分子可以变性,从颗粒释放模板分子并且留下通过第一引物附接至颗粒的互补DNA链。在随后的退火和延长步骤的退火阶段中,互补链可以与第二引物杂交,第二引物在从第一引物去除的位置处与互补链的区段互补。这种杂交可导致互补链在第一引物和第二引物之间形成桥,通过共价键连接第一引物并通过杂交连接第二引物。在延长阶段,通过在同一反应混合物中添加核苷酸,第二引物可以在反向方向上延长,从而将桥转化为双链桥。然后开始下一个循环,并且双链桥可以变性以产生两个单链核酸分子,每个单链核酸分子具有的一个末端分别经由第一引物和第二引物附接至颗粒表面,其中每个单链核酸分子的另一个末端是未附接的。在这第二个循环的退火和延长步骤中,每条链可以与同一颗粒上先前未使用的另外的互补引物杂交,以形成新的单链桥。现在杂交的两个先前未使用的引物延长从而将两个新的桥转换成双链桥。
扩增反应可以包括扩增多于一种核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%。
标记的核酸的扩增可以包括基于PCR的方法或非基于PCR的方法。标记的核酸的扩增可以包括对标记的核酸的指数式扩增。标记的核酸的扩增可以包括对标记的核酸的线性扩增。扩增可以通过聚合酶链式反应(PCR)来进行。PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。PCR可以涵盖反应的衍生形式,包括但不限于,RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR、抑制PCR、半抑制PCR以及组装PCR。
标记的核酸的扩增可以包括基于非PCR的方法,包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)、Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性核酸内切酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’核酸外切酶活性的核酸聚合酶的链置换扩增、滚环扩增和/或分支延伸扩增(RAM)。
在一些实施方案中,本文公开的方法还包括对扩增的扩增子(例如,靶)进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标签或分子标识符标记。可选地,扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本发明的核酸可以包括合成的或改变的核酸。
在一些实施方案中,方法包括反复扩增标记的核酸以产生多于一个扩增子。本文公开的方法可以包括进行至少约、至多约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次、20次、25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次扩增反应。
扩增可以还包括将一种或更多种对照核酸添加至一个或更多个包含多于一种核酸的样品中。扩增可以还包括将一种或更多种对照核酸添加至多于一种核酸。对照核酸可以包含对照标记。
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定型和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括一种或更多种寡核苷酸。一种或更多种寡核苷酸可以包含至少约7-9个核苷酸。一种或更多种寡核苷酸可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一种标记的核酸的至少一部分。一种或更多种引物可以退火至多于一种标记的核酸的3’末端和/或5’末端。一种或更多种引物可以退火至多于一种标记的核酸的内部区域。内部区域可以与多于一种标记的核酸的3’末端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种管家基因引物。一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标签、第二样品标签、分子标识符标记、核酸或其产物。一种或更多种引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一种或更多种靶核酸。靶核酸可以包括一个或更多个样品中总核酸的子集。在一些实施方案中,引物是与本公开内容的阵列附接的探针。
在一些实施方案中,将样品中的多于一种靶条形码化(例如,随机条形码化)还包括产生条形码化靶(例如,随机条形码化靶)或靶的条形码化片段的索引文库。不同的条形码的条形码序列(例如,不同的随机条形码的分子标记)可以彼此不同。产生条形码化靶的索引文库包括从样品中的多于一种靶产生多于一种索引多核苷酸。例如,对于包括第一索引靶和第二索引靶的条形码化靶的索引文库,第一索引多核苷酸的标记区与第二索引多核苷酸的标记区可以相差以下、相差约以下、相差至少以下或相差至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中,产生条形码化靶的索引文库包括使多于一种靶(例如mRNA分子)与包含多(T)区和标记区的多于一种寡核苷酸接触;以及使用逆转录酶进行第一链合成以产生单链标记的cDNA分子(每种包含cDNA区和标记区),其中多于一种靶包括至少两种不同序列的mRNA分子,且多于一种寡核苷酸包括至少两种不同序列的寡核苷酸。产生条形码化靶的索引文库还可以包括扩增单链标记的cDNA分子以产生双链标记的cDNA分子;以及对双链标记的cDNA分子进行巢式PCR以产生标记的扩增子。在一些实施方案中,方法可以包括产生衔接子标记的扩增子。
条形码化(例如,随机条形码化)可以包括使用核酸条形码或标签以标记个体核酸(例如,DNA或RNA)分子。在一些实施方案中,其包括在从mRNA产生cDNA分子时将DNA条形码或标签添加至cDNA分子。可以进行巢式PCR以使PCR扩增偏倚最小化。可以添加用于测序(例如下一代测序(NGS))使用的衔接子。例如在图2的框232处,可以使用测序结果来确定靶的一个或更多个拷贝的细胞标记、分子标记和核苷酸片段的序列。
图3是示出了产生条形码化靶(例如,随机条形码化靶)的索引文库,诸如条形码化的mRNA或其片段的索引文库的非限制性示例性过程的示意图。如步骤1中示出的,逆转录过程可以用独特分子标记、细胞标记和通用PCR位点对每个mRNA分子进行编码。具体地,通过将一组条形码(例如,随机条形码)310与RNA分子302的多(A)尾区308杂交(例如,随机杂交),可以将RNA分子302逆转录以产生标记的cDNA分子304(包括cDNA区306)。条形码310中的每一个可以包括靶结合区,例如多(dT)区312、标记区314(例如,条形码序列或分子)和通用PCR区316。
在一些实施方案中,细胞标记可以包含3个至20个核苷酸。在一些实施方案中,分子标记可以包含3个至20个核苷酸。在一些实施方案中,多于一种随机条形码中的每一种还包括通用标记和细胞标记中的一种或更多种,其中通用标记对于固体支持物上的多于一种随机条形码是相同的,并且细胞标记对于固体支持物上的多于一种随机条形码是相同的。在一些实施方案中,通用标记可以包含3个至20个核苷酸。在一些实施方案中,细胞标记包含3个至20个核苷酸。
在一些实施方案中,标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施方案中,标记区314可以包括通用标记、维度标记和细胞标记中的一种或更多种。条形码序列或分子标记318的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或在这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记320的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或在这些值中的任何两个值之间的数字或范围的核苷酸。通用标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或在这些值中的任何两个值之间的数字或范围的核苷酸。通用标记对于固体支持物上的多于一个随机条形码可以是相同的,并且细胞标记对于固体支持物上的多于一种随机条形码是相同的。维度标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或在这些值中的任何两个值之间的数字或范围的核苷酸。
在一些实施方案中,标记区314可以包括以下、可以包括约以下、可以包括至少以下或可以包括至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种或在这些值中的任何两个值之间的数字或范围的不同标记,诸如条形码序列或分子标记318和细胞标记320。每一种标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值中的任何两个值之间的数字或范围的核苷酸。一组条形码或随机条形码310可以含有以下、可以含有约以下、可以含有至少以下或可以含有至多以下:10种、20种、40种、50种、70种、80种、90种、102种、103种、104种、105种、106种、107种、108种、109种、1010种、1011种、1012种、1013种、1014种、1015种、1020种或在这些值中的任何两个值之间的数字或范围的条形码或随机条形码310。并且条形码或随机条形码310的组可以例如,各自包含独特标记区314。标记的cDNA分子304可以进行纯化以去除过量的条形码或随机条形码310。纯化可以包括Ampure珠纯化。
如步骤2中示出的,来自步骤1中的逆转录过程的产物可以汇集到1个管中,且用第1PCR引物池和第1通用PCR引物进行PCR扩增。因为独特标记区314,汇集是可能的。特别地,可以将标记的cDNA分子304扩增以产生巢式PCR标记的扩增子322。扩增可以包括多重PCR扩增。扩增可以包括以单一反应体积用96种多重引物进行的多重PCR扩增。在一些实施方案中,在单一反应体积中,多重PCR扩增可以利用以下、利用约以下、利用至少以下或利用至多以下:10种、20种、40种、50种、70种、80种、90种、102种、103种、104种、105种、106种、107种、108种、109种、1010种、1011种、1012种、1013种、1014种、1015种、1020种多重引物或在这些值中的任何值之间的数字或范围的多重引物。扩增可以包括使用包括靶向特定基因的定制引物326A-C的第1PCR引物池324和通用引物328。定制引物326可以与标记的cDNA分子304的cDNA部分306’内的区域杂交。通用引物328可以与标记的cDNA分子304的通用PCR区域316杂交。
如图3的步骤3中示出的,来自步骤2中的PCR扩增的产物可以用巢式PCR引物池和第2通用PCR引物扩增。巢式PCR可以使PCR扩增偏倚最小化。特别地,巢式PCR标记的扩增子322可通过巢式PCR进行进一步扩增。巢式PCR可以包括在单一反应体积中用巢式PCR引物332a-c的巢式PCR引物池330和第2通用PCR引物328’进行的多重PCR。巢式PCR引物池330可以包含以下、包含约以下、包含至少以下或包含至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种不同的巢式PCR引物330或在这些值中的任何值之间的数字或范围的不同的巢式PCR引物332。巢式PCR引物332可以包含衔接子334,并与标记的扩增子322的cDNA部分306”内的区域杂交。通用引物328’可以包含衔接子336,并与标记的扩增子322的通用PCR区域316杂交。由此,步骤3产生衔接子标记的扩增子338。在一些实施方案中,巢式PCR引物332和第2通用PCR引物328’可以不包含衔接子334和衔接子336。而是,衔接子334和衔接子336可以连接至巢式PCR的产物以产生衔接子标记的扩增子338。
如步骤4中示出的,可以使用文库扩增引物将来自步骤3的PCR产物进行PCR扩增用于测序。特别地,可以使用衔接子334和衔接子336对衔接子标记的扩增子338进行一个或更多个另外的测定。衔接子334和衔接子336可以与引物340和引物342杂交。一种或更多种引物340和引物342可以是PCR扩增引物。一种或更多种引物340和引物342可以是测序引物。一种或更多种衔接子334和衔接子336可以用于衔接子标记的扩增子338的进一步扩增。一种或更多种衔接子334和衔接子336可以用于对衔接子标记的扩增子338测序。引物342可以包含板索引344,使得使用同一组条形码或随机条形码310产生的扩增子可以使用下一代测序(NGS)在一个测序反应中测序。
包含与寡核苷酸关联的细胞组分结合试剂的组合物
本文公开的一些实施方案提供了多于一种组合物,每种组合物包含与寡核苷酸缀合的细胞组分结合试剂(诸如蛋白结合试剂),其中寡核苷酸包含用于与其缀合的细胞组分结合试剂的独特标识符。美国专利申请公布第US2018/0088112号和第US2018/0346970号中描述了细胞组分结合试剂(诸如条形码化抗体)及其用途(诸如细胞的样品索引);每项专利申请的内容通过引用以其整体并入本文。细胞组分结合试剂可以包括细胞内靶结合试剂、细胞表面靶结合试剂和/或核靶结合试剂。结合试剂(例如,细胞组分结合试剂)可以与结合试剂寡核苷酸关联。结合试剂寡核苷酸可以包括细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸和/或核靶结合试剂特异性寡核苷酸。
细胞组分结合试剂可以能够特异性结合细胞组分靶(例如,细胞内靶、核靶、细胞表面靶)。例如,细胞组分结合试剂的结合靶可以是以下或包括以下:糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整联蛋白、细胞内蛋白或其任何组合。在一些实施方案中,细胞组分结合试剂(例如,蛋白结合试剂)能够与抗原靶或蛋白质靶特异性结合。在一些实施方案中,每种寡核苷酸可以包含条形码,诸如随机条形码。条形码可以包括条形码序列(例如,分子标记)、细胞标记、样品标记或其任何组合。在一些实施方案中,每种寡核苷酸可以包含接头。在一些实施方案中,每种寡核苷酸可以包含用于寡核苷酸探针的结合位点,诸如多(A)尾。例如,多(A)尾可以例如不被锚定到固体支持物或者被锚定到固体支持物。多(A)尾的长度可以是约10个至50个核苷酸,例如长度是18个核苷酸。寡核苷酸可以包含脱氧核糖核苷酸、核糖核苷酸或二者。
独特标识符可以是,例如,具有任何合适长度例如约4个核苷酸至约200个核苷酸的核苷酸序列。在一些实施方案中,独特标识符是长度为25个核苷酸至约45个核苷酸的核苷酸序列。在一些实施方案中,独特标识符可以具有是以下、是约以下、小于以下、大于以下的长度:4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、70个、80个、90个、100个、200个核苷酸或以上值中的任何两个之间的范围。
在一些实施方案中,独特标识符选自一组相异的独特标识符。一组相异的独特标识符可以包括以下或可以包括约以下:20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、5000个或在这些值中的任何两个之间的数字或范围的不同的独特标识符。一组相异的独特标识符可以包括至少以下或包括至多以下:20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个或5000个不同的独特标识符。在一些实施方案中,一组独特标识符被设计成与待分析样品的DNA或RNA序列具有最小的序列同源性。在一些实施方案中,一组独特标识符的序列彼此或与其互补物相差以下或相差约以下的核苷酸:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或在这些值中的任何两个之间的数字或范围。在一些实施方案中,一组独特标识符的序列彼此或与其互补物相差至少以下,或相差至多以下:1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸或10个核苷酸。在一些实施方案中,一组独特标识符的序列表彼此或与其互补物相差至少3%、5%、8%、10%、15%、20%或更多。
在一些实施方案中,独特标识符可以包括用于引物(诸如通用引物)的结合位点。在一些实施方案中,独特标识符可以包括用于引物(诸如通用引物)的至少两个结合位点。在一些实施方案中,独特标识符可以包括用于引物(诸如通用引物)的至少三个结合位点。引物可以用于扩增独特标识符,例如,通过PCR扩增。在一些实施方案中,引物可以用于巢式PCR反应。
本公开内容中设想了任何合适的细胞组分结合试剂,诸如蛋白结合试剂、抗体或其片段、适配体、小分子、配体、肽、寡核苷酸或其任何组合。在一些实施方案中,细胞组分结合试剂可以是多克隆抗体、单克隆抗体、重组抗体、单链抗体(sc-Ab)或其片段,诸如Fab、Fv。在一些实施方案中,多于一种细胞组分结合试剂可以包括以下、包括约以下、包括至少以下或包括至多以下的不同细胞组分试剂:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000或在这些值中的任何两个之间的数字或范围。
寡核苷酸可以通过各种机制与细胞组分结合试剂缀合。在一些实施方案中,寡核苷酸可以与细胞组分结合试剂共价地缀合。在一些实施方案中,寡核苷酸可以与细胞组分结合试剂非共价地缀合。在一些实施方案中,寡核苷酸通过接头与细胞组分结合试剂缀合。接头可以是例如能够从细胞组分结合试剂和/或寡核苷酸裂解或脱离的。在一些实施方案中,接头可以包含将寡核苷酸可逆地附接至细胞组分结合试剂的化学基团。化学基团可以例如通过胺基团与接头缀合。在一些实施方案中,接头可以包含与另一个缀合到细胞组分结合试剂的化学基团形成稳定键的化学基团。例如,化学基团可以是UV光可裂解基团、二硫键、链霉抗生物素蛋白、生物素或胺。在一些实施方案中,化学基团可以通过氨基酸诸如赖氨酸上的伯胺或N-末端与细胞组分结合试剂缀合。可以使用商购可获得的缀合试剂盒,诸如Protein-Oligo缀合试剂盒(Solulink,Inc.,San Diego,CA)、oligo缀合系统(Innova Biosciences,Cambridge,UK)将寡核苷酸与细胞组分结合试剂缀合。
寡核苷酸可以与细胞组分结合试剂(例如,蛋白结合试剂)的任何合适的位点缀合,条件为寡核苷酸不干扰细胞组分结合试剂与其细胞组分靶之间的特异性结合。在一些实施方案中,细胞组分结合试剂是蛋白,诸如抗体。在一些实施方案中,细胞组分结合试剂不是抗体。在一些实施方案中,寡核苷酸可以与抗体在除了抗原结合位点之外的任何地方(例如Fc区、CH1结构域、CH2结构域、CH3结构域和CL结构域)缀合。将寡核苷酸与细胞组分结合试剂(例如抗体)缀合的方法先前已经在例如美国专利第6,531,283号中公开,其内容通过引用以其整体特此明确地并入。寡核苷酸与细胞组分结合试剂的化学计量可以变化。为了增加测序中检测细胞组分结合试剂特异性寡核苷酸的灵敏度,在缀合期间增加寡核苷酸与细胞组分结合试剂的比率可以是有利的。在一些实施方案中,每种细胞组分结合试剂可以与单种寡核苷酸分子缀合。在一些实施方案中,每种细胞组分结合试剂可以与多于一种寡核苷酸分子缀合,例如,与至少以下或至多以下的寡核苷酸分子缀合:2种、3种、4种、5种、10种、20种、30种、40种、50种、100种、1000种或在这些值中的任何两个之间的数字或范围,其中寡核苷酸分子中的每一种包含相同或不同的独特标识符。
在一些实施方案中,多于一种细胞组分结合试剂能够与样品中的多于一种细胞组分靶特异性结合,所述样品诸如单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。在一些实施方案中,多于一种细胞组分靶包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括细胞内细胞组分。在一些实施方案中,多于一种细胞组分可以是、是约、是至少或是至多细胞或生物体中所有细胞组分(例如蛋白)的以下:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或在这些值中的任何两个之间的数字或范围。在一些实施方案中,多于一种细胞组分靶可以包括、包括约、包括至少或包括至多2种、3种、4种、5种、10种、20种、30种、40种、50种、100种、1000种、10000种或在这些值中的任何两个之间的数字或范围的不同的细胞组分靶。
图4示出了与包含用于抗体的独特标识符序列的寡核苷酸关联(例如,缀合)的示例性细胞组分结合试剂(例如,抗体)的示意图。与细胞组分结合试剂缀合的寡核苷酸、用于与细胞组分结合试剂缀合的寡核苷酸或先前与细胞组分结合试剂缀合的寡核苷酸在本文中可被称为抗体寡核苷酸(缩写为结合试剂寡核苷酸)。与抗体缀合的寡核苷酸、用于与抗体缀合的寡核苷酸或先前与抗体缀合的寡核苷酸在本文可以被称为抗体寡核苷酸(缩写为“AbOligo”或“AbO”)。寡核苷酸还可以包含另外的组分,所述另外的组分包括但不限于一种或更多种接头、用于抗体的一种或更多种独特标识符、任选地一种或更多种条形码序列(例如,分子标记)和多(A)尾。在一些实施方案中,寡核苷酸可以从5’至3’包含接头、独特标识符、条形码序列(例如分子标记)和多(A)尾。抗体寡核苷酸可以是mRNA模拟物。
图5示出了与包含用于抗体的独特标识符序列的寡核苷酸关联(例如,缀合)的示例性细胞组分结合试剂(例如,抗体)的示意图。细胞组分结合试剂可以能够与至少一种细胞组分靶(诸如抗原靶或蛋白质靶)特异性结合。结合试剂寡核苷酸(例如,样品索引寡核苷酸或抗体寡核苷酸)可以包含用于进行本公开内容方法的序列(例如,样品索引序列)。例如,样品索引寡核苷酸可以包含样品索引序列,用于鉴定样品的一个或更多个细胞的样品来源。多于一种包含细胞组分结合试剂的组合物中的至少两种包含两种细胞组分结合试剂的组合物(例如样品索引组合物)的索引序列(例如样品索引序列)可以包含不同的序列。在一些实施方案中,结合试剂寡核苷酸与物种的基因组序列不同源。结合试剂寡核苷酸可以被配置为(或可以为)能够从细胞组分结合试剂脱离或不能够从细胞组分结合试剂脱离。
与细胞组分结合试剂缀合的寡核苷酸可以例如包含条形码序列(例如,分子标记序列)、多(A)尾或其组合。与细胞组分结合试剂缀合的寡核苷酸可以是mRNA模拟物。在一些实施方案中,样品索引寡核苷酸包含与多于一种条形码中的至少一种条形码的捕获序列互补的序列。条形码的靶结合区可以包含捕获序列。靶结合区可以例如包含多(dT)区。在一些实施方案中,与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含多(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施方案中,结合试剂寡核苷酸(例如,样品寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂(nuclear target-binding reagent)特异性寡核苷酸)包含长度是约以下、是至少以下或是至多以下的核苷酸序列:6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、110个、120个、128个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、610个、620个、630个、640个、650个、660个、670个、680个、690个、700个、710个、720个、730个、740个、750个、760个、770个、780个、790个、800个、810个、820个、830个、840个、850个、860个、870个、880个、890个、900个、910个、920个、930个、940个、950个、960个、970个、980个、990个、1000个或这些值中任何两个之间的数字或范围。
在一些实施方案中,细胞组分结合试剂(例如,细胞内靶结合试剂、细胞表面靶结合试剂或核靶结合试剂)包含抗体、四聚体、适配体、蛋白质主链或其组合。细胞组分结合试剂可以是蛋白结合试剂。结合试剂寡核苷酸可以例如通过接头与细胞组分结合试剂缀合。结合试剂寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂的分子。化学基团可以选自由以下组成的组:UV光可裂解基团、二硫键、链霉抗生物素蛋白、生物素、胺及其任何组合。
细胞组分结合试剂可与ADAM10、CD156c、ANO6、ATP1B2、ATP1B3、BSG、CD147、CD109、CD230、CD29、CD298、ATP1B3、CD44、CD45、CD47、CD51、CD59、CD63、CD97、CD98、SLC3A2、CLDND1、HLA-ABC、ICAM1、ITFG3、MPZL1、NA K ATP酶α1、ATP1A1、NPTN、PMCAATP酶、ATP2B1、SLC1A5、SLC29A1、SLC2A1、SLC44A2,或其任何组合结合。
蛋白质靶可以是以下或可以包含以下:细胞外蛋白质、细胞内蛋白质或其任何组合。在一些实施方案中,抗原或蛋白质靶是或包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整联蛋白或其任何组合。抗原或蛋白质靶可以是或包括脂质、糖类或其任何组合。蛋白质靶可以选自包含许多蛋白质靶的组。抗原靶或蛋白质靶的数目可以是以下、是约以下、是至少以下或是至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、3000种、4000种、5000种、6000种、7000种、8000种、9000种、10000种、或在这些值中的任何两个值之间的数字或范围。
细胞组分结合试剂(例如,蛋白结合试剂)可以与具有相同序列的两种或更多种结合试剂寡核苷酸(例如,样品索引寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)关联。细胞组分结合试剂可以与具有不同序列的两种或更多种结合试剂寡核苷酸关联。在不同的实施方式中,与细胞组分结合试剂关联的结合试剂寡核苷酸的数目可以是不同的。结合试剂寡核苷酸的数量,无论是具有相同的序列还是不同的序列,可以是、或可以是约、是至少或是至多1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种或者这些值中的任何两个之间的数字或范围。
多于一种包含细胞组分结合试剂的组合物(例如,多于一种样品索引组合物)可以包含一种或更多种未与结合试剂寡核苷酸(诸如样品索引寡核苷酸)缀合的另外的细胞组分结合试剂,其在本文也被称为不含结合试剂寡核苷酸的细胞组分结合试剂(诸如不含样品索引寡核苷酸的细胞组分结合试剂)。在不同实施方式中,多于一种组合物中的另外的细胞组分结合试剂的数目可以是不同的。在一些实施方案中,另外的细胞组分结合试剂的数量可以是、是约、是至少或是至多1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种或者是这些值中的任何两个之间的数字或范围。在一些实施方案中,细胞组分结合试剂和另外的细胞组分结合试剂中的任一种可以是相同的。
在一些实施方案中,提供了包含与一种或更多种结合试剂寡核苷酸(例如,样品索引寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)缀合的细胞组分结合试剂和不与结合试剂寡核苷酸缀合的细胞组分结合试剂的混合物。混合物可以用于本文公开的方法的一些实施方案中,例如,以接触一种或更多种样品和/或一种或更多种细胞。在不同的实施方式中,混合物中以下(1)与(2)的比率可以不同:(1)与结合试剂寡核苷酸缀合的细胞组分结合试剂的数目,(2)不与结合试剂寡核苷酸(例如样品索引寡核苷酸)或一种或更多种其他结合试剂寡核苷酸缀合的另一种细胞组分结合试剂(例如相同的细胞组分结合试剂)的数目。在一些实施方案中,比例可以是以下、是约以下、是至少以下或是至多以下:1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000、1:10000或在值的任何两个之间的数字或范围。在一些实施方案中,比例可以是以下、是约以下、是至少以下或是至多以下:1:1、1.1:1、1.2:1、1.3:1、1.4:1、1.5:1、1.6:1、1.7:1、1.8:1、1.9:1、2:1、2.5:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1、2000:1、3000:1、4000:1、5000:1、6000:1、7000:1、8000:1、9000:1、10000:1或任何两个值之间的数字或范围。
细胞组分结合试剂可以与结合试剂寡核苷酸(例如,样品索引寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)缀合,也可以不与结合试剂寡核苷酸缀合。在一些实施方案中,在包含与结合试剂寡核苷酸缀合的细胞组分结合试剂和不与结合试剂寡核苷酸缀合的一种或更多种细胞组分结合试剂的混合物中,与结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合的细胞组分结合试剂的百分比可以是以下或是约以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或在这些值中的任何两个值之间的数字或范围。
在一些实施方案中,在包含与结合试剂寡核苷酸(例如,样品索引寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)缀合的细胞组分结合试剂和未与样品索引寡核苷酸缀合的细胞组分结合试剂的混合物中,未与结合试剂寡核苷酸(例如,样品索引寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)缀合的细胞组分结合试剂的百分比可以是、是约、是至少或是至多0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或这些值中任何两个之间的数字或范围。
细胞组分混合物
细胞组分结合试剂的混合物(例如抗体混合物)可以用于增加本文公开的方法中的标记灵敏度。不受任何特定理论的限制,认为这可能是因为细胞组分表达或蛋白表达可在细胞类型和细胞状态之间变化,使得寻找标记所有细胞类型的通用细胞组分结合试剂或抗体具有挑战性。例如,细胞组分结合试剂的混合物可以用于允许对更多样品类型进行更灵敏和有效的标记。细胞组分结合试剂的混合物可以包括两种或更多种不同类型的细胞组分结合试剂,例如更宽范围的细胞组分结合试剂或抗体。对不同的细胞组分靶进行标记的细胞组分结合试剂可以汇集在一起以产生足以标记所有细胞类型或一种或更多种感兴趣的细胞类型的混合物。
在一些实施方案中,多于一种组合物(例如,样品索引组合物)中的每一种包含细胞组分结合试剂。在一些实施方案中,多于一种组合物中的组合物包含两种或更多种细胞组分结合试剂,其中两种或更多种细胞组分结合试剂中的每一种都与结合试剂寡核苷酸(例如,样品索引寡核苷酸)关联,其中两种或更多种细胞组分结合试剂中的至少一种能够与一种或更多种细胞组分靶中的至少一种特异性结合。与两种或更多种细胞组分结合试剂关联的结合试剂寡核苷酸的序列可以是相同的。与两种或更多种细胞组分结合试剂关联的结合试剂寡核苷酸的序列可以包含不同的序列。多于一种组合物中的每一种可以包含两种或更多种细胞组分结合试剂。
在不同的实施方式中,组合物中不同类型的细胞组分结合试剂(例如,CD147抗体和CD47抗体)的数目可以不同。具有两种或更多种不同类型的细胞组分结合试剂的组合物在本文中可被称为细胞组分结合试剂混合物(例如,样品索引组合物混合物)。混合物中不同类型的细胞组分结合试剂的数目可以不同。在一些实施方案中,混合物中不同类型的细胞组分结合试剂的数量可以是以下、是约以下、是至少以下或是至多以下:2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、10000种、100000种或者这些值中的任何两个之间的数字或范围。不同类型的细胞组分结合试剂可以与具有相同或不同序列(例如,样品索引序列)的结合试剂寡核苷酸缀合。
细胞组分靶的定量分析方法
本文描述的公开内容包括用于使用寡核苷酸探针对样品中的多于一种细胞组分靶(例如,蛋白质靶)进行定量分析的方法,寡核苷酸探针可以将条形码序列(例如,分子标记序列)与细胞组分结合试剂(例如,蛋白结合试剂)的寡核苷酸关联。细胞组分结合试剂可以包括细胞内靶结合试剂、细胞表面靶结合试剂和/或核靶结合试剂。细胞组分结合试剂的寡核苷酸可以是以下或包括以下:抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、相互作用确定寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸和/或核靶结合试剂特异性寡核苷酸。在一些实施方案中,样品可以是单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。样品可以包括细胞类型(诸如正常细胞、肿瘤细胞、血细胞、B细胞、T细胞、母体细胞、胎儿细胞)的混合物,或来自不同受试者的细胞的混合物。在一些实施方案中,样品可以包括被分到个体隔室诸如微孔阵列中的微孔的多于一个单细胞。
多于一种细胞组分结合试剂的结合靶(即,细胞组分靶)可以是以下,或可以包括以下:糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整联蛋白、细胞内蛋白或其任何组合。在一些实施方案中,细胞组分靶是蛋白质靶。在一些实施方案中,多于一种细胞组分靶包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括细胞内细胞组分。在一些实施方案中,多于一个细胞组分可以是、是约、是至少或是至多生物体中所有编码的细胞组分的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%、100%或这些值中任何两个之间的数字或范围。在一些实施方案中,多于一种细胞组分靶可以包括至少以下:2种、3种、4种、5种、10种、20种、30种、40种、50种、100种、1000种、10000种不同的细胞组分靶。
在一些实施方案中,多于一种细胞组分结合试剂与样品接触,用于与多于一种细胞组分靶特异性结合。未结合的细胞组分结合试剂可以通过例如洗涤来去除。在样品包含细胞的实施方案中,可以去除不与细胞特异性结合的任何细胞组分结合试剂。
在一些情况下,来自细胞群体的细胞可以被分离(例如,隔离)到本公开内容的基底的孔中。细胞群体可以在分离之前被稀释。可以稀释细胞群体,使得基底的孔的至少或至多1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%容纳单细胞。可以稀释细胞群体,使得稀释的群体的细胞数目是、是至少或是至多基底上的孔的数目的以下:1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些情况下,稀释细胞群体,使得细胞的数目为基底中的孔的数目的约10%。
单细胞在基底的孔中的分布可以遵循泊松分布。例如,基底的孔具有多于一个细胞的概率可以是至少或至多0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更大。单细胞在基底的孔中的分布可以是随机的。单细胞在基底的孔中的分布可以是非随机的。细胞可以被分离,使得基底的一个孔仅容纳一个细胞。在一些实施方案中,细胞组分结合试剂可以与荧光分子缀合,以实现将细胞流式分选到个体隔室中。
在一些实施方案中,本文公开的方法提供了使多于一种组合物与样品接触,以与多于一种细胞组分靶特异性结合。应当理解,所使用的条件可以允许细胞组分结合试剂例如抗体与细胞组分靶的特异性结合。在接触步骤之后,可以去除未结合的组合物。例如,在样品包含细胞并且组合物与是细胞表面细胞组分的细胞组分靶诸如细胞表面蛋白特异性结合的实施方案中,未结合的组合物可以通过用缓冲液洗涤细胞来去除,使得只有与细胞组分靶特异性结合的组合物与细胞一起保留。
在一些实施方案中,本文公开的方法可以包括使包含条形码序列(例如分子标记)、细胞标记、样品标记或其任何组合的寡核苷酸(例如条形码或随机条形码)与以下关联:与细胞组分结合试剂关联的多于一种寡核苷酸。例如,包含条形码的多于一种寡核苷酸探针可以用于与组合物的多于一种寡核苷酸杂交。
多于一种寡核苷酸探针可以被固定在固体支持物上。固体支持物可以是自由漂浮的,例如溶液中的珠。固体支持物可嵌入半固体或固体阵列中。在一些实施方案中,多于一种寡核苷酸探针可以不被固定在固体支持物上。当多于一种寡核苷酸探针非常接近细胞组分结合试剂的多于一种寡核苷酸时,细胞组分结合试剂的多于一种寡核苷酸可以与寡核苷酸探针杂交。寡核苷酸探针可以以不可耗尽的比率接触,使得细胞组分结合试剂的每种不同的寡核苷酸可以与具有本公开内容的不同条形码序列(例如,分子标记)的寡核苷酸探针关联。
本文公开的方法可以包括从特异性结合到细胞组分靶的细胞组分结合试剂脱离寡核苷酸。脱离可以以各种方式进行以使化学基团与细胞组分结合试剂分离,诸如UV光裂解、化学处理(例如二硫苏糖醇处理)、加热、酶处理或其任何组合。使寡核苷酸从细胞组分结合试剂脱离可以在使多于一种寡核苷酸探针与组合物的多于一种寡核苷酸杂交的步骤之前、之后或期间进行。
细胞组分和核酸靶的同时定量分析方法
本文公开的方法可用于使用本文公开的组合物和寡核苷酸探针对样品中的多于一种细胞组分靶(例如,蛋白质靶、细胞表面靶、细胞内靶、核靶)和多于一种核酸靶分子进行同时定量分析,寡核苷酸探针可以使条形码序列(例如,分子标记序列)与细胞组分结合试剂的寡核苷酸和核酸靶分子二者关联。US2018/0088112和US2018/0346970中描述了对多于一种细胞组分靶和多于一种核酸靶分子进行同时定量分析的其他方法;这些申请的每一项的内容通过引用以其整体并入本文。在一些实施方案中,样品可以是单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。在一些实施方案中,样品可以包括细胞类型(诸如正常细胞、肿瘤细胞、血细胞、B细胞、T细胞、母体细胞、胎儿细胞)的混合物或来自不同受试者的细胞的混合物。在一些实施方案中,样品可以包括被分到个体隔室诸如微孔阵列中的微孔的多于一个单细胞。
多于一种细胞组分靶可以包括细胞表面靶、细胞内靶、核靶、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括细胞内细胞组分。在一些实施方案中,多于一种细胞组分靶可以是、是约、是至少或是至多生物体或生物体的一个或更多个细胞中的所有细胞组分靶(诸如,表达的蛋白)的以下:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或在这些值中的任何两个之间的数字或范围。在一些实施方案中,多于一种细胞组分靶可以包括、包括约、包括至少或包括至多2种、3种、4种、5种、10种、20种、30种、40种、50种、100种、1000种、10000种或在这些值中的任何两个之间的数字或范围的不同的细胞组分靶。
在一些实施方案中,多于一种细胞组分结合试剂与样品接触,用于与多于一种细胞组分靶特异性结合。未结合的细胞组分结合试剂可以通过例如洗涤来去除。在样品包含细胞的实施方案中,可以去除不与细胞特异性结合的任何细胞组分结合试剂。
在一些情况下,来自细胞群体的细胞可以被分离(例如,隔离)到本公开内容的基底的孔中。细胞群体可以在分离之前被稀释。可以稀释细胞群体,使得基底的孔的至少或至多1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%容纳单细胞。可以稀释细胞群体,使得稀释的群体中的细胞的数目是以下或是至多以下:基底上的孔的数目的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些情况下,稀释细胞群体,使得细胞的数目为基底中的孔的数目的约10%。
单细胞在基底的孔中的分布可以遵循泊松分布。例如,基底的孔具有多于一个细胞的概率可以是至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更大。单细胞在基底的孔中的分布可以是随机的。单细胞在基底的孔中的分布可以是非随机的。细胞可以被分离,使得基底的一个孔仅容纳一个细胞。
在一些实施方案中,本文公开的方法提供了使多于一种组合物与样品接触,以与多于一种细胞组分靶特异性结合。应当理解,所使用的条件可以允许细胞组分结合试剂例如抗体与细胞组分靶的特异性结合。在接触步骤之后,可以去除未结合的组合物。例如,在样品包含细胞并且组合物特异性结合的细胞组分靶在细胞表面上(诸如细胞表面蛋白)的实施方案中,未结合的组合物可以通过用缓冲液洗涤细胞来去除,使得仅与细胞组分靶特异性结合的组合物与细胞一起保留。
在一些实施方案中,本文公开的方法可以提供从样品(例如,细胞)中释放多于一种核酸靶分子。例如,可以裂解细胞以释放多于一种核酸靶分子。细胞裂解可以通过各种方式中的任何一种来完成,例如,通过化学处理、透化冲击、热处理、机械处理、光学处理或其任何组合。可以通过添加包含去污剂(例如,SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)、有机溶剂(例如,甲醇或丙酮)或消化酶(例如,蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。
多于一种核酸分子可包含多种核酸分子。在一些实施方案中,多于一种核酸分子可以包括DNA分子、RNA分子、基因组DNA分子、mRNA分子、rRNA分子、siRNA分子或其组合,并且可以是双链或单链的。在一些实施方案中,多于一种核酸分子包含、包含约、包含至少或包含至多100种、1000种、10000种、20000种、30000种、40000种、50000种、100000种、1000000种或在这些值中的任何两个之间的数字或范围的物质。多于一种核酸分子可以是样品或来自样品,诸如单细胞或多于一个细胞。在一些实施方案中,多于一种核酸分子可以从多于一个样品汇集,诸如从多于一个单细胞汇集。
本文公开的方法可以包括使条形码(例如随机条形码)与多于一种核酸靶分子和细胞组分结合试剂的多于一种寡核苷酸关联,条形码(例如随机条形码)可以包含条形码序列(诸如分子标记)、细胞标记、样品标记或其任何组合。例如,包含随机条形码的多于一种寡核苷酸探针可以用于与多于一种核酸靶分子和组合物中的多于一种寡核苷酸杂交。
多于一种寡核苷酸探针可以被固定在固体支持物上。固体支持物可以是自由漂浮的,例如溶液中的珠。固体支持物可嵌入半固体或固体阵列中。在一些实施方案中,多于一种寡核苷酸探针可以不被固定在固体支持物上。当多于一种寡核苷酸探针与多于一种核酸靶分子和细胞组分结合试剂的多于一种寡核苷酸紧密接近时,多于一种核酸靶分子和细胞组分结合试剂的多于一种寡核苷酸可以与寡核苷酸探针杂交。寡核苷酸探针可以以不可耗尽的比率接触,使得每种不同的核酸靶分子和细胞组分结合试剂的寡核苷酸可以与具有本公开内容的不同条形码序列(例如,分子标记)的寡核苷酸探针关联。
在一些实施方案中,本文公开的方法提供了使寡核苷酸从与细胞组分靶特异性结合的细胞组分结合试剂脱离。脱离可以以各种方式进行以使化学基团与细胞组分结合试剂分离,诸如UV光裂解、化学处理(例如二硫苏糖醇处理)、加热、酶处理或其任何组合。将寡核苷酸从细胞组分结合试剂脱离可以在将多于一个寡核苷酸探针与多于一个核酸靶分子和组合物中的多于一个寡核苷酸杂交的步骤之前、之后或期间进行。
蛋白和核酸靶的同时定量分析
本文公开的方法也可以用于多于一种类型靶分子例如蛋白和核酸靶的同时定量分析。例如,靶分子可以是或包括细胞组分。图6示出了在单细胞中同时定量分析核酸靶和其他细胞组分靶(例如,蛋白)二者的示例性方法的示意图。在一些实施方案中,提供了各自包含细胞组分结合试剂诸如抗体的多于一种组合物605a、605b、605c等。与不同细胞组分靶结合的不同细胞组分结合试剂诸如抗体,与不同的独特标识符缀合。接下来,细胞组分结合试剂可以与包含多于一个细胞610的样品一起孵育。不同的细胞组分结合试剂可以与细胞表面上的细胞组分诸如细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合特异性结合。未结合的细胞组分结合试剂可以例如通过用缓冲液洗涤细胞来去除。然后,具有细胞组分结合试剂的细胞可以被分离到多于一个隔室诸如微孔阵列中,其中单个隔室615的尺寸适合于单细胞和单个珠620。每个珠可以包含多于一种寡核苷酸探针和条形码序列(例如分子标记序列),寡核苷酸探针可以包含珠上所有寡核苷酸探针共有的细胞标记。在一些实施方案中,每种寡核苷酸探针可以包含靶结合区,例如多(dT)序列。与细胞组分结合试剂缀合的寡核苷酸625可以使用化学、光学或其他手段从细胞组分结合试剂脱离。细胞可以被裂解635以释放细胞内的核酸,诸如基因组DNA或细胞mRNA630。细胞mRNA 630、寡核苷酸625或二者可以被珠620上的寡核苷酸探针捕获,例如,通过与多(dT)序列杂交来捕获。逆转录酶可以用于使用细胞mRNA630和寡核苷酸625作为模板使与细胞mRNA 630和寡核苷酸625杂交的寡核苷酸探针延伸。可以对逆转录酶产生的延伸产物进行扩增和测序。可以对测序读段进行序列的去多重化(demultiplexing)或者细胞标记、条形码(例如分子标记)、基因、细胞组分结合试剂特异性寡核苷酸(例如抗体特异性寡核苷酸)的鉴定,这可以产生样品中每个单细胞的细胞组分和基因表达的数字表示。
条形码的关联
与细胞组分结合试剂(例如,抗原结合试剂或蛋白结合试剂)和/或核酸分子关联的寡核苷酸可以与寡核苷酸探针(例如,条形码,诸如随机条形码)随机关联。与细胞组分结合试剂关联的寡核苷酸,在本文中称为结合试剂寡核苷酸,可以是本公开内容的寡核苷酸或包括本公开内容的寡核苷酸,诸如抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、以及相互作用确定寡核苷酸。关联可以例如包括使寡核苷酸探针的靶结合区与靶核酸分子和/或蛋白结合试剂的寡核苷酸的互补部分杂交。例如,条形码(例如随机条形码)的寡(dT)区域可以与靶核酸分子的多(A)尾和/或蛋白结合试剂的寡核苷酸的多(A)尾相互作用。可以选择用于杂交的测定条件(例如,缓冲液pH、离子强度、温度等)以促进形成特定的稳定的杂合体。
本公开内容提供了使用逆转录使分子标记与靶核酸和/或与细胞组分结合试剂关联的寡核苷酸关联的方法。逆转录酶可以使用RNA和DNA二者作为模板。例如,细胞组分结合试剂上最初缀合的寡核苷酸可以是RNA碱基或DNA碱基或二者。除了结合试剂序列的序列或其一部分之外,结合试剂寡核苷酸可以被拷贝并连接(例如,共价地连接)至细胞标记和条形码序列(例如,分子标记)。作为另一个实例,除了mRNA分子或其一部分的序列之外,mRNA分子可以被复制并连接(例如共价地连接)到细胞标记和条形码序列(例如分子标记)。
在一些实施方案中,分子标记可以通过连接寡核苷酸探针靶结合区和靶核酸分子的一部分和/或与细胞组分结合试剂关联(例如,当前或以前关联)的寡核苷酸的一部分来添加。例如,靶结合区可以包含能够与限制性位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。该方法还可以包括用限制性酶(例如,EcoRI)处理靶核酸和/或与细胞组分结合试剂关联的寡核苷酸以产生限制性位点突出端。连接酶(例如,T4 DNA连接酶)可以用于连接两个片段。
确定独特分子标记序列的数目或存在
本文公开的方法可以包括确定用于每种独特标识符、每种核酸靶分子和/或每种结合试剂寡核苷酸(例如抗体寡核苷酸)的独特分子标记序列的数目或存在。例如,测序读段可以用于确定用于每种独特标识符、每种核酸靶分子和/或每种结合试剂寡核苷酸的独特分子标记序列的数目。作为另一种实例,测序读段可用于确定分子标记序列(例如,在测序读段中与靶关联的分子标记序列、结合试剂寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸和/或核靶结合试剂特异性寡核苷酸、抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸和相互作用确定寡核苷酸等)的存在或不存在。
在一些实施方案中,用于每种独特标识符、每种核酸靶分子和/或每种结合试剂寡核苷酸的独特分子标记序列的数目指示样品中每种细胞组分靶(例如,抗原靶、蛋白质靶、细胞表面靶、细胞内靶、核靶)和/或每种核酸靶分子的量。在一些实施方案中,细胞组分靶的量和其相应核酸靶分子例如mRNA分子的量可以相互比较。在一些实施方案中,可以计算细胞组分靶的量与其相应核酸靶分子例如mRNA分子的量的比率。细胞组分靶可以是,例如,细胞表面蛋白标志物。在一些实施方案中,细胞表面蛋白标志物的蛋白水平和细胞表面蛋白标志物的mRNA水平之间的比率低。
本文公开的方法可以用于各种应用。例如,本文公开的方法可以用于样品的蛋白质组和/或转录组分析。在一些实施方案中,本文公开的方法可以用于鉴定样品中的细胞组分靶和/或核酸靶,即生物标志物。在一些实施方案中,细胞组分靶和核酸靶相互对应,即核酸靶编码细胞组分靶。在一些实施方案中,本文公开的方法可以用于鉴定具有样品中的细胞组分靶的量与其相应核酸靶分子例如mRNA分子的量之间的期望比率的细胞组分靶。在一些实施方案中,比率是以下或是约以下:0.001、0.01、0.1、1、10、100、1000或在这些值中的任何两个之间的数字或范围。在一些实施方案中,比率是至少以下或是至多以下:0.001、0.01、0.1、1、10、100或1000。在一些实施方案中,本文公开的方法可以用于鉴定样品中的细胞组分靶,样品中所述细胞组分靶对应的核酸靶分子的量是以下或是约以下:1000种、100种、10种、5种、2种、1种、0种或在这些值中的任何两个之间的数字或范围。在一些实施方案中,本文公开的方法可以用于鉴定样品中这样的细胞组分靶,样品中该细胞组分靶对应的核酸靶分子的量多于以下或小于以下:1000种、100种、10种、5种、2种、1种或0种。
组合物和试剂盒
本文公开的一些实施方案提供了用于对样品中多于一种细胞组分(例如,蛋白、细胞表面靶、细胞内靶、核靶)和/或多于一种核酸靶分子进行同时定量分析的试剂盒和组合物。在一些实施方案中,试剂盒和组合物可以包含:各自与寡核苷酸缀合的多于一种细胞组分结合试剂(例如,多于一种蛋白结合试剂),其中寡核苷酸包含用于细胞组分结合试剂的独特标识符;和多于一种寡核苷酸探针,其中多于一种寡核苷酸探针中的每一种包含靶结合区、条形码序列(例如,分子标记序列),其中条形码序列来自一组相异的独特条形码序列。在一些实施方案中,每种寡核苷酸可以包含分子标记、细胞标记、样品标记或其任何组合。在一些实施方案中,每种寡核苷酸可以包含接头。在一些实施方案中,每种寡核苷酸可以包含用于寡核苷酸探针的结合位点,诸如多(A)尾。例如,多(A)尾可以是例如oligodA18(未锚定至固体支持物)或oligoA18V(锚定至固体支持物)。寡核苷酸可以包含DNA残基、RNA残基或二者。
本文公开的内容包括多于一种样品索引组合物。多于一种样品索引组合物中的每一种可以包含两种或更多种细胞组分结合试剂。两种或更多种细胞组分结合试剂中的每一种可以与样品索引寡核苷酸关联。两种或更多种细胞组分结合试剂中的至少一种可以能够与至少一种细胞组分靶特异性结合。样品索引寡核苷酸可以包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列。多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列可以包括不同的序列。
本文的公开内容包括用于样品索引的方法和试剂盒。在一些实施方案中,两种样品索引组合物中的每一种包含与样品索引寡核苷酸关联的细胞组分结合试剂(例如,蛋白结合试剂),其中细胞组分结合试剂能够与一种或更多种细胞组分靶(例如,一种或更多种蛋白质靶)中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两种样品索引组合物的样品索引序列包含不同的序列。在一些实施方案中,样品索引寡核苷酸包含分子标记序列、用于通用引物的结合位点或其组合。
独特标识符(或与细胞组分结合试剂关联的寡核苷酸,诸如结合试剂寡核苷酸、细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸、抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸或相互作用确定寡核苷酸)可以具有任何合适的长度,例如约25个核苷酸至约45个核苷酸长。在一些实施方案中,独特标识符可以具有是以下、是约以下、小于以下、大于以下的长度:4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、70个、80个、90个、100个、200个核苷酸或以上值中的任何两个之间的范围。
在一些实施方案中,独特标识符选自一组相异的独特标识符。一组相异的独特标识符可以包括、包括约、包括至少或包括至多20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种或在这些值中的任何两个之间的数字或范围的不同的独特标识符。在一些实施方案中,一组独特标识符被设计成与待分析样品的DNA或RNA序列具有最小的序列同源性。在一些实施方案中,一组独特标识符的序列彼此或与其互补物相差以下或相差约以下:1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸,或在这些值中的任何两个之间的数字或范围。在一些实施方案中,一组独特标识符的序列彼此或与其互补物相差至少以下,或相差至多以下:1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸或10个核苷酸。
在一些实施方案中,独特标识符可以包括用于引物(诸如通用引物)的结合位点。在一些实施方案中,独特标识符可以包括用于引物(诸如通用引物)的至少两个结合位点。在一些实施方案中,独特标识符可以包括用于引物(诸如通用引物)的至少三个结合位点。引物可以用于扩增独特标识符,例如,通过PCR扩增。在一些实施方案中,引物可以用于巢式PCR反应。
本公开内容中设想了任何合适的细胞组分结合试剂,诸如任何蛋白结合试剂(例如抗体或其片段、适配体、小分子、配体、肽、寡核苷酸等或其任何组合)。在一些实施方案中,细胞组分结合试剂可以是多克隆抗体、单克隆抗体、重组抗体、单链抗体(scAb)或其片段,诸如Fab和Fv。在一些实施方案中,多于一种蛋白结合试剂可以包括、包括约、包括至少或包括至多20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种或在这些值中的任何两个之间的数字或范围的不同蛋白结合试剂。
在一些实施方案中,寡核苷酸通过接头与细胞组分结合试剂缀合。在一些实施方案中,寡核苷酸可以与蛋白结合试剂共价缀合。在一些实施方案中,寡核苷酸可以与蛋白结合试剂非共价缀合。在一些实施方案中,接头可以包含将寡核苷酸与蛋白结合试剂可逆地或不可逆地附接的化学基团。化学基团可以例如通过胺基团与接头缀合。在一些实施方案中,接头可以包含与另一个缀合至蛋白结合试剂的化学基团形成稳定键的化学基团。例如,化学基团可以是UV光可裂解基团、二硫键、链霉亲和素、生物素、胺等。在一些实施方案中,化学基团可以通过氨基酸诸如赖氨酸上的伯胺或N-末端与蛋白结合试剂缀合。寡核苷酸可以与蛋白结合试剂的任何合适的位点缀合,只要它不干扰蛋白结合试剂与其蛋白质靶之间的特异性结合。在蛋白结合试剂是抗体的实施方案中,寡核苷酸可以与抗体在除了抗原结合位点之外的任何地方(例如Fc区、CH1结构域、CH2结构域、CH3结构域、CL结构域等)缀合。在一些实施方案中,每种蛋白结合试剂可以与单个寡核苷酸分子缀合。在一些实施方案中,每种蛋白结合试剂可以与以下或与约以下的寡核苷酸分子缀合:2个、3个、4个、5个、10个、20个、30个、40个、50个、100个、1000个或在这些值中的任何两个之间的数字或范围,其中每个寡核苷酸分子包含相同的独特标识符。在一些实施方案中,每种蛋白结合试剂可以与多于一个寡核苷酸分子缀合,例如,至少或至多2个、3个、4个、5个、10个、20个、30个、40个、50个、100个或1000个寡核苷酸分子,其中每个寡核苷酸分子包含相同的独特标识符。
在一些实施方案中,多于一种细胞组分结合试剂(例如,蛋白结合试剂)能够与样品中的多于一种细胞组分靶(例如,蛋白质靶)特异性结合。样品可以是、包括、可以从以下获得或可以衍生自以下:单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。在一些实施方案中,多于一种细胞组分靶包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括细胞内蛋白。在一些实施方案中,多于一种细胞组分靶可以包括细胞内蛋白。在一些实施方案中,多于一种细胞组分靶可以是、是约、是至少或是至多生物体中所有细胞组分靶(例如,表达或可能表达的蛋白)的以下:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或在这些值中的任何两个之间的数字或范围。在一些实施方案中,多于一种细胞组分靶可以包括、包括约、包括至少或包括至多以下的不同的细胞组分靶:2种、3种、4种、5种、10种、20种、30种、40种、50种、100种、1000种、10000种或在这些值中的任何两个之间的数字或范围。
使用寡核苷酸缀合的细胞组分结合试剂的样品索引
本文公开的内容包括用于样品鉴定的方法。在一些实施方案中,该方法包括:使来自多于一个样品中的每一个的一个或更多个细胞与多于一种样品索引组合物中的样品索引组合物接触,其中一个或更多个细胞中的每一个包含一种或更多种细胞组分靶,其中多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;去除多于一种样品索引组合物中未结合的样品索引组合物;使用多于一种条形码(例如,随机条形码)使样品索引寡核苷酸条形码化(例如,随机条形码化)以产生多于一种条形码化样品索引寡核苷酸;获得多于一种条形码化样品索引寡核苷酸的测序数据;以及基于多于一种条形码化样品索引寡核苷酸中的至少一种条形码化样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中的至少一个细胞的样品来源。
在一些实施方案中,使用多于一种条形码对样品索引寡核苷酸进行条形码化包括:使多于一种条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;以及使与样品索引寡核苷酸杂交的条形码延伸以产生多于一种条形码化样品索引寡核苷酸。使条形码延伸可以包括使用DNA聚合酶使条形码延伸以产生多于一种条形码化样品索引寡核苷酸。使条形码延伸可以包括使用逆转录酶使条形码延伸以产生多于一种条形码化样品索引寡核苷酸。
与抗体缀合的寡核苷酸、用于与抗体缀合的寡核苷酸或先前与抗体缀合的寡核苷酸在本文中被称为抗体寡核苷酸(“AbOligo”)。在样品索引的上下文中,抗体寡核苷酸在本文中被称为样品索引寡核苷酸。与抗体寡核苷酸缀合的抗体在本文中被称为热抗体(hotantibody)或寡核苷酸抗体。不与抗体寡核苷酸缀合的抗体在本文中被称为冷抗体(coldantibody)或无寡核苷酸抗体。与结合试剂(例如,蛋白结合试剂)缀合的寡核苷酸、用于与结合试剂缀合的寡核苷酸或先前与结合试剂缀合的寡核苷酸在本文被称为试剂寡核苷酸。在样品索引的上下文中,试剂寡核苷酸在本文中被称为样品索引寡核苷酸。与抗体寡核苷酸缀合的结合试剂在本文中被称为热结合试剂或寡核苷酸结合试剂。不与抗体寡核苷酸缀合的结合试剂在本文中称为冷结合试剂或无寡核苷酸结合试剂。
图7示出了使用寡核苷酸关联的细胞组分结合试剂进行样品索引的示例性工作流程的示意图。在一些实施方案中,提供了各自包含结合试剂的多于一种组合物705a、705b等。结合试剂可以是蛋白结合试剂,诸如抗体。细胞组分结合试剂可以包括抗体、四聚体、适配体、蛋白支架或其组合。多于一种组合物705a、705b的结合试剂可以与相同的细胞组分靶结合。例如,多于一种组合物705a、705b的结合试剂可以是相同的(除了与结合试剂关联的样品索引寡核苷酸之外)。
不同的组合物可以包括与具有不同样品索引序列的样品索引寡核苷酸缀合的结合试剂。在不同实施方式中,不同的组合物的数目可以是不同的。在一些实施方案中,不同的组合物的数量可以是、是约、是至少或是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000或在这些值的任何两个之间的数字或范围。
在一些实施方案中,一种组合物中结合试剂的样品索引寡核苷酸可以包含相同的样品索引序列。一种组合物中结合试剂的样品索引寡核苷酸可以不相同。在一些实施方案中,一种组合物中具有相同样品索引序列的结合试剂的样品索引寡核苷酸的百分比可以是以下、是约以下、是至少以下或是至多以下:50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或在这些值中的任何两个之间的数字或范围。
组合物705a和705b可以用于标记不同样品中的样品。例如,组合物705a中细胞组分结合试剂的样品索引寡核苷酸可以具有一种样品索引序列,并且可以用于对样品707a(诸如患者的样品)中的细胞710a(以黑色圆圈示出)进行标记。组合物705b中细胞组分结合试剂的样品索引寡核苷酸可以具有另一种样品索引序列,并且可以用于对样品707b(诸如另一患者的样品或同一患者的另一样品)中的细胞710b(以带阴影的圆圈示出)进行标记。细胞组分结合试剂可以与细胞表面上的细胞组分靶或蛋白诸如细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合特异性结合。未结合的细胞组分结合试剂可以例如通过用缓冲液洗涤细胞来去除。
然后,具有细胞组分结合试剂的细胞可以被分离到多于一个隔室诸如微孔阵列中,其中单个隔室715a、715b的尺寸适合于单细胞710a和单个珠720a或者单细胞710b和单个珠720b。每个珠720a、720b可以包含多于一种寡核苷酸探针和分子标记序列,所述多于一种寡核苷酸探针可以包含珠上所有寡核苷酸探针共有的细胞标记。在一些实施方案中,每种寡核苷酸探针可以包含靶结合区,例如多(dT)序列。与组合物705a的细胞组分结合试剂缀合的样品索引寡核苷酸725a可以被配置为(或可以)能够从细胞组分结合试剂脱离或不能够从细胞组分结合试剂脱离。与组合物705a的细胞组分结合试剂缀合的样品索引寡核苷酸725a可以使用化学、光学或其他手段从细胞组分结合试剂脱离。与组合物705b的细胞组分结合试剂缀合的样品索引寡核苷酸725b可以被配置为(或可以为)能够从细胞组分结合试剂脱离或不能够从细胞组分结合试剂脱离。与组合物705b的细胞组分结合试剂缀合的样品索引寡核苷酸725b可以使用化学、光学或其他手段从细胞组分结合试剂脱离。
细胞710a可以被裂解以释放细胞710a内的核酸,诸如基因组DNA或细胞mRNA730a。裂解的细胞735a以虚线的圆圈示出。细胞mRNA 730a、样品索引寡核苷酸725a或二者可以被珠720a上的寡核苷酸探针捕获,例如,通过与多(dT)序列杂交来捕获。逆转录酶可以用于使用细胞mRNA 730a和寡核苷酸725a作为模板使与细胞mRNA 730a和寡核苷酸725a杂交的寡核苷酸探针延伸。可以对逆转录酶产生的延伸产物进行扩增和测序。
类似地,细胞710b可以被裂解以释放细胞710b内的核酸,诸如基因组DNA或细胞mRNA 730b。裂解的细胞735b以虚线的圆圈示出。细胞mRNA 730b、样品索引寡核苷酸725b或二者可以被珠720b上的寡核苷酸探针捕获,例如,通过与多(dT)序列杂交来捕获。逆转录酶可以用于使用细胞mRNA 730b和寡核苷酸725b作为模板使与细胞mRNA 730b和寡核苷酸725b杂交的寡核苷酸探针延伸。可以对逆转录酶产生的延伸产物进行扩增和测序。
可以对测序读段进行细胞标记、分子标记、基因身份和样品身份的去多重化(例如,根据样品索引寡核苷酸725a和725b的样品索引序列)。细胞标记、分子标记和基因身份的去多重化可以产生样品中每个单细胞的基因表达的数字表示。使用样品索引寡核苷酸的样品索引序列对细胞标记、分子标记和样品身份进行去多重化可以用于确定样品来源。
针对细胞表面上的细胞组分的细胞组分结合试剂可以与独特样品索引寡核苷酸的文库缀合,以允许细胞保持样品身份。例如,针对细胞表面标志物的抗体可以与独特样品索引寡核苷酸的文库缀合,以允许细胞保持样品身份。这将使多个样品能够装载到同一个RhapsodyTM盒(cartridge)中,因为在整个文库制备和测序过程中,与样品来源相关的信息被保留。样品索引可以允许在单个实验中一起运行多个样品,从而简化和缩短实验时间,并消除批次效应(batch effect)。
本文公开的内容包括用于样品鉴定的方法。在一些实施方案中,该方法包括:使来自多于一个样品中的每一个的一个或更多个细胞与多于一种样品索引组合物中的样品索引组合物接触,其中一个或更多个细胞中的每一个包含一种或更多种细胞组分靶,其中多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;去除多于一种样品索引组合物中未结合的样品索引组合物。该方法可以包括使用多于一种条形码(例如,随机条形码)对样品索引寡核苷酸进行条形码化(例如,随机条形码化)以产生多于一种条形码化样品索引寡核苷酸;获得多于一种条形码化样品索引寡核苷酸的测序数据;以及基于多于一种条形码化样品索引寡核苷酸中的至少一种条形码化样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中至少一个细胞的样品来源。
在一些实施方案中,用于样品鉴定的方法包括:使来自多于一个样品中的每一个的一个或更多个细胞与多于一种样品索引组合物中的样品索引组合物接触,其中一个或更多个细胞中的每一个包含一种或更多种细胞组分靶,其中多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;去除多于一种样品索引组合物中未结合的样品索引组合物;以及基于多于一种样品索引组合物的至少一种样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中至少一个细胞的样品来源。
在一些实施方案中,鉴定至少一个细胞的样品来源包括:使用多于一种条形码(例如随机条形码)对多于一种样品索引组合物的样品索引寡核苷酸进行条形码化(例如随机条形码化)以产生多于一种条形码化样品索引寡核苷酸;获得多于一种条形码化样品索引寡核苷酸的测序数据;以及基于多于一种条形码化样品索引寡核苷酸中的至少一种条形码化样品索引寡核苷酸的样品索引序列来鉴定细胞的样品来源。在一些实施方案中,使用多于一种条形码对样品索引寡核苷酸进行条形码化以产生多于一种条形码化样品索引寡核苷酸包括使用多于一种随机条形码对样品索引寡核苷酸进行随机条形码化以产生多于一种随机条形码化样品索引寡核苷酸。
在一些实施方案中,鉴定至少一个细胞的样品来源可以包括鉴定多于一种样品索引组合物的至少一种样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定样品索引序列的存在或不存在可以包括:复制至少一种样品索引寡核苷酸以产生多于一种复制的样品索引寡核苷酸;获得多于一种复制的样品索引寡核苷酸的测序数据;以及基于多于一种样品索引寡核苷酸中的复制的样品索引寡核苷酸的样品索引序列来鉴定细胞的样品来源,所述多于一种样品索引寡核苷酸对应于测序数据中的至少一种条形码化样品索引寡核苷酸。
在一些实施方案中,复制至少一种样品索引寡核苷酸以产生多于一种复制的样品索引寡核苷酸包括:在复制至少一种条形码化样品索引寡核苷酸之前,将复制衔接子连接到至少一种条形码化样品索引寡核苷酸。复制至少一种条形码化样品索引寡核苷酸可以包括使用连接到至少一种条形码化样品索引寡核苷酸的复制衔接子复制至少一种条形码化样品索引寡核苷酸以产生多于一种复制的样品索引寡核苷酸。
在一些实施方案中,复制至少一种样品索引寡核苷酸以产生多于一种复制的样品索引寡核苷酸包括:在复制至少一种条形码化样品索引寡核苷酸之前,使捕获探针与至少一种样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的捕获探针;以及使与样品索引寡核苷酸杂交的捕获探针延伸以产生与捕获探针关联的样品索引寡核苷酸。复制至少一种样品索引寡核苷酸可以包括复制与捕获探针关联的样品索引寡核苷酸以产生多于一种复制的样品索引寡核苷酸。
本文的公开内容还包括用于样品鉴定的方法,其允许例如鉴定细胞过载和多重态。该方法可以包括:使第一多于一个细胞和第二多于一个细胞分别与两种样品索引组合物接触,其中第一多于一个细胞中的每一个和第二多于一个细胞中的每一个包含一种或更多种细胞组分,其中两种样品索引组合物中的每一种包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两种样品索引组合物的样品索引序列包含不同的序列;使用多于一种条形码对样品索引寡核苷酸进行条形码化以产生多于一种条形码化样品索引寡核苷酸,其中多于一种条形码中的每一种包含细胞标记序列、条形码序列(例如,分子标记序列)和靶结合区,其中多于一种条形码中的至少两种条形码的条形码序列包括不同的序列,并且其中多于一种条形码中的至少两种条形码包含相同的细胞标记序列;获得多于一种条形码化样品索引寡核苷酸的测序数据;以及鉴定各自与获得的测序数据中的两种或更多种样品索引序列关联的一种或更多种细胞标记序列;以及从获得的测序数据去除与各自与两种或更多种样品索引序列关联的一种或更多种细胞标记序列关联的测序数据;和/或将与各自与两种或更多种样品索引序列关联的一种或更多种细胞标记序列关联的测序数据从随后的分析(例如,单细胞mRNA谱分析或全转录组分析)排除。在一些实施方案中,样品索引寡核苷酸包含条形码序列(例如,分子标记序列)、用于通用引物的结合位点或其组合。样品鉴定的方法可用于所述方法。
例如,该方法可以用于使用样品索引装载50000个或更多个细胞(相比于10000-20000个细胞)。样品索引可以使用寡核苷酸缀合的细胞组分结合试剂(例如抗体)或针对细胞组分(例如通用蛋白标志物)的细胞组分结合试剂,以用独特样品索引对来自不同样品的细胞进行标记。当来自不同样品的两个或更个细胞、来自样品的不同细胞群体的两个或更个细胞,或样品的两个或更个细胞,被捕获在同一微孔或液滴中时,组合的“细胞”(或两个或更个细胞的内容物)可以与具有不同样品索引序列的样品索引寡核苷酸(或具有不同细胞鉴定序列的细胞鉴定寡核苷酸)关联。在不同实施方式中,细胞的不同群体的数目可以是不同的。在一些实施方案中,不同群体的数量可以是、是约、是至少或是至多2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种或者这些值中的任何两个之间的数字或范围。在不同实施方式中,每个群体中细胞的数目或平均数目可以是不同的。在一些实施方案中,每个群体中细胞的数量或平均数量可以是、是约、至少或是至多1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或者这些值中的任何两个之间的数字或范围。当每个群体中细胞的数目或平均数目足够小(例如,等于或小于每个群体50个、25个、10个、5个、4个、3个、2个或1个细胞)时,用于细胞过载和多重体鉴定的样品索引组合物可以被称为细胞鉴定组合物。
寡核苷酸缀合的抗体
独特分子标记序列
与细胞组分结合试剂关联的寡核苷酸(例如,抗体寡核苷酸(“AbOligo”或“AbO”)、结合试剂寡核苷酸、细胞组分结合试剂特异性寡核苷酸、样品索引寡核苷酸)可以包含独特分子标记序列(也称为分子索引(MI)、“分子条形码”或独特分子标识符(UMI))。细胞组分结合试剂可以包括细胞内靶结合试剂、细胞表面靶结合试剂和/或核靶结合试剂。结合试剂寡核苷酸可以包括细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸和/或核靶结合试剂特异性寡核苷酸。在一些实施方案中,包含如本文描述的分子条形码的结合试剂寡核苷酸种类通过增加灵敏度、减少相对标准误差或增加灵敏度和/或降低标准误差来降低偏倚。分子条形码可以包含独特序列,使得当多个样品核酸(可以彼此相同和/或不同)与分子条形码一一关联时,不同的样品核酸可以通过分子条形码彼此区分。这样,即使样品包含具有相同序列的两种核酸,这两种核酸中的每一种可以用不同的分子条形码标记,使得群体中的核酸可以被定量,甚至在扩增之后被定量。分子条形码可以包括至少5个核苷酸的核酸序列,例如至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸,包括这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中,分子条形码的核酸序列包含例如独特序列,使得组合物中的每种独特寡核苷酸物质包含不同的分子条形码。在一些实施方案中,两种或更多种独特寡核苷酸物质可以包含相同的分子条形码,但是仍然彼此不同。例如,如果独特寡核苷酸物质包含样品条形码,则具有特定样品条形码的每种独特寡核苷酸物质可以包含不同的分子条形码。在一些实施方案中,包含独特寡核苷酸物质的组合物包含至少1000种不同分子条形码的分子条形码多样性,并且因此包含至少1000种独特寡核苷酸物质。在一些实施方案中,包含独特寡核苷酸物质的组合物包含至少6500种不同分子条形码的分子条形码多样性,并且因此包含至少6,500种独特寡核苷酸物质。在一些实施方案中,包含独特寡核苷酸物质的组合物包含至少65000种不同分子条形码的分子条形码多样性,并且因此包含至少65,000种独特寡核苷酸物质。
独特分子标记序列可以位于独特标识符序列的5’,在独特分子标记序列和独特标识符序列之间没有任何间插序列。在一些实施方案中,独特分子标记序列位于间隔区的5’,所述间隔区位于独特标识符序列的5’,使得间隔区位于独特分子标记序列与独特标识符序列之间。在一些实施方案中,独特标识符序列位于独特分子标记序列的5’,在独特标识符序列与独特分子标记序列之间没有任何间插序列。在一些实施方案中,独特标识符序列位于间隔区的5’,所述间隔区位于独特分子标记序列的5’,使得间隔区位于独特标识符序列与独特分子标记序列之间。
独特分子标记序列可以包括至少2个核苷酸的核酸序列,例如至少2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个核苷酸、这些值中的任何两个之间的数字或范围的核苷酸。
在一些实施方案中,结合试剂寡核苷酸的独特分子标记序列包含为双重体“VN”和/或“NV”的至少三个重复的序列(其中每个“V”是A、C或G中的任何一个,并且其中“N”是A、G、C或T中的任何一个),至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。双重体“VN”的多个重复的实例包括VN、VNVN、VNVNVN和VNVNVNVN。要注意的是,虽然式“VN”和“NV”描述了对基本内容的约束,但不是每个V或每个N都必须相同或不同。例如,如果组合物中独特寡核苷酸物质的分子条形码包含VNVNVN,一种分子条形码可以包含序列ACGGCA,而另一种分子条形码可以包含序列ATACAT,而另一种分子条形码可以包含序列ATACAC。要注意的是,任何数目的重复的双重体“VN”将具有不多于50%的T含量。在一些实施方案中,包含至少1000种独特寡核苷酸物质的组合物的至少95%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少1000种独特寡核苷酸物质的组合物的至少99%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少1000种独特寡核苷酸物质的组合物的至少99.9%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少6500种独特寡核苷酸物质的组合物的至少95%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少6500种独特寡核苷酸物质的组合物的至少99%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少6500种独特寡核苷酸物质的组合物的至少99.9%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少65000种独特寡核苷酸物质的组合物的至少95%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少65,000种独特寡核苷酸物质的组合物的至少99%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,包含至少65000种独特寡核苷酸物质的组合物的至少99.9%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个之间的范围。在一些实施方案中,组合物由或基本上由至少1000、6500或65,000种独特的寡核苷酸物质组成,每种寡核苷酸物质具有包含序列VNVNVN的分子条形码。在一些实施方案中,组合物由或基本上由至少1000、6500或65,000种独特的寡核苷酸物质组成,每种寡核苷酸物质具有包含序列VNVNVNVN的分子条形码。在一些实施方案中,如本文描述的组合物的至少95%、99%或99.9%的条形码区域包含如本文描述的双重体“VN”和/或“NV”的至少三个重复。在一些实施方案中,包含重复的双重体“VN”和/或“NV”的独特分子标记序列可以产生低偏倚,同时在减少偏倚与维持相对大量的可用核苷酸序列之间提供折中,使得可以在相对短的序列中获得相对高的多样性,同时仍然使偏倚最小化。在一些实施方案中,包含重复的双重体“VN”和/或“NV”的独特分子标记序列可以通过增加灵敏度、降低相对标准误差或增加灵敏度和减少标准误差来减少偏倚。在一些实施方案中,包含重复的双重体“VN”和/或“NV”的独特分子标记序列通过充当地理标志物(geomarker)来改进信息学分析。在一些实施方案中,本文描述的重复的双重体“VN”和/或“NV”减少了独特分子标记序列内均聚物的发生率。在一些实施方案中,本文描述的重复的双重体“VN”和/或“NV”中断均聚物。
在一些实施方案中,样品索引寡核苷酸包含第一分子标记序列。在一些实施方案中,至少两种样品索引寡核苷酸的第一分子标记序列是不同的,并且至少两种样品索引寡核苷酸的样品索引序列是相同的。在一些实施方案中,至少两种样品索引寡核苷酸的第一分子标记序列是不同的,并且至少两种样品索引寡核苷酸的样品索引序列是不同的。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含第二分子标记序列。在一些实施方案中,至少两种细胞组分结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两种细胞组分结合试剂特异性寡核苷酸的独特标识符序列是相同的。在一些实施方案中,至少两种细胞组分结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两种细胞组分结合试剂特异性寡核苷酸的独特标识符序列是不同的。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的独特第二分子标记序列的数目指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数,细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。在一些实施方案中,以下(1)和(2)的组合(例如,最小值、平均值和最大值)指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数:(1)测序数据中与用于细胞组分结合试剂的独特标识符序列关联的独特第一分子标记序列的数目,细胞组分结合试剂能够与至少一种细胞组分靶特异性结合;和(2)测序数据中与用于细胞组分结合试剂的独特标识符序列关联的独特第二分子标记序列的数目,细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。
对齐序列
在一些实施方案中,结合试剂寡核苷酸(例如,细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)包含与多(dA)区相邻的对齐序列(例如,参考图9描述的对齐序列825bb)。对齐序列的长度可以是1个或更多个核苷酸。对齐序列的长度可以是2个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含多(dT)区、多(dG)区、多(dC)区、多(dU)区或其组合。在一些实施方案中,对齐序列位于多(dA)区的5’。有利地,在一些实施方案中,对齐序列的存在使得结合试剂寡核苷酸中的每一种的多(A)尾具有相同的长度,导致更大的性能均匀性。在一些实施方案中,在多于一种结合试剂寡核苷酸(其中的每一种结合试剂寡核苷酸包含对齐序列)中具有相同多(dA)区长度的结合试剂寡核苷酸的百分比可以是以下或可以是约以下:80%、90%、91%、93%、95%、97%、99.9%、99.9%、99.99%或100%或在这些值中的任何两个之间的数字或范围。在一些实施方案中,在多于一种结合试剂寡核苷酸(其中的每一种结合试剂寡核苷酸包含对齐序列)中具有相同多(dA)区长度的结合试剂寡核苷酸的百分比可以是至少以下或可以是至多以下:80%、90%、91%、93%、95%、97%、99.9%、99.9%、99.99%或100%。
在不同实施方式中,对齐序列的长度可以是不同的。在一些实施方案中,对齐序列的长度可以是以下或可以是约以下、是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或在这些值中的任何两个值之间的数字或范围。在不同实施方式中,对齐序列中鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是不同的。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或在这些值中的任何两个之间的数字或范围。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个或100个。在一些实施方案中,样品索引寡核苷酸包含对齐序列。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含对齐序列。
接头
结合试剂寡核苷酸(例如,细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)可以通过各种机制与细胞组分结合试剂(例如,细胞内靶结合试剂、细胞表面靶结合试剂、核靶结合试剂)缀合。在一些实施方案中,结合试剂寡核苷酸可以与细胞组分结合试剂共价缀合。在一些实施方案中,结合试剂寡核苷酸可以与细胞组分结合试剂非共价缀合。在一些实施方案中,结合试剂寡核苷酸通过接头与细胞组分结合试剂缀合。在一些实施方案中,结合试剂寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂的分子。化学基团可以选自由以下组成的组:UV光可裂解基团、二硫键、链霉抗生物素蛋白、生物素、胺及其任何组合。接头可以包含碳链。碳链可以包含例如5-50个碳原子。在不同实施方案中,碳链可以具有不同数目的碳原子。在一些实施方案中,碳链中碳原子的数目可以是以下、可以是约以下、至少以下或可以是至多以下:3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个或在这些值中的任何两个值之间的数字或范围。在一些实施方案中,碳链包含2-30个碳原子。在一些实施方案中,碳链包含12个碳原子。在一些实施方案中,用于结合试剂寡核苷酸的氨基修饰物可以与细胞组分结合试剂缀合。在一些实施方案中,接头包含5’氨基修饰物C6(5AmMC6)或其衍生物。在一些实施方案中,接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。在一些实施方案中,较长的接头实现了更高的缀合效率。在一些实施方案中,较长的接头在缀合之前实现了更高的修饰效率。在一些实施方案中,增加功能性胺与DNA序列之间的距离产生更高的缀合效率。在一些实施方案中,增加功能性胺与DNA序列之间的距离在缀合之前产生更高的修饰效率。在一些实施方案中,使用5AmMC12作为接头比使用5AmMC6作为接头产生更高的修饰效率(在缀合之前)。在一些实施方案中,使用5AmMC12作为接头比使用5AmMC6作为接头产生更高的缀合效率。在一些实施方案中,样品索引寡核苷酸通过接头与细胞组分结合试剂关联。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸通过接头与细胞组分结合试剂关联。
抗体特异性条形码序列
在若干实施方案中,本文公开了对结合试剂寡核苷酸(例如,细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)的独特标识符序列(例如,抗体特异性条形码序列)设计的改进。细胞内靶结合试剂特异性寡核苷酸可以包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符。细胞表面靶结合试剂特异性寡核苷酸可以包含用于细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符。核靶结合试剂特异性寡核苷酸可以包含用于核靶结合试剂特异性寡核苷酸的独特核靶标识符。在一些实施方案中,独特标识符序列(例如,样品索引序列、细胞组分结合试剂特异性寡核苷酸)被设计成具有大于3的汉明距离。在一些实施方案中,独特标识符序列的汉明距离可以是以下,或是约以下:1、2、3、4、5、6、7、8、9、10,或在这些值中的任何两个之间的数字或范围。在一些实施方案中,独特标识符序列具有在40%至60%范围内的GC含量,并且不具有预测的二级结构(例如,发夹)。在一些实施方案中,独特标识符序列不包含计算机模拟预测与小鼠和/或人类转录物结合的任何序列。在一些实施方案中,独特标识符序列不包含计算机模拟预测与Rhapsody和/或SCMK系统引物结合的任何序列。在一些实施方案中,独特标识符序列不包含均聚物。
引物衔接子
在一些实施方案中,结合试剂寡核苷酸(例如,细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸、核靶结合试剂特异性寡核苷酸)包含引物衔接子。在一些实施方案中,引物衔接子包含以下序列:第一通用引物、其互补序列、其部分序列或其组合。在一些实施方案中,第一通用引物包括扩增引物、其互补序列、其部分序列或其组合。在一些实施方案中,第一通用引物包括测序引物、其互补序列、其部分序列或其组合。在一些实施方案中,测序引物包括Illumina测序引物。在一些实施方案中,测序引物包括Illumina测序引物的一部分。在一些实施方案中,测序引物包括P7测序引物。在一些实施方案中,测序引物包括P7测序引物的一部分。在一些实施方案中,引物衔接子包括用于Illumina P7的衔接子。在一些实施方案中,引物衔接子包括用于Illumina P7的部分衔接子。在一些实施方案中,扩增引物是Illumina P7序列或其子序列。在一些实施方案中,测序引物是Illumina R2序列或其子序列。在一些实施方案中,第一通用引物的长度是5-50个核苷酸。在一些实施方案中,引物衔接子可以包含至少5个核苷酸的核酸序列,例如至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸、这些值中的任何两个之间的数字或范围的核苷酸。引物衔接子可以包含第一通用引物、扩增引物、测序引物、其互补序列、其部分序列或其组合的序列的至少5个核苷酸的核酸序列,例如第一通用引物、扩增引物、测序引物、其互补序列、其部分序列或其组合的序列的至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸,包括这些值中任何两个之间的数字或范围的核苷酸。
用于测序文库制备的常规扩增工作流程可以采用三轮PCR,诸如,例如:第一轮(“PCR 1”)采用靶特异性引物和针对通用Illumina测序引物1序列的引物;第二轮(“PCR2”)使用侧翼为Illumina测序引物2序列的巢式靶特异性引物和针对通用Illumina测序引物1序列的引物;和第三轮(“PCR 3”)添加Illumina P5和P7和样品索引。有利地,在一些实施方案中,与如果起始模板(例如,附接至珠的样品索引寡核苷酸)不具有引物衔接子相比,本文公开的引物衔接子能够在文库制备中实现更短且更简单的工作流程。在一些实施方案中,引物衔接子将模板的测序前PCR扩增减少一轮(与如果不包含引物衔接子的模板相比)。在一些实施方案中,引物衔接子将模板的测序前PCR扩增减少至一轮(与如果不包含引物衔接子的模板相比)。在一些实施方案中,包含引物衔接子的模板不需要用于附接Illumina测序衔接子的PCR扩增步骤,如果模板不包含引物衔接子,则需要预测序。在一些实施方案中,引物衔接子序列(或其子序列)不是包含引物衔接子序列的测序模板的测序读出的一部分,并且因此不影响包含引物衔接子的模板的读段质量。与如果不包含引物衔接子的模板相比,包含引物衔接子的模板可以具有降低的测序多样性。
在一些实施方案中,样品索引寡核苷酸包含引物衔接子。在一些实施方案中,复制样品索引寡核苷酸、条形码化样品索引寡核苷酸或其产物包括使用第一通用引物、包含第一通用引物序列的第一引物或其组合,以产生多于一种复制的样品索引寡核苷酸。在一些实施方案中,复制一种样品索引寡核苷酸、条形码化样品索引寡核苷酸或其产物包括使用第一通用引物、包含第一通用引物序列的第一引物、第二通用引物、包含第二通用引物序列的第二引物或其组合,以产生多于一种复制的样品索引寡核苷酸。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含引物衔接子。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含以下序列:第一通用引物、其互补序列、其部分序列或其组合。
结合试剂寡核苷酸条形码化
图8示出了与结合试剂805(此处图示的抗体)关联的结合试剂寡核苷酸825(此处图示的抗体寡核苷酸)的条形码化的非限制性示例性工作流程的示意图。结合试剂寡核苷酸825可以通过接头825l与结合试剂805关联。结合试剂寡核苷酸825可以使用化学、光学或其他手段从结合试剂脱离。结合试剂寡核苷酸825可以是mRNA模拟物。结合试剂寡核苷酸825可以包含引物衔接子825pa、抗体分子标记825am(例如,独特分子标记序列)、抗体条形码825ab(例如,独特标识符序列)、对齐序列825bb和多(A)尾825a。在一些实施方案中,引物衔接子825pa包含以下序列:第一通用引物、其互补序列、其部分序列或其组合。在一些实施方案中,引物衔接子825pa对于所有或一些结合试剂寡核苷酸825可以是相同的。在一些实施方案中,抗体条形码825ab对于所有或一些结合试剂寡核苷酸825可以是相同的。在一些实施方案中,不同结合试剂寡核苷酸825的抗体条形码825ab是不同的。在一些实施方案中,不同结合试剂寡核苷酸825的抗体分子标记825am是不同的。
结合试剂寡核苷酸825可以使用多于一种条形码815(例如,与颗粒诸如珠810关联的条形码815)进行条形码化,以产生多于一种条形码化结合试剂寡核苷酸840。在一些实施方案中,条形码815可以包含用于与结合试剂寡核苷酸825,任选地分子标记815m(例如,用于确定结合试剂寡核苷酸的出现数目)、细胞标记815c和通用标记815u结合的多(dT)区815t。在一些实施方案中,条形码815与结合试剂寡核苷酸825的多(dT)区815t杂交。在一些实施方案中,条形码化结合试剂寡核苷酸840通过使与结合试剂寡核苷酸825杂交的条形码815延伸(例如,通过逆转录)而产生。在一些实施方案中,条形码化结合试剂寡核苷酸840包含引物衔接子825pa、抗体分子标记825am(例如,独特分子标记序列)、抗体条形码825ab(例如,独特标识符序列)、对齐序列825bb、多(dT)区815t、分子标记815m、细胞标记815c和通用标记815u。
在一些实施方案中,本文公开的条形码化结合试剂寡核苷酸包含两种独特分子标记序列:来源于条形码的分子标记序列(例如,分子标记815m)和来源于结合试剂寡核苷酸的分子标记序列(例如,抗体分子标记825am、样品索引寡核苷酸的第一分子标记序列、细胞组分结合试剂特异性寡核苷酸的第二分子标记序列)。如本文使用的,“双重分子索引”是指采用包含第一独特分子标记序列和第二独特分子标记序列(或其互补序列)的条形码化结合试剂寡核苷酸(或其产物)的本文公开的方法和组合物。在一些实施方案中,本文公开的样品鉴定和细胞组分靶的定量分析的方法可以包括获得条形码分子标记序列和/或结合试剂寡核苷酸分子标记序列的信息序列。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的条形码分子标记序列的数目指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数,细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的结合试剂寡核苷酸分子标记序列的数目指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数,细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的结合试剂寡核苷酸分子标记序列和条形码分子标记序列二者的数目指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数,细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。
在开始测序方案之前使用PCR来扩增物质的量增加了伪影(artifacts)的可能性,诸如当过早终止产物引发随后轮合成时,在扩增期间发生人为重组。在一些实施方案中,本文提供的双重分子索引的方法允许在给定足够测序深度的情况下鉴定PCR嵌合体。另外地,在一些实施方案中,向结合试剂寡核苷酸添加独特分子标记序列增加了随机标记的复杂性。因此,在一些实施方案中,结合试剂寡核苷酸中独特分子标记序列的存在可以克服UMI多样性的限制。在一些实施方案中,与不使用该方法和组合物相比,本文提供的双重分子索引方法将测序后分子覆盖计算期间标记为“饱和”的细胞组分靶的数目降低至少或至少约2%(例如,2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、40%、50%、75%、100%、150%、200%、250%、500%、1000%或更高,以及其中的重叠范围)。
阻断试剂
本文描述的组合物可以包含阻断试剂。阻断试剂可以包含例如(a)能够与至少一部分蛋白质靶结合试剂特异性寡核苷酸或一部分细胞内靶结合试剂特异性寡核苷酸杂交的一种或更多种寡核苷酸;(b)能够与一种或更多种非靶核酸或其任何组合中的至少一种杂交的一种或更多种诱饵寡核苷酸。多于一个细胞可以在存在阻断试剂的情况下被固定和/或透化,多于一个细胞可以在细胞被固定和/或透化或两者之后接触阻断试剂。在一些实施方案中,本文描述的方法包括在细胞与固定剂和/或透化剂接触后,使细胞与阻断试剂(例如,诱饵寡核苷酸)接触。
不受任何特定理论的限制,认为诱饵寡核苷酸可以例如防止或减少细胞内靶结合试剂特异性寡核苷酸或蛋白质靶结合试剂特异性寡核苷酸与非靶细胞/内源性核酸的不合意的非特异性结合,因此减少方法中的噪声。例如,诱饵寡核苷酸能够与一种或更多种非靶核酸中的至少一种或其一部分杂交。诱饵寡核苷酸的非限制性示例性设计在图14A-图14B中示出。诱饵寡核苷酸可以包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的一个或更多个共同特征。例如,诱饵寡核苷酸可以包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸相同或基本相同的AbSeq条形码。在一些实施方案中,AbSeq条形码是约20个至50个核苷酸,例如20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个或者这些值中的任何两个之间的范围的核苷酸。在一些实施方案中,诱饵寡核苷酸不具有AbSeq条形码。在一些实施方案中,诱饵寡核苷酸包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的序列相同或基本相似的序列。例如,诱饵寡核苷酸可以具有与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸具有、具有约、具有至少约100%、99%、98%、97%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%、70%、65%、60%或这些值中任何两个之间的数字或范围的序列同一性的序列。诱饵寡核苷酸的这样的序列的长度可以是、可以是约、可以是至少或可以是至多3个、5个、8个、10个、12个、14个、15个、18个、20个、25个、30个、35个、40个,或者这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中,诱饵寡核苷酸与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸具有、具有约或具有至多5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、这些值中的任何两个之间的数字或范围的序列同一性。
在一些实施方案中,诱饵寡核苷酸包含随机序列区域,其中在每4个、5个、6个或7个核苷酸链段(即,4个、5个、6个或7个连续的核苷酸)中有至少一个G或C。在一些实施方案中,诱饵寡核苷酸不包含具有超过3个、4个、5个或6个连续T或A的任何多(dT)或多(dA)区域。在一些实施方案中,诱饵寡核苷酸包含AbSeq条形码序列和长度为约12-15个核苷酸的随机序列。
诱饵寡核苷酸可以包含一种或更多种修饰的核苷酸、5’修饰、3’修饰或其任何组合。3’修饰可以是例如3’双脱氧-C修饰(ddC)。5’修饰可以是例如5’氨基修饰物C12修饰(5AmMC12)。诱饵寡核苷酸的长度可以变化,例如诱饵寡核苷酸的长度可以是或是约25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个或这些值中任何两个之间的范围的核苷酸。诱饵寡核苷酸可以包含一个或更多个UMI或UMI区域。在一些实施方案中,诱饵寡核苷酸不包含UMI。在一些实施方案中,诱饵寡核苷酸包含一个或更多个随机序列区域(例如,1个、2个、3个、4个随机序列区域)。在一些实施方案中,诱饵寡核苷酸不包含随机序列。UMI的长度可以变化,例如,UMI的长度可以是或是约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或这些值中任何两个之间的范围的核苷酸。随机序列区的长度可以变化,例如,随机序列区的长度可以是、是约、是至多或是至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个或这些值中的任何两个之间的范围的核苷酸。在一些实施方案中,诱饵寡核苷酸包含长度为或为约30个核苷酸的随机序列区,并且其中随机序列区在每个6个核苷酸链段中具有至少一个G或C。表1中提供了诱饵寡核苷酸的非限制性实例。表1中提供的两种或更多种诱饵寡核苷酸可以一起用于本文描述的任何方法和组合物。例如,表1中在诱饵1下面提供的三种诱饵寡核苷酸可以一起使用,并且表1中在诱饵2下面提供的三种寡核苷酸可以一起使用。在一些实施方案中,诱饵寡核苷酸(例如,表1中示出的那些)不包含3’修饰。在一些实施方案中,3’修饰能够减少或阻止诱饵寡核苷酸的聚合酶延伸(例如,3’双脱氧-C修饰(ddC))。在一些实施方案中,诱饵寡核苷酸被配置为通过包含例如延伸阻断物来阻止其经由聚合酶的3’延伸。3’修饰可以是一种或更多种延伸阻断物。3’修饰可以是配置为不与寡核苷酸条形码的靶结合区退火的序列。延伸阻断物可以包含一个或更多个2’-O-甲基(2’OM)RNA核苷酸。延伸阻断物可以包含无碱基位点、稳定的无碱基位点、化学捕获的无碱基位点或其任何组合中的一种或更多种。在一些实施方案中,稳定的无碱基位点包含1’,2’-双脱氧。在一些实施方案中,化学捕获的无碱基位点包括与烷氧基胺或硼氢化钠反应的无碱基位点。在一些实施方案中,无碱基位点包括无嘌呤位点、无嘧啶位点或两者。在一些实施方案中,无碱基位点由烷基化剂或氧化剂产生。在一些实施方案中,一种或更多种延伸阻断物包括:一个或更多个硝基吲哚、一个或更多个肌苷、一个或更多个吖啶、一个或更多个2-氨基嘌呤、一个或更多个2-6-二氨基嘌呤、一个或更多个5-溴脱氧尿苷、一个或更多个反向胸苷(反向dT)、一个或更多个反向双脱氧胸苷(ddT)、一个或更多个双脱氧胞苷(ddC)、一个或更多个5-甲基胞苷、一个或更多个5-羟甲基胞苷、一个或更多个2’-O-甲基RNA碱基、一个或更多个未甲基化RNA碱基、一个或更多个异脱氧胞苷(Iso-dC)、一个或更多个异脱氧鸟苷(Iso-dG)、一个或更多个C3(OC3H6OPO3)基团、一个或更多个可光裂解(PC)[OC3H6-C(o)NHCH2-C6H3NO2-CH(CH3)OPO3]基团、一个或更多个己二醇基团、一个或更多个spacer 9(iSp9)[(OCH2CH2)3OPO3]基团、一个或更多个spacer 18(iSp18)[(OCH2CH2)6OPO3]基团、或其任何组合。
在一些实施方案中,阻断试剂包含一种或更多种寡核苷酸,其序列与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的序列的一部分互补。在一些实施方案中,本文描述的方法包括在存在阻断试剂的情况下,使多于一种蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸与细胞接触。在一些实施方案中,诱饵寡核苷酸包含随机序列,该随机序列具有与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸中的一种或更多种的分子标记基本相同的长度。在一些实施方案中,诱饵寡核苷酸被配置成模拟细胞内靶结合试剂特异性寡核苷酸和/或细胞表面靶结合试剂特异性寡核苷酸,并且从而结合本来会结合细胞内靶结合试剂特异性寡核苷酸和/或细胞表面靶结合试剂特异性寡核苷酸的不合意的核酸物质。在一些实施方案中,本文提供的诱饵寡核苷酸包含、不包含和/或包含本文提供的细胞内靶结合试剂特异性寡核苷酸和/或细胞表面靶结合试剂特异性寡核苷酸的一种或更多种元件的修饰形式,诸如,例如对齐序列、UMI、抗体特异性条形码序列、引物衔接子、通用PCR手柄和/或配置为结合寡核苷酸条形码的靶结合区的序列(例如多(A)尾)。
本文描述的方法、组合物和试剂盒可以减少由条形码寡核苷酸(例如,寡核苷酸缀合的抗体中的抗体特异性寡核苷酸)与非靶细胞蛋白(例如,细胞表面蛋白和细胞内蛋白)的非特异性结合引起的噪声。当暴露大量细胞/内源性核酸时,在涉及细胞内组分(例如,细胞内蛋白质)的单细胞分析中使用本文公开的方法、组合物和试剂盒可能是有利的。如本文描述,通过使用诱饵寡核苷酸可以减少由非特异性结合引起的噪声(例如,部分减少、接近完全减少和完全减少)。在一些实施方案中,本文描述的方法、组合物和试剂盒可用于细胞内蛋白质染色的多种固定和透化工作流程。
在一些实施方案中,将固定/透化的细胞与1个、2个或3个独特诱饵寡核苷酸接触,并孵育持续合意的时间段(例如,约1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、7分钟、8分钟、9分钟、10分钟、12分钟、15分钟、20分钟、30分钟、60分钟,或者这些值中的任何两个之间的数字或范围)。例如,诱饵寡核苷酸可以导致、导致约或导致至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、100%或这些值中的任何两个之间的数字或范围的与非靶核酸的非特异性结合的减少。在一些实施方案中,诱饵寡核苷酸可以导致、导致约或导致至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、100%或这些值中任何两个之间的数字或范围的蛋白质基因组学或使用AbO的其他蛋白质组学工作流程中的噪声的减少。本文描述的诱饵寡核苷酸也可用于非单细胞分析,包括组织、细胞和类器官的AbO染色(例如,蛋白质组学工作流程,诸如cyclicIF)。
表1:非限制性示例性诱饵寡核苷酸和集合。
用于检测和测量蛋白质靶表达的组合物和方法
具有AbSeq技术的RhapsodyTM系统可用于在单细胞水平上同时分析mRNA和蛋白质(例如,细胞内蛋白质和表面蛋白质)。因此,可以检测和测量表面蛋白以及细胞内蛋白在单细胞中的存在和/或它们的表达水平。在当前的单细胞分析方案(例如,AbSeq方案)中,对于细胞内染色,细胞应该被固定和透化,但是这些方案会影响mRNA的稳定性。此外,细胞内区域含有大量的核酸,这些核酸可以与AbSeq抗体中的寡核苷酸产生非特异性结合和背景。本文提供的方法和组合物,诸如当裂解单细胞时,使用能够在理想的温度(例如15℃-65℃)解离蛋白质-核酸复合体的剂(例如蛋白酶K),可以解决这些问题。该方法可以包括在理想的温度(例如在15℃-65℃)使细胞与裂解缓冲液接触以裂解细胞,并且其中裂解缓冲液包含能够解离蛋白质-核酸复合体的剂。在一些实施方案中,首先使细胞与裂解缓冲液接触以裂解细胞,并将能够解离蛋白质-核酸复合体的剂加入裂解缓冲液中。理想的温度可以是或是约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃、65℃或者这些值中的任何两个之间的数字或范围。在一些实施方案中,理想的温度是至少或是至少约15℃、20℃、25℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、60℃、61℃、62℃、63℃、64℃或65℃的温度。在一些实施方案中,能够解离蛋白质-核酸复合体的剂在25-55℃对细胞发挥作用。在一些实施方案中,能够解离蛋白质-核酸复合体的剂在加热下对细胞发挥作用。
在US2018/0088112和US2018/0346970以及WO/2020/037065中已经描述了使用与寡核苷酸关联的蛋白结合试剂(例如,寡核苷酸缀合抗体(AbO)和寡核苷酸缀合适配体)用于条形码化和/或用于确定单细胞中的蛋白表达谱和样品追踪(例如,追踪样品来源)的实施方案;这些申请中的每一个的内容通过引用以其整体并入本文。
在一些实施方案中,DNA细胞组分结合试剂特异性寡核苷酸(例如,抗体寡核苷酸)与寡核苷酸条形码杂交并延伸,以实现来自相同珠的蛋白质定量和mRNA定量的单独但平行的工作流程,如US20210214784中描述的,其内容通过引用以其整体并入本文。在一些实施方案中,寡核苷酸条形码包含如US20210214770中描述的裂解区(包含例如一个或更多个裂解位点,诸如非规范核苷酸(例如脱氧尿苷)或限制性内切酶识别序列),其内容通过引用以其整体并入本文。本文提供的方法和组合物可以与2021年8月31日提交的题为“RNAPRESERVATION AND RECOVERY FROM FIXED CELLS”的美国专利申请第63/239,369号中描述的方法和组合物协同使用,其内容通过引用以其整体并入本文。在一些实施方案中,本文提供的系统、方法、组合物和试剂盒可以与WO/2021/163374中描述的系统、方法、组合物和试剂盒协同使用,其内容通过引用以其整体并入本文。
本文提供的公开内容包括在从表型分析到功能分析的免疫肿瘤学中分析单细胞蛋白质组表达的方法。免疫肿瘤学家需要从发现到验证的全面和互补的单细胞解决方案,而当前可用的方法不足以提供这样的解决方案。本文公开的方法和组合物提供了经由染料和寡核苷酸缀合的抗体探询细胞内蛋白质靶的多重化的能力,并且本文提供了用于流式细胞术和scMultiomics(例如,单细胞多组学)的验证和相关性工作流程。所公开的方法和组合物允许递送最广泛和最动态的试剂谱以使具有高度多重化的单细胞分析的单细胞蛋白质组调查成为可能。在一些实施方案中,本文提供的方法和组合物可与单细胞分泌组学一起采用。在一些实施方案中,提供了测量细胞内靶表达的方法,包括原位标记和/或裂解后捕获和标记。
细胞内靶表达测量(例如IC AbSeq)存在多种障碍。细胞需要稳定化的透化以接近IC蛋白质靶。需要在IC-AbSeq染色后有效地将mRNA从“稳定化的”细胞释放的技术。已知交联的RNA在用常规固定试剂(PFA、福尔马林等)固定期间将降解。本文提供的方法和组合物能够使IC靶上的抗体-寡核苷酸结合成为可能,同时维持scMultiomics工作流程(例如Rhapsody兼容工作流程)上的“充分的”mRNA分析。该工作流程可以包括IC抗体-寡核苷酸阻断缓冲液。对能够使细胞内AbSeq实验和mRNA一起用于同时的mRNA/蛋白分析成为可能的方法和组合物存在需求。在一些实施方案中,细胞被固定和透化用于细胞内抗体染色。已知RNA在用于细胞内蛋白染色的常规固定方法(例如,PFA、福尔马林)中损失。在一些实施方案中,提供了包括可逆固定和临时透化的方法作为绕过这一障碍的策略。在一些实施方案中,由于单链DNA通过氢键、静电相互作用等的非特异性结合,AbSeq中的寡核苷酸可以产生背景。盐浓度的增加和/或寡核苷酸长度的减少可以降低这种背景。在一些实施方案中,为了防止单链寡核苷酸与细胞内核酸结合,双链寡核苷酸可以与细胞组分结合试剂(例如,抗体)关联,和/或互补的寡核苷酸池可以用作阻断试剂。图12A-图12C示出了用于以高通量方式同时测量单细胞细胞内靶表达、细胞表面靶表达和mRNA表达的示例性工作流程的示意图。工作流程可任选地包括在细胞表面上结合寡核苷酸缀合抗体(ABO)(本文称为对表面蛋白的AbSeq染色),以及固定(例如,使用包括但不限于PFA、DSP(二硫代双(琥珀酰亚胺基丙酸酯))、SPDP、MeOH、CellCover或其任何组合的固定剂的固定)包含细胞内蛋白和mRNA的细胞。在一些实施方案中,在固定细胞之前进行表面蛋白的AbSeq染色。胺可以通过含有二硫桥的间隔区附接。工作流程可以包括膜透化(例如,使用包括但不限于皂苷、甲醇或两者的透化试剂的透化)。在一些实施方案中,工作流程可以包括AbSeq染色和/或洗涤(例如,使细胞与本文描述的细胞内靶结合试剂接触,并且任选地随后进行一次或更多次洗涤以去除未结合的细胞内靶结合试剂)。染色可以包括使细胞与本文提供的结合试剂诸如抗体-寡核苷酸缀合物(单链的或双链的)接触。结合试剂可以在高盐缓冲液(例如150mM-300mM NaCl)中与互补寡核苷酸或诱饵寡核苷酸混合,并且任选与DNA阻断试剂混合。工作流程可以包括去除透化剂(例如,去除皂苷)。不受任何特定理论的束缚,认为去除透化剂可以重新填充膜(例如,重建膜完整性)并阻止RNA进一步遭受RNA酶作用。在一些实施方案中,进行细胞表面蛋白的AbSeq染色(例如,与本文描述的细胞表面靶结合试剂接触和一次或更多次洗涤)。在一些实施方案中,工作流程可以包括分区细胞(例如,装载到Rhapsody盒上),使得每个分区包含单细胞。该工作流程可以包括使分区的细胞与解固定剂(例如,DTT)接触。工作流程可包括裂解分区的细胞,以及逆转细胞中的RNA(例如,mRNA)交联。反向交联可以通过使用一种或更多种解固定剂或条件来实现,包括但不限于蛋白酶K、加热、DTT及其任何组合。在一些实施方案中,解固定剂可以裂解二硫桥。解固定剂可以在用于裂解细胞的裂解缓冲液中,例如裂解缓冲液可以包含蛋白酶K。在裂解细胞的过程中,在裂解缓冲液中使用蛋白酶K和加热(例如,从37℃到56℃)来逆转RNA(例如,mRNA)交联可能是有利的。在一些实施方案中,交联RNA是PFA固定细胞的结果。加热可以是在、可以是约在37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃或这些值中任何两个值之间的范围。解固定剂可以在裂解步骤期间逆转固定,例如逆转mRNA交联。细胞组分结合试剂寡核苷酸(例如,细胞内靶结合试剂特异性寡核苷酸、细胞表面靶结合试剂特异性寡核苷酸)和/或mRNA可如本文描述地捕获(例如,通过寡核苷酸条形码)。本文公开的独特的可逆固定和透化方法使细胞内染色,同时也意外地保持RNAseq能力。
在一些实施方案中,本文提供的工作流程的一个或更多个变量可以根据特定实施方案和用户的需要进行调整,以生成优化的工作流程。在一些实施方案中,细胞内靶结合试剂特异性寡核苷酸的长度可以变化。在一些实施方案中,降低细胞内靶结合试剂特异性寡核苷酸的长度、采用双链细胞内靶结合试剂特异性寡核苷酸和/或无UMI的细胞内靶结合试剂特异性寡核苷酸可以减少噪声(例如,由于细胞内靶结合试剂特异性寡核苷酸的非特异性结合的噪声)。在一些实施方案中,固定剂、解固定剂和/或透化剂可以变化。例如,在一些实施方案中,该工作流程包括使用非交联固定剂(例如,甲醇)。染色条件可以根据实施方案而变化。可以调整(例如,增加)在工作流程的一个或更多个步骤期间使用的缓冲液的盐浓度以减少非特异性寡核苷酸结合。在一些实施方案中,在一个或更多个步骤期间使用阻断缓冲液可以使非特异性抗体-寡核苷酸结合最小化。在一些实施方案中,该工作流程包括作为阻断溶液组分的高蛋白和/或寡核苷酸池。在一些实施方案中,细胞捕获效率优化和/或细胞裂解(靶捕获)效率(例如,在BD Rhapsody盒中的)被改进。已在以下中描述了用于固定和透化的方法:Attar,Moustafa等人.“A practical solution for preserving singlecells for RNA sequencing.”Scientific reports 8.1(2018):1-10,Medepalli,Krishnakiran等人.“A new technique for reversible permeabilization of livecells for intracellular delivery of quantum dots.”Nanotechnology 24.20(2013):205101,Xiang,Charlie C等人.“Using DSP,a reversible cross-linker,to fix tissuesections for immunostaining,microdissection and expression profiling.”Nucleicacids research 32.22(2004):e185-e185,Gerlach,Jan P.等人.“Combinedquantification of intracellular(phospho-)proteins and transcriptomics fromfixed single cells.”Scientific reports 9.1(2019):1-10,和Granja,Jeffrey M等人.“Single-cell multiomic analysis identifies regulatory programs in mixed-phenotype acute leukemia.”Nature Biotechnology 37.12(2019):1458-1465,其中每一个的内容通过引用以其整体并入本文。
在一些实施方案中,提供了用于测量细胞内靶表达、细胞表面靶表达和细胞中核酸靶的拷贝数的方法。在一些实施方案中,该方法包括:使包含多于一种细胞内靶和多于一种细胞表面靶和核酸靶的拷贝的多于一个细胞固定和/或透化。该方法可以包括:使多于一种细胞内靶结合试剂与多于一个细胞接触,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,所述细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中细胞内靶结合试剂能够与多于一种细胞内靶中的至少一种特异性结合。该方法可以包括:使多于一种细胞表面靶结合试剂和与细胞内靶结合试剂关联的多于一个细胞接触,其中多于一种细胞表面靶结合试剂中的每一种包含细胞表面靶结合试剂特异性寡核苷酸,所述细胞表面靶结合试剂特异性寡核苷酸包含用于细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符,并且其中细胞表面靶结合试剂能够与多于一种细胞表面靶中的至少一种特异性结合。该方法可以包括:将与细胞内靶结合试剂和细胞表面靶结合试剂关联的多于一个细胞分区至多于一个分区,其中多于一个分区中的分区包含来自与细胞内靶结合试剂和细胞表面靶结合试剂关联的多于一个细胞的单细胞。方法可以包括:在包含单细胞的分区中,使单细胞与在15℃-65℃的裂解缓冲液接触以裂解单细胞,其中裂解缓冲液包含能够使蛋白质-核酸复合体解离的剂。该方法可以包括:在包含单细胞的分区中,使多于一种寡核苷酸条形码与细胞表面靶结合试剂特异性寡核苷酸和细胞内靶结合试剂特异性寡核苷酸以及核酸靶的拷贝接触进行杂交,其中寡核苷酸条形码各自包含第一分子标记。该方法可以包括:使与细胞内靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞内靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸各自包含与独特细胞内靶标识符序列的至少一部分互补的序列和第一分子标记。该方法可以包括:使与细胞表面靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸各自包含与独特细胞表面靶标识符序列的至少一部分互补的序列和第一分子标记。该方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记。方法可以包括:获得多于一种条形码化核酸分子或其产物的信息(例如序列信息),以确定多于一个细胞中的一个或更多个中的核酸靶的拷贝数。该方法可以包括:获得多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的信息(例如序列信息),以确定多于一个细胞中的一个或更多个中的多于一种细胞表面靶中的至少一种细胞表面靶的拷贝数。方法可以包括:获得多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的信息(例如序列信息),以确定多于一个细胞中的一个或更多个中的多于一种细胞内靶中的至少一种细胞内靶的拷贝数。
本文描述的方法可以包括:在包含单细胞的分区中,使单细胞的固定逆转。使多于一个细胞可逆地透化可以包括使多于一个细胞与透化剂接触。该方法可以包括:在使多于一种细胞内靶结合试剂与多于一个细胞接触之后,从与多于一种细胞内靶结合试剂关联的多于一个细胞去除透化剂。使多于一个细胞可逆地透化可以包括使多于一个细胞与透化剂接触,并从与多于一种细胞内靶结合试剂关联的多于一个细胞去除透化剂。多于一个细胞可以包含多于一种细胞表面靶。
该方法可以包括:使多于一种细胞表面靶结合试剂和与细胞内靶结合试剂关联的多于一个细胞接触,其中多于一种细胞表面靶结合试剂中的每一种包含细胞表面靶结合试剂特异性寡核苷酸,所述细胞表面靶结合试剂特异性寡核苷酸包含用于细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符,并且其中细胞表面靶结合试剂能够与多于一种细胞表面靶中的至少一种特异性结合;使多于一种寡核苷酸条形码与细胞表面靶结合试剂特异性寡核苷酸接触进行杂交;使与细胞表面靶结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸各自包含与独特细胞表面靶标识符序列的至少一部分互补的序列和第一分子标记;以及获得多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定多于一个细胞中的一个或更多个中多于一种细胞表面靶中的至少一种细胞表面靶的拷贝数。
多于一个细胞可以包含核酸靶的拷贝。该方法可以包括:使多于一种寡核苷酸条形码与核酸靶的拷贝接触进行杂交;使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记;以及获得多于一种条形码化核酸分子或其产物的序列信息,以确定多于一个细胞中的一个或更多个中核酸靶的拷贝数。
使多于一种细胞内靶结合试剂与多于一个细胞接触可以在存在包含一种或更多种盐的缓冲液的情况下进行。包含一种或更多种盐的缓冲液可以包含约10nM至约1M(例如,约150nM至约300nM)的盐浓度。包含一种或更多种盐的缓冲液的盐浓度可以是以下或可以是约以下:1nM、2nM、3nM、4nM、5nM、6nM、7nM、8nM、9nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、200nM、300nM、400nM、500nM、600nM、700nM、800nM、900nM、1000nM或在这些值中的任何两个之间的数字或范围。一种或更多种盐可以包括钠盐、钾盐、镁盐、锂盐、钙盐、锰盐、铯盐、铵盐、烷基铵盐或其任何组合。一种或更多种盐可以包括NaCl、KCl、MgCl2、Ca2+、MnCl2、LiCl或其任何组合。
方法可以包括:在使多于一个细胞内靶结合试剂与多于一个细胞接触之前,使多于一个细胞与阻断试剂接触。使多于一种细胞内靶结合试剂与多于一个细胞接触可以在存在阻断试剂的情况下进行。阻断试剂可以包括与细胞内靶结合试剂特异性寡核苷酸的至少一部分互补的多于一种寡核苷酸。阻断试剂可以包括BD Horizon Brilliant染色缓冲液、BD Horizon Brilliant染色缓冲液Plus、甲醇或其任何组合。细胞内靶结合试剂可以包括源自第一物种的抗体或其片段。阻断试剂可以包括源自第一物种的血清。
多于一种寡核苷酸条形码可以与固体支持物关联。多于一个分区中的分区可以包含单个固体支持物。分区可以是孔或液滴。每一种寡核苷酸条形码可以包含第一通用序列。寡核苷酸条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含多(dT)区。细胞内靶结合试剂特异性寡核苷酸可以包含与捕获序列互补的序列,所述捕获序列被配置为捕获细胞内靶结合试剂特异性寡核苷酸。细胞表面靶结合试剂特异性寡核苷酸可以包含与捕获序列互补的序列,所述捕获序列被配置为捕获细胞表面靶结合试剂特异性寡核苷酸。与捕获序列互补的序列可以包含多(dA)区。
多于一种条形码化细胞内靶结合试剂特异性寡核苷酸可以包含第一通用序列的互补物。细胞内靶结合试剂特异性寡核苷酸可以包含第二通用序列。在一些实施方案中,该方法包括获得多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的序列信息。该方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物,扩增多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞内靶结合试剂特异性寡核苷酸;以及获得多于一种扩增的条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的测序数据。细胞内靶结合试剂特异性寡核苷酸可以包含第二分子标记。多于一种细胞内靶结合试剂特异性寡核苷酸中的至少10种可以包含不同的第二分子标记序列。在一些实施方案中,至少两种细胞内靶结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中至少两种细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符序列是相同的。在一些实施方案中,至少两种细胞内靶结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中至少两种细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符序列是不同的。在一些实施方案中,测序数据中与用于能够与至少一种细胞内靶特异性结合的细胞内靶结合试剂的独特细胞内靶标识符序列关联的独特第一分子标记序列的数目指示多于一个细胞中的一个或更多个中至少一种细胞内靶的拷贝数。在一些实施方案中,测序数据中与用于能够与至少一种细胞内靶特异性结合的细胞内靶结合试剂的独特细胞内靶标识符序列关联的独特第二分子标记序列的数目指示多于一个细胞中的一个或更多个中至少一种细胞内靶的拷贝数。获得序列信息可以包括将测序衔接子附接至多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物。
细胞内靶结合试剂特异性寡核苷酸可以包含与多(dA)区相邻的对齐序列。细胞内靶结合试剂特异性寡核苷酸可以通过接头与细胞内靶结合试剂关联。细胞内靶结合试剂特异性寡核苷酸可以被配置为能够从细胞内靶结合试剂脱离。该方法可以包括:使细胞内靶结合试剂特异性寡核苷酸从细胞内靶结合试剂解离。该方法可以包括:在使多于一种细胞内靶结合试剂与多于一个细胞接触之后,去除多于一种细胞内靶结合试剂中未与多于一个细胞接触的一种或更多种细胞内靶结合试剂。在一些实施方案中,去除未与多于一个细胞接触的一种或更多种细胞内靶结合试剂包括:去除未与对应的多于一种细胞内靶中的至少一种接触的一种或更多种细胞内靶结合试剂。细胞内靶可以包括细胞内蛋白质靶。细胞内靶可以包括糖类、脂质、蛋白、肿瘤抗原或其任何组合。细胞内靶可以包括细胞内的靶。在一些实施方案中,细胞内靶结合试剂特异性寡核苷酸不包含分子标记。细胞内靶结合试剂特异性寡核苷酸可以包含双链RNA或双链DNA。细胞内靶结合试剂特异性寡核苷酸可以包含少于约100个核苷酸(例如,100nt、90nt、80nt、70nt、60nt、50nt、40nt、30nt、20nt、10nt或在这些值中的任何两个之间的数字或范围)的长度。细胞内靶结合试剂特异性寡核苷酸可以包含少于约7个、6个、5个、4个、3个、2个或1个CpG二核苷酸。
在一些实施方案中,确定多于一个细胞中的一个或更多个中核酸靶的拷贝数包括基于与多于一种条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、其互补物或其组合的数目来确定多于一个细胞中核酸靶的拷贝数。方法可以包括:使随机引物与多于一种条形码化核酸分子接触,其中随机引物中的每一个包含第三通用序列或其互补物;以及使与多于一种条形码化核酸分子杂交的随机引物延伸以产生多于一种延伸产物。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第三通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。在一些实施方案中,扩增多于一种延伸产物包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到多于一种延伸产物。该方法可以包括:基于与第一多于一种条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目,确定多于一个细胞中的一个或更多个中核酸靶的拷贝数。在一些实施方案中,确定多于一个细胞中的一个或更多个中核酸靶的拷贝数包括基于与第一多于一种条形码化扩增子中的条形码化扩增子关联的具有不同序列的第一分子标记的数目来确定多于一个细胞中的一个或更多个中多于一种核酸靶中的每一种的数目,所述第一多于一种条形码化扩增子包括多于一种核酸靶中的每一种的序列。多于一种核酸靶中的每一种的序列可以包括多于一种核酸靶中的每一种的子序列。第一多于一种条形码化扩增子中的核酸靶的序列可以包括核酸靶的子序列。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第三通用序列或其互补物杂交的引物扩增第一多于一种条形码化扩增子,从而产生第二多于一种条形码化扩增子。在一些实施方案中,扩增第一多于一种条形码化扩增子包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到第一多于一种条形码化扩增子。该方法可以包括:基于与第二多于一种条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目,确定多于一个细胞中的一个或更多个中核酸靶的拷贝数。在一些实施方案中,第一多于一种条形码化扩增子和/或第二多于一种条形码化扩增子包含全转录组扩增(WTA)产物。
方法可以包括:使用多于一种条形码化核酸分子作为模板合成第三多于一种条形码化扩增子以产生第三多于一种条形码化扩增子。合成第三多于一种条形码化扩增子可以包括对多于一种条形码化核酸分子进行PCR扩增。合成第三多于一种条形码化扩增子可以包括使用能够与第一通用序列或其互补物杂交的引物以及靶特异性引物进行的PCR扩增。该方法可以包括:获得第三多于一种条形码化扩增子或其产物的序列信息,并且任选地获得所述序列信息包括将测序衔接子附接至第三多于一种条形码化扩增子或其产物。该方法可以包括:基于与第三多于一种条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目,确定多于一个细胞中的一个或更多个中核酸靶的拷贝数。核酸靶可以包括核酸分子。核酸分子可以包括RNA、mRNA、微RNA、siRNA、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸或其任何组合。
多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸可以包含第一通用序列的互补物。细胞表面靶结合试剂特异性寡核苷酸可以包含第四通用序列。在一些实施方案中,获得多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的序列信息。该方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第四通用序列或其互补物杂交的引物,扩增多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞表面靶结合试剂特异性寡核苷酸;以及获得多于一种扩增的条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的测序数据。细胞表面靶结合试剂特异性寡核苷酸可以包含第三分子标记。多于一种细胞表面靶结合试剂特异性寡核苷酸中的至少10种可以包含不同的第三分子标记序列。在一些实施方案中,至少两种细胞表面靶结合试剂特异性寡核苷酸的第三分子标记序列是不同的,并且其中至少两种细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符序列是相同的。在一些实施方案中,至少两种细胞表面靶结合试剂特异性寡核苷酸的第三分子标记序列是不同的,并且其中至少两种细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符序列是不同的。在一些实施方案中,测序数据中与用于能够与至少一种细胞表面靶特异性结合的细胞表面靶结合试剂的独特细胞表面靶标识符序列关联的独特第一分子标记序列的数目指示多于一个细胞中的一个或更多个中至少一种细胞表面靶的拷贝数。在一些实施方案中,测序数据中与用于能够与至少一种细胞表面靶特异性结合的细胞表面靶结合试剂的独特细胞表面靶标识符序列关联的独特第三分子标记序列的数目指示多于一个细胞中的一个或更多个中至少一种细胞表面靶的拷贝数。在一些实施方案中,获得序列信息可以包括将测序衔接子附接至多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物。
细胞表面靶结合试剂特异性寡核苷酸可以包含与多(dA)区相邻的对齐序列。细胞表面靶结合试剂特异性寡核苷酸可以通过接头与细胞表面靶结合试剂关联。细胞表面靶结合试剂特异性寡核苷酸可以被配置为能够从细胞表面靶结合试剂脱离。该方法可以包括:使细胞表面靶结合试剂特异性寡核苷酸从细胞表面靶结合试剂解离。该方法可以包括:在使多于一种细胞表面靶结合试剂与多于一个细胞接触之后,去除多于一种细胞表面靶结合试剂中未与多于一个细胞接触的一种或更多种细胞表面靶结合试剂。在一些实施方案中,去除未与多于一个细胞接触的一种或更多种细胞表面靶结合试剂包括:去除未与对应的多于一种细胞表面靶中的至少一种接触的一种或更多种细胞表面靶结合试剂。细胞表面靶可以包括蛋白质靶。细胞表面靶可以包括糖类、脂质、蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。细胞表面靶可以在细胞表面上。
固定剂和解固定剂
如本文描述,固定剂可以包括交联剂。固定剂可以包括可裂解交联剂。可裂解交联剂可以包括硫醇可裂解交联剂。可裂解交联剂可以包括或可以衍生自二硫代双(琥珀酰亚胺基丙酸酯)(DSP,Lomant试剂)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP,Wang和Richard试剂)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。可裂解交联剂可以包含选自由以下组成的组的可裂解连接:化学可裂解连接、光可裂解连接、酸不稳定接头、热敏感性连接、酶促可裂解连接或其任何组合。可裂解交联剂可以包括二硫化物接头。固定剂可以包括BD Cytofix。固定剂可以包括可逆交联物。固定剂可以包括非交联固定剂。非交联固定剂可以包括甲醇。在一些实施方案中,固定剂(即,固定剂(fixative))是醛或包含醛,包括但不限于多聚甲醛(PFA)、甲醛和戊二醛,或其组合。
固定剂的非限制性实例包括但不限于NHS(N-羟基琥珀酰亚胺);磺基-NHS(N-羟基磺基琥珀酰亚胺);EDC(1-乙基-3-[3-二甲基氨基丙基])碳二亚胺盐酸盐;SMCC(琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯);磺基-SMCC;DSS(二琥珀酰亚胺基辛二酸酯);DSG(二琥珀酰亚胺基戊二酸酯);DFDNB(1,5-二氟-2,4-二硝基苯);BS3(双(磺基琥珀酰亚胺基)辛二酸酯);TSAT(三-(琥珀酰亚胺基)氨基三乙酸酯);BS(PEG)5(聚乙二醇化的双(磺基琥珀酰亚胺基)辛二酸酯);BS(PEG)9(聚乙二醇化的双(磺基琥珀酰亚胺基)-辛二酸酯);DSP(二硫代双(琥珀酰亚胺基丙酸酯));DTSSP(3,3’-二硫代双(磺基琥珀酰亚胺基丙酸酯));DST(二琥珀酰亚胺基酒石酸酯);BSOCOES(双(2-(琥珀酰亚胺基氧羰基氧基)-乙基)砜);EGS(乙二醇双(琥珀酰亚胺基琥珀酸酯));DMA (二亚胺代己二酸二甲酯);DMP(庚二亚氨酸二甲酯);DMS(辛二亚氨酸二甲酯);DTBP(Wang和Richard试剂);BM(PEG)2(1,8-双马来酰亚胺基二乙二醇);BM(PEG)3(1,11-双马来酰亚胺基三乙二醇);BMB(1,4-双马来酰亚胺基丁烷);DTME(二硫代双马来酰亚胺基乙烷);BMH(双马来酰亚胺基己烷);BMOE(双马来酰亚胺基乙烷);TMEA(三(2-马来酰亚胺基乙基)胺);SPDP(琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯);SMCC(琥珀酰亚胺基反式-4-(马来酰亚胺基甲基)环己烷-1-甲酸酯);SIA(琥珀酰亚胺基碘乙酸酯);SBAP(琥珀酰亚胺基3-(溴乙酰胺基)丙酸酯);STAB(琥珀酰亚胺基(4-碘乙酰基)氨基苯甲酸酯);磺基-SIAB(磺基琥珀酰亚胺基(4-碘乙酰基)氨基苯甲酸酯);AMAS(N-α-马来酰亚胺基乙酰氧基琥珀酰亚胺酯);BMPS(N-β-马来酰亚胺基丙氧基琥珀酰亚胺酯);GMBS(N-γ-马来酰亚胺基丁酰氧基琥珀酰亚胺酯);磺基-GMBS(N-γ-马来酰亚胺基丁酰氧基磺基琥珀酰亚胺酯);MBS(间马来酰亚胺基苯甲酰基-N-羟基琥珀酰亚胺酯);磺基-MBS(间马来酰亚胺基苯甲酰基-N-羟基磺基琥珀酰亚胺酯);SMCC(琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯);磺基-SMCC(磺基琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯);EMCS(N-ε-马来酰亚胺基己酰氧基琥珀酰亚胺酯);磺基-EMCS(N-ε-马来酰亚胺基己酰氧基磺基琥珀酰亚胺酯);SMPB(琥珀酰亚胺基4-(对马来酰亚胺基苯基)丁酸酯);磺基-SMPB(磺基琥珀酰亚胺基4-(N-马来酰亚胺基苯基)丁酸酯);SMPH(琥珀酰亚胺基6-((β-马来酰亚胺基丙酰胺基)-己酸酯));LC-SMCC(琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-羧基-(6-酰氨基己酸酯));磺基-KMUS(N-κ-马来酰亚胺基十一烷酰氧基磺基琥珀酰亚胺酯);SPDP(琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯);LC-SPDP(琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯);LC-SPDP(琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯);磺基-LC-SPDP(磺基琥珀酰亚胺基6-(3’-(2-吡啶基二硫代)丙酰胺基)己酸酯);SMPT(4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯);PEG4-SPDP(聚乙二醇化的长链SPDP交联剂);PEG12-SPDP(聚乙二醇化的长链SPDP交联剂);SM(PEG)2(聚乙二醇化的SMCC交联剂);SM(PEG)4(聚乙二醇化的SMCC交联剂);SM(PEG)6(聚乙二醇化的长链SMCC交联剂);SM(PEG)8(聚乙二醇化的长链SMCC交联剂);SM(PEG)12(聚乙二醇化的长链SMCC交联剂);SM(PEG)24(聚乙二醇化的长链SMCC交联剂);BMPH(N-β-马来酰亚胺基丙酸酰肼);EMCH(N-ε-马来酰亚胺基己酸酰肼);MPBH(4-(4-N-马来酰亚胺基苯基)丁酸酰肼);KMUH(N-κ-马来酰亚胺基十一烷酸酰肼);PDPH(3-(2-吡啶基二硫代)-丙酰肼);ATFB-SE(4-叠氮基-2,3,5,6-四氟苯甲酸琥珀酰亚胺酯);ANB-NOS(N-5-叠氮基-2-硝基苯甲酰氧基琥珀酰亚胺);SDA(NHS-二氮丙啶)(琥珀酰亚胺基4,4’-叠氮戊酸酯);LC-SDA(NHS-LC-二氮丙啶)(琥珀酰亚胺基6-(4,4’-叠氮戊酰胺基)己酸酯);SDAD(NHS-SS-二氮丙啶)(琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯);磺基-SDA(磺基-NHS-二氮丙啶)(磺基琥珀酰亚胺基4,4’-叠氮戊酸酯);磺基-LC-SDA(磺基-NHS-LC-二氮丙啶)(磺基琥珀酰亚胺基6-(4,4’-叠氮戊酰胺基)己酸酯);磺基-SDAD(磺基-NHS-SS-二氮丙啶)(磺基琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯);SPB(琥珀酰亚胺基-[4-(补骨脂素-8-基氧基)]-丁酸酯);磺基-SANPAH(磺基琥珀酰亚胺基6-(4’-叠氮基-2’-硝基苯基氨基)己酸酯);DCC(二环己基碳二亚胺);EDC(1-乙基-3-(3-二甲基氨基丙基)碳二亚胺盐酸盐);戊二醛、甲醛、多聚甲醛、琥珀醛、乙二醛、亚甲基二醇或其任何组合。在一些实施方案中,在本文提供的方法中采用戊二醛缩醛、1,4-吡喃、2-烷氧基-3,4-二氢-2H-吡喃(例如,2-乙氧基-3,4-二氢-2H-吡喃)或其任何组合。
交联剂的非限制性实例包括同型双官能性交联剂、异型双官能性交联剂、三官能性交联剂、多官能性交联剂及其组合。同型双官能性交联剂具有两端具有相同反应性基团的间隔臂(spacer arm)。异型双官能性交联剂具有两端具有不同反应性基团的间隔臂。三官能性交联剂具有连接到中心原子(诸如氮)的三个短间隔臂,并且每个间隔臂以反应性基团结束。本文公开的交联剂可以使氨基-氨基基团、氨基-巯基基团、巯基-巯基基团、氨基-羧基基团等交联。可以使用本领域已知的使蛋白交联的任何交联剂。另外,交联剂可以是化学交联剂或UV诱导交联剂。
固定剂可以是膜可渗透的(例如,膜可渗透交联剂)。可裂解和/或膜可渗透交联剂可以包括二硫代双(琥珀酰亚胺基丙酸酯)(DSP,Lomant试剂)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP,Wang和Richard试剂)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。
本文描述的方法可以包括将单细胞的固定逆转,其可以包括使单细胞与解固定剂接触。解固定剂可以是膜透过性的。解固定剂可以包括硫醇、羟胺、高碘酸盐、碱或其任何组合。解固定剂可以包括DTT。使单细胞的固定反向可以包括UV光裂解、化学处理、加热、酶处理或其任何组合。使单细胞的固定反向可以包括裂解单细胞。裂解单细胞可以包括加热、使单细胞与去污剂接触、改变pH或其任何组合。
不受任何特定理论的束缚,认为使用加热逆转甲醛交联,并利用蛋白酶K解离(例如,分解)在细胞固定期间形成的蛋白质-核酸复合体可能是有利的,这可以改善RNA的保存和回收。本文描述的方法和组合物在固定/透化细胞用于蛋白质检测和保存mRNA以及逆转mRNA交联用于涉及蛋白质和RNA两者的检测和分析的单细胞分析(例如,RNAseq)方面可以产生意想不到的和优异的结果。
透化剂
本文公开的内容包括能够使多于一个细胞的细胞膜透化的透化剂。透化剂能够使细胞膜对蛋白质靶结合试剂(例如,细胞内靶结合试剂)可渗透。透化剂可以包括溶剂、去污剂或表面活性剂或其任何组合。透化剂可以包括BD Cytoperm。透化剂可以包含皂苷或其衍生物、毛地黄皂苷或其衍生物或其任何组合。
在使多于一个细胞与透化剂接触后,多于一种细胞内靶结合试剂能够穿过多于一个细胞的细胞膜。与不存在透化剂的情况相比,在存在透化剂的情况下,进入细胞的细胞内靶结合试剂可以是至少2倍(例如2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍,或在这些值中的任何之间的数字或范围)多。与不存在透化剂的情况相比,在存在透化剂的情况下,细胞内靶结合试剂与多于一种细胞表面靶中的至少一种的特异性结合可以是至少2倍(例如2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍,或在这些值中的任何之间的数字或范围)大。
从多于一个细胞去除透化剂可以包括用不包含透化剂的缓冲液进行一次或更多次洗涤。在一些实施方案中,从多于一个细胞去除透化剂使多于一个细胞的细胞膜完整性恢复。在一些实施方案中,从多于一个细胞去除透化剂使多于一个细胞的细胞膜的透化反向。与存在透化剂的情况相比,在不存在透化剂的情况下,细胞内靶结合试剂从细胞的退出可以是至少2倍(例如2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍,或在这些值中的任何之间的数字或范围)大。在一些实施方案中,去除透化剂使细胞内靶结合试剂从细胞的泄漏减少至少2倍(例如2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍,或在这些值中的任何之间的数字或范围)。
如本文使用的,使细胞“透化”可指减少细胞膜完整性从而允许分子(例如,修饰剂、酶、抗体、其他蛋白)进入细胞内空间的处理。透化可以包括破坏、溶解、修饰脂质膜和/或在脂质膜中形成孔。在一些实施方案中,透化不涉及细胞形态的破坏或细胞的裂解。可使用各种溶剂、表面活性剂和/或市售试剂中的任何一种或更多种进行透化。在一些实施方案中,使用有机溶剂使细胞透化。有机溶剂的实例包括但不限于苯、正丁醇、正丙醇、异丙醇、甲苯、乙醚、苯乙醇、氯仿、己烷、乙醇和丙酮。在一些实施方案中,表面活性剂、去污剂或乳化剂用于使细胞膜透化。透化剂的非限制性实例包括皂苷、NP-40、Tween-20、triton X-100、brij 35、杜邦纳(Duponal)、毛地黄皂苷、硫堇、氯丙嗪、丙咪嗪、聚乙烯亚胺、十二烷基硫酸钠、脱氧胆酸钠和N-月桂基肌磺酸钠。在另外的实施方案中,市售的透化试剂和试剂盒包括但不限于LeucopermTM、PerFix-EXPOSE、PerFix-nc、试剂盒、Cytofix/CytopermTM溶液和固定透化试剂盒。
组合物和试剂盒
本文提供了组合物和试剂盒。在一些实施方案中,试剂盒包含:多于一种细胞内靶结合试剂,其中多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,所述细胞内靶结合试剂特异性寡核苷酸包含用于细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中细胞内靶结合试剂能够与细胞的至少一种细胞内靶特异性结合。试剂盒可以包含:多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。试剂盒可以包括:透化剂、固定剂、解固定剂、阻断试剂或其任何组合。固定剂可以包括或可以衍生自二硫代双(琥珀酰亚胺基丙酸酯)(DSP,Lomant试剂)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP,Wang和Richard试剂)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。透化剂可以包括溶剂、去污剂或表面活性剂。透化剂可以包括皂苷、毛地黄皂苷、其衍生物或其任何组合。解固定剂可以包括硫醇、羟胺、高碘酸盐、碱或其任何组合。解固定剂可以包括DTT。阻断试剂可以包括与细胞内靶结合试剂特异性寡核苷酸的至少一部分互补的多于一种寡核苷酸。
在一些实施方案中,蛋白质靶结合试剂特异性寡核苷酸(例如,细胞内靶结合试剂特异性寡核苷酸)不包含分子标记。细胞内靶结合试剂特异性寡核苷酸可以包含双链RNA或双链DNA。蛋白质靶结合试剂特异性寡核苷酸的长度可以包含少于约110个核苷酸、约90个核苷酸、约75个核苷酸或约50个核苷酸。蛋白质靶结合试剂特异性寡核苷酸可以包含少于约四个CpG二核苷酸。
试剂盒可以包含:缓冲液、盒、一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂或其组合。靶结合区可以包含基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。寡核苷酸条形码可以包含相同的样品标记和/或相同的细胞标记。在一些实施方案中,多于一种寡核苷酸条形码的每一种样品标记、细胞标记和/或分子标记包含至少6个核苷酸。
多于一种寡核苷酸条形码中的至少一种可以被固定或部分地固定在合成颗粒上;和/或多于一种寡核苷酸条形码中的至少一种可以被包封或部分地包封在合成颗粒中。合成颗粒可以是可破坏的。合成颗粒可以是或可以包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合;选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合;或者可破坏的水凝胶珠。在一些实施方案中,多于一种寡核苷酸条形码中的每一种可以包含接头官能团。合成颗粒可以包括固体支持物官能团。支持物官能团和接头官能团可以彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮及其任何组合组成的组。
实施例
上文讨论的实施方案的一些方面在以下实施例中进一步详细公开,其并不是以任何方式意在限制本公开内容的范围。
实施例1.用于与蛋白结合试剂关联的寡核苷酸
本实施例展示了可以与蛋白结合试剂缀合的寡核苷酸的设计。寡核苷酸可用于同时确定蛋白表达和基因表达。寡核苷酸也可用于样品索引,以确定相同或不同样品的细胞。
95mer寡核苷酸设计
以下方法用于产生用于蛋白表达和基因表达的同时确定或样品索引的候选寡核苷酸序列和相应的引物序列。
1.序列生成和消除
以下方法用于产生用于蛋白表达和基因表达的同时确定或样品索引的候选寡核苷酸序列。
步骤1a.随机产生许多具有期望长度(45bp)的候选序列(50000种序列)。
步骤1b.将转录调节物LSRR序列附加到所产生的序列的5’末端,并将多(A)序列(25bp)附加到所产生的序列的3’末端。
步骤1c.去除产生和附接的不具有40%至50%范围内的GC含量的序列。
步骤1d.将各自具有一个或更多个发夹结构的剩余序列去除。
剩余的候选寡核苷酸序列的数量是423。
2.引物设计
使用以下方法设计用于剩余的423种候选寡核苷酸序列的引物。
2.1 N1引物:使用通用N1序列:5’-GTTGTCAAGATGCTACCGTTCAGAG-3’(LSRR序列;SEQ ID NO.3)作为N1引物。
2.2 N2引物(用于扩增特异性样品索引寡核苷酸;例如,图9B-图9D中的N2引物):
2.2a.去除不从N1序列下游开始的候选N2引物。
2.2b.去除在候选寡核苷酸序列最后35bp中重叠的候选N2引物。
2.2c.去除与使用寡核苷酸进行研究的细胞的物种的转录组(例如,人类转录组或小鼠转录组)对齐的候选引物。
2.2d.使用ILR2序列(ACACGACGCTCTTCCGATCT;SEQ ID NO.4)作为使引物-引物相互作用最小化或避免引物-引物相互作用的默认对照。
在423种候选寡核苷酸序列中,设计了用于390种候选寡核苷酸的N2引物。
3.过滤
以下方法用于过滤剩余的390种候选引物序列。
3a.消除具有以A结尾的随机序列(即多(A)序列的有效长度大于25bp)的任何候选寡核苷酸序列,以保持多(A)尾对于所有条形码而言长度相同。
3b.消除具有4个或更多个连续G(>3个G)的任何候选寡核苷酸序列,这是由于G运行的寡核苷酸合成中的额外成本和潜在的较低产量。
图9A示出了使用上文的方法产生的非限制性示例性候选寡核苷酸序列。
200mer寡核苷酸设计
使用以下方法产生用于同时确定蛋白表达和基因表达以及样品索引的候选寡核苷酸序列和相应的引物序列。
1.序列生成和消除
使用以下产生用于蛋白表达和基因表达的同时确定以及样品索引的候选寡核苷酸序列。
1a.随机产生许多具有期望长度(128bp)的候选序列(100000种序列)。
1b.将转录调节物LSRR序列和一个另外的非人类、非小鼠的锚序列附加到所产生的序列的5’末端,并将多(A)序列(25bp)附加到所产生的序列的3’末端。
1c.去除产生和附接的不具有40%至50%范围内的GC含量的序列。
1d.基于发夹结构评分分选剩余的候选寡核苷酸序列。
1e.选择具有最低发夹评分的1000种剩余的候选寡核苷酸序列。
2.引物设计
使用以下方法设计用于具有最低发夹评分的400种候选寡核苷酸序列的引物。
2.1 N1引物:使用通用N1序列:5’-GTTGTCAAGATGCTACCGTTCAGAG-3’(LSRR序列;SEQ ID NO.3)作为N1引物。
2.2 N2引物(用于扩增特异性样品索引寡核苷酸;例如,图9B和图9C中的N2引物):
2.2a.去除不从N1序列下游23nt开始的候选N2引物(锚序列是跨越所有候选寡核苷酸序列通用的)。
2.2b.去除在靶序列最后100bp中重叠的候选N2引物。所得的候选引物可以在靶序列的第48个核苷酸和第100个核苷酸之间。
2.2c.去除与使用寡核苷酸进行研究的细胞的物种的转录组(例如,人类转录组或小鼠转录组)对齐的候选引物。
2.2d.使用ILR2序列,5’-ACACGACGCTCTTCCGATCT-3’(SEQ ID NO.4)作为使引物-引物相互作用最小化或避免引物-引物相互作用的默认对照。
2.2e.去除在靶序列最后100bp中重叠的候选N2引物。
在400种候选寡核苷酸序列中,设计了用于392种候选寡核苷酸的N2引物。
3.过滤
以下用于过滤剩余的392种候选引物序列。
3a.消除具有以A结尾的随机序列(即多(A)序列的有效长度大于25bp)的任何候选寡核苷酸序列,以保持多(A)尾对于所有条形码而言长度相同。
3b.消除具有4个或更多个连续G(>3个G)的任何候选寡核苷酸序列,这是由于G运行的寡核苷酸合成中的额外成本和潜在的较低产量。
图9B示出了使用上文的方法产生的非限制性示例性候选寡核苷酸序列。图9B示出的巢式N2引物可以结合抗体或样品特异性序列用于靶向扩增。图9C示出了具有对应于用于靶向扩增的锚序列的巢式通用N2引物的相同非限制性示例性候选寡核苷酸序列。图9D示出了用于一步靶向扩增的具有N2引物的相同非限制性示例性候选寡核苷酸序列。
总之,这些数据表明,具有不同长度的寡核苷酸序列可以被设计用于蛋白表达和基因表达的同时确定或样品索引。寡核苷酸序列可以包括通用引物序列、抗体特异性寡核苷酸序列或样品索引序列以及多(A)序列。
实施例2.寡核苷酸关联的抗体的工作流程
本实施例展示了使用寡核苷酸缀合的抗体来确定蛋白质靶的表达谱的工作流程。
将受试者的冷冻细胞(例如,冷冻外周血单个核细胞(PBMC))解冻。将解冻的细胞用寡核苷酸缀合的抗体(例如0.06μg/100μl的抗CD4抗体(寡核苷酸缀合的抗体储备物的1:333稀释))在一定温度染色持续一段时间(例如在室温持续20分钟)。寡核苷酸缀合的抗体缀合有1种、2种或3种寡核苷酸(“抗体寡核苷酸”)。抗体寡核苷酸的序列在图10中示出。洗涤细胞以去除未结合的寡核苷酸缀合的抗体。细胞任选地用钙黄绿素AM(BD(FranklinLake,New Jersey))和Draq7TM(Abcam(Cambridge,United Kingdom))染色,用于使用流式细胞术分选以获得感兴趣的细胞(例如,活细胞)。任选地洗涤细胞以去除过量的钙黄绿素AM和Draq7TM。使用流式细胞术将被钙黄绿素AM(活细胞)而非Draq7TM(未死亡或透化的细胞)染色的单细胞分选到BD RhapsodyTM盒中。
在含有单细胞和珠的孔中,孔中的单细胞(例如3500个活细胞)在裂解缓冲液(例如具有5mM DTT的裂解缓冲液)中裂解。靶(例如,CD4)的mRNA表达谱使用BD RhapsodyTM珠确定。靶(例如,CD4)的蛋白表达谱使用BD RhapsodyTM珠和抗体寡核苷酸确定。简而言之,mRNA分子在细胞裂解后被释放。RhapsodyTM珠与条形码(例如,随机条形码)关联,每个条形码包含分子标记、细胞标记和寡(dT)区。从裂解的细胞释放的mRNA分子的多(A)区与随机条形码的多(T)区杂交。抗体寡核苷酸的多(dA)区与条形码的寡(dT)区杂交。使用条形码对mRNA分子进行逆转录。使用条形码复制抗体寡核苷酸。逆转录和复制任选地同时发生在一个样品等分试样中。
逆转录的产物和复制的产物使用引物来进行PCR扩增,用于使用N1引物确定感兴趣的基因的mRNA表达谱,以及使用抗体寡核苷酸N1引物确定靶的蛋白表达谱。例如,逆转录的产物和复制的产物可以在60度退火温度使用引物进行15个循环的PCR扩增,用于使用血液小组N1引物确定488个血液小组基因的mRNA表达谱,以及使用抗体寡核苷酸N1引物确定CD4蛋白的表达谱(“PCR 1”)。多余的条形码任选地通过Ampure清理来去除。来自PCR 1的产物任选地分成两个等分试样,一个等分试样用于使用用于感兴趣的基因的N2引物确定感兴趣的基因的mRNA表达谱,并且一个等分试样用于使用抗体寡核苷酸N2引物确定感兴趣的靶的蛋白表达谱(“PCR 2”)。两个等分试样进行PCR扩增(例如,在60度退火温度进行15个循环)。基于如图10中图示的抗体寡核苷酸(“PCR 2”),确定细胞中靶的蛋白表达。在测序衔接子添加(“PCR 3”),诸如测序衔接子连接后获得和分析测序数据。基于感兴趣的基因的mRNA表达谱确定细胞类型。
总之,本实施例描述了使用寡核苷酸缀合的抗体用于确定感兴趣的靶的蛋白表达谱。本实施例还描述了,可以同时确定感兴趣的靶的蛋白表达谱和感兴趣的基因的mRNA表达谱。
实施例3.细胞组分结合试剂寡核苷酸
图11A-图11B示出了用于同时确定蛋白表达和基因表达以及用于样品索引的寡核苷酸的非限制性示例性设计。图11A示出了非限制性示例性细胞组分结合试剂寡核苷酸(SEQ IDNO:7),其包含用于抗体缀合的5’氨基修饰物C6(5AmMC6)接头(例如,可以在抗体缀合之前修饰)、通用PCR手柄、抗体特异性条形码序列和多(A)尾。虽然该实施方案描绘了长度为25个核苷酸的多(A)尾,但是多(A)尾的长度可以变化。在一些实施方案中,抗体特异性条形码序列是用于蛋白表达谱分析的方法的抗体克隆特异性条形码。在一些实施方案中,抗体特异性条形码序列是用于样品索引的方法的样品标签序列。在一些实施方案中,抗体特异性条形码序列的示例性设计特征是汉明距离大于3,GC含量在40%至60%的范围内,并且不存在预测的二级结构(例如,发夹)。在一些实施方案中,通用PCR手柄用于在文库制备期间将Illumina测序衔接子附接至扩增子的靶向的PCR扩增。在一些实施方案中,高质量的测序读段可以通过减少测序多样性来实现。
图11B示出了非限制性示例性细胞组分结合试剂寡核苷酸(SEQ ID NO:8),其包含用于抗体缀合的5’氨基修饰物C12(5AmMC12)接头、引物衔接子(例如,用于Illumina P7的部分衔接子)、抗体独特分子标识符(UMI)、抗体特异性条形码序列、对齐序列和多(A)尾。虽然该实施方案描绘了长度为25个核苷酸的多(A)尾,但是在一些实施方案中,多(A)尾的长度可以在18-30个核苷酸的范围内。抗体特异性条形码序列的示例性设计特征(其中“X”表示任何核苷酸),除了图11A中描述的那些,在一些实施方案中,包括缺乏均聚物和缺乏计算机模拟预测的结合人类转录物、小鼠转录物、Rhapsody系统引物和/或SCMK系统引物的序列。在一些实施方案中,对齐序列包含序列BB(其中B是C、G或T)。在一些实施方案中,提供长度为1个核苷酸和长度多于2个核苷酸的对齐序列。在一些实施方案中,与较短的接头(例如,5AmMC6)相比,5AmMC12接头可以实现更高的效率(例如,对于抗体缀合或抗体缀合之前的修饰)。抗体UMI序列可以包含“VN”和/或“NV”双重体(其中每个“V”是A、C或G中的任何一个,并且其中“N”是A、G、C或T中的任何一个),在一些实施方案中,这通过充当地理标志物和/或减少均聚物的发生率来改进信息学分析。在一些实施方案中,结合试剂寡核苷酸上独特分子标记序列的存在增加了随机标记的复杂性。在一些实施方案中,引物衔接子包含以下序列:第一通用引物、其互补序列、其部分序列或其组合。在一些实施方案中,引物衔接子消除了对通常在测序之前需要的用于附接Illumina测序衔接子的PCR扩增步骤的需要。在一些实施方案中,引物衔接子序列(或其子序列)不是包含引物衔接子序列的测序模板的测序读出的一部分,并且因此不影响包含引物衔接子的模板的读段质量。
实施例4.用于细胞内AbSeq和基因表达谱分析的示例性工作流程
在本实施例中,描述了用于同时测量细胞内蛋白质表达和基因表达的工作流程的非限制性示例性实施方案。
步骤1:使用0.4%~4% PFA(例如不同稀释度的BD TFBS试剂盒、BD TFPBS试剂盒或BD Cytofix/cytoperm试剂盒)在4℃-25℃固定细胞15-50分钟。可选地,使用CellCover在4℃进行细胞固定2-5分钟。
步骤2:使用含有400U/mL RNA酶抑制剂的皂苷基(TF透化/洗涤缓冲液,来自BD的Perm III缓冲液)进行细胞透化。
步骤3:使用诱饵寡核苷酸(例如,大小在50bp-100bp之间的1-10个不同的诱饵寡核苷酸)在具有400U/ml RNA酶抑制剂的缓冲液(例如,50-300uL BD透化/洗涤缓冲液)中以5uM-100uM终浓度阻断寡核苷酸结合,在冰上或室温孵育10-20分钟。
步骤4:在50uL-300uL的缓冲液(例如,BD透化/洗涤缓冲液)中用400U/mL的RNA酶抑制剂和诱饵寡核苷酸(例如,1-10个不同的诱饵寡核苷酸,大小在50bp-100bp之间,最终浓度为5uM-100uM)在冰上进行细胞内AbSeq染色30-60分钟。
步骤5:使用含有400U/mLRNA酶抑制剂的BD透化/洗涤缓冲液洗涤细胞。
步骤6:在细胞裂解步骤(向样品缓冲液中加入400U/mL RNA酶抑制剂)之前,按照RhapsodyTM方案进行细胞装载。
步骤7:向裂解缓冲液中加入40U/mL蛋白酶K,并且在装载裂解缓冲液后,在25℃-55℃孵育盒5-15分钟,以进行细胞裂解并将mRNA捕获到RhapsodyTM珠。
步骤8:按照标准方案进行cDNA生成/文库制备/测序,并分析数据。
实施例5.用BD细胞内AbSeq抗体-寡核苷酸进行染色的示例性工作流程
在本实施例中,描述了用于同时测量表面蛋白表达、细胞内蛋白表达和基因表达的工作流程的非限制性示例性实施方案。工作流程可以包括:(i)表面AbSeq染色/洗涤;(ii)固定(例如,CellCover固定);(iii)透化(例如,使用PermIII);(iv)阻断;(v)IC-AbSeq染色/洗涤;(vi)单细胞分析工作流程(如Rhapsody);和/或(viii)用裂解缓冲液(可包含蛋白酶K)裂解约5分钟。该工作流程可以与US2018/0088112、US2018/0346970和WO/2020/037065中描述的用于确定单细胞中的表面蛋白表达谱和样品追踪(例如,追踪样品来源)的工作流程并行使用,这些申请中的每一个的内容通过引用以其整体并入本文。该工作流程可以包括使用BD细胞内AbSeq(IC-AbSeq)抗体对细胞内抗原进行染色,以便用BDRhapsodyTM系统进行谱分析。每个BD IC-AbSeq抗体可以与抗体特异性寡核苷酸条形码缀合,用于一起谱分析表面蛋白和mRNA表达。
材料
试剂、耗材和设备
表2-表4分别提供了可以在工作流程中使用的非限制性示例性试剂、耗材和设备。诱饵寡核苷酸可以重悬于DNA悬浮缓冲液中至1mM浓度的储备液。
表2:示例性试剂
表3:示例性耗材
供应物 供应商 目录号
单通道移液器(20、200、1000μL)+吸头 Major Supplier -
血清移液管(15mL)+吸头 Major Supplier -
细胞过滤器盖 Corning 352235
5mL,12x75mm圆底聚苯乙烯管 Thermo Fisher Scientific FB149563A
Eppendorf 5-mLDNA LoBind管 Eppendorf 0030122348
Eppendorf 1.5-mL蛋白质和DNA LoBind管 Eppendorf 022431021
低滞留过滤移液器吸头 Major Supplier -
无绒拭纸(Kim-Wipes) Major Supplier -
表4:示范性设备
设备 供应商 目录号
温控离心机 Major Supplier -
37℃培养箱/水浴 Major Supplier -
2℃-8℃冰桶 Major Supplier -
样品旋涡器 Major Supplier -
BD RhapsodyTMP1200M移液器 BD -
BDRhapsodyTMP5000M移液器 BD -
大型磁选台+15mL适配器 Major Supplier -
用于1.5mL管的6管磁选架 Major Supplier -
用于1.5-mL管的热块,37℃ Major Supplier -
用于1.5-mL管的热块,80℃ Major Supplier -
细胞过滤器盖 Corning 352235
细胞计数器 Major Supplier -
BD RhapsodyTM扫描仪和/或RhapsodyTM表达系统 BD -
数字计时器 Major Supplier -
程序前要素
工作流程可以包括制备单细胞悬浮液。如果生物样品含有红细胞污染,则工作流程可以包括红细胞裂解。
工作流程可以包括通过向样品缓冲液(例如来自BD RhapsodyTM试剂盒(PN:633731))加入RNA酶抑制剂来产生修饰的样品缓冲液。在一些实施方案中,每个盒需要4mL修饰的样品缓冲液。工作流程可以包括向4mL RhapsodyTM样品缓冲液中加入100μL RNA酶抑制剂,最终浓度为1000单位/mL。工作流程可以包括将溶液放置在冰上。
工作流程可以包括通过混合不含核酸酶的水和BSA(不含脱氧RNA酶和蛋白酶)粉末来制备10%w/v牛血清白蛋白(BSA)储备溶液。工作流程可以包括彻底涡旋以获得均匀的溶液。10% BSA可以储存在-20℃。
工作流程可以包括根据下表5制备IC染色缓冲液[15mL/样品]。首先向不含核酸酶的水中加入10X PBS,然后加入10% BSA,并轻轻混合以获得均匀的溶液。向该溶液中加入10% Tween-20,并轻轻混合。不要过度混合,以免形成气泡。最后,加入RNA酶抑制剂和移液混合物以保持酶的活性。将管放在冰上。
工作流程可以包括分别根据下面的表6-表7制备细胞水合和诱饵阻断缓冲液,并放置在冰上。
缓冲液
在一些实施方案中,表中所示的量足以缓冲1个盒。
表5:IC染色缓冲液
IC染色缓冲液 量(mL) 最终浓度
10X PBS 1.5 1X
10%BSA 4.5 3.00%
10%Tween20 0.15 0.10%
RNA酶抑制剂(40U/μl) 0.15 0.4U/μl
无核酸酶水 8.7
总计 15
表6:细胞水合缓冲液
细胞水合缓冲液 量(μl) 最终浓度
10X PBS 150 1X
10%BSA 450 3.00%
10%Tween20 1.5 0.10%
RNA酶抑制剂(40U/μl) 37.5 1U/μl
无核酸酶水 1252.5
总计 1500
表7:诱饵阻断缓冲液
程序
工作流程可以包括下面提供的一个或更多个步骤。下面列出的试剂和设备的合适替代物是本领域技术人员已知的,并且本文也提供了这些替代物。在一些实施方案中,用户执行包括样品索引和/或表面蛋白谱分析的方案,直到洗涤标记的细胞,并且然后继续下面的方案。
在该工作流程的一些实施方案中,预期的总细胞装载在20,000至100万个单细胞之间。
细胞的固定和透化
表面染色的细胞可以用BD染色缓冲液洗涤三次,小心去除残留的上清液。然后,细胞沉淀可准备用于固定、透化和细胞内染色,如下描述:
步骤1:轻轻敲击工作台上的管以打碎细胞沉淀,向细胞沉淀中加入1mL冷固定剂(例如CellCover(CC))并轻轻移液混合。
步骤2:如果细胞还没有在非DNA LoBind 1.5-mL微量离心管中,此时转移它们。在一些实施方案中,避免使用DNA LoBind管进行固定和透化步骤。
步骤3:将细胞在冰上固定5分钟。
步骤4:使用摆桶离心机,在4℃以800×g离心5分钟沉淀细胞。小心地去除并适当丢弃上清液,不要干扰沉淀。
步骤5:轻轻敲击工作台上的管,打碎细胞颗粒。
步骤6:在缓慢涡旋细胞的同时,逐滴地加入1mL冰冷的透化剂(例如,BD PermIII缓冲液)。涡旋可以防止细胞多重态。
步骤7:在冰上透化细胞20min。在一些实施方案中,在该孵育期间,工作流程包括制备2X BD IC-AbSeq主混合物,如下表8所示。
步骤8:使用摆桶离心机,在4℃以800×g离心5分钟沉淀细胞。
步骤9:在不干扰沉淀的情况下,用移液管尽可能多地去除PermIII缓冲液。
步骤10:轻轻敲击管以打碎细胞沉淀,并加入1mL细胞水合缓冲液,用移液管混合5-10次。
在4℃以800×g离心5分钟。继续“用BD IC-AbSeq Ab-寡核苷酸标记细胞”的步骤1。
用BD IC-AbSeq Ab-寡核苷酸标记细胞
步骤1:通过将表8中的以下试剂移液到新的1.5mL DNA LoBind管中,制备2X BDIC-AbSeq主混合物。表9-表10是示例性制品。
表8:2X BD IC-AbSeq标记主混合物
表9:10plex 2X BD IC-AbSeq标记主混合物的示例
表10:用细胞多重化试剂盒10plex 2X BD IC-AbSeq标记主混合物的示例
向每个含有20μL样品标签的样品标签管中加入80.0μL 2X AbSeq标记主混合物。
在一些实施方案中,工作流程包括:(i)在每次实验前产生新汇集的抗体;和/或(ii)创建超额30%的池,以确保有足够的体积用于标记。在一些实施方案中,试剂是粘性的,并且容易形成气泡。
在一些实施方案中,对于高plex通道,工作流程包括使用8通道螺旋盖管封盖器和多通道移液管将BD AbSeq Ab-寡核苷酸移液到8管排中。离心管排,并将2X BD AbSeq Ab-寡核苷酸汇集到1.5mL DNA LoBind管中。
步骤2:用移液管混合,并放在冰上。
步骤3:小心地从样品管中取出并适当丢弃上清液,并轻轻敲击以打碎细胞沉淀。
步骤4:用100μL诱饵阻断缓冲液重悬细胞。
步骤5:将悬浮液转移到5mL圆底管中,并在冰上孵育10分钟。
步骤6:向含有100μL细胞悬浮液加诱饵缓冲液的5ml管中加入100μL 2X BD IC-AbSeq主混合物,制成最终体积为200uL的细胞染色混合物。用移液器充分混合,并在冰上孵育30分钟。
在一些实施方案中,在该孵育期间,对盒(例如,BD RhapsodyTM盒)进行引发和处理。保存在室温。
步骤7:向标记的细胞中加入3mL IC染色缓冲液,并用移液管混合。
步骤8:使用摆桶离心机,在4℃以800×g离心5分钟沉淀细胞。
步骤9:打开管盖并倒置,将上清液倒入生物危险废物中。保持管倒置,并用无绒拭纸温和地吸干,以去除管残留的上清液。
步骤10:向细胞沉淀中加入3mL IC染色缓冲液,并通过移液管混合重悬进行第一次洗涤。
步骤11:使用摆桶离心机,在4℃以800×g离心5分钟。
步骤12:打开管盖并倒置,将上清液倒入生物危险废物中。保持管倒置,并用无绒拭纸温和地吸干,以去除管残留的上清液。
步骤13:(任选)重复步骤10-12,总共洗涤2-3次。
步骤14:将沉淀重新悬浮在620μL冷的修饰的样品缓冲液(含有1U/μL RNA酶抑制剂)中,并转移到新的1.5mL DNA LoBind管中。
步骤15:加入3.1μl的DyeCycle Green对细胞进行染色,用移液管充分混合并在避光的情况下在冰上孵育5分钟。
步骤16:通过带有例如细胞过滤器盖的Falcon管过滤细胞(Corning目录号352235)。
步骤17:通过轻轻地将10μL细胞液移到例如INCYTO一次性血细胞计数器(INCYTO目录号DHCN01-5)中,立即计数细胞(例如,使用BD RhapsodyTM扫描仪)。在一些实施方案中,由于这些是被固定的细胞,细胞活力不适用。在一些实施方案中,对于低丰度样品(<20,000),将细胞重新悬浮在200μL冷的修饰的样品缓冲液(含有1U/μL RNA酶抑制剂)中。
步骤18:将细胞放置在冰上。在一些实施方案中,工作流程可以包括继续进行如本文描述的单细胞捕获和cDNA合成(例如,使用BD RhapsodyTM单细胞分析系统)。在一些这样的实施方案中,工作流程可以包括以下修改:
(a):用本方案中制备的冷的修饰的样本缓冲液(添加1U/μL RNA酶抑制剂)替换BD样品缓冲液。这可以提高RNA产量。
(b):使用含有DTT和蛋白酶K的裂解缓冲液进行裂解步骤,
(b)(i):就在裂解步骤之前,取1mL含有DTT的RhapsodyTM裂解缓冲液,并向其中加入蛋白酶K(40单位/mL,加入50μL/mL)。每盒制备1mL。放置在冰上。
(b)(ii):将裂解时间从2min增加到5min。
(b)(iii):在取回步骤中使用含有DTT的常规BD裂解缓冲液。
术语
在至少一些先前描述的实施方案中,一种实施方案中使用的一个或更多个要素可以互换地用于另一种实施方案中,除非这种替换在技术上不可行。本领域技术人员将理解,在不脱离所要求保护的主题的范围的情况下,可以对上述方法和结构进行各种其他的省略、添加和修改。所有此类修改和改变都旨在落在由所附权利要求书限定的主题的范围内。
关于本文中使用基本上任何复数和/或单数术语,在对于上下文和/或应用适当的情况下,本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文明确阐述各种单数/复数排列。如本说明书和所附权利要求书中使用的,单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数指代物,除非上下文另外明确指示。除非另外说明,否则在本文中对“或”的任何提及旨在涵盖“和/或”。
本领域技术人员将理解,通常,本文使用的术语,并且特别是所附权利要求书(例如,所附权利要求书的主体)中的术语,通常旨在作为“开放性的”术语(例如,术语“包括/包含(including)”应解释为“包括但不限于(including but not limited to)”,术语“具有(having)”应解释为“具有至少(having at least)”,术语“包括/包含(includes)”应解释为“包括但不限于(includes but is not limited to)”等)。本领域技术人员将进一步理解,如果意图所介绍的权利要求陈述中的特定数字,则这样的意图将明确地陈述于权利要求中,并且在这种陈述不存在的情况下,不存在这种意图。例如,作为对理解的帮助,以下所附权利要求书可以包含介绍性措辞“至少一种”和“一种或更多种”的使用,以介绍权利要求陈述。然而,此类措辞的使用不应解读为意味着由不定冠词“一(a)”或“一(an)”介绍权利要求陈述会将任何包含此类介绍的权利要求陈述的具体权利要求限制到包含仅一种此类陈述的实施方案,甚至当同一权利要求包括介绍性措辞“一种或更多种”或“至少一种”以及不定冠词诸如“一(a)”或“一(an)”时也是如此(例如,“一(a)”和/或“一(an)”应解释为意指“至少一种”或“一种或更多种”);这对于使用定冠词来介绍权利要求陈述同样适用。此外,即使明确地陈述了介绍的权利要求陈述的特定数字,本领域技术人员将认识到,此类陈述应解释为意指至少所陈述的数字(例如,仅陈述“两种陈述”而没有其他修饰词意指至少两种陈述或两种或更多种陈述)。此外,在使用类似于“A、B和C等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有A、B和C中的至少一种的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。在使用类似于“A、B或C等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有A、B或C中的至少一种的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。本领域技术人员将进一步理解,实际上,无论在说明书、权利要求书还是在附图中,呈现两个或更多个替代术语的任何分离性词语和/或措辞应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”应被理解为包括“A”或“B”或“A和B”的可能性。
此外,当本公开内容的特征或方面以马库什组(Markush group)描述时,本领域技术人员将意识到,本公开内容还由此以马库什组的任何个体成员或成员子组描述。
如本领域技术人员将理解的,出于任何和所有目的,诸如在提供书面描述方面,本文公开的所有范围还涵盖该范围的任何和所有可能的子范围和子范围的组合。任何列出的范围都可以很容易地被识别为充分描述并使相同的范围能被分解为至少相等的一半、三分之一、四分之一、五分之一、十分之一等。作为非限制性实例,本文讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,所有语言,诸如“多达”、“至少”、“大于”、“小于”等包括所陈述的数字,并且指可以随后分解为如上文讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个单独的成员。因此,例如,具有1-3个物品的组是指具有1个、2个或3个物品的组。类似地,具有1-5个物品的组是指具有1个、2个、3个、4个或5个物品的组,等等。
尽管本文已经公开了各种方面和实施方案,但其他方面和实施方案对本领域技术人员将是明显的。本文公开的各种方面和实施方案用于说明的目的而并不旨在限制,真正范围和精神由以下权利要求指出。

Claims (89)

1.一种用于检测细胞中蛋白质靶表达和核酸靶拷贝数的方法,所述方法包括:
使各自包含多于一种蛋白质靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定;
使所述多于一个细胞透化;
使所述多于一个细胞与包含能够与所述一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸的阻断试剂接触;
使多于一种蛋白质靶结合试剂与所述多于一个细胞接触,其中所述多于一种蛋白质靶结合试剂中的每一种包含蛋白质靶结合试剂特异性寡核苷酸,所述蛋白质靶结合试剂特异性寡核苷酸包含用于所述蛋白质靶结合试剂特异性寡核苷酸的独特蛋白质靶标识符,并且其中所述蛋白质靶结合试剂能够与所述多于一种蛋白质靶中的至少一种特异性结合;
将与所述蛋白质靶结合试剂关联的多于一个细胞分区至多于一个分区,其中所述多于一个分区中的分区包含来自与所述蛋白质靶结合试剂关联的多于一个细胞的单细胞;
在包含所述单细胞的分区中,使多于一种寡核苷酸条形码与所述核酸靶的拷贝和所述蛋白质靶结合试剂特异性寡核苷酸接触进行杂交,其中所述寡核苷酸条形码各自包含第一分子标记;
使与所述蛋白质靶结合试剂特异性寡核苷酸杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸,所述多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸各自包含与所述独特蛋白质靶标识符序列的至少一部分互补的序列和所述第一分子标记;
使与所述核酸靶的拷贝杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与所述核酸靶的至少一部分互补的序列和所述第一分子标记;
获得所述多于一种条形码化核酸分子或其产物的序列信息,以确定所述多于一个细胞中的一个或更多个中所述核酸靶的拷贝数;以及
获得所述多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或其产物的序列信息以确定所述多于一个细胞中的一个或更多个中所述多于一种蛋白质靶中的至少一种蛋白质靶的存在。
2.根据权利要求1所述的方法,其中所述多于一种蛋白质靶包括细胞表面蛋白质靶、细胞内蛋白质靶或其组合。
3.根据权利要求2所述的方法,其中获得所述多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或其产物的序列信息以确定所述多于一个细胞中的一个或更多个中的所述多于一种蛋白质靶中的至少一个蛋白质靶的存在,包括确定所述多于一个细胞中的一个或更多个中所述多于一种蛋白质靶中的至少一个蛋白质靶的存在。
4.一种用于测量细胞中细胞内靶表达和核酸靶的拷贝数的方法,所述方法包括:
使各自包含多于一种细胞内靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定;
使所述多于一个细胞透化;
使所述多于一个细胞与包含能够与所述一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸的阻断试剂接触;
使多于一种细胞内靶结合试剂与所述多于一个细胞接触,其中所述多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,所述细胞内靶结合试剂特异性寡核苷酸包含用于所述细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中所述细胞内靶结合试剂能够与所述多于一种细胞内靶中的至少一种特异性结合;
将与所述细胞内靶结合试剂关联的多于一个细胞分区至多于一个分区,其中所述多于一个分区中的分区包含来自与所述细胞内靶结合试剂关联的多于一个细胞的单细胞;
在包含所述单细胞的分区中,使多于一种寡核苷酸条形码与所述核酸靶的拷贝和所述细胞内靶结合试剂特异性寡核苷酸接触进行杂交,其中所述寡核苷酸条形码各自包含第一分子标记;
使与所述细胞内靶结合试剂特异性寡核苷酸杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞内靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸各自包含与所述独特细胞内靶标识符序列的至少一部分互补的序列和所述第一分子标记;
使与所述核酸靶的拷贝杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与所述核酸靶的至少一部分互补的序列和所述第一分子标记;
获得所述多于一种条形码化核酸分子或其产物的序列信息,以确定所述多于一个细胞中的一个或更多个中所述核酸靶的拷贝数;以及
获得所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定所述多于一个细胞中的一个或更多个中所述多于一种细胞内靶中的至少一种细胞内靶的拷贝数。
5.一种用于测量细胞中细胞内靶表达、细胞表面靶表达和核酸靶的拷贝数的方法,所述方法包括:
使包含多于一种细胞内靶、多于一种细胞表面靶、核酸靶的拷贝和一种或更多种非靶核酸的多于一个细胞固定;
使所述多于一个细胞透化;
使所述多于一个细胞与包含能够与所述一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸的阻断试剂接触;
使多于一种细胞内靶结合试剂与所述多于一个细胞接触,其中所述多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,所述细胞内靶结合试剂特异性寡核苷酸包含用于所述细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中所述细胞内靶结合试剂能够与所述多于一种细胞内靶中的至少一种特异性结合;
使多于一种细胞表面靶结合试剂和与所述细胞内靶结合试剂关联的多于一个细胞接触,其中所述多于一种细胞表面靶结合试剂中的每一种包含细胞表面靶结合试剂特异性寡核苷酸,所述细胞表面靶结合试剂特异性寡核苷酸包含用于所述细胞表面靶结合试剂特异性寡核苷酸的独特细胞表面靶标识符,并且其中所述细胞表面靶结合试剂能够与所述多于一种细胞表面靶中的至少一种特异性结合;
将与所述细胞内靶结合试剂和所述细胞表面靶结合试剂关联的多于一个细胞分区至多于一个分区,其中所述多于一个分区中的分区包含来自与所述细胞内靶结合试剂和所述细胞表面靶结合试剂关联的多于一个细胞的单细胞;
在包含所述单细胞的分区中,使多于一种寡核苷酸条形码与所述细胞表面靶结合试剂特异性寡核苷酸和所述细胞内靶结合试剂特异性寡核苷酸和所述核酸靶的拷贝接触进行杂交,其中所述寡核苷酸条形码各自包含第一分子标记;
使与所述细胞内靶结合试剂特异性寡核苷酸杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞内靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸各自包含与所述独特细胞内靶标识符序列的至少一部分互补的序列和所述第一分子标记;
使与所述细胞表面靶结合试剂特异性寡核苷酸杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸,所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸各自包含与所述独特细胞表面靶标识符序列的至少一部分互补的序列和所述第一分子标记;
使与所述核酸靶的拷贝杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与所述核酸靶的至少一部分互补的序列和所述第一分子标记;
获得所述多于一种条形码化核酸分子或其产物的序列信息,以确定所述多于一个细胞中的一个或更多个中所述核酸靶的拷贝数;
获得所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定所述多于一个细胞中的一个或更多个中所述多于一种细胞表面靶中的至少一种细胞表面靶的拷贝数;以及
获得所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的序列信息,以确定所述多于一个细胞中的一个或更多个中所述多于一种细胞内靶中的至少一种细胞内靶的拷贝数。
6.根据权利要求1-5中任一项所述的方法,其中将所述多于一个细胞与阻断试剂接触是在使所述多于一个细胞固定和透化的同时或之后。
7.根据权利要求1-6中任一项所述的方法,其中所述多于一种诱饵寡核苷酸中的每一种能够与非靶核酸的至少一部分杂交。
8.根据权利要求1-6中任一项所述的方法,其中所述诱饵寡核苷酸包含与非靶核酸的至少一部分互补的序列。
9.根据权利要求1-8中任一项所述的方法,其中所述诱饵寡核苷酸包含与所述蛋白质靶结合试剂特异性寡核苷酸或所述细胞内靶结合试剂特异性寡核苷酸的序列相同或基本相似的序列。
10.根据权利要求9所述的方法,其中所述序列的长度为3-40个核苷酸。
11.根据权利要求1-10中任一项所述的方法,其中所述诱饵寡核苷酸与所述蛋白质靶结合试剂特异性寡核苷酸或所述细胞内靶结合试剂特异性寡核苷酸具有至多50%的序列同一性。
12.根据权利要求1-11中任一项所述的方法,其中所述诱饵寡核苷酸不包含UMI。
13.根据权利要求1-11中任一项所述的方法,其中所述诱饵寡核苷酸包含随机序列,并且任选地,所述随机序列的长度为约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸。
14.根据权利要求1-13中任一项所述的方法,其中所述诱饵寡核苷酸不包含具有多于4个、5个、6个或7个连续T或A的任何序列。
15.根据权利要求1-14中任一项所述的方法,其中所述诱饵寡核苷酸在每4个、5个、6个或7个连续的核苷酸中包含至少一个G或C。
16.根据权利要求1-15中任一项所述的方法,其中所述诱饵寡核苷酸包含一种或更多种修饰的核苷酸。
17.根据权利要求1-16中任一项所述的方法,其中所述诱饵寡核苷酸包含5’修饰,并且任选地所述5’修饰包含5’氨基修饰物C12修饰(5AmMC12)。
18.根据权利要求1-17中任一项所述的方法,其中所述诱饵寡核苷酸包含3’修饰,并且任选所述3’修饰包含3’双脱氧-C修饰(ddC)。
19.根据权利要求1-18中任一项所述的方法,其中所述诱饵寡核苷酸包含能够减少或阻止所述诱饵寡核苷酸的聚合酶延伸的一种或更多种3’修饰,任选地一种或更多种延伸阻断剂,还任选地所述一种或更多种延伸阻断剂包括:
一个或更多个硝基吲哚、一个或更多个肌苷、一个或更多个吖啶、一个或更多个2-氨基嘌呤、一个或更多个2-6-二氨基嘌呤、一个或更多个5-溴脱氧尿苷、一个或更多个反向胸苷(反向dT)、一个或更多个反向双脱氧胸苷(ddT)、一个或更多个双脱氧胞苷(ddC)、一个或更多个5-甲基胞苷、、一个或更多个5-羟甲基胞苷、一个或更多个2’-O-甲基RNA碱基、一个或更多个未甲基化RNA碱基、一个或更多个异脱氧胞苷(Iso-dC)、一个或更多个异脱氧鸟苷(Iso-dG)、一个或更多个C3(OC3H6OPO3)基团、一个或更多个可光裂解(PC)[OC3H6-C(o)NHCH2-C6H3NO2-CH(CH3)OPO3]基团、一个或更多个己二醇基团、一个或更多个spacer 9(iSp9)[(OCH2CH2)3OPO3]基团、一个或更多个spacer 18(iSp18)[(OCH2CH2)6OPO3]基团、一个或更多个2’-O-甲基(2’OM)RNA核苷酸、一个或更多个无碱基位点、一个或更多个稳定的无碱基位点、一个或更多个化学捕获的无碱基位点或其任何组合。
20.根据权利要求1-19中任一项所述的方法,其中所述寡核苷酸的长度为30个至65个核苷酸。
21.根据权利要求1-20中任一项所述的方法,其中在包含所述单细胞的分区中,使所述单细胞在15℃-65℃与裂解缓冲液接触以裂解所述单细胞,其中所述裂解缓冲液包含能够解离蛋白质-核酸复合体的剂。
22.根据权利要求1-21中任一项所述的方法,其中所述核酸靶是RNA。
23.根据权利要求1-21中任一项所述的方法,其中所述核酸靶是mRNA。
24.根据权利要求1-23中任一项所述的方法,其中使所述多于一个细胞固定包括使所述多于一个细胞与固定剂接触。
25.根据权利要求24所述的方法,其中所述固定剂包括非交联固定剂,任选地所述非交联固定剂包括甲醇。
26.根据权利要求24所述的方法,其中所述固定剂包括交联剂。
27.根据权利要求26所述的方法,其中所述交联剂包括可裂解交联剂。
28.根据权利要求27所述的方法,其中所述可裂解交联剂包括以下或衍生自以下:二硫代双(琥珀酰亚胺基丙酸酯)(DSP)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。
29.根据权利要求27所述的方法,其中所述可裂解交联剂包含选自由以下组成的组的可裂解连接:化学可裂解连接、光可裂解连接、酸不稳定接头、热敏感性连接、酶促可裂解连接和其组合。
30.根据权利要求27所述的方法,其中所述可裂解交联剂是硫醇可裂解交联剂或包含二硫化物接头。
31.根据权利要求24所述的方法,其中所述固定剂包含多聚甲醛(PFA)、二硫代双(琥珀酰亚胺基丙酸酯(DSP)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、CellCover或其组合。
32.根据权利要求1-31中任一项所述的方法,其中使所述多于一个细胞固定和使所述多于一个细胞透化是同时进行的。
33.根据权利要求32所述的方法,其中使所述多于一个细胞的固定和透化在存在能够使所述多于一个细胞固定和透化的双重功能剂的情况下进行。
34.根据权利要求33所述的方法,其中所述双重功能剂是甲醇。
35.根据权利要求1-34中任一项所述的方法,其中使所述多于一个细胞透化包括使所述多于一个细胞与透化剂接触。
36.根据权利要求1-35中任一项所述的方法,包括在使所述多于一种蛋白质靶结合试剂或所述多于一个细胞内靶结合试剂与所述多于一个细胞接触之后,从与所述多于一种蛋白质靶结合试剂或所述多于一个细胞内靶结合试剂关联的所述多于一个细胞中去除所述透化剂。
37.根据权利要求1-36中任一项所述的方法,其中所述透化剂能够(i)使所述多于一个细胞的细胞膜透化,(ii)使细胞膜对所述蛋白质靶结合试剂或所述细胞内靶结合试剂或两者都可渗透。
38.根据权利要求1-37中任一项所述的方法,其中所述透化剂包括(i)溶剂、去污剂或表面活性剂;(ii)BD Cytoperm;(iii)皂苷或其衍生物;(iv)Triton X-100,(v)甲醇或其衍生物,和/或(vi)毛地黄皂苷或其衍生物。
39.根据权利要求1-38中任一项所述的方法,其中能够解离蛋白质-核酸复合体的剂包含广谱丝氨酸蛋白酶。
40.根据权利要求39所述的方法,其中所述广谱丝氨酸蛋白酶是蛋白酶K。
41.根据权利要求1-40中任一项所述的方法,其中所述裂解缓冲液包含解固定剂。
42.根据权利要求41所述的方法,其中所述解固定剂包括硫醇、羟胺、高碘酸盐、碱或其任何组合。
43.根据权利要求1-40中任一项所述的方法,其中所述裂解缓冲液包括DTT。
44.根据权利要求1-43中任一项所述的方法,所述方法包括使所述单细胞的固定逆转。
45.根据权利要求44所述的方法,其中使所述单细胞的固定逆转包括UV光裂解、化学处理、加热、酶处理或其任何组合。
46.根据权利要求1-45中任一项所述的方法,其中使所述单细胞与所述裂解缓冲液在25℃-55℃接触。
47.根据权利要求1-46中任一项所述的方法,其中使所述单细胞与所述裂解缓冲液接触还包括使所述单细胞与去污剂接触、改变pH或其任何组合。
48.根据权利要求1-47中任一项所述的方法,其中所述多于一种寡核苷酸条形码与固体支持物关联,并且其中所述多于一个分区中的分区包含单个固体支持物。
49.根据权利要求1-48中任一项所述的方法,其中所述分区是孔或液滴。
50.根据权利要求1-49中任一项所述的方法,其中每种寡核苷酸条形码包含第一通用序列。
51.根据权利要求1-50中任一项所述的方法,其中所述寡核苷酸条形码包含靶结合区,所述靶结合区包含捕获序列,任选地所述靶结合区包含多(dT)区,还任选地与所述捕获序列互补的序列包含多(dA)区。
52.根据权利要求51所述的方法,其中所述蛋白质靶结合试剂特异性寡核苷酸或所述细胞内靶结合试剂特异性寡核苷酸包含与配置为捕获所述蛋白质靶结合试剂特异性寡核苷酸或所述细胞内靶结合试剂特异性寡核苷酸的捕获序列互补的序列,任选地,所述细胞表面靶结合试剂特异性寡核苷酸包含与配置为捕获所述细胞表面靶结合试剂特异性寡核苷酸的捕获序列互补的序列。
53.根据权利要求1-52中任一项所述的方法,其中所述多于一种条形码化蛋白质靶结合试剂特异性寡核苷酸或所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸包含所述第一通用序列的互补物。
54.根据权利要求1-53中任一项所述的方法,其中所述蛋白质靶结合试剂特异性寡核苷酸或所述细胞内靶结合试剂特异性寡核苷酸包含第二通用序列和/或第二分子标记。
55.根据权利要求1-53中任一项所述的方法,其中所述阻断试剂包含能够与所述细胞内靶结合试剂特异性寡核苷酸的至少一部分杂交的多于一种寡核苷酸。
56.根据权利要求55所述的方法,其中所述多于一种寡核苷酸中的每一种包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的序列的一部分互补的序列。
57.根据权利要求55-56中任一项所述的方法,其中所述多于一种寡核苷酸各自包含随机序列,所述随机序列具有与所述细胞内靶结合试剂特异性寡核苷酸或所述蛋白质靶结合试剂特异性寡核苷酸的一种或更多种的所述第二分子标记基本相同的长度。
58.根据权利要求1-57中任一项所述的方法,其中所述多于一种寡核苷酸中的每一种包含与蛋白质靶结合试剂特异性寡核苷酸或细胞内靶结合试剂特异性寡核苷酸的序列的一部分互补的序列。
59.根据权利要求1-58中任一项所述的方法,其中所述多于一种寡核苷酸各自包含随机序列,所述随机序列具有与所述细胞内靶结合试剂特异性寡核苷酸或所述蛋白质靶结合试剂特异性寡核苷酸的一种或更多种的所述第二分子标记基本相同的长度。
60.根据权利要求1-59中任一项所述的方法,其中获得所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的序列信息包括:
使用能够与所述第一通用序列或其互补物杂交的引物和能够与所述第二通用序列或其互补物杂交的引物,扩增所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞内靶结合试剂特异性寡核苷酸;以及
获得所述多于一种扩增的条形码化细胞内靶结合试剂特异性寡核苷酸或其产物的测序数据。
61.根据权利要求1-60中任一项所述的方法,其中所述多于一种细胞内靶结合试剂特异性寡核苷酸中的至少10种包含不同的第二分子标记序列,任选地(i)至少两种细胞内靶结合试剂特异性寡核苷酸的所述第二分子标记序列不同,并且其中所述至少两种细胞内靶结合试剂特异性寡核苷酸的所述独特细胞内靶标识符序列相同;或者(ii)至少两种细胞内靶结合试剂特异性寡核苷酸的所述第二分子标记序列不同,并且其中所述至少两种细胞内靶结合试剂特异性寡核苷酸的所述独特细胞内靶标识符序列不同。
62.根据权利要求1-61中任一项所述的方法,其中所述测序数据中与用于能够与至少一种细胞内靶特异性结合的细胞内靶结合试剂的所述独特细胞内靶标识符序列关联的独特第一分子标记序列的数目指示所述多于一个细胞中的一个或更多个中至少一种细胞内靶的拷贝数。
63.根据权利要求1-62中任一项所述的方法,其中所述测序数据中与用于能够与至少一种细胞内靶特异性结合的细胞内靶结合试剂的所述独特细胞内靶标识符序列关联的独特第二分子标记序列的数目指示所述多于一个细胞中的一个或更多个中至少一种细胞内靶的拷贝数。
64.根据权利要求1-63中任一项所述的方法,其中获得所述序列信息包括将测序衔接子附接到所述多于一种条形码化细胞内靶结合试剂特异性寡核苷酸或其产物。
65.根据权利要求1-64中任一项所述的方法,其中所述细胞内靶包含:(i)细胞内蛋白质靶;(ii)糖类、脂质、蛋白质、肿瘤抗原或其任何组合;和/或(iii)细胞内的靶。
66.根据权利要求1-65中任一项所述的方法,其中所述细胞内靶结合试剂特异性寡核苷酸(i)不包含分子标记;(ii)包含双链RNA或双链DNA;(iii)包含少于约110个核苷酸、约90个核苷酸、约75个核苷酸或约50个核苷酸的长度;和/或(iv)包含少于约四个CpG二核苷酸。
67.根据权利要求1-66中任一项所述的方法,其中确定所述多于一个细胞中的一个或更多个中所述核酸靶的拷贝数包括基于与所述多于一种条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、其互补物或其组合的数目来确定所述多于一个细胞中所述核酸靶的拷贝数。
68.根据权利要求1-67中任一项所述的方法,其中所述核酸靶包括核酸分子,任选地所述核酸分子包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸或其任何组合。
69.根据权利要求1-68中任一项所述的方法,其中所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸包含所述第一通用序列的互补物,其中所述细胞表面靶结合试剂特异性寡核苷酸包含第四通用序列,并且其中获得所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的序列信息包括:
使用能够与所述第一通用序列或其互补物杂交的引物和能够与所述第四通用序列或其互补物杂交的引物,扩增所述多于一种条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞表面靶结合试剂特异性寡核苷酸;以及
获得所述多于一种扩增的条形码化细胞表面靶结合试剂特异性寡核苷酸或其产物的测序数据。
70.根据权利要求1-69中任一项所述的方法,其中使所述多于一种寡核苷酸条形码延伸包括使用逆转录酶和/或缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中至少一种的DNA聚合酶使所述多于一种寡核苷酸条形码延伸,任选地所述DNA聚合酶包括Klenow片段,任选地所述逆转录酶包括病毒逆转录酶,任选地其中所述病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。
71.根据权利要求1-70中任一项所述的方法,其中(i)所述第一通用序列、所述第二通用序列、所述第三通用序列和/或所述第四通用序列相同;和/或(ii)所述第一通用序列、所述第二通用序列、所述第三通用序列和/或所述第四通用序列不同。
72.根据权利要求1-71中任一项所述的方法,其中所述第一通用序列、所述第二通用序列、所述第三通用序列和/或所述第四通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分,任选地所述测序衔接子包含P5序列、P7序列、其互补序列和/或其部分,还任选地其中所述测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。
73.根据权利要求1-72中任一项所述的方法,其中所述多于一种寡核苷酸条形码中的至少10种包含不同的第一分子标记序列。
74.根据权利要求1-73中任一项所述的方法,其中所述多于一种寡核苷酸条形码各自包含细胞标记,任选地所述多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸,还任选地与同一固体支持物关联的寡核苷酸条形码包含相同的细胞标记,任选地与不同固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
75.根据权利要求48-74中任一项所述的方法,其中所述固体支持物包括合成颗粒或平坦表面,任选地所述合成颗粒是可破坏的,并且还任选地所述合成颗粒包括可破坏的水凝胶颗粒。
76.根据权利要求75所述的方法,其中所述多于一种寡核苷酸条形码中的至少一种被固定在所述合成颗粒上、部分地固定在所述合成颗粒上、包封在所述合成颗粒中或部分地包封在所述合成颗粒中。
77.根据权利要求75-76中任一项所述的方法,其中所述合成颗粒包括珠,任选地所述珠包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。
78.根据权利要求75-77中任一项所述的方法,其中所述合成颗粒包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合。
79.根据权利要求1-78中任一项所述的方法,其中所述多于一个细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
80.一种试剂盒,所述试剂盒包含:
多于一种细胞内靶结合试剂,其中所述多于一种细胞内靶结合试剂中的每一种包含细胞内靶结合试剂特异性寡核苷酸,所述细胞内靶结合试剂特异性寡核苷酸包含用于所述细胞内靶结合试剂特异性寡核苷酸的独特细胞内靶标识符,并且其中所述细胞内靶结合试剂能够与细胞中的至少一种细胞内靶特异性结合;
多于一种寡核苷酸条形码,其中所述多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中所述多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;
固定剂;
裂解缓冲液;和/或
阻断试剂,其中所述阻断试剂包含(a)能够与所述细胞内靶结合试剂特异性寡核苷酸的至少一部分杂交的多于一种寡核苷酸,(b)包含能够与所述一种或更多种非靶核酸中的至少一种杂交的多于一种诱饵寡核苷酸,或两者。
81.根据权利要求80所述的试剂盒,还包含能够解离蛋白质-核酸复合体的剂,并且任选地,所述裂解缓冲液包含能够解离蛋白质-核酸复合体的所述剂。
82.根据权利要求80-81中任一项所述的试剂盒,其中能够解离蛋白质-核酸复合体的所述剂包含蛋白酶K。
83.根据权利要求80-82中任一项所述的试剂盒,其中所述固定剂包括以下或衍生自以下:二硫代双(琥珀酰亚胺基丙酸酯)(DSP)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。
84.根据权利要求80-83中任一项所述的试剂盒,还包含透化剂,任选地所述透化剂是溶剂、去污剂或表面活性剂或包含溶剂、去污剂或表面活性剂,并且还任选地所述透化剂是皂苷、毛地黄皂苷、其衍生物或其任何组合或包含皂苷、毛地黄皂苷、其衍生物或其任何组合。
85.根据权利要求80-84中任一项所述的试剂盒,所述试剂盒包含缓冲液、盒、一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂或其组合。
86.根据权利要求80-85中任一项所述的试剂盒,其中所述靶结合区包括基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。
87.根据权利要求80-86中任一项所述的试剂盒,其中所述寡核苷酸条形码包含相同的样品标记和/或相同的细胞标记。
88.根据权利要求80-87中任一项所述的试剂盒,其中所述多于一种寡核苷酸条形码的每一种样品标记、细胞标记、和/或分子标记包含至少6个核苷酸。
89.根据权利要求80-88中任一项所述的试剂盒,其中所述多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在合成颗粒上;和/或所述多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在合成颗粒中,任选地所述合成颗粒是可破坏的。
CN202280073721.8A 2021-08-31 2022-08-30 诱饵多核苷酸在单细胞多组学中的应用 Pending CN118510907A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163239367P 2021-08-31 2021-08-31
US63/239,367 2021-08-31
PCT/US2022/075656 WO2023034790A1 (en) 2021-08-31 2022-08-30 Use of decoy polynucleotides in single cell multiomics

Publications (1)

Publication Number Publication Date
CN118510907A true CN118510907A (zh) 2024-08-16

Family

ID=84360852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280073721.8A Pending CN118510907A (zh) 2021-08-31 2022-08-30 诱饵多核苷酸在单细胞多组学中的应用

Country Status (4)

Country Link
US (1) US20240287591A1 (zh)
EP (1) EP4396368A1 (zh)
CN (1) CN118510907A (zh)
WO (1) WO2023034790A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
KR102363716B1 (ko) 2016-09-26 2022-02-18 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
EP3635135A1 (en) 2017-06-05 2020-04-15 Becton, Dickinson and Company Sample indexing for single cells
CN113454234A (zh) 2019-02-14 2021-09-28 贝克顿迪金森公司 杂合体靶向和全转录物组扩增
WO2021016239A1 (en) 2019-07-22 2021-01-28 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6531283B1 (en) 2000-06-20 2003-03-11 Molecular Staging, Inc. Protein expression profiling
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
GB201011971D0 (en) * 2010-07-15 2010-09-01 Olink Ab Methods and product
KR102536833B1 (ko) 2013-08-28 2023-05-26 벡톤 디킨슨 앤드 컴퍼니 대량의 동시 단일 세포 분석
KR102363716B1 (ko) 2016-09-26 2022-02-18 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
EP3635135A1 (en) 2017-06-05 2020-04-15 Becton, Dickinson and Company Sample indexing for single cells
JP2021533781A (ja) 2018-08-17 2021-12-09 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company アプタマーバーコーディング
CN115279919A (zh) 2020-01-13 2022-11-01 贝克顿迪金森公司 使用含有du的寡核苷酸的细胞捕获
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
CN115087746A (zh) * 2020-02-12 2022-09-20 贝克顿迪金森公司 细胞内AbSeq

Also Published As

Publication number Publication date
EP4396368A1 (en) 2024-07-10
WO2023034790A1 (en) 2023-03-09
US20240287591A1 (en) 2024-08-29

Similar Documents

Publication Publication Date Title
CN113574178B (zh) 与抗体关联的寡核苷酸
US20210246492A1 (en) Intracellular abseq
US11649497B2 (en) Methods and compositions for quantitation of proteins and RNA
CN112805389B (zh) 确定5’转录物序列
US20210214770A1 (en) Cell capture using du-containing oligonucleotides
EP3837378B1 (en) Aptamer barcoding
CN110719959B (zh) 针对单细胞的样品索引
CN118510907A (zh) 诱饵多核苷酸在单细胞多组学中的应用
US20240360438A1 (en) Rna preservation and recovery from fixed cells
CN116194589A (zh) 用于转座酶可及染色质的单细胞测定
CN115427584A (zh) 嗜中温dna聚合酶延伸阻断物
CN115803445A (zh) 用于5撇基因表达测定的寡核苷酸和珠
CN112969789A (zh) 使用随机引发的单细胞全转录组分析
CN114729350A (zh) 使用随机引发获得用于免疫组库测序的全长v(d)j信息
CN118176306A (zh) 用于mRNA 5’分析的模板转换寡核苷酸(TSO)
US11939622B2 (en) Single cell chromatin immunoprecipitation sequencing assay
CN117916389A (zh) 使用原位逆转录的空间多组学
EP3728636B1 (en) Particles associated with oligonucleotides
WO2020150356A1 (en) Polymerase chain reaction normalization through primer titration
CN118647730A (zh) 制备核酸用于进一步分析其序列
CN117957330A (zh) 全长单细胞rna测序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination