ES2844852T3

ES2844852T3 - Acidos nucleicos bloqueados para capturar genes de fusión

Info

Publication number: ES2844852T3
Application number: ES16828575T
Authority: ES
Inventors: Stefanie Ann Ward Mortimer
Original assignee: Guardant Health Inc
Current assignee: Guardant Health Inc
Priority date: 2015-07-21
Filing date: 2016-07-21
Publication date: 2021-07-22
Anticipated expiration: 2036-07-21
Also published as: US20220411877A1; CN108138230A; WO2017015513A9; EP3828292A1; EP3325667B1; US20180195131A1; WO2017015513A1; AU2016297096A9; US20190071730A9; JP7074661B2; EP3325667A1; JP2018524014A; AU2016297096B2; EP3325667A4; AU2016297096A1; US20170226590A1; CN108138230B; CA2993019A1

Abstract

Un método para capturar un fragmento de punto de ruptura de un gen de fusión, que comprende (a) poner en contacto una muestra biológica proporcionada con una sonda de polinucleótidos, que comprende uno o más nucleótidos de ácido nucleico bloqueado (LNA), en condiciones suficientes para: (i) permitir la hibridación entre la sonda de polinucleótidos y el fragmento de punto de ruptura para proporcionar un polinucleótido capturado por sonda en una mezcla, dicha sonda de polinucleótidos tiene complementariedad de secuencia con el fragmento de punto de ruptura y tiene una afinidad para el gen de fusión que es mayor que la de un polinucleótido que tiene la complementariedad de secuencia y que contiene solo nucleótidos no modificados; y (ii) permitir el enriquecimiento o aislamiento del polinucleótido capturado por sonda de la mezcla, en donde la sonda de polinucleótidos tiene complementariedad de secuencia con el fragmento de punto de ruptura, (b) eluir los polinucleótidos capturados por sondas para aislar los polinucleótidos capturados de las sondas; y (c) secuenciar directamente los polinucleótidos eluidos o usar los polinucleótidos eluidos para producir bibliotecas de secuenciación, en donde la muestra biológica contiene o se sospecha que contiene una molécula de ácido nucleico libre de células que comprende el fragmento de punto de ruptura del gen de fusión.

Description

DESCRIPCIÓN

Ácidos nucleicos bloqueados para capturar genes de fusión

REFERENCIA CRUZADA ANTECEDENTES

Los eventos de fusión de genes son reordenamientos cromosómicos que reúnen porciones anteriormente separadas de por lo menos dos genes en un genoma. Los eventos de fusión de genes pueden dar como resultado genes de fusión de cáncer, donde la yuxtaposición aberrante de dos o más genes puede codificar una proteína de fusión, o los elementos reguladores de un gen pueden impulsar la expresión aberrante de un oncogén. La detección de estos genes de fusión de cáncer puede ser difícil. Es menos probable que los fragmentos de punto de ruptura hibriden con sondas en la misma medida que los fragmentos que no contienen puntos de ruptura. Por tanto, los métodos de hibridación para el enriquecimiento de fragmentos de punto de ruptura pueden carecer de eficacia.

Los genes de fusión son una forma de mutación somática encontrada en células cancerosas. La capacidad de detectar tales genes de fusión es útil en el diagnóstico y monitorización del cáncer.

Los genes de fusión que se sabe que se encuentran en el cáncer incluyen, por ejemplo, los siguientes: APIP/SLC1A2 en cáncer de colon, ATG7/RAF1 en cáncer de páncreas, BCL6/RAF1 en astrocitoma, BCR-ABL en leucemia mieloide crónica, BRD4-NUT en carcinomas de línea media, CEP85L/ROS1 en angiosarcoma, CLTC/VMP1 en cáncer de mama, ELM4-ALK en cáncer de pulmón, EWSR1/CREM en melanoma, FAM133B/CDK6 en leucemia linfoblástica aguda de células T, KIAA1549-BRAF (en 7q34) en astrocitoma de grado bajo, MECT1-MAML2 en carcinoma mucoepidermoide, PAX8- PPARG en carcinoma folicular, RET-NTRK1 en carcinoma de tiroides papilar, SEC 16 A-NOTCH1 en cánceres de mama, SRGAP3-RAF1 (en 3p25) en astrocitoma de grado bajo, TFE3-TFEB en cáncer de riñón.

Los puntos de ruptura pueden producirse en muchas localizaciones diferentes en un gen implicado en la fusión de genes. Tal punto de ruptura puede agruparse en ciertas partes del gen.

Un método para detectar fusiones de genes es mediante FISH (hibridación in situ fluorescente). Otra es la secuenciación del ácido desoxirribonucleico (ADN).

La WO 2013/006195 divulga un método para detectar fusiones de genes por medio sondas específicas de fusión que hibridan con puntos de ruptura amplificados.

SUMARIO

En la presente se reconoce la necesidad de métodos para enriquecer fragmentos de puntos de ruptura para detectar y caracterizar genes de fusión del cáncer.

La presente divulgación proporciona métodos para detectar genes de fusión, que pueden usarse para detectar una enfermedad, como el cáncer. En la presente se proporcionan métodos para el enriquecimiento de fragmentos de puntos de ruptura, como para detectar y caracterizar genes de fusión, que pueden estar asociados con una enfermedad, como el cáncer.

En un aspecto, la presente divulgación proporciona un método para proporcionar una intervención diagnóstica o terapéutica a un sujeto que tiene o se sospecha que tiene cáncer, que comprende (a) proporcionar una muestra biológica que comprende moléculas de ácido nucleico libre de células de un sujeto; (b) poner en contacto las moléculas de ácido nucleico libre de células de la muestra biológica con un conjunto de sondas en condiciones de hibridación suficientes para producir polinucleótidos capturados por sondas, tal conjunto de sondas comprende una pluralidad de sondas de polinucleótidos, en donde cada una de la pluralidad de sondas de polinucleótidos tiene (i) complementariedad de secuencia con un gen de fusión y (ii) afinidad por el gen de fusión que es mayor que un polinucleótido que tiene una secuencia complementaria con el gen de fusión y que contiene solo nucleótidos no modificados; (c) aislar los polinucleótidos capturados por sondas de la mezcla, para producir una muestra enriquecida con polinucleótidos aislados que comprenden fragmentos de puntos de rupturas del gen de fusión; (d) secuenciar los polinucleótidos aislados para producir secuencias; (e) detectar polinucleótidos que comprenden puntos de ruptura de genes de fusión en base a las secuencias; y (f) proporcionar la intervención diagnóstica o terapéutica en base a la detección de fragmentos de puntos de ruptura.

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos comprende uno o más nucleótidos de ácido nucleico bloqueado (LNA). En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos comprende una pluralidad de nucleótidos de LNA, en donde por lo menos dos de los nucleótidos de LNA están separados por no más de 30 nucleótidos. En algunas realizaciones, los por lo menos dos nucleótidos de LNA están separados por no más de 15.

En algunas realizaciones, por lo menos el 50% de los nucleótidos de cada uno de por lo menos un subconjunto de la pluralidad de sondas de polinucleótidos son nucleótidos de ácido nucleico bloqueado (LNA). En algunas realizaciones, por lo menos el 75% de los nucleótidos de cada uno de por lo menos un subconjunto de la pluralidad de sondas de polinucleótidos son nucleótidos de ácido nucleico bloqueado (LNA).

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene una temperatura de fusión que es por lo menos aproximadamente 1° C más alta que la del polinucleótido que tiene una secuencia complementaria con el gen de fusión y que contiene solo nucleótidos no modificados. En algunas realizaciones, la temperatura de fusión es por lo menos aproximadamente 10° C más alta.

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene una temperatura de fusión que es por lo menos aproximadamente un 2% más alta que la del polinucleótido que tiene la secuencia complementaria con el gen de fusión y que contiene sólo nucleótidos no modificados. En algunas realizaciones, la temperatura de fusión es por lo menos aproximadamente un 10% más alta.

En algunas realizaciones, el gen de fusión es un gen de fusión del cáncer. En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene complementariedad de secuencia con un gen de un par de genes de fusión de las FIG. 2A-2B o un gen de fusión entre dos o más genes seleccionados de la FIG. 3. En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene complementariedad de secuencia con una región de punto de ruptura a no más de 500 nucleótidos de un punto de ruptura del gen de fusión. En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene complementariedad de secuencia con una secuencia a través de un punto de ruptura en el gen de fusión.

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene una longitud menor de aproximadamente 500 nucleótidos. En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene una longitud entre aproximadamente 20 y aproximadamente 200 nucleótidos. En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene una longitud entre aproximadamente 80 y aproximadamente 160 nucleótidos.

En algunas realizaciones, cada uno de los fragmentos de punto de ruptura tiene una longitud entre aproximadamente 140 nucleótidos y 180 nucleótidos.

En algunas realizaciones, la pluralidad de sondas de polinucleótidos se acopla a un soporte sólido. En algunas realizaciones, el conjunto de sondas comprende una o más sondas de polinucleótidos naturales. En algunas realizaciones, la pluralidad de sondas de polinucleótidos comprende por lo menos una sonda de polinucleótidos que hibrida con una región de punto de ruptura de una secuencia de ácidos nucleicos incluida en el gen de fusión, y por lo menos una sonda de polinucleótidos natural que hibrida con una región no de punto de ruptura de la secuencia de ácidos nucleicos incluida en el gen de fusión.

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos proporciona por lo menos 50% de cobertura de una región de punto de ruptura de una secuencia de ácidos nucleicos incluida en el gen de fusión.

En algunas realizaciones, (d) comprende unir, a los polinucleótidos aislados, etiquetas que comprenden códigos de barras que tienen secuencias de códigos de barras distintas para generar polinucleótidos originales etiquetados. En algunas realizaciones, el método comprende además amplificar los polinucleótidos originales etiquetados para producir polinucleótidos de la progenie etiquetados.

En algunas realizaciones, el método comprende además (i) secuenciar los polinucleótidos de la progenie etiquetados para producir lecturas de secuencia, en donde cada lectura de secuencia comprende una secuencia de códigos de barras y una secuencia derivada de uno dado de los polinucleótidos aislados, y (ii) agrupar las lecturas de secuencia en familias en base a por lo menos una secuencia de códigos de barras.

En algunas realizaciones, el método comprende además comparar las lecturas de secuencia agrupadas dentro de cada familia para determinar secuencias consenso para cada familia, en donde cada una de las secuencias consenso corresponde a un polinucleótido único entre los polinucleótidos originales etiquetados.

En otro aspecto, la presente divulgación proporciona un método para capturar un fragmento de punto de ruptura de un gen de fusión, que comprende (a) proporcionar una muestra biológica que contiene o se sospecha que contiene una molécula de ácido nucleico libre de células que comprende el fragmento de punto de ruptura del gen de fusión; y (b) poner en contacto la muestra biológica con una sonda de polinucleótidos en condiciones suficientes para (i) permitir la hibridación entre la sonda de polinucleótidos y el fragmento de punto de ruptura para proporcionar un polinucleótido capturado por sonda en una mezcla, dicha sonda de polinucleótidos tiene complementariedad de secuencia con el fragmento de punto de ruptura y tiene una afinidad por el gen de fusión que es mayor que la de un polinucleótido que tiene complementariedad de secuencia con el gen de fusión y que contiene sólo nucleótidos no modificados; y (ii) enriquecimiento o aislamiento del polinucleótido capturado por sonda de la mezcla, en donde la sonda de polinucleótidos tiene complementariedad de secuencia con el fragmento de punto de ruptura.

De acuerdo con la invención, la sonda de polinucleótidos comprende uno o más nucleótidos de ácido nucleico bloqueado (LNA). En algunas realizaciones, la sonda de polinucleótidos comprende una pluralidad de nucleótidos de LNA, en donde por lo menos dos de los nucleótidos de LNA están separados por no más de 30 nucleótidos. En algunas realizaciones, los por lo menos dos nucleótidos de LNA están separados por no más de 15 nucleótidos.

Otro aspecto de la presente divulgación proporciona un conjunto de sondas que comprende una pluralidad de sondas de polinucleótidos, en donde cada una de las sondas de polinucleótidos tiene (i) complementariedad de secuencia con un gen de fusión como parte de una molécula de ácidos nucleicos libre de células y (ii) afinidad por el gen de fusión que es mayor que un polinucleótido que tiene complementariedad de secuencia con el gen de fusión y que contiene sólo nucleótidos no modificados.

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos comprende uno o más nucleótidos de ácido nucleico bloqueado. En algunas realizaciones, el conjunto de sondas comprende además una o más sondas de polinucleótidos naturales. En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos comprende por lo menos una sonda de polinucleótidos que hibrida con una región de punto de ruptura de una secuencia de ácidos nucleicos incluida en el gen de fusión, y por lo menos una sonda de polinucleótidos natural que hibrida con una región no de punto de ruptura de la secuencia de ácidos nucleicos incluida en el gen de fusión.

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos proporciona por lo menos un 50% de cobertura de una región de punto de ruptura de una secuencia de ácidos nucleicos incluida en el gen de fusión.

En algunas realizaciones, la pluralidad de sondas de polinucleótidos hibridan con porciones de uno o ambos de los diferentes genes en el gen de fusión.

En algunas realizaciones, el conjunto de sondas comprende además un soporte sólido, en donde la pluralidad de sondas de polinucleótidos está acoplada al soporte sólido.

En algunas realizaciones, el gen de fusión es un gen de fusión de cáncer.

En algunas realizaciones, cada una de la pluralidad de sondas de polinucleótidos tiene complementariedad de secuencia con un gen de un par de genes de fusión de las FIGS. 2A-2B o un gen de fusión entre dos o más genes seleccionados de la FIG. 3.

En otro aspecto, en la presente se divulga un polinucleótido de alta afinidad, que comprende una secuencia que está configurada para hibridar específicamente con una secuencia de ácidos nucleicos asociada con un gen de fusión en una molécula de ácido nucleico libre de células.

En otro aspecto, en la presente se divulga un polinucleótido de alta afinidad configurado para hibridar específicamente con un gen de fusión. En una realización, el polinucleótido de alta afinidad comprende uno o más nucleótidos de ácidos nucleicos bloqueados. En otra realización, el polinucleótido de alta afinidad tiene una temperatura de fusión que es por lo menos cualquiera de 1° C, 2° C, 3° C, 4° C, 5° C, 10° C, 15° C o 20° C más alta que la de un polinucleótido con la misma secuencia que comprende solo nucleótidos naturales. En otra realización, el polinucleótido de alta afinidad tiene una temperatura de fusión que es por lo menos cualquiera de un 2%, 4%, 6%, 8% o 10% más alta que la de un polinucleótido con la misma secuencia que comprende solo nucleótidos naturales. En otra realización, el polinucleótido de alta afinidad está configurado para hibridar específicamente con un gen de fusión de cáncer. En otra realización, el polinucleótido de alta afinidad está configurado para hibridar específicamente con un gen de un par de genes de fusión de las FIGS. 2A-2B o un gen de fusión entre por lo menos cualquiera de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más genes seleccionados de la FIG. 3. En otra realización, el polinucleótido de alta afinidad está configurado para hibridar dentro de una región de punto de ruptura a no más de 500 nucleótidos de un punto de ruptura del gen de fusión. En otra realización, el polinucleótido de alta afinidad está configurado para hibridar a través de un punto de ruptura en el gen de fusión. En otra realización, el polinucleótido de alta afinidad tiene una longitud menor de aproximadamente 500 nucleótidos, entre aproximadamente 20 y aproximadamente 200 nucleótidos, o entre aproximadamente 80 y aproximadamente 160 nucleótidos. En otra realización, el polinucleótido de alta afinidad comprende una pluralidad de nucleótidos de ácido nucleico bloqueado (LNA), en donde por lo menos dos de los nucleótidos de LNA están separados por no más de 30, 20, 15, 10 o 5 nucleótidos. En otra realización, el 100%, o por lo menos cualquiera del 90%, 75%, 50%, 20%, 10% o 5% o 1% de los nucleótidos en el polinucleótido son nucleótidos de ácido nucleico bloqueado. En otra realización, el polinucleótido de alta afinidad tiene una secuencia de nucleótidos perfecta o sustancialmente complementaria a una secuencia de nucleótidos del gen de fusión.

En otro aspecto, esta divulgación proporciona una sonda de polinucleótidos de alta afinidad que comprende un polinucleótido de alta afinidad configurado para hibridar específicamente con un gen de fusión. En una realización, el polinucleótido de alta afinidad comprende uno o más nucleótidos de ácido nucleico bloqueado. En otra realización, la sonda comprende una funcionalidad seleccionada de un marcador detectable, una fracción de unión o un soporte sólido. En otra realización, la sonda está configurada para hibridar con un fragmento de punto de ruptura de un gen de fusión. En otra realización, el fragmento de punto de ruptura tiene una longitud entre aproximadamente 140 nucleótidos y aproximadamente 180 nucleótidos. En otra realización, el fragmento es ácido desoxirribonucleico (ADN) o ADN genómico libre de células. En otra realización, el polinucleótido de alta afinidad está unido a un soporte sólido.

En otro aspecto, esta divulgación proporciona un conjunto de sondas que comprende una pluralidad de sondas de polinucleótidos, cada sonda configurada para hibridar específicamente con un gen de fusión, en donde el conjunto comprende una o más sondas de polinucleótidos de alta afinidad. En una realización, el polinucleótido de alta afinidad comprende uno o más nucleótidos de ácido nucleico bloqueado. En otra realización, el conjunto comprende una o más sondas de polinucleótidos naturales. En otra realización, el conjunto de sondas comprende por lo menos una sonda de polinucleótidos de alta afinidad que hibrida específicamente con una región de punto de ruptura de un gen implicado en el gen de fusión, y por lo menos una sonda de polinucleótidos naturales que hibrida con una región no de punto de ruptura del gen implicado en el gen de fusión. En otra realización, la una o más sondas de polinucleótidos de alta afinidad en el conjunto de sondas proporcionan por lo menos un 50% (por ejemplo, por lo menos 0,5X a 5X) de cobertura de una región de punto de ruptura de un gen implicado en el gen de fusión. En otra realización, las sondas hibridan con porciones de uno o ambos de los diferentes genes en el gen de fusión. En otra realización, el conjunto de sondas se configura como un chip de oligonucleótidos. En otra realización, una secuencia objetivo es objetivo tanto de sondas de polinucleótidos de alta afinidad como de sondas de polinucleótidos de afinidad estándar.

En otro aspecto, esta divulgación proporciona un kit que comprende una pluralidad de conjuntos de sondas, en donde cada conjunto de sondas hibrida específicamente con un gen diferente y por lo menos uno de los conjuntos de sondas es un conjunto de sondas de esta divulgación. En una realización, el polinucleótido de alta afinidad comprende uno o más nucleótidos de ácido nucleico bloqueado.

En otro aspecto, esta divulgación proporciona un método para capturar un fragmento de punto de ruptura de un gen de fusión que comprende poner en contacto el fragmento de punto de ruptura con una sonda de polinucleótidos de alta afinidad en condiciones de hibridación rigurosas y permitir la hibridación, en donde la sonda de polinucleótidos está unida a un soporte sólido y en donde la sonda de polinucleótidos tiene una secuencia de nucleótidos que es sustancial o perfectamente complementaria con una secuencia de nucleótidos del fragmento de punto de ruptura. En una realización, el polinucleótido de alta afinidad comprende uno o más nucleótidos de ácido nucleico bloqueado.

En otro aspecto, esta divulgación proporciona un método para enriquecer una muestra de polinucleótidos que comprende un punto de ruptura de un gen de fusión, que comprende: a) poner en contacto un conjunto de sondas de la reivindicación 20 con una mezcla de polinucleótidos en condiciones de hibridación para producir polinucleótidos capturados con sondas; y b) aislar los polinucleótidos capturados por sondas de la mezcla, para producir una muestra enriquecida con polinucleótidos que comprenden fragmentos de punto de ruptura del gen de fusión. En una realización, el polinucleótido de alta afinidad comprende uno o más nucleótidos de ácido nucleico bloqueado. En otra realización, los polinucleótidos comprenden ADN libre de células o ADN genómico fragmentado. En otra realización, el método comprende además aislar polinucleótidos capturados de las sondas. En otra realización, el método comprende además secuenciar los polinucleótidos aislados.

En otro aspecto, esta divulgación proporciona un método para diagnosticar cáncer en un sujeto que comprende: a) proporcionar una muestra que comprende polinucleótidos de un sujeto; b) poner en contacto el ADN libre de células (ADNcf) de la muestra con un conjunto de sondas de la reivindicación 20 en condiciones de hibridación para producir polinucleótidos capturados por sondas; c) aislar los polinucleótidos capturados por sondas de la mezcla, para producir una muestra enriquecida con polinucleótidos que comprenden fragmentos de punto de ruptura del gen de fusión; d) secuenciar los polinucleótidos aislados para producir secuencias; e) detectar polinucleótidos que comprenden puntos de ruptura de genes de fusión en base a las secuencias; y f) diagnosticar el cáncer en base a la detección de fragmentos de puntos de ruptura. En una realización, el polinucleótido de alta afinidad comprende uno o más nucleótidos de ácido nucleico bloqueado.

Otro aspecto de la presente divulgación proporciona un medio legible por ordenador no transitorio que comprende código ejecutable por máquina que, tras la ejecución por uno o más procesadores informáticos, implementa cualquiera de los métodos anteriores o en cualquier otro lugar de la presente.

Otro aspecto de la presente divulgación proporciona un sistema que comprende uno o más procesadores informáticos y un medio legible por ordenador no transitorio acoplado al mismo. El medio legible por ordenador no transitorio comprende código ejecutable por máquina que, tras su ejecución por uno o más procesadores informáticos, implementa cualquiera de los métodos anteriores o en cualquier otro lugar de la presente.

Aspectos y ventajas adicionales de la presente divulgación resultarán fácilmente evidentes para los expertos en esta técnica a partir de la siguiente descripción detallada, en la que sólo se muestran y describen realizaciones ilustrativas de la presente divulgación. Como se comprenderá, la presente divulgación es capaz de otras realizaciones diferentes, y sus varios detalles son susceptibles de modificaciones en varios aspectos obvios, todo sin apartarse de la divulgación. Por consiguiente, los dibujos y la descripción deben considerarse de naturaleza ilustrativa y no restrictiva.

INCORPORACIÓN POR REFERENCIA

Todas las publicaciones, patentes y solicitudes de patente mencionadas en esta especificación se incorporan en la presente como referencia en la misma medida que si cada publicación, patente o solicitud de patente individual se indicara específica e individualmente para incorporarla como referencia.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Las características novedosas de la invención se exponen con particularidad en las reivindicaciones adjuntas. Se obtendrá una mejor comprensión de las características y ventajas de la presente invención haciendo referencia a la siguiente descripción detallada que expone realizaciones ilustrativas en las que se utilizan los principios de la invención, y los dibujos acompañantes (también "Figura" y "FIG." en la presente), de los cuales: La FIG. 1 representa fragmentos de puntos de ruptura derivados de un gen de fusión y la pérdida de tales fragmentos durante los protocolos de captura por sondas estándar;

La FIG. 2A proporciona una lista de pares de genes de fusión del cáncer;

La FIG. 2B proporciona otra lista de pares de genes de fusión del cáncer;

La FIG. 3 proporciona una lista de genes detectados en genes de fusión del cáncer;

Las FIGS. 4A-4U proporcionan puntos de ruptura ejemplares para pares de genes de fusión de cáncer;

Las FIGS. 5A-B muestran diferentes profundidades de cobertura y traslape para sondas y/o polinucleótidos; Las FIGS. 6A-6D muestran diferentes mezclas ejemplares de subconjuntos de secuencias de sondas de alta afinidad y subconjuntos de secuencias de sondas de afinidad estándar;

La FIG. 7 muestra un panel de 64 genes, que incluye cuatro genes, ALK, NKRT1, RET y ROS1, implicados en reordenamientos de genes;

La FIG. 8 muestra ocho regiones genómicas del gen ALK que pueden ser el objetivo de una cobertura más profunda; y

La FIG. 9 muestra un sistema de control informático que está programado o configurado de otro modo para implementar los métodos proporcionados en la presente.

DESCRIPCIÓN DETALLADA

Aunque se han mostrado y descrito en la presente varias realizaciones de la invención, resultará obvio para los expertos en la técnica que tales realizaciones se proporcionan solamente a modo de ejemplo. A los expertos en la técnica se les pueden ocurrir numerosas variaciones, cambios y sustituciones sin apartarse de la invención. Debe entenderse que pueden emplearse varias alternativas a las realizaciones de la invención descritas en la presente. I. Definiciones

"Polinucleótido de alta afinidad", como se usa en la presente, se refiere a un polinucleótido que comprende por lo menos una modificación química que proporciona al polinucleótido una temperatura de fusión más alta en una reacción de hibridación en comparación con un polinucleótido de la misma secuencia no modificado de este modo. En realizaciones, la temperatura de fusión más alta puede ser por lo menos cualquiera de 1°, 2°, 3°, 4°, 5°, 10°, 15° o 20° C más alta. El polinucleótido puede comprender uno o más análogos de nucleótidos, un nucleótido de LNA.

"Ácido nucleico bloqueado" ("LNA") (a veces denominado "ARN inaccesible"), como se usa en la presente, se refiere a un polinucleótido de alta afinidad que comprende por lo menos un nucleótido de ácido nucleico bloqueado (LNA).

"Nucleótido de ácido nucleico bloqueado" ("nucleótido de LNA") como se usa en la presente, se refiere a un nucleótido de ARN modificado que proporciona al polinucleótido mayor estabilidad termodinámica durante la hibridación en comparación con un polinucleótido que se diferencia del LNA solo por tener un ribonucleótido natural en lugar del nucleótido de ARN modificado. En ciertas realizaciones, la fracción de ribosa de un nucleótido de ARN modificado se modifica con un puente adicional que conecta el oxígeno 2' y el carbono 4'. Los nucleótidos de LNA pueden comprender cualquier tipo de puente adicional entre 2'O y 4'C del ARN que aumente la estabilidad termodinámica del dúplex entre el LNA y su complemento. En algunos casos, el BNA, el oxígeno 2' y el carbono 4' están puenteados por un grupo metileno. En algunos casos, los ácidos nucleicos con puente 2'-O,4'-C-etileno (ENA), el oxígeno 2' y el carbono 4' están puenteados por un grupo etileno. Otros ejemplos de BNA pueden incluir, pero no están limitados a, 2',4'-BNAnc[NH], 2',4'-BNANC[NMe] y 2',4'-BNANC[NBn].

"Ácido nucleico con puente" ("BNA") se refiere a ácidos nucleicos modificados con 2'-O,4'-C-metileno.

Otros nucleótidos modificados con 2'O, como 2'O-Me, también demuestran una mayor estabilidad.

"Gen de fusión", como se usa en la presente, se refiere a un gen que resulta de un reordenamiento cromosómico (inversión, deleción, translocación) que reúne porciones anteriormente separadas de por lo menos dos genes diferentes en un genoma.

"Gen de fusión de cáncer", como se usa en la presente, se refiere a un gen de fusión que resulta de una mutación somática en una célula cancerosa.

"Punto de ruptura", como se usa en la presente, se refiere a una posición de nucleótido en un gen de fusión en el que se fusionan porciones de dos genes diferentes.

"Región de punto de ruptura", como se usa en la presente, se refiere a una región de un gen que puede estar implicada en fusiones de genes en las que puede producirse un punto de ruptura.

"Fragmento de punto de ruptura" de un gen de fusión, como se usa en la presente, se refiere a un fragmento de un gen de fusión que incluye secuencias de dos genes diferentes que componen el gen de fusión.

"Sonda", como se usa en la presente, se refiere a un polinucleótido que comprende una funcionalidad. La funcionalidad puede ser un marcador detectable (fluorescente), una fracción de unión (biotina) o un soporte sólido (una partícula magnéticamente atraíble o un chip).

"Polinucleótido natural" u "oligonucleótido natural", como se usa en la presente, se refiere a un polinucleótido o un oligonucleótido en el que todos los nucleótidos en la sonda son nucleótidos naturales.

"Complementariedad" se refiere a la capacidad de un ácido nucleico para formar enlaces de hidrógeno con otra secuencia de ácidos nucleicos mediante tipos de Watson-Crick tradicional u otros no tradicionales. Un porcentaje de complementariedad indica el porcentaje de residuos en una molécula de ácido nucleico que puede formar enlaces de hidrógeno (emparejamiento de bases Watson-Crick) con una segunda secuencia de ácidos nucleicos (5, 6, 7, 8, 9, 10 de 10 siendo un 50%, 60%, 70%, 80%, 90% y 100% complementarios, respectivamente). "Perfectamente complementario" significa que todos los residuos contiguos de una secuencia de ácidos nucleicos formarán un enlace de hidrógeno con el mismo número de residuos contiguos en una segunda secuencia de ácidos nucleicos.

"Sustancialmente complementario", como se usa en la presente, se refiere a un grado de complementariedad que es por lo menos cualquiera de 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98 %, 99% o 100% en una región de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 o más nucleótidos, o se refiere a dos ácidos nucleicos que hibridan en condiciones rigurosas. La identidad de secuencia, como con el propósito de evaluar el porcentaje de complementariedad, puede medirse mediante cualquier algoritmo de alineación adecuado, incluyendo, pero no limitado a, el algoritmo de Needleman-Wunsch (ver, por ejemplo, el alineador EMBOSS Needle disponible en el sitio web mundial: ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html, opcionalmente con la configuración predeterminada), el algoritmo BLAST (ver, por ejemplo, la herramienta de alineación BLAST disponible en blast.ncbi.nlm.nih.gov/Blast.cgi, opcionalmente con la configuración predeterminada), o el algoritmo de Smith-Waterman (ver, por ejemplo, el alineador EMBOSS Water disponible en el sitio web mundial: ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html, opcionalmente con la configuración predeterminada). La alineación óptima puede evaluarse usando cualquier parámetro adecuado de un algoritmo elegido, incluyendo los parámetros predeterminados.

"Hibridación" se refiere a una reacción en la que uno o más polinucleótidos reaccionan para formar un complejo que se estabiliza mediante enlaces de hidrógeno entre las bases de los residuos de nucleótidos. El enlace de hidrógeno puede producirse mediante emparejamiento de bases de Watson Crick, unión de Hoogstein, o de cualquier otra manera específica de secuencia de acuerdo con la complementariedad de bases. El complejo puede comprender dos cadenas que forman una estructura dúplex, tres o más cadenas que forman un complejo de múltiples cadenas, una única cadena autohibridante o cualquier combinación de estos. Una reacción de hibridación puede constituir un paso en un proceso más extenso, como el inicio de la PCR, o la escisión enzimática de un polinucleótido por una endonucleasa. Una segunda secuencia que es complementaria a una primera secuencia se denomina "complemento" de la primera secuencia. El término “que puede hibridar” como se aplica a un polinucleótido se refiere a la capacidad del polinucleótido de formar un complejo que se estabiliza mediante enlaces de hidrógeno entre las bases de los residuos de nucleótidos en una reacción de hibridación. "Hibridar específicamente con" o "hibridando específicamente con" o "hibridación específica" se refiere a la formación de un dúplex estable entre dos polinucleótidos en condiciones del 50% de formamida, 5 x SSC y 1% de SDS incubado a 42° C o 5 x SSC y 1% de SDS incubado a 65° C, con un lavado en 0,2 x SSC y 0,1% de SDS a 65° C.

El término "condiciones de hibridación rigurosas" se refiere a las condiciones en las que un polinucleótido hibridará preferentemente con su subsecuencia objetivo y, en menor grado, con otras secuencias, o no con todas ellas. La "hibridación rigurosa" en el contexto de experimentos de hibridación de ácidos nucleicos depende de la secuencia y son diferentes bajo diferentes parámetros ambientales. Una guía extensa para la hibridación de ácidos nucleicos se encuentra en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology --Hybridization with Nucleic Acid Probes parte I capítulo 2 "OverView of principles of hybridization and the strategy of nucleic acid probe assays", Elsevier, Nueva York.

Generalmente, las condiciones de hibridación y lavado altamente rigurosas se seleccionan para que sean aproximadamente 5° C más bajas que el punto de fusión térmico (Tm) para la secuencia específica a una fuerza iónica y un pH definidos. La Tm es la temperatura (bajo una fuerza iónica y un pH definidos) a la que el 50% de la secuencia objetivo hibrida con una sonda perfectamente adaptada. Se seleccionan condiciones muy estrictas para que sean iguales a la Tm para una sonda en particular.

Las condiciones de hibridación rigurosas incluyen un tampón que comprende agua, un tampón (un tampón de fosfato, tris, SSPE o SSC a pH 6-9 o pH 7-8), una sal (sodio o potasio) y un desnaturalizante (SDS, formamida o tween) y una temperatura de 37° C, -70° C, 60° C -65° C.

Un ejemplo de condiciones de hibridación rigurosas para la hibridación de ácidos nucleicos complementarios que tienen más de 100 residuos complementarios en un filtro en una transferencia Southern o Northern es formalina al 50% con 1 mg de heparina a 42° C, con la hibridación llevándose a cabo durante la noche. Un ejemplo de condiciones de lavado muy rigurosas es NaCl 0,15 M a 72° C durante aproximadamente 15 minutos. Un ejemplo de condiciones de lavado rigurosas es un lavado SSC 0,2X a 65° C durante 15 minutos (ver, Sambrook et al. Para una descripción del tampón de SSC). A menudo, un lavado de alta rigurosidad va precedido de un lavado de baja rigurosidad para eliminar la señal de la sonda de fondo. Un ejemplo de lavado de rigurosidad media para un dúplex de más de 100 nucleótidos es 1x SSC a 45° C durante 15 minutos. Un ejemplo de lavado de baja rigurosidad para un dúplex de, por ejemplo, más de 100 nucleótidos, es 4-6x SSC a 40° C durante 15 minutos. En general, una relación señal a ruido de 2x (o superior) que la observada para una sonda no relacionada en el ensayo de hibridación particular indica la detección de una hibridación específica.

II. Visión general

En la presente se proporcionan composiciones y métodos para detectar polinucleótidos que comprenden uno o más genes de fusión. Los polinucleótidos pueden ser ácido desoxirribonucleico (ADN). Las composiciones y métodos proporcionados en la presente pueden detectar genes de fusión con alta sensibilidad en muestras de polinucleótidos heterogéneos, como ADN libre de células ("ADNcf").

El ADN de las células, incluyendo las células cancerosas, puede verterse en la sangre en forma de ADN libre de células. El ADN libre de células tiene una longitud media de aproximadamente 160 nucleótidos. Debido a que la fragmentación no se produce en puntos preespecificados, para cualquier locus genómico, pueden encontrarse fragmentos en una muestra que traslapan a través de ese locus.

En el cáncer, ciertos genes están implicados comúnmente en fusiones de genes con otros genes. Por ejemplo, los genes EML4 y ALK se fusionan comúnmente entre sí en el cáncer. El punto de ruptura de cada gen implicado en una fusión puede producirse en regiones de punto de ruptura ("puntos críticos") en cada uno de los genes. Cuando las células que contienen estos genes de fusión mueren, su ADN se vierte en la sangre en forma de ADNcf. Como se muestra en la FIG. 1, la posición en el mapeo del fragmento al punto de ruptura puede producirse en cualquier parte del fragmento, cerca del extremo 5', en el medio o cerca del extremo 3'. Por consiguiente, el polinucleótido de ADNcf puede tener una secuencia de nucleótidos muy corta o muy larga de cualquiera de los genes implicados en la fusión.

Ciertos métodos de secuenciación de ADN usan la captura de secuencias para enriquecer las secuencias de interés. La captura de secuencias típicamente implica el uso de sondas de oligonucleótidos que hibridan con la secuencia de interés. La estrategia del conjunto de sondas puede implicar el traslape de las sondas a través de una región de interés. Tales sondas pueden tener una longitud de aproximadamente 120 bases. El conjunto puede tener una profundidad de aproximadamente 2x. La eficacia de la captura de secuencias depende, en parte, de la longitud de la secuencia en la molécula objetivo que es complementaria (o casi complementaria) a la secuencia de la sonda.

Sin embargo, en el caso de genes de fusión, el mapeo de polinucleótidos para el punto de ruptura puede contener una secuencia del gen objetivo que es más corta que la óptima para la hibridación y captura. Por ejemplo, un mapeo de fragmento de ADNcf para una fusión que implica una fusión ALK-EML4 puede tener, por ejemplo, una secuencia de 150 nucleótidos del gen ALK, una secuencia de 100 nucleótidos, una secuencia de 50 nucleótidos, una secuencia de 25 nucleótidos o una secuencia de 10 nucleótidos. En este caso, hay una probabilidad más baja de capturar el polinucleótido si tiene una secuencia de ALK más corta que la de capturar un polinucleótido con una secuencia completamente complementaria con la sonda ALK. El problema es más agudo cuando la captura de secuencias es multiplex, dirigiéndose a secuencias de muchos genes diferentes.

En la presente se proporcionan materiales y métodos para capturar fragmentos de polinucleótidos que mapean para un punto de ruptura en un gen de fusión. Dichos polinucleótidos se capturan usando ácidos nucleicos bloqueados de alta afinidad. Tales sondas tienen una temperatura de fusión más alta que las sondas de la misma secuencia elaboradas a partir de nucleótidos naturales. En consecuencia, producen un rendimiento más alto de productos capturados de la misma muestra.

Tales sondas pueden incluirse en un conjunto de sondas dirigido tanto a genes de fusión como a genes no de fusión. De esta manera, los polinucleótidos capturados se enriquecen para aquellos que incluyen genes de fusión, en comparación con una población capturada usando solo sondas elaboradas a partir de nucleótidos naturales.

Las sondas de LNA pueden configurarse para traslaparse a través de regiones de puntos de ruptura de genes implicados en genes de fusión.

Cada nucleótido en una sonda de LNA puede ser un nucleótido de LNA. Alternativamente, una fracción de los nucleótidos puede ser nucleótidos de LNA. En ciertas realizaciones, los nucleótidos de LNA pueden estar separados por un número predeterminado de nucleótidos.

La presente invención proporciona polinucleótidos de alta afinidad que pueden usarse para enriquecer una muestra que contiene fragmentos de ácidos nucleicos para aquellos fragmentos de ácidos nucleicos que contienen eventos de fusión génica. Estos polinucleótidos de alta afinidad pueden contener nucleótidos de LNA. La sustitución de nucleótidos de LNA estándar por nucleótidos estándar aumenta la temperatura de fusión del polinucleótido de alta afinidad, aumentando de este modo la estabilidad del dúplex entre el polinucleótido de alta afinidad y un fragmento de ácido nucleico que contiene un gen de fusión.

Las fusiones de genes pueden asociarse con, y en algunos casos contribuir a, el desarrollo de una célula sana en una neoplasia (un tumor o un adenoma). La detección de estos eventos de fusión de genes puede proporcionar un enfoque útil para detectar y/o monitorizar la presencia de una neoplasia en un paciente. Sin embargo, los fragmentos de puntos de ruptura tendrán menos secuencia derivada de cualquier gen que flanquea el punto de ruptura que un fragmento de ácido nucleico de una longitud similar que comprende la secuencia de solo uno de los genes. Por esta razón, un fragmento de punto de ruptura a menudo solo es capaz de unirse a una sección reducida de una sonda génica o un oligonucleótido específico del gen. Si las condiciones de hibridación y lavado se han optimizado para una unión de longitud completa o casi completa, el fragmento de ácido nucleico que contiene el punto de ruptura puede hibridar con afinidad insuficiente y perderse (ver FIG. 1). Además, en una muestra heterogénea que contiene fragmentos de ácido nucleico de células que han y no han experimentado eventos de fusión de genes, los fragmentos de ácido nucleico de aquellas que no han experimentado eventos de fusión de genes pueden unirse de manera más estable a la sonda del gen o al oligonucleótido específico del gen e inhibir competitivamente la hibridación. de fragmentos de ácidos nucleicos que contienen puntos de ruptura.

El ácido nucleico derivado de tumores puede encontrarse en fluidos corporales libres de células. Los ácidos nucleicos derivados de tumores de tales fluidos corporales libres de células pueden ensayarse para fragmentos de ácidos nucleicos que contienen genes de fusión para detectar neoplasias. Los fluidos corporales libres de células pueden contener pequeñas cantidades de ácido nucleico derivado de tumores, y el ácido nucleico derivado de tumores puede mezclarse con ácido nucleico que se deriva de tejido sano. La presente divulgación también proporciona enfoques para enriquecer fragmentos de ácidos nucleicos que contienen genes de fusión de ácido nucleico derivado de un fluido corporal libre de células.

III. Muestras de prueba

A. Tipos de sujetos

Se recogen muestras de sujetos, por ejemplo, pacientes con riesgo de desarrollar cáncer. Los sujetos pueden ser pacientes sin factores de riesgo conocidos de cáncer. Los sujetos pueden ser pacientes cuyos únicos factores de riesgo de cáncer sean la edad y/o el sexo. En algunos casos, los sujetos pueden tener factores de riesgo conocidos de cáncer, por ejemplo, tabaquismo o antecedentes familiares de cáncer. En algunos casos, los sujetos pueden ser pacientes con síntomas de cáncer.

Otros sujetos pueden ser pacientes con neoplasias que se hayan detectado anteriormente mediante colonoscopia o imagenología. Las muestras derivadas de pacientes con neoplasias detectadas anteriormente pueden analizarse para fragmentos de ácidos nucleicos que contengan puntos de ruptura para recomendar un curso de tratamiento o terapia. Las muestras derivadas de pacientes con neoplasias pueden analizarse para fragmentos de ácidos nucleicos que contengan puntos de ruptura para determinar la efectividad del tratamiento o terapia que están recibiendo.

Otros sujetos pueden ser pacientes con neoplasias que se han detectado anteriormente, pero en los que la neoplasia ya no es detectable (pacientes en remisión o que no tienen evidencia de enfermedad). Las muestras derivadas de pacientes en los que la neoplasia ya no es detectable pueden analizarse para fragmentos de ácidos nucleicos que contengan puntos de ruptura para detectar una recaída o reemergencia de la neoplasia.

Otros sujetos pueden ser mujeres con historial familiar de cáncer, en donde se sabe o se sospecha que el defecto genético responsable del cáncer familiar es un gen de fusión. En algunos casos, una mujer con historial familiar de cáncer puede estar embarazada y querer determinar si el feto del que está embarazada tiene el gen de fusión. En algunos casos, una muestra que contiene ácidos nucleicos fetales de tal sujeto puede probarse para el evento de fusión génica.

B. Tipos de muestras

Las muestras pueden ser ácidos nucleicos extraídos de varias fuentes. Los ácidos nucleicos pueden ser, pero no están limitados a, ADN genómico, ARN, ADN mitocondrial, ADN fetal y ARNmi.

Las muestras pueden extraerse de una variedad de fluidos corporales que contienen ácidos nucleicos libres de células, que incluyen pero no se limitan a sangre, suero, plasma, vítreo, esputo, orina, lágrimas, transpiración, saliva, semen, excreciones mucosas, moco, líquido cefalorraquídeo, líquido amniótico, líquido linfático y similares. La recogida de fluidos corporales puede lograrse usando una variedad de técnicas. En algunos casos, la recogida puede comprender la aspiración de un fluido corporal de un sujeto usando una jeringuilla. En otros casos, la recogida puede comprender el pipeteo o la recogida directa de fluido en un recipiente de recogida.

Después de la recogida de fluido corporal, los ácidos nucleicos libres de células pueden aislarse y extraerse usando una variedad de técnicas. En algunos casos, los ácidos nucleicos libres de células pueden aislarse, extraerse y prepararse usando kits disponibles comercialmente, como el protocolo de kit de ácidos nucleicos circulantes Qiagen Qiamp®. En otros ejemplos, el protocolo del kit de ensayo Qiagen Qubit™ dsDNA HS, el kit Agilent™ DNA 1000 o la preparación de la biblioteca de secuenciación TruSeq™; puede usarse el protocolo de bajo rendimiento (LT) para cuantificar los ácidos nucleicos. Los ácidos nucleicos libres de células pueden ser de origen fetal (a través de líquido extraído de una mujer embarazada) o pueden derivarse del tejido de la propia mujer. Los ácidos nucleicos libres de células pueden derivarse de una neoplasia (por ejemplo, un tumor o un adenoma).

Generalmente, los ácidos nucleicos libres de células se extraen y aíslan de fluidos corporales a través de un paso de división en el que los ácidos nucleicos libres de células, como se encuentran en solución, se separan de las células y otros componentes no solubles del fluido corporal. La división puede incluir, pero no se limita a, técnicas como centrifugación o filtración. En otros casos, las células no se separan primero de los ácidos nucleicos libres de células, sino que se lisan. En un ejemplo, el ADN genómico de células intactas se divide mediante precipitación selectiva. Los ácidos nucleicos libres de células, incluyendo el ADN, pueden permanecer solubles y pueden separarse del ADN genómico insoluble y extraerse. Generalmente, después de la adición de tampones y otros pasos de lavado específicos para diferentes kits, los ácidos nucleicos pueden precipitarse usando precipitación con isopropanol. Pueden usarse pasos de limpieza adicionales, como columnas a base de sílice, para eliminar contaminantes o sales. Los pasos generales pueden optimizarse para aplicaciones específicas. Pueden añadirse ácidos nucleicos portadores a granel no específicos, por ejemplo, a lo largo de la reacción para optimizar ciertos aspectos del procedimiento, como el rendimiento.

Los ácidos nucleicos libres de células pueden tener como máximo 500 nucleótidos de longitud, como máximo 400 nucleótidos de longitud, como máximo 300 nucleótidos de longitud, como máximo 250 nucleótidos de longitud, como máximo 225 nucleótidos de longitud, como máximo 200 nucleótidos de longitud, como máximo 190 nucleótidos de longitud, como máximo 180 nucleótidos de longitud, como máximo 170 nucleótidos de longitud, como máximo 160 nucleótidos de longitud, como máximo 150 nucleótidos de longitud, como máximo 140 nucleótidos de longitud, como máximo 130 nucleótidos de longitud, como máximo 120 nucleótidos de longitud, como máximo 110 nucleótidos de longitud o como máximo 100 nucleótidos de longitud.

Los ácidos nucleicos libres de células pueden tener por lo menos 500 nucleótidos de longitud, por lo menos 400 nucleótidos de longitud, por lo menos 300 nucleótidos de longitud, por lo menos 250 nucleótidos de longitud, por lo menos 225 nucleótidos de longitud, por lo menos 200 nucleótidos de longitud. longitud, por lo menos 190 nucleótidos de longitud, por lo menos 180 nucleótidos de longitud, por lo menos 170 nucleótidos de longitud, por lo menos 160 nucleótidos de longitud, por lo menos 150 nucleótidos de longitud, por lo menos 140 nucleótidos de longitud, por lo menos 130 nucleótidos de longitud, por lo menos 120 nucleótidos de longitud, por lo menos 110 nucleótidos de longitud o por lo menos 100 nucleótidos de longitud. En particular, los ácidos nucleicos libres de células pueden tener una longitud de entre 140 y 180 nucleótidos.

Puede extraerse una muestra de tejido del sujeto. Una muestra puede ser una biopsia de tumor. La biopsia del tumor puede contener una mezcla tejido tumoral y sano. La biopsia del tumor puede fijarse con formaldehído e incrustarse en parafina. El tumor puede ser por lo menos el 0,1% de la biopsia, por lo menos el 0,2% de la biopsia, por lo menos el 0,5% de la biopsia, por lo menos el 0,7% de la biopsia, por lo menos el 1% de la biopsia, por lo menos el 2% de la biopsia, por lo menos el 3% de la biopsia, por lo menos un 4% de la biopsia, por lo menos el 5% de la biopsia, por lo menos el 10% de la biopsia, por lo menos el 15% de la biopsia, por lo menos el 20% de la biopsia, por lo menos el 25% de la biopsia, o por lo menos el 30% de la biopsia. Una muestra puede ser una biopsia de tejido sano.

Los ácidos nucleicos extraídos del tejido pueden tener como máximo 10 kb de longitud, como máximo 7 kb de longitud, como máximo 5 kb de longitud, como máximo 4 kb de longitud, como máximo 3 kb de longitud, como máximo 2 kb de longitud, como máximo 1 kb de longitud, como máximo 500 nucleótidos de longitud, como máximo 400 nucleótidos de longitud, como máximo 300 nucleótidos de longitud, como máximo 250 nucleótidos de longitud, como máximo 225 nucleótidos de longitud, como máximo 200 nucleótidos de longitud, como máximo 190 nucleótidos de longitud, como máximo 180 nucleótidos de longitud, como máximo 170 nucleótidos de longitud, como máximo 160 nucleótidos de longitud, como máximo 150 nucleótidos de longitud, como máximo 140 nucleótidos de longitud, como máximo 130 nucleótidos de longitud, como máximo 120 nucleótidos de longitud, como máximo 110 nucleótidos de longitud o como máximo 100 nucleótidos de longitud.

Los ácidos nucleicos extraídos del tejido pueden tener por lo menos 5 kb de longitud, por lo menos 4 kb de longitud, por lo menos 3 kb de longitud, por lo menos 2 kb de longitud, por lo menos 1 kb de longitud, por lo menos 500 nucleótidos de longitud, por lo menos 400 nucleótidos de longitud, por lo menos 300 nucleótidos de longitud, por lo menos 250 nucleótidos de longitud, por lo menos 225 nucleótidos de longitud, por lo menos 200 nucleótidos de longitud, por lo menos 190 nucleótidos de longitud, por lo menos 180 nucleótidos de longitud, por lo menos 170 nucleótidos de longitud, por lo menos 160 nucleótidos de longitud, por lo menos 150 nucleótidos de longitud, por lo menos 140 nucleótidos de longitud, por lo menos 130 nucleótidos de longitud, por lo menos 120 nucleótidos de longitud, por lo menos 110 nucleótidos de longitud, o por lo menos 100 nucleótidos de longitud.

En algunos casos, los ácidos nucleicos pueden cortarse durante el proceso de extracción y comprenden fragmentos de entre 100 y 400 nucleótidos de longitud. En algunos casos, los ácidos nucleicos pueden cortarse después de la extracción y pueden comprender nucleótidos de entre 100 y 400 nucleótidos de longitud.

El aislamiento y la purificación de ácidos nucleicos libres de células y derivados de tejidos puede lograrse usando varios enfoques, que incluyen, pero no están limitados a, el uso de kits y protocolos comerciales proporcionados por compañías como Sigma Aldrich, Life Technologies, Promega, Affymetrix, IBI o similares. Los kits y protocolos también pueden estar disponibles no comercialmente.

IV. Análisis genético

El análisis genético incluye la detección de variantes de secuencia de nucleótidos, variaciones en el número de copias y genes de fusión. Las variantes genéticas pueden determinarse mediante secuenciación. El método de secuenciación puede ser secuenciación masivamente paralela, es decir, secuenciación simultánea (o en sucesión rápida) de cualquiera de por lo menos 100.000, 1 millón, 10 millones, 100 millones o 1 billón de moléculas de polinucleótidos. Los métodos de secuenciación pueden incluir, pero no están limitados a: secuenciación de alto rendimiento, pirosecuenciación, secuenciación por síntesis, secuenciación de moléculas individuales, secuenciación de nanoporos, secuenciación de semiconductores, secuenciación por ligación, secuenciación por hibridación, RNA-Seq (Illumina), Expresión genética digital (Helicos), secuenciación de próxima generación, secuenciación de moléculas individuales por síntesis (SMSS) (Helicos), secuenciación masivamente paralela, matriz de moléculas individuales clonal (Solexa), secuenciación de escopeta, secuenciación de Maxam-Gilbert o Sanger, paseo de cebadores, secuenciación usando PacBio, SOLiD, Ion Torrent, plataformas basadas en nanopore u otros métodos de secuenciación.

La secuenciación puede hacerse más eficaz realizando la captura de secuencias, es decir, el enriquecimiento de una muestra para secuencias objetivo de interés, secuencias de genes de fusión de cáncer y puntos de ruptura de genes de fusión de cáncer como se describe en la presente. La captura de secuencias puede realizarse usando sondas inmovilizadas que hibridan con los objetivos de interés. La captura de secuencias puede realizarse usando sondas unidas a grupos funcionales, biotina, que permiten que las sondas hibriden con secuencias específicas a enriquecer a partir de una muestra mediante derribo. En algunos casos, antes de la hibridación con sondas funcionalizadas, pueden enmascararse secuencias específicas como secuencias adaptadoras de fragmentos de bibliotecas apareando secuencias de polinucleótidos complementarias no funcionalizadas con los fragmentos para reducir la unión no específica o fuera del objetivo.

En algunos casos, los fragmentos de ácido nucleico libre de células o los fragmentos de ácido nucleico derivados de tejido son entradas para producir bibliotecas de secuenciación. En algunos casos, los fragmentos se enriquecen para una secuencia específica antes de preparar una biblioteca de secuenciación. Los ácidos nucleicos fragmentados enriquecidos pueden unirse a cualquier adaptador de secuenciación adecuado para su uso en cualquier plataforma de secuenciación divulgada en la presente. Por ejemplo, un adaptador de secuencias puede comprender una secuencia de célula de flujo, un código de barras de muestras o ambos. En otro ejemplo, un adaptador de secuencias puede ser un adaptador con forma de horquilla y/o comprender un código de barras de muestras. Además, los fragmentos resultantes pueden amplificarse y secuenciarse. En algunos casos, el adaptador no comprende una región de cebador de secuenciación. En algunos casos, las bibliotecas de secuenciación se enriquecen para secuencias específicas antes de la secuenciación.

Los ácidos nucleicos libres de células pueden incluir pequeñas cantidades de ácidos nucleicos tumorales mezclados con ácidos nucleicos de la línea germinal. En algunos casos, las biopsias de tumores pueden incluir pequeñas cantidades de tejido tumoral mezclado con tejido sano, y los ácidos nucleicos extraídos de tales muestras sin enriquecimiento pueden incluir pequeñas cantidades de ácidos nucleicos tumorales mezclados con ácidos nucleicos de la línea germinal. Los métodos de secuenciación que aumentan la sensibilidad y la especificidad de la detección de ácidos nucleicos tumorales y, en particular, las variantes de secuencias genéticas y la variación del número de copias, pueden ser útiles en los métodos de esta invención. Tales métodos se describen, por ejemplo, en la WO 2014/039556, WO 2014/149134 y WO 2015/100427. Estos métodos no solo pueden detectar moléculas con una sensibilidad de hasta el 0,1% o más, sino que también pueden distinguir estas señales del ruido típico de los métodos de secuenciación actuales. Los aumentos en la sensibilidad y la especificidad de muestras a base de sangre de ácidos nucleicos libres de células pueden lograrse usando varios métodos. Un método incluye el etiquetado de alta eficacia de moléculas de ácido nucleico en la muestra, etiquetando por lo menos cualquiera del 50%, 75% o 90% de los polinucleótidos en una muestra. Esto aumenta la probabilidad de que una molécula objetivo de abundancia baja en una muestra sea etiquetada y posteriormente secuenciada, y aumenta significativamente la sensibilidad de detección de moléculas objetivo.

Otro método implica el seguimiento molecular, que identifica las lecturas de secuencia que se han generado de manera redundante a partir de una molécula parental original y asigna la identidad más probable de una base en cada locus o posición en la molécula parental. Esto aumenta significativamente la especificidad de detección al reducir el ruido generado por los errores de amplificación y de secuenciación, lo que reduce la frecuencia de falsos positivos.

Los métodos de la presente divulgación pueden usarse para detectar la variación genética en material genético de partida inicial no etiquetado de forma única (ácidos nucleicos raros) a una concentración que es menor del 5%, 1%, 0,5%, 0,1%, 0,05%, o 0,01%, con una especificidad de por lo menos el 99%, 99,9%, 99,99%, 99,999%, 99,9999% o 99,99999%. Las lecturas de secuencia de polinucleótidos etiquetados pueden seguirse posteriormente para generar secuencias de consenso para polinucleótidos con una tasa de error de no más del 2%, 1%, 0,1% o 0,01%.

V. Eventos de fusión de genes y regiones de puntos de ruptura

Los eventos de fusión de genes son reordenamientos cromosómicos (inversión, deleción y translocación) que unen porciones anteriormente separadas de por lo menos dos genes diferentes en un genoma, dando como resultado un gen de fusión. Los genes de fusión pueden asociarse con y/o provocar la formación de una neoplasia. Un gen de fusión puede ser un gen de fusión de cáncer. Un gen de fusión de cáncer puede ser un gen de fusión resultante de una mutación somática que está presente en un cáncer. En las FIGS 2A y 2B se encuentran ejemplos no limitativos de pares de genes que pueden formar genes de fusión de cáncer. En la FIG. 3 se enumeran ejemplos no limitativos de genes implicados en genes de fusión.

La FIG. 8 muestra ejemplos no limitativos de regiones genómicas del gen ALK que pueden ser el objetivo de una cobertura más profunda. Las regiones genómicas en la FIG. 8 pueden corresponder a diferentes variantes del gen ALK. Tal cobertura profunda puede cuantificarse por el número de moléculas únicas obtenidas después de secuenciar y colapsar con códigos de barras moleculares, por ejemplo, aproximadamente 2-3 mil moléculas para variantes típicas frente a aproximadamente 4 mil moléculas para las regiones genómicas de la FIG. 8. Un intervalo de unos pocos miles de moléculas únicas puede corresponder a una profundidad de secuenciación superior a 1000x, 2000x, 3000x, 4000x, 5000x o 10000x.

Típicamente, un gen de fusión puede dar como resultado una yuxtaposición aberrante de dos genes que pueden codificar una proteína de fusión (BCR-ABL1), o los elementos reguladores de un gen pueden impulsar la expresión aberrante de un oncogén (TMPRSS2-ERG). A pesar de la naturaleza recurrente de los genes de fusión de cáncer, la localización exacta del punto de ruptura de cada gen de fusión puede variar. Una región de punto de ruptura se refiere a una región de un gen que puede estar implicada en fusiones de genes en las que puede producirse un punto de ruptura. En algunos casos, la región del punto de ruptura está como máximo a 500 nucleótidos de un punto de ruptura. En algunos casos, la región del punto de ruptura está como máximo a 200 nucleótidos de un punto de ruptura, como máximo a 500 nucleótidos de un punto de ruptura, como máximo a 750 nucleótidos de un punto de ruptura, como máximo a 1 kilobase (kb) de un punto de ruptura, como máximo a 5 kb de un punto de ruptura, como máximo a 10 kb de un punto de ruptura, como máximo a 20 kb de un punto de ruptura, como máximo a 30 kb de un punto de ruptura, como máximo a 40 kb de un punto de ruptura, como máximo a 50 kb de un punto de ruptura, o como máximo a 100 kb de un punto de ruptura.

En la FIG, 4A-4U se proporcionan puntos de ruptura ejemplares, no limitativos para pares de genes dados del Catalog of Somatic Mutations in Cancer (COSMIC; ver Forbes et al., Nucleic Acids Research (2014) 43:D805-D811). Para cada par de genes, se proporciona una ID de mutación específico en la primera columna que indica una clase particular de constructo de fusión detectado o inferido de la bibliografía. Por ejemplo, la FIG. 4A proporciona 29 clases de constructos de fusión detectados o inferidos de la bibliografía. Para cada mutación, el compañero de fusión 5' y 3' (5' y 3' son con respecto a la direccionalidad de la transcripción de cada gen) proporciona cada uno el nombre del gen, el último exón observado, el punto de ruptura inferido relativo a la transcripción, si hay y si está insertada la secuencia. Para cada ID de mutación, también se proporcionan una serie de muestras únicas observadas con la mutación y el porcentaje de genes de fusión que implican los dos genes que tienen esa mutación particular.

Por ejemplo, la primera fila de la FIG. 4A indica que la mutación COSF463 es una fusión EML4-ALK, en donde el gen EML4 se ha fusionado en sentido ascendente del gen ALK. En este ejemplo, el último exón de EML4 observado es el exón 13 y el punto de ruptura inferido está en la posición genómica correspondiente a la posición 1751 del transcrito del gen EML4. El gen EML4 se ha fusionado de tal manera que el primer exón ALK después de la unión de fusión es el exón 20, y la posición del punto de ruptura inferida es la posición genómica correspondiente a la posición 4080 del transcrito del gen ALK. No hay ninguna secuencia insertada adicional en el gen del compañero 5' o del compañero 3'. El gen de fusión COSF463 se ha detectado en 170 muestras únicas, o el 25% de todos los genes de fusión EML4-ALK incluidos en la base de datos COSMIC. En algunos casos, tal COSF488 (FIG. 4A, fila 5), el punto de ruptura inferido incluye un '+' seguido de un número, que denota una posición genómica de ese número de bases en sentido descendente (en un intrón o UTR) de la posición de la transcripción indicada por el primer número. Si el número está entre paréntesis, la posición es aproximada. En algunos casos, tal COSF488 (FIG. 4a , fila 5), el punto de ruptura inferido incluye un '-' seguido de un número, que denota una posición genómica de ese número de bases en sentido ascendente (en un intrón o UTR) de la posición de la transcripción indicada por el primer número. Si el número está entre paréntesis, la posición es aproximada. Un '?' indica que se desconoce el punto de ruptura exacto. Por ejemplo, en COSF488, el punto de ruptura es 654 bases en sentido descendente de la posición genómica correspondiente a la posición 2318 de la transcripción del gen EML4, que se ha fusionado en una posición 172 bases en sentido ascendente de la posición genómica correspondiente a la posición 4080 de la transcripción del gen ALK.

VI. Polinucleótidos de alta afinidad

En algunos casos, el polinucleótido de alta afinidad puede tener por lo menos aproximadamente 450 nucleótidos de longitud, por lo menos aproximadamente 425 nucleótidos de longitud, por lo menos aproximadamente 400 nucleótidos de longitud, por lo menos aproximadamente 375 nucleótidos de longitud, por lo menos aproximadamente 350 nucleótidos de longitud, por lo menos aproximadamente 325 nucleótidos de longitud, por lo menos aproximadamente 300 nucleótidos de longitud, por lo menos aproximadamente 275 nucleótidos de longitud, por lo menos aproximadamente 250 nucleótidos de longitud, por lo menos aproximadamente 225 nucleótidos de longitud, por lo menos aproximadamente 200 nucleótidos de longitud, por lo menos aproximadamente 180 nucleótidos de longitud, por lo menos aproximadamente 160 nucleótidos de longitud, por lo menos aproximadamente 140 nucleótidos de longitud, por lo menos aproximadamente 120 nucleótidos de longitud, por lo menos aproximadamente 100 nucleótidos de longitud, por lo menos aproximadamente 80 nucleótidos de longitud, por lo menos aproximadamente 60 nucleótidos de longitud, por lo menos aproximadamente 40 nucleótidos de longitud, o por lo menos aproximadamente 20 nucleótidos de longitud.

Además, en algunos casos, el polinucleótido de alta afinidad puede tener como máximo aproximadamente 500 nucleótidos de longitud, como máximo aproximadamente 450 nucleótidos de longitud, como máximo aproximadamente 425 nucleótidos de longitud, como máximo aproximadamente 400 nucleótidos de longitud, como máximo aproximadamente 375 nucleótidos de longitud, como máximo aproximadamente 350 nucleótidos de longitud, como máximo aproximadamente 325 nucleótidos de longitud, como máximo aproximadamente 300 nucleótidos de longitud, como máximo aproximadamente 275 nucleótidos de longitud, como máximo aproximadamente 250 nucleótidos de longitud, como máximo aproximadamente 225 nucleótidos de longitud, como máximo aproximadamente 200 nucleótidos de longitud, como máximo aproximadamente 180 nucleótidos de longitud, como máximo aproximadamente 160 nucleótidos de longitud, como máximo aproximadamente 140 nucleótidos de longitud, como máximo aproximadamente 120 nucleótidos de longitud, como máximo aproximadamente 100 nucleótidos de longitud, como máximo aproximadamente 80 nucleótidos de longitud, como máximo aproximadamente 60 nucleótidos de longitud, como máximo aproximadamente 40 nucleótidos de longitud, o como máximo aproximadamente 20 nucleótidos de longitud.

En particular, en algunos casos, los polinucleótidos de alta afinidad pueden tener entre aproximadamente 20 y aproximadamente 200 nucleótidos de longitud. Además, en algunos casos, los polinucleótidos de alta afinidad pueden tener entre aproximadamente 80 y aproximadamente 160 nucleótidos de longitud.

En ciertas realizaciones, los polinucleótidos de alta afinidad de esta invención tienen una secuencia de por lo menos 10, por lo menos 25, por lo menos 50, por lo menos 100 o por lo menos 150 nucleótidos perfectamente complementarios o sustancialmente complementarios a una secuencia objetivo de un gen de fusión.

Los polinucleótidos de alta afinidad pueden contener uno o más nucleótidos de LNA. En algunos casos, el 100% de los nucleótidos dentro del polinucleótido de alta afinidad son nucleótidos de LNA. En algunos casos, por lo menos el 90%, por lo menos el 70%, por lo menos el 50%, por lo menos el 20%, por lo menos el 10%, por lo menos el 5% o por lo menos el 1% de los nucleótidos dentro de los polinucleótidos de alta afinidad son nucleótidos de LNA. En algunos casos, como máximo el 90%, como máximo el 70%, como máximo el 50%, como máximo el 20%, como máximo el 10%, como máximo el 5% o como máximo el 1% de los nucleótidos dentro del polinucleótido de alta afinidad son nucleótidos de LNA.

Si un polinucleótido de alta afinidad contiene más de un nucleótido de LNA, en algunos casos los nucleótidos de LNA pueden estar separados por no más de 30 nucleótidos, no más de 20 nucleótidos, no más de 15 nucleótidos, no más de 10 nucleótidos, o no más de 5 nucleótidos. En otros casos en los que el polinucleótido de alta afinidad contiene más de un nucleótido LNA, los nucleótidos LNA pueden estar separados por lo menos por 30 nucleótidos, por lo menos por 20 nucleótidos, por lo menos por 15 nucleótidos, por lo menos por 10 nucleótidos o por lo menos por 5 nucleótidos.

Para cada nucleótido de LNA insertado en lugar de un nucleótido natural en un polinucleótido de alta afinidad, la temperatura de fusión del dúplex del polinucleótido de alta afinidad y su secuencia complementaria que comprende solo nucleótidos naturales puede aumentar por lo menos 1° C, por lo menos 2° C, por lo menos 3° C, por lo menos 4° C, por lo menos 5° C, por lo menos 6° C, por lo menos 7° C, por lo menos 8° C, por lo menos 9° C, o por lo menos 10° C en condiciones estrictas. En particular, para cada nucleótido de LNA insertado en lugar de un nucleótido natural, la temperatura de fusión puede aumentar entre aproximadamente 2° C y aproximadamente 8° C.

En algunos casos, la temperatura de fusión de un polinucleótido de alta afinidad (que comprende uno o más nucleótidos LNA) puede ser por lo menos un 0,5% más alta, por lo menos un 1% más alta, por lo menos un 2% más alta, por lo menos un 3% más alta, en menos 4% más alta, por lo menos un 5% más alta, por lo menos un 10% más alta, por lo menos un 15% más alta, por lo menos un 20% más alta, por lo menos un 25% más alta, por lo menos un 30% más alta, por lo menos un 35% más alta, por lo menos un 40% más alta, por lo menos un 45% más alta, por lo menos un 50% más alta, por lo menos un 55% más alta, por lo menos un 60% más alta, por lo menos un 65% más alta, por lo menos un 70% más alta, por lo menos un 75% más alta, por lo menos un 80 % más alta, por lo menos un 85% más alta, por lo menos un 90% más alta, por lo menos un 95% más alta, o por lo menos un 100% más alta que la temperatura de fusión de un polinucleótido que comprende solo nucleótidos naturales con la misma secuencia que el polinucleótido de alta afinidad.

En una configuración, las sondas unidas pueden purificarse por afinidad usando una combinación de compañeros de unión. En un ejemplo, las sondas pueden contener un compañero de unión como biotina. La pareja de unión puede usarse luego como señuelo para una pareja de unión adicional, como estreptavidina, en un paso de purificación por afinidad. En algunos casos, las sondas unidas pueden purificarse por afinidad a partir de sondas no unidas. En otros casos, las cadenas de polinucleótidos de muestra, que comprenden un compañero de unión y sondas unidas, pueden purificarse por afinidad a partir de sondas no unidas.

Generalmente, puede ser adecuado cualquier enfoque químico para la captura de las sondas unidas. En algunos casos, la captura puede lograrse mediante métodos que comprenden biotina y estreptavidina, o derivados de estreptavidina. Por ejemplo, una realización de la divulgación proporciona la captura de fragmentos de bibliotecas de secuenciación de genes de fusión, en donde las sondas para los genes implicados en el gen de fusión, las sondas para la región del punto de ruptura y/o las sondas para el punto de ruptura se aparean con las cadenas fundidas de la biblioteca de secuenciación y se purifican por afinidad lejos de otros fragmentos de bibliotecas de secuenciación.

Para el aislamiento pueden usarse partículas magnéticamente atraíbles, como perlas. Puede usarse cualquier técnica de aislamiento de perlas adecuada con los métodos de la presente divulgación. En algunos casos, las perlas pueden ser útiles para el aislamiento ya que las moléculas de interés pueden unirse a las perlas y las perlas pueden lavarse para eliminar los componentes de la solución no unidos a las perlas, lo que permite el enriquecimiento, la purificación y/o el aislamiento. Las perlas pueden estar separadas de otros componentes en la solución en base a propiedades como tamaño, densidad o propiedades dieléctricas, iónicas y magnéticas. En realizaciones preferidas, las partículas son magnéticamente atraíbles. Las partículas magnéticamente atraíbles pueden introducirse, mezclarse, eliminarse y liberarse en solución usando campos magnéticos. También pueden automatizarse procesos que utilizan partículas magnéticamente atraíbles. Las partículas magnéticamente atraíbles son suministradas por varios proveedores, incluyendo NEB, Dynal, Micromod, Turbobeads y Spherotech. Las partículas pueden funcionalizarse usando química de funcionalización para proporcionar una superficie que tenga los grupos de unión requeridos para la unión a polinucleótidos.

En algunos casos, la sonda y/o el polinucleótido de alta afinidad se configuran para hibridar con un gen de fusión de cáncer. Por ejemplo, la sonda y/o el polinucleótido de alta afinidad pueden ser complementarios a una porción de cualquier gen del que se deriva el gen de fusión. En algunos casos, el gen de fusión de cáncer puede ser uno o más genes seleccionados de las listas presentadas en las FIGS. 2A-2B.

En algunos casos, la sonda y/o el polinucleótido de alta afinidad pueden configurarse para hibridar con una región de punto de ruptura. Por ejemplo, en algunos casos la sonda y/o el polinucleótido de alta afinidad pueden ser complementarios con una porción de una región de punto de ruptura (la sonda y/o el polinucleótido de alta afinidad pueden ser complementarios a una secuencia dentro de 500 nucleótidos de un punto de ruptura). Además, en algunos casos, la sonda y/o el polinucleótido de alta afinidad pueden configurarse para hibridar a través de un punto de ruptura en un gen de fusión (ver FIG. 6C). Por ejemplo, la sonda y/o el polinucleótido pueden ser complementarios a una porción de la secuencia en cada lado de un punto de ruptura (ver FIG. 6D).

VII. Conjuntos de sondas y/o polinucleótidos

En algunos casos, se proporcionan conjuntos de sondas y/o polinucleótidos. En algunos casos, todas las sondas y/o polinucleótidos del conjunto comprenden nucleótidos de LNA. En algunos casos, un subconjunto de las sondas y/o polinucleótidos en el conjunto comprende solo nucleótidos naturales, a lo que se hace referencia en lo sucesivo como un "subconjunto de afinidad estándar", y un segundo subconjunto que comprende uno o más nucleótidos de LNA, a lo que se hace referencia en lo sucesivo como un "subconjunto de alta afinidad".

En una realización, el conjunto de sondas incluye una o más sondas dirigidas a una secuencia de nucleótidos en una región de punto de ruptura de un gen de fusión.

Pueden proporcionarse sondas y/o polinucleótidos en una variedad de profundidades de cobertura. Por ejemplo, en algunos casos la profundidad de cobertura puede ser de por lo menos 0,5x, en donde un conjunto de sondas o polinucleótidos se dirigen a la mitad media de las bases en una región (ver la FIG. 5A).

En algunos casos, la profundidad de cobertura puede ser por lo menos 1x, en donde las sondas y/o los polinucleótidos se diseñan de tal manera que cada base de una región sea objetivo de media de una única secuencia de sondas y/o de polinucleótidos. En algunos casos, la profundidad de cobertura puede ser de por lo menos 2x, en donde las sondas y/o polinucleótidos se diseñan de manera que cada base en una región sea objetivo de media de dos secuencias de sondas y/o de polinucleótidos. En algunos casos, la profundidad de cobertura por un conjunto de sondas o polinucleótidos puede ser por lo menos 3x, por lo menos 4x o por lo menos 5x. En algunos casos, las sondas y/o polinucleótidos pueden estar en traslape, en donde un conjunto de sondas y/o polinucleótidos se diseñan de tal manera que una región objetivo contigua está cubierta por las secuencias de sondas y/o de polinucleótidos (ver FIG. 5B).

En algunos casos, puede ser preferible usar un subconjunto de afinidad estándar de sondas y/o polinucleótidos para enriquecer algunos fragmentos de ácidos nucleicos de interés, y usar un subconjunto de sondas y/o polinucleótidos de alta afinidad para enriquecer otros fragmentos de ácidos nucleicos en la misma muestra. Por ejemplo, en algunos casos, un subconjunto de afinidad estándar de sondas y/o polinucleótidos puede dirigirse a exomas, oncogenes o genes supresores de tumores, y un subconjunto de sondas y/o polinucleótidos de alta afinidad puede dirigirse a genes de fusión, como genes de fusión de cáncer (por ejemplo los genes enumerados en la FIG.

3). En otro ejemplo, en algunos casos, un subconjunto de afinidad estándar se dirige con una primera profundidad de cobertura a una porción contigua o no contigua de uno o más genes implicados en una fusión de genes, incluyendo las regiones de punto de ruptura, y un subconjunto de alta afinidad se dirige con una segunda profundidad de cobertura a regiones de punto de ruptura (ver FIG. 6A). En algunos casos, un subconjunto de afinidad estándar apunta con una primera profundidad de cobertura a una porción contigua o no contigua de cada uno de los genes, excluyendo las regiones de punto de ruptura, y un subconjunto de alta afinidad se dirige con una segunda profundidad de cobertura a las regiones de punto de ruptura (ver FIG. 6B). En algunos casos, un subconjunto de afinidad estándar se dirige con una primera profundidad de cobertura a una porción contigua o no contigua de cada uno de los genes, y un subconjunto de alta afinidad se dirige con una segunda profundidad de cobertura a los puntos de ruptura (ver Figura 6C). En algunos casos, un subconjunto de afinidad estándar se dirige con una primera profundidad de cobertura a una porción contigua o no contigua de cada uno de los genes, y un subconjunto de alta afinidad se dirige con una segunda profundidad de cobertura a la secuencia de cualquier lado de un punto de ruptura, pero no al propio punto de ruptura (ver la FIG. 6D).

En algunos casos, un conjunto de sondas y/o polinucleótidos está configurado para dirigirse a más de un gen para enriquecer un panel de genes que pueden estar implicados en fusiones de genes (ver, por ejemplo, la FIG.

7). Además, en algunos casos, un conjunto de sondas y/o polinucleótidos está configurado para dirigirse a más de un gen y sus puntos de ruptura o regiones de puntos de ruptura.

En algunos casos, los conjuntos de sondas y/o polinudeótidos están configurados para dirigirse a un gen de fusión específico. Por ejemplo, las sondas y/o polinucleótidos pueden diseñarse para dirigirse a uno o ambos genes implicados en la fusión de genes. En algunos casos, un conjunto de sondas y/o polinucleótidos comprenden sondas y/o polinucleótidos que se dirigen a un único gen y/o sus puntos de ruptura o regiones de puntos de ruptura.

En algunos casos, las sondas y/o polinucleótidos de afinidad estándar se mezclan con las sondas y/o polinucleótidos de alta afinidad. En algunos casos, las sondas y/o polinucleótidos de afinidad estándar y las sondas y/o polinucleótidos de alta afinidad se separan y emplean secuencialmente. Además, en algunos casos, la muestra se pone en contacto primero con las sondas de afinidad estándar, y luego los fragmentos de ácido nucleico no capturados se ponen en contacto con las sondas de alta afinidad.

En algunos casos, los conjuntos de sondas de alta afinidad pueden incluir polinucleótidos de afinidad estándar dopados con polinucleótidos de alta afinidad. En un conjunto de sondas de este tipo, una secuencia objetivo puede dirigirse para la hibridación mediante polinucleótidos estándar y de alta afinidad. En tal conjunto dopado, los polinucleótidos de alta afinidad pueden dirigirse solo a secuencias en una región de punto de ruptura. VIII. Kits

La presente divulgación proporciona kits para enriquecer muestras para fragmentos de puntos de ruptura. Los kits pueden comprender cualquiera de las sondas y/o polinucleótidos divulgados en la presente. En algunos casos, el kit puede comprender una pluralidad de conjuntos de sondas, en donde cada conjunto de sondas hibrida con un gen diferente y por lo menos uno de los conjuntos de sondas está configurado para hibridar con un gen de fusión y comprende uno o más polinucleótidos y/o sondas de alta afinidad.

IX. Métodos de uso

La presente divulgación proporciona métodos para enriquecer fragmentos de puntos de ruptura usando cualquiera de las sondas y/o polinucleótidos divulgados en la presente. Tales métodos pueden comprender poner en contacto un conjunto de sondas que hibrida con un gen de fusión, en donde una o más sondas y/o polinucleótidos es un polinucleótido y/o sonda de alta afinidad, con una mezcla de polinucleótidos para producir polinucleótidos capturados por sondas. Los polinucleótidos capturados por sondas pueden aislarse luego para producir una muestra enriquecida de polinucleótidos que comprenden fragmentos de puntos de ruptura del gen de fusión. En algunos casos, los polinucleótidos son ADN libre de células. En algunos casos, los polinucleótidos son ADN genómico fragmentado. En algunos casos, los polinucleótidos capturados por sondas se eluyen para aislar los polinucleótidos capturados de las sondas. En algunos casos, los polinucleótidos eluidos se secuencian o se usan directamente para producir bibliotecas de secuenciación.

Se proporcionan métodos para detectar genes de fusión. En un método, se proporciona por lo menos un conjunto de sondas que comprende por lo menos un polinucleótido de alta afinidad que está dirigido a un gen implicado en una fusión de genes. El conjunto de sondas puede incluir sondas de polinucleótidos tanto de afinidad estándar como de alta afinidad. En algunas realizaciones, el conjunto de sondas comprende una pluralidad de subconjuntos de sondas, cada subconjunto dirigido a secuencias de un gen de interés diferente, uno o más de los cuales está implicado en una fusión de genes en el cáncer y, en algunos ejemplos, por lo menos de tales genes no está implicado en una fusión de genes.

El conjunto de sondas puede mezclarse con una muestra que comprende ADN, como ADNcf, en condiciones rigurosas de hibridación, y puede permitirse que el ADN hibride con las sondas. Como el conjunto de sondas incluye sondas de polinucleótidos de alta afinidad, aumenta la probabilidad de capturar fragmentos de ADN que incluyen un punto de ruptura del gen de fusión. El ADN capturado puede aislarse de la sonda y secuenciarse. Las secuencias pueden analizarse para detectar fragmentos de ADN que tienen secuencias que abarcan un punto de ruptura, como fragmentos de ADN que incluyen secuencias de dos genes diferentes normalmente no fusionados. La presencia de genes de fusión puede estar correlacionada con una enfermedad, como el cáncer. Por consiguiente, este método es útil en el diagnóstico de enfermedades, como el cáncer.

Sistemas de control informáticos

La presente divulgación proporciona sistemas de control informáticos que están programados para implementar métodos de la divulgación. La FIG. 9 muestra un sistema informático 901 que está programado o configurado de otro modo para detectar genes de fusión y diagnosticar y/o proporcionar una intervención terapéutica para una enfermedad, como el cáncer.

El sistema informático 901 incluye una unidad central de procesamiento (CPU, también "procesador" y "procesador informático" en la presente) 905, que puede ser un procesador de un solo núcleo o de múltiples núcleos, o una pluralidad de procesadores para procesamiento paralelo. El sistema informático 901 también incluye memoria o ubicación de memoria 910 (por ejemplo, memoria de acceso aleatorio, memoria de solo lectura, memoria flash), unidad de almacenamiento electrónico 915 (por ejemplo, disco duro), interfaz de comunicaciones 920 (por ejemplo, adaptador de red) para comunicarse con uno o más de otros sistemas, y dispositivos periféricos 925, como caché, otra memoria, almacenamiento de datos y/o adaptadores de pantalla electrónicos. La memoria 910, la unidad de almacenamiento 915, la interfaz 920 y los dispositivos periféricos 925 están en comunicación con la CPU 905 a través de un bus de comunicación (líneas continuas), como una placa base. La unidad de almacenamiento 915 puede ser una unidad de almacenamiento de datos (o depósito de datos) para almacenar datos. El sistema informático 901 puede estar acoplado operativamente a una red informática ("red") 930 con la ayuda de la interfaz de comunicación 920. La red 930 puede ser Internet, una internet y/o extranet, o una intranet y/o extranet que está en comunicación con Internet. La red 930 en algunos casos es una red de telecomunicaciones y/o de datos. La red 930 puede incluir uno o más servidores informáticos, que pueden permitir la informática distribuida, como la informática en la nube. La red 930, en algunos casos con la ayuda del sistema informático 901, puede implementar una red de pares, que puede permitir que los dispositivos acoplados al sistema informático 901 se comporten como un cliente o un servidor.

La CPU 905 puede ejecutar una secuencia de instrucciones legibles por máquina, que pueden incorporarse en un programa o software. Las instrucciones pueden almacenarse en una ubicación de memoria, como la memoria 910. Las instrucciones pueden dirigirse a la CPU 905, que posteriormente puede programar o configurar de otro modo la CPU 905 para implementar métodos de la presente divulgación. Los ejemplos de operaciones realizadas por la CPU 905 pueden incluir recuperar, decodificar, ejecutar y reescribir.

La CPU 905 puede ser parte de un circuito, como un circuito integrado. En el circuito pueden incluirse uno o más de otros componentes del sistema 901. En algunos casos, el circuito es un circuito integrado de aplicación específica (ASIC).

La unidad de almacenamiento 915 puede almacenar archivos como controladores, bibliotecas y programas guardados. La unidad de almacenamiento 915 puede almacenar datos de usuario, por ejemplo, preferencias de usuario y programas de usuario. El sistema informático 901 en algunos casos puede incluir una o más unidades de almacenamiento de datos adicionales que son externas al sistema informático 901, como las localizadas en un servidor remoto que está en comunicación con el sistema informático 901 a través de una intranet o Internet.

El sistema informático 901 puede comunicarse con uno o más sistemas informáticos remotos a través de la red 930. Por ejemplo, el sistema informático 901 puede comunicarse con un sistema informático remoto de un usuario (por ejemplo, un proveedor de atención médica). Ejemplos de sistemas informáticos remotos incluyen ordenadores personales (por ejemplo, PC portátil), pizarras o tabletas PC (por ejemplo, iPad de Apple®, Samsung® Galaxy Tab), teléfonos, teléfonos inteligentes (por ejemplo, iPhone de Apple®, dispositivo con Android, Blackberry®) o asistentes digitales personales. El usuario puede acceder al sistema informático 901 a través de la red 930.

Los métodos descritos en la presente pueden implementarse mediante un código ejecutable de máquina (por ejemplo, procesador informático) almacenado en una ubicación de almacenamiento electrónico del sistema informático 901 como, por ejemplo, en la memoria 910 o la unidad de almacenamiento electrónico 915. El código ejecutable o legible por máquina puede proporcionarse en forma de software. Durante el uso, el código puede ser ejecutado por el procesador 905. En algunos casos, el código puede ser recuperado de la unidad de almacenamiento 915 y almacenado en la memoria 910 para que el procesador 905 tenga fácil acceso. En algunas situaciones, la unidad de almacenamiento electrónico 915 puede excluirse, y las instrucciones ejecutables por máquina se almacenan en la memoria 910.

El código puede precompilarse y configurarse para su uso con una máquina que tenga un procesador adaptado para ejecutar el código, o puede compilarse durante el tiempo de ejecución. El código puede suministrarse en un lenguaje de programación que puede seleccionarse para permitir que el código se ejecute de una manera precompilada o como compilada.

Los aspectos de los sistemas y métodos proporcionados en la presente, como el sistema informático 901, pueden incorporarse en la programación. Varios aspectos de la tecnología pueden considerarse como "productos" o "artículos manufacturados" típicamente en forma de código ejecutable por máquina (o procesador) y/o datos asociados que se llevan o incorporan en un tipo de medio legible por máquina. El código ejecutable por máquina puede almacenarse en una unidad de almacenamiento electrónico, como una memoria (por ejemplo, memoria de solo lectura, memoria de acceso aleatorio, memoria flash) o un disco duro. Los medios de tipo "almacenamiento" pueden incluir parte o toda la memoria tangible de los ordenadores, procesadores o similares, o módulos asociados de los mismos, como varias memorias de semiconductores, unidades de cinta, unidades de disco y similares, que pueden proporcionar almacenamiento no transitorio en cualquier momento para la programación del software. En ocasiones, todo o partes del software pueden comunicarse a través de Internet o de otras redes de telecomunicaciones. Tales comunicaciones, por ejemplo, pueden permitir la carga del software desde un ordenador o procesador a otro, por ejemplo, desde un servidor de gestión u ordenador huésped a la plataforma informática de un servidor de aplicaciones. Por tanto, otro tipo de medio que puede llevar los elementos de software incluye ondas ópticas, eléctricas y electromagnéticas, como las que se usan en interfaces físicas entre dispositivos locales, a través de redes terrestres alámbricas y ópticas y a través de varios enlaces aéreos. Los elementos físicos que transportan tales ondas, como enlaces por cable o inalámbricos, enlaces ópticos o similares, también pueden considerarse medios que llevan el software. Como se usan en la presente, a menos que se limite a medios de "almacenamiento" tangibles no transitorios, términos como "medio legible" por ordenador o máquina se refieren a cualquier medio que participa en la proporción de instrucciones a un procesador para su ejecución.

Por tanto, un medio legible por máquina, como un código ejecutable por ordenador, puede adoptar muchas formas, que incluyen pero no se limitan a, un medio de almacenamiento tangible, un medio de onda portadora o un medio de transmisión físico. Los medios de almacenamiento no volátiles incluyen, por ejemplo, discos ópticos o magnéticos, como cualquiera de los dispositivos de almacenamiento en cualquier ordenador o similares, como los que pueden usarse para implementar las bases de datos, etc. mostrados en los dibujos. Los medios de almacenamiento volátiles incluyen la memoria dinámica, como la memoria principal de dicha plataforma informática. Los medios de transmisión tangibles incluyen cables coaxiales; cable de cobre y fibra óptica, incluidos los cables que componen un bus dentro de un sistema informático. Los medios de transmisión de ondas portadoras pueden adoptar la forma de señales eléctricas o electromagnéticas, u ondas acústicas o de luz como las generadas durante las comunicaciones de datos por radiofrecuencia (RF) e infrarrojos (IR). Por lo tanto, las formas comunes de medios legibles por ordenador incluyen, por ejemplo: un disquete, un disco flexible, un disco duro, una cinta magnética, cualquier otro medio magnético, un CD-ROM, DVD o DVD-ROM, cualquier otro medio óptico, cinta de papel para tarjetas perforadas, cualquier otro medio de almacenamiento físico con patrones de orificios, una RAM, una ROM, una PROm y EPROM, una FLASH-EPROM, cualquier otro chip o cartucho de memoria, una onda portadora que transporte datos o instrucciones, cables o enlaces que transporten dicha portadora, o cualquier otro medio desde el cual un ordenador pueda leer código de programación y/o datos. Muchas de estas formas de medios legibles por ordenador pueden estar implicadas en llevar una o más secuencias de una o más instrucciones a un procesador para su ejecución.

El sistema informático 901 puede incluir o estar en comunicación con una pantalla electrónica 935 que comprende una interfaz de usuario (UI) 940 para proporcionar una salida de un informe, que puede incluir un diagnóstico de un sujeto o una intervención terapéutica para el tema. Los ejemplos de UI incluyen, sin limitación, una interfaz gráfica de usuario (GUI) y una interfaz de usuario basada en web.

Los métodos y sistemas de la presente divulgación pueden implementarse mediante uno o más algoritmos. Un algoritmo puede implementarse por medio de software tras la ejecución por la unidad central de procesamiento 905. El algoritmo puede, por ejemplo, facilitar el enriquecimiento, secuenciación y/o detección de genes de fusión. EJEMPLOS

Ejemplo 1: Enriquecimiento y secuenciación de genes de cáncer y genes de fusión de cáncer

El ADN libre de células circulantes se aísla del plasma de un paciente con cáncer usando el kit QIAamp Circulating Nucleic Acid (Qiagen) según el protocolo del fabricante, excepto que se realiza una SPRI de doble cara con perlas AmpureXP (Beckman Coulter) para eliminar los fragmentos de >500 bps y conservar todos los fragmentos de menor peso molecular. Los fragmentos de ADNcf de ~160 pb resultantes (de 5 a 30 ng) se reparan luego en los extremos y se ligan a adaptadores con etiquetas de códigos de barras moleculares y secuencias requeridas para la secuenciación de próxima generación en sentido descendente (HiSeq2500, Illumina). El ADNcf ligado se amplifica durante 10 ciclos usando cebadores complementarios a las secuencias adaptadoras ligadas.

Para enriquecer las regiones de interés, incluyendo los genes de fusión, las bibliotecas de ADNcf resultantes se desnaturalizan a 95° C y luego se hibridan a 65° C primero con oligos que bloquean las secuencias añadidas y luego con oligos de ARN biotinilado de 120-nt (Agilent Technologies) y también oligos de ARN/LNA o ADN/LNA biotinilados de 120-nt (Exiqon) en tampón de hibridación riguroso durante 16 horas. Las reacciones de hibridación se capturan usando perlas de estreptavidina (Invitrogen), se lavan para eliminar los fragmentos de ADNcf no objetivo y se eluyen usando hidróxido de sodio. Las bibliotecas enriquecidas resultantes se amplifican durante otros 12 ciclos y se secuencian en un HiSeq2500 (Illumina).

Ejemplo 2: Captura de secuencias

Se aísla ADN libre de células de un paciente con cáncer.

Se proporciona un conjunto de sondas que está configurado para capturar polinucleótidos que tienen secuencias de 68 genes objetivo, incluyendo cuatro genes implicados en reordenamientos de genes. El conjunto de sondas comprende subconjuntos, cada subconjunto dirigido a uno de los 68 genes en el panel. Cada subconjunto dirigido a un gen que no está implicado en un reordenamiento de genes es un subconjunto de afinidad estándar (incluye solo polinucleótidos de afinidad no alta, polinucleótidos con solo nucleótidos naturales). Cada subconjunto dirigido a un gen implicado en un reordenamiento de genes es un subconjunto de alta afinidad (incluye por lo menos un polinucleótido de alta afinidad). Los conjuntos tienen traslapes 2X en los exones. En los subconjuntos de alta afinidad, los polinucleótidos de alta afinidad se dirigen solo a las regiones de puntos de ruptura del gen. Los subconjuntos de alta afinidad están dopados con polinucleótidos de alta afinidad, de tal manera que tanto los polinucleótidos de alta afinidad como los polinucleótidos de afinidad estándar se dirigen a secuencias en las regiones de puntos de ruptura.

El ADN libre de células y el conjunto de sondas se combinan en condiciones rigurosas de hibridación y se incuban durante la noche. El conjunto de sondas con ADNcf unido se aísla de la mezcla. Los polinucleótidos unidos se separan de las sondas y se secuencian. Se identifican polinucleótidos que comprenden secuencias a través de un punto de ruptura.

Aunque en la presente se han mostrado y descrito realizaciones preferidas de la presente invención, resultará obvio para los expertos en la técnica que tales realizaciones se proporcionan a modo de ejemplo solamente. No se pretende que la invención esté limitada por los ejemplos específicos proporcionados dentro de la especificación. Aunque la invención se ha descrito con referencia a la especificación mencionada anteriormente, no se pretende que las descripciones e ilustraciones de las realizaciones de la presente se interpreten en un sentido limitativo. Además, debe entenderse que todos los aspectos de la invención no se limitan a las representaciones, configuraciones o proporciones relativas específicas establecidas en la presente que dependen de una variedad de condiciones y variables. Debe entenderse que pueden emplearse varias alternativas a las realizaciones de la invención descritas en la presente al poner en práctica la invención. Por tanto, se pretende que las reivindicaciones siguientes definan el alcance de la invención y que los métodos y estructuras dentro del alcance de estas reivindicaciones estén protegidos por las mismas.

Claims

REIVINDICACIONES

1. Un método para capturar un fragmento de punto de ruptura de un gen de fusión, que comprende

(a) poner en contacto una muestra biológica proporcionada con una sonda de polinucleótidos, que comprende uno o más nucleótidos de ácido nucleico bloqueado (LNA), en condiciones suficientes para:

(i) permitir la hibridación entre la sonda de polinucleótidos y el fragmento de punto de ruptura para proporcionar un polinucleótido capturado por sonda en una mezcla, dicha sonda de polinucleótidos tiene complementariedad de secuencia con el fragmento de punto de ruptura y tiene una afinidad para el gen de fusión que es mayor que la de un polinucleótido que tiene la complementariedad de secuencia y que contiene solo nucleótidos no modificados; y

(ii) permitir el enriquecimiento o aislamiento del polinucleótido capturado por sonda de la mezcla, en donde la sonda de polinucleótidos tiene complementariedad de secuencia con el fragmento de punto de ruptura, (b) eluir los polinucleótidos capturados por sondas para aislar los polinucleótidos capturados de las sondas; y (c) secuenciar directamente los polinucleótidos eluidos o usar los polinucleótidos eluidos para producir bibliotecas de secuenciación,

en donde la muestra biológica contiene o se sospecha que contiene una molécula de ácido nucleico libre de células que comprende el fragmento de punto de ruptura del gen de fusión.

2. El método de la reivindicación 1, en donde la sonda de polinucleótidos comprende una pluralidad de nucleótidos de LNA, en donde por lo menos dos de los nucleótidos de LNA están separados por no más de 30 nucleótidos.

3. El método de la reivindicación 2, en donde por lo menos dos de los nucleótidos de LNA están separados por no más de 15 nucleótidos.

4. El método de cualquiera de las reivindicaciones 1 a 3, en donde la sonda de polinucleótidos comprende por lo menos un 90%, por lo menos un 70%, por lo menos un 50%, por lo menos un 20%, por lo menos un 10%, por lo menos un 5%, o por lo menos un 1% de los nucleótidos que son nucleótidos de LNA.

5. El método de cualquiera de las reivindicaciones 1 a 4, en donde la sonda de polinucleótidos tiene una temperatura de fusión más alta en una reacción de hibridación de por lo menos 1°, 2°, 3°, 4°, 5°, 10°, 15°, o 20° C más alta en comparación con un polinucleótido de la misma secuencia que contiene solo nucleótidos no modificados.

6. El método de cualquiera de las reivindicaciones 1 a 5, en donde la sonda de polinucleótidos está configurada para hibridar con un gen de fusión de cáncer.

7. El método de la reivindicación 6, en donde el gen de fusión de cáncer está presente en las FIGS. 2A-2B o un gen de fusión entre dos o más genes seleccionados de la FIG. 3.

8. El método de cualquiera de las reivindicaciones 1 a 7, en donde la sonda de polinucleótidos tiene complementariedad de secuencia con una secuencia dentro de 500 nucleótidos de un punto de ruptura de un gen de fusión.

9. El método de cualquiera de las reivindicaciones 1 a 8, en donde la sonda de polinucleótidos tiene complementariedad de secuencia con una porción de la secuencia en cada lado de un punto de ruptura del gen de fusión.

10. El método de cualquiera de las reivindicaciones 1 a 9, en donde la sonda de polinucleótidos tiene como máximo aproximadamente 500 nucleótidos de longitud, como máximo aproximadamente 450 nucleótidos de longitud, como máximo aproximadamente 425 nucleótidos de longitud, como máximo aproximadamente 400 nucleótidos de longitud, como máximo aproximadamente 375 nucleótidos de longitud, como máximo aproximadamente 350 nucleótidos de longitud, como máximo aproximadamente 325 nucleótidos de longitud, como máximo aproximadamente 300 nucleótidos de longitud, como máximo aproximadamente 275 nucleótidos de longitud, como máximo aproximadamente 250 nucleótidos de longitud, como máximo aproximadamente 225 nucleótidos de longitud, como máximo aproximadamente 200 nucleótidos de longitud, como máximo aproximadamente 180 nucleótidos de longitud, como máximo aproximadamente 160 nucleótidos de longitud, como máximo aproximadamente 140 nucleótidos de longitud, como máximo aproximadamente 120 nucleótidos de longitud, como máximo aproximadamente 100 nucleótidos de longitud, como máximo aproximadamente 80 nucleótidos de longitud, como máximo aproximadamente 60 nucleótidos de longitud, como máximo aproximadamente 40 nucleótidos de longitud, o como máximo aproximadamente 20 nucleótidos de longitud.

11. El método de cualquiera de las reivindicaciones 1 a 10, en donde la muestra biológica es sangre, suero, plasma, vitreo, esputo, orina, lágrimas, transpiración, saliva, semen, excreciones mucosas, moco, líquido cefalorraquídeo, líquido amniótico o líquido linfático.

12. El método de cualquiera de las reivindicaciones 1 a 11, en donde la molécula de ácido nucleico libre de células tiene como máximo 500 nucleótidos de longitud, como máximo 400 nucleótidos de longitud, como máximo 300 nucleótidos de longitud, como máximo 250 nucleótidos de longitud, como máximo 225 nucleótidos de longitud, como máximo 200 nucleótidos de longitud, como máximo 190 nucleótidos de longitud, como máximo 180 nucleótidos de longitud, como máximo 170 nucleótidos de longitud, como máximo 160 nucleótidos de longitud, como máximo 150 nucleótidos de longitud, como máximo 140 nucleótidos de longitud, como máximo 130 nucleótidos de longitud, como máximo 120 nucleótidos de longitud, como máximo 110 nucleótidos de longitud, o como máximo 100 nucleótidos de longitud.