Nothing Special   »   [go: up one dir, main page]

BR112019013391A2 - Adaptador de ácido nucleico, e, método para detecção de uma mutação em uma molécula de dna circulante tumoral (ctdna) de fita dupla. - Google Patents

Adaptador de ácido nucleico, e, método para detecção de uma mutação em uma molécula de dna circulante tumoral (ctdna) de fita dupla. Download PDF

Info

Publication number
BR112019013391A2
BR112019013391A2 BR112019013391-7A BR112019013391A BR112019013391A2 BR 112019013391 A2 BR112019013391 A2 BR 112019013391A2 BR 112019013391 A BR112019013391 A BR 112019013391A BR 112019013391 A2 BR112019013391 A2 BR 112019013391A2
Authority
BR
Brazil
Prior art keywords
seq
sequence
nucleic acid
cancer
dna
Prior art date
Application number
BR112019013391-7A
Other languages
English (en)
Inventor
Arnal Suzzette
Angeloni Taraneh
Original Assignee
Quest Diagnostics Investments Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quest Diagnostics Investments Llc filed Critical Quest Diagnostics Investments Llc
Publication of BR112019013391A2 publication Critical patent/BR112019013391A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/101Modifications characterised by incorporating non-naturally occurring nucleotides, e.g. inosine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

a presente tecnologia provê composições de polinucleotídeo e métodos de uso das mesmas para detectar dna circulante tumoral (ctdna) em um paciente. kits para uso na prática dos métodos são também providos.

Description

ADAPTADOR DE ÁCIDO NUCLEICO, E, MÉTODO PARA DETECÇÃO DE UMA MUTAÇÃO EM UMA MOLÉCULA DE DNA CIRCULANTE TUMORAL (CTDNA) DE FITA DUPLA
REFERÊNCIA REMISSIVA AOS PEDIDOS RELACIONADOS [001] Este pedido reivindica o benefício de e a prioridade ao Pedido
Provisório US n° 62/439.574, depositado em 28 de dezembro de 2016, cuja revelação é aqui incorporada em sua totalidade como referência.
CAMPO TÉCNICO [002] A presente tecnologia refere-se às composições de adaptador de polinucleotídeo e aos métodos de uso das mesmas para detectar DNA circulante tumoral (ctDNA, circulating tumor DNA) em uma amostra, como, por exemplo, uma amostra de ácido nucleico livre da célula obtida de um sujeito. Kits para uso na prática dos métodos são também providos.
FUNDAMENTOS [003] A seguinte descrição dos antecedentes da presente tecnologia é provida simplesmente como um auxílio no entendimento da presente tecnologia e não é admitida para descrever ou constituir a técnica anterior à presente tecnologia.
[004] Tumores continuamente liberam DNA para dentro da circulação (ctDNA), onde ele é facilmente acessível (Stroun et al., Eur. J. Cancer Clin. Oncol. 23:707-712 (1987)). Análise de tal DNA livre da célula (cfDNA, cell-free DNA) derivado de câncer tem o potencial para revolucionar a detecção de cânceres, a genotipificação de tumores, e a monitoração de doenças. Por exemplo, o acesso não invasivo ao DNA derivado de tumor via biopsias líquidas é particularmente atrativo para tumores sólidos. Entretanto, na maioria dos tumores sólidos em estádio inicial e em muitos dos tumores sólidos em estádio avançado, os níveis sanguíneos de ctDNA são extremamente baixos (Bettegowda, C. et al., Sei. Transi. Med. 6:224ra24 (2014); Newman, A.M. et al., Nat. Med. 20:548-554 (2014)), complicando,
Petição 870190070370, de 24/07/2019, pág. 8/108
2/80 por conseguinte, as detecção e análise de ctDNA. Vários fatores influenciam os limites de detecção de ctDNA, mas a recuperação de moléculas de cfDNA e os erros não biológicos introduzidos durante a preparação de biblioteca e a sensibilidade analítica do limite de sequenciamento continuam a representar um grande obstáculo para o perfilamento ultrassensível de ctDNA.
[005] Portanto, há uma necessidade de métodos mais sensíveis e de alto desempenho para detectar e monitorar ácidos nucleicos derivados de cânceres em pacientes com câncer.
SUMÁRIO DA PRESENTE TECNOLOGIA [006] Os métodos e as composições de adaptador de polinucleotídeo aqui revelados referem-se à detecção de mutações em ctDNA presente em amostras derivadas de um sujeito diagnosticado como tendo, ou suspeito de ter câncer. E reconhecido que os métodos aqui revelados permitem a detecção rápida e sensível e o perfilamento rápido e sensível de mutações em ctDNA em várias sequências de ácidos nucleicos-alvo nos éxons e/ou introns de um ou mais genes relacionados a câncer incluindo, mas não limitados a, ALK, BRAF, EGFR, ERBB2, KIT, KRAS, MET, NRAS, NTRK1, PIK3CA, ROS1, e RET. Os métodos aqui revelados proveem um arcabouço para o perfilamento ultrassensível de ctDNA realizado usando modelos analíticos acurados de limites de detecção. Estas qualidades melhoram os limites de detecção em comparação com os métodos prévios para amostras com teor limitado de DNA.
[007] Em um aspecto, a presente revelação provê um adaptador de ácido nucleico compreendendo uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que (a) a primeira fita de oligonucleotídeo (i) compreende uma primeira região proximal e uma primeira região distai, em que a primeira região proximal compreende uma primeira sequência de identificador molecular único e uma primeira sequência espaçadora tendo a sequência 5’ TGACT 3’ (SEQ ID NO:__), em que a
Petição 870190070370, de 24/07/2019, pág. 9/108
3/80 primeira sequência espaçadora está localizada 3’ à primeira sequência de identificador molecular único; e (ii) não compreende uma sequência degenerada ou semidegenerada; (b) a segunda fita de oligonucleotídeo (i) compreende uma segunda região proximal e uma segunda região distai, em que a segunda região proximal compreende uma segunda sequência de identificador molecular único e uma segunda sequência espaçadora tendo a sequência 5’ GTCA 3’ (SEQ ID NO:__), em que a sequência espaçadora está localizada 5’ ao segundo identificador molecular único; e (ii) não compreende uma sequência degenerada ou semidegenerada; (c) a primeira região proximal da primeira fita de oligonucleotídeo hibridiza com a segunda região proximal da segunda fita de oligonucleotídeo; e (d) a primeira região distai da primeira fita de oligonucleotídeo não hibridiza com a segunda região distai da segunda fita de oligonucleotídeo. Em algumas modalidades do adaptador de ácido nucleico, o nucleotídeo “T” localizado na extremidade-3’ da primeira sequência espaçadora contém uma união de fosforotioato.
[008] Em algumas modalidades, a primeira sequência de identificador molecular único da primeira fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’ AGCTGCAGTAGC 3’ (SEQ ID NO: 5’ TGATGATGATAC 3’ (SEQ ID NO: _); 5’
TCGACTGTCGAG 3’ (SEQ ID NO: 5’ GTACTCTAGCTA 3’ (SEQ ID NO: _); 5’ CAGAGCACTCGT 3’ (SEQ ID NO: _); 5’ CATGCGATAGTC 3’ (SEQ ID NO: _); 5’ TCATCAGTCGAG 3’ (SEQ ID NO: _); 5’ AATCAGCGGTAT 3’ (SEQ ID NO: _); 5’ AGCATACTACTG 3’ (SEQ ID NO: _); 5’ GCTGATACACGT 3’ (SEQ ID NO: _); 5’ CTCTGTCACACG 3’ (SEQ ID NO: _); 5’ GCTACGTCATCA 3’ (SEQ ID NO: _); 5’ GCAGATGTCACT 3’ (SEQ ID NO: 5’ ACTCACAGCTAG 3’ (SEQ ID NO: _); 5’ CTCGCTCATGTA 3’ (SEQ ID NO: 5’ TAGCTGCACTAG 3’ (SEQ ID NO: _); 5’ CAGTTCGAGCTA 3’ (SEQ ID NO: _); 5’ TGCATGACTCGC 3’ (SEQ ID NO: 5’ GTGTACTGTACA 3’ (SEQ ID
Petição 870190070370, de 24/07/2019, pág. 10/108
4/80
NO: 5’ ACTAGAGTCTGA 3’ (SEQ ID NO: 5’
AGAGTGCGTGTC 3’ (SEQ ID NO: _); 5’ TACGCATCAGAT 3’ (SEQ ID NO: _); 5’ CTGCATGACAGT 3’ (SEQ ID NO: e 5’
GTACGATCTCAC 3’ (SEQ ID NO: _)· [009] Adicional ou alternativamente, em algumas modalidades, a segunda sequência de identificador molecular único da segunda fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’ GCTACTGCAGCT 3’ (SEQ ID NO: _); 5’ GTATCATCATCA 3’ (SEQ ID NO: 5’ CTCGACAGTCGA 3’ (SEQ ID NO: 5’
TAGCTAGAGTAC 3’ (SEQ ID NO: _); 5’ ACGAGTGCTCTG 3’ (SEQ ID NO: _); 5’ GACTATCGCATG 3’ (SEQ ID NO: 5’ CTCGACTGATGA 3’ (SEQ ID NO: _); 5’ ATACCGCTGATT 3’ (SEQ ID NO: _); 5’ CAGTAGTATGCT 3’ (SEQ ID NO: _); 5’ ACGTGTATCAGC 3’ (SEQ ID NO: 5’ CGTGTGACAGAG 3’ (SEQ ID NO: 5’
TGATGACGTAGC 3’ (SEQ ID NO: _); 5’ AGTGACATCTGC 3’ (SEQ ID NO: _); 5’ CTAGCTGTGAGT 3’ (SEQ ID NO: 5’
TACATGAGCGAG 3’ (SEQ ID NO: 5’ CTAGTGCAGCTA 3’ (SEQ
ID NO: 5’ TAGCTCGAACTG 3’ (SEQ ID NO: 5’
GCGAGTCATGCA 3’ (SEQ ID NO: _); 5’ TGTACAGTACAC 3’ (SEQ ID NO: _); 5’ TCAGACTCTAGT 3’ (SEQ ID NO: 5’ GACACGCACTCT 3’ (SEQ ID NO: _); 5’ ATCTGATGCGTA 3’ (SEQ ID NO: _); 5’ ACTGTCATGCAG 3’ (SEQ ID NO: e 5’ GTGAGATCGTAC 3’ (SEQ ID NO: __)· [0010] Em algumas modalidades, a sequência de nucleotídeos da primeira fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGCTG CAGTAGCTGACT 3’ (SEQ ID NO: 1); 5’
TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGATGATGATACT GACT 3’ (SEQ ID NO: 3); 5’ TACACTCTTTCCCTACACGAC
Petição 870190070370, de 24/07/2019, pág. 11/108
5/80
GCTCTTCCGATCTTCGACTGTCGAGTGACT 3’ (SEQ ID NO: 5); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGTACTCTAGCTAT GACT 3’ (SEQ ID NO: 7); 5’ TACACTCTTTCCCTACACGACG CTCTTCCGATCTCAGAGCACTCGTTGACT 3’ (SEQ ID NO: 9); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCATGCGATAGTCT GACT 3’ (SEQ ID NO: 11); 5’ TACACTCTTTCCCTACAC GACGCTCTTCCGATCTTCATCAGTCGAGTGACT 3’ (SEQ ID NO: 13); 5 ’ TAC ACTCTTTCCCTAC ACGACGCTCTTCCGATCTAATC AGCGGT ATTGACT 3’ (SEQ ID NO: 15); 5’ TACACTCTTTCCCTACACGA CGCTCTTCCGATCTAGCATACTACTGTGACT 3’ (SEQ ID NO: 17); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCTGATACACGTT GACT 3’ (SEQ ID NO: 19); 5’ TACACTCTTTCCCTACACG ACGCTCTTCCGATCTCTCTGTCACACGTGACT 3’ (SEQ ID NO: 21); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCTACGTCATCAT GACT 3’ (SEQ ID NO: 23); 5’ TACACTCTTTCCCTACAC GACGCTCTTCCGATCTGCAGATGTCACTTGACT 3’ (SEQ ID NO: 25); 5 ’ TAC ACTCTTTCCCTAC ACGACGCTCTTCCGATCTACTC AC AGC
TAGTGACT 3’ (SEQ ID NO: 27); 5’ TACACTCTTTCCCTACACGAC GCTCTTCCGATCTCTCGCTCATGTATGACT 3’ (SEQ ID NO: 29); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTAGCTGCACTAGT GACT 3’ (SEQ ID NO: 31); 5’ TACACTCTTTCCCTACACGACGC TCTTCCGATCTCAGTTCGAGCTATGACT 3’ (SEQ ID NO: 33); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGCATGACTCGCT GACT 3’ (SEQ ID NO: 35); 5’ TACACTCTTTCCCTACACGA CGCTCTTCCGATCTGTGTACTGTACATGACT 3’ (SEQ ID NO: 37); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTAGAGTCTGA TGACT 3’ (SEQ ID NO: 39); 5’ TACACTCTTTCCCTACACG ACGCTCTTCCGATCTAGAGTGCGTGTCTGACT 3’ (SEQ ID NO: 41); 5’
TACACTCTTTCCCTACACGACGCTCTTCCGATCTTACGCATCAGATT
Petição 870190070370, de 24/07/2019, pág. 12/108
6/80
GACT 3’ (SEQ ID NO: 43); 5’ TACACTCTTTCCCTACAC GACGCTCTTCCGATCTCTGCATGACAGTTGACT 3’ (SEQ ID NO: 45); e 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGTACGATCT CACTGACT 3’ (SEQ ID NO: 47).
[0011] Adicional ou altemativamente, em algumas modalidades, a sequência de nucleotideos da segunda fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’ GTCAGCTACTGCAGCTAGATCG GAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 2); 5’ GTCAGTATCATCATCAAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 4); 5’ GTCACTCGACAGTCGAAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 6); 5’ GTCATAGCTAGAGTACAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 8); 5’ GTCAACGAGTGCTCTGAG ATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 10);
’ GTCAGACTATCGCATGAGATCGGAAGAGCACACGTCTGAACTCC AGTCAC 3’ (SEQ ID NO: 12); 5’ GTCACTCGACTGATGAA GATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 14); 5’ GTCAATACCGCTGATTAGATCGGAAGAGCACACGTCTGAAC TCCAGTCAC 3’ (SEQ ID NO: 16); 5’ GTCACAGTAGTATGCTAG ATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 18); 5 ’ GTC AACGTGTATC AGC AGATCGGAAGAGC AC ACGTCTGAACT CCAGTCAC 3’ (SEQ ID NO: 20); 5’ GTCACGTGTGACAGAGAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 22); 5’ GTCATGATGACGTAGCAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 24); 5’ GTCAAGTGACATCTGCAGAT CGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 26); 5’ GTCACTAGCTGTGAGTAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 28); 5’ GTCATACATGAGCGAGAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 30); 5’
Petição 870190070370, de 24/07/2019, pág. 13/108
7/80
GTCACTAGTGCAGCTAAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 32); 5’ GTCATAGCTCGAACTGAG ATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 34); 5 ’ GTC AGCGAGTC ATGC AAGATCGGAAGAGC AC ACGTCTGAACTC CAGTCAC 3’ (SEQ ID NO: 36); 5’ GTCATGTACAGTACACAG ATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 38); 5 ’ GTC ATC AGACTCTAGTAGATCGGAAGAGC AC ACGTCTGAACT
CCAGTCAC 3’ (SEQ ID NO: 40); 5’ GTCAGACACGCACTCTAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 42); 5’ GTCAATCTGATGCGTAAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 44); 5’ GTCAACTGTCATGCAGAG ATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 46); e 5’ GTCAGTGAGATCGTACAGATCGGAAGAGCACACGTCTGAACT CCAGTCAC 3’ (SEQ ID NO: 48).
[0012] Em determinadas modalidades do adaptador de ácido nucleico, a extremidade-5 ’ da primeira fita de oligonucleotídeo está marcada com biotina. Em outras modalidades do adaptador de ácido nucleico, a extremidade-3 ’ da segunda fita de oligonucleotídeo está marcada com biotina. Em algumas modalidades, o adaptador de ácido nucleico é usado para sequenciar uma molécula de ácido nucleico-alvo de fita dupla selecionada a partir do grupo consistindo em DNA de fita dupla ou RNA de fita dupla. O DNA de fita dupla pode ser DNA genômico cortado, ou DNA livre da célula.
[0013] Em qualquer uma das modalidades acima, o adaptador de ácido nucleico da presente tecnologia compreende, ainda, pelo menos dois sítios de aglutinação de iniciadores de PCR, pelo menos dois sítios de aglutinação de iniciadores de sequenciamento, ou qualquer combinação dos mesmos. Adicional ou altemativamente, em algumas modalidades, o adaptador de ácido nucleico da presente tecnologia compreende, ainda, uma sequência de código de barras amostra-específico, em que a sequência de
Petição 870190070370, de 24/07/2019, pág. 14/108
8/80 código de barras amostra-específico compreende 2 a 20 nucleotídeos.
[0014] Em outro aspecto, a presente revelação provê um método para detecção de pelo menos uma mutação em uma molécula de DNA circulante tumoral (ctDNA) de fita dupla presente em uma amostra obtida de um paciente compreendendo (a) ligar uma pluralidade de adaptadores de formato em Y às ambas extremidades da molécula de ctDNA de fita dupla para formar um complexo de adaptador-ctDNA de fita dupla, cada adaptador de formato em Y compreendendo uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que a sequência da primeira fita de oligonucleotídeo e a sequência da segunda fita de oligonucleotídeo são selecionadas a partir do grupo consistindo em SEQ ID NO: 1 e SEQ ID NO: 2; SEQ ID NO: 3 e SEQ ID NO: 4; SEQ ID NO: 5 e SEQ ID NO: 6; SEQ ID NO: 7 e SEQ ID NO: 8; SEQ ID NO: 9 e SEQ ID NO: 10; SEQ ID NO: 11 e SEQ ID NO: 12; SEQ ID NO: 13 e SEQ ID NO: 14; SEQ ID NO: 15 e SEQ ID NO: 16; SEQ ID NO: 17 e SEQ ID NO: 18; SEQ ID NO: 19 e SEQ ID NO: 20; SEQ ID NO: 21 e SEQ ID NO: 22; SEQ ID NO: 23 e SEQ ID NO: 24; SEQ ID NO: 25 e SEQ ID NO: 26; SEQ ID NO: 27 e SEQ ID NO: 28; SEQ ID NO: 29 e SEQ ID NO: 30; SEQ ID NO: 31 e SEQ ID NO: 32; SEQ ID NO: 33 e SEQ ID NO: 34; SEQ ID NO: 35 e SEQ ID NO: 36; SEQ ID NO: 37 e SEQ ID NO: 38; SEQ ID NO: 39 e SEQ ID NO: 40; SEQ ID NO: 41 e SEQ ID NO: 42; SEQ ID NO: 43 e SEQ ID NO: 44; SEQ ID NO: 45 e SEQ ID NO: 46; e SEQ ID NO: 47 e SEQ ID NO: 48; (b) amplificar ambas as fitas do complexo de adaptador-ctDNA para produzir primeiros amplicons e segundos amplicons, em que os primeiros amplicons são derivados da primeira fita de oligonucleotídeo, os segundos amplicons são derivados da segunda fita de oligonucleotídeo; (c) sequenciar os primeiros amplicons e segundos amplicons; (d) detectar pelo menos uma mutação na molécula de ctDNA de fita dupla, quando uma mutação detectada nos primeiros amplicons é consistente com uma mutação detectada nos segundos amplicons. Em
Petição 870190070370, de 24/07/2019, pág. 15/108
9/80 algumas modalidades do método, o paciente é diagnosticado com câncer ovariano, câncer de mama, câncer de cólon, câncer de pulmão, câncer de próstata, câncer gástrico, câncer pancreático, câncer cervical, câncer de fígado, câncer de bexiga, câncer do trato urinário, câncer de tireoide, câncer renal, carcinoma, melanoma, câncer de cabeça e pescoço, ou câncer de cérebro.
[0015] Em algumas modalidades, o método compreende, ainda, enriquecer os primeiros amplicons e segundos amplicons com uma pluralidade de sequências-isca, em que a pluralidade de sequências-isca compreende pelo menos uma região gênica que corresponde a cada um de uma pluralidade de genes relacionados a câncer. A pluralidade de genes relacionados a câncer pode compreender ALK, BRAF, EGFR, ERBB2, KIT, KRAS, MET, NRAS, NTRK1, PIK3CA, ROS1 e RET.
[0016] Adicional ou altemativamente, em algumas modalidades do método, a pluralidade de sequências-isca são iscas de RNA, iscas de DNA, ou uma mistura de iscas de RNA e iscas de DNA. Em determinadas modalidades, a pluralidade de sequências-isca compreende uma mistura 1:1 de iscas de RNA e iscas de DNA. Em outras modalidades, a pluralidade de sequências-isca compreende uma mistura de iscas de RNA e iscas de DNA tendo uma razão de 2:1, 1,5:1, 0,75:1 ou 0,5:1.
[0017] Em determinadas modalidades do método, ambas as extremidades 3’ da molécula de ctDNA de fita dupla compreendem, ainda, uma projeção-“A”.
[0018] Em qualquer uma das modalidades acima, cada adaptador de formato em Y compreende, ainda, pelo menos dois sítios de aglutinação de iniciadores de sequenciamento. Adicional ou altemativamente, em algumas modalidades, cada adaptador de formato em Y compreende, ainda, uma sequência de código de barras paciente-específico, em que a sequência de código de barras paciente-específico compreende 2 a 20 nucleotídeos. Cada
Petição 870190070370, de 24/07/2019, pág. 16/108
10/80 adaptador de formato em Y da presente tecnologia pode estar marcado com biotina.
[0019] Em algumas modalidades do método, a amostra compreende não mais que 5 ng de DNA livre da célula. Em outras modalidades, a amostra compreende pelo menos 6 a 30 ng de DNA livre da célula. Em determinadas modalidades, a amostra é sangue inteiro, soro, plasma, fluido sinovial, fluido linfático, fluido ascítico, ou fluido intersticial.
[0020] Também são aqui revelados kits compreendendo um ou mais adaptadores de ácido nucleico de formato em Y compreendendo pelo menos uma sequência selecionada dentre as SEQ ID NOS: 1-48, e instruções para uso.
BREVE DESCRIÇÃO DOS DESENHOS [0021] A Figura 1(a) mostra a cobertura deduplicada de determinadas regiões exônicas ou intrônicas de vários genes relacionados a câncer em variados níveis de entrada de cfDNA (15 ng ou 30 ng) usando os adaptadores de formato em Y de ácidos nucleicos (ou YAMIs) da presente tecnologia. A Figura 1 (b) mostra a cobertura deduplicada de determinadas regiões exônicas ou intrônicas de vários genes relacionados a câncer em variados níveis de entrada de cfDNA usando os adaptadores descritos em Kennedy et al. (2014) (doravante “YUMIs”).
[0022] As Figura 2(a) e Figura 2(b) mostram os amplicons resultantes (correspondendo à seta na Figura 2(a) e os picos de cerca de 300 pb na Figura 2(b)) gerados após amplificação das bibliotecas de DNAs ligados aos YAMIs sob diferentes condições experimentais. “AMP1” refere-se à Amplificação 1, que é realizada após purificação das moléculas ligadas ao adaptador para adicionar códigos de barras espécime-específicos e para enriquecer em moléculas com adaptadores corretamente ligados.
[0023] A Figura 3(a) mostra a eficiência de ligação decrescida de
YUMIs durante a preparação de biblioteca de DNAs. A Figura 3(b) mostra a
Petição 870190070370, de 24/07/2019, pág. 17/108
11/80 ligação de YAMIs ao cfDNA e, também, ao DNA genômico cortado (veja a seta) sob diferentes condições experimentais.
[0024] A Figura 4 mostra a complexidade total das bibliotecas de cfDNAs geradas com YAMIs relativa à complexidade das bibliotecas de cfDNAs geradas com YUMIs.
[0025] A Figura 5 mostra as ‘sequências consenso de fita simples’ (SSCS, Single-Strand Consensus Sequences') que foram derivadas para determinadas regiões exônicas ou intrônicas de vários genes relacionados a câncer quando as bibliotecas de cfDNAs foram geradas usando YAMIs.
[0026] A Figura 6(a) mostra a cobertura total das regiões gênicas ensaiadas quando se enriquecem os amplicons derivados de cfDNA com iscas de DNA sob diferentes condições de hibridização e lavagem. As temperaturas citadas na Figura 6(a) referem-se às ambas temperaturas de hibridização e de lavagem. Por exemplo, uma temperatura de 60°C indica que ambas as etapas de hibridização e lavagem foram realizadas a 60°C. A Figura 6(b) mostra a cobertura total das regiões gênicas ensaiadas quando se enriquecem os amplicons derivados de cfDNA com iscas de DNA, iscas de RNA, ou uma combinação de iscas de DNA e iscas de RNA a uma temperatura de hibridização de 65°C, e uma temperatura de lavagem de 65°C.
[0027] A Figura 7 mostra as SSCS médias e as sequências consenso dúplex (DCS, Duplex Consensus Sequences) médias que foram derivadas para determinadas regiões exônicas ou intrônicas de vários genes relacionados a câncer quando as bibliotecas foram geradas com entrada de 5 ng de cfDNA de cinco amostras de paciente usando YAMIs curtos (shYAMIs, short YAMIs) representados pelas SEQ ID NOS: 1 a 48.
DESCRIÇÃO DETALHADA [0028] A presente revelação provê composições de adaptador de polinucleotídeo e métodos para detecção de mutações em ácidos nucleicos livres da célula, por exemplo ctDNA presente em amostras derivadas de
Petição 870190070370, de 24/07/2019, pág. 18/108
12/80 sujeitos diagnosticados como tendo, ou suspeitos de ter câncer. Kits para uso na prática dos métodos também são providos.
[0029] As alterações genéticas em células cancerosas podem prover um meio pelo qual as células cancerosas podem ser distinguidas das células normais (e.g., não cancerosas). Por exemplo, cfDNA pode ser analisado para a presença de variação genética característica de células tumorais. Entretanto, os níveis absolutos de DNA tumoral livre da célula em tais amostras é, com frequência, baixo, e a variação genética pode representar apenas uma porção muito pequena do genoma inteiro. Dois fatores importantes subjacentes ao limite de detecção de todos os métodos de perfilamento de ctDNA são o número de moléculas de cfDNA que são recuperadas e o número de mutações em um tumor de paciente que são interrogados. Volumes de sangue clinicamente relevantes são frequentemente limitados em pacientes cancerosos devido à anemia, às comordidezes, e ao status de desempenho insatisfatório do paciente. Estudos que analisam o cfDNA de controles saudáveis têm mostrado que erros de “background” foram progressivamente evidentes abaixo de frações de alelos de cerca de 0,2%, e >50% das posições genômicas sequenciadas tinham artefatos sob uma fração de alelo de 0,02% (Newman et al., Nat. Biotechnol. 34(5):547-55 (2016)).
[0030] Embora tenha sido relatada uma variedade de métodos para redução dos artefatos relacionados ao sequenciamento, uma abordagem comum envolve a etiquetagem de moléculas de DNA com identificadores únicos (UIDs, Unique Identifiers, também conhecidos como códigos de barras moleculares) (Jabara et al., Proc. Natl. Acad. Sei. USA 108, 20166-20171 (2011); Kinde et al., Proc. Natl. Acad. Sei. USA 108, 9530-9535 (2011); Schmitt, M.W. et al., Proc. Natl. Acad. Sei. USA 109, 14508-14513 (2012); Kennedy, S.R. et al., Nat. Protoc. 9, 2586-2606 (2014); Kukita, Y. et al., DNA Res. 22, 269-277 (2015); Schmitt, M.W. et al., Nat. Methods 12, 423425 (2015)). Tais códigos de barras permitem o rastreamento preciso de
Petição 870190070370, de 24/07/2019, pág. 19/108
13/80 moléculas individuais, tomando possível distinguir mutações somáticas autênticas provenientes in vivo de artefatos introduzidos ex vivo.
[0031] Estratégias recentes podem rastrear moléculas de DNA ‘dúplex’ de fita dupla presentes na amostra original (Kennedy, S.R. et al., Nat. Protoc. 9, 2586-2606 (2014); Gregory, M.T. et al., Nucleic Acids Res. 44, e22 (2016); Schmitt, M.W. et al., Nat. Methods 12, 423-425 (2015)). Embora a codificação de barras de dúplex alcance supressão de erros melhor que os métodos de codificação de barras de fita simples, ela é relativamente ineficiente (Kennedy, S.R. et al., Nat. Protoc. 9, 2586-2606 (2014)) e, portanto, é subótima para as quantidades de cfDNA limitadas obteníveis em um ambiente clínico. Estudos prévios têm relatado que os métodos de construção de bibliotecas que envolvem o uso de adaptadores de formato em Y de ácido nucleico podem resultar na formação disseminada de adaptadorartefato dimérico, tomando-os, por conseguinte, inadequados para aplicações que utilizam quantidades baixas de material de partida de ácido nucleico. Bennett et al., BioTechniques 56:289-300 (2014). De fato, é insatisfatório o desempenho total dos adaptadores descritos em Kennedy et al. (2014) durante o estágio de ligação da preparação de bibliotecas, limitando, por conseguinte, seu uso com respeito à detecção de mutações em ctDNA. (Newman et al., Nat. Biotechnol. 34(5):547-55 (2016)); consulte também a Figura 1(b) e a Figura 3(a)).
[0032] Em contraste, as composições de adaptador de polinucleotídeo da presente tecnologia aumentam a eficiência de ligação em aproximadamente 20% (Tabela 1), propiciando, assim, a recuperação eficiente de ctDNA de amostras contendo entradas limitadas de cfDNA. Além disso, os métodos da presente tecnologia geraram aproximadamente 500 a 1.800 leituras de sequências consenso de fita simples (SSCS) dentro de regiões gênicas-alvo a partir de níveis de entrada de cfDNA tão baixos quanto 5 ng. Consulte a Figura 7. Consequentemente, os métodos da presente
Petição 870190070370, de 24/07/2019, pág. 20/108
14/80 tecnologia mostram sensibilidade analítica aprimorada quando se detectam mutações em ctDNA presente em amostras derivadas de um sujeito diagnosticado como tendo, ou suspeito de ter câncer.
Definições [0033] Como aqui usado, o termo “cerca de” com referência a um número é geralmente considerado para incluir números que caem dentro de uma faixa de 1% a 5% em qualquer direção (maior que ou menor que) do número salvo indicação em contrário ou, de outra forma, evidente a partir do contexto.
[0034] Como aqui usados, os termos “amplificar” ou “amplificação” com respeito às sequências de ácidos nucleicos, referem-se aos métodos que aumentam a representação de uma população de sequências de ácidos nucleicos em uma amostra. Métodos de amplificação de ácido nucleico, como PCR {Polymerase Chain Reaction, Reação em Cadeia da Polimerase), métodos isotérmicos, métodos do círculo rolante, etc., são bem conhecidos pelo técnico versado. Cópias de uma sequência de ácido nucleico específica geradas in vitro em uma reação de amplificação são chamadas de “amplicons” ou “produtos de amplificação”.
[0035] O termo “adaptador” refere-se a uma sequência de ácido nucleico curta, quimicamente sintetizada, que pode ser usada para se ligar à extremidade-3 ’ ou -5’ de uma sequência de ácido nucleico com o propósito de facilitar a fixação à outra molécula. O adaptador pode ser de fita simples ou de fita dupla. Um adaptador pode incorporar uma sequência curta (e.g., menor que 55 pares de bases) útil para sequenciamento ou amplificação por PCR. O adaptador pode compreender sequências conhecidas, sequências degeneradas, ou ambas. Um adaptador de fita dupla pode compreender duas fitas hibridizáveis. Altemativamente, um adaptador de fita dupla pode compreender uma porção hibridizável e uma porção não hibridizável. A porção não hibridizável de um adaptador de fita dupla compreende duas
Petição 870190070370, de 24/07/2019, pág. 21/108
15/80 regiões de fita simples que não são hibridizáveis entre si. Dentro da porção não hibridizável, a fita contendo uma extremidade-5’ não hibridizada é referida como a fita-5’ e a fita contendo uma extremidade-3’ não hibridizada é referida como a fita-3’. Em algumas modalidades, o adaptador de fita dupla tem uma porção hibridizável em uma extremidade do adaptador e uma porção não hibridizável na extremidade oposta do adaptador. Em algumas modalidades, a porção não hibridizável do adaptador de fita dupla pode estar aberta (adaptador de formato em Y).
[0036] O termo “código de barras” refere-se a uma sequência de nucleotídeos dentro de um polinucleotídeo que é usada para identificar uma molécula de ácido nucleico. Por exemplo, um código de barras pode ser usado para identificar moléculas quando as moléculas de vários grupos são combinadas para processamento ou sequenciamento em uma maneira multiplexada. Um código de barras pode estar localizado em uma determinada posição dentro de um polinucleotídeo (e.g., na extremidade-3’, na extremidade-5’, ou no meio do polinucleotídeo) e pode compreender sequências de qualquer comprimento (e.g., 1 a 100 ou mais nucleotídeos). Adicionalmente, um código de barras pode compreender uma ou mais sequências predefinidas. O termo “predefinida” significa que a sequência de um código de barras é predeterminada ou conhecida antes da identificação ou sem a necessidade de identificação da sequência inteira do ácido nucleico compreendendo o código de barras. Em alguns casos, os códigos de barras predefinidos podem ser fixados aos ácidos nucleicos para separação dos ácidos nucleicos em grupos. Em algumas modalidades, um código de barras pode compreender sequências artificiais, e.g., sequências projetadas ou modificadas que não estão presentes no genoma inalterado (de tipo selvagem) de um sujeito. Em outras modalidades, um código de barras pode compreender uma sequência endógena, e.g., sequências que estão presentes no genoma inalterado (de tipo selvagem) de um sujeito. Em determinadas
Petição 870190070370, de 24/07/2019, pág. 22/108
16/80 modalidades, um código de barras pode ser um código de barras endógeno. Um código de barras endógeno pode ser uma sequência de um ácido nucleico genômico, sendo que a sequência é usada como um código de barras ou identificador para o ácido nucleico genômico. Uma ou mais sequências do fragmento de DNA genômico podem ser um código de barras endógeno. Tipos diferentes de códigos de barras podem ser usados em combinação. Por exemplo, um fragmento de ácido nucleico genômico endógeno pode ser fixado a uma sequência artificial, que pode ser usada como um identificador único do fragmento de ácido nucleico genômico. Um “código de barras amostra-específico” ou “código de barras de paciente” refere-se a uma sequência de polinucleotídeo que é usada para identificar a origem ou a fonte de uma molécula de ácido nucleico. Por exemplo, uma sequência de “AAAA” pode ser fixada para identificar ácidos nucleicos isolados do Paciente A.
[0037] Como aqui usados, os termos “sequência randômica” ou “sequência degenerada” referem-se a uma sequência não tendo uma definição precisa.
[0038] “Isca”, como aqui usada, é um tipo de reagente de captura híbrido que resgata sequências de ácidos nucleicos-alvo para sequenciamento. Uma isca pode ser uma molécula de ácido nucleico, e.g., uma molécula de DNA ou de RNA, que pode hibridizar com (e.g., ser complementar a), e, com isso, permitir a captura de um ácido nucleico-alvo. Em uma modalidade, uma isca é uma molécula de RNA (e.g., uma molécula de RNA modificada ou naturalmente ocorrente); uma molécula de DNA (e.g., uma molécula de DNA modificada ou naturalmente ocorrente), ou uma combinação das mesmas. Em outras modalidades, uma isca inclui uma entidade de aglutinação, e.g., uma etiqueta de afinidade, que permite a captura e a separação, e.g., pela aglutinação a uma entidade de aglutinação, de um híbrido formado por uma isca e um ácido nucleico hibridizado com a isca. Em uma modalidade, uma isca é adequada para hibridização em fase de solução.
Petição 870190070370, de 24/07/2019, pág. 23/108
17/80 [0039] Os termos “câncer” ou “tumor” são usados intercambiavelmente e referem-se à presença de células possuindo características típicas de células causadoras de câncer, como proliferação descontrolada, imortalidade, potencial metastático, crescimento rápido e velocidade de proliferação rápida, e determinados atributos morfológicos característicos. As células cancerosas estão, com frequência, na forma de um tumor, mas tais células podem existir sozinhas dentro de um animal, ou podem ser uma célula cancerosa não tumorigênica. Como aqui usado, o termo “células cancerosas” inclui células pré-cancerosas (e.g., benignas), malignas, pré-metastáticas, metastáticas, e não metastáticas. Cânceres de virtualmente qualquer tecido são conhecidos por aquelas pessoas versadas na técnica, incluindo tumores sólidos como carcinomas, sarcomas, glioblastomas, melanomas, linfomas, mielomas, etc., e cânceres da circulação sanguínea como leucemias. Exemplos de câncer incluem, mas não são limitados aos, câncer ovariano, câncer de mama, câncer de cólon, câncer de pulmão, câncer de próstata, câncer gástrico, câncer pancreático, câncer cervical, câncer ovariano, câncer de fígado, câncer de bexiga, câncer do trato urinário, câncer de tireoide, câncer renal, carcinoma, melanoma, câncer de cabeça e pescoço, e câncer de cérebro. A frase “carga de câncer” ou “carga de tumor “refere-se à quantidade de células cancerosas ou ao volume de tumor em um sujeito. A redução da carga de câncer consequentemente pode referir-se à redução de células cancerosas, ou do volume de tumor em um sujeito. O termo “célula cancerosa” refere-se a uma célula que apresenta propriedades do tipo câncer, e.g., reprodução incontrolável, resistência aos sinais de anticrescimento, capacidade para metástase, e perda de capacidade para sofrer morte celular programada (e.g., apoptose) ou uma célula que é derivada de uma célula cancerosa, e.g., clone de uma célula cancerosa.
[0040] O termo “DNA livre da célula (cfDNA, cell-free DNAJ' refere-se ao DNA em uma amostra que quando coletado, não estava contido
Petição 870190070370, de 24/07/2019, pág. 24/108
18/80 dentro de uma célula. Os cfDNAs podem compreender tanto DNA derivado de célula normal quanto DNA derivado de célula cancerosa. O cfDNA é comumente obtido do sangue ou plasma (“circulação”). Os cfDNAs podem ser liberados para dentro da circulação mediante processos de morte celular ou secreção, e.g., apoptose ou necrose celular. Uma fração de cfDNA pode incluir ctDNA.
[0041] O “DNA circulante tumoral (ctDNA, circulating tumor DNA)” refere-se à fração de DNA livre da célula (cfDNA) em uma amostra que se origina de um tumor.
[0042] Os termos “complementar” ou “complementaridade”, como aqui usados, com referência aos polinucleotídeos (i.e., uma sequência de nucleotídeos como um oligonucleotídeo ou um ácido nucleico-alvo) referemse às regras de pareamento de bases. O complemento de uma sequência de ácido nucleico, como aqui usado, refere-se a um oligonucleotídeo que, quando alinhado com a sequência de ácido nucleico de tal modo que a extremidade-5’ de uma sequência de ácido nucleico seja pareada com a extremidade-3 ’ da outra sequência de ácido nucleico, está em “associação antiparalela”. Por exemplo, a sequência «5’-A-G-T-3’» é complementar à sequência «3’-T-C-A-5’». Determinadas bases não comumente encontradas em ácidos nucleicos naturalmente ocorrentes podem estar incluídas nos ácidos nucleicos aqui descritos. Estas incluem, por exemplo, inosina, 7desazaguanina, Ácidos Nucleicos Bloqueados (LNA, Locked Nucleic Acids'), e Ácidos Peptídeo-Nucleicos (PNA, Peptide Nucleic Acids). A complementaridade não precisa ser perfeita; dúplices estáveis podem conter pares de bases malpareadas, bases degenerativas, ou bases não pareadas. Aquelas pessoas versadas na técnica da tecnologia de ácido nucleico podem determinar a estabilidade do dúplex empiricamente considerando o número de variáveis incluindo, por exemplo, o comprimento do oligonucleotídeo, as sequência e composição de bases do oligonucleotídeo, a força iônica e a
Petição 870190070370, de 24/07/2019, pág. 25/108
19/80 incidência de pares de bases malpareadas. Uma sequência complementar pode também ser uma sequência de RNA complementar à sequência de DNA ou sua sequência complementar, e pode também ser um cDNA.
[0043] Como aqui usado, um “controle” é uma amostra alternativa usada em um experimento para propósito de comparação. Um controle pode ser “positivo” ou “negativo”. Uma “amostra de ácido nucleico de controle” ou “amostra de ácido nucleico de referência”, como aqui usada, refere-se às moléculas de ácido nucleico de uma amostra de controle ou de referência. Em determinadas modalidades, a amostra de ácido nucleico de controle ou de referência é uma sequência de DNA ou de RNA de tipo selvagem ou não mutada. Em determinadas modalidades, a amostra da ácido nucleico de referência está purificada ou isolada (e.g., está removida de seu estado natural).
[0044] O termo “deduplicação” refere-se a um método compreendendo o agrupamento de sequências de ácidos nucleicos em grupos compreendendo a progênie de uma molécula individual originalmente presente na amostra. A molécula original e sua progênie são caracterizadas por um mesmo código de barras molecular único (UID, Unique Molecular Identifier). A deduplicação compreende, ainda, a análise das sequências das moléculas da progênie para indiretamente determinar a sequência da molécula original com uma taxa de erros reduzida.
[0045] “Detecção”, como aqui usada, refere-se à determinação da presença de uma mutação em um ácido nucleico de interesse em uma amostra. A detecção não exige que o método forneça sensibilidade de 100%.
[0046] “Gene”, como aqui usado, refere-se a uma sequência de DNA que compreende sequências regulatórias e codificantes necessárias para a produção de um RNA, que pode ter uma função não codificante (e.g., um
RNA ribossomal ou RNA de transferência) ou que pode incluir um polipeptídeo ou um precursor de polipeptídeo. O RNA ou polipeptídeo pode
Petição 870190070370, de 24/07/2019, pág. 26/108
20/80 ser codificado por uma sequência codificante de comprimento completo ou por qualquer porção da sequência codificante desde que a atividade ou função desejada seja mantida. Embora uma sequência dos ácidos nucleicos possa ser mostrada na forma de DNA, uma pessoa comumente versada na técnica reconhece que a sequência de RNA correspondente terá uma sequência similar com a timina (T) estando substituída por uracila (U), i.e., “T” está substituída por “U.” [0047] O termo “região gênica” pode referir-se a um trecho de sequências dentro de um gene ou adjacente a um gene, e.g., um íntron, um éxon, um promotor, uma região-3’-não traduzida etc.
[0048] O termo “hibridizar” (“hibridização”), como aqui usado, refere-se a um processo pelo qual duas fitas de ácido nucleico substancialmente complementares (pelo menos cerca de 65% complementares ao longo de um trecho de pelo menos 14 a 25 nucleotídeos, pelo menos cerca de 75%, ou pelo menos cerca de 90% complementares) anelam entre si sob condições apropriadamente estringentes para formar um dúplex ou heterodúplex mediante a formação de uniões de hidrogênio entre os pares de bases complementares. As hibridizações são típica e preferivelmente conduzidas com moléculas de ácido nucleico de comprimento de sonda, preferivelmente 15 a 100 nucleotídeos em comprimento, mais preferivelmente 18 a 50 nucleotídeos em comprimento. As técnicas de hibridização de ácidos nucleicos são bem conhecidas na técnica. Consulte, e.g., Sambrook, et al., 1989, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Press, Plainview, N.Y. A hibridização e a força de hibridização (z.e., a força da associação entre os ácidos nucleicos) são influenciadas por fatores como o grau de complementaridade entre os ácidos nucleicos, a estringência das condições envolvidas, e o ponto de fusão térmico (Tm) do híbrido formado. Aquelas pessoas versadas na técnica entendem como estimar e ajustar a estringência das condições de hibridização de modo que as
Petição 870190070370, de 24/07/2019, pág. 27/108
21/80 sequências tendo pelo menos um nível desejado de complementaridade sejam estavelmente hibridizadas, enquanto que aquelas tendo complementaridade mais baixa não sejam estavelmente hibridizadas. Para exemplos de condições e parâmetros de hibridização, consulte, e.g., Sambrook, et al., 1989, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Press, Plain view, N.Y.; Ausubel, F. M. et al. 1994, Current Protocols in Molecular Biology, John Wiley & Sons, Secaucus, N.J. Em algumas modalidades, hibridização específica ocorre sob condições estringentes de hibridização. Um oligonucleotídeo ou polinucleotídeo (e.g., uma sonda ou um iniciador) que é específico para um ácido nucleico-alvo “hibridizará” com o ácido nucleico-alvo sob condições adequadas.
[0049] O termo “hibridizável” significa que duas fitas de polinucleotídeo de um ácido nucleico são complementares em uma ou mais posições de nucleotídeo, e.g., as bases nitrogenadas das duas fitas de polinucleotídeo podem formar duas ou mais uniões de hidrogênio de CrickWatson. Por exemplo, se um polinucleotídeo compreende 5’ ATGC 3’, ele é hibridizável com a sequência 5’ GCAT 3’. Sob algumas condições experimentais, se um polinucleotídeo compreende 5’ GGGG 3’, ele pode também ser hibridizável com as sequências 5’ CCAC 3’ e 5’ CCCA 3’, que não são perfeitamente complementares.
[0050] O termo “não hibridizável” significa que duas fitas de polinucleotídeo de um ácido nucleico são não complementares, e.g., as bases nitrogenadas das duas fitas de polinucleotídeo separadas não formam duas ou mais uniões de hidrogênio de Crick-Watson sob condições estringentes de hibridização.
[0051] Como aqui usados, os termos “indivíduo”, “paciente”, ou “sujeito” são usados intercambiavelmente e referem-se a um organismo individual, um vertebrado, um mamífero, ou um ser humano. Em uma modalidade preferida, o indivíduo, paciente ou sujeito é um ser humano.
Petição 870190070370, de 24/07/2019, pág. 28/108
22/80 [0052] Como aqui usado, o termo “biblioteca” refere-se a uma coleção de sequências de ácidos nucleicos, e.g., uma coleção de ácidos nucleicos derivados de fragmentos genômicos inteiros, fragmentos subgenômicos, cDNA, fragmentos de cDNA, cfDNA, RNA, fragmentos de RN A, ou uma combinação dos mesmos. Em uma modalidade, uma porção das ou todas as sequências de ácidos nucleicos da biblioteca compreende(m) uma sequência de adaptador. A sequência de adaptador pode estar localizada em uma ou em ambas as extremidades. A sequência de adaptador pode ser útil, e.g., para um método de sequenciamento (e.g., um método de NGS [Next Generation Sequencing], Sequenciamento de Nova Geração, Sequenciamento de Próxima Geração), para amplificação, para transcrição reversa, para sequenciamento, ou para clonagem em um vetor.
[0053] A biblioteca pode compreender uma coleção de sequências de ácidos nucleicos, e.g., uma sequência de ácido nucleico-alvo (e.g., uma sequência de ácido nucleico de tumor), uma sequência de ácido nucleico de referência, ou uma combinação das mesmas. Em algumas modalidades, as sequências de ácidos nucleicos da biblioteca podem ser derivadas de um único sujeito. Em outras modalidades, uma biblioteca pode compreender sequências de ácidos nucleicos de mais que um sujeito (e.g., 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30 ou mais sujeitos). Em algumas modalidades, duas ou mais bibliotecas de sujeitos diferentes podem ser combinadas para formar uma biblioteca tendo sequências de ácidos nucleicos de mais que um sujeito. Em uma modalidade, o sujeito tem, ou está sob risco para ter, um câncer ou tumor.
[0054] Uma “sequência de ácido nucleico de biblioteca” refere-se a uma molécula de ácido nucleico, e.g., DNA, RNA, ou uma combinação dos mesmos, que é um membro de uma biblioteca. Em algumas modalidades, uma sequência de ácido nucleico de biblioteca é uma molécula de DNA, e.g., DNA genômico, cfDNA ou cDNA. Em algumas modalidades, uma sequência de
Petição 870190070370, de 24/07/2019, pág. 29/108
23/80 ácido nucleico de biblioteca é DNA genômico fragmentado, e.g., cortado ou enzimaticamente preparado. Em determinadas modalidades, as sequências de ácidos nucleicos de biblioteca compreendem uma sequência de um sujeito e uma sequência não derivada do sujeito, e.g., sequência de adaptador, uma sequência de iniciador, ou outras sequências que permitem a identificação, e.g., sequências de “código de barras”.
[0055] O termo “ligação” refere-se à conexão de duas moléculas por uniões químicas para gerar uma molécula nova. Por exemplo, a aglutinação de um polinucleotídeo adaptador a outro polinucleotídeo pode referir-se à formação de uniões químicas entre o adaptador e o polinucleotídeo (e.g., usando uma ligase ou qualquer outro método) para gerar uma nova molécula individual compreendendo o adaptador e o polinucleotídeo.
[0056] O termo “PCR multiplex”, como aqui usado, refere-se à amplificação de dois ou mais produtos de PCR ou amplicons que são, cada um, iniciados usando um par de iniciadores diferentes.
[0057] O termo “mutação” refere-se a uma alteração genética no genoma de um organismo ou de uma célula. Por exemplo, as mutações de interesse podem ser alterações relativas à linhagem germinativa de um organismo, e.g., alterações específicas às células cancerosas. As mutações podem incluir variantes de nucleotídeo único (SNV, Single Nucleotide Variants'), variantes de número de cópias (CNV, Copy Number Variants), inserções, deleções e rearranjos (e.g., fusões).
[0058] “Sequenciamento de Nova Geração” (ou “Sequenciamento de Próxima Geração”) (Next-generation sequencing) ou NGS”, como aqui usado, refere-se a qualquer método de sequenciamento que determina a sequência de nucleotídeos de quer moléculas de ácidos nucleicos individuais (e.g., em sequenciamento de molécula única) quer substitutos (proxies) clonalmente expandidos de moléculas de ácidos nucleicos individuais em um modo em paralelo de alto desempenho (e.g., mais que 103, ΙΟ4, 105 ou mais moléculas
Petição 870190070370, de 24/07/2019, pág. 30/108
24/80 são simultaneamente sequenciadas). Em uma modalidade, a abundância relativa das espécies de ácido nucleico na biblioteca pode ser estimada pela contagem do número relativo de ocorrências de suas sequências cognatas nos dados gerados pelo experimento de sequenciamento. Os métodos de sequenciamento de nova geração são conhecidos na técnica, e são descritos, e.g., em Metzker, M. Nature Biotechnology Reviews 11:31-46 (2010).
[0059] Como aqui usado, “oligonucleotídeo” refere-se a uma molécula que tem uma sequência de bases de ácido nucleico em uma cadeia principal compreendida predominantemente de unidades monoméricas idênticas em intervalos definidos. As bases estão posicionadas na cadeia principal em uma tal maneira que elas podem ligar-se a um ácido nucleico tendo uma sequência de bases que são complementares às bases do oligonucleotídeo. Os oligonucleotídeos mais comuns têm uma cadeia principal de unidades de açúcar-fosfato. Uma distinção pode ser feita entre oligodesoxirribonucleotídeos que não tem um grupo hidroxila na posição-2’ e oligorribonucleotídeos que tem um grupo hidroxila na posição-2’. Os oligonucleotídeos podem também incluir derivados, nos quais o hidrogênio do grupo hidroxila está substituído por grupos orgânicos, e.g., um grupo alila. Uma ou mais bases do oligonucleotídeo podem também estar modificadas para incluir uma união de fosforotioato (e.g., um dos dois átomos de oxigênio na cadeia principal de fosfato que não está envolvido na ponte intemucleotídica, está substituído por um átomo de enxofre) para aumentar a resistência à degradação por nuclease. Os oligonucleotídeos do método que funcionam como iniciadores ou sondas são, em geral, de pelo menos cerca de 10 a 15 nucleotídeos em comprimento e mais preferivelmente de pelo menos cerca de 15 a 55 nucleotídeos em comprimento, embora oligonucleotídeos mais curtos ou mais longos possam ser usados no método. O tamanho exato dependerá de muitos fatores, que, por sua vez, dependerá da função ou do uso final do oligonucleotídeo. O oligonucleotídeo pode ser gerado em qualquer
Petição 870190070370, de 24/07/2019, pág. 31/108
25/80 maneira, incluindo, por exemplo, síntese química, replicação de DNA, digestão, por endonuclease de restrição, de plasmídeos ou de DNA de fago, transcrição reversa, PCR, ou uma combinação das mesmas. O oligonucleotídeo pode ser modificado e.g., pela adição de um grupo metila, uma porção biotina ou digoxigenina, uma etiqueta fluorescente ou pelo uso de nucleotídeos radioativos.
[0060] O termo “polinucleotídeo” refere-se a um biopolímero que compreende um ou mais monômeros nucleotídicos (naturais ou não naturais) covalentemente unidos em uma cadeia. Em algumas modalidades, um polinucleotídeo pode ter uma sequência compreendendo uma sequência de ácido nucleico genômico. Em outras modalidades, um polinucleotídeo pode ter uma sequência artificial (e.g., uma sequência não encontrada em ácidos nucleicos genômicos). Um polinucleotídeo pode compreender sequência de ácido nucleico genômica e/ou sequência artificial. Uma sequência artificial pode ou não conter nucleotídeos não naturais.
[0061] Como aqui usado, o termo “iniciador” refere-se a um oligonucleotídeo, que é capaz de atuar como um ponto de iniciação da síntese de sequência de ácido nucleico quando posto sob condições nas quais é induzida a síntese de um produto de extensão de iniciador que é complementar a uma fita de ácido nucleico-alvo, i.e., na presença de diferentes nucleotídeo-trifosfatos e uma polimerase em um agente tamponante apropriado (“agente tamponante” inclui pH, força iônica, cofatores etc.) e a uma temperatura adequada. Um ou mais dos nucleotídeos do iniciador podem ser modificados, por exemplo, pela adição de um grupo metila, uma porção biotina ou digoxigenina, uma etiqueta fluorescente ou pelo uso de nucleotídeos radioativos. Uma sequência de iniciador não precisa reproduzir a sequência exata do molde. Por exemplo, um fragmento de nucleotídeos não complementar pode ser fixado à extremidade-5' do iniciador, com o restante da sequência de iniciador sendo substancialmente complementar à fita. O
Petição 870190070370, de 24/07/2019, pág. 32/108
26/80 termo iniciador, como aqui usado, inclui todas as formas de iniciadores que podem ser sintetizadas incluindo iniciadores do tipo ácido peptídeo-nucleico, iniciadores do tipo ácido nucleico bloqueado, iniciadores modificados com grupo fosforotioato, iniciadores marcados, e semelhantes. O termo “iniciador direto”, como aqui usado, significa um iniciador que se anela com a fita antissenso de dsDNA. Um “iniciador reverso” anela-se com a fita senso de dsDNA.
[0062] Como aqui usado, “par de iniciadores” refere-se a um par de iniciador direto e iniciador reverso (z.e., um par de iniciador esquerdo e iniciador direito) que podem ser usados juntos para amplificar uma dada região de um ácido nucleico de interesse.
[0063] Como aqui usada, uma “amostra” refere-se a uma substância que está sendo ensaiada para a presença de uma mutação em um ácido nucleico de interesse. Métodos de processamento para liberar ou diferentemente tomar disponível um ácido nucleico para detecção são bem conhecidos na técnica e podem incluir etapas de manipulação de ácido nucleico. Uma amostra biológica pode ser um fluido corporal ou uma amostra de tecido isolada de um sujeito. Em alguns casos, uma amostra biológica pode consistir em sangue inteiro, plaquetas, células vermelhas do sangue, células brancas do sangue, plasma, soros, urina, fezes, amostra epidérmica, amostra vaginal, amostra de pele, suabe de bochecha, esperma, fluido amniótico, células cultivadas, amostra de medula óssea, biopsias de tumor, aspirado e/ou vilosidades coriônicas, células cultivadas, células endoteliais, fluido sinovial, fluido linfático, fluido ascítico, fluido intersticial ou extracelular e semelhantes. O termo “amostra” pode também incluir o fluido em espaços entre células, incluindo fluido crevicular gengival, medula óssea, fluido cerebroespinhal (FCE), saliva, muco, escarro, sêmen, suor, urina, ou quaisquer outros fluidos corporais. As amostras podem ser obtidas de um sujeito por qualquer meio incluindo, mas não limitado a, venipuntura,
Petição 870190070370, de 24/07/2019, pág. 33/108
27/80 excreção, ejaculação, massagem, biopsia, aspirado por agulha, lavagem, curetagem, incisão cirúrgica, ou intervenção ou outro meio conhecido na técnica. Uma amostra de sangue pode ser sangue inteiro ou qualquer fração do mesmo, incluindo células do sangue (células vermelhas do sangue, células brancas do sangue ou leucócitos, e plaquetas), soro e plasma. As amostras de sangue inteiro de cerca de 0,5 a 5 mL coletadas em EDTA, ACD ou heparina como anticoagulante são adequadas.
[0064] Como aqui usado, um “seletor” refere-se a uma pluralidade de oligonucleotídeos ou sondas que hibridizam com uma ou mais regiões genômicas. Em algumas modalidades, as uma ou mais regiões genômicas podem estar associadas com doenças, e.g., cânceres.
[0065] O termo “sensibilidade”, como aqui usado, com referência aos métodos da presente tecnologia, é uma medição da capacidade de um método para detectar uma variante de sequência pré-selecionada em uma população heterogênea de sequências. Um método tem uma sensibilidade de S% para variantes de F% se, dada uma amostra na qual a variante de sequência préselecionada está presente como pelo menos F% das sequências na amostra, o método pode detectar a sequência pré-selecionada em uma confiança préselecionada de C%, S% das vezes. A guisa de exemplo, um método tem uma sensibilidade de 90% para variantes de 5% se, dada uma amostra na qual a sequência variante pré-selecionada está presente como pelo menos 5% das sequências na amostra, o método pode detectar a sequência pré-selecionada em uma confiança pré-selecionada de 99%, 9 das 10 vezes (F=5%; C=99%; S=90%).
[0066] O termo “específico”, como aqui usado, com referência a um iniciador oligonucleotídeo significa que a sequência de nucleotídeos do iniciador tem pelo menos 12 bases de identidade de sequência com uma porção do ácido nucleico a ser amplificado quando o oligonucleotídeo e o ácido nucleico são alinhados Um iniciador oligonucleotídeo que é específico
Petição 870190070370, de 24/07/2019, pág. 34/108
28/80 para um ácido nucleico é um que, sob condições estringentes de hibridização ou de lavagem, é capaz de hibridizar com o alvo de interesse e substancialmente não hibridiza com ácidos nucleicos que não são de interesse. Níveis mais altos de identidade de sequência são preferidos e incluem pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95% e mais preferivelmente pelo menos 98% de identidade de sequência.
[0067] “Especificidade”, como aqui usada, é uma medição da capacidade de um método para distinguir uma variante de sequência préselecionada, verdadeiramente ocorrente, dos artefatos de sequenciamento ou de outras sequências proximamente relacionadas. E a capacidade para evitar detecções positivas falsas que podem provir de erros introduzidos na sequência de interesse durante a preparação da amostra, erro de sequenciamento, ou sequenciamento não intencional de sequências proximamente relacionadas como pseudogenes ou membros de uma família de genes. Um método tem uma especificidade de X% se, quando aplicado a um conjunto de amostras de Niotai sequências, no qual Xverdadeiras sequências são verdadeiramente variantes e XNão-verdadeiras são não verdadeiramente variantes, o método seleciona pelo menos X% das não verdadeiramente variantes como não variantes. E.g., um método tem uma especificidade de 90% se, quando aplicado a um conjunto de amostras de 1.000 sequências, no qual 500 sequências são verdadeiramente variantes e 500 são não verdadeiramente variantes, o método seleciona 90% das 500 sequências não verdadeiramente variantes como não variantes. Especificidades exemplificadoras incluem 90, 95, 98, e 99%.
[0068] O termo “condições estringentes de hibridização”, como aqui usado, refere-se às condições de hibridização pelo menos tão estringentes quanto as seguintes: hibridização em 50% de formamida, SSC 5x, 50 rnM de
NalUPCU, pH 6,8, 0,5% de SDS, 0,1 mg/mL de DNA sonificado de esperma de salmão, e solução de Denhart 5x a 42°C de um dia para outro; lavagem
Petição 870190070370, de 24/07/2019, pág. 35/108
29/80 com SSC 2x, 0,1% de SDS a 45°C; e lavagem com SSC 0,2x, 0,1% de SDS a 45°C. Em outro exemplo, condições estringentes de hibridização não devem permitir a hibridização de dois ácidos nucleicos que diferem em mais que duas bases ao longo de um trecho de 20 nucleotideos contíguos.
[0069] Como aqui usados, os termos “sequência alvo” e “sequência de ácido nucleico-alvo” referem-se a uma sequência de ácido nucleico específica a ser detectada e/ou quantificada na amostra a ser analisada.
Adaptadores de ácido nucleico da presente tecnologia [0070] São aqui providas composições de adaptador de polinucleotídeo que são úteis para identificar ou analisar ácidos nucleicos. Em algumas modalidades, os adaptadores de ácido nucleico da presente tecnologia são adaptadores de formato em Y.
[0071] A presente tecnologia provê uma pluralidade de adaptadores de formato em Y, em que cada adaptador de formato em Y compreende uma porção hibridizável em uma extremidade (extremidade proximal) do adaptador de formato em Y e uma porção não hibridizável na extremidade oposta (extremidade distal) do adaptador de formato em Y, em que a porção hibridizável compreende uma sequência de código de barras de fita dupla identificável única de pelo menos 6 a 12 pares de bases. Os adaptadores de ácido nucleico aqui revelados podem ser fixados a um ou mais ácidos nucleicos (e.g., cfDNA) mediante a porção hibridizável (de fita dupla) dos adaptadores.
[0072] Também é aqui provida uma pluralidade de adaptadores de formato em Y, em que cada adaptador de formato em Y compreende uma porção hibridizável em uma extremidade (extremidade proximal) do adaptador de formato em Y e uma porção não hibridizável na extremidade oposta (extremidade distal) do adaptador de formato em Y, e em que cada adaptador de formato em Y compreende um código de barras de paciente de pelo menos dois nucleotideos.
Petição 870190070370, de 24/07/2019, pág. 36/108
30/80 [0073] Os adaptadores de ácido nucleico da presente tecnologia compreendem uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que (a) a primeira fita de oligonucleotídeo (i) compreende uma primeira região proximal e uma primeira região distai, em que a primeira região proximal compreende uma primeira sequência de identificador molecular único e uma primeira sequência espaçadora tendo a sequência 5’ TGACT 3’ (SEQ ID NO: __), em que a primeira sequência espaçadora está localizada 3’ à primeira sequência de identificador molecular único; e (ii) não compreende uma sequência degenerada ou semidegenerada;
(b) a segunda fita de oligonucleotídeo (i) compreende uma segunda região proximal e uma segunda região distai, em que a segunda região proximal compreende uma segunda sequência de identificador molecular único e uma segunda sequência espaçadora tendo a sequência 5’ GTCA 3’ (SEQ ID NO: __), em que a sequência espaçadora está localizada 5’ ao segundo identificador molecular único; e (ii) não compreende uma sequência degenerada ou semidegenerada; (c) a primeira região proximal da primeira fita de oligonucleotídeo hibridiza com a segunda região proximal da segunda fita de oligonucleotídeo (i.e., a porção hibridizável do adaptador); e (d) a primeira região distai da primeira fita de oligonucleotídeo não hibridiza com a segunda região distai da segunda fita de oligonucleotídeo (i.e., a porção não hibridizável do adaptador). Em algumas modalidades do adaptador de ácido nucleico, o nucleotideo “T” localizado na extremidade-3’ da primeira sequência espaçadora contém uma união de fosforotioato. Em determinadas modalidades, a primeira sequência de identificador molecular único e a segunda sequência de identificador molecular único podem compreender nucleotideos não naturais, e.g., aminoalil-uridina, iso-citosinas, isoguanina, e
2-aminopurina.
[0074] Em algumas modalidades, a primeira sequência de identificador molecular único da primeira fita de oligonucleotídeo é
Petição 870190070370, de 24/07/2019, pág. 37/108
31/80 selecionada a partir do grupo consistindo em: 5’ AGCTGCAGTAGC 3’ (SEQ ID NO: 5’ TGATGATGATAC 3’ (SEQ ID NO: _); 5’
TCGACTGTCGAG 3’ (SEQ ID NO: 5’ GTACTCTAGCTA 3’ (SEQ ID NO: _); 5’ CAGAGCACTCGT 3’ (SEQ ID NO: _); 5’ CATGCGATAGTC 3’ (SEQ ID NO: _); 5’ TCATCAGTCGAG 3’ (SEQ ID NO: _); 5’ AATCAGCGGTAT 3’ (SEQ ID NO: _); 5’ AGCATACTACTG 3’ (SEQ ID NO: _); 5’ GCTGATACACGT 3’ (SEQ ID NO: _); 5’ CTCTGTCACACG 3’ (SEQ ID NO: _); 5’ GCTACGTCATCA 3’ (SEQ ID NO: _); 5’ GCAGATGTCACT 3’ (SEQ ID NO: 5’ ACTCACAGCTAG 3’ (SEQ ID NO: _); 5’ CTCGCTCATGTA 3’ (SEQ ID NO: 5’ TAGCTGCACTAG 3’ (SEQ ID NO: _); 5’ CAGTTCGAGCTA 3’ (SEQ ID NO: _); 5’ TGCATGACTCGC 3’ (SEQ ID NO: 5’ GTGTACTGTACA 3’ (SEQ ID NO: 5’ ACTAGAGTCTGA 3’ (SEQ ID NO: _); 5’
AGAGTGCGTGTC 3’ (SEQ ID NO: _); 5’ TACGCATCAGAT 3’ (SEQ ID NO: _); 5’ CTGCATGACAGT 3’ (SEQ ID NO: _); e 5’ GTACGATCTCAC 3’ (SEQ ID NO: _).
[0075] Adicional ou altemativamente, em algumas modalidades, a segunda sequência de identificador molecular único da segunda fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’ GCTACTGCAGCT 3’ (SEQ ID NO: _); 5’ GTATCATCATCA 3’ (SEQ ID NO: 5’ CTCGACAGTCGA 3’ (SEQ ID NO: _); 5’
TAGCTAGAGTAC 3’ (SEQ ID NO: _); 5’ ACGAGTGCTCTG 3’ (SEQ ID NO: _); 5’ GACTATCGCATG 3’ (SEQ ID NO: 5’ CTCGACTGATGA 3’ (SEQ ID NO: _); 5’ ATACCGCTGATT 3’ (SEQ ID NO: _); 5’ CAGTAGTATGCT 3’ (SEQ ID NO: _); 5’ ACGTGTATCAGC 3’ (SEQ ID NO: 5’ CGTGTGACAGAG 3’ (SEQ ID NO: 5’
TGATGACGTAGC 3’ (SEQ ID NO: _); 5’ AGTGACATCTGC 3’ (SEQ ID
NO: _); 5’ CTAGCTGTGAGT 3’ (SEQ ID NO: 5’
TACATGAGCGAG 3’ (SEQ ID NO: 5’ CTAGTGCAGCTA 3’ (SEQ
Petição 870190070370, de 24/07/2019, pág. 38/108
32/80
ID NO: 5’ TAGCTCGAACTG 3’ (SEQ ID NO: _); 5’
GCGAGTCATGCA 3’ (SEQ ID NO: _); 5’ TGTACAGTACAC 3’ (SEQ ID NO: _); 5’ TCAGACTCTAGT 3’ (SEQ ID NO: _); 5’ GACACGCACTCT 3’ (SEQ ID NO: _); 5’ ATCTGATGCGTA 3’ (SEQ ID NO: _); 5’ ACTGTCATGCAG 3’ (SEQ ID NO: e 5’ GTGAGATCGTAC 3’ (SEQ ID NO:
[0076] Em algumas modalidades, a sequência de nucleotídeos da primeira fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’
TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGCTGCAGTAGC TGACT 3’ (SEQ ID NO: 1); 5’ TACACTCTTTCCCTACACGACG CTCTTCCGATCTTGATGATGATACTGACT 3’ (SEQ ID NO: 3); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTCGACTGTCGAGT GACT 3’ (SEQ ID NO: 5); 5’ TACACTCTTTCCCTACACGAC GCTCTTCCGATCTGTACTCTAGCTATGACT 3’ (SEQ ID NO: 7); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCAGAGCACTCGT TGACT 3’ (SEQ ID NO: 9); 5’ TACACTCTTTCCCTACACGA CGCTCTTCCGATCTCATGCGATAGTCTGACT 3’ (SEQ ID NO: 11); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTCATCAGTCGAGT GACT 3’ (SEQ ID NO: 13); 5’ TACACTCTTTCCCTACACGA CGCTCTTCCGATCTAATCAGCGGTATTGACT 3’ (SEQ ID NO: 15); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGCATACTACTGT GACT 3’ (SEQ ID NO: 17); 5’ TACACTCTTTCCCTACACG ACGCTCTTCCGATCTGCTGATACACGTTGACT 3’ (SEQ ID NO: 19); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCTCTGTCACACGT GACT 3’ (SEQ ID NO: 21); 5’ TACACTCTTTCCCTACACG ACGCTCTTCCGATCTGCTACGTCATCATGACT 3’ (SEQ ID NO: 23); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCAGATGTCACTT GACT 3’ (SEQ ID NO: 25); 5’ TACACTCTTTCCCTACACG
Petição 870190070370, de 24/07/2019, pág. 39/108
33/80
ACGCTCTTCCGATCTACTCACAGCTAGTGACT 3’ (SEQ ID NO: 27); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCTCGCTCATGTAT GACT 3’ (SEQ ID NO: 29); 5’ TACACTCTTTCCCTACACG ACGCTCTTCCGATCTTAGCTGCACTAGTGACT 3’ (SEQ ID NO: 31); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCAGTTCGAGCTAT GACT 3’ (SEQ ID NO: 33); 5’ TACACTCTTTCCCTACACGA CGCTCTTCCGATCTTGCATGACTCGCTGACT 3’ (SEQ ID NO: 35); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGTGTACTGTACAT GACT 3’ (SEQ ID NO: 37); 5’ TACACTCTTTCCCTACACGA CGCTCTTCCGATCTACTAGAGTCTGATGACT 3’ (SEQ ID NO: 39); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGAGTGCGTGTC TGACT 3’ (SEQ ID NO: 41); 5’ TACACTCTTTCCCTACACGAC GCTCTTCCGATCTTACGCATCAGATTGACT 3’ (SEQ ID NO: 43); 5’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCTGCATGACAGTT GACT 3’ (SEQ ID NO: 45); e 5’ TACACTCTTTCCCTACACG ACGCTCTTCCGATCTGTACGATCTCACTGACT 3’ (SEQ ID NO: 47). [0077] Adicional ou altemativamente, em algumas modalidades, a sequência de nucleotideos da segunda fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’
GTCAGCTACTGCAGCTAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 2); 5’ GTCAGTATCATCATCAAGAT CGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 4); 5’ GTCACTCGACAGTCGAAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 6); 5’ GTCATAGCTAGAGTACAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 8); 5’ GTCAACGAGTGCTCTGAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 10); 5’ GTCAGACTATCGCATGAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 12); 5’ GTCACTCGACTGATGAAGATCGGAAGAGCACACGTCTGAACTCCA
Petição 870190070370, de 24/07/2019, pág. 40/108
34/80
GTCAC 3’ (SEQ ID NO: 14); 5’ GTCAATACCGCTGATTAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 16); 5’ GTCACAGTAGTATGCTAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 18); 5’ GTCAACGTGTATCAGCAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 20); 5’ GTCACGTGTGACAGAGAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 22); 5’ GTCATGATGACGTAGCAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 24); 5’ GTCAAGTGACATCTGCAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 26); 5’ GTCACTAGCTGTGAGTAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 28); 5’ GTCATACATGAGCGAGAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 30); 5’ GTCACTAGTGCAGCTAAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 32); 5’ GTCATAGCTCGAACTGAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 34); 5’ GTCAGCGAGTCATGCAAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 36); 5’ GTCATGTACAGTACACAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 38); 5’ GTCATCAGACTCTAGTAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 40); 5’ GTCAGACACGCACTCTAGATCGGAAGAGCACACGTCTGAACTCCA GTCAC 3’ (SEQ ID NO: 42); 5’ GTCAATCTGATGCGTAAG ATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 44); 5 ’ GTCAACTGTCATGCAGAGATCGGAAGAGCACACGTCTGAACTCC AGTCAC 3’ (SEQ ID NO: 46); e 5’ GTCAGTGAGATCGTACAGA TCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 48). [0078] Em determinadas modalidades dos adaptadores de ácido nucleico, a extremidade-5’ da primeira fita de oligonucleotídeo é marcada com uma etiqueta de afinidade (e.g., biotina). Em outras modalidades dos
Petição 870190070370, de 24/07/2019, pág. 41/108
35/80 adaptadores de ácido nucleico, a extremidade-3’ da segunda fita de oligonucleotídeo é marcada com uma etiqueta de afinidade (e.g., biotina). Os adaptadores de ácido nucleico da presente tecnologia podem ser usados para sequenciar uma molécula de ácido nucleico-alvo de fita dupla selecionada a partir do grupo consistindo em DNA de fita dupla ou RNA de fita dupla. O DNA de fita dupla pode ser DNA genômico cortado ou DNA livre da célula. [0079] Adicional ou alternativamente, em algumas modalidades, os adaptadores de ácido nucleico da presente tecnologia compreendem, ainda, uma sequência de código de barras amostra-específico (e.g., código de barras de paciente), em que a sequência de código de barras amostra-específico compreende cerca de 2 a 20 nucleotídeos. O código de barras de paciente pode conter, bases naturalmente ocorrentes (e.g., Adenosina (A), Timidina (T), Guanosina (G), Citosina (C), e Uracila (U)) ou bases não naturalmente ocorrentes (e.g., aminoalil-uridina, iso-citosinas, isoguanina, e 2aminopurina).
[0080] Em algumas modalidades, o código de barras de paciente está localizado na fita-5’ da porção não hibridizável dos adaptadores de ácido nucleico. Em outras modalidades, o código de barras de paciente está localizado na fita-3’ da porção não hibridizável dos adaptadores de ácido nucleico. Altemativamente, em determinadas modalidades, o código de barras de paciente está localizado na porção hibridizável dos adaptadores de ácido nucleico.
[0081] Em qualquer uma das modalidades acima, os adaptadores de ácido nucleico da presente tecnologia podem compreender, ainda, pelo menos dois sítios de aglutinação de iniciadores de PCR, pelo menos dois sítios de aglutinação de iniciadores de sequenciamento, ou qualquer combinação dos mesmos. Em algumas modalidades, os sítios de aglutinação de iniciadores de PCR e/ou os sítio de aglutinação de iniciadores de sequenciamento estão presentes na porção não hibridizável dos adaptadores de ácido nucleico da
Petição 870190070370, de 24/07/2019, pág. 42/108
36/80 presente tecnologia. Em outras modalidades, os sítios de aglutinação de iniciadores de PCR e/ou os sítio de aglutinação de iniciadores de sequenciamento estão presentes na porção hibridizável dos adaptadores de ácido nucleico da presente tecnologia. Em algumas modalidades, os sítioS de aglutinação de iniciadores de sequenciamento compreendem pelo menos uma sequência selecionada a partir do grupo consistindo em P5, P7, Pl, A e lon Xpress™.
[0082] Em qualquer uma das modalidades acima, um adaptador de ácido nucleico da presente tecnologia pode compreender as mesmas sequências de iniciadores que dos adaptadores de ácido nucleico da presente tecnologia. Em outras modalidades, as sequências de iniciadores em um ou mais adaptadores de ácido nucleico da presente tecnologia podem ser diferentes das sequências de iniciadores nos outros adaptadores de ácido nucleico aqui revelados.
Métodos de detecção da presente tecnologia [0083] São aqui revelados métodos para a detecção ultras sensível de ácidos nucleicos, e.g., DNA circulante livre da célula, por exemplo, DNA circulante tumoral livre da célula em uma amostra. O método acuradamente quantifica ácidos nucleicos, e.g., DNA tumoral livre da célula derivado de tumores. Devido ao fato de que os níveis de DNA derivado de tumor, com frequência, correspondem às respostas clínicas às diversas terapias, o método pode identificar mutações acionáveis. O método pode também ser usado para não invasivamente detectar e monitorar tumores, facilitando, assim, a terapia de câncer personalizada.
[0084] A presente revelação provê métodos para detecção de mutações relacionadas a câncer em ácidos nucleicos circulantes tumorais com sensibilidade alta usando sequenciamento de nova geração. O método pode ser aplicado ao DNA livre da célula (cfDNA) contendo DNA circulante tumoral (ctDNA). O método da presente tecnologia otimiza a detecção de
Petição 870190070370, de 24/07/2019, pág. 43/108
37/80 ctDNA de amostras de entrada baixa, facilitando, com isso, a quantificação isenta de biopsia de variantes ao longo de centenas que quilobases.
[0085] Em algumas modalidades do método, SNVs e inserções/deleções com uma frequência tão baixa quanto 0,5% podem ser detectadas com uma entrada de cfDNA de 5 a 15ng. Em determinadas modalidades do método, SNVs e inserções/deleções com uma frequência tão baixa quanto 0,25% podem ser detectadas com uma entrada de cfDNA de pelo menos 30ng.
[0086] Em um aspecto, a presente revelação provê um método para detecção de pelo menos uma mutação em uma molécula de DNA circulante tumoral (ctDNA) de fita dupla presente em uma amostra obtida de um paciente compreendendo (a) ligar uma pluralidade de adaptadores de formato em Y às ambas extremidades da molécula de ctDNA de fita dupla para formar um complexo de adaptador-ctDNA de fita dupla, cada adaptador de formato em Y compreendendo uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que a sequência da primeira fita de oligonucleotídeo e a sequência da segunda fita de oligonucleotídeo são selecionadas a partir do grupo consistindo em SEQ ID NO: 1 e SEQ ID NO: 2; SEQ ID NO: 3 e SEQ ID NO: 4; SEQ ID NO: 5 e SEQ ID NO: 6; SEQ ID NO: 7 e SEQ ID NO: 8; SEQ ID NO: 9 e SEQ ID NO: 10; SEQ ID NO: 11 e SEQ ID NO: 12; SEQ ID NO: 13 e SEQ ID NO: 14; SEQ ID NO: 15 e SEQ ID NO: 16; SEQ ID NO: 17 e SEQ ID NO: 18; SEQ ID NO: 19 e SEQ ID NO: 20; SEQ ID NO: 21 e SEQ ID NO: 22; SEQ ID NO: 23 e SEQ ID NO: 24; SEQ ID NO: 25 e SEQ ID NO: 26; SEQ ID NO: 27 e SEQ ID NO: 28; SEQ ID NO: 29 e SEQ ID NO: 30; SEQ ID NO: 31 e SEQ ID NO: 32; SEQ ID NO: 33 e SEQ ID NO: 34; SEQ ID NO: 35 e SEQ ID NO: 36; SEQ ID NO: 37 e SEQ ID NO: 38; SEQ ID NO: 39 e SEQ ID NO: 40; SEQ ID NO: 41 e SEQ ID NO: 42; SEQ ID NO: 43 e SEQ ID NO: 44; SEQ ID NO: 45 e SEQ ID NO: 46; e SEQ ID NO: 47 e SEQ ID NO: 48; (b) amplificar ambas as
Petição 870190070370, de 24/07/2019, pág. 44/108
38/80 fitas do complexo de adaptador-ctDNA para produzir primeiros amplicons e segundos amplicons, em que os primeiros amplicons são derivados da primeira fita de oligonucleotídeo, os segundos amplicons são derivados da segunda fita de oligonucleotídeo; (c) sequenciar os primeiros amplicons e segundos amplicons; (d) detectar pelo menos uma mutação na molécula de ctDNA de fita dupla, quando uma mutação detectada nos primeiros amplicons é consistente com uma mutação detectada nos segundos amplicons. Os complexos de adaptador-ctDNA são formados pela fixação da molécula de ctDNA à porção hibridizável (de fita dupla) dos adaptadores de formato em [0087] Em algumas modalidades do método, o paciente é diagnosticado com câncer ovariano, câncer de mama, câncer de cólon, câncer de pulmão, câncer de próstata, câncer gástrico, câncer pancreático, câncer cervical, câncer de fígado, câncer de bexiga, câncer do trato urinário, câncer de tireoide, câncer renal, carcinoma, melanoma, câncer de cabeça e pescoço ou câncer de cérebro.
[0088] Em determinadas modalidades do método, ambas as extremidades-3’ da molécula de ctDNA de fita dupla compreendem, ainda, uma projeção-“A”. Os métodos aqui revelados compreendem uma etapa de fixar de uma molécula à outra molécula, e.g., um adaptador de polinucleotídeo em um polinucleotídeo diferente. A fixação pode compreender ligar os adaptadores de formato em Y da presente tecnologia a um ou mais ácidos nucleicos. Em alguns casos, a enzima usada na ligação é uma DNA-ligase, e.g., uma DNA-ligase de fago T4, DNA-ligase de E. coli, ligase de mamífero, ou qualquer combinação das mesmas. A ligase de mamífero pode ser DNA-ligase I, DNA-ligase III, ou DNA-ligase IV. A ligase pode também ser uma ligase termoestável.
[0089] Em algumas modalidades, o método compreende, ainda, enriquecer os primeiros amplicons e segundos amplicons com uma
Petição 870190070370, de 24/07/2019, pág. 45/108
39/80 pluralidade de sequências-isca, em que a pluralidade de sequências-isca compreende pelo menos uma região gênica que corresponde a cada um de uma pluralidade de genes relacionados a câncer. A pluralidade de genes relacionados a câncer pode compreender ALK, BRAF, EGFR, ERBB2, KIT, KRAS, MET, NRAS, NTRK1, PIK3CA, ROS1 e RET.
[0090] Adicional ou altemativamente, em algumas modalidades do método, a pluralidade de sequências-isca são iscas de RNA, iscas de DNA, ou uma mistura de iscas de RNA e iscas de DNA. Em determinadas modalidades, a pluralidade de sequências-isca compreende uma mistura 1:1 de iscas de RNA e iscas de DNA. Em outras modalidades, a pluralidade de sequências-isca compreende uma mistura de iscas de RNA e iscas de DNA tendo uma razão de 2:1, 1,5:1, 0,75:1 ou 0,5:1.
[0091] Em qualquer uma das modalidades acima, cada adaptador de formato em Y compreende, ainda, pelo menos dois sítios de aglutinação de iniciadores de sequenciamento. Adicional ou altemativamente, em algumas modalidades, cada adaptador de formato em Y compreende, ainda, uma sequência de código de barras paciente-específico, em que a sequência de código de barras paciente-específico compreende 2 a 20 nucleotídeos. Cada adaptador de formato em Y da presente tecnologia pode estar marcado com uma etiqueta de afinidade (e.g., biotina).
[0092] Em algumas modalidades do método, a amostra compreende não mais que 5 ng de DNA livre da célula. Em outras modalidades, a amostra compreende pelo menos 6 a 20 ng de DNA livre da célula. Em determinadas modalidades, a amostra é sangue inteiro, soro, plasma, fluido sinovial, fluido linfático, fluido ascítico, ou fluido intersticial.
[0093] A detecção pode incluir a determinação de se os primeiros amplicons e os segundos amplicons originam-se da mesma fita de uma molécula de ctDNA de fita dupla presente na amostra por meio de identificação das sequências identificadoras moleculares presentes na porção
Petição 870190070370, de 24/07/2019, pág. 46/108
40/80 hibridizável das primeira e segunda fitas de oligonucleotídeo do adaptador de formato em Y da presente tecnologia (z.e., a “sequência de código de barras de fita dupla”). As sequências de códigos de barras de fita dupla únicos podem identificar fitas do ácido nucleico-alvo (e.g., uma molécula de ctDNA). Por exemplo, após um adaptador ser fixado a um ácido nucleicoalvo, ambas as fitas do ácido nucleico resultante contêm o código de barras de fita dupla único. Após a amplificação, os amplicons derivados de uma fita do ácido nucleico contêm o mesmo código de barras de fita dupla que os amplicons derivados da outra fita do mesmo ácido nucleico.
[0094] Portanto, em algumas modalidades, o código de barras de fita dupla pode ser usado para identificar amplicons derivados das duas fitas do mesmo ácido nucleico molde. Em determinadas modalidades, os códigos de barras de fita dupla únicos podem ser usados para identificar mutações em uma fita, mas não na outra fita, do ácido nucleico. Em determinadas modalidades, as mutações que ocorrem em uma fita, mas não na outra fita, do ácido nucleico molde podem ser erros de amplificação que podem ser rejeitados como artefatos.
[0095] A sequência de código de barras de fita dupla pode estar localizada vários pares de bases distante do par de bases que fixa o adaptador de formato em Y à molécula de ctDNA. Se as sequências identificadoras moleculares podem ser comparadas como se originando do mesmo adaptador, é possível o sequenciamento de fita dupla. A sequência de código de barras de fita dupla é comparada pelo pareamento de Watson-Crick.
[0096] No contexto da presente tecnologia, os amplicons derivados do mesmo ácido nucleico molde devem conter a mesma sequência de identificador molecular único (UID, Unique Molecular Identifier}. Estes identificadores moleculares únicos diferentes podem ser usados para identificar e contar os ácidos nucleicos molde diferentes na amostra original. Por exemplo, UIDs podem ser usados para contar os ácidos nucleicos molde
Petição 870190070370, de 24/07/2019, pág. 47/108
41/80 originais contendo as mesmas mutações. Em outros casos, os UIDs podem ser usados para identificar e agrupar os amplicons do mesmo ácido nucleico molde original.
Amostras [0097] As amostras podem ser coletadas de sujeitos repetidamente durante um período de tempo (e.g., uma vez por dia, uma vez por semana, uma vez por mês, bianualmente ou anualmente). A obtenção de numerosas amostras de um sujeito durante um período de tempo pode ser usada para verificar os resultados desde as detecções iniciais ou para identificar uma alteração como resultado de, por exemplo, tratamento com fármaco.
[0098] A amostra pode compreender ácidos nucleicos incluindo ácidos nucleicos tumorais. Os ácidos nucleicos podem ser ácidos nucleicos genômicos. Os ácidos nucleicos podem também ser ácidos nucleicos circulantes, e.g., ácidos nucleicos livres da célula. Por exemplo, os ácidos nucleicos circulantes podem ser de um tumor, e.g., ctDNA. Os ácidos nucleicos de amostra úteis para os métodos da presente tecnologia podem compreender cfDNAs, e.g., DNA em uma amostra que não está contido dentro de uma célula. Tal DNA pode estar fragmentado, e.g., pode ser, em média, de cerca de 170 nucleotídeos em comprimento, que pode coincidir com o comprimento de DNA enrolado ao redor de um único nucleossomo.
[0099] O cfDNA pode ser uma mistura heterogênea de DNA de células normal e tumoral, e uma amostra inicial de cfDNA pode não estar enriquecida com DNA de célula cancerosa e regiões recorrentemente mutadas de um genoma de célula cancerosa. Uma pessoa versada na técnica entenderá que sequências não mutadas de linhagens germinativas podem não ser distinguidas entre uma fonte de tumor e uma fonte de célula normal, mas sequências contendo mutações somáticas têm uma probabilidade de serem derivadas de DNA tumoral. Em algumas modalidades, uma amostra pode compreender DNAs de linhagens germinativas de controle. Uma amostra
Petição 870190070370, de 24/07/2019, pág. 48/108
42/80 pode também compreender DNAs tumorais. Além disso, uma amostra pode compreender cfDNAs obtidos de um indivíduo suspeito de ter ctDNA na amostra. Adicionalmente, uma amostra pode compreender cfDNAs obtidos de um indivíduo suspeito de ter ctDNA na amostra, por exemplo, como parte de teste rotineiro.
[00100] Os métodos aqui revelados podem compreender a obtenção de uma ou mais amostras, e.g., amostras de ácido nucleico, de um sujeito. Os ácidos nucleicos de uma ou mais amostras podem ser ácidos nucleicos tumorais. Por exemplo, os ácidos nucleicos podem ser extraídos de biopsias de tumor. Os ácidos nucleicos tumorais podem também ser liberados das células tumorais para dentro da corrente sanguínea, e.g., como resultado de respostas imunológicas ao tumor. O ácido nucleico tumoral que é liberado para dentro do sangue pode ser ctDNA.
[00101] Os ácidos nucleicos de uma ou mais amostras podem ser ácidos nucleicos genômicos. Deve ser entendido que a etapa de obtenção de ácidos nucleicos tumorais e de ácidos nucleicos genômicos de um sujeito com um câncer específico pode ocorrer simultaneamente. Por exemplo, venipuntura para coletar sangue, plasma, ou soro, pode simultaneamente coletar ambos ácidos nucleicos genômico e tumoral. A obtenção de ácidos nucleicos tumorais e de ácidos nucleicos genômicos de um sujeito com um câncer específico pode também ocorrer em ocasiões separadas. Por exemplo, pode ser possível obter uma única amostra de tecido de um paciente, por exemplo, uma amostra de biopsia, que inclui ambos ácidos nucleicos tumorais e ácidos nucleicos genômicos. Também é possível obter os ácidos nucleicos tumorais e ácidos nucleicos genômicos do sujeito em amostras separadas, em tecidos separados, ou em tempos separados.
[00102] A obtenção de ácidos nucleicos tumorais e ácidos nucleicos genômicos de um sujeito com um câncer específico pode também incluir o processo de extração de um fluido biológico ou de uma amostra de tecido do
Petição 870190070370, de 24/07/2019, pág. 49/108
43/80 sujeito com o câncer específico. A obtenção dos ácidos nucleicos pode incluir procedimentos para melhorar o rendimento ou a recuperação dos ácidos nucleicos, como separação dos ácidos nucleicos dos outros contaminantes e componentes celulares que podem estar presentes no fluido biológico ou na amostra de tecido, e.g., por extração com fenol/clorofórmio, precipitação por solventes orgânicos ou colunas-spin para aglutinação de DNA.
[00103] Algumas vezes, os ácidos nucleicos estão misturados ou impuros. Em algumas modalidades, duas ou mais amostras podem ser isoladas de dois ou mais sujeitos. Sequências de códigos de barras de pacientes podem ser utilizadas para identificar uma amostra da qual o ácido nucleico originou-se e para separar os ácidos nucleicos em grupos diferentes. Em algumas modalidades, os ácidos nucleicos de uma primeira amostra podem estar associados com um primeiro código de barras de paciente, enquanto que ácidos nucleicos de uma segunda amostra podem estar associados com um segundo código de barras de paciente.
[00104] Em outras modalidades, as duas ou mais amostras podem ser do mesmo sujeito. Em determinadas modalidades, as duas ou mais amostras podem ser de tecidos diferentes do mesmo sujeito. Por exemplo, uma amostra pode ser de um tumor (e.g., um tumor sólido) e a outra amostra pode ser do sangue do mesmo sujeito. As amostras podem ser obtidas ao mesmo tempo ou em dois ou mais instantes de tempo.
Amplificação [00105] Os ácidos nucleicos sendo amplificados podem ser DNAs, incluindo DNAs genômicos, cDNAs (DNAs complementares), DNAs livres da célula (cfDNAs) e DNAs circulantes tumorais (ctDNAs). Os ácidos nucleicos sendo amplificados também podem se RNAs. Como aqui usada, uma reação de amplificação pode consistir em várias rodadas de síntese de DNA.
[00106] Os métodos aqui revelados podem compreender amplificação
Petição 870190070370, de 24/07/2019, pág. 50/108
44/80 dos ácidos nucleicos molde compreendendo ácidos nucleicos de amostra fixados aos adaptadores de formato em Y. Qualquer uma das técnicas conhecidas para amplificação de ácidos nucleicos (e.g., DNA e RNA) pode ser usada com os ensaios aqui descritos. Algumas técnicas de amplificação são as metodologias de reação em cadeia da polimerase (PCR, Polymerase Chain Reaction) que podem incluir, mas não são limitadas a, PCR em solução e PCR in situ. Altemativamente, a amplificação pode compreender amplificação não exponencial, como amplificação linear.
[00107] A amplificação dos ácidos nucleicos moldes pode compreender o uso da amplificação com aglutinação a microesferas (beads) seguida por detecção óptica como descrito nas Publicações de Pedidos U.S. n°s 2002/0012930, 2003/0058629, 2003/0100102, 2003/0148344,
2004/0248161, 2005/0079510, 2005/0124022, e 2006/0078909.
[00108] A amplificação de um ácido nucleico molde pode compreender o uso de uma ou mais polimerases. A polimerase pode ser uma DNA-polimerase ou uma RNA-polimerase. Em algumas modalidades, a polimerase pode ser uma polimerase de alta fidelidade, KAPA-HiFi-DNApolimerase. A polimerase pode ser também Phusion-DNA-polimerase.
[00109] Em algumas modalidades, um iniciador único ou um ou ambos iniciadores de um par de iniciadores compreende(m) um adaptador de sequenciamento específico ligado à extremidade-5 ’ da porção de sequência específica-alvo do iniciador. Este adaptador de sequenciamento é um oligonucleotídeo curto de sequência conhecida que pode prover um sítio de iniciação tanto para amplificação quanto para sequenciamento do ácido nucleico-alvo contíguo. Como tais, os adaptadores de sequenciamento permitem a aglutinação de um fragmento a uma lâmina de fluxo para o sequenciamento de nova geração. Qualquer adaptador de sequenciamento pode estar incluído dentro de um iniciador usado na presente revelação.
[00110] Em algumas modalidades, todos os amplicons diretos (i.e.,
Petição 870190070370, de 24/07/2019, pág. 51/108
45/80 amplicons estendidos a partir dos iniciadores diretos que hibridizam com fitas antissenso de um ácido nucleico-alvo) contêm o mesmo adaptador de sequenciamento. Em algumas modalidades quando é realizado o sequenciamento de fita dupla, todos os amplicons diretos contêm o mesmo adaptador de sequenciamento e todos os amplicons reversos (i.e., amplicons estendidos a partir de iniciadores reversos que hibridizam com fitas senso de um segmento-alvo) contêm um adaptador de sequenciamento que é diferente do adaptador de sequenciamento dos amplicons diretos.
[00111] Em algumas modalidades, os adaptadores de sequenciamento são sequências de adaptadores P5 e/ou P7 que são recomendadas pelos Sequenciadores da Illumina (MiSeq e HiSeq). Consulte, e.g., WilliamsCarrier et al., Plant J., 63(1):167-77 (2010). Em algumas modalidades, os adaptadores de sequenciamento são sequências de adaptadores de código de barras Pl, A, ou lon Xpress™ que são recomendados pelos Sequenciadores da Life Technologies. Outros adaptadores de sequenciamento são conhecidos na técnica.
[00112] Adicional ou altemativamente, em algumas modalidades dos métodos acima, são sequenciados amplicons de mais que uma amostra. Em algumas modalidades, todas as amostras são sequenciadas simultaneamente em paralelo. Em algumas modalidades dos métodos acima, amplicons de pelo menos 1, 5, 10, 20, 30, ou até 35, 40, 45, 48 ou 50 amostras diferentes são amplificados e sequenciados usando os métodos aqui descritos.
[00113] Adicional ou altemativamente, em algumas modalidades do método, amplicons derivados de uma única amostra podem compreender, ainda, uma sequência de índice idêntica que indica a fonte a partir da qual o amplicon é gerado, a sequência de índice para cada amostra sendo diferente das sequências de índice de todas as outras amostras. Como tal, o uso de sequências de índice permite que múltiplas amostras sejam reunidas por rodada de sequenciamento e a fonte de amostras seja subsequentemente
Petição 870190070370, de 24/07/2019, pág. 52/108
46/80 averiguada com base na sequência de índice. Em algumas modalidades, o “Access Array™ System” (Fluidigm Corp., San Francisco, CA, EUA) ou o “Apollo 324 System” (Wafergen Biosystems, Fremont, CA, EUA) é usado para gerar uma biblioteca de amplicons de código de barras (indexados) por amplificação simultânea dos ácidos nucleicos das amostras em uma configuração.
[00114] Em algumas modalidades, os amplicons indexados são gerados usando iniciadores (por exemplo, iniciadores diretos e/ou iniciadores reversos) contendo a sequência de índice. Tais iniciadores indexados podem ser incluídos durante a preparação da biblioteca como uma ferramenta de “codificação de barras” para identificar os amplicons como originários de uma fonte de amostras específica. Quando são usados iniciadores indexados e/ou ligados a adaptador de sequenciamento, o adaptador de sequenciamento e/ou a sequência de índice é incorporado(a) ao amplicon (juntamente com a sequência de iniciador específica-alvo) durante a amplificação. Portanto, os amplicons resultantes são sequenciamento-competentes e não exigem o protocolo tradicional de preparação de biblioteca. Além disso, a presença da etiqueta de índice permite a diferenciação de sequências de múltiplas fontes de amostra. Em algumas modalidades, a biblioteca de amplicons é gerada usando a abordagem de PCR multiplexada.
[00115] Os amplicons indexados de mais que uma fonte de amostras são quantificados individualmente e então reunidos antes do sequenciamento de alto desempenho. Como tal, o uso de sequências de índice permite que múltiplas amostras (i.e., amostras de mais que uma fonte de amostras) sejam reunidas por rodada por sequenciamento e a fonte de amostras seja averiguada com base na sequência de índice. Quando conjuntos de iniciadores indexados são usados, esta capacidade pode ser explorada para estudos comparativos. Em algumas modalidades, as bibliotecas de amplicons de até 48 fontes separadas são reunidas antes do sequenciamento.
Petição 870190070370, de 24/07/2019, pág. 53/108
47/80
Reparo de extremidade [00116] Os métodos aqui revelados podem compreender a realização de uma reação de reparo de extremidade em uma pluralidade de ácidos nucleicos-alvo (e.g., cfDNA) para produzir uma pluralidade de ácidos nucleicos reparados na extremidade. Por exemplo, a reação de reparo de extremidade pode ser conduzida antes da fixação dos adaptadores de formato em Y da presente tecnologia à pluralidade de ácidos nucleicos-alvo.
[00117] Em algumas modalidades, a reação de reparo de extremidade pode ser conduzida antes da amplificação dos ácidos nucleicos modificados com adaptador. Em outras modalidades, a reação de reparo de extremidade pode ser conduzida após a amplificação doa ácidos nucleicos modificados com adaptador.
[00118] Em algumas modalidades, a reação de reparo de extremidade pode ser conduzida antes da fragmentação da pluralidade de ácidos nucleicosalvo. Em outras modalidades, a reação de reparo de extremidade pode ser conduzida após a fragmentação da pluralidade de ácidos nucleicos-alvo.
[00119] A reação de reparo de extremidade pode também ser realizada pelo uso de uma ou mais enzimas de reparo de extremidade. Em algumas modalidades, as enzimas para reparo de DNA podem compreender polimerase e exonuclease. Por exemplo, polimerase pode introduzir as bases faltantes em uma fita de DNA na direção de 5’ para 3’. O DNA de fita dupla resultante pode ser de mesmo comprimento que a fita de DNA mais longa original. Exonuclease pode remover as projeções-3’. O DNA de fita dupla resultante pode ser de mesmo comprimento que a fita de DNA mais curta original.
Formação de cauda-A [00120] Os métodos aqui revelados podem compreender a realização de uma reação de formação de cauda-A na pluralidade de ácidos nucleicosalvo (e.g., cfDNA) para produzir uma pluralidade de ácidos nucleicos com cauda-A. Por exemplo, uma reação de formação de cauda-A pode ser
Petição 870190070370, de 24/07/2019, pág. 54/108
48/80 conduzida antes da fixação dos adaptadores de formato em Y da presente tecnologia à pluralidade de ácidos nucleicos.
[00121] Ainda, a reação de formação de cauda-A pode ser conduzida antes da amplificação dos ácidos nucleicos modificados com adaptador-. Em outras modalidades, a reação de formação de cauda-A pode ser conduzida após a amplificação dos ácidos nucleicos modificados com adaptador.
[00122] Em algumas modalidades, a reação de formação de cauda-A pode ser conduzida antes da fragmentação da pluralidade de ácidos nucleicosalvo. Em alguns casos, a reação de formação de cauda-A pode ser conduzida após a fragmentação da pluralidade de ácidos nucleicos-alvo.
[00123] Em outras modalidades, a reação de formação de cauda-A pode ser conduzida antes do reparo de extremidade da pluralidade de ácidos nucleicos-alvo. Em algumas modalidades, a reação de formação de cauda-A pode ser conduzida após o reparo de extremidade da pluralidade de ácidos nucleicos-alvo.
[00124] A reação de formação de cauda-A pode também ser conduzida pelo uso de uma ou mais enzimas formadoras de cauda-A. Por exemplo, um resíduo A pode ser adicionado pela incubação de um fragmento de DNA com dATP e uma DNA-polimerase não reparadora, que adicionará um único resíduo 3’-“A”.
Plataformas de NGS [00125] Genotipagem, detecção, identificação ou quantificação do ctDNA podem utilizar sequenciamento. O sequenciamento pode ser realizado usando sequenciamento de alto desempenho massivamente paralelo. O sequenciamento pode ser realizado usando usando ácidos nucleicos aqui descritos como DNA genômico, cfDNA, cDNA derivado de transcritos de RNA ou de RNA como um molde. Por exemplo, a informação de sequência da amostra de DNA livre da célula pode ser obtida por sequenciamento massivamente paralelo. Em algumas modalidades, o sequenciamento
Petição 870190070370, de 24/07/2019, pág. 55/108
49/80 massivamente paralelo pode ser realizado em um subconjunto de um genoma, e.g., de um subconjunto de cfDNA da amostra de cfDNA. A informação de sequência pode ser obtida por sequenciamento paralelo usando células de fluxo. Por exemplo, os iniciadores para amplificação podem ser covalentemente fixados às lâminas nas células de fluxo e então as células de fluxo podem ser expostas aos reagentes para extensão e sequenciamento de ácidos nucleicos.
[00126] Após a produção de uma biblioteca de amplicons etiquetados com adaptador, os amplicons são sequenciados usando sequenciamento de alto desempenho, massivamente paralelo (i.e., sequenciamento de nova geração). Em algumas modalidades, sequenciamento de alto desempenho, massivamente paralelo utiliza sequenciamento-por-síntese com corantes terminais reversíveis. Em outras modalidades, o sequenciamento é realizado via sequenciamento-por-ligação. Em ainda outras modalidades, o sequenciamento é sequenciamento de molécula única. Exemplos de técnicas de Sequenciamento de Nova Geração (Next Generation Sequencing, NGS) incluem, mas não são limitadas a, pirossequenciamento, sequenciamento com corantes terminais reversíveis, sequenciamento SOLiD™, sequenciamento por semicondutor de íons (hidrogênio), sequenciamento de molécula única Helioscope™ etc.
[00127] O sistema de sequenciamento de amplicon Ion Torrent™ (Life Technologies, Carlsbad, CA) utiliza a abordagem baseada em fluxo que detecta as alterações de pH causadas pela liberação de íons hidrogênio durante a incorporação de nucleotideos não modificados em replicação de DNA. Para uso com este sistema, uma biblioteca de sequenciamento é inicialmente produzida pela geração de fragmentos de DNA flanqueados por adaptadores de sequenciamento. Em algumas modalidades, estes fragmentos podem ser clonalmente amplificados sobre partículas por PCR em emulsão. As partículas com o molde amplificado são então posicionadas em um chip
Petição 870190070370, de 24/07/2019, pág. 56/108
50/80 semicondutor de silício para sequenciamento. Durante a replicação, o chip é inundado com um nucleotideo após o outro, e se um nucleotideo complementa a molécula de DNA em um micropoço específico do chip, então ele será incorporado. Um próton é habitualmente liberado quando um nucleotideo é incorporado pela polimerase na molécula de DNA, resultando em uma alteração local detectável de pH. O pH da solução então altera-se naquele poço e é detectado pelo sensor de íons. Se repetições de homopolímero estão presentes na sequência molde, múltiplos nucleotídeos serão incorporados em um ciclo único. Isto resulta em um número correspondente de hidrogênios liberados e um sinal eletrônico proporcionalmente mais alto.
[00128] O sistema de sequenciamento 454™ GS FLX™ (Roche, Alemanha), utiliza uma metodologia de detecção baseada em luz em um sistema de piros sequenciamento paralelo em grande escala. O pirossequenciamento usa polimerização de DNA, adição de uma espécie de nucleotideo de cada vez e detecção e quantificação do número de nucleotídeos adicionados a uma dada localização mediante a luz emitida pela liberação de pirofosfatos fixados. Para uso com o sistema 454™, fragmentos de DNA ligados ao adaptador são fixados em pequenas esferas (microesferas, beads) de captura de DNA em uma emulsão de água-em-óleo e amplificados por PCR (PCR em emulsão). Cada microesfera com DNA ligado é posicionada dentro de um poço em uma placa de picotitulação e os reagentes de sequenciamento são liberados através dos poços da placa. Os quatro nucleotídeos de DNA são adicionados sequencialmente em uma ordem fixa ao longo do dispositivo de placa de picotitulação durante uma rodada de sequenciamento. Durante o fluxo de nucleotídeos, milhões de cópias de DNA ligado a cada uma das microesferas são sequenciadas em paralelo. Quando um nucleotideo complementar à fita molde é adicionado a um poço, o nucleotideo é incorporado à fita de DNA existente, gerando um sinal
Petição 870190070370, de 24/07/2019, pág. 57/108
51/80 luminoso que é registrado por uma câmera CCD no instrumento.
[00129] Tecnologia de sequenciamento baseada em corantes terminais reversíveis: moléculas de DNA são primeiro fixadas aos iniciadores sobre uma lâmina e amplificadas de modo que sejam formadas colônias clonais locais. Quatro tipos de bases de terminador reversível {reversible terminator bases, RT-bases) são adicionados, e os nucleotídeos não incorporados são removidos por lavagem. Diferentemente do piros sequenciamento, o DNA pode ser apenas estendido com um nucleotídeo de cada vez. Uma câmera obtém imagens dos nucleotídeos fluorescentemente marcados, então o corante juntamente com o bloqueador terminal-3’ é quimicamente removido do DNA, permitindo o ciclo seguinte.
[00130] O sequenciamento de molécula única da “Helicos Biosciences Corp.” (Cambridge, MA) usa fragmentos de DNA com adaptadoras de cauda poli-A adicionados, que são fixados à superfície da lâmina de fluxo. Em cada ciclo, DNA-polimerase e uma espécie única de nucleotídeo fluorescentemente marcado são adicionadas, resultando em uma extensão dependente de molde dos dúplices de iniciador-molde imobilizados na superfície. As leituras são realizadas pelo sequenciador Helioscope™. Após obtenção das imagens cobrindo o arranjo completo, clivagem química e liberação do marcador fluorescente permite o subsequente ciclo de extensão e imageamento.
[00131] Sequenciamento por síntese (SBS, Sequencing By Ssynthesis), como o sequenciamento eletroforético com terminação de corante “no estilo antigo”, baseia-se na incorporação de nucleotídeos por uma DNA-polimerase para determinar a sequência de bases. Uma biblioteca de DNAs com adaptadores ligados é desnaturada em fitas simples e enxertada em uma lâmina de fluxo, seguido por amplificação por ponte para formar um arranjo de alta densidade de pontos sobre uma lâmina de vidro. Métodos com terminador reversível usam versões reversíveis de corantes terminadores, adicionando um nucleotídeo de cada vez, detectando a fluorescência em cada
Petição 870190070370, de 24/07/2019, pág. 58/108
52/80 posição pela remoção repetida do grupo bloqueador para permitir a polimerização de outro nucleotídeo. O sinal de incorporação de nucleotídeo pode variar com os nucleotideos fluorescentemente marcados, as reações luminosas ativadas por fosfato tendo todas sido usadas. Exemplos de plataformas de SBS incluem Illumina GA, HiSeq 2500, HiSeq 1500, HiSeq 2000, ou HiSeq 1000. O sistema de sequenciamento personalizado MiSeq® (Illumina, Inc.) também utiliza sequenciamento por síntese com química de terminador reversível.
[00132] Em contraste com o sequenciamento pelo método de síntese, o sequenciamento pelo método por ligação usa uma DNA-ligase para determinar a sequência-alvo. O método de sequenciamento baseia-se em ligação enzimática de oligonucleotídeos que são adjacentes mediante complementaridade local com a fita de DNA molde. Esta tecnologia utiliza uma partição de todos os possíveis oligonucleotídeos de um comprimento fixado, marcados de acordo com a posição sequenciada. Os oligonucleotídeos são anelados e a ligação preferencial pela DNA-ligase para emparelhamento de sequências resulta em um sinal de espaço de cores que codificam dinucleotídeos naquela posição (mediante a liberação de uma sonda fluorescentemente marcada que corresponde a um nucleotídeo conhecido em uma posição conhecida ao longo do oligonucleotídeo). Este método é principalmente usado pelos sequenciadores SOLiD™ da Life Technologies. Antes do sequenciamento, o DNA é amplificado por PCR em emulsão. As microesferas resultantes, cada uma contendo apenas cópias da mesma molécula de DNA, são depositadas sobre um substrato plano sólido.
[00133] O sequenciamento SMRT™ é baseado no sequenciamento pela abordagem de síntese. O DNA é sintetizado em recipientes do tipo poço pequeno-”Zero-Moó/e Wave-Guides” (ZMWs) com ferramentas de captura localizadas no fundo do poço. O sequenciamento é realizado com o uso de polimerase não modificada (fixada ao fundo de ZMW) e nucleotideos
Petição 870190070370, de 24/07/2019, pág. 59/108
53/80 fluorescentemente marcados fluindo livremente na solução. Os poços são construídos em uma maneira que apenas a fluorescência ocorrendo no fundo do poço é detectada. O marcador fluorescente é solto do nucleotídeo quando o nucleotídeo é incorporado à fita de DNA, deixando uma fita de DNA não modificada.
[00134] O sequenciamento de alto desempenho de RNA ou DNA pode também ser realizado usando “AnyDot-chips” (Genovoxx, Alemanha), que permite a monitoração de processos biológicos (e.g., expressão de miRNA ou variabilidade de alelo (detecção de SNP)). Por exemplo, os “AnyDot-chips” permitem a intensificação de 10X-50X da detecção de sinal de fluorescência de nucleotídeo. Outros sistemas de sequenciamento de alto desempenho incluem aqueles revelados em Venter, J., et al., Science 16 February 2001; Adams, M. et al., Science 24 March 2000; e M. J, Levene, et al., Science 299:682-686, January 2003; e, também, nas Publicações de Pedidos U.S. n°s 2003/0044781 e 2006/0078937.
Sequenciamento de fita dupla [00135] Os métodos aqui revelados podem compreender uma etapa de parear leituras de sequenciamento para obter uma sequência de fita dupla (dúplex). A etapa envolve ler cada sequência de ácido nucleico para determinar seu código de barras. Em algumas modalidades, os códigos de barras nas duas fitas são complementares entre si (e.g., se os IDs moleculares únicos estão localizados na porção hibridizável do adaptador de formato em Y). Sob este cenário, ácidos nucleicos etiquetados com adaptador de formato em Y são agrupados em famílias que compartilham o mesmo ID molecular único (UID, Unique molecular ID) e uma sequência consenso é estabelecida para cada uma das duas fitas para formar ‘sequências consenso de fita simples’ (SSCSs). As duas sequências consenso complementares derivadas das duas fitas de um dúplex de DNA individual são então comparadas entre si, e a identidade de bases em cada posição é retida apenas se as duas fitas
Petição 870190070370, de 24/07/2019, pág. 60/108
54/80 coincidirem perfeitamente naquela posição, dando uma ‘sequência consenso dúplex’ (DCS).
[00136] Em algumas modalidades, os métodos aqui revelados compreendem uma etapa de suprimir erros usando código de barras. O método compreende uma etapa de mapear a sequência para o genoma de referência e identificar todas as variantes de nucleotídeo único (SNVs) (i.e., bases diferentes da sequência de referência). O método compreende, ainda, uma etapa de submeter as SNVs à filtração de qualidade. Em algumas modalidades, a filtração de qualidade é filtração de qualidade “Phred” usando um limiar Q de 30, que elimina 99,9% dos erros decorrentes dos artefatos de sequenciamento.
[00137] Em algumas modalidades, o método compreende, ainda, uma etapa de reduzir erros pela contagem do número de SNVs para cada posição genômica (submetida à e tendo sido aprovada pela filtração de qualidade na etapa precedente) e selecionar a variante mais abundante. Em uma modalidade adicional, o método compreende, ainda, uma etapa de subtrair as sequências com SNVs, que não haviam sido aprovadas pela filtração de qualidade, do grupo de sequências definidas como uma família de códigos de barras que compartilham o mesmo UID. O método compreende, ainda, uma etapa de consolidar todos os membros da família de código de barras em uma única sequência, apenas mantendo as variantes que foram aprovadas na etapa precedente com >2 membros.
[00138] Ainda mais, em algumas modalidades do método, todas as variantes de não referência em famílias de códigos de barras de acontecimento singular (i.e., famílias com uma sequência) são eliminadas a não ser que confirmadas pela evidência de pelo menos uma outra molécula de DNA com > 2 membros da família confirmando aquela variante.
Redução de erro de “background” [00139] Os métodos aqui providos podem compreender, ainda,
Petição 870190070370, de 24/07/2019, pág. 61/108
55/80 métodos de redução de erro de “background”. Os erros de “background” podem compreender mutações que não ocorrem in vivo mas são artificialmente geradas, e.g., durante a amplificação ou o sequenciamento. As mutações de erro de “background”, por exemplo, alterações de nucleotídeo único, e.g., mutações de guanina para timina (G para T), podem ser causadas pelos erros de PCR ou de sequenciamento. Estas mutações ocorrem um uma fita de um ácido nucleico de fita dupla mas não ocorrem na outra fita. Estas mutações artificiais de G para T podem ser detectadas e desconsideradas.
[00140] Também são aqui revelados métodos para redução do erro de “background” em sequência de uma pluralidade de amplicons derivados de uma pluralidade de ácidos nucleicos, compreendendo a) identificar mutações de pelo menos uma primeira leitura de sequência e de pelo menos uma segunda leitura de sequência, onde as mutações da primeira leitura de sequência e da segunda leitura de sequência são mutações consistentes; b) eliminar as mutações que ocorrem em menos que 50% dos amplicons derivados de um único ácido nucleico; c) eliminar as mutações de G para T que ocorrem nos primeiros amplicons derivados de uma primeira fita de um ácido nucleico de fita dupla, onde as mutações de G para T não ocorrem nos segundos amplicons derivados de uma segunda fita do ácido nucleico de fita dupla; d) eliminar as mutações em amplicons, onde um primeiro subconjunto dos amplicons compreende um primeiro código de barras de fita dupla e um segundo subconjunto dos amplicons compreende um segundo código de barras de fita dupla, onde o primeiro código de barras de fita dupla é diferente do segundo código de barras de fita dupla; ou f) qualquer combinação dos mesmos. O termo “eliminar”, como aqui usado, pode referir-se aos dados de mutação desconsiderados da informação de sequência.
[00141] A redução de erro de “background” pode compreender identificar mutações de pelo menos uma primeira leitura de sequência e de pelo menos uma segunda leitura de sequência, em que as mutações da
Petição 870190070370, de 24/07/2019, pág. 62/108
56/80 primeira leitura de sequência e da segunda leitura de sequência são mutações consistentes. Neste caso, a mutação é uma mutação real, e.g., não é erro de “background”.
[00142] Em algumas modalidades, uma mutação de um nucleotídeo identificado de uma primeira leitura de sequência de uma fita de um ácido nucleico de fita dupla é consistente com uma mutação do nucleotídeo identificado de uma segunda leitura de sequência da mesma fita do ácido nucleico de fita dupla. Por exemplo, se as mutações são reais, e.g., não são erros de “background”, uma mutação (e.g., um nucleotídeo mutado para A) identificada de uma leitura de sequência de uma fita de um ácido nucleico de fita dupla deve ser consistente com uma mutação (e.g., um nucleotídeo mutado para A) identificada de uma segunda leitura de sequência da mesma fita do ácido nucleico de fita dupla.
[00143] Em determinadas modalidades, uma mutação de um nucleotídeo identificado de uma primeira leitura de sequência de uma fita de um ácido nucleico de fita dupla é consistente com uma mutação de um nucleotídeo complementar identificado de uma segunda leitura de sequência da outra fita do ácido nucleico de fita dupla. Por exemplo, se as mutações são reais, e.g., não são erros de “background”, uma mutação (e.g., um nucleotídeo mutado para A) identificada de uma leitura de sequência de uma fita de um ácido nucleico de fita dupla deve ser consistente com uma mutação T (e.g., um nucleotídeo mutado para T) identificada de uma leitura de sequência da outra fita do ácido nucleico de fita dupla.
[00144] A redução de erro de “background” pode compreender identificar mutações consistentes de 2 ou mais, e.g. até 20 ou mais leituras de sequência.
[00145] As mutações que são consideradas como erro de “background” na informação de sequência podem ocorrer randomicamente em vários loci, e por conseguinte, pode não estar presentes em todos os amplicons contendo
Petição 870190070370, de 24/07/2019, pág. 63/108
57/80 um lócus das mutações. Em outra modalidade, análise por bioinformática pode ser realizada para remover as mutações que não ocorrem em todos os amplicons contendo o mesmo lócus.
[00146] O erro de “background” pode compreender mutações que não ocorrem em todos os amplicons derivados de um único ácido nucleico. Por exemplo, a redução de erro de “background” pode compreender eliminar as mutações que ocorrem em menos que cerca de 50% a menos que cerca de 75% ou menos que cerca de 100% dos amplicons derivados de um único ácido nucleico ou abaixo de um nível de corte experimentalmente determinado.
[00147] A presente tecnologia também provê um método de sequenciamento de ctDNA que compreende uma etapa de reduzir os erros de “background” pelo agrupamento, em famílias, das moléculas que compartilham o mesmo ID molecular único (UID). Esta etapa determina o número de moléculas originais sequenciadas (como o número de famílias que compartilham um UID) e elimina os erros não compartilhados por todos os membros da família. Estes erros podem ser introduzidos por lesão oxidativa em nucleosídeo, PCR, e outras fontes exógenas durante a copiagem ou o processamento da molécula-alvo. O método de agrupamento de moléculas por UID e avaliação dos erros é referido como “deduplicação”. Em algumas modalidades, a presente tecnologia provê um método de avaliar câncer por análise de ctDNA com supressão de erros usando codificação de barras molecular. Em algumas modalidades, a presente tecnologia prove um método de supressão de erros em genotipagem de ctDNA de um paciente usando codificação de barras molecular.
[00148] As sequências podem ser, então “deduplicadas” usando UIDs como aqui descrito. Devido aos rendimentos tipicamente baixos de cfDNA em amostras clínicas de plasma, as taxas de erro e o desempenho de codificação de barras podem ser avaliados usando todas as moléculas
Petição 870190070370, de 24/07/2019, pág. 64/108
58/80 recuperadas (z.e., independente do número de cópias de UID ou da composição das fitas {strandedness)).
Projeto de seletor [00149] São aqui revelados métodos para análise de ácidos nucleicos para detectar câncer. Os métodos compreendem (a) ligar uma pluralidade de adaptadores de formato em Y via as porções de fita dupla deles às ambas extremidades de uma pluralidade de ácidos nucleicos de fita dupla para produzir ácidos nucleicos etiquetados com adaptador, em que cada adaptador de formato em Y compreende uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que a sequência da primeira fita de oligonucleotídeo e a sequência da segunda fita de oligonucleotídeo são selecionadas a partir do grupo consistindo em SEQ ID NO: 1 e SEQ ID NO: 2; SEQ ID NO: 3 e SEQ ID NO: 4; SEQ ID NO: 5 e SEQ ID NO: 6; SEQ ID NO: 7 e SEQ ID NO: 8; SEQ ID NO: 9 e SEQ ID NO: 10; SEQ ID NO: 11 e SEQ ID NO: 12; SEQ ID NO: 13 e SEQ ID NO: 14; SEQ ID NO: 15 e SEQ ID NO: 16; SEQ ID NO: 17 e SEQ ID NO: 18; SEQ ID NO: 19 e SEQ ID NO: 20; SEQ ID NO: 21 e SEQ ID NO: 22; SEQ ID NO: 23 e SEQ ID NO: 24; SEQ ID NO: 25 e SEQ ID NO: 26; SEQ ID NO: 27 e SEQ ID NO: 28; SEQ ID NO: 29 e SEQ ID NO: 30; SEQ ID NO: 31 e SEQ ID NO: 32; SEQ ID NO: 33 e SEQ ID NO: 34; SEQ ID NO: 35 e SEQ ID NO: 36; SEQ ID NO: 37 e SEQ ID NO: 38; SEQ ID NO: 39 e SEQ ID NO: 40; SEQ ID NO: 41 e SEQ ID NO: 42; SEQ ID NO: 43 e SEQ ID NO: 44; SEQ ID NO: 45 e SEQ ID NO: 46; e SEQ ID NO: 47 e SEQ ID NO: 48; (b) amplificar ambas as fitas dos ácidos nucleicos etiquetados com adaptador para produzir uma pluralidade de amplicons; (c) hibridizar os amplicons com um seletor compreendendo um conjunto de oligonucleotídeos que seletivamente hibridizam com regiões genômicas de todos os ou de um subconjunto dos um ou mais ácidos nucleicos da amostra; e (d) sequenciar os amplicons hibridizados para detectar a presença ou ausência de câncer ou de mutações
Petição 870190070370, de 24/07/2019, pág. 65/108
59/80 relacionadas a câncer. Em algumas modalidades, os ácidos nucleicos de fita dupla são DNA genômico, cfDNA, ctDNA, ou cDNA derivado de transcritos de RNA.
[00150] Mutações somáticas, que são mutações que ocorrem em qualquer uma das células do corpo exceto nas células da linhagem germinativa, podem ser características de células cancerosas. Os cânceres humanos são, em sua maioria, relativamente homogêneos para mutações somáticas em genes individuais. Um seletor pode ser usado para enriquecer moléculas de ácido nucleico derivadas de tumor a partir de ácidos nucleicos genômicos totais. O projeto do seletor pode determinar quais mutações podem ser detectadas com alta probabilidade para um paciente com um dado câncer. O tamanho do seletor pode também diretamente influenciar o custo e a profundidade de cobertura de sequência. Por exemplo, o projeto e o uso de seletores são descritos em parte em US 2014/0296081 e Newman et al., Nat Med. 20(5):548-54 (2014), aqui incorporados em suas totalidades como referências.
[00151] Os métodos aqui revelados podem compreender um ou mais seletores ou usos dos um ou mais seletores. Um seletor pode compreender uma pluralidade de oligonucleotídeos ou sondas que hibridizam com uma ou mais regiões genômicas. As regiões genômicas podem compreender uma ou mais regiões mutadas. As regiões genômicas podem compreender uma ou mais mutações associadas com um ou mais cânceres.
[00152] A pluralidade de regiões genômicas pode compreender diferentes regiões genômicas. Em algumas modalidades, a pluralidade de regiões genômicas pode compreender de umas poucas até 7.500 diferentes regiões genômicas.
[00153] Uma região genômica pode compreender uma região codificante de proteína, ou uma porção da mesma. Uma região codificante de proteína pode referir-se a uma região do genoma que codifica uma proteína,
Petição 870190070370, de 24/07/2019, pág. 66/108
60/80
e.g., um gene. Uma região genômica pode compreender dois ou mais genes, duas ou mais regiões codificantes de proteína, ou porções dos(as) mesmos(as). Um gene pode também compreender sequências não codificantes, como um íntron, ou região não traduzida (UTR, untranslated region) ou porções das mesmas. Em algumas modalidades, uma região genômica não compreende um gene inteiro. Uma região genômica pode compreender um pseudogene, um transposon, ou um retrotransposon.
[00154] Uma região genômica pode compreender uma região não codificante de proteína. Em algumas modalidades, uma região não codificante de proteína pode ser transcrita em um RNA não codificante (ncRNA, noncoding RNA). Em algumas modalidades, o RNA não codificante pode ser um RNA de transferência (tRNA, transfer RNA), RNA ribossomal (rRNA, ribosomal RNA), RNA regulatório, RNA nuclear pequeno (snRNA, small nuclear RNA), RNA nucleolar pequeno (snoRNA, small nucleolar RNA), microRNA, (siRNA, small interfering RNA), RNA interagente com proteínas Piwi (piRNA, Piwi-interacting RNA), ou ncRNA longo.
[00155] Uma região genômica pode compreender uma região recorrentemente mutada, e.g., uma região do genoma, habitualmente do genoma humano, na qual há uma probabilidade aumentada de mutação genética em um câncer de interesse, relativo ao genoma como um todo. Uma região recorrentemente mutada pode também se referir a uma região do genoma que compreende uma ou mais mutações que é recorrente na população. Uma região recorrentemente mutada pode ser caracterizada por um “índice de Recorrência” (IR).
[00156] O IR em geral refere-se ao número de sujeitos individuais (e.g., pacientes cancerosos) com uma mutação que ocorre dentro de um dado comprimento em quilobases (kb) da sequência genômica (e.g., número de pacientes com mutações/comprimento da região genômica em kb). Uma região genômica pode também ser caracterizada pelo número de pacientes
Petição 870190070370, de 24/07/2019, pág. 67/108
61/80 com uma mutação por éxon. Os limiares para cada métrica (e.g., IR e pacientes por éxon ou região genômica) podem ser selecionados para estatisticamente enriquecer em indutores conhecidos ou suspeitos do câncer de interesse. Os limiares podem também ser selecionados arbitrariamente escolhendo o percentil de topo para cada métrica.
[00157] O número de regiões genômicas em um seletor pode variar dependendo da natureza do câncer. A inclusão de números maiores de regiões genômicas pode em geral aumentar a possibilidade de que uma única mutação somática será identificada. Por exemplo, o genoma inteiro de uma amostra de tumor e de uma amostra genômica poderia ser sequenciado, e as sequências resultantes poderíam ser separadas para se observarem quaisquer diferenças com o tecido não tumoral.
[00158] A biblioteca de regiões genômicas recorrentemente mutadas, ou “seletor” pode ser usada ao longo de uma população inteira para um dado câncer, não precisa ser otimizada para cada sujeito.
[00159] O método pode compreender, ainda, uma reação de hibridização, e.g., hibridização dos amplicons com um seletor compreendendo um conjunto de oligonucleotídeos que seletivamente hibridiza com regiões genômicas de um ou mais ácidos nucleicos da amostra. Em algumas modalidades, a reação de hibridização pode compreender hibridiza da pluralidade de amplicons em um suporte sólido, e.g., uma pluralidade de microesferas.
[00160] O método pode compreender, ainda, conduzir uma reação de hibridização após uma reação enzimática. Por exemplo, em algumas modalidades, a reação enzimática pode compreender uma ou mais dentre uma reação de ligação, uma reação de fragmentação, uma reação de reparo de extremidade, uma reação de formação de cauda-A, ou uma reação de amplificação.
[00161] O seletor pode também compreender um conjunto de
Petição 870190070370, de 24/07/2019, pág. 68/108
62/80 oligonucleotídeos. O conjunto de oligonucleotídeos pode hibridizar com menos que 100 kb e até 1,5 megabases (Mb) do genoma. O conjunto de oligonucleotídeos pode ser capaz de hibridizar com pelo menos 5 e até 500 ou mais diferentes regiões genômicas. O seletor pode também hibridizar com uma variedade de diferentes regiões genômicas, e.g., entre cerca de 10 e cerca de 1.000 diferentes regiões genômicas. O seletor pode também hibridizar com uma pluralidade de regiões genômicas, e.g., cerca de 50 a cerca de 7.500 diferentes regiões genômicas.
[00162] Um seletor pode hibridizar com uma região genômica compreendendo uma mutação que não é recorrente na população. Por exemplo, uma região genômica pode compreender uma ou mais mutações que estão presentes em um dado sujeito. Em algumas modalidades, uma região genômica que compreende uma ou mais mutações em um sujeito pode ser usada para produzir um seletor personalizado para o sujeito.
[00163] O seletor pode hibridizar com uma pluralidade de regiões genômicas compreendendo uma ou mais mutações selecionadas a partir do grupo consistindo em SNV, CNV, inserções, deleções e rearranjos.
[00164] Um seletor pode hibridizar com uma mutação em uma região genômica conhecida ou predita por estar associada com um câncer. Uma mutação em uma região genômica conhecida por estar associada com um câncer pode ser referida como uma “mutação somática conhecida”. Uma mutação somática conhecida pode ser uma mutação localizada em um ou mais genes conhecidos por estarem associados com um câncer e pode ser uma mutação presente em um ou mais oncogenes. Por exemplo, mutações somáticas conhecidas pode incluem uma ou mais mutações localizadas em EGFR, KRAS ou BRAF. Altemativamente, um seletor pode hibridizar com uma mutação em uma região genômica que não tem sido relatada em estar associada com um câncer. Uma região genômica pode compreender uma sequência do genoma humano de tamanho suficiente para capturar uma ou
Petição 870190070370, de 24/07/2019, pág. 69/108
63/80 mais mutações recorrentes.
[00165] Os métodos da presente tecnologia podem ser direcionados para cfDNA, que é, em geral, menor que cerca de 200 pb em comprimento, e, por conseguinte, uma região genômica pode ser, em geral, menor que cerca de 10 kb. Geralmente, a região genômica de uma SNV pode ser bastante curta, de cerca de 45 pb a cerca de 500 pb em comprimento, enquanto que a região genômica de um rearranjo genômico de fusão ou de outro rearranjo genômico pode ser mais longa, de cerca de 1 kb a cerca de 10 kb em comprimento. Uma região genômica em um seletor pode ser menor que 10 kb, por exemplo, de 100 pb a 10 kb. Em algumas modalidades, a sequência total coberta pelo seletor é menor que cerca de 1,5 megapares-de-bases (Mb), e.g., 10 kb a 1,5 Mb.
[00166] Em determinadas modalidades, um seletor útil nos métodos da presente tecnologia compreende variantes obtidas do sequenciamento do genoma inteiro de tumores. Por exemplo, a lista de variantes pode ser obtida dos ácidos nucleicos de sequenciamento do exoma das coleções de amostras de tumor, como uma coleção de tumores de carcinoma de células escamosas (SCC, Squamous Cell Carcinoma) de pulmão ou de tumores de adenocarcinoma de pulmão ou de quaisquer outras coleções de um ou mais tipos de tumores disponíveis para análises por sequenciamento. As sequências podem ser filtradas para eliminar as variantes localizadas em regiões genômicas ricas em repetições (como por exemplo, repetições simples, microssatélites, repetições interrompidas e duplicações segmentais). As sequências podem também (ou ao contrário) ser filtradas para eliminar variantes localizadas em intervalos com baixas taxas de mapeamento ou baixa unicidade de k-mers (sequências curtas de k-nucleotídeos).
[00167] Seletores usados nos métodos aqui revelados podem ser projetados para cobrir tantos pacientes e mutações por paciente quanto possíveis com a mínima quantidade de espaço genômico.
Petição 870190070370, de 24/07/2019, pág. 70/108
64/80 [00168] Em algumas modalidades, a presente revelação provê um método de criar um seletor, i.e., selecionar regiões genômicas a serem analisadas em um paciente. Os seletores podem ser projetados para priorizar a inclusão de regiões genômicas com base na métrica de “índice de recorrência” (IR) aqui definida. Em algumas modalidades, regiões genômicas a serem incluídas no seletor são éxons ou porções menores de um éxon contendo lesões conhecidas. Uma região genômica a ser incluída compreende a lesão conhecida e é flanqueada por um ou mais pares de base para um comprimento de tile mínimo de 100 pb.
[00169] Em determinadas modalidades, regiões genômicas são classificadas por IR decrescente, e aquelas nas classificações mais altas de ambos IR e o número de pacientes por éxon são incluídas no seletor. Em algumas modalidades, a classificação mais elevada é mais alta que ou igual ao topo 10%. Nesta modalidade, o seletor tem cobertura de paciente adicional maximizada com espaço mínimo. Em algumas modalidades, o processo de seleção de regiões genômicas é repetido sob condições menos estringentes,
i.e., a classificação percentil mais baixa que o topo 10%, e.g., topo 33% pode ser selecionada. Nesta modalidade, o método resulta na inclusão de regiões que maximamente aumentam o número mediano de mutações por paciente. Em algumas modalidades, a inclusão de outras regiões genômicas em um seletor é terminada quando um tamanho predeterminado é alcançado. Em algumas modalidades, o tamanho predeterminado desejado é cerca de 100200 kb. Em outras modalidades, a inclusão de outras regiões genômicas em um seletor é terminada quando todas as regiões genômicas satisfazendo aos filtros descritos acima são esgotadas.
[00170] Em algumas modalidades, o seletor compreendendo regiões genômicas contendo variações de nucleotideo único (SNVs, Single Nucleotide
Variations') compreende, ainda, regiões clinicamente relevantes contendo outros tipos de mutações, e.g., fusões, regiões semente, variações de número
Petição 870190070370, de 24/07/2019, pág. 71/108
65/80 de cópias (CNVs, Copy Number Variations') e regiões de classificação histológica.
[00171] O seletor pode ser projetado para um câncer específico, câncer de pulmão de células não pequenas (NSCLC, Non-Small Cell Lung Cancer), câncer de mama, carcinoma endometrial uterino, etc. O seletor pode também ser projetado para uma classe genérica de cânceres, e.g., cânceres epiteliais (carcinomas), sarcomas, linfomas, melanomas, gliomas, teratomas, etc. O seletor pode também ser projetado para um subgênero de cânceres, e.g., adenocarcinoma, carcinoma de células escamosas, e semelhantes.
[00172] O seletor pode compreender informação relacionada a uma pluralidade de regiões genômicas compreendendo uma ou mais mutações presentes em pelo menos um sujeito sofrendo de um câncer. Por exemplo, o seletor pode compreender informação relacionada a uma pluralidade de regiões genômicas compreendendo até 20 mutações presentes em pelo menos um sujeito sofrendo de câncer. Em algumas modalidades, o seletor pode compreender informação relacionada a uma pluralidade de regiões genômicas compreendendo até 200 ou mais mutações presentes em pelo menos um sujeito sofrendo de câncer. Em algumas modalidades, as uma ou mais mutações dentro da pluralidade de regiões genômicas podem estar presentes em pelo menos 1% e até 20% ou mais (e.g., até 95% ou mais) dos sujeitos de uma população de sujeitos sofrendo de um câncer.
Estimativa da carga de tumor [00173] Em algumas modalidades, a presente revelação provê um método de determinação da carga de tumor em um paciente pelo sequenciamento de moléculas dúplices no cfDNA de paciente.
[00174] Os métodos aqui revelados podem compreender uma etapa de projetar um seletor cobrindo um número adequado (e.g., > 1.500) de variações de sequência, como mutações não sinônimas (i.e., uma mutação de nucleotídeo que altera a sequência de aminoácidos de uma proteína). O seletor
Petição 870190070370, de 24/07/2019, pág. 72/108
66/80 pode ser projetado por qualquer método varredura, e.g., sequenciamento do exoma de tumores. Em algumas modalidades, um seletor personalizado pode ser projetado por sequenciamento do exoma do tumor de pacientes. O método compreende, ainda, uma etapa de sequenciamento dúplex do cfDNA de paciente. Em algumas modalidades, tão poucos quanto 1.000 equivalentes genômicos podem ser recuperáveis nesta etapa.
Seleção de tratamento baseada na triagem de ctDNA [00175] São aqui revelados métodos para determinação de se um paciente hospedando uma ou mais mutações em ctDNA se beneficiará do tratamento com pelo menos um agente terapêutico.
[00176] Em um aspecto, a presente revelação provê um método para seleção de um paciente para tratamento com pelo menos um agente terapêutico compreendendo: (a) ligar uma pluralidade de adaptadores de formato em Y às ambas extremidades de uma molécula de ctDNA de fita dupla presente em uma amostra obtida de um paciente para formar um complexo de adaptador-ctDNA de fita dupla, cada adaptador de formato em Y compreendendo uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que a sequência da primeira fita de oligonucleotídeo e a sequência da segunda fita de oligonucleotídeo são selecionadas a partir do grupo consistindo em SEQ ID NO: 1 e SEQ ID NO: 2; SEQ ID NO: 3 e SEQ ID NO: 4; SEQ ID NO: 5 e SEQ ID NO: 6; SEQ ID NO: 7 e SEQ ID NO: 8; SEQ ID NO: 9 e SEQ ID NO: 10; SEQ ID NO: 11 e SEQ ID NO: 12; SEQ ID NO: 13 e SEQ ID NO: 14; SEQ ID NO: 15 e SEQ ID NO: 16; SEQ ID NO: 17 e SEQ ID NO: 18; SEQ ID NO: 19 e SEQ ID NO: 20; SEQ ID NO: 21 e SEQ ID NO: 22; SEQ ID NO: 23 e SEQ ID NO: 24; SEQ ID NO: 25 e SEQ ID NO: 26; SEQ ID NO: 27 e SEQ ID NO: 28; SEQ ID NO: 29 e SEQ ID NO: 30; SEQ ID NO: 31 e SEQ ID NO: 32; SEQ ID NO: 33 e SEQ ID NO: 34; SEQ ID NO: 35 e SEQ ID NO: 36; SEQ ID NO: 37 e SEQ ID NO: 38; SEQ ID NO: 39 e SEQ ID NO: 40; SEQ ID NO: 41 e SEQ ID NO: 42; SEQ
Petição 870190070370, de 24/07/2019, pág. 73/108
67/80
ID NO: 43 e SEQ ID NO: 44; SEQ ID NO: 45 e SEQ ID NO: 46; e SEQ ID NO: 47 e SEQ ID NO: 48; (b) amplificar ambas as fitas do complexo de adaptador-ctDNA para produzir primeiros amplicons e segundos amplicons, em que os primeiros amplicons são derivados da primeira fita de oligonucleotídeo, os segundos amplicons são derivados da segunda fita de oligonucleotídeo; (c) sequenciar os primeiros amplicons e segundos amplicons; (d) detectar pelo menos uma mutação na molécula de ctDNA de fita dupla, quando uma mutação detectada nos primeiros amplicons é consistente com uma mutação detectada nos segundos amplicons; e (e) selecionar o paciente para tratamento com pelo menos um agente terapêutico se uma mutação é detectada na molécula de ctDNA de fita dupla, em que a molécula de ctDNA corresponde a ALK, BRAF, EGFR, ERBB2, KIT, KRAS, MET, NRAS, NTRK1, PIK3CA, ROS1, ou RET [00177] Em algumas modalidades, o pelo menos um agente terapêutico compreende um(a) ou mais dentre terapias anti-HE/?-2, inibidores antitirosina-quinase-do-EGFR, inibidores da via PI3K/AKT/mTor, inibidores de quinases, inibidores de BRAF, inibidores de ALK/ΜΕΤ, antagonistas de ERBB2, e inibidores de RAF/MEK/ERK.
[00178] Em determinadas modalidades, o inibidor da tirosina-quinase do EGFR é gefitinibe ou eriotinibe. Em determinadas modalidades, a terapia anti-EGFR é cetuximabe.
[00179] Em algumas modalidades do método, a terapia anti-HER-2 é trastuzumabe ou lapatinibe.
[00180] Exemplos de inibidores de quinases incluem, mas não são limitados a crizotinibe, afatinibe, Axitinibe, bevacizumabe, Bosutinibe, Cetuximabe, Dasatinibe, Eriotinibe, Fostamatinibe, Gefitinibe, Imatinibe, Lapatinibe, Lenvatinibe, Nilotinibe, Panitumumabe, Pazopanibe, Pegaptanibe, Ranibizumabe, Ruxolitinibe, Sorafenibe, Sunitinibe, Trastuzumabe e Vemurafenibe.
Petição 870190070370, de 24/07/2019, pág. 74/108
68/80 [00181] Exemplos de inibidores de BRAF incluem, mas não são limitados a, GDC-0879, SB590885, Encorafenibe, RAF265, TAK-632, PLX4720, CEP-32496, AZ628, Tosilato de Sorafenibe, Sorafenibe, Vemurafenibe (Zelboraf) e Dabrafenibe (GSK2118436).
[00182] Exemplos de inibidores de RAF/MEK/ERK incluem, mas não são limitados a, Vemurafenibe (Zelboraf) e Dabrafenibe (GSK2118436), Encorafenibe, TAK-632, PLX4720, MLN2480, Cobimetinibe (GDC-0973), MEK 162, RO5126766, GDC-0623, VTXlle, Selumetinibe (AZD6244), PD0325901, Trametinibe (GSK1120212), U0126-EtOH, PD184352 (CI1040), Refametinibe, PD98059, BIX02189, Binimetinibe, Pimasertibe (AS703026), SL327, BIX02188, AZD833O, TAK-733, PD318088, SCH772984, e FR 180204.
[00183] Exemplos de inibidores da via PI3K/AKT/mTor incluem, mas não são limitados a, BKM120, BEZ235, Pictilisibe (GDC-0941), LY294002, CAL-101 (Idelalisibe), GNE-317, PI-3065, HS-173, PI-103, NU7441, GSK2636771, VS-5584, CZC24832, Duvelisibe, TG100-115, A66, YM201636, CAY10505, GSK1059615, PF-04691502, PIK-75, PIK-93, AS605240, BGT226, AZD6482, Voxtalisibe, Alpelisibe, CUDC-907, IC-87114, Omipalisibe, TG100713, Gedatolisibe, CH5132799, PKI-402, BAY 80-6946, TGX-221, XL147, PIK-90, PIK-293, PIK-294, 3-Metiladenina, Quercetina, Wortmanina, ZSTK474, AS-252424, AS-604850, everolimo, e Apitolisibe.
[00184] Exemplos de antagonistas de ERBB2 incluem, mas não são limitados a, Lapatinibe, Canertinibe, CP-724,714, AZD8931, AEE788, Tyrphostin AG 879, Mubritinibe, e Pertuzumabe.
[00185] Exemplos de inibidores de ALK incluem, mas não são limitados a, Crizotinibe, TAE684, Alectinibe, Ceritinibe, AP26113,
AZD3463, e ASP3026.
[00186] Exemplos de inibidores de MET incluem, mas não são limitados a, Crizotinibe, PHA-665752, SU11274, SGX-523, BMS-777607,
Petição 870190070370, de 24/07/2019, pág. 75/108
69/80
JNJ-38877605, Tivantinibe, PF-04217903, MGCD-265, Capmatinibe, AMG 208, MK-2461, AMG 458, NVP-BVU972, e Tepotinibe.
[00187] Os métodos da presente tecnologia são úteis para avaliação da eficácia de um regime de tratamento de câncer em um paciente. Os níveis de expressão de ctDNA/perfis de expressão de ctDNA provem níveis de referência (benchmarks) convenientemente mensuráveis pelos quais determina-se a efetividade de um regime terapêutico para câncer.
[00188] Em um aspecto, a presente revelação provê um método para avaliação da eficácia de um regime terapêutico em um sujeito diagnosticado com, ou suspeito de ter câncer compreendendo (a) detectar mutações em ctDNA em uma amostra de teste obtida do sujeito durante ou após a administração do regime terapêutico usando os adaptadores de ácido nucleico e os métodos aqui revelados, e (b) determinar a eficácia do regime de tratamento pela detecção das alterações nos níveis de expressão de ctDNA e/ou no perfil de expressão de ctDNA presente na amostra de teste relativa àquela observada em uma amostra de referência obtida do sujeito antes da administração do regime terapêutico. Em algumas modalidades do método, o regime terapêutico é determinado como sendo eficaz se os níveis de expressão de ctDNA presentes na amostra de teste estão decrescidos relativos àqueles observados em uma amostra de referência obtida do sujeito antes da administração do regime terapêutico. Em algumas modalidades do método, o regime terapêutico é determinado como sendo eficaz se o perfil de expressão de ctDNA presente na amostra de teste é comparável com aquele observado em uma amostra de teste obtida de um sujeito de controle normal (isento de câncer).
[00189] Em algumas modalidades, o regime terapêutico é detectado com base nos níveis de expressão de ctDNA e/ou no perfil de expressão de ctDNA observados no sujeito antes da administração do regime terapêutico. O regime terapêutico pode ser mantido, descontinuado, ou subsequentemente
Petição 870190070370, de 24/07/2019, pág. 76/108
70/80 modificado com base nos níveis de expressão de ctDNA e/ou no perfil de expressão de ctDNA observados no sujeito durante ou após a administração do regime terapêutico.
[00190] Em outro aspecto, os métodos aqui descritos são úteis para a identificação de populações de pacientes que apresentam diferentes graus de sensibilidades a um agente terapêutico (e.g., um agente terapêutico aqui revelado ou um agente terapêutico anticâncer conhecido na técnica). Idade, sexo, altura, peso, etnicidade, história familiar de distúrbios genéticos, status imunocomprometido, e história médica são exemplos não limitadores de fatores que podem influenciar a responsividade de um paciente a um agente terapêutico específico.
[00191] Alterações nos níveis de expressão de ctDNA e/ou perfis de expressão de ctDNA podem ser usadas para classificar os pacientes com base na responsividade deles a uma dose específica de um agente terapêutico. Em algumas modalidades, um paciente pode ser responsivo, não responsivo, ou hiper-responsivo a um agente terapêutico em uma dose específica ou em uma faixa de doses específica. A determinação da sensibilidade do paciente a um agente terapêutico é útil para otimizar a eficácia terapêutica e para reduzir os efeitos colaterais associados com o agente terapêutico. Em determinadas modalidades, a dose do agente terapêutico pode ser ajustada para alcançar eficácia terapêutica e/ou minimizar os efeitos colaterais com base nas alterações nos níveis de expressão de ctDNA e/ou nos perfis de expressão de ctDNA em pacientes tratados. Em outras modalidades, um agente terapêutico pode ser suplementado com um agente terapêutico adicional para alcançar eficácia terapêutica e/ou minimizar os efeitos colaterais com base nas alterações nos níveis de expressão de ctDNA e/ou nos perfis de expressão de ctDNA em pacientes tratados. Em outra modalidade, o tratamento com um agente terapêutico pode ser temporário ou completamente descontinuado para alcançar eficácia terapêutica e/ou minimizar os efeitos colaterais com base nas
Petição 870190070370, de 24/07/2019, pág. 77/108
71/80 alterações nos níveis de expressão de ctDNA e/ou nos perfis de expressão de ctDNA em pacientes tratados.
Kits [00192] A presente revelação provê também kits para detecção de alterações em cfDNA ou ctDNA em uma amostra.
[00193] Kits da presente tecnologia compreendem um ou mais adaptadores de ácido nucleico de formato em Y aqui revelados. Em algumas modalidades, os kits da presente tecnologia compreendem, ainda, sequênciasisca que são úteis para detectar mutações em várias sequências de cfDNA ou de ctDNA que correspondem a um ou mais genes relacionados a câncer incluindo, mas não limitados a ALK, BRAF, EGFR, ERBB2, KIT, KRAS, MET, NRAS, NTRK1, P1K3CA, ROS1 e RET.
[00194] Em algumas modalidades, os kits compreendem, ainda, agentes tamponantes, enzimas tendo atividade de polimerase, enzimas tendo atividade de polimerase ou não tendo atividade de exonuclease 5’—>3’ ou atividade de ambas exonucleases 5’—>3’ e 3’—>5’, cofatores de enzima como magnésio ou manganês, sais, nucleotideos de extensão de cadeia como desoxinucleotídeo-trifosfatos (dNTPs), dNTPs modificados, dNTPs resistentes à nuclease ou dNTPs marcados, necessários para realizar um ensaio ou uma reação, como amplificação e/ou detecção de alterações nas sequências de ácido nucleico alvo (e.g., ctDNA).
[00195] Em uma modalidade, os kits da presente tecnologia compreendem, ainda, uma sequência de ácido nucleico de controle positivo e uma sequência de ácido nucleico de controle negativo para garantir a integridade do ensaio durante as rodadas experimentais. Um kit pode conter, ainda, um meio para comparar o perfil de cfDNA em uma amostra derivada de um paciente canceroso com uma amostra de ácido nucleico de referência (e.g., uma amostra de cfDNA de paciente não canceroso). O kit pode também compreender instruções de uso, programa de computador para análise
Petição 870190070370, de 24/07/2019, pág. 78/108
72/80 automatizada, recipientes, embalagens tal como embalamento pretendido para venda comercial e semelhantes.
[00196] Os kits da presente tecnologia podem também incluir outros reagentes necessários para realizar qualquer uma das técnicas de NGS aqui reveladas. Por exemplo, o kit pode compreender, ainda, um(a) ou mais dentre: adaptadores de sequenciamento, iniciadores, enzimas reparadoras de extremidade, enzimas formadoras de cauda-A, sequências de código de barras, tubos de reação, ligases, agentes tamponantes para ligase, reagentes e/ou agentes tamponantes para lavagem, reagentes e/ou agentes tamponantes para hibridização, reagentes e/ou agentes tamponantes para marcação, e meios de detecção. Os agentes tamponantes e/ou reagentes são habitualmente otimizados para a técnica de amplificação/detecção específica para à qual o kit é pretendido. Protocolos para usar estes agentes tamponantes e reagentes para realizar diferentes etapas do procedimento podem também estar incluídos no kit.
[00197] Os kits da presente tecnologia podem incluir componentes que são usados para preparar ácidos nucleicos a partir de uma amostra de teste para as subsequentes amplificação e/ou detecção de alterações em cfDNA ou ctDNA. Tais componentes para preparação de amostra podem ser usados para produzir extratos de ácido nucleico das amostras de tecido. As amostras de teste usadas nos métodos descritos acima variarão com base em fatores como o formato do ensaio, a natureza do método de detecção, e os tecidos específicos, as células específicas ou os extratos específicos usados(as) como a amostra de teste a ser ensaiada. Métodos de extração de ácidos nucleicos das amostras são bem conhecidos na técnica e podem ser facilmente adaptados para obter uma amostra que é compatível com o sistema utilizado. Sistemas de preparação de amostras automatizados para extração de ácidos nucleicos de uma amostra de teste estão comercialmente disponíveis, e.g., sistema de preparação de amostras “COBAS AmpliPrep System” da Roche Molecular
Petição 870190070370, de 24/07/2019, pág. 79/108
73/80
Systems, sistema de preparação de amostras “BioRobot 9600” da Qiagen, e sistema de preparação de amostras “PRISM™ 6700” da Applied Biosystems.
EXEMPLOS
Exemplo 1: Métodos e Procedimentos Gerais [00198] Amostras de sangue inteiro foram coletadas dos pacientes em tubos “Cell-Free DNA BCT®“ (Streck, Omaha, NE, EUA), e subsequentemente centrifugadas para separar as porções de plasma, creme leucocitário e células vermelhas do sangue. O cfDNA foi extraído do plasma usando o “DynaMax Cell Free DNA Extraction Kit” (Life Technologies, Grand Island, NY, EUA) e o “Hamilton Microlab Star” (Hamilton Bonaduz A.G., Bonaduz, Suíça) e o “KingFisher” (Thermo Scientific, Waltham, MA, EUA) de acordo com as instruções do fabricante. O DNA foi quantificado usando o “Qubit dsDNA High Sensitivity Kit” (Life Technologies, Grand Island, NY, EUA) de acordo com as instruções do fabricante. O cfDNA isolado foi submetido ao reparo de extremidade e à formação de cauda-A usando o “NEBNext Ultra II End Repair Kit” (New England BioLabs, Ipswich, MA, EUA) de acordo com as instruções do fabricante.
[00199] YUMIs foram gerados e utilizados de acordo com os procedimentos descritos em Kennedy, S.R. et al., Nat. Protoc. 9, 2586-2606 (2014), que é aqui incorporado como referência. Oligonucleotídeos correspondendo às fitas senso e antissenso dos adaptadores de formato em Y de ácidos nucleicos aqui revelados (YAMIs) foram anelados individualmente em uma placa de 96 poços contendo solução tampão para hibridização de adaptador 5X (TE 0,5X (pH 8,0), NaCl 0,025M) sob as seguintes condições:
TEMPERATURA, °C TEMPO
95 5 min
35 Is
25 5 min
[00200] Os YAMIs anelados tendo, cada um, sua própria sequência de código de barras de fita dupla foram subsequentemente reunidos. Alguns
YAMIs foram biotinilados.
Petição 870190070370, de 24/07/2019, pág. 80/108
74/80 [00201] YAMIs e YUMIs foram, então, ligados às ambas extremidades de cada molécula de cfDNA via suas porções hibridizáveis (de fita dupla) usando o “NEBNext Ultra II Ligation Kit” (New England BioLabs, Ipswich, MA, EUA) de acordo com as instruções do fabricante. A concentração de adaptadores YAMI usados por amostra de cfDNA (entrada de 5-30 ng) foi aproximadamente de HOnM. Os produtos ligados foram purificados usando microesferas “Agencourt Ampure XP” (Beckman Coulter) de acordo com as instruções do fabricante. Os YAMIs também compreendiam um código de barras de paciente e uma sequência universal que podem se ligar a um iniciador de sequenciamento (e.g., P5 ou P7), que foram incorporados durante AMP1 usando os iniciadores MWS21 (5'-CAAGCAGAAGACGGCAT ACGAGATXXXXXXXXXGTGACTGGAGTTC AGACGTGTGC-3 ’) e
P5_R1_F (5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCT ACACGACGC-3’) sob as seguintes condições de PCR:
98 °C 2 min
98 °C 30 s 6 ciclos
61°C 30 s
72°C 1 min
72°C 5 min
[00202] Os ácidos nucleicos etiquetados com adaptador resultantes foram reunidos e subsequentemente contatados com iscas conjugadas com estreptavidina ou com biotina (“SureSelectXT Target Enrichment System”, Agilent Technologies, Santa Clara, CA, EUA, e “xGen® Lockdown® Probes ou Panels”, IDT, Coralville, IA, EUA) de acordo com as instruções do fabricante, de modo a enriquecer as regiões-alvo em ALK, BRAF, EGFR, ERBB2, KIT, KRAS, MET, NRAS, NTRK1, PIK3CA, ROS1, e RET Estas incluem regiões exônicas de EGFR, BRAF, MET, ERBB2, KRAS, NRAS, PI3KCA, e KIT e regiões intrônicas áeALK (íntron 19), ROS1 (introns 31-35), RET (introns 9-11), e NTKR1 (introns 8-11)._____________________________
Parâmetros Iscas de DNA (IDT) Iscas de RNA (Agilent)
Comprimento 60 nt* 120 nt
Densidade de Tiling 2x máx 5x máx
Temperatura Ótima de Hibridização 65°C 65°C
Temperatura Ótimo de Hibridização 4 horas 16-24 horas
Petição 870190070370, de 24/07/2019, pág. 81/108
75/80
I Tempo Ótimo de Lavagem | 60-65°C | 70-72°C ] *0 comprimento da isca de DNA pode variar de 60 a 120 pares de bases [00203] Os ácidos nucleicos etiquetados com adaptador enriquecidos foram subsequentemente amplificados por PCR usando os iniciadores P5 e P7. A informação de sequência dos amplicons etiquetados com adaptador purificados foi, então, obtida, pelo sequenciamento de nova geração usando a plataforma “Illumina NextSeq”. 6 Amostras no total (cinco amostras de paciente e uma única amostra de controle sem molde) foram reunidas para uma única biblioteca para sequenciamento.
[00204] Os amplicons foram agrupados em famílias compartilhando o mesmo ID molecular único (UID) e um sítio de partida posicionai específico quando mapeados para o genoma humano. Uma sequência consenso foi estabelecida para cada uma das duas fitas de uma molécula dúplex individual para formar ‘sequências consenso de fita simples’ (SSCSs). Consenso em cada posição é lido apenas se mais que 70% dos membros da família compartilham o mesmo nucleotídeo naquela posição.
[00205] Mutações que foram variantes biológicas reais ocorreram no mesmo lócus, enquanto que mutações falsas devido aos erros de “background” ocorreram randomicamente em loci diferentes. Além disso, mutações devido aos erros de “background” ocorreram em um subconjunto dos amplicons derivados do mesmo ácido nucleico molde. Os amplicons derivados do mesmo ácido nucleico molde foram alinhados com base no identificador único e a análise por bioinformática foi realizada para filtrar as mutações devido aos erros de “background”, e.g., mutações falsas, que ocorreram randomicamente em loci diferentes, ou que ocorreram em um subconjunto dos amplicons derivados do mesmo ácido nucleico molde As etapas de processamento de bioinformática implementadas para estas análises são descritas em Kennedy, S.R. et al., Nat. Protoc. 9, 2586-2606 (2014).
Exemplo 2: Desempenho Comparativo de YAMIs e YUMIs na Detecção de Mutações em cfDNA
Petição 870190070370, de 24/07/2019, pág. 82/108
76/80 [00206] Sabe-se que formações de estrutura secundária derivada de adaptador interferem com a eficiência de amplificação e o enriquecimento (via hibridização-captura) de moléculas de DNA-alvo corretamente ligadas. Os experimentos de ligação com YAMIs revelaram que os artefatos de estrutura secundária derivada de adaptador (pico intenso a aproximadamente 150bp) não foram amplificados durante a primeira rodada de amplificação (AMP1). Consulte as Figuras 2(a) e 2(b). Ainda mais, os YAMIs curtos (shYAMIs) representados pelas SEQ ID NOS: 1-48 não formaram estruturas secundárias durante os experimentos de ligação. Além disso, as Figuras 2(a) e 2(b) mostram que os YAMIs da presente tecnologia foram eficazes na geração de bibliotecas de cfDNAs sob diferentes condições experimentais (e.g., concentrações de YAMI variando de 25 nM a 75 nM durante um período de ligação de 1 hora ou 3 horas). Dessa forma, a eficácia dos YAMIs da presente tecnologia pode ser parcialmente atribuída à ausência de artefatos de estrutura secundária derivada de adaptador na etapa de ligação de adaptador.
[00207] Ainda mais, os YAMIs da presente tecnologia foram também eficazes na geração de bibliotecas de DNA genômico cortado sob diferentes condições experimentais (e.g., concentrações de YAMI variando de 25 nM a 75 nM durante um período de ligação de 1 hora ou 3 horas). Consulte a Figura 3(b).
[00208] As Figuras 6(a) e 6(b) mostram que a cobertura total das regiões gênicas ensaiadas melhorou quando se enriqueceram os amplicons derivados de cfDNA com uma combinação de iscas de DNA e de RNA comparada com aquela observada com apenas iscas de DNA. Como mostrado na Figura 6(a), houve diminuições significativas em cobertura para as regiões específicas ricas em AT quando o enriquecimento foi realizado usando apenas iscas de DNA. A cobertura das regiões ricas em AT foi muito pouco favorecida quando o enriquecimento foi realizado usando apenas iscas de
Petição 870190070370, de 24/07/2019, pág. 83/108
77/80
RNA, enquanto que o enriquecimento usando uma combinação de iscas de DNA e de RNA normalizou a cobertura ao longo de todas as regiões (ambas as regiões ricas em AT e ricas em GC). Figura 6(b).
[00209] Como mostrado nas Figuras 1(a) e 1(b), os YAMIs mostraram cobertura deduplicada superior de várias regiões de muitos genes relacionados a câncer (e.g., éxon 4 de KRAS, éxon 13 de MET, éxon 21 de PIK3CA, éxon 11 de KIT, éxon 15 de BRAF e outros) em níveis de entrada de cfDNA de 15 ng comparada com aquela observada com YUMIs. A Figura 1(a) mostra também que a cobertura deduplicada de várias regiões gênicas obtidas com YAMIs foi positivamente correlacionada com níveis crescentes de entrada de cfDNA. Estes resultados foram consistentes com a observação de que os YUMIs mostraram eficiência de ligação insatisfatória durante a preparação de biblioteca de cfDNAs relativa àquela com adaptadores-Y convencionais. Consulte a Figura 3(a). Como mostrado na Figura 3(a), com YUMIs, foram observados níveis altos de cfDNA não ligado.
[00210] Os YAMIs também mostraram eficiência de ligação durante a preparação de biblioteca de DNA genômico (entrada: 15 ng de DNA genômico cortado) comparados com os YUMIs purificados por HPLC ou PAGE. Consulte a Tabela 1.
[ Tabela 1| [ Adaptador | não ligado | ligado [ total s %ligado| | hplclyumi I 4.587.3I 1.2.7.1--}| 9.361.6i 5J% j PAGÍJyLJMÍ I 4.646.1 | 5,313.8 j 9.959,9 J 53%| | YÀMI-pico ] 2.432,7] 6.072,5 ] 8.505,2J 71%j [00211] De fato, a elevada eficiência de ligação dos YAMIs resultou em um aumento observável na profundidade de leitura total e na complexidade das bibliotecas de cfDNA geradas com YAMIs comparado com aquele observado com os YUMIs (consulte a Figura 4). A Figura 5 demonstra que um número maior de ‘sequências consenso de fita simples’ (SSCS) foi derivado para várias regiões exônicas ou intrônicas de genes relacionados a câncer quando as bibliotecas de cfDNA foram geradas usando
Petição 870190070370, de 24/07/2019, pág. 84/108
78/80 os YAMIs em comparação com os YUMIs. Ainda mais, a Figura 7 mostra que aproximadamente 500-1.800 leituras de sequências consenso de fita simples (SSCS) dentro das regiões gênicas alvo foram obtidas a partir de níveis de entrada de cfDNA tão baixos quando 5 ng quando as bibliotecas de cfDNA foram geradas usando YAMIs curtos (shYAMIs) (representados pelas SEQ ID NOS: 1-48).
[00212] Estes resultados demonstram que os adaptadores de formato em Y de ácido nucleico da presente tecnologia (YAMIs e shYAMIs) mostram eficácia superior com respeito à geração de bibliotecas de DNAs complexos a partir de quantidades limitadas de DNA de entrada, particularmente de cfDNA, em comparação com outros adaptadores de formato em Y conhecidos na técnica (e.g., YUMIs). Consequentemente, s adaptadores de formato em Y de ácido nucleico da presente tecnologia são úteis em métodos para detecção de mutações em moléculas de DNA circulante tumoral (ctDNA) presentes em amostras de pacientes.
EQUIVALENTES [00213] A presente tecnologia não deve ser limitada em termos das modalidades específicas descritas neste pedido, que são intencionadas como simples ilustrações dos aspectos individuais da presente tecnologia. Muitas modificações e variações desta presente tecnologia podem ser realizadas sem se desviarem dos seus espírito e escopo, como será evidente para aquelas pessoas versadas na técnica. Métodos e aparelhos funcionalmente equivalentes dentro do escopo da presente tecnologia, além daqueles aqui mencionados, serão evidentes para aquelas pessoas versadas na técnica a partir das descrições precedentes. Tais modificações e variações são intencionadas para caírem dentro do escopo da presente tecnologia. Deve ser entendido que esta presente tecnologia não se limita aos métodos específicos, reagentes específicos, compostos específicos, composições específicas ou sistemas biológicos específicos, que, pode, obviamente, variar. Também deve
Petição 870190070370, de 24/07/2019, pág. 85/108
79/80 ser entendido que a terminologia aqui usada é apenas para o propósito de descrever as modalidades específicas, e não é intencionada para ser limitadora.
[00214] Além disso, onde características ou aspectos da revelação são descritos em termos de grupos de Markush, aquelas pessoas versadas na técnica reconhecerão que a revelação é também descrita por meio destes em termos de qualquer membro individual ou subgrupo individual de membros do grupo de Markush.
[00215] Como será entendido por uma pessoa versada na técnica, para qualquer um e todos os propósitos, particularmente em termos de provimento de uma descrição redigida, todas as faixas aqui reveladas incluem também qualquer uma das e todas as possíveis subfaixas e combinações de subfaixas das mesmas. Qualquer faixa listada pode ser facilmente reconhecida como suficientemente descrevendo e permitindo que a mesma faixa seja separada em pelo menos metades iguais, terços iguais, quartos iguais, quintos iguais, décimos iguais, etc. Como um exemplo não limitador, cada faixa aqui discutida pode ser separada em um terço inferior, um terço intermediário e um terço superior, etc. Como também será entendido por uma pessoa versada na técnica todas as linguagens como “até”, “pelo menos”, “maior que”, “menor que”, e semelhantes, incluem o número citado e referem-se às faixas que podem ser subsequentemente separadas em subfaixas como discutido acima. Finalmente, como será entendido por uma pessoa versada na técnica, uma faixa inclui cada membro individual. Dessa forma, por exemplo, um grupo tendo 1 a 3 células refere-se aos grupos tendo 1, 2, ou 3 células. Similarmente, um grupo tendo 1 a 5 células refere-se aos grupos tendo 1, 2, 3, 4, ou 5 células, e assim por diante.
[00216] Todas as patentes, pedidos de patente, pedidos provisórios, e publicações aqui referidas(os) ou citadas(os) são incorporadas(os) como referências em suas totalidades, incluindo todas as figuras e tabelas, desde que
Petição 870190070370, de 24/07/2019, pág. 86/108
80/80 não sejam inconsistentes com os ensinamentos explícitos deste relatório descritivo.

Claims (25)

  1. REIVINDICAÇÕES
    1. Adaptador de ácido nucleico, caracterizado pelo fato de que compreende uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que:
    (a) a primeira fita de oligonucleotídeo:
    (i) compreende uma primeira região proximal e uma primeira região distai, em que a primeira região proximal compreende uma primeira sequência de identificador molecular único e uma primeira sequência espaçadora tendo a sequência 5’ TGACT 3’ (SEQ ID NO:__), em que a primeira sequência espaçadora está localizada 3’ à primeira sequência de identificador molecular único; e (ii) não compreende uma sequência degenerada ou semidegenerada;
    (b) a segunda fita de oligonucleotídeo:
    (i) compreende uma segunda região proximal e uma segunda região distai, em que a segunda região proximal compreende uma segunda sequência de identificador molecular único e uma segunda sequência espaçadora tendo a sequência 5’ GTCA 3’ (SEQ ID NO:__), em que a sequência espaçadora está localizada 5’ ao segundo identificador molecular único; e (ii) não compreende uma sequência degenerada ou semidegenerada;
    (c) a primeira região proximal da primeira fita de oligonucleotídeo hibridiza com a segunda região proximal da segunda fita de oligonucleotídeo; e (d) a primeira região distai da primeira fita de oligonucleotídeo não hibridiza com a segunda região distai da segunda fita de oligonucleotídeo.
  2. 2. Adaptador de ácido nucleico de acordo com a reivindicação 1, caracterizado pelo fato de que o nucleotideo “T” localizado na
    Petição 870190070370, de 24/07/2019, pág. 88/108
    2/10 extremidade-3’ da primeira sequência espaçadora contém uma união de fosforotioato.
  3. 3. Adaptador de ácido nucleico de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a primeira sequência de identificador molecular único da primeira fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’ AGCTGCAGTAGC 3’ (SEQ ID NO: 5’ TGATGATGATAC 3’ (SEQ ID NO: _); 5’
    TCGACTGTCGAG 3’ (SEQ ID NO: 5’ GTACTCTAGCTA 3’ (SEQ ID NO: _); 5’ CAGAGCACTCGT 3’ (SEQ ID NO: _); 5’ CATGCGATAGTC 3’ (SEQ ID NO: _); 5’ TCATCAGTCGAG 3’ (SEQ ID NO: _); 5’ AATCAGCGGTAT 3’ (SEQ ID NO: _); 5’ AGCATACTACTG 3’ (SEQ ID NO: _); 5’ GCTGATACACGT 3’ (SEQ ID NO: _); 5’ CTCTGTCACACG 3’ (SEQ ID NO: _); 5’ GCTACGTCATCA 3’ (SEQ ID NO: _); 5’ GCAGATGTCACT 3’ (SEQ ID NO: 5’ ACTCACAGCTAG 3’ (SEQ ID NO: _); 5’ CTCGCTCATGTA 3’ (SEQ ID NO: 5’ TAGCTGCACTAG 3’ (SEQ ID NO: _); 5’ CAGTTCGAGCTA 3’ (SEQ ID NO: _); 5’ TGCATGACTCGC 3’ (SEQ ID NO: 5’ GTGTACTGTACA 3’ (SEQ ID NO: 5’ ACTAGAGTCTGA 3’ (SEQ ID NO: _); 5’
    AGAGTGCGTGTC 3’ (SEQ ID NO: _); 5’ TACGCATCAGAT 3’ (SEQ ID NO: _); 5’ CTGCATGACAGT 3’ (SEQ ID NO: _); e 5’ GTACGATCTCAC 3’ (SEQ ID NO: _).
  4. 4. Adaptador de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que a segunda sequência de identificador molecular único da segunda fita de oligonucleotídeo é selecionada a partir do grupo consistindo em: 5’ GCTACTGCAGCT 3’ (SEQ ID NO: _); 5’ GTATCATCATCA 3’ (SEQ ID NO: _); 5’ CTCGACAGTCGA 3’ (SEQ ID NO: _); 5’ TAGCTAGAGTAC 3’ (SEQ ID NO: _); 5’ ACGAGTGCTCTG 3’ (SEQ ID NO: 5’ GACTATCGCATG 3’ (SEQ ID NO: _); 5’ CTCGACTGATGA 3’ (SEQ ID NO: _); 5’
    Petição 870190070370, de 24/07/2019, pág. 89/108
    3/10
    ATACCGCTGATT 3’ (SEQ ID NO: _); 5’ CAGTAGTATGCT 3’ (SEQ ID NO: _); 5’ ACGTGTATCAGC 3’ (SEQ ID NO: _); 5’ CGTGTGACAGAG 3’ (SEQ ID NO: _); 5’ TGATGACGTAGC 3’ (SEQ ID NO: 5’ AGTGACATCTGC 3’ (SEQ ID NO: 5’
    CTAGCTGTGAGT 3’ (SEQ ID NO: _); 5’ TACATGAGCGAG 3’ (SEQ ID NO: _); 5’ CTAGTGCAGCTA 3’ (SEQ ID NO: 5’ TAGCTCGAACTG 3’ (SEQ ID NO: _); 5’ GCGAGTCATGCA 3’ (SEQ ID NO: _); 5’ TGTACAGTACAC 3’ (SEQ ID NO: 5’ TCAGACTCTAGT 3’ (SEQ ID NO: 5’ GACACGCACTCT 3’ (SEQ ID NO: 5’ ATCTGATGCGTA
    3’ (SEQ ID NO: 5’ ACTGTCATGCAG 3’ (SEQ ID NO: _); e 5’
    GTGAGATCGTAC 3’ (SEQ ID NO: _).
  5. 5. Adaptador de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que a sequência de nucleotídeos da primeira fita de oligonucleotídeo é selecionada a partir do grupo consistindo em:
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAG CTGCAGTAGCTGACT 3’ (SEQ ID NO: 1);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTG ATGATGATACTGACT 3’ (SEQ ID NO: 3);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTC GACTGTCGAGTGACT 3’ (SEQ ID NO: 5);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGT ACTCTAGCTATGACT 3’ (SEQ ID NO: 7);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCA GAGCACTCGTTGACT 3’ (SEQ ID NO: 9);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCA TGCGATAGTCTGACT 3’ (SEQ ID NO: 11);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTC ATCAGTCGAGTGACT 3’ (SEQ ID NO: 13);
    Petição 870190070370, de 24/07/2019, pág. 90/108
    4/10
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAA TCAGCGGTATTGACT 3’ (SEQ ID NO: 15);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAG CATACTACTGTGACT 3’ (SEQ ID NO: 17);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGC TGATACACGTTGACT 3’ (SEQ ID NO: 19);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCT CTGTCACACGTGACT 3’ (SEQ ID NO: 21);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGC TACGTCATCATGACT 3’ (SEQ ID NO: 23);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGC AGATGTCACTTGACT 3’ (SEQ ID NO: 25);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAG TCACAGCTAGTGACT 3’ (SEQ ID NO: 27);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCT CGCTCATGTATGACT 3’ (SEQ ID NO: 29);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTA GCTGCACTAGTGACT 3’ (SEQ ID NO: 31);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCA GTTCGAGCTATGACT 3’ (SEQ ID NO: 33);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTG CATGACTCGCTGACT 3’ (SEQ ID NO: 35);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCT GTACTGTACATGACT 3’ (SEQ ID NO: 37);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAG TAGAGTCTGATGACT 3’ (SEQ ID NO: 39);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTAG AGTGCGTGTCTGACT 3’ (SEQ ID NO: 41);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTTA
    Petição 870190070370, de 24/07/2019, pág. 91/108
    5/10
    CGCATCAGATTGACT 3’ (SEQ ID NO: 43);
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTCT GCATGACAGTTGACT 3’ (SEQ ID NO: 45); e
    5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCTGT ACGATCTCACTGACT 3’ (SEQ ID NO: 47).
  6. 6. Adaptador de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que a sequência de nucleotídeos da segunda fita de oligonucleotídeo é selecionada a partir do grupo consistindo em:
    5 ’ GTCAGCTACTGCAGCTAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 2);
    5 ’ GTCAGTATCATCATCAAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 4);
    5 ’ GTCACTCGACAGTCGAAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 6);
    5 ’ GTCATAGCTAGAGTACAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 8);
    5 ’ GTCAACGAGTGCTCTGAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 10);
    5 ’ GTCAGACTATCGCATGAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 12);
    5 ’ GTCACTCGACTGATGAAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 14);
    5 ’ GTCAATACCGCTGATTAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 16);
    5 ’ GTCACAGTAGTATGCTAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 18);
    5 ’ GTCAACGTGTATCAGCAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 20);
    Petição 870190070370, de 24/07/2019, pág. 92/108
    6/10
    5 ’ GTCACGTGTGACAGAGAGATCGGAAGAGCACACG TCTGAACTCCAGTCAC 3’ (SEQ ID NO: 22);
    5 ’ GTCATGATGACGTAGCAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 24);
    5 ’ GTCAAGTGACATCTGCAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 26);
    5 ’ GTCACTAGCTGTGAGTAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 28);
    5 ’ GTC ATAC ATGAGCGAGAGATCGGAAGAGC AC AC GTCTGAACTCCAGTCAC 3’ (SEQ ID NO: 30);
    5 ’ GTCACTAGTGCAGCTAAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 32);
    5 ’ GTCATAGCTCGAACTGAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 34);
    5 ’ GTCAGCGAGTCATGCAAGATCGGAAGAGCACACG TCTGAACTCCAGTCAC 3’ (SEQ ID NO: 36);
    5 ’ GTCATGTACAGTACACAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 38);
    5 ’ GTCATCAGACTCTAGTAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 40);
    5 ’ GTCAGACACGCACTCTAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 42);
    5 ’ GTCAATCTGATGCGTAAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 44);
    5 ’ GTCAACTGTCATGCAGAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 46); e
    5 ’ GTCAGTGAGATCGTACAGATCGGAAGAGCACACGT CTGAACTCCAGTCAC 3’ (SEQ ID NO: 48).
  7. 7. Adaptador de ácido nucleico de acordo com qualquer uma
    Petição 870190070370, de 24/07/2019, pág. 93/108
    7 /10 das reivindicações 1 a 6, caracterizado pelo fato de que a extremidade-5’ da primeira fita de oligonucleotídeo está marcada com biotina.
  8. 8. Adaptador de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que a extremidade-3’ da segunda fita de oligonucleotídeo está marcada com biotina.
  9. 9. Adaptador de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o adaptador de ácido nucleico é usado para sequenciar uma molécula de ácido nucleico-alvo de fita dupla selecionada a partir do grupo consistindo em DNA de fita dupla ou RNA de fita dupla.
  10. 10. Adaptador de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que compreende adicionalmente menos dois sítios de aglutinação de iniciadores de PCR, pelo menos dois sítios de aglutinação de iniciadores de sequenciamento ou qualquer combinação dos mesmos.
  11. 11. Adaptador de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que compreende adicionalmente uma sequência de código de barras amostra-específico, em que a sequência de código de barras amostra-específico compreende 2 a 20 nucleotídeos.
  12. 12. Adaptador de ácido nucleico de acordo com a reivindicação 9, caracterizado pelo fato de que o DNA de fita dupla é DNA genômico cortado, ou DNA livre da célula.
  13. 13. Método para detecção de pelo menos uma mutação em uma molécula de DNA circulante tumoral (ctDNA) de fita dupla presente em uma amostra obtida de um paciente, caracterizado pelo fato de que compreende:
    (a) ligar uma pluralidade de adaptadores de formato em Y às ambas extremidades da molécula de ctDNA de fita dupla para formar um
    Petição 870190070370, de 24/07/2019, pág. 94/108
    8/10 complexo de adaptador-ctDNA de fita dupla, cada adaptador de formato em Y compreendendo uma primeira fita de oligonucleotídeo e uma segunda fita de oligonucleotídeo, em que a sequência da primeira fita de oligonucleotídeo e a sequência da segunda fita de oligonucleotídeo são selecionadas a partir do grupo consistindo em SEQ ID NO: 1 e SEQ ID NO: 2; SEQ ID NO: 3 e SEQ ID NO: 4; SEQ ID NO: 5 e SEQ ID NO: 6; SEQ ID NO: 7 e SEQ ID NO: 8; SEQ ID NO: 9 e SEQ ID NO: 10; SEQ ID NO: 11 e SEQ ID NO: 12; SEQ ID NO: 13 e SEQ ID NO: 14; SEQ ID NO: 15 e SEQ ID NO: 16; SEQ ID NO: 17 e SEQ ID NO: 18; SEQ ID NO: 19 e SEQ ID NO: 20; SEQ ID NO: 21 e SEQ ID NO: 22; SEQ ID NO: 23 e SEQ ID NO: 24; SEQ ID NO: 25 e SEQ ID NO: 26; SEQ ID NO: 27 e SEQ ID NO: 28; SEQ ID NO: 29 e SEQ ID NO: 30; SEQ ID NO: 31 e SEQ ID NO: 32; SEQ ID NO: 33 e SEQ ID NO: 34; SEQ ID NO: 35 e SEQ ID NO: 36; SEQ ID NO: 37 e SEQ ID NO: 38; SEQ ID NO: 39 e SEQ ID NO: 40; SEQ ID NO: 41 e SEQ ID NO: 42; SEQ ID NO: 43 e SEQ ID NO: 44; SEQ ID NO: 45 e SEQ ID NO: 46; e SEQ ID NO: 47 e SEQ ID NO: 48;
    (b) amplificar ambas as fitas do complexo de adaptadorctDNA para produzir primeiros amplicons e segundos amplicons, em que os primeiros amplicons são derivados da primeira fita de oligonucleotídeo, os segundos amplicons são derivados da segunda fita de oligonucleotídeo;
    (c) sequenciar os primeiros amplicons e segundos amplicons;
    (d) detectar pelo menos uma mutação na molécula de ctDNA de fita dupla, quando uma mutação detectada nos primeiros amplicons é consistente com uma mutação detectada nos segundos amplicons.
  14. 14. Método de acordo com a reivindicação 13, caracterizado pelo fato de que compreende adicionalmente enriquecer os primeiros amplicons e segundos amplicons com uma pluralidade de sequências-isca, em que a pluralidade de sequências-isca compreende pelo menos uma região gênica que corresponde a cada um de uma pluralidade de genes relacionados a
    Petição 870190070370, de 24/07/2019, pág. 95/108
    9/10 câncer.
  15. 15. Método de acordo com a reivindicação 14, caracterizado pelo fato de que a pluralidade de genes relacionados a câncer compreende ALK, BRAF, EGFR, ERBB2, KIT, KRAS, MET, NRAS, NTRK1, PIK3CA, ROS1 e RET
  16. 16. Método de acordo com qualquer uma das reivindicações 13 a 15, caracterizado pelo fato de que a pluralidade de sequências-isca são iscas de RNA, iscas de DNA ou uma mistura de iscas de RNA e iscas de DNA.
  17. 17. Método de acordo com a reivindicação 16, caracterizado pelo fato de que a pluralidade de sequências-isca compreende uma mistura 1:1 de iscas de RNA e iscas de DNA.
  18. 18. Método de acordo com qualquer uma das reivindicações 13 a 17, caracterizado pelo fato de que ambas as extremidades 3’ da molécula de ctDNA de fita dupla compreendem adicionalmente uma projeção-A.
  19. 19. Método de acordo com qualquer uma das reivindicações 13 a 18, caracterizado pelo fato de que cada adaptador de formato em Y compreende adicionalmente pelo menos dois sítios de aglutinação de iniciadores de sequenciamento.
  20. 20. Método de acordo com qualquer uma das reivindicações 13 a 19, caracterizado pelo fato de que cada adaptador de formato em Y compreende adicionalmente uma sequência de código de barras pacienteespecífico, em que a sequência de código de barras paciente-específico compreende 2 a 20 nucleotídeos.
  21. 21. Método de acordo com qualquer uma das reivindicações 13 a 20, caracterizado pelo fato de que a amostra compreende não mais que 5 ng de DNA livre da célula.
  22. 22. Método de acordo com qualquer uma das reivindicações 13 a 20, caracterizado pelo fato de que a amostra compreende pelo menos 6 a
    Petição 870190070370, de 24/07/2019, pág. 96/108
    10/10
    30 ng de DNA livre da célula.
  23. 23. Método de acordo com qualquer uma das reivindicações 13 a 22, caracterizado pelo fato de que a amostra é sangue inteiro, soro, plasma, fluido sinovial, fluido linfático, fluido ascítico ou fluido intersticial.
  24. 24. Método de acordo com qualquer uma das reivindicações 13 a 23, caracterizado pelo fato de que o paciente é diagnosticado com câncer ovariano, câncer de mama, câncer de cólon, câncer de pulmão, câncer de próstata, câncer gástrico, câncer pancreático, câncer cervical, câncer de fígado, câncer de bexiga, câncer do trato urinário, câncer de tireoide, câncer renal, carcinoma, melanoma, câncer de cabeça e pescoço, ou câncer de cérebro.
  25. 25. Método de acordo com qualquer uma das reivindicações 13 a 24, caracterizado pelo fato de que cada adaptador de formato em Y compreende adicionalmente um marcador biotina.
BR112019013391-7A 2016-12-28 2017-12-27 Adaptador de ácido nucleico, e, método para detecção de uma mutação em uma molécula de dna circulante tumoral (ctdna) de fita dupla. BR112019013391A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662439574P 2016-12-28 2016-12-28
US62/439574 2016-12-28
PCT/US2017/068483 WO2018125892A1 (en) 2016-12-28 2017-12-27 Compositions and methods for detecting circulating tumor dna

Publications (1)

Publication Number Publication Date
BR112019013391A2 true BR112019013391A2 (pt) 2020-03-03

Family

ID=62710775

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112019013391-7A BR112019013391A2 (pt) 2016-12-28 2017-12-27 Adaptador de ácido nucleico, e, método para detecção de uma mutação em uma molécula de dna circulante tumoral (ctdna) de fita dupla.

Country Status (7)

Country Link
US (2) US11414710B2 (pt)
EP (1) EP3562961A4 (pt)
CN (2) CN110741096B (pt)
BR (1) BR112019013391A2 (pt)
CA (1) CA3048859A1 (pt)
MX (2) MX2019007894A (pt)
WO (1) WO2018125892A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3907299A1 (en) 2011-04-15 2021-11-10 The Johns Hopkins University Safe sequencing system
CA2889937C (en) 2012-10-29 2020-12-29 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
BR112020002555A2 (pt) 2017-08-07 2020-08-11 The Johns Hopkins University métodos e materiais para avaliar e tratar câncer
WO2021231862A1 (en) * 2020-05-14 2021-11-18 Georgia Tech Research Corporation Methods of detecting the efficacy of anticancer agents

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002034949A2 (en) * 2000-10-27 2002-05-02 Molecular Staging Inc. Methods for identifying genes associated with diseases or specific phenotypes
WO2008015396A2 (en) 2006-07-31 2008-02-07 Solexa Limited Method of library preparation avoiding the formation of adaptor dimers
WO2009099602A1 (en) * 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
US20120100548A1 (en) * 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
US10316362B2 (en) * 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
EP3564395A1 (en) * 2010-12-30 2019-11-06 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
US9260753B2 (en) * 2011-03-24 2016-02-16 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
EP3744857A1 (en) 2012-03-20 2020-12-02 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
CA2872141C (en) * 2012-05-31 2016-01-19 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
WO2014130890A1 (en) * 2013-02-21 2014-08-28 Toma Biosciences, Inc. Methods, compositions, and kits for nucleic acid analysis
CN105408496A (zh) * 2013-03-15 2016-03-16 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
US20160032396A1 (en) * 2013-03-15 2016-02-04 The Board Of Trustees Of The Leland Stanford Junior University Identification and Use of Circulating Nucleic Acid Tumor Markers
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
CN107922967B (zh) * 2015-05-22 2022-04-19 西格马-奥尔德里奇有限责任公司 用于下一代基因组步移的方法以及相关的组合物和试剂盒
PL3387152T3 (pl) * 2015-12-08 2022-05-09 Twinstrand Biosciences, Inc. Ulepszone adaptory, sposoby i kompozycje do sekwencjonowania dupleksowego
US10487358B2 (en) * 2016-09-23 2019-11-26 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
US10011870B2 (en) * 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
MX2019007444A (es) * 2016-12-22 2019-08-16 Guardant Health Inc Metodos y sistemas para analisis de moleculas de acido nucleico.

Also Published As

Publication number Publication date
EP3562961A4 (en) 2021-01-06
CN110741096A (zh) 2020-01-31
WO2018125892A1 (en) 2018-07-05
US11414710B2 (en) 2022-08-16
EP3562961A1 (en) 2019-11-06
CN117004721A (zh) 2023-11-07
US20230061928A1 (en) 2023-03-02
CA3048859A1 (en) 2018-07-05
US20190330704A1 (en) 2019-10-31
MX2019007894A (es) 2019-12-11
CN110741096B (zh) 2023-07-14
MX2024003382A (es) 2024-04-30

Similar Documents

Publication Publication Date Title
US20210363597A1 (en) Identification and use of circulating nucleic acids
US11981966B2 (en) Methods for screening solid tumors for mutations
CN108004301B (zh) 基因目标区域富集方法及建库试剂盒
ES2831148T3 (es) Identificación y uso de marcadores tumorales de ácido nucleico circulante
US20230061928A1 (en) Compositions and methods for detecting circulating tumor dna
EP3541826B1 (en) Methods for detecting dna mutations using mitra tip extraction
WO2010123625A1 (en) Cd133 polymorphisms predict clinical outcome in patients with cancer
WO2013172933A1 (en) Ethnic gene profile of genes involved in angiogenesis may predict regional bevacizumab efficacy difference in gastric cancer
JP2021526791A (ja) セルフリー核酸の細胞起源を決定するための方法およびシステム
Morgensztern et al. Mutational events in lung cancer: Present and developing technologies
WO2024020573A1 (en) Methods for detection and reduction of sample preparation-induced methylation artifacts
WO2013172932A1 (en) Colon cancer tumor suppressor gene, b-defensin 1, predicts recurrence in patients with stage ii and iii colon cancer
US20250059601A1 (en) Multifunctional primers for paired sequencing reads
US20240002922A1 (en) Methods for simultaneous molecular and sample barcoding
Javanmardi Genomic instability and genetic heterogeneity in neuroblastoma
US20220356467A1 (en) Methods for duplex sequencing of cell-free dna and applications thereof
WO2023150633A2 (en) Multifunctional primers for paired sequencing reads
Javanmardi Genomic instability and genetic heterogeneity in neuroblastoma tumours
CN114634982A (zh) 一种检测多核苷酸变异的方法
WO2011146406A1 (en) Germline polymorphisms in vegf predict clinical outcomes in cancer patients treated with sorafenib
WO2011146405A1 (en) Egf +61g/a and ts 5'utr 2r/3r polymorphisms predict clinical outcomes in cancer patients undergoing anti-egfr therapy

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]