JP2024541312A - 新規末端デオキシヌクレオチド転移酵素(TdT)バリアントおよびその使用 - Google Patents
新規末端デオキシヌクレオチド転移酵素(TdT)バリアントおよびその使用 Download PDFInfo
- Publication number
- JP2024541312A JP2024541312A JP2024527290A JP2024527290A JP2024541312A JP 2024541312 A JP2024541312 A JP 2024541312A JP 2024527290 A JP2024527290 A JP 2024527290A JP 2024527290 A JP2024527290 A JP 2024527290A JP 2024541312 A JP2024541312 A JP 2024541312A
- Authority
- JP
- Japan
- Prior art keywords
- amino acid
- seq
- acid sequence
- tdt
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 title claims abstract description 238
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 title claims abstract description 236
- 238000006467 substitution reaction Methods 0.000 claims abstract description 106
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 231
- 150000001413 amino acids Chemical class 0.000 claims description 63
- 239000003999 initiator Substances 0.000 claims description 38
- 108091033319 polynucleotide Proteins 0.000 claims description 37
- 102000040430 polynucleotide Human genes 0.000 claims description 37
- 239000002157 polynucleotide Substances 0.000 claims description 37
- 125000003729 nucleotide group Chemical group 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 31
- 239000001226 triphosphate Substances 0.000 claims description 29
- 235000011178 triphosphate Nutrition 0.000 claims description 29
- 239000012634 fragment Substances 0.000 claims description 28
- 239000002777 nucleoside Substances 0.000 claims description 28
- -1 nucleoside triphosphate Chemical class 0.000 claims description 26
- 239000002773 nucleotide Substances 0.000 claims description 26
- 102220472129 Protein Wnt-2_C23A_mutation Human genes 0.000 claims description 14
- 230000002194 synthesizing effect Effects 0.000 claims description 13
- 238000010348 incorporation Methods 0.000 claims description 11
- 230000035772 mutation Effects 0.000 abstract description 15
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 abstract description 9
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 abstract description 9
- 101100191004 Bacillus subtilis (strain 168) polX gene Proteins 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 abstract 1
- 235000001014 amino acid Nutrition 0.000 description 106
- 229940024606 amino acid Drugs 0.000 description 62
- 150000007523 nucleic acids Chemical class 0.000 description 35
- 210000004027 cell Anatomy 0.000 description 30
- 230000015572 biosynthetic process Effects 0.000 description 28
- 102000039446 nucleic acids Human genes 0.000 description 28
- 108020004707 nucleic acids Proteins 0.000 description 28
- 108020004414 DNA Proteins 0.000 description 27
- 238000003786 synthesis reaction Methods 0.000 description 27
- 238000012217 deletion Methods 0.000 description 20
- 230000037430 deletion Effects 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 18
- 230000002255 enzymatic effect Effects 0.000 description 18
- 239000013598 vector Substances 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 10
- 230000000903 blocking effect Effects 0.000 description 10
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 9
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 9
- 239000004473 Threonine Substances 0.000 description 9
- 235000004279 alanine Nutrition 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 8
- 230000000977 initiatory effect Effects 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 235000018102 proteins Nutrition 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 229910019142 PO4 Inorganic materials 0.000 description 7
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 230000006820 DNA synthesis Effects 0.000 description 6
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 6
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 6
- 235000018417 cysteine Nutrition 0.000 description 6
- 125000005842 heteroatom Chemical group 0.000 description 6
- 125000005647 linker group Chemical group 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 239000004474 valine Substances 0.000 description 6
- 239000004475 Arginine Substances 0.000 description 5
- 241000206602 Eukaryota Species 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 125000000217 alkyl group Chemical group 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 235000009697 arginine Nutrition 0.000 description 5
- 238000010511 deprotection reaction Methods 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 5
- 235000004554 glutamine Nutrition 0.000 description 5
- 241000894007 species Species 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 125000004432 carbon atom Chemical group C* 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 150000003833 nucleoside derivatives Chemical class 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 4
- LPXPTNMVRIOKMN-UHFFFAOYSA-M sodium nitrite Chemical compound [Na+].[O-]N=O LPXPTNMVRIOKMN-UHFFFAOYSA-M 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 3
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 125000000547 substituted alkyl group Chemical group 0.000 description 3
- 238000001308 synthesis method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000701832 Enterobacteria phage T3 Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 125000002252 acyl group Chemical group 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 239000007978 cacodylate buffer Substances 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 101150007302 dntt gene Proteins 0.000 description 2
- JGBUYEVOKHLFID-UHFFFAOYSA-N gelred Chemical compound [I-].[I-].C=1C(N)=CC=C(C2=CC=C(N)C=C2[N+]=2CCCCCC(=O)NCCCOCCOCCOCCCNC(=O)CCCCC[N+]=3C4=CC(N)=CC=C4C4=CC=C(N)C=C4C=3C=3C=CC=CC=3)C=1C=2C1=CC=CC=C1 JGBUYEVOKHLFID-UHFFFAOYSA-N 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052763 palladium Inorganic materials 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 125000006239 protecting group Chemical group 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 230000001603 reducing effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 235000010288 sodium nitrite Nutrition 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- PHIYHIOQVWTXII-UHFFFAOYSA-N 3-amino-1-phenylpropan-1-ol Chemical compound NCCC(O)C1=CC=CC=C1 PHIYHIOQVWTXII-UHFFFAOYSA-N 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000867607 Chlorocebus sabaeus Species 0.000 description 1
- 229910021580 Cobalt(II) chloride Inorganic materials 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 1
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 description 1
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical class O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 1
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 1
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 125000005553 heteroaryloxy group Chemical group 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 125000002796 nucleotidyl group Chemical group 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 239000001048 orange dye Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- HJRIWDYVYNNCFY-UHFFFAOYSA-M potassium;dimethylarsinate Chemical compound [K+].C[As](C)([O-])=O HJRIWDYVYNNCFY-UHFFFAOYSA-M 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 238000012409 standard PCR amplification Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000002849 thermal shift Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Abstract
本発明は、polXファミリーの新規DNAポリメラーゼ、特に特異的突然変異または置換を含む末端デオキシヌクレオチド転移酵素(TdT)バリアント、およびそれらの使用について述べる。
【選択図】なし
【選択図】なし
Description
本発明は、少なくとも1つの特異的突然変異または置換を含むpolXファミリーの新規DNAポリメラーゼ、末端デオキシポリヌクレオチド(TdT)バリアント、およびその使用に関する。
現在の合成生物学は、近年急速に成長し続けている研究分野である。また、合成生物学は、生体物質を合成する可能性を提供する。したがって、天然には存在しない生体物質を得ることができ、このことによって療法または診断上の解決策、例えば、ゲノムおよび診断配列決定、多重核酸増幅、治療抗体開発、合成生物学、核酸ベースの療法、DNAオリガミ、DNAベースのデータ保存等が、もたらされる。
遺伝子合成は、化学ベースの合成方法によって通常には行われる。しかし、こういった方法にはいくつかの問題がある。一例を挙げると、付加された各ヌクレオチドについて、遺伝的エラーの確率は約0.5%であり、配列が長ければ長いほど、エラーを含有する確率は高い。
近年、化学ベースの合成法を、末端デオキシヌクレオチド転移酵素(TdT)などのテンプレートフリーポリメラーゼを使用する酵素ベースの方法によって補うかまたはこれで置き換えることに関心が集まっているが、なぜなら、このような酵素の効率性が証明され、合成率が高く、エラーのリスクが制限されかつ穏和な非毒性反応条件が有利であるからである、例えば、Ybertら、国際特許公開第WO2015/159023号;Hiattら、米国特許第5763594号;Jensenら、Biochemistry、57:1821~1832頁(2018)等。
酵素ベースの合成を使用するほとんどの方法には、ポリヌクレオチド生成物において所望の配列を得るために、可逆的にブロックされたヌクレオシドトリホスフェートの使用が必要である。残念ながら、テンプレートフリーポリメラーゼは、修飾されていないヌクレオシドトリホスフェートと比較して効率が低下したそのような修飾されたヌクレオシドトリホスフェートを組み入れる。したがって、修飾されたヌクレオシドトリホスフェートに向けられたより良好な組み込み効率を備えた新規テンプレートフリーポリメラーゼバリアントが、開発されてきた、例えば、Championら、米国特許公開第US2019/0211315号の後に国際特許公開第WO2021116270号;Ybertら、国際特許公開第WO2017/216472号等。
新規テンプレートフリーポリメラーゼバリアントが開発されたが、酵素的DNA合成過程でのDNA品質は、例えば、DNA合成過程での置換、欠失、または挿入などの、所望のヌクレオチドの組み込みを欠くリスクを低めることによって改善することができる可能性がある。少なくとも部分的に、これらの欠失は、特にプライマーがヘアピン構造を有する場合に、テンプレートフリーポリメラーゼが所望のヌクレオチドを組み込むことができないことによって生じる。
ゆえに、DNA合成過程での置換または欠失の数を制限または防止し、ひいては満足なDNA品質の合成を達成するための、新規のテンプレートフリーポリメラーゼバリアントが必要である。
こういった必要性に取り組むために、本発明者らは、新規TdTバリアントを開発し、驚くべきことに、より活性なTdTバリアントが、特にDNA合成過程で、欠失、挿入または置換などの誤組み込みが少ないDNA鎖またはRNA鎖を産生することを発見した。
したがって、本発明は、一例として配列番号6に記載の配列を有することができるリンカー部分を備えるまたは備えない新規末端デオキシヌクレオチド転移酵素(TdT)バリアントに関する。
新規末端デオキシヌクレオチド転移酵素(TdT)バリアントは、
配列番号2と少なくとも70%同一のアミノ酸配列であって、好ましくは配列番号2と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号2と100%未満同一のアミノ酸配列であって、前記アミノ酸配列は、23位、262位、264位および298位からなる第1の群から選択される位置に、もしくは前記第1の群の各位置の機能的に等価な位置に置換アミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている、配列番号2と少なくとも70%同一のアミノ酸配列、または配列番号8と少なくとも70%同一のアミノ酸配列であって、好ましくは配列番号8と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号8と100%未満同一のアミノ酸配列であって、前記アミノ酸配列は、4位、243位、245位および279位からなる第2の群から選択される位置に、もしくは前記第2の群の各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、ここで、これらの位置は、配列番号8に記載のアミノ酸配列を参照することによって付番されている、配列番号8と少なくとも70%同一のアミノ酸配列、
を含む。
配列番号2と少なくとも70%同一のアミノ酸配列であって、好ましくは配列番号2と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号2と100%未満同一のアミノ酸配列であって、前記アミノ酸配列は、23位、262位、264位および298位からなる第1の群から選択される位置に、もしくは前記第1の群の各位置の機能的に等価な位置に置換アミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている、配列番号2と少なくとも70%同一のアミノ酸配列、または配列番号8と少なくとも70%同一のアミノ酸配列であって、好ましくは配列番号8と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号8と100%未満同一のアミノ酸配列であって、前記アミノ酸配列は、4位、243位、245位および279位からなる第2の群から選択される位置に、もしくは前記第2の群の各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、ここで、これらの位置は、配列番号8に記載のアミノ酸配列を参照することによって付番されている、配列番号8と少なくとも70%同一のアミノ酸配列、
を含む。
一部の実施形態では、新規TdTバリアントは、配列番号2に記載のアミノ酸配列を含み、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に、あるアミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている。
一部の実施形態では、新規TdTバリアントは、配列番号8に記載のアミノ酸配列を含み、前記アミノ酸配列は、4位、243位、245位および279位からなる群から選択される位置に、あるアミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号8に記載のアミノ酸配列を参照することによって付番されている。
別の実施形態では、TdTバリアントは、配列番号1に記載のアミノ酸配列を含み、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置にまたは前記群の各位置の機能的に等価な位置に別のアミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号1に記載のアミノ酸配列を参照することによって付番されている。特に、前記置換されたアミノ酸は配列番号1において「X」により指示される。
別の実施形態では、TdTバリアントは、配列番号7に記載のアミノ酸配列を含み、前記アミノ酸配列は、4位、243位、245位および279位からなる群から選択される位置にまたは各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、ここで、これらの位置は、配列番号7に記載のアミノ酸配列を参照することによって付番されている。特に、前記置き換えられたアミノ酸は配列番号7において「X」により指示される。
特定の実施形態では、末端デオキシヌクレオチド転移酵素(TdT)バリアントは、配列番号1または配列番号2に記載のアミノ酸配列中に2つ以上のアミノ酸置換、好ましくは少なくとも2つのアミノ酸置換、より好ましくは少なくとも3つのアミノ酸置換を含む。
特定の実施形態では、末端デオキシヌクレオチド転移酵素(TdT)バリアントは、配列番号7または配列番号8に記載のアミノ酸配列中に2つ以上のアミノ酸置き換え、好ましくは少なくとも2つのアミノ酸置き換え、より好ましくは少なくとも3つのアミノ酸置き換えを含む。
一部の実施形態では、配列番号1または配列番号2に記載のアミノ酸配列において置換されるアミノ酸は、アルギニン(R)、バリン(V)、アラニン(A)、ロイシン(L)、リジン(K)、グルタミン(Q)、スレオニン(T)およびグリシン(G)からなる群から選択される。
一部の実施形態では、配列番号7または配列番号8に記載のアミノ酸配列において置き換えられるアミノ酸は、アルギニン(R)、バリン(V)、アラニン(A)、ロイシン(L)、リジン(K)、グルタミン(Q)、スレオニン(T)およびグリシン(G)からなる群から選択される。
特定の実施形態では、TdTバリアントは、配列番号3、配列番号4および配列番号5から選択されるアミノ酸配列を含む。
特定の実施形態では、TdTバリアントは、配列番号9、配列番号10および配列番号11から選択されるアミノ酸配列を含む。
本発明はまた、所定の任意の配列のテンプレートフリーポリヌクレオチド伸長を実施するためのキットにも関し、ここで、キットは、本発明の少なくとも1種のTdTバリアント、少なくとも1種の3’-O-修飾されたヌクレオシドトリホスフェート、および必要に応じて少なくとも1種のイニシエーターを含む。このようなキットは、DNA伸長のためのA、C、GおよびTについてのデオキシリボヌクレオシドトリホスフェート(dNTP)、またはRNA伸長のためのrA、rC、rGおよびUについてのリボヌクレオシドトリホスフェート(rNTP)をさらに含むことができる。
したがって、キットは、本発明による少なくとも1種のTdTバリアントを含む。これに関連して、キットは1種のTdTバリアントまたは多種のTdTバリアント、例えば異なる2種のTdTバリアントを含むことができる、ことが理解される。
特定の実施形態では、キットは2種以上のTdTバリアントを含み、特にキットは本発明による2種のTdTバリアントを含み、より好ましくはキットは本発明による3種のTdTバリアントを含む。
一部の実施形態では、キットは、配列番号3、配列番号4および配列番号5から選択されるアミノ酸配列を含む少なくとも1種のTdTバリアントを含む。特定の実施形態では、キットは2種のTdTバリアントを含み、第1のTdTバリアントは配列番号3、配列番号4および配列番号5から選択されるアミノ酸配列を含み、かつ第2のTdTバリアントは配列番号3、配列番号4および配列番号5から選択されるアミノ酸配列を含むが、前記第2のTdTバリアントは第1のTdTバリアントとは異なる。別の特定の実施形態では、キットは、本発明による3種のTdTバリアントを含み、より好ましくは、キットは、配列番号3に記載のアミノ酸配列を含むTdTバリアントと、配列番号4に記載のアミノ酸配列を含むTdTバリアントと、配列番号5に記載のアミノ酸配列を有するTdTバリアントとを含む。
一部の実施形態では、キットは、配列番号3、配列番号4および配列番号5から選択されるアミノ酸配列と少なくとも70%同一のアミノ酸配列を含む少なくとも1種のTdTバリアントを含む。特定の実施形態では、キットは2種のTdTバリアントを含み、第1のTdTバリアントは、配列番号3、配列番号4および配列番号5から選択されるアミノ酸配列と少なくとも70%同一であるアミノ酸配列を含み、かつ第2のTdTバリアントは、配列番号3、配列番号4および配列番号5から選択されるアミノ酸配列と少なくとも70%同一であるアミノ酸配列を含むが、前記第2のTdTバリアントは第1のTdTバリアントとは異なる。
一部の実施形態では、キットは、配列番号9、配列番号10および配列番号11から選択されるアミノ酸配列と少なくとも70%同一のアミノ酸配列を含む少なくとも1種のTdTバリアントを含む。特定の実施形態では、キットは2種のTdTバリアントを含み、第1のTdTバリアントは、配列番号9、配列番号10および配列番号11から選択されるアミノ酸配列と少なくとも70%同一であるアミノ酸配列を含み、かつ第2のTdTバリアントは、配列番号9、配列番号10および配列番号11から選択されるアミノ酸配列と少なくとも70%同一であるアミノ酸配列を含むが、前記第2のTdTバリアントは第1のTdTバリアントとは異なる。
一部の実施形態では、第1のTdTバリアントは配列番号3と少なくとも70%同一のアミノ酸配列を含み、第2のバリアントは配列番号5と少なくとも70%同一のアミノ酸配列を含む。
一部の実施形態では、第1のTdTバリアントは配列番号9と少なくとも70%同一のアミノ酸配列を含み、第2のバリアントは配列番号11と少なくとも70%同一のアミノ酸配列を含む。
有利には、本発明によるTdTバリアントによれば、従来技術のTdTバリアントの技術的問題が解決され、核酸の酵素的合成過程で欠失、挿入が防止され、他の望ましくないトリホスフェート、例えば化学的に損傷されたdNTPの組み込みが低下する。
本発明はまた、ポリヌクレオチドを合成する方法にも関し、方法は:
a.遊離3’-ヒドロキシルを有する3’末端ヌクレオチドを有する少なくとも1種のイニシエーターを用意する工程、
b.伸長条件下で、遊離3’-O-ヒドロキシルを有する前記少なくとも1種のイニシエーターを、3’-O-ブロックされたヌクレオシドトリホスフェートおよび本発明によるTdTバリアントと接触させ、その結果、前記少なくとも1種のイニシエーターは、3’-O-ブロックされたヌクレオシドトリホスフェートの組み込みによって伸長されて、3’-O-ブロックされた伸長断片を形成する工程、ならびに
c.伸長断片を脱ブロッキングして、遊離3’-ヒドロキシルを有する伸長断片を形成する工程、ならびに
d.伸長条件下で工程c.で得られた伸長断片を接触させることによって、ポリヌクレオチドが形成されるまで、工程b.および工程c.を繰り返す工程、
を含む。
a.遊離3’-ヒドロキシルを有する3’末端ヌクレオチドを有する少なくとも1種のイニシエーターを用意する工程、
b.伸長条件下で、遊離3’-O-ヒドロキシルを有する前記少なくとも1種のイニシエーターを、3’-O-ブロックされたヌクレオシドトリホスフェートおよび本発明によるTdTバリアントと接触させ、その結果、前記少なくとも1種のイニシエーターは、3’-O-ブロックされたヌクレオシドトリホスフェートの組み込みによって伸長されて、3’-O-ブロックされた伸長断片を形成する工程、ならびに
c.伸長断片を脱ブロッキングして、遊離3’-ヒドロキシルを有する伸長断片を形成する工程、ならびに
d.伸長条件下で工程c.で得られた伸長断片を接触させることによって、ポリヌクレオチドが形成されるまで、工程b.および工程c.を繰り返す工程、
を含む。
さらなる実施形態では、本発明には、上記のTdTバリアントをコードする少なくとも1種の核酸分子が含まれる。換言すれば、本発明は、2種以上の核酸を含むことができ、前記核酸分子それぞれは、記載されている、TdTバリアントに相当するタンパク質配列をコードする。
本発明にはまた、そのような核酸分子を含む少なくとも1種の発現ベクター、および前述の核酸分子または前述の発現ベクターを含む少なくとも1種の宿主細胞が含まれる。なおさらなる実施形態では、本発明には、本発明の少なくとも1種のTdTバリアントを生成する方法が含まれ、この場合、宿主細胞は前記TdTバリアントをコードする核酸の発現を可能にする培養条件下で培養され、かつTdTバリアントが必要に応じて回収される。
定義
アミノ酸は、本明細書では、以下の命名法に従って1文字コードまたは3文字コードによって表される:A:Ala(アラニン)。R:Arg(アルギニン);N:Asn(アスパラギン);D:Asp(アスパラギン酸);C:Cys(システイン);Q:Gln(グルタミン);E:Glu(グルタミン酸);G:Gly(グリシン);H:His(ヒスチジン);I:Ile(イソロイシン);L:Leu(ロイシン);K:Lys(リジン);M:Met(メチオニン);F:Phe(フェニルアラニン);P:プロ(プロリン);S:Ser(セリン);T:Thr(スレオニン);W:Trp(トリプトファン);Y:Tyr(チロシン);V:Val(バリン)およびX(未定のアミノ酸)。
アミノ酸は、本明細書では、以下の命名法に従って1文字コードまたは3文字コードによって表される:A:Ala(アラニン)。R:Arg(アルギニン);N:Asn(アスパラギン);D:Asp(アスパラギン酸);C:Cys(システイン);Q:Gln(グルタミン);E:Glu(グルタミン酸);G:Gly(グリシン);H:His(ヒスチジン);I:Ile(イソロイシン);L:Leu(ロイシン);K:Lys(リジン);M:Met(メチオニン);F:Phe(フェニルアラニン);P:プロ(プロリン);S:Ser(セリン);T:Thr(スレオニン);W:Trp(トリプトファン);Y:Tyr(チロシン);V:Val(バリン)およびX(未定のアミノ酸)。
本発明の文脈における「末端デオキシヌクレオチド転移酵素(TdT)バリアント」とは、一連の突然変異または変更を共有する一群のTdT突然変異体を意味する。変更または突然変異とは、1つ以上の位置における置換、挿入、および/または欠失とすることができ、DNAポリメラーゼ活性を保存することを可能にする。例えば、同じアミノ酸残基位置に存在する1種または2種または3種の突然変異、例えばスレオニンは28位でリジンにより置換されている。特に、配列番号3、配列番号4および配列番号5に記載のアミノ酸配列を有するTdTは突然変異体であり、前記TdTは一連の突然変異を共有しかつバリアントを構成する。
本発明によるTdTバリアントは、切断型TdTバリアントである。TdTバリアントは、当技術分野で周知されている種々の技法によって得ることができる。特に、野生型タンパク質をコードするDNA配列を改変するための技法の例としては、それらに限定されないが、部位特異的突然変異誘発、ランダム突然変異誘発、および合成ポリヌクレオチドの構築が挙げられる。
「切断型TdTバリアント」とは、本発明の文脈において、相当する野生型TdTのN末端部分を含まないTdTを意味する。本発明によるTdTバリアントは、相当する野生型親NP_001036693.1[ハツカネズミ(Mus musculus)])TdT配列のアミノ酸残基1~132を欠くN末端切断型TdTである。
「未定のアミノ酸」または「未知のアミノ酸」または「X」とは、本発明の文脈において、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン酸、グルタミン、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、スレオニン、トリプトファン、チロシン、およびバリンからなる群から選択される20個のアミノ酸のうちの1つとすることができるアミノ酸を意味する。
本発明の文脈における「置換されたアミノ酸」または「置き換えられたアミノ酸」とは、特定の位置に、特に、配列番号2に記載のアミノ酸配列を参照することによって付番されている23位、262位、264位および298位からなる第1の群から選択される位置に、または、配列番号8に記載のアミノ酸配列を参照することによって付番されている4位、243位、245位および279位からなる第2の群から選択される位置に、本来のアミノ酸(置換または突然変異の前)の別のアミノ酸による置換を意味する。例えば、配列番号2の23位または配列番号8の4位にて、本来のアミノ酸はCであり、置換されたアミノ酸はAである。
本発明の意味において2つの核酸配列の間または2つのアミノ酸配列の間の「同一性の%」または「同一性のパーセンテージ」または「と少なくとも%同一の」とは、比較される2つの配列の間で同一であるヌクレオチドのまたはアミノ酸残基のパーセンテージを指すものと理解され、このパーセンテージは最良のアライメントの後に得られるものであり、このパーセンテージは純粋に統計学的なものであり、当該2つの配列間の差異はランダムにかつそれらの全長にわたって分布する。比較のための配列の最良のアライメントは、手作業の他に、Smith and Waterman(1981)(Ad.App.Math.2:482頁)の局所相同性アルゴリズムを用いて、Neddleman and Wunsch(1970)(J.Mol.Biol.48:443頁)の局所相同性アルゴリズムを用いて、Pearson and Lipman(1988)(Proc.Natl.Acad.Sci.USA 85:2444頁)の類似性検索方法を用いて、これらのアルゴリズムを使用するコンピューターソフトウェア(GAP、BESTFIT、FASTA and TFASTA in the Wisconsin Genetics Software Package、Genetics Computer Group、575 Science Dr.、Madison、Wis.)を用いて、オンラインアライメントソフトウェアMutalin(http://multalin.toulouse.inra.fr/multalin/multalin.html;1988、Nucl.Acids Res.、16(22)、10881~10890頁)を用いて、実施することができる。
本発明の意味において「機能的に等価な配列」とは、poIXファミリーのDNAポリメラーゼの配列、特に、配列番号1もしは配列番号2または配列番号7もしは配列番号8と少なくとも70%、75%、80%、85%、90%、好ましくは少なくとも95%、97%、99%の同一性の配列、すなわちアミノ酸配列を有するおよび同一の機能的役割を有するTdTの配列を意味すると、理解される。
「機能的に等価な残基」とは、配列番号2または配列番号8と相同な配列を有し、同一の機能的役割を有する、poIXファミリーのDNAポリメラーゼの配列中の残基を意味すると理解される。したがって、「機能的に等価な位置」とは、相同配列における機能的に等価な残基の位置である。
機能的に等価な残基は、例えばオンラインアラインメントソフトウェアMutalin(http://multalin.toulouse.inra.fr/multalin/multalin.html;1988、Nucl.Acids Res.、16(22)、10881~10890頁)を用いて実施される配列アラインメントを使用して特定される。アラインメント後、機能的に等価な残基は、考慮される異なる配列上の相同な位置にある。配列のアラインメントおよび機能的に等価な残基の特定は、poIXファミリーのDNAポリメラーゼと種間バリアントを含めてその天然バリアントの間で行うことができる。
本発明の意味において「少なくとも1つのアミノ酸置換を含む」または「少なくとも1つのアミノ酸突然変異を含む」とは、バリアントは配列番号1または配列番号2の配列に関連して指示されるような1つ以上の置換または突然変異を有するが、バリアントは他の修飾、特に置換、欠失または付加を有することができる、ことを意味すると理解される。
本発明の意味において「少なくとも1つのアミノ酸置き換えを含む」とは、バリアントは配列番号7または配列番号8の配列に関連して指示されるような1つ以上の置換または突然変異を有するが、バリアントは他の修飾、特に置換、欠失または付加を有することができる、ことを意味すると理解される。
本発明は、poIXファミリーのDNAポリメラーゼのバリアント、特に、テンプレート鎖なしでDNAまたはRNAなどのポリヌクレオチドを合成するために使用することができるTdTポリメラーゼの安定化バリアントである、TdTバリアントに関する。本発明のTdTバリアントによれば、修飾されたヌクレオチド、より具体的には3’O-可逆的に修飾されたヌクレオシドトリホスフェートを、ポリヌクレオチド合成の酵素ベースの方法において使用することが可能になる。特に、TdTバリアントは、切断型TdTバリアント、より具体的には、N末端切断型TdTバリアントである。
テンプレートフリー酵素的合成
ポリヌクレオチドのテンプレートフリー酵素的合成は、3’-O-ブロックされたデオキシヌクレオシドトリホスフェート(3’-O-ブロックされたdNTP)の組み込みにおいてより高い温度安定性またはより高い効率性などの改善された特性を有するように操作されたそのバリアントを含めて、末端デオキシヌクレオチド転移酵素(TdT)などのテンプレートフリーポリメラーゼを使用する様々な既知のプロトコールによって行うことができる、例えば、Ybertら、国際特許公開第WO/2015/159023号;Ybertら、国際特許公開第WO/2017/216472号;Hyman、米国特許第5436143号;Hiattら、米国特許第5763594号;Jensenら、Biochemistry、57:1821~1832頁(2018);Mathewsら、Organic & Biomolecular Chemistry、DOI:0.1039/c6ob01371f(2016);Schmitzら、Organic Lett.、1(11):1729~1731頁(1999)である。
ポリヌクレオチドのテンプレートフリー酵素的合成は、3’-O-ブロックされたデオキシヌクレオシドトリホスフェート(3’-O-ブロックされたdNTP)の組み込みにおいてより高い温度安定性またはより高い効率性などの改善された特性を有するように操作されたそのバリアントを含めて、末端デオキシヌクレオチド転移酵素(TdT)などのテンプレートフリーポリメラーゼを使用する様々な既知のプロトコールによって行うことができる、例えば、Ybertら、国際特許公開第WO/2015/159023号;Ybertら、国際特許公開第WO/2017/216472号;Hyman、米国特許第5436143号;Hiattら、米国特許第5763594号;Jensenら、Biochemistry、57:1821~1832頁(2018);Mathewsら、Organic & Biomolecular Chemistry、DOI:0.1039/c6ob01371f(2016);Schmitzら、Organic Lett.、1(11):1729~1731頁(1999)である。
一部の実施形態では、酵素的DNA合成の方法は、図1に例示されるように、ヌクレオチドが各サイクルにおいて付加されるような、工程の反復サイクルを含む。イニシエーターポリヌクレオチド(100)が、例えば、固体支持体(102)に付着されて、用意され、これが遊離3’-ヒドロキシル基(103)を有する。イニシエーターポリヌクレオチド(100)(またはその後のサイクルで伸長されたイニシエーターポリヌクレオチド)に、イニシエーターポリヌクレオチド(100)(または伸長されたイニシエーターポリヌクレオチド)の3’末端上への3’-O-保護されたdNTPの酵素的組み込みにとって効果的な条件下で、3’-O-保護されたdNTPとTdTバリアント(104)とを添加する。この反応により、その3’-ヒドロキシルが保護された伸長したイニシエーターポリヌクレオチド(106)が生成される。
換言すれば、ポリヌクレオチドを合成する方法は、以下の工程を含む:
a.遊離3’-ヒドロキシルを有する3’末端ヌクレオチドを有する少なくとも1種のイニシエーターを用意する工程、
b.伸長条件下で、遊離3’-O-ヒドロキシルを有する前記少なくとも1種のイニシエーターを、3’-O-ブロックされたヌクレオシドトリホスフェートおよび本発明によるTdTバリアントと接触させ、その結果、イニシエーターは、3’-O-ブロックされたヌクレオシドトリホスフェートの組み込みによって伸長されて、3’-O-ブロックされた伸長断片を形成する工程、
c.伸長断片を脱ブロッキングして、遊離3’-ヒドロキシルを有する伸長断片を形成する工程、ならびに
d.伸長条件下で工程c.で得られた伸長断片を接触させることによって、ポリヌクレオチドが形成されるまで、工程b.および工程c.を繰り返す工程。
a.遊離3’-ヒドロキシルを有する3’末端ヌクレオチドを有する少なくとも1種のイニシエーターを用意する工程、
b.伸長条件下で、遊離3’-O-ヒドロキシルを有する前記少なくとも1種のイニシエーターを、3’-O-ブロックされたヌクレオシドトリホスフェートおよび本発明によるTdTバリアントと接触させ、その結果、イニシエーターは、3’-O-ブロックされたヌクレオシドトリホスフェートの組み込みによって伸長されて、3’-O-ブロックされた伸長断片を形成する工程、
c.伸長断片を脱ブロッキングして、遊離3’-ヒドロキシルを有する伸長断片を形成する工程、ならびに
d.伸長条件下で工程c.で得られた伸長断片を接触させることによって、ポリヌクレオチドが形成されるまで、工程b.および工程c.を繰り返す工程。
伸長したイニシエーターポリヌクレオチドが完成した配列を含有する場合、3’-O-保護基は除去されるか、または脱保護され、所望の配列が、当初のイニシエーターポリヌクレオチドから切断される。このような切断は、様々な1本鎖切断技法のうちのいずれかを使用して、例えば、切断可能なヌクレオチドまたは切断可能なリンカーを、当初のイニシエーターポリヌクレオチド内の所定の位置に挿入することによって、行うことができる。例示的切断可能なヌクレオチドまたはリンカーとしては、それらに限定されないが、(i)ウラシルDNAグリコシラーゼによって切断されるウラシルヌクレオチド;(ii)米国特許第5,739,386号に記載の、ニトロベンジルリンカーなどの光開裂性基;またはエンドヌクレアーゼVによって切断されるイノシン、が挙げられる。
一部の実施形態では、切断されたポリヌクレオチドは、遊離5’-ヒドロキシルを有することができる;他の実施形態では、切断されたポリヌクレオチドは、5’リン酸化末端を有することができる。伸長されたイニシエーターポリヌクレオチドが完成した配列を含有しない場合、3’-O-保護基が除去されて遊離3’-ヒドロキシル(103)を露出し、伸長されたイニシエーターポリヌクレオチドはヌクレオチド付加および脱保護の別のサイクルに供される。
本明細書で使用される場合、ヌクレオチドまたはヌクレオシドの3’-ヒドロキシルなどの特定の基に関しての「保護された」および「ブロックされた」という用語は、交換可能に使用され、特定の基に共有結合的に付着する部分であって、化学的または酵素的プロセス過程で当該基への化学変化を防止する、部分を意味するものである。特定の基は、ヌクレオシドトリホスフェートの3’-ヒドロキシルであるまたは3’-保護された(またはブロックされた)-ヌクレオシドトリホスフェートが組み込まれてある延長断片(または「延長中間体」)である場合は常に、防止される化学変化とは、酵素的カップリング反応による当該延長断片(または「延長中間体」)のさらなる、もしくは続いて起こる延長である。
一部の実施形態では、各合成工程において3’-O-可逆的にブロックされたdNTPの存在下でTdTを使用して、ヌクレオチドの整列配列をイニシエーター核酸にカップリングする。一部の実施形態では、ポリヌクレオチドを合成する方法は、(a)遊離3’-ヒドロキシルを有するイニシエーターを用意する工程;(b)延長条件下で、遊離3’-ヒドロキシルを有するイニシエーターまたは延長中間体をTdTと、3’-O-ブロックされたヌクレオシドトリホスフェートの存在下で反応させて3’-O-ブロックされた延長中間体を生成する工程;(c)延長中間体を脱ブロッキングして遊離3’-ヒドロキシルを備える延長中間体を生成する工程;および(d)ポリヌクレオチドが合成されるまで工程(b)および工程(c)を繰り返す工程を含む。時折、「延長中間体」は「伸長断片」とも呼ばれることもある。
一部の実施形態では、イニシエーターは、例えば、その5’末端により固体支持体に付着されたオリゴヌクレオチドとして用意される。また、上記の方法は、反応工程または延長工程後、ならびに脱ブロッキング工程後に、洗浄工程を含む場合もある。例えば、反応させる工程は、所定のインキュベーション期間または反応時間後に、例えば洗浄することによって、非組み込みヌクレオシドトリホスフェートを除去するサブ工程を含む場合がある。そのような所定のインキュベーション期間または反応時間は、数秒、例えば30秒~数分、例えば30分とすることができる。
上記方法はまた、反応工程または延長工程後、ならびに脱ブロッキング工程後に、キャッピング工程ならびに洗浄工程を含むことができる。上述のように、一部の実施形態では、キャッピング工程を含めることができ、その場合、非延長遊離3’-ヒドロキシルをキャッピングされた鎖のさらなるいかなる延長をも防止する化合物と反応させる。一部の実施形態では、そのような化合物は、ジデオキシヌクレオシドトリホスフェートとすることができる。他の実施形態では、遊離3’-ヒドロキシルを備える非延長鎖は、3’-エキソヌクレアーゼ活性、例えば、Exo Iを用いてそれらを処理することによって分解することができる。例えば、Hymanの米国特許第5436143号を参照されたい。同様に、一部の実施形態では、脱ブロッキングすることができない鎖は、鎖を除去するようにまたはさらなる延長に対して鎖を不活性となるように処理することができる。
ポリヌクレオチドの連続合成を含む一部の実施形態では、キャッピングが等モル量の複数のポリヌクレオチドの生成を防止する場合があるので、キャッピング工程は望ましくない場合がある。キャッピングがない場合、配列には欠失エラーの均一な分布があることになるが、複数のポリヌクレオチドのそれぞれが等モル量で存在することになる。このことは、非延長断片がキャッピングされる場合にはあてはまらないと思われる。
一部の実施形態では、延長工程または伸長工程向けの反応条件は、以下を含むことができる:2.0μM精製TdT;125~600μM 3’-O-ブロックされたdNTP(例えば、3’-O-NH2-ブロックされたdNTP);約10~約500mMカコジル酸カリウムバッファー(6.5と7.5の間のpH)、および約0.01から約10mMまでの二価カチオン(例えば、CoC12またはMnC12)、この場合、伸長反応は、反応体積50μL中、室温~45℃の範囲内の温度で3分間実施することができる。3’-O-ブロックされたdNTPが3’-O-NH2-ブロックされたdNTPである実施形態では、脱ブロッキング工程のための反応条件は、以下を含むことができる:700mM NaNO2;1M酢酸ナトリウム(酢酸を用いて4.8~6.5の範囲のpHに調整)、この場合、脱ブロッキング反応は、体積50μL中、室温~45℃の範囲内の温度で30秒間~数分間実施することができる。
特定の適用に応じて、脱ブロッキング工程および/または切断工程は、様々な化学的または物理的条件、例えば、光、熱、pH、特定の化学結合を切断することができる酵素などの特異的試薬の存在を含むことができる。3’-O-ブロッキング基および相応する脱ブロッキング条件を選択する上での指針は、参照することにより組む込まれる以下の参考文献に見出すことができる:米国特許第5808045号;米国特許第8808988号;国際特許公開第WO91/06678号;および下に引用の参考文献。一部の実施形態では、切断剤(ここでも、脱ブロッキング試薬または脱ブロッキング剤とも呼ばれることもある)は、例えば、ジチオスレイトール(DTT)などの化学的切断剤である。代替の実施形態では、切断剤は、3’-ホスフェートブロッキング基を切断することができる、例えば、ホスファターゼなどの酵素的切断剤とすることができる。脱ブロッキング剤の選択が、使用される3’-ヌクレオチドブロッキング基のタイプに、1つまたは複数のブロッキング基が使用されているかどうか、イニシエーターが、穏和な処理を必要とする生細胞もしくは生物体にまたは固体支持体等に付着されるかどうかに左右されることは当業者には理解されるであろう。例えば、トリス(2-カルボキシエチル)ホスフィン(TCEP)などのホスフィンを使用して3’O-アジドメチル基を切断することができる、パラジウム錯体を使用して3’O-アリル基を切断することができる、または、ナトリウム亜硝酸塩を使用して3’O-アミノ基を切断することができる。特定の実施形態では、切断反応には、TCEP、パラジウム錯体またはナトリウム亜硝酸塩が関与する。
上述の通り、一部の実施形態では、直交性の脱ブロッキング条件を使用して除去することができる2種以上のブロッキング基を用いることが望ましい。以下のブロッキング基の例示的対を、上記のものなどのパラレル合成実施形態で使用することができる。他のブロッキング基の対または2つ超を含有する基が、本発明のこれらの実施形態での使用に利用可能である場合もある、と理解される。
生細胞でオリゴヌクレオチドを合成するには、穏和な脱ブロッキングまたは脱保護の条件、すなわち細胞膜を破壊せず、タンパク質を変性させず、キーとなる細胞機能に干渉しない等の条件が必要である。一部の実施形態では、脱保護条件は、細胞生存と適合性である生理的条件の範囲内である。そのような実施形態では、酵素的脱保護は、生理的条件下で実施することができるので望ましい。一部の実施形態では、酵素的に除去可能な特異的ブロッキング基が、その除去に特異的な酵素と関連付けられる。例えば、エステルベースまたはアシルベースのブロッキング基は、アセチルエステラーゼなどのエステラーゼまたは類似の酵素を用いて除去することができ、ホスフェートブロッキング基は、T4ポリヌクレオチドキナーゼなどの3’ホスファターゼを用いて除去することができる。例として、3’-O-ホスフェートは、100mM トリス-HCl(pH6.5)、10mM MgC12、5mM 2-メルカプトエタノール、および1単位のT4ポリヌクレオチドキナーゼなどの溶液での処理によって除去することができる。反応は、37℃の温度で1分間進行する。
「3’-ホスフェートブロックされた」または「3’-ホスフェート保護された」ヌクレオチドとは、3’位にてのヒドロキシル基がホスフェート含有部分の存在によってブロックされているヌクレオチドを指す。本発明による3’-ホスフェートブロックされたヌクレオチドの例は、ヌクレオチジル-3’-ホスフェートモノエステル/ヌクレオチジル-2’,3’-環状ホスフェート、ヌクレオチジル-2’-ホスフェートモノエステルおよびヌクレオチジル-2’または3’-アルキルリン酸ジエステル、ならびにヌクレオチジル-2’または3’-ピロリン酸である。チオホスフェートまたはそのような化合物の他のアナログも使用することができる、ただし、こういった代用が脱リン酸化を妨げず、ホスファターゼによって遊離3’-OHがもたらされることを条件とする。
3’-O-エステル保護されたdNTPまたは3’-O-ホスフェート保護されたdNTPの合成および酵素的脱保護のさらなる例は、以下の文献に記載されている:Canardら、Proc.Natl.Acad.Sci.、92:10859~10863頁(1995);Canardら、Gene、148:1~6頁(1994);Cameronら、Biochemistry、16(23):5120~5126頁(1977);Rasolonjatovoら、Nucleosides & Nucleotides、18(4&5):1021~1022頁(1999);Ferreroら、Monatshefte fur Chemie、131:585~616頁(2000);Taunton-Rigbyら、J.Org.Chem.、38(5):977~985頁(1973);Uemuraら、Tetrahedron Lett.、30(29):3819~3820頁(1989);Beckerら、J.Biol.Chem.、242(5):936~950頁(1967);Tsien、国際特許公開第WO1991/006678号。
本明細書で使用される場合、「イニシエーター」(または「イニシエーティング断片」、「イニシエーター核酸」、「イニシエーターオリゴヌクレオチド」等のような等価な用語)は、TdTなどのテンプレートフリーポリメラーゼによってさらに伸長させることができる、遊離3’末端を備える短いオリゴヌクレオチド配列を指す。一実施形態では、イニシエーティング断片はDNAイニシエーティング断片である。代替の実施形態では、イニシエーティング断片はRNAイニシエーティング断片である。一部の実施形態では、イニシエーティング断片は、3から100個の間のヌクレオチド、特に、3から20個の間のヌクレオチドを保有する。一部の実施形態では、イニシエーティング断片は一本鎖である。代替の実施形態では、イニシエーティング断片は二本鎖である。特定の実施形態では、5’-一級アミンを用いて合成したイニシエーターオリゴヌクレオチドを、製造業者のプロトコールを使用して磁気ビーズに共有結合的に連結することができる。同様に、3’-一級アミンを用いて合成したイニシエーターオリゴヌクレオチドを、製造業者のプロトコールを使用して磁気ビーズに共有結合的に連結することができる。本発明の実施形態と共に使用に適した様々な他の付着化学は、当技術分野で周知されており、例えば、Integrated DNA Technologies brochure、「Strategies for Attaching Oligonucleotides to Solid Supports」、第6巻(2014);Hermanson、Bioconjugate Techniques、第2版(Academic Press、2008);および類似の文献である。
本発明において用いられる3’-O-ブロックされたdNTPの多くは、商業ベンダーから購入してもよく、または公開された技法、例えば、米国特許第7057026号;国際特許公開第WO2004/005667号、同第WO91/06678号;Canardら、Gene(上で引用);Metzkerら、Nucleic Acids Research、22:4259~4267頁(1994);Mengら、J.Org.Chem.、14:3248~3252頁(3006);米国特許公開第2005/037991号を使用して合成してもよい。一部の実施形態では、修飾されたヌクレオチドは、プリン塩基またはピリミジン塩基と、共有結合的に付着した除去可能な3’-OHブロッキング基を有するリボースまたはデオキシリボースの糖部分とを含む修飾されたヌクレオチド分子またはヌクレオシド分子を含み、したがって、3’炭素原子は構造:
-O-Z
の基を付着している
[式中、-Zは、-C(R’)2-O-R’’、-C(R’)2-N(R’’)2、-C(R’)2-N(H)R’’、-C(R’)2-S-R’’および-C(R’)2-Fのうちのいずれかであり、ここで、各R’’は、除去可能な保護基であるかまたはその一部であり;各R’は、独立して、水素原子、アルキル、置換されたアルキル、アリールアルキル、アルケニル、アルキニル、アリール、ヘテロアリール、複素環式、アシル、シアノ、アルコキシ、アリールオキシ、ヘテロアリールオキシもしくはアミドの各基、または結合基を通して付着された検出可能な標識であり;ただし、一部の実施形態では、そのような置換基は、10個までの炭素原子および/または5個までの酸素もしくは窒素のヘテロ原子を有することを条件とし;または、(R’)2は、式=C(R’’’)2の基を表し、ここで、各R’’’は、同一でも異なっていてもよくかつ水素原子およびハロゲン原子ならびにアルキル基を含む群から選択され、ただし、一部の実施形態では、各R’’’のアルキルは1から3個までの炭素原子を有することを条件とし;ならびに、ここで、分子が反応して、各R’’がHと交換されている中間体か、またはZが-(R’)2-Fである場合は、FがOH、SHもしくはNH2、好ましくはOHと交換されている中間体をもたらし、この中間体は水性条件下で解離して遊離3’-OHを備える分子を与える;ただし、Zが-C(R’)2-S-R’’である場合、両方のR’基ともHではないことを条件とする。ある特定の実施形態では、修飾されたヌクレオチドまたはヌクレオシドのR’は、アルキルまたは置換されたアルキルであり、ただし、そのようなアルキルまたは置換されたアルキルは、1から10個までの炭素原子と0から4個までの酸素または窒素のヘテロ原子を有することを条件とする。ある特定の実施形態では、修飾されたヌクレオチドまたはヌクレオシドの-Zは、式-C(R’)2-N3である。ある特定の実施形態では、Zはアジドメチル基である]。
-O-Z
の基を付着している
[式中、-Zは、-C(R’)2-O-R’’、-C(R’)2-N(R’’)2、-C(R’)2-N(H)R’’、-C(R’)2-S-R’’および-C(R’)2-Fのうちのいずれかであり、ここで、各R’’は、除去可能な保護基であるかまたはその一部であり;各R’は、独立して、水素原子、アルキル、置換されたアルキル、アリールアルキル、アルケニル、アルキニル、アリール、ヘテロアリール、複素環式、アシル、シアノ、アルコキシ、アリールオキシ、ヘテロアリールオキシもしくはアミドの各基、または結合基を通して付着された検出可能な標識であり;ただし、一部の実施形態では、そのような置換基は、10個までの炭素原子および/または5個までの酸素もしくは窒素のヘテロ原子を有することを条件とし;または、(R’)2は、式=C(R’’’)2の基を表し、ここで、各R’’’は、同一でも異なっていてもよくかつ水素原子およびハロゲン原子ならびにアルキル基を含む群から選択され、ただし、一部の実施形態では、各R’’’のアルキルは1から3個までの炭素原子を有することを条件とし;ならびに、ここで、分子が反応して、各R’’がHと交換されている中間体か、またはZが-(R’)2-Fである場合は、FがOH、SHもしくはNH2、好ましくはOHと交換されている中間体をもたらし、この中間体は水性条件下で解離して遊離3’-OHを備える分子を与える;ただし、Zが-C(R’)2-S-R’’である場合、両方のR’基ともHではないことを条件とする。ある特定の実施形態では、修飾されたヌクレオチドまたはヌクレオシドのR’は、アルキルまたは置換されたアルキルであり、ただし、そのようなアルキルまたは置換されたアルキルは、1から10個までの炭素原子と0から4個までの酸素または窒素のヘテロ原子を有することを条件とする。ある特定の実施形態では、修飾されたヌクレオチドまたはヌクレオシドの-Zは、式-C(R’)2-N3である。ある特定の実施形態では、Zはアジドメチル基である]。
一部の実施形態では、Zは、200以下の分子量を有するヘテロ原子を含むまたは含まない切断可能な有機部分である。他の実施形態では、Zは、100以下の分子量を有するヘテロ原子を含むまたは含まない切断可能な有機部分である。他の実施形態では、Zは、50以下の分子量を有するヘテロ原子を含むまたは含まない切断可能な有機部分である。一部の実施形態では、Zは、200以下の分子量を有するヘテロ原子を含むまたは含まない酵素的に切断可能な有機部分である。他の実施形態では、Zは、100以下の分子量を有するヘテロ原子を含むまたは含まない酵素的に切断可能な有機部分である。他の実施形態では、Zは、50以下の分子量を有するヘテロ原子を含むまたは含まない酵素的に切断可能な有機部分である。他の実施形態では、Zは、200以下の分子量を有する酵素的に切断可能なエステル基である。他の実施形態では、Zは、3’-ホスファターゼによって除去可能なホスフェート基である。一部の実施形態では、以下の3’-ホスファターゼのうちの1種以上を、製造業者の推奨プロトコールを用いて使用することができる:T4ポリヌクレオチドキナーゼ、仔ウシ腸アルカリホスファターゼ、組換えエビアルカリホスファターゼ(例えば、New England Biolabs、Beverly、MAから入手可能)。
さらなる特定の実施形態では、3’-ブロックされたヌクレオチドトリホスフェートは、3’-O-アジドメチル、3’-O-NH2または3’-O-アリル基のいずれかによってブロックされている。他の実施形態では、3’-ブロックされたヌクレオチドトリホスフェートは、3’-O-アジドメチル、3’-O-NH2のいずれかによってブロックされている。
一部の実施形態では、本発明の3’-O-ブロッキング基には、3’-O-メチル、3’-O-(2-ニトロベンジル)、3’-O-アリル、3’-O-アミン、3’-O-アジドメチル、3’-O-tert-ブトキシエトキシ、3’-O-(2-シアノエチル)、および3’-O-プロパルギルが含まれる。
TdTバリアント
本発明の第1の態様によれば、本発明によるTdTバリアントは、配列番号2に記載のアミノ酸配列を含み、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に、あるアミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている。特に、本発明によるTdTバリアントは、(i)テンプレートなしで核酸断片を合成することができ、(ii)3’-O-修飾されたヌクレオチドを核酸断片へと組み込むことができる。
本発明の第1の態様によれば、本発明によるTdTバリアントは、配列番号2に記載のアミノ酸配列を含み、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に、あるアミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている。特に、本発明によるTdTバリアントは、(i)テンプレートなしで核酸断片を合成することができ、(ii)3’-O-修飾されたヌクレオチドを核酸断片へと組み込むことができる。
特定の実施形態では、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される2つ以上のアミノ酸置換、好ましくは少なくとも2つまたは3つを含むことができる。前記TdTバリアントは、DNA鎖および/またはRNA鎖を合成することができる。
別の実施形態では、本発明によるTdTバリアントは、配列番号1に記載のアミノ酸配列を有し、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に、あるアミノ酸での少なくとも1つのアミノ酸置換を含み、
ここで、これらの位置は、配列番号1に記載のアミノ酸配列を参照することによって付番されている。配列番号1に記載のアミノ酸配列を有する前記TdTバリアントは、23位、262位、264位および298位からなる群から選択される位置に少なくとも1個の未定のアミノ酸を含む。配列中の未定のアミノ酸は、配列番号1において「X」により指示される。
ここで、これらの位置は、配列番号1に記載のアミノ酸配列を参照することによって付番されている。配列番号1に記載のアミノ酸配列を有する前記TdTバリアントは、23位、262位、264位および298位からなる群から選択される位置に少なくとも1個の未定のアミノ酸を含む。配列中の未定のアミノ酸は、配列番号1において「X」により指示される。
本発明の第2の態様によれば、本発明によるTdTバリアントは、配列番号2と少なくとも70%同一の、好ましくは配列番号2と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号2と100%未満同一のアミノ酸配列を含み、前記アミノ酸配列は、23位、262位、264位および298位からなる第1の群から選択される位置にまたは前記第1の群の各位置の機能的に等価な位置に置換アミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている。特に、本発明によるTdTバリアントは、(i)テンプレートなしで核酸断片を合成することができ、(ii)3’-O-修飾されたヌクレオチドを核酸断片へと組み込むことができる。
特定の実施形態では、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される2つ以上のアミノ酸置換、好ましくは少なくとも2つまたは3つを含むことができる。前記TdTバリアントは、DNA鎖および/またはRNA鎖を合成することができる。
別の実施形態では、本発明によるTdTバリアントは、配列番号1と少なくとも70%同一の、好ましくは配列番号1と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号1と100%未満同一のアミノ酸配列を有し、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置にまたは前記第1の群の各位置の機能的に等価な位置に置換アミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号1に記載のアミノ酸配列を参照することによって付番されている。配列番号1と少なくとも70%同一のアミノ酸配列を有する前記TdTバリアントは、23位、262位、264位および298位からなる第1の群から選択される位置にまたは前記第1の群の各位置の機能的に等価な位置に少なくとも1個の未定のアミノ酸を含む。配列中の未定のアミノ酸は、配列番号1において「X」により指示される。
本発明の第2の態様によれば、本発明によるTdTバリアントは、
配列番号8と少なくとも70%同一の、好ましくは配列番号8と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号8と100%未満同一のアミノ酸配列を含み、前記アミノ酸配列は、4位、243位、245位および279位からなる第2の群から選択される位置にまたは前記第2の群の各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、ここで、これらの位置は、配列番号8に記載のアミノ酸配列を参照することによって付番されている。特に、本発明によるTdTバリアントは、(i)テンプレートなしで核酸断片を合成することができ、(ii)3’-O-修飾されたヌクレオチドを核酸断片へと組み込むことができる。
配列番号8と少なくとも70%同一の、好ましくは配列番号8と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号8と100%未満同一のアミノ酸配列を含み、前記アミノ酸配列は、4位、243位、245位および279位からなる第2の群から選択される位置にまたは前記第2の群の各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、ここで、これらの位置は、配列番号8に記載のアミノ酸配列を参照することによって付番されている。特に、本発明によるTdTバリアントは、(i)テンプレートなしで核酸断片を合成することができ、(ii)3’-O-修飾されたヌクレオチドを核酸断片へと組み込むことができる。
特定の実施形態では、前記アミノ酸配列は、4位、243位、245位および279位からなる第2の群から選択される2つ以上のアミノ酸置き換え、好ましくは少なくとも2つまたは3つを含むことができる。前記TdTバリアントは、DNA鎖および/またはRNA鎖を合成することができる。
別の実施形態では、本発明によるTdTバリアントは、配列番号7と少なくとも70%同一の、好ましくは配列番号7と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号7と100%未満同一のアミノ酸配列を有し、前記アミノ酸配列は、4位、243位、245位および279位からなる群から選択される位置にまたは前記第1の群の各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、ここで、これらの位置は、配列番号7に記載のアミノ酸配列を参照することによって付番されている。配列番号7と少なくとも70%同一のアミノ酸配列を有する前記TdTバリアントは、4位、243位、245位および279位からなる第2の群から選択される位置にまたは前記第2の群の各位置の機能的に等価な位置に少なくとも1個の未定のアミノ酸を含む。配列中の未定のアミノ酸は、配列番号7において「X」により指示される。
別の実施形態では、TdTバリアントは、配列番号2に記載のアミノ酸配列を含み、前記アミノ酸配列は、C23、V262、T264およびI298からなる群から選択される一残基に相当する位置に、あるアミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている。例えば、残基C23は置換前の23位にてのシステインアミノ酸に相当する。
別の実施形態では、TdTバリアントは、配列番号2と少なくとも70%同一のアミノ酸配列を含み、前記アミノ酸配列は、C23、V262、T264およびI298からなる群から選択される一残基に相当する位置にまたは前記群の各位置の機能的に等価な位置に置換アミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている。例えば、残基C23は置換前の23位にてのシステインアミノ酸に相当する。
別の実施形態では、TdTバリアントは、配列番号2と少なくとも70%同一のアミノ酸配列を含み、前記アミノ酸配列は、C4、V243、T245およびI279からなる群から選択される一残基に相当する位置にまたは前記群の各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、ここで、これらの位置は、配列番号8に記載のアミノ酸配列を参照することによって付番されている。例えば、残基C4は置換前の23位にてのシステインアミノ酸に相当する。先の実施形態のいずれか一つによれば、上記の置換は、柔軟なループL1 - dNTPとiDNAの結合に関与するタンパク質領域 - 内に位置するTdT残基に相当するが、また、触媒ドメインのコア - 反応の化学段階(ヌクレオチジルエキソ転移酵素活性)に関与するタンパク質領域 - 内に位置するTdT残基にも、および、C末端ドメイン - iDNA結合とTdTの全体的なフォールディングに関与するタンパク質領域 - に位置するTdT残基にも、相当する。特定の位置、特に柔軟なループL1における前記置換によって、iDNAのTdT 3’OHの間のより良好なアライメントに起因して、dNTPのアルファホスフェートに対する反応収率が改善される。
一部の実施形態では、本発明によるTdTバリアントは、配列番号2に記載のアミノ酸配列または配列番号2に記載の機能的に等価な配列を含み、前記アミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に、あるアミノ酸での少なくとも1つのアミノ酸置換を含み、ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている。
本発明の文脈において、TdTバリアントは任意の種由来であってもよく、キメラタンパク質であってもよい。「キメラタンパク質」とは、バリアントの一部が少なくとも異なる2種由来であることを意味する。前記キメラタンパク質は、ある種のタンパク質の1つ以上の所定の配列と、poIXファミリーのメンバーである、特にTdTである第2の種の少なくとも1つの所定の別の配列との付加によって、特に融合またはコンジュゲーションによって形成される。好ましくは、TdTバリアントはキメラタンパク質であり、より好ましくは、キメラタンパク質は異なる2種由来の一部、特にマウス由来の所定の配列とウシ由来の所定の配列とを含む。
特定の実施形態では、本発明によるTdTバリアントは、配列番号1にまたは配列番号2に記載のアミノ酸配列と少なくとも70%、75%、80%、85%、90%の同一性または相同性、好ましくは、配列番号1によるまたは配列番号2の配列と少なくとも95%、96%、97%、98%、99%および100%未満の同一性を有するアミノ酸配列を含む。
別の特定の実施形態では、本発明によるTdTバリアントは、配列番号3、配列番号4および配列番号5で構成される群から選択されるアミノ酸配列と少なくとも70%、75%、80%、85%、90%の同一性または相同性、より好ましくは、配列番号3、配列番号4および配列番号5で構成される群から選択される配列と少なくとも95%、96%、97%、98%、99%および100%未満の同一性を有するアミノ酸配列を含む。
特定の実施形態では、23位、262位、264位および298位からなる群から選択される位置にての置換アミノ酸での少なくとも1つのアミノ酸置換は、R、V、A、L、K、Q、TおよびGからなる群から選択される。より好ましくは、置換されたアミノ酸は298位にあり、指示される位置は配列番号1または配列番号2とのアラインメントによって決定される。
特定の実施形態では、4位、243位、245位および279位からなる群から選択される位置にての置き換えアミノ酸での少なくとも1つのアミノ酸置き換えは、R、V、A、L、K、Q、TおよびGからなる群から選択される。より好ましくは、置き換えられたアミノ酸は279位にあり、指示される位置は配列番号7または配列番号8とのアラインメントによって決定される。
一部の実施形態では、配列番号1または配列番号2に記載のアミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に少なくとも2つの置換を含む。好ましくは、第1の置換は298位にあり、第2の置換は23位、262位、および264位からなる群から選択される位置にある。
一部の実施形態では、配列番号1または配列番号2と少なくとも70%同一のアミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に少なくとも2つの置換を含む。好ましくは、第1の置換は298位にあり、第2の置換は23位、262位、および264位からなる群から選択される位置にある。I
一部の実施形態では、配列番号7または配列番号8と少なくとも70%同一のアミノ酸配列は、4位、243位、245位、および279位からなる群から選択される位置に少なくとも2つの置き換えを含む。好ましくは、第1の置換は279位にあり、第2の置換は4位、243位、および245位からなる群から選択される位置にある。
特定の実施形態では、少なくとも2つの置換は、R、V、A、L、K、Q、TおよびGからなる群から選択される。
特定の実施形態では、少なくとも2つの置き換えは、R、V、A、L、K、Q、TおよびGからなる群から選択される。一部の実施形態では、配列番号1または配列番号2に記載のアミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に少なくとも3つの置換を含む。好ましくは、第1の置換は298位にあり、第2の置換は23位または264位にあり、第3の置換も同様に23位または264位にある。
一部の実施形態では、配列番号1または配列番号2と少なくとも70%同一のアミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に少なくとも3つの置換を含む。好ましくは、第1の置換は298位にあり、第2の置換は23位または264位にあり、第3の置換も同様に23位または264位にある。
一部の実施形態では、配列番号7または配列番号8と少なくとも70%同一のアミノ酸配列は、4位、243位、245位、および279位からなる群から選択される位置に少なくとも3つの置き換えを含む。好ましくは、第1の置き換えは279位にあり、第2の置き換えは4位または245位にあり、第3の置き換えも同様に4位または245位にある。
特定の実施形態では、3つの置換は、R、V、A、L、K、Q、TおよびGからなる群から選択される。
特定の実施形態では、3つの置き換えは、R、V、A、L、K、Q、TおよびGからなる群から選択される。
特定の実施形態では、配列番号2に記載の本発明によるTdTバリアントのアミノ酸配列は、I298V/T/Lから選択される少なくとも1つのアミノ酸置換を含む。「I298V/T/L」とは、これは、イソロイシンがバリン(V)、スレオニン(T)およびロイシン(L)から選択されるアミノ酸によって298位で置換されていることを意味する。好ましくは、少なくとも1つのアミノ酸置換はI298/Vである。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、I298V/T/Lから選択される少なくとも1つのアミノ酸置換を含む。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、I279V/T/Lから選択される少なくとも1つのアミノ酸置き換えを含む。
別の特定の実施形態では、配列番号2に記載のTdTバリアントのアミノ酸配列は、T264R/K/Qから選択される少なくとも1つのアミノ酸置換を含む。「T264R/K/Q」とは、これは、スレオニンがアルギニン(R)、ロイシン(K)およびグルタミン(Q)から選択されるアミノ酸によって264位で置換されていることを意味する。好ましくは、少なくとも1つのアミノ酸置換はT264/Rである。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、T264R/K/Qから選択される少なくとも1つのアミノ酸置換を含む。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、T245R/K/Qから選択される少なくとも1つのアミノ酸置き換えを含む。
別の特定の実施形態では、配列番号2に記載のTdTバリアントのアミノ酸配列は、V262A/T/Gから選択される少なくとも1つのアミノ酸置換を含む。「V262A/T/G」とは、これは、バリンがアラニン(A)、スレオニン(T)およびグリシン(G)から選択されるアミノ酸によって262位で置換されていることを意味する。好ましくは、少なくとも1つのアミノ酸置換はV262Aである。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、V262A/T/Gから選択される少なくとも1つのアミノ酸置換を含む。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、V243A/T/Gから選択される少なくとも1つのアミノ酸置き換えを含む。
別の特定の実施形態では、配列番号2に記載のTdTバリアントのアミノ酸配列は、C23A/Tから選択される少なくとも1つのアミノ酸置換を含む。「C23A/T」とは、これは、システインがアミノ酸アラニン(A)またはスレオニン(T)によって23位で置換されていることを意味する。好ましくは、少なくとも1つのアミノ酸置換はC23Aである。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、C23A/Tから選択される少なくとも1つのアミノ酸置換を含む。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、C4A/Tから選択される少なくとも1つのアミノ酸置き換えを含む。
一部の実施形態では、配列番号2に記載のTdTバリアントのアミノ酸配列は、C23A/T、V262A/T/G、T264R/K/QおよびI298V/T/Lから選択される少なくとも2つのアミノ酸置換を含み、好ましくは、2つのアミノ酸置換は、T264R/K/QおよびI298V/T/L、またはC23A/TおよびI298V/T/L、またはV262A/T/GおよびI298V/T/Lである。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、C23A/T、V262A/T/G、T264R/K/QおよびI298V/T/Lから選択される少なくとも2つのアミノ酸置換を含み、好ましくは、2つのアミノ酸置換は、T264R/K/QおよびI298V/T/L、またはC23A/TおよびI298V/T/L、またはV262A/T/GおよびI298V/T/Lである。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、C4A/T、V243A/T/G、T245R/K/QおよびI279V/T/Lから選択される少なくとも2つのアミノ酸置換を含み、好ましくは、2つのアミノ酸置換は、T245R/K/QおよびI279V/T/L、またはC4A/TおよびI279V/T/L、またはV243A/T/GおよびI279V/T/Lである。
他の好ましい実施形態では、配列番号2に記載のTdTバリアントのアミノ酸配列は、C23A/T、およびT264R/K/Q、およびI298V/T/Lである3つのアミノ酸置換を含む。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、C23A/T、およびT264R/K/Q、およびI298V/T/Lである3つのアミノ酸置換を含む。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、C4A/T、およびT245R/K/Q、およびI279V/T/Lである3つのアミノ酸置換を含む。
一部の実施形態では、前記少なくとも1つのアミノ酸置換は298位にある。
一部の実施形態では、前記少なくとも1つのアミノ酸置き換えは279位にある。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、23位、262位、264位、および298位からなる群から選択される位置に少なくとも2つの置換を含む。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、4位、243位、245位、および279位からなる群から選択される位置に少なくとも2つの置き換えを含む。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に少なくとも3つの置換を含む。
一部の実施形態では、配列番号8と少なくとも70%同一のアミノ酸配列は、4位、243位、245位、および279位からなる群から選択される位置に少なくとも3つの置き換えを含む。
一部の実施形態では、TdTバリアントは、配列番号3、配列番号4、配列番号5からなる群から選択されるアミノ酸配列を含み、好ましくはTdTバリアントは配列番号3または配列番号5に記載のアミノ酸配列を有し、より好ましくはTdTバリアントは配列番号5に記載のアミノ酸配列を有する。
一部の実施形態では、TdTバリアントは、配列番号9、配列番号10、配列番号11からなる群から選択されるアミノ酸配列を含み、好ましくはTdTバリアントは配列番号9または配列番号11に記載のアミノ酸配列を有し、より好ましくはTdTバリアントは配列番号11に記載のアミノ酸配列を有する。
一部の実施形態では、配列番号2と少なくとも70%同一のアミノ酸配列を含むTdTバリアントは、配列番号3、配列番号4および配列番号5からなる群から選択されるアミノ酸配列と少なくとも70%同一であり、好ましくはそれらと少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一であり、かつ必要に応じてそれらと100%未満同一である。
配列番号8と少なくとも70%同一のアミノ酸配列を含むTdTバリアントは、配列番号9、配列番号10および配列番号11からなる群から選択されるアミノ酸配列と少なくとも70%同一であり、好ましくはそれらと少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一であり、かつ必要に応じてそれらと100%未満同一である。
本発明による前記特定のTdTバリアントによって、DNA合成の質が改善され、次いで技術的問題が解決される。特に、配列番号3、配列番号4および配列番号5に記載のアミノ酸配列を有するTdTバリアントは、配列番号2に記載のアミノ酸配列を有するTdTバリアントの欠失率と比較してそれぞれ、工程当たり0.55%から0.36%、0.32%および0.40%まで、アラニンについて欠失率の減少を有する。同じTdTバリアントによって、全体的な合成エラー率がそれぞれ工程当たり0.04%、0.06%および0.06%だけ減少する。したがって、本発明による前記特定のTdTバリアントは、配列番号2に記載のアミノ酸配列を有するTdTバリアントと比較して、より安定である。
また特に、配列番号3、配列番号4、配列番号5、配列番号9、配列番号10または配列番号11と少なくとも70%同一のアミノ酸配列を有するTdTバリアントは、配列番号2に記載のアミノ酸配列を有するTdTバリアントまたは配列番号8に記載のアミノ酸配列を有するTdTバリアントの欠失率と比較してそれぞれ、工程当たり0.55%から0.36%、0.32%および0.40%まで、アラニンについて欠失率の減少を有する。同じTdTバリアントによって、全体的な合成エラー率がそれぞれ工程当たり0.04%、0.06%および0.06%だけ減少する。したがって、本発明による前記特定のTdTバリアントは、配列番号2に記載のまたは配列番号8に記載のアミノ酸配列を有するTdTバリアントと比較して、より安定である。
別の実施形態では、本発明は、poIXファミリーのDNAポリメラーゼのバリアントを、特に本発明によるテンプレート鎖なしで核酸分子を合成することができるTdTをコードする核酸に関する。本発明はまた、本発明による核酸の発現カセットに関する。本発明は、本発明による核酸または発現カセットを含むベクターにさらに関する。ベクターは、プラスミドから選択しても、ウイルスベクターから選択してもよい。
DNAポリメラーゼバリアントをコードする核酸は、DNA(cDNAまたはgDNA)であっても、RNAであっても、この2つの混合物であってもよい。上記核酸は、一本鎖形態であっても、デュプレックス形態であっても、この2つの形態の混合物であってもよい。上記核酸は、例えば、修飾された結合、修飾されたプリン塩基もしくはピリミジン塩基、または修飾された糖を含む修飾されたヌクレオチドを含むことができる。上記核酸は、化学合成、組換え、突然変異誘発等を含めて、当業者に既知の方法のいずれかによって調製することができる。
発現カセットは、本発明によるTdTバリアントの発現に必要な全てのエレメント、特に、宿主細胞における転写および翻訳に必要なエレメントを含む。宿主細胞は、原核生物のものであっても真核生物のものであってもよい。特に、発現カセットは、プロモーターおよびターミネーターを、必要に応じて増幅因子を含む。プロモーターは、原核生物のものであっても真核生物のものであってもよい。以下は好ましい原核生物プロモーターの例である:Lacl、LacZ、pLacT、ptac、pARA、pBAD、バクテリオファージT3もしくはT7のRNAポリメラーゼプロモーター、ポリヒドリンプロモーター、ラムダファージのPRもしくはPLプロモーター。以下は好ましい真核生物プロモーターの例である:CMV早期プロモーター、HSVチミジンキナーゼプロモーター、SV40早期または後期プロモーター、マウスのメタロチオネイン-Lプロモーター、およびある特定のレトロウイルスのLTR領域。一般に、適正なプロモーターの選択に関して、当業者は、Sambrookら(1989)による研究をまたはFullerら(1996;Immunology in Current Protocols in Molecular Biology)により記載の技法を有利に参照することができる。
本発明は、本発明によるTdTバリアントをコードする核酸または発現カセットを担持するベクターに関する。ベクターは、発現ベクターであることが好ましい、すなわち、ベクターは、宿主細胞におけるバリアントの発現に必要なエレメントを含む。宿主細胞は、原核生物、例えば大腸菌(E.coli)であっても、または真核生物であってもよい。真核生物は、酵母(例えば、P.パストリス(P.pastoris)またはK.ラクチス(K.lactis))もしくは真菌(例えばアスペルギルス(Aspergillus)属のもの)などの下等真核生物であっても、昆虫細胞(例えばSf9またはSf21)、哺乳動物細胞もしくは植物細胞などの高等真核生物であってもよい。細胞は、哺乳動物細胞、例えばCOS(ミドリザル細胞株)(例えば、COS 1(ATCC CRL-1650)、COS 7(ATCC CRL-1651)、CHO(米国特許第4,889,803号;同第5,047,335号、CHO-K1(ATCC CCL-61))、マウスの細胞およびヒト細胞であってもよい。特定の実施形態では、細胞は、非ヒトであり非胚性である。ベクターは、プラスミド、ファージ、ファージミド、コスミド、ウイルス、YAC、BAC、アグロバクテリウム(Agrobacterium)pTiプラスミド等とすることができる。ベクターは好ましくは、複製起点、多重クローニング部位および選択遺伝子から選択される1つ以上のエレメントを含むことができる。好ましい実施形態では、ベクターはプラスミドである。以下は原核生物ベクターの非網羅的例である:pQE70、pQE60、pQE-9(Qiagen)、pbs、pD10、ファージスクリプト、psiX174、pbluescrip SK、pbsks、pNH8A、pNH16A、pNH18A、pNH46A(Stratagene);ptrc99a、pKK223-3、pKK233-3、pDR540、pBR322およびpRIT5(Pharmacia)、pET(Novagen)。以下は真核生物ベクターの非網羅的例である:pWLNEO、pSV2CAT、pPICZ、pcDNA3.1(+)Hyg(Invitrogen)、pOG44、pXT1、pSG(Stratagene);pSVK3、pBPV、pCI-neo(Stratagene)、pMSG、pSVL(Pharmacia);およびpQE-30(QLAexpress)。ウイルスベクターは、非網羅的様式でアデノウイルス、AAV、HSV、レンチウイルス等である。好ましくは、発現ベクターはプラスミドまたはウイルスベクターである。
本発明によるTdTバリアントをコードする配列は、シグナルペプチドを含む場合もあれば含まない場合もある。上記配列がシグナルペプチドを含まない場合には、メチオニンを必要に応じてN末端に付加することができる。別の代替形態では、異種シグナルペプチドを導入してもよい。この異種シグナルペプチドは、大腸菌などの原核生物に由来しても、真核生物、特に哺乳動物細胞、昆虫細胞、または酵母に由来してもよい。
本発明は、細胞を形質転換するまたはトランスフェクションするための、本発明による、発現カセットのまたはベクターのポリヌクレオチドの使用に関する。本発明は、TdTバリアントをコードする核酸、発現カセットまたはベクターを含む宿主細胞に、および本発明によるTdTバリアントを生成するためのその使用に関する。「宿主細胞」という用語は、本細胞の培養からまたは増殖から生じる娘細胞を包含する。特定の実施形態では、細胞は、非ヒトであり非胚性である。
本発明はまた、本発明のTdTバリアントを生成するための方法にも関し、本発明によるポリヌクレオチド、発現カセットまたはベクターによる細胞の形質転換またはトランスフェクション;トランスフェクトされた/形質転換された細胞を培養すること;および細胞により産生されたTdTバリアントを回収すること、を含む。代替的な実施形態では、本発明によるTdTバリアントを生成するための方法は、本発明によるポリヌクレオチド、発現カセットまたはベクターを含む細胞を用意すること;トランスフェクトされた/形質転換された細胞を培養すること;および細胞により産生されたTdTバリアントを回収することを含む。特に、細胞は、バリアントをコードする核酸によって一過性のまたは安定な様式で形質転換されても/トランスフェクトされてもよい。この核酸は、エピソームの形態でまたは染色体の形態で細胞に含めることができる。組換えタンパク質を生成するための方法は、当業者には周知されている。
TdTバリアントは、共有結合または非共有結合;アミノ酸タグ(例えば、ポリ-アミノ酸タグ、ポリ-Hisタグ、6Hisタグ等);化学化合物(例えば、ポリエチレングリコール);タンパク質-タンパク質結合ペア(例えば、ビオチン-アビジン);アフィニティーカップリング;捕捉プローブ;またはこれらの任意の組み合わせを始めとするリンカー部分に動作可能に連結することができる。リンカー部分は、TdTバリアントとは別であってもよく、TdTバリアントの一部であってもよい。本発明の修飾されたTdTバリアントと共に使用するための例示的Hisタグは、MASSHHHHHHSSGSEKKIS - (配列番号6)である。タグ-リンカー部分は、TdTバリアントのヌクレオチド結合活性または触媒活性に干渉せず、TdTバリアントの容易な精製および分離を可能にする。
本発明によるTdTバリアントは、テンプレート鎖なしでの核酸の合成に特に有利である。より具体的には、本発明によるバリアントは、天然ヌクレオチドよりも大きな立体障害を呈する修飾されたヌクレオチドの収容により適切である、より柔軟なループ1を有する。また、配列番号2のT264R突然変異または配列番号8のT245Rによって、TdTとDNAイニシエーターとの間の相互作用が改善される。
したがって、本発明はまた、3’-OH修飾されたヌクレオチドから、テンプレート鎖なしで核酸分子を合成するための、本発明によるTdTバリアントの、特に出願第WO2016034807号に記載のものの、使用にも関する。
別の態様では、本発明は、特にテンプレート鎖なしでの核酸分子の酵素的合成のためのキットに関し、前記キットは:
a.上記実施形態のいずれか一つによる少なくとも1種のTdTバリアント、
b.少なくとも1種の3’-O-修飾されたヌクレオシドトリホスフェート、および
c.必要に応じて少なくとも1種のイニシエーター
を含む。
a.上記実施形態のいずれか一つによる少なくとも1種のTdTバリアント、
b.少なくとも1種の3’-O-修飾されたヌクレオシドトリホスフェート、および
c.必要に応じて少なくとも1種のイニシエーター
を含む。
特に、修飾されたヌクレオシドトリホスフェートは保護基である。この保護基によって、3’-OHをブロックして/保護して、その結果、その他のヌクレオシドとの反応を防止することを可能にする。したがって、特に、キットは、少なくとも1種の3’-O-保護されたヌクレオシドトリホスフェートを含む。
特定の実施形態では、本発明のキットは、少なくとも2種のTdTバリアント、好ましくは少なくとも3種のTdTバリアントを含む。キットが2種以上のTdTバリアントを含む場合、キット中のTdTバリアントは互いに異なる可能性がある。例えば、キットは本発明のTdTバリアントの混合物であってもよい。
一部の実施形態では、キットは、配列番号3と少なくとも70%同一の、好ましくは配列番号3と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号3と100%未満同一のアミノ酸配列を含む第1のTdTバリアントと、配列番号5と少なくとも70%同一の、好ましくは配列番号5と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号5と100%未満同一のアミノ酸配列を含む第2のTdTバリアントと、を含む。
より好ましい実施形態では、本発明のキットは、配列番号3に記載のアミノ酸配列を含む第1のTdTバリアントと、配列番号5に記載のアミノ酸配列を含む第2のバリアントとを含む。
一部の実施形態では、本発明のキットは、配列番号9と少なくとも70%同一の、好ましくは配列番号9と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号9と100%未満同一のアミノ酸配列を含む第1のTdTバリアントと、配列番号11と少なくとも70%同一の、好ましくは配列番号11と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%同一の、必要に応じて配列番号11と100%未満同一のアミノ酸配列を含む第2のTdTバリアントと、を含む。
より好ましい実施形態では、本発明のキットは、配列番号9に記載のアミノ酸配列を含む第1のTdTバリアントと、配列番号11に記載のアミノ酸配列を含む第2のバリアントと、を含む。
本発明の前記TdTバリアントおよび前記キットは、テンプレート鎖なしでのポリヌクレオチド、すなわち核酸分子の酵素的合成に特に適切である。
したがって、本発明はまた、テンプレート鎖なしでの核酸分子の酵素的合成のための方法にも関し、本方法によれば、プライマー鎖を、少なくとも1種のヌクレオチドと、好ましくは3’-OH修飾されたヌクレオチドと、本発明によるTdTバリアントの存在下で接触させる。
したがって、本発明は、必要に応じて所定の配列を有するポリヌクレオチドを合成する方法に関し、方法は:
a.遊離3’-ヒドロキシルを有する3’-末端ヌクレオチドを有する少なくとも1種のイニシエーターを用意する工程、
b.伸長条件下で、遊離3’-O-ヒドロキシルを有する前記少なくとも1種のイニシエーターを、3’-O-ブロックされたヌクレオシドトリホスフェートおよび上記実施形態のいずれか1つによるTdTバリアントと接触させ、その結果、前記少なくとも1種のイニシエーターは、3’-O-ブロックされたヌクレオシドトリホスフェートの組み込みによって伸長されて、3’-O-ブロックされた伸長断片を形成する工程、ならびに
c.伸長断片を脱ブロッキングして、遊離3’-ヒドロキシルを有する伸長断片を形成する工程、ならびに
d.伸長条件下で工程c.で得られた伸長断片を接触させることによって、ポリヌクレオチドが形成されるまで、工程b.および工程c.を繰り返す工程、
を含む。
a.遊離3’-ヒドロキシルを有する3’-末端ヌクレオチドを有する少なくとも1種のイニシエーターを用意する工程、
b.伸長条件下で、遊離3’-O-ヒドロキシルを有する前記少なくとも1種のイニシエーターを、3’-O-ブロックされたヌクレオシドトリホスフェートおよび上記実施形態のいずれか1つによるTdTバリアントと接触させ、その結果、前記少なくとも1種のイニシエーターは、3’-O-ブロックされたヌクレオシドトリホスフェートの組み込みによって伸長されて、3’-O-ブロックされた伸長断片を形成する工程、ならびに
c.伸長断片を脱ブロッキングして、遊離3’-ヒドロキシルを有する伸長断片を形成する工程、ならびに
d.伸長条件下で工程c.で得られた伸長断片を接触させることによって、ポリヌクレオチドが形成されるまで、工程b.および工程c.を繰り返す工程、
を含む。
好ましい実施形態では、本発明によるTdTバリアントは、参照により本明細書に組み込まれる出願第WO2015/159023号に記載されている合成方法を実施するために使用することができる。
本発明の他の特徴および利点は、もちろん非限定的なものである以下の実施例および結果からより明らかになるであろう。
実施例1 - TdTバリアントの構築、発現およびスクリーニング
TdTバリアントの構築
本発明のTdTバリアントは、Miyazaki K.MEGAWHOP cloning:a method of creating random mutagenesis libraries via megaprimer PCR of whole plasmids.Methods Enzymol.2011;498:399~406頁.Doi:10.1016/B978-0-12-385120-8.00017-6.PMID:21601687により開示されたMEGAWHOPクローニング法を使用して創出した。
TdTバリアントの構築
本発明のTdTバリアントは、Miyazaki K.MEGAWHOP cloning:a method of creating random mutagenesis libraries via megaprimer PCR of whole plasmids.Methods Enzymol.2011;498:399~406頁.Doi:10.1016/B978-0-12-385120-8.00017-6.PMID:21601687により開示されたMEGAWHOPクローニング法を使用して創出した。
メガプライマーを、通常のPCR増幅および分子生物学技法に従って、少なくとも1つのプライマーは変異原性(縮重コドンまたは事前設計の突然変異を含有する)である一対のプライマーを用いるPCRによって作製した。精製メガプライマーを、第2のPCR工程でTDT環状骨格プラスミド(pet28ベクター)と組み合わせた。DpnIでの消化の後、PCR生成物をE.Cloni 10G細胞(Lucigen)にエレクトロポレーションした。形質転換体を、50mg/Lカナマイシンを補充した2YT寒天プレート上で選択した。TdTバリアントをコードするプラスミドを、形質転換プレートのバクテリアカーペットから、または一晩の液体培養物(0.5%グルコースおよび50mg/Lカナマイシンを補充した2YT)からのいずれかから直接に調製した。
発現およびスクリーニング
スクリーニングの場合、TdTバリアントをコードするプラスミドを市販の大腸菌株BL21(DE3)(Novagen)で再形質転換した。カナマイシンペトリ皿内で増殖することができたコロニーを分離し、標識した。TdTの個々のバリアントを、Ybertら、米国特許出願第US2020/0002690号により記載のように、Ni-NTAクロマトグラフィーを使用して96ウェルフォーマットで生成し、発現させ、および精製した。タンパク質の量は280nmにての吸収度によって決定した。
スクリーニングの場合、TdTバリアントをコードするプラスミドを市販の大腸菌株BL21(DE3)(Novagen)で再形質転換した。カナマイシンペトリ皿内で増殖することができたコロニーを分離し、標識した。TdTの個々のバリアントを、Ybertら、米国特許出願第US2020/0002690号により記載のように、Ni-NTAクロマトグラフィーを使用して96ウェルフォーマットで生成し、発現させ、および精製した。タンパク質の量は280nmにての吸収度によって決定した。
実施例2 - TdTバリアントの活性、特にデュプレックスおよびヘアピンの活性の研究。
本発明による様々なTdTバリアントの活性を、以下の試験によって決定した。結果を、バリアントそれぞれが由来する配列番号2のTdT(参照)を用いて得られた結果と比較した。
本発明による様々なTdTバリアントの活性を、以下の試験によって決定した。結果を、バリアントそれぞれが由来する配列番号2のTdT(参照)を用いて得られた結果と比較した。
本研究では、国際特許出願番号第WO2020/099451号に記載のように、3’末端dNTPの組み込みにおけるTdT動態をモニタリングする。本発明者らは、単一の塩基(+A反応についてはTGGCCおよび+G反応についてはCAGCAAGGCT)の組み込みの際に一本鎖DNAから二本鎖DNA(dsDNA)へと移行する短いイニシエーターDNA(iDNA)基質を開発した。用途に応じて、2つのタイプのiDNA:主に分子内dsDNAを形成するヘアピン-DNA、または2つの分子から構成される対称なdsDNAを形成するデュプレックス-DNA、を適用した(図2を参照のこと)。デュプレックスアッセイでは、単一の組み込まれた塩基のエネルギー効果が2倍であり、このことは、容易に融解するA=Tペアを創出する+Aまたは+Tの反応をモニタリングするのに極めて重要である。
したがって、このようなシステムでは、dsDNAの形成はTdTの酵素活性を反映し、その形成をdsDNA特異的挿入色素(エチジウムブロマイド、GelRed、SYBR Green)の蛍光を測定することによってリアルタイムでモニタリングできる。TdTバリアントの比活性を、500μM 3’ONH2 dNTP、10μM iDNAおよび30nM TdTの存在下でのGelRed蛍光増加の初速度として決定した。
結果
OP2とは、キャピラリー電気泳動によって決定した、酵素的に作製したDNAの純度を表す。E12とは、固体支持体に付着させたAACTACCTGTACCGGC DNAの先端に合成したTGTTCCGGAAGAGCAACCTG DNA配列を表す。Q21とは、固体支持体に付着させたGTATGGCGCGATGACTCG DNAの先端に合成したCGCACGCTAC DNA配列を表す。Tmは、純粋なTdTバリアントの融解温度を表し、SYPRO Orange色素を使用してサーマルシフトアッセイから決定される。欠失率は、平均約50塩基長である本発明者らの標準24プライマーセットからの平均値である。
OP2とは、キャピラリー電気泳動によって決定した、酵素的に作製したDNAの純度を表す。E12とは、固体支持体に付着させたAACTACCTGTACCGGC DNAの先端に合成したTGTTCCGGAAGAGCAACCTG DNA配列を表す。Q21とは、固体支持体に付着させたGTATGGCGCGATGACTCG DNAの先端に合成したCGCACGCTAC DNA配列を表す。Tmは、純粋なTdTバリアントの融解温度を表し、SYPRO Orange色素を使用してサーマルシフトアッセイから決定される。欠失率は、平均約50塩基長である本発明者らの標準24プライマーセットからの平均値である。
配列番号3または配列番号4または配列番号5を有するTdTバリアントの、それぞれ突然変異T264R+I298V、またはC23A+T264R+I298V、またはV262A+I298Vを有するバリアントの、活性および合成性能を図3に表す。パネルAのプロットは、TAGCT+Aデュプレックステストにおける+A反応の酵素速度を示し、パネルBのプロットは、CAGCAAGGCT+Gヘアピンによる+G反応の酵素速度を指示する。
したがって、配列番号3、配列番号4および配列番号5に記載のアミノ酸配列を有するTdTバリアントによって、配列番号2に記載のアミノ酸配列を有するTdTバリアントの欠失率と比較してそれぞれ、工程当たり0.55%から0.36%、0.32%および0.40%まで、アラニンについて欠失率が減少した。同じTdTバリアントによって、全体的な合成エラー率がそれぞれ工程当たり0.04%、0.06%および0.06%だけ減少する。したがって、本発明による前記特定のTdTバリアントはより良好な品質のDNA鎖を産生する。
実施例3 - 比較研究
本研究によって、配列番号2のTdTを用いて得られたものと比較して、配列番号3、配列番号4または配列番号5のTdTバリアントによって合成された配列の置換、挿入、欠失の平均値について調査する。
本研究によって、配列番号2のTdTを用いて得られたものと比較して、配列番号3、配列番号4または配列番号5のTdTバリアントによって合成された配列の置換、挿入、欠失の平均値について調査する。
24の配列を、各TdTバリアントについて二重で合成する。合成を、0.5Mカコジル酸バッファー pH7.4中で、20%DMSO、50mM NaClにての20μM酵素、2mM CoCl2、500μM ONH2ヌクレオチド、750pmol樹脂(10μM iDNA)を用いて37℃で行う。各合成は、対照として配列番号2のTdTを含む。パーセンテージとは、参照配列と比較した完全なリードのパーセンテージを指す)。
各TdTバリアントによって合成された24の配列を、Illumina,Inc.製のiSeq 100 Systemシーケンサーを使用して配列決定した。欠失、挿入、および置換のパーセンテージを、シーケンサーから得られた配列とターゲット配列を比較することによって算出する。
結果を図4に詳述する。
欠失の平均値に関して、配列番号2のTdTと比較して、配列番号3、配列番号4および配列番号5のTdTバリアントは、特に配列番号4および配列番号5のTdTバリアントは、全てより良好である。挿入の平均値も配列番号2のTdTよりも減少している。したがって、本発明によるTdTバリアントは誤組み込みが少ないDNA鎖を産生し、結果として、技術的問題は本発明のTdTによって十分に解決される。
Claims (14)
- 配列番号2と少なくとも70%同一のアミノ酸配列であって、
前記アミノ酸配列は、23位、262位、264位および298位からなる第1の群から選択される位置に、もしくは前記第1の群の各位置の機能的に等価な位置に置換アミノ酸での少なくとも1つのアミノ酸置換を含み、
ここで、これらの位置は、配列番号2に記載のアミノ酸配列を参照することによって付番されている、
配列番号2と少なくとも70%同一のアミノ酸配列、
または
配列番号8と少なくとも70%同一のアミノ酸配列であって、
前記アミノ酸配列は、4位、243位、245位および279位からなる第2の群から選択される位置に、もしくは前記第2の群の各位置の機能的に等価な位置に置き換えアミノ酸での少なくとも1つのアミノ酸置き換えを含み、
ここで、これらの位置は、配列番号8に記載のアミノ酸配列を参照することによって付番されている、
配列番号8と少なくとも70%同一のアミノ酸配列
を含む、末端デオキシヌクレオチド転移酵素(TdT)バリアント。 - 置換アミノ酸または置き換えアミノ酸は、R、V、A、L、K、Q、TおよびGからなる群から選択される、請求項1に記載のTdTバリアント。
- 前記少なくとも1つのアミノ酸置換は298位にある、または前記少なくとも1つのアミノ酸置き換えは279位にある、請求項1または2に記載のTdTバリアント。
- 配列番号2と少なくとも70%同一のアミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に少なくとも2つの置換を含む、または
配列番号8と少なくとも70%同一のアミノ酸配列は、4位、243位、245位および279位からなる群から選択される位置に少なくとも2つの置き換えを含む、
請求項1から3のいずれか一項に記載のTdTバリアント。 - 配列番号2と少なくとも70%同一のアミノ酸配列は、23位、262位、264位および298位からなる群から選択される位置に少なくとも3つの置換を含む、または
配列番号8と少なくとも70%同一のアミノ酸配列は、4位、243位、245位および279位からなる群から選択される位置に少なくとも3つの置き換えを含む、
請求項1から4のいずれか一項に記載のTdTバリアント。 - 配列番号2と少なくとも70%同一のアミノ酸配列は、I298V/T/Lから選択される少なくとも1つのアミノ酸置換を含む、または
配列番号8と少なくとも70%同一のアミノ酸配列は、I279V/T/Lから選択される少なくとも1つのアミノ酸置き換えを含む、
請求項1から5のいずれか一項に記載のTdTバリアント。 - 配列番号2と少なくとも70%同一のアミノ酸配列は、T264R/K/Qから選択される少なくとも1つのアミノ酸置換を含む、または
配列番号8と少なくとも70%同一のアミノ酸配列は、T245R/K/Qから選択される少なくとも1つのアミノ酸置き換えを含む、
請求項1から6のいずれか一項に記載のTdTバリアント。 - 配列番号2と少なくとも70%同一のアミノ酸配列は、V262A/T/Gから選択される少なくとも1つのアミノ酸置換を含む、または
配列番号8と少なくとも70%同一のアミノ酸配列は、V243A/T/Gから選択される少なくとも1つのアミノ酸置き換えを含む、
請求項1から7のいずれか一項に記載のTdTバリアント。 - 配列番号2と少なくとも70%同一のアミノ酸配列は、C23A/Tから選択される少なくとも1つのアミノ酸置換を含む、または
配列番号8と少なくとも70%同一のアミノ酸配列は、C4A/Tから選択される少なくとも1つのアミノ酸置き換えを含む、
請求項1から8のいずれか一項に記載のTdTバリアント。 - 配列番号2と少なくとも70%同一のアミノ酸配列は、配列番号3、配列番号4および配列番号5からなる群から選択されるアミノ酸配列と少なくとも70%同一である、または
配列番号8と少なくとも70%同一のアミノ酸配列は、配列番号9、配列番号10および配列番号11からなる群から選択されるアミノ酸配列と少なくとも70%同一である、
請求項1から9のいずれか一項に記載のTdTバリアント。 - a.請求項1から10のいずれか一項に記載の少なくとも1種のTdTバリアント、
b.少なくとも1種の3’-O-修飾されたヌクレオシドトリホスフェート、および
c.必要に応じて少なくとも1種のイニシエーター
を含む、キット。 - キットは2種のTdTバリアントを含む、請求項11に記載のキット。
- 第1のTdTバリアントは配列番号3と少なくとも70%同一のアミノ酸配列を含み、第2のバリアントは配列番号5と少なくとも70%同一のアミノ酸配列を含む、または
第1のTdTバリアントは配列番号9と少なくとも70%同一のアミノ酸配列を含み、第2のバリアントは配列番号11と少なくとも70%同一のアミノ酸配列を含む、
請求項12に記載のキット。 - ポリヌクレオチドを合成する方法であって、方法は:
a.遊離3’-ヒドロキシルを有する3’末端ヌクレオチドを有する少なくとも1種のイニシエーターを用意する工程、
b.伸長条件下で、遊離3’-O-ヒドロキシルを有する少なくとも1種のイニシエーターを、3’-O-ブロックされたヌクレオシドトリホスフェートおよび請求項1から10のいずれか一項に記載のTdTバリアントと接触させ、その結果、前記少なくとも1種のイニシエーターは、3’-O-ブロックされたヌクレオシドトリホスフェートの組み込みによって伸長されて、3’-O-ブロックされた伸長断片を形成する工程、ならびに
c.伸長断片を脱ブロッキングして、遊離3’-ヒドロキシルを有する伸長断片を形成する工程、ならびに
d.伸長条件下で工程c.で得られた前記少なくとも伸長された断片を接触させることによって、ポリヌクレオチドが形成されるまで、工程b.および工程c.を繰り返す工程、
を含む、ポリヌクレオチドを合成する方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR2111980 | 2021-11-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024541312A true JP2024541312A (ja) | 2024-11-08 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10435676B2 (en) | Variants of terminal deoxynucleotidyl transferase and uses thereof | |
US20240254459A1 (en) | Variants of terminal deoxynucleotidyl transferase and uses thereof | |
US11859217B2 (en) | Terminal deoxynucleotidyl transferase variants and uses thereof | |
US20230193222A1 (en) | Variants of Family a Dna Polymerase and Uses Thereof | |
CA3161087A1 (en) | Chimeric terminal deoxynucleotidyl transferases for template-free enzymatic synthesis of polynucleotides | |
JP2024541312A (ja) | 新規末端デオキシヌクレオチド転移酵素(TdT)バリアントおよびその使用 | |
EP3976809B1 (en) | Variants of terminal deoxynucleotidyl transferase and uses thereof | |
AU2022388772A1 (en) | Novel terminal deoxynucleotidyl | |
WO2023083999A2 (en) | Novel terminal deoxynucleotidyl transferase (tdt) variants | |
JP2023522234A (ja) | 末端デオキシヌクレオチジルトランスフェラーゼ変異体およびその使用 | |
EP3744854A1 (en) | Variants of terminal deoxynucleotidyl transferase and uses thereof | |
WO2023143123A1 (zh) | 可控合成单链dna的末端转移酶变体及应用 | |
IL292874A (en) | Efficient enzymatic synthesis of template-free polynucleotides | |
Class et al. | Patent application title: Enzymatic Synthesis of L-Nucleic Acids Inventors: Andreas Pech (Halle, DE) Ralf David (Leipzig, DE) Florian Jarosch (Berlin, DE) Florian Jarosch (Berlin, DE) Michael Jahnz (Berlin, DE) Sven Klussmann (Berlin, DE) Assignees: NOXXON PHARMA AG |