KR101939420B1 - 돌연변이체 세공 - Google Patents
돌연변이체 세공 Download PDFInfo
- Publication number
- KR101939420B1 KR101939420B1 KR1020137023664A KR20137023664A KR101939420B1 KR 101939420 B1 KR101939420 B1 KR 101939420B1 KR 1020137023664 A KR1020137023664 A KR 1020137023664A KR 20137023664 A KR20137023664 A KR 20137023664A KR 101939420 B1 KR101939420 B1 KR 101939420B1
- Authority
- KR
- South Korea
- Prior art keywords
- pores
- serine
- monomers
- gly
- leu
- Prior art date
Links
- 239000011148 porous material Substances 0.000 title claims description 388
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 152
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 71
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 71
- 238000012512 characterization method Methods 0.000 claims abstract description 12
- 239000000178 monomer Substances 0.000 claims description 283
- 239000002773 nucleotide Substances 0.000 claims description 200
- 125000003729 nucleotide group Chemical group 0.000 claims description 200
- 238000000034 method Methods 0.000 claims description 92
- 102000004190 Enzymes Human genes 0.000 claims description 85
- 108090000790 Enzymes Proteins 0.000 claims description 85
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 80
- 238000006467 substitution reaction Methods 0.000 claims description 75
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 74
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 73
- 235000001014 amino acid Nutrition 0.000 claims description 64
- 229940024606 amino acid Drugs 0.000 claims description 63
- 150000001413 amino acids Chemical group 0.000 claims description 61
- 102100026040 Leishmanolysin-like peptidase Human genes 0.000 claims description 60
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 50
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 47
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 47
- 235000009582 asparagine Nutrition 0.000 claims description 47
- 229960001230 asparagine Drugs 0.000 claims description 47
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 43
- 102000040430 polynucleotide Human genes 0.000 claims description 42
- 108091033319 polynucleotide Proteins 0.000 claims description 42
- 239000002157 polynucleotide Substances 0.000 claims description 42
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 41
- 239000004473 Threonine Substances 0.000 claims description 41
- 230000035772 mutation Effects 0.000 claims description 40
- 235000018417 cysteine Nutrition 0.000 claims description 37
- 108090000623 proteins and genes Proteins 0.000 claims description 36
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 35
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 33
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 33
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 32
- 239000004474 valine Substances 0.000 claims description 32
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 31
- 102000004169 proteins and genes Human genes 0.000 claims description 31
- 239000004475 Arginine Substances 0.000 claims description 30
- 235000004279 alanine Nutrition 0.000 claims description 30
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 30
- 235000018102 proteins Nutrition 0.000 claims description 30
- 238000012163 sequencing technique Methods 0.000 claims description 30
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 29
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 29
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 29
- 230000003993 interaction Effects 0.000 claims description 29
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 28
- 229960003767 alanine Drugs 0.000 claims description 28
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 28
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 25
- 239000004471 Glycine Substances 0.000 claims description 24
- 235000018977 lysine Nutrition 0.000 claims description 23
- 108060004795 Methyltransferase Proteins 0.000 claims description 22
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 19
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 19
- 239000000203 mixture Substances 0.000 claims description 19
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 18
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 18
- 239000004472 Lysine Substances 0.000 claims description 18
- 102000044158 nucleic acid binding protein Human genes 0.000 claims description 17
- 108700020942 nucleic acid binding protein Proteins 0.000 claims description 17
- -1 polymerase Proteins 0.000 claims description 17
- 230000004048 modification Effects 0.000 claims description 16
- 238000012986 modification Methods 0.000 claims description 16
- 238000006384 oligomerization reaction Methods 0.000 claims description 13
- 229960000310 isoleucine Drugs 0.000 claims description 9
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 9
- 229930182817 methionine Natural products 0.000 claims description 9
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 9
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 8
- 239000012530 fluid Substances 0.000 claims description 8
- 102200114133 rs368386747 Human genes 0.000 claims description 8
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 7
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 7
- 102220613771 Angiotensin-converting enzyme 2_N90Q_mutation Human genes 0.000 claims description 6
- 102220640750 Guanine nucleotide-binding protein G(i) subunit alpha-3_N90R_mutation Human genes 0.000 claims description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 6
- 125000003588 lysine group Chemical class [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 6
- 102200026914 rs730882246 Human genes 0.000 claims description 6
- 102220612719 Cyclin-dependent kinase inhibitor 3_N91K_mutation Human genes 0.000 claims description 5
- 102220377465 c.268A>T Human genes 0.000 claims description 5
- 102220354163 c.270T>G Human genes 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 101710183280 Topoisomerase Proteins 0.000 claims description 4
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 4
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 claims description 4
- 235000003704 aspartic acid Nutrition 0.000 claims description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 4
- LEVWYRKDKASIDU-IMJSIDKUSA-N cystine group Chemical group C([C@@H](C(=O)O)N)SSC[C@@H](C(=O)O)N LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 claims description 4
- 102220085012 rs863225291 Human genes 0.000 claims description 4
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 claims description 3
- 102000003960 Ligases Human genes 0.000 claims description 3
- 108090000364 Ligases Proteins 0.000 claims description 3
- 101710163270 Nuclease Proteins 0.000 claims description 3
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 claims description 3
- 230000009144 enzymatic modification Effects 0.000 claims description 2
- 102220072644 rs753744791 Human genes 0.000 claims 2
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 claims 1
- 229930195711 D-Serine Natural products 0.000 claims 1
- ROHFNLRQFUQHCH-RXMQYKEDSA-N D-leucine Chemical compound CC(C)C[C@@H](N)C(O)=O ROHFNLRQFUQHCH-RXMQYKEDSA-N 0.000 claims 1
- 102000017033 Porins Human genes 0.000 claims 1
- 108010013381 Porins Proteins 0.000 claims 1
- 150000001945 cysteines Chemical class 0.000 claims 1
- 102000053602 DNA Human genes 0.000 description 130
- 108020004414 DNA Proteins 0.000 description 130
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 48
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 48
- 238000002474 experimental method Methods 0.000 description 43
- 239000012528 membrane Substances 0.000 description 40
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 37
- 125000003275 alpha amino acid group Chemical group 0.000 description 31
- 108060002716 Exonuclease Proteins 0.000 description 30
- 230000008901 benefit Effects 0.000 description 30
- 102000013165 exonuclease Human genes 0.000 description 30
- 230000001965 increasing effect Effects 0.000 description 28
- 239000000523 sample Substances 0.000 description 28
- 108090000765 processed proteins & peptides Proteins 0.000 description 26
- 239000000872 buffer Substances 0.000 description 24
- 210000004027 cell Anatomy 0.000 description 22
- 238000012300 Sequence Analysis Methods 0.000 description 21
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 20
- 108010006464 Hemolysin Proteins Proteins 0.000 description 19
- 239000000539 dimer Substances 0.000 description 19
- 239000003228 hemolysin Substances 0.000 description 19
- 229920002477 rna polymer Polymers 0.000 description 19
- 230000000694 effects Effects 0.000 description 18
- 239000001103 potassium chloride Substances 0.000 description 18
- 235000011164 potassium chloride Nutrition 0.000 description 18
- 150000003839 salts Chemical class 0.000 description 17
- 241000588724 Escherichia coli Species 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 239000000243 solution Substances 0.000 description 15
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- 230000002829 reductive effect Effects 0.000 description 14
- 239000000232 Lipid Bilayer Substances 0.000 description 13
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 13
- 229910052739 hydrogen Inorganic materials 0.000 description 13
- 108010061238 threonyl-glycine Proteins 0.000 description 13
- 239000013598 vector Substances 0.000 description 13
- 108020004682 Single-Stranded DNA Proteins 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 239000002585 base Substances 0.000 description 12
- 239000001257 hydrogen Substances 0.000 description 12
- 230000001976 improved effect Effects 0.000 description 12
- 239000010410 layer Substances 0.000 description 12
- 150000002632 lipids Chemical class 0.000 description 12
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 11
- 229920000858 Cyclodextrin Polymers 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 238000013461 design Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000005945 translocation Effects 0.000 description 11
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 10
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 10
- 102220587339 NEDD8-activating enzyme E1 catalytic subunit_L88S_mutation Human genes 0.000 description 10
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 238000002703 mutagenesis Methods 0.000 description 9
- 231100000350 mutagenesis Toxicity 0.000 description 9
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 8
- 238000006731 degradation reaction Methods 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 229960004452 methionine Drugs 0.000 description 8
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 8
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 125000003118 aryl group Chemical group 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 125000003636 chemical group Chemical group 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 238000011533 pre-incubation Methods 0.000 description 7
- 108010029020 prolylglycine Proteins 0.000 description 7
- 230000003068 static effect Effects 0.000 description 7
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 6
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 6
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 6
- 102000014914 Carrier Proteins Human genes 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 6
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- 241000589499 Thermus thermophilus Species 0.000 description 6
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 6
- 125000003277 amino group Chemical group 0.000 description 6
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 6
- 239000012472 biological sample Substances 0.000 description 6
- 239000008366 buffered solution Substances 0.000 description 6
- 229940104302 cytosine Drugs 0.000 description 6
- 230000005611 electricity Effects 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 239000004005 microsphere Substances 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- 108700004896 tripeptide FEG Proteins 0.000 description 6
- 239000004971 Cross linker Substances 0.000 description 5
- 241000701959 Escherichia virus Lambda Species 0.000 description 5
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 5
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 5
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 5
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 5
- 241000187480 Mycobacterium smegmatis Species 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- 208000031481 Pathologic Constriction Diseases 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 108091008324 binding proteins Proteins 0.000 description 5
- 235000012000 cholesterol Nutrition 0.000 description 5
- 239000003431 cross linking reagent Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 229910052751 metal Inorganic materials 0.000 description 5
- 239000002184 metal Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 4
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 4
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 4
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 4
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 4
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 4
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 4
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 239000012491 analyte Substances 0.000 description 4
- 239000007864 aqueous solution Substances 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000007831 electrophysiology Effects 0.000 description 4
- 238000002001 electrophysiology Methods 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 102220289580 rs33916541 Human genes 0.000 description 4
- 102220094762 rs876659915 Human genes 0.000 description 4
- 239000007790 solid phase Substances 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 3
- 108091006112 ATPases Proteins 0.000 description 3
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 3
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 3
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 3
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 3
- 102220594474 Annexin-2 receptor_L88T_mutation Human genes 0.000 description 3
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 3
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 3
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 3
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 3
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 3
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 150000008574 D-amino acids Chemical class 0.000 description 3
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 3
- 239000001116 FEMA 4028 Substances 0.000 description 3
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 3
- JLCYOCDGIUZMKQ-JBACZVJFSA-N Glu-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N JLCYOCDGIUZMKQ-JBACZVJFSA-N 0.000 description 3
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 3
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 3
- 108091093094 Glycol nucleic acid Proteins 0.000 description 3
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 3
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 3
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 3
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 3
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 3
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 3
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 3
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 3
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 3
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 3
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 3
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 3
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 3
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 3
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 229960004853 betadex Drugs 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 238000010382 chemical cross-linking Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 3
- 235000013928 guanylic acid Nutrition 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 230000009257 reactivity Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 239000002356 single layer Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 230000036262 stenosis Effects 0.000 description 3
- 208000037804 stenosis Diseases 0.000 description 3
- 230000002966 stenotic effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- UKGJZDSUJSPAJL-YPUOHESYSA-N (e)-n-[(1r)-1-[3,5-difluoro-4-(methanesulfonamido)phenyl]ethyl]-3-[2-propyl-6-(trifluoromethyl)pyridin-3-yl]prop-2-enamide Chemical compound CCCC1=NC(C(F)(F)F)=CC=C1\C=C\C(=O)N[C@H](C)C1=CC(F)=C(NS(C)(=O)=O)C(F)=C1 UKGJZDSUJSPAJL-YPUOHESYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical group Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-FOEKBKJKSA-N 3654-96-4 Chemical compound C[35S]CC[C@H](N)C(O)=O FFEARJCKVFRZRR-FOEKBKJKSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- 102220505792 ADP-ribosylation factor-binding protein GGA3_N91A_mutation Human genes 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 2
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 2
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 2
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 2
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 2
- 241000701844 Bacillus virus phi29 Species 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 2
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 description 2
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 2
- 101100458289 Drosophila melanogaster msps gene Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102220505067 Eukaryotic translation initiation factor 3 subunit B_I89Y_mutation Human genes 0.000 description 2
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 2
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 2
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 2
- QFJPFPCSXOXMKI-BPUTZDHNSA-N Gln-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N QFJPFPCSXOXMKI-BPUTZDHNSA-N 0.000 description 2
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 2
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 2
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 2
- JPUNZXVHHRZMNL-XIRDDKMYSA-N Glu-Pro-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JPUNZXVHHRZMNL-XIRDDKMYSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 2
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 2
- 108010014594 Heterogeneous Nuclear Ribonucleoprotein A1 Proteins 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 2
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 2
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- BSJCSHIAMSGQGN-BVSLBCMMSA-N Phe-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O BSJCSHIAMSGQGN-BVSLBCMMSA-N 0.000 description 2
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 2
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 2
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 2
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- BZDVTEPMYMHZCR-JGVFFNPUSA-N [(2s,5r)-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)CC1 BZDVTEPMYMHZCR-JGVFFNPUSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 239000000823 artificial membrane Substances 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001588 bifunctional effect Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 102220359631 c.277G>A Human genes 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- JQXXHWHPUNPDRT-YOPQJBRCSA-N chembl1332716 Chemical compound O([C@](C1=O)(C)O\C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)/C=C\C=C(C)/C(=O)NC=2C(O)=C3C(O)=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CCN(C)CC1 JQXXHWHPUNPDRT-YOPQJBRCSA-N 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- ZOOGRGPOEVQQDX-KHLHZJAASA-N cyclic guanosine monophosphate Chemical compound C([C@H]1O2)O[P@](O)(=O)O[C@@H]1[C@H](O)[C@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-KHLHZJAASA-N 0.000 description 2
- 229940097362 cyclodextrins Drugs 0.000 description 2
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 2
- CIKGWCTVFSRMJU-KVQBGUIXSA-N dGDP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 CIKGWCTVFSRMJU-KVQBGUIXSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- JSRLJPSBLDHEIO-SHYZEUOFSA-N dUMP Chemical compound O1[C@H](COP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 JSRLJPSBLDHEIO-SHYZEUOFSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 229910021389 graphene Inorganic materials 0.000 description 2
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 230000037427 ion transport Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 108010077055 methylated bovine serum albumin Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 150000003904 phospholipids Chemical class 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 229960001225 rifampicin Drugs 0.000 description 2
- 102200160490 rs1800299 Human genes 0.000 description 2
- 102220008913 rs33960103 Human genes 0.000 description 2
- 102200037598 rs749038326 Human genes 0.000 description 2
- 102200037599 rs749038326 Human genes 0.000 description 2
- 102220137179 rs755230402 Human genes 0.000 description 2
- 102220156356 rs886046630 Human genes 0.000 description 2
- 239000012266 salt solution Substances 0.000 description 2
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 229920001059 synthetic polymer Polymers 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000013638 trimer Substances 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- JWDFQMWEFLOOED-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 3-(pyridin-2-yldisulfanyl)propanoate Chemical compound O=C1CCC(=O)N1OC(=O)CCSSC1=CC=CC=N1 JWDFQMWEFLOOED-UHFFFAOYSA-N 0.000 description 1
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 1
- UKDDQGWMHWQMBI-UHFFFAOYSA-O 1,2-diphytanoyl-sn-glycero-3-phosphocholine Chemical compound CC(C)CCCC(C)CCCC(C)CCCC(C)CC(=O)OCC(COP(O)(=O)OCC[N+](C)(C)C)OC(=O)CC(C)CCCC(C)CCCC(C)CCCC(C)C UKDDQGWMHWQMBI-UHFFFAOYSA-O 0.000 description 1
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- DJQYYYCQOZMCRC-UHFFFAOYSA-N 2-aminopropane-1,3-dithiol Chemical group SCC(N)CS DJQYYYCQOZMCRC-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 125000004105 2-pyridyl group Chemical group N1=C([*])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 1
- 102220511175 APC membrane recruitment protein 1_T95V_mutation Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229910018072 Al 2 O 3 Inorganic materials 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- IXTPACPAXIOCRG-ACZMJKKPSA-N Ala-Glu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N IXTPACPAXIOCRG-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- VGMNWQOPSFBBBG-XUXIUFHCSA-N Ala-Leu-Leu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VGMNWQOPSFBBBG-XUXIUFHCSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- 102220539911 Alkaline phosphatase, placental type_I89L_mutation Human genes 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 1
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 1
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 1
- NXVGBGZQQFDUTM-XVYDVKMFSA-N Asn-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N NXVGBGZQQFDUTM-XVYDVKMFSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 1
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- 102220484866 C-type lectin domain family 4 member A_W21A_mutation Human genes 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 102220548139 Calpain-2 catalytic subunit_D22E_mutation Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102220583911 Cellular tumor antigen p53_P98S_mutation Human genes 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 1
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 1
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102220563226 DALR anticodon-binding domain-containing protein 3_N91L_mutation Human genes 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 229920004943 Delrin® Polymers 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- 101000875449 Escherichia phage lambda Exonuclease Proteins 0.000 description 1
- 101100226347 Escherichia phage lambda exo gene Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000237858 Gastropoda Species 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- ZXGLLNZQSBLQLT-SRVKXCTJSA-N Gln-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZXGLLNZQSBLQLT-SRVKXCTJSA-N 0.000 description 1
- GQTNWYFWSUFFRA-KKUMJFAQSA-N Gln-Met-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GQTNWYFWSUFFRA-KKUMJFAQSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 1
- 102220468647 HLA class II histocompatibility antigen, DP beta 1 chain_I94N_mutation Human genes 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 1
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- 108091036060 Linker DNA Proteins 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- ZAWOJFFMBANLGE-CIUDSAMLSA-N Lys-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N ZAWOJFFMBANLGE-CIUDSAMLSA-N 0.000 description 1
- KSFQPRLZAUXXPT-GARJFASQSA-N Lys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)C(=O)O KSFQPRLZAUXXPT-GARJFASQSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- UFOWQBYMUILSRK-IHRRRGAJSA-N Met-Lys-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 UFOWQBYMUILSRK-IHRRRGAJSA-N 0.000 description 1
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 1
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 1
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 1
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 1
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 1
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- 241000045365 Microporus <basidiomycete fungus> Species 0.000 description 1
- 229910000792 Monel Inorganic materials 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- OHLUUHNLEMFGTQ-UHFFFAOYSA-N N-methylacetamide Chemical compound CNC(C)=O OHLUUHNLEMFGTQ-UHFFFAOYSA-N 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- JNRFYJZCMHHGMH-UBHSHLNASA-N Phe-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JNRFYJZCMHHGMH-UBHSHLNASA-N 0.000 description 1
- MQWISMJKHOUEMW-ULQDDVLXSA-N Phe-Arg-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 MQWISMJKHOUEMW-ULQDDVLXSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 1
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 1
- NHHZWPNMYQUNEH-ACRUOGEOSA-N Phe-Tyr-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N NHHZWPNMYQUNEH-ACRUOGEOSA-N 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- XZGWNSIRZIUHHP-SRVKXCTJSA-N Pro-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 XZGWNSIRZIUHHP-SRVKXCTJSA-N 0.000 description 1
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 102220553310 Proenkephalin-A_T83N_mutation Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102220637688 Ras-related protein Rab-33A_D91G_mutation Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- JJUNLJTUIKFPRF-BPUTZDHNSA-N Ser-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N JJUNLJTUIKFPRF-BPUTZDHNSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 102220528872 Serum amyloid A-4 protein_A96D_mutation Human genes 0.000 description 1
- 229910004298 SiO 2 Inorganic materials 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 229910021607 Silver chloride Inorganic materials 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- IGWHDMPTQKSDTL-JXOAFFINSA-N TMP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IGWHDMPTQKSDTL-JXOAFFINSA-N 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 102220504166 Testis-specific XK-related protein, Y-linked 2_N93A_mutation Human genes 0.000 description 1
- 102220504158 Testis-specific XK-related protein, Y-linked 2_N93S_mutation Human genes 0.000 description 1
- 102220504181 Testis-specific XK-related protein, Y-linked 2_N93T_mutation Human genes 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 1
- PEYSVKMXSLPQRU-FJHTZYQYSA-N Trp-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PEYSVKMXSLPQRU-FJHTZYQYSA-N 0.000 description 1
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 1
- RYXOUTORDIUWNI-BPUTZDHNSA-N Trp-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RYXOUTORDIUWNI-BPUTZDHNSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- ZJKZLNAECPIUTL-JBACZVJFSA-N Trp-Gln-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ZJKZLNAECPIUTL-JBACZVJFSA-N 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- NESIQDDPEFTWAH-BPUTZDHNSA-N Trp-Met-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O NESIQDDPEFTWAH-BPUTZDHNSA-N 0.000 description 1
- GQEXFCQNAJHJTI-IHPCNDPISA-N Trp-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GQEXFCQNAJHJTI-IHPCNDPISA-N 0.000 description 1
- VUMCLPHXCBIJJB-PMVMPFDFSA-N Trp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N VUMCLPHXCBIJJB-PMVMPFDFSA-N 0.000 description 1
- IVBJBFSWJDNQFW-XIRDDKMYSA-N Trp-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IVBJBFSWJDNQFW-XIRDDKMYSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- ITUAVBRBGKVBLH-BVSLBCMMSA-N Trp-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ITUAVBRBGKVBLH-BVSLBCMMSA-N 0.000 description 1
- UIRVSEPRMWDVEW-RNXOBYDBSA-N Trp-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N UIRVSEPRMWDVEW-RNXOBYDBSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 1
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 1
- YTUABZMPYKCWCQ-XQQFMLRXSA-N Val-His-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N YTUABZMPYKCWCQ-XQQFMLRXSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 229910001514 alkali metal chloride Inorganic materials 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000000211 autoradiogram Methods 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 210000003323 beak Anatomy 0.000 description 1
- 235000011175 beta-cyclodextrine Nutrition 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000008364 bulk solution Substances 0.000 description 1
- 102220350046 c.242G>A Human genes 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 150000003841 chloride salts Chemical class 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- KHWCHTKSEGGWEX-UHFFFAOYSA-N deoxyadenylic acid Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(O)=O)O1 KHWCHTKSEGGWEX-UHFFFAOYSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- CEIPQQODRKXDSB-UHFFFAOYSA-N ethyl 3-(6-hydroxynaphthalen-2-yl)-1H-indazole-5-carboximidate dihydrochloride Chemical compound Cl.Cl.C1=C(O)C=CC2=CC(C3=NNC4=CC=C(C=C43)C(=N)OCC)=CC=C21 CEIPQQODRKXDSB-UHFFFAOYSA-N 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- GDSRMADSINPKSL-HSEONFRVSA-N gamma-cyclodextrin Chemical compound OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO GDSRMADSINPKSL-HSEONFRVSA-N 0.000 description 1
- 229940080345 gamma-cyclodextrin Drugs 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 125000002795 guanidino group Chemical group C(N)(=N)N* 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 229920000592 inorganic polymer Polymers 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 239000000138 intercalating agent Substances 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 239000004570 mortar (masonry) Substances 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 230000000065 osmolyte Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- LFGREXWGYUGZLY-UHFFFAOYSA-N phosphoryl Chemical group [P]=O LFGREXWGYUGZLY-UHFFFAOYSA-N 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 238000009832 plasma treatment Methods 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 1
- 239000004810 polytetrafluoroethylene Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 101150056906 recJ gene Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000005932 reductive alkylation reaction Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 102200005671 rs1013940 Human genes 0.000 description 1
- 102220004802 rs104894468 Human genes 0.000 description 1
- 102200087432 rs104894685 Human genes 0.000 description 1
- 102220198221 rs1057519921 Human genes 0.000 description 1
- 102220010983 rs138272051 Human genes 0.000 description 1
- 102220278254 rs1554096653 Human genes 0.000 description 1
- 102220282584 rs1555593696 Human genes 0.000 description 1
- 102220113946 rs201190593 Human genes 0.000 description 1
- 102200067340 rs2272938 Human genes 0.000 description 1
- 102200083368 rs28903085 Human genes 0.000 description 1
- 102220036433 rs35389822 Human genes 0.000 description 1
- 102220023118 rs387907555 Human genes 0.000 description 1
- 102200076325 rs5658 Human genes 0.000 description 1
- 102220112195 rs72807847 Human genes 0.000 description 1
- 102220287474 rs730881901 Human genes 0.000 description 1
- 102220188881 rs747642461 Human genes 0.000 description 1
- 102220215689 rs767146349 Human genes 0.000 description 1
- 102200037607 rs771019366 Human genes 0.000 description 1
- 102220202916 rs775400768 Human genes 0.000 description 1
- 102220328285 rs786201383 Human genes 0.000 description 1
- 102220075256 rs796052433 Human genes 0.000 description 1
- 102220067296 rs797044668 Human genes 0.000 description 1
- 102220018884 rs80358525 Human genes 0.000 description 1
- 102220083144 rs863224688 Human genes 0.000 description 1
- 102220158369 rs886047453 Human genes 0.000 description 1
- 102220188872 rs886053704 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 101150072534 sbcB gene Proteins 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 229920002379 silicone rubber Polymers 0.000 description 1
- 239000004945 silicone rubber Substances 0.000 description 1
- HKZLPVFGJNLROG-UHFFFAOYSA-M silver monochloride Chemical compound [Cl-].[Ag+] HKZLPVFGJNLROG-UHFFFAOYSA-M 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000035892 strand transfer Effects 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 150000003573 thiols Chemical group 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 101150097442 xthA gene Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/35—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Mycobacteriaceae (F)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/04—Mycobacterium, e.g. Mycobacterium tuberculosis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/101—DNA polymerase
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Mycology (AREA)
- Veterinary Medicine (AREA)
- Communicable Diseases (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pulmonology (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 Msp의 돌연변이체 형태에 관한 것이다. 본 발명은 또한 Msp를 사용한 핵산의 특징 규명에 관한 것이다.
Description
본 발명은 Msp의 돌연변이체 형태에 관한 것이다. 본 발명은 또한 Msp를 사용한 핵산의 특징 규명에 관한 것이다.
나노세공 감지란 피분석물 분자와 수용체 사이의 개별적인 결합 이벤트에 대한 관찰 결과에 의존하는 감지 접근법이다. 나노세공 센서는 절연막에 나노미터 크기의 단일 세공을 설치하고, 피분석물 분자의 존재하에 세공을 통한 전압-구동식 이온 수송을 측정함으로써 형성될 수 있다. 피분석물의 정체는 그의 독특한 전류 신호, 특히, 전류 블록의 지속 기간 및 정도, 및 전류 수준의 변동을 통해 밝혀진다.
현재 넓은 범위에 걸쳐 적용되는 신속하고 저렴한 핵산 (예컨대 DNA 또는 RNA) 서열분석 기술이 요구되고 있다. 현 기술은 대개 다량의 핵산을 제조하고, 신호 검출을 위한 고품질의 전문 형광성 화학 물질이 필요하기 때문에 속도가 느리고, 비용이 많이 든다. 나노세공 감지는 필요한 뉴클레오티드와 시약의 정량을 감소시킴으로써 신속하고 저렴한 핵산 서열분석을 제공할 수 있는 잠재능을 가진다.
나노세공 감지를 사용하여 핵산을 서열분석하는 데 필수적인 구성 요소 중 2가지는 (1) 세공을 통과하는 핵산 이동 조절, 및 (2) 핵산 중합체가 세공을 통해 이동함에 따른 뉴클레오티드의 판별이다. 과거에는 뉴클레오티드를 판별하기 위해 핵산을 헤몰리신의 돌변변이체를 통해 통과시켰다. 이는 서열 의존성인 것으로 보인 전류 신호를 제공하였다. 또한 다수의 뉴클레오티드가 관찰되는 전류 결과에 기여하며, 이를 통해 관찰되는 전류 결과와 핵산 서열 도전 과제 사이의 직접적인 관계가 형성되는 것으로 나타났다.
뉴클레오티드 판별을 위한 전류 범위는 헤몰리신 세공의 돌연변이를 통해 개선되기는 하였지만, 뉴클레오티드 사이의 전류차가 추가로 개선될 수만 있다면, 서열분석 시스템의 성능은 더욱 높아지게 될 것이다. 추가로, 핵산이 세공을 통해 이동할 때, 일부 전류 상태는 높은 변동을 보인 것으로 관찰되었다. 또한, 일부 돌연변이체 헤몰리신 세공은 다른 것보다도 더 높은 변동을 보인다. 이러한 상태의 변동은 서열 특이 정보를 포함할 수 있지만, 시스템을 단순화시키기 위해서는 변동이 낮은 세공이 바람직할 수 있다. 또한, 관찰되는 전류 결과에 기여하는 뉴클레오티드의 개수를 축소시키는 것이 바람직할 수 있다.
다른 형태의 Msp로는 미코박테리움 스메그마티스(Mycobacterium smegmatis)로부터의 세공이다. MspA는 미코박테리움 스메그마티스로부터 유래된 157 kDa의 팔량체 포린이다. MspA의 구조는 연구원들에 의해 문서로 잘 기록되어 있다 (문헌 [Gundlach, Proc Natl Acad Sci U S A. 2010 Sep 14; 107(37): 16060-5. Epub 2010 Aug 26]). 일부 중요한 잔기가 확인되었으며, 이는 세공의 특성을 증진시키기 위해 변형되었다. 이같은 돌연변이화는 DNA가 MspA 세공을 통해 천이될 수 있도록 하기 위해 수행될 수 있다. MspB, C 및 D 또한 Msp의 공지된 형태이다.
본 발명의 개요
본 발명자들은 놀랍게도 Msp의 신규한 돌연변이체가 예컨대 핵산의 서열과 같은 특징을 예측할 수 있는 개선된 특성을 보인다는 것을 입증하였다. 돌연변이체는 놀랍게도 개선된 뉴클레오티드 판별을 보인다. 특히, 돌연변이체는 놀랍게도 증가된 전류 범위 (이로써 상이한 뉴클레오티드들 간의 판별은 더욱 쉬워진다), 및 감소된 상태 변동 (이로써 신호 대 노이즈 비는 증가한다)을 보인다. 추가로, 핵산이 세공을 통해 이동함에 따른 전류에 기여하는 뉴클레오티드의 개수는 감소하게 된다. 이로써, 핵산이 세공을 통해 이동함에 따라 관찰되는 전류 결과와 핵산 서열 사이의 직접적인 관계를 더욱 쉽게 확인할 수 있다.
본 발명자들은 또한 놀랍게도 세공을 통한 핵산 이동이 Phi29 DNA 폴리머라제에 의해 조절될 때 Msp가 개선된 서열분석 특성을 보인다는 것도 밝혀냈다. 특히, Msp와 Phi29 DNA 폴리머라제의 커플링을 통해 3가지 예상치 못했던 이점을 얻게 되었다. 첫번째로, 상업적으로 실행 가능한 속도로의 세공을 통한 핵산 이동으로 또한 효과적인 서열분석이 가능해진다. 두번째로, 세공을 통해 핵산이 이동함에 따라 전류 범위가 증가하는 것이 관찰되며, 이로써 서열은 보다 쉽게 측정될 수 있다. 세번째로, 전류 변동은 감소하는 것이 관찰되며, 이로써 신호 대 노이즈 비는 증가하게 된다.
따라서, 본 발명은 서열 번호 2에 제시된 서열의 변이체를 포함하며, 여기서 변이체는 하기 돌연변이 중 하나 이상의 돌연변이를 포함하는 것인, 돌연변이체 Msp 단량체를 제공한다:
(a) 88번 위치의 아스파라긴 (N), 세린 (S), 글루타민 (Q) 또는 트레오닌 (T);
(b) 90번 위치의 세린 (S), 글루타민 (Q) 또는 티로신 (Y);
(c) 105번 위치의 류신 (L) 또는 세린 (S);
(d) 126번 위치의 아르기닌 (R);
(e) 75번 위치의 세린 (S);
(f) 77번 위치의 세린 (S);
(g) 59번 위치의 아르기닌 (R);
(h) 75번 위치의 글루타민 (Q), 아스파라긴 (N) 또는 트레오닌 (T);
(i) 77번 위치의 글루타민 (Q), 아스파라긴 (N) 또는 트레오닌 (T);
(j) 78번 위치의 류신 (L);
(k) 81번 위치의 아스파라긴 (N);
(l) 83번 위치의 아스파라긴 (N);
(m) 86번 위치의 세린 (S) 또는 트레오닌 (T);
(n) 87번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(o) 88번 위치의 티로신 (Y), 페닐알라닌 (F), 발린 (V), 아르기닌 (R), 알라닌 (A), 글리신 (G) 또는 시스테인 (C);
(p) 89번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(q) 90번 위치의 류신 (L), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 트레오닌 (T), 글리신 (G), 알라닌 (A), 발린 (V), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(r) 91번 위치의 세린 (S), 글루타민 (Q), 류신 (L), 메티오닌 (M), 이소류신 (I), 알라닌 (A), 발린 (V), 글리신 (G), 페닐알라닌 (F), 트립토판 (W), 티로신 (Y), 히스티딘 (H), 트레오닌 (T), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(s) 92번 위치의 알라닌 (A) 또는 세린 (S);
(t) 93번 위치의 세린 (S), 알라닌 (A), 트레오닌 (T), 글리신 (G);
(u) 94번 위치의 류신 (L);
(v) 95번 위치의 발린 (V);
(w) 96번 위치의 아르기닌 (R), 아스파르트산 (D), 발린 (V), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T);
(x) 97번 위치의 세린 (S);
(y) 98번 위치의 세린 (S);
(z) 99번 위치의 세린 (S);
(aa) 100번 위치의 세린 (S);
(bb) 101번 위치의 페닐알라닌 (F);
(cc) 102번 위치의 리신 (K), 세린 (S) 또는 트레오닌 (T);
(dd) 103번 위치의 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 글리신 (G) 또는 트레오닌 (T);
(ee) 104번 위치의 이소류신;
(ff) 105번 위치의 티로신 (Y), 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 트레오닌 (T), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 글리신 (G), 발린 (V), 아르기닌 (R), 리신 (K), 프롤린 (P), 또는 시스테인 (C);
(gg) 106번 위치의 페닐알라닌 (F), 이소류신 (I), 발린 (V) 또는 세린 (S);
(hh) 108번 위치의 프롤린 (P) 또는 세린 (S);
(ii) 118번 위치의 아스파라긴 (N);
(jj) 103번 위치의 세린 (S) 또는 시스테인 (C); 및
(kk) 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치 중 하나 이상의 위치의 시스테인.
본 발명은 또한
- Msp로부터 유래된 2개 이상의 공유적으로 부착된 단량체를 포함하는 구축물;
- 본 발명의 돌연변이체 또는 본 발명의 구축물을 코딩하는 폴리뉴클레오티드;
- 본 발명의 동일한 돌연변이체 단량체를 포함하는, Msp로부터 유래된 동종올리고머 세공;
- 본 발명의 1개 이상의 돌연변이체 단량체를 포함하며, 여기서 8개의 단량체 중 1개 이상은 나머지 다른 단량체와 상이한 것인, Msp로부터 유래된 이종올리고머 세공;
- (a) 표적 서열을 본 발명의 세공 및 핵산 결합 단백질과 접촉시켜, 상기 단백질이 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계; 및 (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 표적 서열의 특징을 규명하는 단계를 포함하는, 표적 핵산 서열의 특징을 규명하는 방법;
- (a) 본 발명의 세공 및 (b) 핵산 처리 효소를 포함하는, 표적 핵산 서열의 서열분석을 위한 키트;
- (a) 다수의 본 발명의 세공 및 (b) 다수의 핵산 처리 효소를 포함하는, 샘플 중의 표적 핵산 서열의 서열분석을 위한 장치;
- (a) 표적 서열을 Msp로부터 유래된 세공 및 Phi29 DNA 폴리머라제와 접촉시켜, 상기 폴리머라제가 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계; 및 (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 표적 서열의 특징을 규명하는 단계를 포함하며, 여기서 단계 (a) 및 (b)는 세공을 가로질러 적용되는 전압을 사용하여 수행되는 것인, 표적 핵산 서열의 특징을 규명하는 방법;
- (a) 표적 핵산 서열의 존재하에서 Msp로부터 유래된 세공을 Phi29 DNA 폴리머라제와 접촉시키는 단계; 및 (b) 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 표적 핵산 서열의 특징 규명을 위한 센서를 형성하는 단계를 포함하는, 표적 핵산 서열의 특징 규명을 위한 센서를 형성하는 방법;
- (a) 핵산 서열의 존재하에서 Phi29 DNA 폴리머라제를 Msp로부터 유래된 세공과 접촉시키는 단계; 및 (b) 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 단계를 포함하는, Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 방법;
- (a) Msp로부터 유래된 세공 및 (b) Phi29 DNA 폴리머라제를 포함하는, 표적 핵산 서열의 특징 규명을 위한 키트; 및
- 다수의 Msp로부터 유래된 세공 및 다수의 Phi29 DNA 폴리머라제를 포함하는, 샘플 중의 표적 핵산 서열의 특징 규명을 위한 장치
를 제공한다.
도 1은 단일 DNA 가닥이 나노세공을 전좌함에 따른 개별 전류 수준의 평균 체류 시간을 나타낸 것이다. 데이터를 다수의 단일 분자로부터 수집하고, 전류 수준에 의해 사분위수로 나누었다.
도 2는 MS-(NNNRRK)8 나노세공을 통해 DNA 가닥 (서열 번호 15)을 이동시키는 언지핑(unzipping) 모드의, Phi29 사용으로부터 얻은 전류 수준 및 변동을 보여주는 것이다.
도 3은 HL-(돌연변이체)7 나노세공을 통해 DNA 가닥 (서열 번호 15)을 이동시키는 언지핑 모드의, Phi29 사용으로부터 얻은 전류 수준 및 변동을 보여주는 것이다.
도 4는 (-200 mV 내지 200 mV인) 적용 전위 범위에서 기록된 단일의 MspA 채널에 대한 전류 수준을 보여주는 것이다.
도 5는 기준 MspA 돌연변이체인 MS-(B1)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 6은 MspA 돌연변이체인 MS-(B1-I105Y)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 7은 MspA 돌연변이체인 MS-(B1-I105N)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 8은 180 mV에서 MS-(B1-I105A)8 세공에 대한 고 전도도 상태 (275 pA) 및 저 전도도 상태 (150 pA) 사이의 전류 변화를 보여주는 것이다.
도 9는 DNA가 언지핑될 때, 기준 MS-(B1)8 세공을 통과시 생성되는 전류 수준을 보여주는 것이다. 이 이벤트에 대한 전류 범위는 ~30 pA이다.
도 10은 DNA가 언지핑될 때, 기준 MS-(B1-I105A)8 세공을 통과시 생성되는 전류 수준을 보여주는 것이다. 이 이벤트에 대한 전류 범위는 ~40 pA이다.
도 11은 실시예 9 및 12 및 15에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 12는 실시예 10 및 11에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 13은 MspA 단량체 서열에서 점 돌연변이화가 이루어질 때, 같은 DNA 서열에 대하여 서열분석 프로파일이 어떻게 변화하는지를 보여주는 것이다. 이러한 플롯은 다중 폴리뉴클레오티드로부터 수득된 수준의 프로파일의 평균을 보여주는 것이다. A) 이 그래프는 MS-(B1)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. B) 이 그래프는 MS-(B1-D90Q-D93S-I105A)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. C) 이 그래프는 MS-(B1-D90Q-Q126R)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. D) 이 그래프는 MS-(B1-L88N-D90Q-D91M)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. E) 이 그래프는 MS-(B1-L88N-D90Q-D91S)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. F) 이 그래프는 MS-(B1-G75S-G77S-L88N-Q126R)8 세공에 대한 서열분석 프로파일을 보여주는 것이다.
도 14는 실시예 13에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 15는 Phi29 DNA 폴리머라제에 의해 매개되는, MspA 돌연변이체 세공 MS-(B1)8을 통과하는 RNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 16은 지질 이중층 내로의 세공 삽입을 보여주는 것이다. A)는 단량체로부터 올리고머화된 MS-(B1)8의 세공 삽입을 보여주는 것이다. B)는 이량체로부터 올리고머화된 MS-(B1-B1)4의 세공 삽입을 보여주는 것이다.
도 17은 헬리카제에 의해 매개되는, 단량체의 올리고머화에 의해 제조된 MS-(B1)8 돌연변이체 세공을 통과하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 18은 헬리카제에 의해 매개되는, 이량체의 올리고머화에 의해 제조된 MS-(B1-B1)4 돌연변이체 세공을 통과하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 19는 실시예 16에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 20은 헬리카제에 의해 매개되는, MS-(B1-L88N)8 돌연변이체 세공을 통과하는 시토신 및 5-메틸시토신 둘 모두를 포함하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
서열 목록에 대한 설명
서열 번호 1은 NNN-RRK 돌연변이체 MspA 단량체를 코딩하는 폴리뉴클레오티드 서열을 보여준다.
서열 번호 2 (이는 "B1"로도 지칭된다)는 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체의 아미노산 서열을 보여준다. 돌연변이체에는 신호 서열 및 (출발 코돈으로 코딩되는) 아미노 말단 메티오닌이 결여되어 있고, 하기 돌연변이를 포함한다: D90N, D91N, D93N, D118R, D134R 및 E139K. 이들 돌연변이에 의해 MspA 세공을 통한 DNA 전이가 가능해진다.
서열 번호 3은 Phi29 DNA 폴리머라제를 코딩하는 폴리뉴클레오티드 서열을 보여준다.
서열 번호 4는 Phi29 DNA 폴리머라제의 아미노산 서열을 보여준다.
서열 번호 5는 E. 콜라이(E. coli)로부터의 sbcB 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 E. 콜라이로부터의 엑소뉴클레아제 I 효소 (EcoExo I)를 코딩한다.
서열 번호 6은 E. 콜라이로부터의 엑소뉴클레아제 I 효소 (EcoExo I)의 아미노산 서열을 보여준다.
서열 번호 7은 E. 콜라이로부터의 xthA 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 E. 콜라이로부터의 엑소뉴클레아제 III 효소를 코딩한다.
서열 번호 8은 E. 콜라이로부터의 엑소뉴클레아제 III 효소의 아미노산 서열을 보여준다. 이 효소는 이중 가닥 DNA (dsDNA)의 한 가닥으로부터 3'-5' 방향으로 5' 모노포스페이트 뉴클레오시드의 분배성 분해를 수행한다. 가닥 상에서 효소 개시를 위해서는 대략 4개 정도의 뉴클레오티드로 이루어진 5' 오버행이 필요하다.
서열 번호 9는 T. 써모필루스(T. thermophilus)로부터의 recJ 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 T. 써모필루스로부터의 RecJ 효소 (TthRecJ-cd)를 코딩한다.
서열 번호 10은 T. 써모필루스로부터의 RecJ 효소 (TthRecJ-cd)의 아미노산 서열을 보여준다. 이 효소는 ssDNA으로부터 5'-3' 방향으로 5' 모노포스페이트 뉴클레오시드의 진행성 분해를 수행한다. 가닥 상에서 효소 개시를 위해서는 4개 이상의 뉴클레오티드가 필요하다.
서열 번호 11은 박테리오파지 람다 exo (redX) 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 박테리오파지 람다 엑소뉴클레아제를 코딩한다.
서열 번호 12는 박테리오파지 람다 엑소뉴클레아제의 아미노산 서열을 보여준다. 서열은 삼량체로 조립되는 3개의 동일한 서브유닛 중 하나이다. 효소는 dsDNA으로부터 5'-3' 방향으로 뉴클레오티드의 고도로 진행성인 분해를 수행한다 (http://www.neb.com/nebecomm/products/productM0262.asp). 가닥 상에서 효소 개시를 위해서는 우선적으로 5' 포스페이트를 가진 대략 4개 정도의 뉴클레오티드로 이루어진 5' 오버행이 필요하다.
서열 번호 13 내지 15는 실시예 2에서 사용된 서열을 보여준다.
서열 번호 16 내지 18은 각각 성숙한 형태의 MspB, C 및 D 돌연변이체의 아미노산 서열을 보여준다. 성숙한 형태에는 신호 서열이 결여되어 있다.
서열 번호 19 및 20은 실시예 9, 12 및 15에서 사용된 서열을 보여준다.
서열 번호 21 내지 23은 실시예 10 및 11에서 사용된 서열을 보여준다.
서열 번호 24 내지 27은 실시예 13에서 사용된 서열을 보여준다.
서열 번호 28은 실시예 14에서 사용된 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체인 이량체의 DNA 서열을 보여준다.
서열 번호 29는 실시예 14에서 사용된 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체인 이량체의 단백질 서열을 보여준다.
서열 번호 30, 31 및 32는 실시예 16에서 사용된 서열을 보여준다.
서열 번호 33은 서열 번호 29에서 제시된 구축물에서 사용되는 제시되는 링커 서열을 보여준다.
도 2는 MS-(NNNRRK)8 나노세공을 통해 DNA 가닥 (서열 번호 15)을 이동시키는 언지핑(unzipping) 모드의, Phi29 사용으로부터 얻은 전류 수준 및 변동을 보여주는 것이다.
도 3은 HL-(돌연변이체)7 나노세공을 통해 DNA 가닥 (서열 번호 15)을 이동시키는 언지핑 모드의, Phi29 사용으로부터 얻은 전류 수준 및 변동을 보여주는 것이다.
도 4는 (-200 mV 내지 200 mV인) 적용 전위 범위에서 기록된 단일의 MspA 채널에 대한 전류 수준을 보여주는 것이다.
도 5는 기준 MspA 돌연변이체인 MS-(B1)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 6은 MspA 돌연변이체인 MS-(B1-I105Y)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 7은 MspA 돌연변이체인 MS-(B1-I105N)8에 대한 개방 세공 수준의 IV 곡선을 보여주는 것이다. 각각의 선은 단일 세공을 나타낸다.
도 8은 180 mV에서 MS-(B1-I105A)8 세공에 대한 고 전도도 상태 (275 pA) 및 저 전도도 상태 (150 pA) 사이의 전류 변화를 보여주는 것이다.
도 9는 DNA가 언지핑될 때, 기준 MS-(B1)8 세공을 통과시 생성되는 전류 수준을 보여주는 것이다. 이 이벤트에 대한 전류 범위는 ~30 pA이다.
도 10은 DNA가 언지핑될 때, 기준 MS-(B1-I105A)8 세공을 통과시 생성되는 전류 수준을 보여주는 것이다. 이 이벤트에 대한 전류 범위는 ~40 pA이다.
도 11은 실시예 9 및 12 및 15에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 12는 실시예 10 및 11에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 13은 MspA 단량체 서열에서 점 돌연변이화가 이루어질 때, 같은 DNA 서열에 대하여 서열분석 프로파일이 어떻게 변화하는지를 보여주는 것이다. 이러한 플롯은 다중 폴리뉴클레오티드로부터 수득된 수준의 프로파일의 평균을 보여주는 것이다. A) 이 그래프는 MS-(B1)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. B) 이 그래프는 MS-(B1-D90Q-D93S-I105A)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. C) 이 그래프는 MS-(B1-D90Q-Q126R)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. D) 이 그래프는 MS-(B1-L88N-D90Q-D91M)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. E) 이 그래프는 MS-(B1-L88N-D90Q-D91S)8 세공에 대한 서열분석 프로파일을 보여주는 것이다. F) 이 그래프는 MS-(B1-G75S-G77S-L88N-Q126R)8 세공에 대한 서열분석 프로파일을 보여주는 것이다.
도 14는 실시예 13에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 15는 Phi29 DNA 폴리머라제에 의해 매개되는, MspA 돌연변이체 세공 MS-(B1)8을 통과하는 RNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 16은 지질 이중층 내로의 세공 삽입을 보여주는 것이다. A)는 단량체로부터 올리고머화된 MS-(B1)8의 세공 삽입을 보여주는 것이다. B)는 이량체로부터 올리고머화된 MS-(B1-B1)4의 세공 삽입을 보여주는 것이다.
도 17은 헬리카제에 의해 매개되는, 단량체의 올리고머화에 의해 제조된 MS-(B1)8 돌연변이체 세공을 통과하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 18은 헬리카제에 의해 매개되는, 이량체의 올리고머화에 의해 제조된 MS-(B1-B1)4 돌연변이체 세공을 통과하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
도 19는 실시예 16에서 사용된 DNA 기질 디자인을 보여주는 것이다.
도 20은 헬리카제에 의해 매개되는, MS-(B1-L88N)8 돌연변이체 세공을 통과하는 시토신 및 5-메틸시토신 둘 모두를 포함하는 DNA의 조절형 전좌에 대한 예시적인 이벤트 자취를 보여주는 것이다. 상부 자취에서 강조 표시된 부분의 확대도는 하기는 제시되어 있다.
서열 목록에 대한 설명
서열 번호 1은 NNN-RRK 돌연변이체 MspA 단량체를 코딩하는 폴리뉴클레오티드 서열을 보여준다.
서열 번호 2 (이는 "B1"로도 지칭된다)는 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체의 아미노산 서열을 보여준다. 돌연변이체에는 신호 서열 및 (출발 코돈으로 코딩되는) 아미노 말단 메티오닌이 결여되어 있고, 하기 돌연변이를 포함한다: D90N, D91N, D93N, D118R, D134R 및 E139K. 이들 돌연변이에 의해 MspA 세공을 통한 DNA 전이가 가능해진다.
서열 번호 3은 Phi29 DNA 폴리머라제를 코딩하는 폴리뉴클레오티드 서열을 보여준다.
서열 번호 4는 Phi29 DNA 폴리머라제의 아미노산 서열을 보여준다.
서열 번호 5는 E. 콜라이(E. coli)로부터의 sbcB 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 E. 콜라이로부터의 엑소뉴클레아제 I 효소 (EcoExo I)를 코딩한다.
서열 번호 6은 E. 콜라이로부터의 엑소뉴클레아제 I 효소 (EcoExo I)의 아미노산 서열을 보여준다.
서열 번호 7은 E. 콜라이로부터의 xthA 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 E. 콜라이로부터의 엑소뉴클레아제 III 효소를 코딩한다.
서열 번호 8은 E. 콜라이로부터의 엑소뉴클레아제 III 효소의 아미노산 서열을 보여준다. 이 효소는 이중 가닥 DNA (dsDNA)의 한 가닥으로부터 3'-5' 방향으로 5' 모노포스페이트 뉴클레오시드의 분배성 분해를 수행한다. 가닥 상에서 효소 개시를 위해서는 대략 4개 정도의 뉴클레오티드로 이루어진 5' 오버행이 필요하다.
서열 번호 9는 T. 써모필루스(T. thermophilus)로부터의 recJ 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 T. 써모필루스로부터의 RecJ 효소 (TthRecJ-cd)를 코딩한다.
서열 번호 10은 T. 써모필루스로부터의 RecJ 효소 (TthRecJ-cd)의 아미노산 서열을 보여준다. 이 효소는 ssDNA으로부터 5'-3' 방향으로 5' 모노포스페이트 뉴클레오시드의 진행성 분해를 수행한다. 가닥 상에서 효소 개시를 위해서는 4개 이상의 뉴클레오티드가 필요하다.
서열 번호 11은 박테리오파지 람다 exo (redX) 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오티드 서열을 보여준다. 이는 박테리오파지 람다 엑소뉴클레아제를 코딩한다.
서열 번호 12는 박테리오파지 람다 엑소뉴클레아제의 아미노산 서열을 보여준다. 서열은 삼량체로 조립되는 3개의 동일한 서브유닛 중 하나이다. 효소는 dsDNA으로부터 5'-3' 방향으로 뉴클레오티드의 고도로 진행성인 분해를 수행한다 (http://www.neb.com/nebecomm/products/productM0262.asp). 가닥 상에서 효소 개시를 위해서는 우선적으로 5' 포스페이트를 가진 대략 4개 정도의 뉴클레오티드로 이루어진 5' 오버행이 필요하다.
서열 번호 13 내지 15는 실시예 2에서 사용된 서열을 보여준다.
서열 번호 16 내지 18은 각각 성숙한 형태의 MspB, C 및 D 돌연변이체의 아미노산 서열을 보여준다. 성숙한 형태에는 신호 서열이 결여되어 있다.
서열 번호 19 및 20은 실시예 9, 12 및 15에서 사용된 서열을 보여준다.
서열 번호 21 내지 23은 실시예 10 및 11에서 사용된 서열을 보여준다.
서열 번호 24 내지 27은 실시예 13에서 사용된 서열을 보여준다.
서열 번호 28은 실시예 14에서 사용된 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체인 이량체의 DNA 서열을 보여준다.
서열 번호 29는 실시예 14에서 사용된 MspA 단량체의 성숙한 형태의 NNN-RRK 돌연변이체인 이량체의 단백질 서열을 보여준다.
서열 번호 30, 31 및 32는 실시예 16에서 사용된 서열을 보여준다.
서열 번호 33은 서열 번호 29에서 제시된 구축물에서 사용되는 제시되는 링커 서열을 보여준다.
개시된 생성물 및 방법의 상이한 적용은 당업계에서의 구체적인 요구에 맞게 맞춤화될 수 있다는 것을 이해하여야 한다. 본원에서 사용되는 용어는 단지 본 발명의 특정 실시양태를 기술하기 위한 목적의 것이며, 제한하고자 하는 것이 아니라는 것 또한 이해하여야 한다.
추가로, 본 명세서 및 첨부된 특허청구범위에서 사용되는 바와 같이, 단수 형태 "하나"("a", "an") 및 "그"라는 것은 달리 문맥상 명확하게 명시되지 않는 한, 다수의 지시 대상을 포함한다. 따라서, 예를 들어, "한 돌연변이체"라고 언급하는 것은 "돌연변이체들"을 포함하고, "한 치환"이라고 언급하는 것은 2개 이상의 상기 치환들을 포함하며, "한 세공"이라고 언급하는 것은 2개 이상의 상기 세공들을 포함하고, "한 핵산 서열"이라고 언급하는 것은 2개 이상의 상기 서열들을 포함하는 등의 예를 들 수 있다.
상기 또는 하기에서 본원에서 인용된 모든 공개 문헌, 특허 및 특허 출원은 그의 전문이 본원에서 참고로 포함된다.
돌연변이체
Msp
단량체
본 발명은 돌연변이체 Msp 단량체를 제공한다. 돌연변이체 Msp 단량체는 본 발명의 세공을 형성하는 데 사용될 수 있다. 돌연변이체 Msp 단량체는, 그의 서열이 야생형 Msp 단량체의 것으로부터 변이되고, 세공을 형성할 수 있는 능력을 보유하는 단량체이다. 세공을 형성할 수 있는 돌연변이체 단량체의 능력을 확인하는 방법은 당업계에 주지되어 있고, 하기에서 더 상세하게 논의된다.
돌연변이체 단량체는 개선된 뉴클레오티드 판독 특성을 가지며, 즉, 개선된 뉴클레오티드 포획 및 판별을 보인다. 특히, 돌연변이체 단량체로부터 구축된 세공은 야생형보다 더욱 쉽게 뉴클레오티드 및 핵산을 포획한다. 추가로, 돌연변이체 단량체로부터 구축된 세공은 증가된 전류 범위 (이로써 상이한 뉴클레오티드들 간의 판별은 더욱 쉬워진다), 및 감소된 상태 변동 (이로써 신호 대 노이즈 비는 증가한다)을 보인다. 추가로, 핵산이 돌연변이체로부터 구축된 세공을 통해 이동함에 따른 전류에 기여하는 뉴클레오티드의 개수를 감소하게 된다. 이로써, 핵산이 세공을 통해 이동함에 따라 관찰되는 전류 결과와 핵산 서열 사이의 직접적인 관계를 더욱 쉽게 확인할 수 있다. 돌연변이체의 개선된 뉴클레오티드 판독 특성은 5가지 주요 기전을 통해, 즉,
· 입체구조적 변화 (아미노산 잔기의 크기를 증가 또는 축소);
· 전하의 변화 (예컨대 핵산 서열과 상호작용하는 +ve 전하 도입);
· 수소 결합의 변화 (예컨대 염기쌍에 수소 결합할 수 있는 아미노산 도입);
· 파이 스태킹(pi stacking) 변화 (예컨대 비국소화된 전자 파이계를 통해 상호작용하는 아미노산 도입); 및/또는
· 세공의 구조 변경의 변화 (예컨대 전정부 및/또는 협착부의 크기를 증가시키는 아미노산 도입)에 의해 달성된다.
상기 5가지 기전 중 임의의 하나 이상의 것이 본 발명의 세공의 개선된 특성의 원인이 될 수 있다. 예를 들어, 본 발명의 세공은 변경된 입체구조, 변경된 수소 결합 및 변경된 구조의 결과로서 개선된 뉴클레오티드 판독 특성을 보일 수 있다.
벌키 잔기, 예컨대 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H)의 도입으로 세공의 입체구조는 증가하게 된다. 또한, 방향족 잔기, 예컨대 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H)의 도입으로 세공의 파이 스태킹은 증가하게 된다. 또한, 벌키 또는 방향족 잔기의 도입으로 예를 들어, 세공을 펼치고, 전정부 및/또는 협착부의 크기를 증가시킴으로써 세공 구조는 증가하게 된다. 이하는 하기에서 더욱 상세하게 기술된다.
본 발명의 돌연변이체 단량체는 서열 번호 2에 제시된 서열에 변이체를 포함한다. 서열 번호 2는 MspA 단량체의 NNN-RRK 돌연변이체이다. 이는 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다. 서열 번호 2의 변이체는 서열 번호 2의 것으로부터 변이되고, 세공을 형성할 수 있는 그의 능력을 보유하는 아미노산 서열을 가지는 폴리펩티드이다.
변이체는 하기 돌연변이 중 하나 이상의 돌연변이를 포함한다:
(a) 88번 위치의 아스파라긴 (N), 세린 (S), 글루타민 (Q) 또는 트레오닌 (T);
(b) 90번 위치의 세린 (S), 글루타민 (Q) 또는 티로신 (Y);
(c) 105번 위치의 류신 (L) 또는 세린 (S);
(d) 126번 위치의 아르기닌 (R);
(e) 75번 위치의 세린 (S);
(f) 77번 위치의 세린 (S);
(g) 59번 위치의 아르기닌 (R);
(h) 75번 위치의 글루타민 (Q), 아스파라긴 (N) 또는 트레오닌 (T);
(i) 77번 위치의 글루타민 (Q), 아스파라긴 (N) 또는 트레오닌 (T);
(j) 78번 위치의 류신 (L);
(k) 81번 위치의 아스파라긴 (N);
(l) 83번 위치의 아스파라긴 (N);
(m) 86번 위치의 세린 (S) 또는 트레오닌 (T);
(n) 87번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(o) 88번 위치의 티로신 (Y), 페닐알라닌 (F), 발린 (V), 아르기닌 (R), 알라닌 (A), 글리신 (G) 또는 시스테인 (C);
(p) 89번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(q) 90번 위치의 류신 (L), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 트레오닌 (T), 글리신 (G), 알라닌 (A), 발린 (V), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(r) 91번 위치의 세린 (S), 글루타민 (Q), 류신 (L), 메티오닌 (M), 이소류신 (I), 알라닌 (A), 발린 (V), 글리신 (G), 페닐알라닌 (F), 트립토판 (W), 티로신 (Y), 히스티딘 (H), 트레오닌 (T), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(s) 92번 위치의 알라닌 (A) 또는 세린 (S);
(t) 93번 위치의 세린 (S), 알라닌 (A), 트레오닌 (T), 글리신 (G);
(u) 94번 위치의 류신 (L);
(v) 95번 위치의 발린 (V);
(w) 96번 위치의 아르기닌 (R), 아스파르트산 (D), 발린 (V), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T);
(x) 97번 위치의 세린 (S);
(y) 98번 위치의 세린 (S);
(z) 99번 위치의 세린 (S);
(aa) 100번 위치의 세린 (S);
(bb) 101번 위치의 페닐알라닌 (F);
(cc) 102번 위치의 리신 (K), 세린 (S) 또는 트레오닌 (T);
(dd) 103번 위치의 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 글리신 (G) 또는 트레오닌 (T);
(ee) 104번 위치의 이소류신;
(ff) 105번 위치의 티로신 (Y), 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 트레오닌 (T), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 글리신 (G), 발린 (V), 아르기닌 (R), 리신 (K), 프롤린 (P), 또는 시스테인 (C);
(gg) 106번 위치의 페닐알라닌 (F), 이소류신 (I), 발린 (V) 또는 세린 (S);
(hh) 108번 위치의 프롤린 (P) 또는 세린 (S);
(ii) 118번 위치의 아스파라긴 (N);
(jj) 103번 위치의 세린 (S) 또는 시스테인 (C); 및
(kk) 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치 중 하나 이상의 위치의 시스테인.
야생형 MspA에서, 각 단량체의 잔기 88 및 105는 세공의 내부 협착부에서 소수성 고리를 형성한다. L88 및 I105 위치의 소수성 잔기는 세공의 주요 협착부 바로 위에 있으며, 수성 채널쪽으로 향해 있다. 이 잔기를 돌연변이화시키면, 기준 (서열 번호 2)에 비해 유의적으로 더 높은 개방 세공 전류를 가진 세공이 형성된다. 상기 위치에서 돌연변이화시켰을 때 관찰되는 전류차는 단일 돌연변이화시켰을 때에 기대되는 것보다도 유의적으로 더 높다. 이러한 놀라운 결과는 상기 위치에서의 돌연변이는 단지 상기 잔기에서의 국소 환경보다는 채널 구조에 영향을 미치질 수 있다는 것을 암시한다. 비록 서열 번호 2인 기준이 광범위한 세공 전도도를 보인다고 보고된 바 있기는 하지만, 상기에 대한 이유로 인해 잘 이해되고 있지 않다. L88 및 I105 위치에서 돌연변이화하면, 기준 세공보다 유의적으로 더 높은 지배적인 세공 전류 수준을 얻게 된다. 추가로, 이러한 더 높은 전도도 상태는 돌연변이체의 지배적인 입체구조이며, 큰 전류 범위 및 증가된 신호 대 노이즈에 대해서 바람직할 수 있다.
88번 위치의 N, S, Q 또는 T 도입 (즉, 상기 (a) 돌연변이)은 핵산에서 뉴클레오티드에 수소 결합할 수 있는 아미노산을 세공의 내부 협착부 내로 도입한다.
각 단량체의 잔기 90 및 91 또한 세공의 내부 협착부의 일부를 형성한다. 각 단량체의 잔기 118은 세공의 전정부 내부에 존재한다. 각 단량체의 잔기 134는 세공으로의 입구의 일부이다.
90번 위치의 S, Q 또는 Y 도입 (즉, 상기 (b) 돌연변이)은 핵산에서 뉴클레오티드에 수소 결합할 수 있는 아미노산을 세공의 내부 협착부 내로 도입한다.
변이체는 임의의 개수의 돌연변이 (a) 내지 (kk), 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 돌연변이를 포함할 수 있다. 바람직한 돌연변이 조합은 하기에서 논의된다. 변이체 내로 도입되는 아미노산은 천연적으로 발생된 또는 비-천연적으로 발생된 그의 유도체일 수 있다. 변이체 내로 도입되는 아미노산은 D-아미노산일 수 있다.
임의의 개수의 시스테인이 변이체 내로 도입될 수 있다. 90, 91 및 103번 위치 중 하나 이상, 예컨대 2개의 위치에 또는 모든 위치에 시스테인이 도입되는 것이 바람직하다. 하기에서 더욱 상세하게 논의되는 바와 같이, 상기 위치는 분자 어댑터(adaptor)의 화학적 부착에 유용할 수 있다. 임의의 개수의 시스테인, 예컨대 2, 3, 4, 5, 6개 이상의 시스테인이 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치에 도입될 수 있다. 상기 위치는 세공의 비-보존적 루프 영역에 존재하며, 따라서, 하기에서 더욱 상세하게 논의되는 바와 같이, 세공에의 핵산 결합 단백질의 화학적 부착에 유용하다.
바람직한 실시양태에서, 변이체는 하기 (A) 내지 (Z)에 제시되어 있는 치환 중 하나 이상의 치환을 포함한다. 변이체는 임의의 개수, 예컨대 1, 2, 3, 4 또는 5개의 A 내지 Z의 치환을 포함할 수 있다.
(A) (i) 75번 위치의 세린 (S), (ii) 77번 위치의 세린 (S), (iii) 88번 위치의 아스파라긴 (N), (iv) 90번 위치의 글루타민 (Q) 및 (v) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2, 3, 4 또는 5개 포함할 수 있다. 각 단량체에 4개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.
(B) (i) 90번 위치의 글루타민 (Q) 및 (ii) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.
(C) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2, 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.
(D) (i) 88번 위치의 세린 (S) 및 (ii) 90번 위치의 글루타민 (Q) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.
(E) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 90번 위치의 글루타민 (Q) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 3에 제시되어 있다.
(F) (i) 90번 위치의 글루타민 (Q) 및 (ii) 105번 위치의 알라닌 (A) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(G) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(H) (i) 88번 위치의 트레오닌 (T) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(I) (i) 87번 위치의 글루타민 (Q) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(J) (i) 89번 위치의 티로신 (Y) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(K) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 89번 위치의 페닐알라닌 (F) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(L) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 89번 위치의 티로신 (Y) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(M) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 알라닌 (A) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(N) (i) 90번 위치의 세린 (S) 및 (ii) 94번 위치의 아스파라긴 (N) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(O) (i) 90번 위치의 세린 (S) 및 (ii) 104번 위치의 이소류신 (I) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(P) (i) 88번 위치의 아스파르트산 (D) 및 (ii) 105번 위치의 리신 (K) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(Q) (i) 88번 위치의 아스파라긴 (N) 및 (ii) 126번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1 또는 2개 포함할 수 있다. 각 단량체에 두 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(R) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 91번 위치의 아르기닌 (R) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(S) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 91번 위치의 세린 (S) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(T) (i) 88번 위치의 아스파라긴 (N), (ii) 90번 위치의 글루타민 (Q) 및 (iii) 105번 위치의 발린 (V) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(U) (i) 90번 위치의 글루타민 (Q), (ii) 93번 위치의 세린 (S) 및 (iii) 105번 위치의 알라닌 (A) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 각 단량체에 3개의 치환 모두를 포함하는 동종-팔량체 세공이 가지는 장점은 하기 표 2에 제시되어 있다.
(V) (i) 90번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H), (ii) 91번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H) 및 (iii) 105번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 이들 벌키, 방향족 잔기의 도입으로 세공의 전정부 및/또는 협착부에서 파이 스태킹 및 입체구조는 증가한다. 또한 전정부 및/또는 협착부 크기도 증가한다 (즉, 세공은 열린다).
(W) (i) 90번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V), (ii) 91번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V) 및 (iii) 105번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V) 중 하나 이상의 도입. 변이체는 이들 치환을 1, 2 또는 3개 포함할 수 있다. 더 작은 잔기를 도입하게 되면 세공의 전정부 및/또는 협착부의 입체구조는 축소된다.
(X) 90번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H) 및/또는 91번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H)의 도입. 양으로 하전된 잔기 (R, K 또는 H)를 도입하게 되면, 세공의 협착부와 핵산 서열 사이의 상호작용은 증가하게 된다.
(Y) 90번 위치의 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 91번 위치의 히스티딘 (H) 및/또는 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 히스티딘 (H)의 도입. 상기 잔기를 도입하면, 세공의 협착부와 핵산 서열 사이에 발생되는 수소 결합은 증가하게 된다. 또한, 전정부 및/또는 협착부 크기도 증가한다 (즉, 세공은 열린다).
(Z) 90, 91 및 103번 위치 중 하나 이상의 위치의 시스테인 도입. 이러한 도입으로 화학기는 시스테인 연결부를 통해 세공에 부착될 수 있다. 이에 대해서는 상기 및 하기에서 더욱 상세하게 논의된다.
바람직한 변이체로는 하기 치환(들) 중 하나 이상의 치환을 포함하는 변이체를 포함하나, 이에 한정되지 않는다: L88N; L88S; L88Q; L88T; D90S; D90Q; D90Y; I105L; I105S; Q126R; G75S; G77S; G75S, G77S, L88N 및 Q126R; G75S, G77S, L88N, D90Q 및 Q126R; D90Q 및 Q126R; L88N, D90Q 및 Q126R; L88S 및 D90Q; L88N 및 D90Q; E59R; G75Q; G75N; G75S; G75T; G77Q; G77N; G77S; G77T; I78L; S81N; T83N; N86S; N86T; I87F; I87V; I87L; L88N; L88S; L88Y; L88F; L88V; L88Q; L88T; I89F; I89V; I89L; N90S; N90Q; N90L; N90Y; N91S; N91Q; N91L; N91M; N91I; N91A; N91V; N91G; G92A; G92S; N93S; N93A; N93T; I94L; T95V; A96R; A96D; A96V; A96N; A96S; A96T; P97S; P98S; F99S; G100S; L101F; N102K; N102S; N102T; S103A; S103Q; S103N; S103G; S103T; V104I; I105Y; I105L; I105A; I105Q; I105N; I105S; I105T; T106F; T106I; T106V; T106S; N108P; N108S; D90Q 및 I105A; D90S 및 G92S; L88T 및 D90S; I87Q 및 D90S; I89Y 및 D90S; L88N 및 I89F; L88N 및 I89Y; D90S 및 G92A; D90S 및 I94N; D90S 및 V104I; L88D 및 I105K; L88N 및 Q126R; L88N, D90Q 및 D91R; L88N, D90Q 및 D91S; L88N, D90Q 및 I105V; D90Q, D93S 및 I105A; N91Y; N90Y 및 N91G; N90G 및 N91Y; N90G 및 N91G; I05G; N90R; N91R; N90R 및 N91R; N90K; N91K; N90K 및 N91K; N90Q 및 N91G; N90G 및 N91Q; N90Q 및 N91Q; R118N; N91C; N90C; N90W; N91W; N90K; N91K; N90R; N91R; N90S 및 N91S; N90Y 및 I105A; N90G 및 I105A; N90Q 및 I105A; N90S 및 I105A; L88A 및 I105A; L88S 및 I105S; L88N 및 I105N; N90G 및 N93G; N90G; N93G; N90G 및 N91A; I105K; I105R; I105V; I105P; I105W; L88R; L88A; L88G; L88N; N90R 및 I105A; N90S 및 I105A; L88A 및 I105A; L88S 및 I105S; L88N 및 I105N; L88C; S103C; 및 I105C.
특히 바람직한 변이체는 I105N을 포함한다. I105N을 포함하는, 돌연변이체 단량체로부터 구축된 세공은 대략 80%만큼 증가된 잔류 전류를 가진다. 상이한 뉴클레오티드와 관련하여 전류 변화 또한 증가한다. 이는 I105N을 포함하는, 돌연변이체 단량체로부터 구축된 세공의 구조 변화를 반영한다. 그러므로, 상기 세공은 뉴클레오티드를 판별할 수 있는 개선된 능력을 가진다.
바람직한 단일 돌연변이체 및 동종-팔량체 세공에서 사용되었을 때의 그의 장점은 하기 표 1에 제시되어 있다.
바람직한 다중돌연변이체 및 동종-팔량체 세공에서 사용되었을 때의 그의 장점은 하기 표 2에 제시되어 있다.
가장 바람직한 돌연변이체 및 동종-팔량체 세공에서 사용되었을 때의 그의 장점은 하기 표 3에 제시되어 있다.
상기 논의된 구체적인 돌연변이 이외에도, 변이체는 다른 돌연변이를 포함할 수 있다. 변이체는 서열 번호 2의 전장의 아미노산 서열 전체에 걸쳐 바람직하게는 아미노산 동일성 기준으로 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게, 변이체는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 2의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 100개 이상, 예를 들어, 125, 150, 175 또는 200개 이상의 연속된 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 아미노산이 동일할 수 있다 ("강력한 상동성(hard homology)").
상동성을 측정하는 데 당업계의 표준이 사용될 수 있다. 예를 들어, UWGCG 패키지는 예를 들어, 그의 디폴트 환경 설정에서 사용되는 상동성을 계산할 수 있는 BESTFIT 프로그램을 제공한다 (문헌 [Devereux et al (1984) Nucleic Acids Research 12, p387-395]). PILEUP 및 BLAST 알고리즘은 예를 들어, 문헌 [Altschul S. F. (1993) J Mol Evol 36:290-300]; [Altschul, S.F et al (1990) J Mol Biol 215:403-10]에 기술되어 있는 바와 같이, 상동성을 계산하거나, 또는 서열을 정렬하는 데 (예컨대 (전형적으로 그의 디폴트 환경 설정에서) 등가 잔기 또는 상응하는 서열을 확인하는 데) 사용될 수 있다.
BLAST 분석을 실행하기 위한 소프트웨어는 미국 국립 생물 기술 정보 센터(National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/)를 통해 공개적으로 이용가능하다. 상기 알고리즘은 먼저, 데이터베이스 서열 중 길이가 같은 워드와 함께 정렬되었을 때, 매치되거나 또는 일부 양의 값 임계값 스코어 T를 충족시키는, 질의 서열 중의 길이가 W인 짧은 워드를 확인함으로써 높은 스코어링 서열쌍 (HSP)을 확인하는 것을 포함한다. T는 이웃 워드 스코어 임계값으로서 의미되어 진다 (문헌 [Altschul et al, 상기 문헌 동일]). 이들 초기 이웃 워드 히트는 이를 포함하는 HSP를 찾아내기 위해 검색을 개시하기 위한 시드로서의 역할을 한다. 워드 히트는 정렬 누적 점수가 증가할 수 있을 때까지 각 서열을 따라 양 방향으로 연장된다. 워드 히트의 각 방향으로의 연장은, 정렬 누적 점수가 그의 최대 달성값으로부터 정량 X만큼 감소하였을 때; 하나 이상의 음성 스코어링 잔기 정렬의 누적으로 인하여 누적 점수가 0 이하로 하락하였을 때; 또는 각 서열 말단에 도달하였을 때에 중단된다. BLAST 알고리즘 파라미터 W, T 및 X가 정렬 감도 및 속도를 결정짓는다. BLAST 프로그램은 디폴트로서 워드 길이 (W)=11, BLOSUM62 스코어링 매트릭스 (문헌 [Henikoff and Henikoff (1992) Proc . Natl . Acad . Sci . USA 89: 10915-10919] 참조) 정렬 (B)=50, 기대치 (E)=10, M=5, N=4, 및 양 가닥 비교를 사용하였다.
BLAST 알고리즘은 두 서열 간의 유사성에 관한 통계학적 분석을 실행한다; 예컨대 문헌 [Karlin 및 Altschul (1993) Proc . Natl . Acad . Sci . USA 90: 5873-5787] 참조. BLAST 알고리즘이 제공하는 유사성에 관한 한 척도는 최소합 확률 (P(N))인데, 이는 두 아미노산 서열 간의 매칭이 우연히 일어날 수 있는 확률을 나타낸다. 예를 들어, 제1 서열을 제2 서열과 비교하였을 때, 최소합 확률이 약 1 미만일 경우, 바람직하게는 약 0.1 미만, 더욱 바람직하게는 약 0.01, 및 가장 바람직하게는 약 0.001 미만일 경우, 서열은 또 다른 서열과 유사한 것으로 간주된다.
서열 번호 2는 MspA 단량체의 NNN-RRK 돌연변이체이다. 변이체는 MspA와 비교하여 MspB, C 또는 D 단량체 중에 돌연변이 중 임의의 것을 포함할 수 있다. 성숙한 형태의 MspB, C 및 D는 서열 번호 16 내지 18에 제시되어 있다. 특히, 변이체는 MspB 중에 존재하는 하기 치환: A138P를 포함할 수 있다. 변이체는 MspC 중에 존재하는 하기 치환: A96G, N102E 및 A138P 중 하나 이상을 포함할 수 있다. 변이체는 MspD 중에 존재하는 하기 돌연변이: G1의 결실, L2V, E5Q, L8V, D13G, W21A, D22E, K47T, I49H, I68V, D91G, A96Q, N102D, S103T, V104I, S136K 및 G141A 중 하나 이상을 포함할 수 있다. 변이체는 Msp B, C 및 D로부터의 돌연변이 및 치환 중 하나 이상을 포함할 수 있다.
아미노산 치환은 상기 논의된 것 이외에도 서열 번호 2의 아미노산 서열에 대하여, 예를 들어, 최대 1, 2, 3, 4, 5, 10, 20 또는 30개까지 치환이 이루어질 수 있다. 보존적 치환은 아미노산을, 화학적 구조가 유사하거나, 화학적 특성이 유사하거나, 측쇄 부피가 유사한 다른 아미노산으로 치환하는 것이다. 도입되는 아미노산은 치환되는 아미노산과 유사한 극성, 친수성, 소수성, 염기도, 산도, 중성도 또는 전하를 가질 수 있다. 별법으로, 보존적 치환은 기존 방향족 또는 지방족 아미노산의 위치에 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변경은 당업계에 주지되어 있고, 이는 하기 표 4에 정의되어 있는 바와 같은 20종의 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 가지는 경우, 이는 하기 표 5의 아미노산 측쇄에 대한 소수성 등급을 참조함으로써 결정될 수 있다.
서열 번호 2의 아미노산 서열의 하나 이상의 아미노산 잔기가 추가로 상기 기술된 폴리펩티드로부터 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 까지의, 또는 그 이상의 잔기가 결실될 수 있다.
변이체는 서열 번호 2의 단편을 포함할 수 있다. 상기 단편은 세공 형성 활성을 보유한다. 단편의 길이는 50, 100, 150 또는 200개 이상의 아미노산 길이일 수 있다. 상기 단편은 본 발명의 세공을 제조하는 데 사용될 수 있다. 단편은 바람직하게 서열 번호 2의 세공 형성 도메인을 포함한다. 단편은 서열 번호 2의 잔기 88, 90, 91, 105, 118 및 134 중 하나를 포함하여야 한다. 전형적으로, 단편은 서열 번호 2의 잔기 88, 90, 91, 105, 118 및 134 모두를 포함한다.
별법으로 또는 추가적으로 하나 이상의 아미노산이 상기 기술된 폴리펩티드에 부가될 수 있다. 연장은 서열 번호 2의 아미노산 서열 또는 그의 폴리펩티드 변이체 또는 단편의 아미노 말단 또는 카르복시 말단에서 제공될 수 있다. 연장 길이는 예를 들어, 1 내지 10개의 아미노산 길이 정도로 매우 짧을 수 있다. 별법으로, 연장은 예를 들어, 최대 50 또는 100개 이하의 아미노산 정도로 보다 장쇄일 수 있다. 캐리어 단백질이 본 발명의 아미노산 서열에 융합될 수 있다. 다른 융합 단백질은 하기에서 더욱 상세하게 논의된다. 변이체는 서열 번호 2의 아미노 말단에 메티오닌을 가질 수 있다.
상기에서 논의된 바와 같이, 변이체는 서열 번호 2의 것으로부터 변이되고, 세공을 형성할 수 있는 그의 능력을 보유하는 아미노산 서열을 가지는 폴리펩티드이다. 변이체는 전형적으로 세공 형성을 담당하는 서열 번호 2의 영역을 포함한다. β-베럴 구조를 포함하는 Msp의 세공 형성 능력은 각 서브유닛에서 β-시트형 구조로 제공된다. 서열 번호 2의 변이체는 전형적으로 서열 번호 2에 β-시트형 구조를 형성하는 영역을 포함한다. 생성된 변이체가 세공을 형성할 수 있는 그의 능력을 보유하는 한, 서열 번호 2 중의 β-시트형 구조를 형성하는 영역에 대해 하나 이상의 변형이 이루어질 수 있다. 서열 번호 2의 변이체는 바람직하게 그의 α-헬릭스 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대 치환, 부가 또는 결실을 포함한다.
돌연변이체 단량체는 그의 확인 또는 정제를 도울 수 있도록, 예를 들어, 히스티딘 잔기 (his 태그), 아스파르트산 잔기 (asp 태그), 스트렙트아비딘 태그 또는 플래그 태그의 부가에 의해, 또는 폴리펩티드가 천연적으로 신호 서열을 함유하지 않는 세포로부터의 그의 분비 촉진을 위한 신호 서열의 부가에 의해 변형될 수 있다. 유전자 태그를 도입하는 것에 대한 대안은 세공 상의 본래의 또는 조작된 위치에 있는 태그를 화학적으로 반응시키는 것이다. 이것의 예는 세공의 바깥쪽 상에서 조작된 시스테인에 대한 겔-이동 시약을 반응시키는 것이 될 것이다. 이는 헤몰리신 이종-올리고머를 분리시키는 방법으로서 입증된 바 있다 (문헌 [Chem Biol. 1997 Jul;4(7):497-505]).
돌연변이체 단량체는 시현용 표지로 표지화될 수 있다. 시현용 표지는 세공이 검출될 수 있도록 하는 임의의 적합한 표지일 수 있다. 적합한 표지로는 형광성 분자, 방사성 동위 원소, 예컨대 125I, 35S, 효소, 항체, 항원, 폴리뉴클레오티드 및 리간드, 예컨대 비오틴을 포함하나, 이에 한정되지 않는다.
돌연변이체 단량체는 합성적으로 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 세공은 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 돌연변이체 단량체의 아미노산 서열은 비-천연적으로 발생된 아미노산을 포함하도록 또는 단량체의 안정성을 증가시키도록 변형될 수 있다. 돌연변이체 단량체가 합성 수단에 의해 제조되었을 때, 상기 아미노산은 제조되는 동안에 도입될 수 있다. 돌연변이체 단량체는 또한 합성적 또는 재조합 제조 이후에 변경될 수 있다.
돌연변이체 단량체는 또한 D-아미노산을 사용하여 제조될 수 있다. 예를 들어, 돌연변이체 단량체는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 상기 단백질 또는 펩티드를 제조하는 분야에 있어서 통상적인 것이다.
돌연변이체 단량체는 용이한 뉴클레오티드 판별을 위해 하나 이상의 특이적인 변형을 포함한다. 돌연변이체 단량체는 또한, 세공 형성을 간섭하지 않는 한, 다른 비-특이적인 변형도 포함할 수 있다. 다수의 비-특이적인 측쇄 변형이 당업계에 공지되어 있고, 그러한 변형은 돌연변이체 단량체의 측쇄에 대해 이루어질 수 있다. 상기 변형은 예를 들어, 알데히드와의 반응에 의한 아미노산의 환원적 알킬화에 이은, NaBH4에 의한 환원, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의한 아실화를 포함한다.
돌연변이체 단량체는 당업계에 공지된 표준 방법을 사용하여 제조될 수 있다. 돌연변이체 단량체를 코딩하는 폴리뉴클레오티드 서열은 당업계의 표준 방법을 사용하여 유도되고 복제될 수 있다. 상기 서열은 하기에서 더욱 상세하게 논의된다. 돌연변이체 단량체를 코딩하는 폴리뉴클레오티드 서열은 당업계의 표준 기법을 사용하여 박테리아 숙주 세포에서 발현될 수 있다. 돌연변이체 단량체는 재조합 발현 벡터로부터의 폴리펩티드의 계내 발현에 의해 세포에서 제조될 수 있다. 발현 벡터는 임의적으로 폴리펩티드의 발현을 제어하기 위해 유도가능한 프로모터를 보유한다.
돌연변이체 단량체는 임의의 단백질 액체 크로마토그래피 시스템에 의한 세공 제조 유기체로부터의 정제 이후에, 또는 하기 기술되는 바와 같은 재조합 발현 이후에 대규모로 제조될 수 있다. 전형적인 단백질 액체 크로마토그래피 시스템으로는 FPLC, AKTA 시스템, 바이오-캐드(Bio-Cad) 시스템, 바이오-래드 바이오로직(Bio-Rad BioLogic) 시스템 및 및 길슨(Gilson) HPLC 시스템을 포함한다. 이어서, 돌연변이체 단량체는 본 발명에 따른 용도를 위해 천연적으로 발생된 막 또는 인공막 내로 삽입될 수 있다. 세공을 막 내로 삽입하는 막은 하기에서 논의된다.
일부 실시양태에서, 돌연변이체 단량체는 화학적으로 변형된다. 돌연변이체 단량체는 임의의 방식으로 및 임의의 부위에서 화학적으로 변형될 수 있다. 돌연변이체 단량체는 바람직하게 분자의 하나 이상의 시스테인에의 부착 (시스테인 연결), 분자의 하나 이상의 리신에의 부착, 분자의 하나 이상의 비천연 아미노산에의 부착, 에피토프의 효소 변형 또는 말단의 변형에 의해 화학적으로 변형된다. 상기 변형을 수행하는 데 적합한 방법은 당업계에 주지되어 있다. 돌연변이체 단량체는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 단량체는 염료 또는 형광단의 부착에 의해 화학적으로 변형될 수 있다.
일부 실시양태에서, 돌연변이체 단량체는 상기 단량체를 포함하는 세공과 표적 뉴클레오티드 또는 표적 핵산 서열 사이의 상호작용을 촉진하는 분자 어댑터로 화학적으로 변형된다. 어댑터가 존재하면 세공과 뉴클레오티드 또는 핵산 서열의 주객 화학법이 개선되고, 이로써, 돌연변이체 단량체로부터 형성된 세공의 서열분석 능력이 개선된다. 주객 화학법의 원리는 당업계에 주지되어 있다. 어댑터는 세공과 뉴클레오티드 또는 핵산 서열과의 상호작용을 개선시키는 세공의 물리적 또는 화학적 특성에 영향을 미친다. 어댑터는 세공의 베럴 또는 채널의 전하를 변경시킬 수 있거나, 특이적으로 뉴클레오티드 또는 핵산 서열과 상호작용하거나, 그에 결합함으로써 세공과 그의 상호작용이 용이하게 이루어지게 할 수 있다.
분자 어댑터는 바람직하게 시클릭 분자, 시클로덱스트린, 하이브리드화할 수 있는 종, DNA 결합제 또는 인터킬레이터, 펩티드 또는 펩티드 유사체, 합성 중합체, 방향족 평면 분자, 양으로 하전된 소형 분자 또는 수소 결합이 가능한 소형 분자이다.
어댑터는 시클릭일 수 있다. 시클릭 어댑터는 바람직하게 세공과 동일한 대칭 구조이다. Msp가 전형적으로 중심축을 기준으로 그 둘레에 8개의 서브유닛을 가지는 바, 어댑터는 바람직하게 8중 대칭 구조이다. 이에 대해서는 하기에서 더욱 상세하게 논의한다.
어댑터는 전형적으로 주객 화학법을 통해 뉴클레오티드 또는 핵산 서열과 상호작용한다. 어댑터는 전형적으로 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있다. 어댑터는 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 하나 이상의 화학기는 바람직하게 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스의 힘(Van der Waal's forces), π-양이온 상호작용 및/또는 정전력에 의해 뉴클레오티드 또는 핵산 서열과 상호작용한다. 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있는 하나 이상의 화학기는 바람직하게 양으로 하전된. 뉴클레오티드 또는 핵산 서열과 상호작용할 수 있는 하나 이상의 화학기는 더욱 바람직하게는 아미노기를 포함한다. 아미노기는 제1급, 제2급 또는 제3급 탄소 원자에 부착될 수 있다. 어댑터는 더욱더 바람직하게는 아미노기 고리, 예컨대 6, 7, 8개의 아미노기로 이루어진 고리를 포함한다. 어댑터는 가장 바람직하게는 8개의 아미노기로 이루어진 고리를 포함한다. 양성자화된 아미노기로 이루어진 고리는 뉴클레오티드 또는 핵산 서열 중의 음으로 하전된 포스페이트기와 상호작용할 수 있다.
세공 내에 어댑터를 정확하게 배치하는 것은 어댑터와, 돌연변이체 단량체를 포함하는 세공 사이의 주객 화학법에 의해 용이하게 이루어질 수 있다. 어댑터는 바람직하게 세공 중의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 어댑터는 더욱 바람직하게는 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스의 힘, π-양이온 상호작용 및/또는 정전력을 통해 세공 중의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 세공 중의 하나 이상의 아미노산과 상호작용할 수 있는 화학기는 전형적으로 히드록실 또는 아민이다. 히드록실기는 제1급, 제2급 또는 제3급 탄소 원자에 부착될 수 있다. 히드록실기는 세공 중의 비하전된 아미노산과 수소 결합을 형성할 수 있다. 세공과 뉴클레오티드 또는 핵산 서열 사이의 상호작용이 용이하게 이루어지게 하는 임의의 어댑터가 사용될 수 있다.
적합한 어댑터로는 시클로덱스트린, 시클릭 펩티드 및 쿠커비투릴을 포함하나, 이에 한정되지 않는다. 어댑터는 바람직하게 시클로덱스트린 또는 그의 유도체이다. 시클로덱스트린 또는 그의 유도체는 문헌 [Eliseev, A. V., and Schneider, H-J. (1994) J. Am . Chem . Soc . 116, 6081-6088]에 개시된 것 중 임의의 것일 수 있다. 어댑터는 더욱 바람직하게는 헵타키스-6-아미노-β-시클로덱스트린 (am7-βCD), 6-모노데옥시-6-모노아미노-β-시클로덱스트린 (am1-βCD) 또는 헵타키스-(6-데옥시-6-구아니디노)-시클로덱스트린 (gu7-βCD)이다. gu7-βCD 중의 구아니디노기는 am7-βCD 중의 1급 아민보다 훨씬 더 높은 pKa를 가지며, 이로써 더 크게 양으로 하전되어 있다. 이러한 gu7-βCD 어댑터는 세공 중 뉴클레오티드의 체류 시간을 증가시키는 데, 측정된 잔류 전류의 정확도를 증가시키는 데 뿐만 아니라, 고온에서의 염기 검출률을 증가시키는 데, 또는 낮은 데이터 획득률을 증가시키는 데 사용될 수 있다.
하기에서 더욱 상세하게 논의되는 바와 같이, 숙신이미딜 3-(2-피리딜디티오)프로피오네이트 (SPDP) 가교제가 사용될 경우, 어댑터는 바람직하게 헵타키스(6-데옥시-6-아미노)-6-N-모노(2-피리딜)디티오프로파노일-β-시클로덱스트린 (am6amPDP1-βCD)이다.
더욱 적합한 어댑터로는 8개의 당 유닛을 포함하는 (그리고, 이로써 8중 대칭 구조를 가지는) γ-시클로덱스트린을 포함한다. γ-시클로덱스트린은 링커 분자를 포함할 수 있거나, 또는 상기에서 논의된 β-시클로덱스트린 예에서 사용된 변형된 당 유닛 모두 또는 그 이상을 포함하도록 변형될 수 있다.
분자 어댑터는 바람직하게 돌연변이체 단량체에 공유적으로 부착된다. 어댑터는 당업계에 공지된 임의의 방법을 사용하여 세공에 공유적으로 부착될 수 있다. 어댑터는 전형적으로 화학적 연결부를 통해 부착된다. 분자 어댑터가 시스테인 연결부를 통해 부착될 경우, 하나 이상의 시스테인은 바람직하게 치환에 의해 돌연변이체로 도입된다. 물론 본 발명의 돌연변이체 단량체는 88, 90, 91, 103 및 105번 위치 중 하나 이상의 위치에 시스테인 잔기를 포함할 수 있다. 돌연변이체 단량체는 하나 이상의, 예컨대 2, 3, 4 또는 5개의 상기 시스테인에의 분자 어댑터의 부착에 의해 화학적으로 변형될 수 있다. 별법으로, 돌연변이체 단량체는 다른 위치에 도입된 하나 이상의 시스테인에의 분자의 부착에 의해 화학적으로 변형될 수 있다. 분자 어댑터는 바람직하게 서열 번호 2의 90, 91 및 103번 위치 중 하나 이상의 위치에 부착된다.
시스테인 잔기의 반응성은 인접 잔기의 변형에 의해 증진될 수 있다. 예를 들어, 측면에 위치하는 아르기닌, 히스티딘 또는 리신 잔기의 염기성 기는 시스테인 티올기의 pKa를 반응성이 더 큰 S- 기의 것으로 변화시킬 것이다. 시스테인 잔기의 반응성은 티올 보호기, 예컨대 dTNB에 의해 보호될 수 있다. 이는 링커 부착 이전에 돌연변이체 단량체의 하나 이상의 시스테인 잔기와 함께 반응할 수 있다. 상기 분자는 돌연변이체 단량체에 직접 부착될 수 있다. 상기 분자는 바람직하게 링커, 예컨대 화학적 가교제 또는 펩티드 링커를 사용하여 돌연변이체 단량체에 부착된다.
적합한 화학적 가교제는 당업계에 주지되어 있다. 바람직한 가교제로는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디술파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디술파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디술파닐)옥타노에이트를 포함한다. 가장 바람직한 가교제는 숙신이미딜 3-(2-피리딜디티오)프로피오네이트 (SPDP)이다. 전형적으로, 분자는, 분자/가교제 복합체가 돌연변이체 단량체에 공유적으로 부착되기 이전에 이작용성 가교제에 공유적으로 부착되기도 하지만, 이작용성 가교제/단량체 복합체가 분자에 부착되기 이전에 이작용성 가교제가 단량체에 공유적으로 부착될 수도 있다.
링커는 바람직하게 디티오트레이톨 (DTT)에 대해 적합성을 띤다. 적합한 링커로는 요오도아세트아미드계 및 말레이미드계 링커를 포함하지만, 이에 한정되지 않는다.
다른 실시양태에서, 단량체는 핵산 결합 단백질에 부착될 수 있다. 이는 본 발명의 서열분석 방법에서 사용될 수 있는 모듈식 서열분석 시스템을 형성한다. 핵산 결합 단백질은 하기에서 논의한다.
핵산 결합 단백질은 바람직하게 돌연변이체 단량체에 공유적으로 부착된다. 단백질은 당업계에 공지된 임의의 방법을 사용하여 세공에 공유적으로 부착될 수 있다. 단량체 및 단백질은 화학적으로 융합되거나, 유전자적으로 융합될 수 있다. 전체 구축물이 단일 폴리뉴클레오티드 서열로부터 발현된다면, 단량체 및 단백질은 유전자적으로 융합된다. 세공의 핵산 결합 단백질에의 유전적 융합은 국제 출원 번호 PCT/GB09/001679 (공개 공보 WO 2010/004265)에서 논의된 바 있다.
핵산 결합 단백질이 시스테인 연결부를 통해 부착될 경우, 하나 이상의 시스테인은 바람직하게 치환에 의해 돌연변이체로 도입된다. 물론 본 발명의 돌연변이체 단량체는 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치 중 하나 이상의 위치에 시스테인 잔기를 포함할 수 있다. 상기 위치는 동족체 중 보존도가 낮은 루프 영역 중에 존재하는데, 이는 돌연변이 또는 삽입이 내성을 띨 수 있다는 것을 시사한다. 그러므로, 핵산 결합 단백질을 부착시키는 데 적합하다. 시스테인 잔기의 반응성은 상기 기술된 바와 같이 변형에 의해 증진될 수 있다.
핵산 결합 단백질은 돌연변이체 단량체에 직접 또는 하나 이상의 링커를 통해 부착될 수 있다. 분자는 국제 출원 번호 PCT/GB10/000132 (공개 공보 WO 2010/086602)에 기술된 하이브리드화 링커를 사용하여 돌연변이체 단량체에 부착될 수 있다. 별법으로, 펩티드 링커가 사용될 수 있다. 펩티드 링커는 아미노산 서열이다. 펩티드 링커의 길이, 가요성, 및 친수성은 전형적으로는 단량체 및 분자의 기능을 방해하지 않도록 디자인된다. 바람직한 가요성 펩티드 링커는 2 내지 20개, 예컨대 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산으로 이루어진 스트레치이다. 더욱 바람직한 가요성 링커로는 (SG)1, (SG)2, (SG)3, (SG)4, (SG)5 및 (SG)8 (여기서 S는 세린이고, G는 글리신이다)을 포함한다. 바람직한 강성 링커는 2 내지 30개, 예컨대 4, 6, 8, 16 또는 24개의 프롤린 아미노산으로 이루어진 스트레치이다. 더욱 바람직한 강성 링커는 (P)12 (여기서 P는 프롤린이다).
돌연변이체 단량체는 분자 어댑터 및 핵산 결합 단백질로 화학적으로 변형될 수 있다.
구축물
본 발명은 또한 Msp로부터 유래된 2개 이상의 공유적으로 부착된 단량체를 포함하는 구축물을 제공한다. 본 발명의 구축물은 세공을 형성할 수 있는 그의 능력을 보유한다. 본 발명의 하나 이상의 구축물은 핵산 서열의 특징을 규명하기 위해, 예컨대 그의 서열을 분석하기 위해 세공을 형성하는 데 사용될 수 있다. 구축물은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 단량체를 포함할 수 있다. 2개 이상의 단량체는 동일하거나, 상이할 수 있다.
단량체가 본 발명의 돌연변이체 단량체일 필요는 없다. 예를 들어, 1개 이상의 단량체는 서열 번호 2에 제시된 서열을 포함할 수 있다. 별법으로, 1개 이상의 단량체는 그의 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 2와 50% 이상 상동성이지만, 본 발명의 돌연변이체 단량체에 필요한 특이적인 돌연변이 중 어느 것도 포함하지 않는 서열 번호 2의 변이체를 포함할 수 있다. 더욱 바람직하게는, 변이체는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 2의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 바람직한 실시양태에서, 구축물 중 1개 이상의 단량체는 본 발명의 돌연변이체 단량체이다. 구축물 중의 단량체들은 모두 본 발명의 돌연변이체 단량체일 수 있다. 돌연변이체 단량체는 동일하거나, 상이할 수 있다. 더욱 바람직한 실시양태에서, 구축물은 2개의 단량체를 포함하고, 단량체 중 1개 이상은 본 발명의 돌연변이체 단량체이다.
단량체는 바람직하게 유전자적으로 융합된다. 전체 구축물이 단일 폴리뉴클레오티드 서열로부터 발현된다면, 단량체는 유전자적으로 융합된다. 단량체의 코딩 서열은 구축물을 코딩하는 단일 폴리뉴클레오티드 서열을 형성하는 임의의 방식으로 조합될 수 있다.
단량체는 임의의 배열로 유전자적으로 융합될 수 있다. 단량체는 그의 말단 아미노산을 통해 융합될 수 있다. 예를 들어, 한 단량체의 아미노산 말단은 또 다른 단량체의 카르복시 말단에 융합될 수 있다. 각각이 서열 번호 2에 제시된 서열 또는 변이체를 포함하는 것인 2개 이상의 단량체의 유전적 융합으로부터 구축물이 형성된 경우에는, (아미노에서 카르복시 방향으로) 구축물 중 두번째 및 후속 단량체는 그의 아미노 말단 단부 (이들 각각은 앞의 단량체의 카르복시 말단에 융합된다)에 메티오닌을 포함할 수 있다. 예를 들어, M이 서열 번호 2에 제시된 서열 또는 (아미노 말단 메티오닌을 포함하지 않는) 변이체를 포함하는 단량체이고, mM이 서열 번호 2에 제시된 서열 또는 아미노 말단 메티오닌을 포함하는 변이체를 포함하는 단량체일 경우, 구축물은 서열 M-mM, M-mM-mM 또는 M-mM-mM-mM을 포함할 수 있다. 상기 메티오닌의 존재는 전형적으로 전체 구축물을 코딩하는 폴리뉴클레오티드 내의, 두번째 및 후속 단량체를 코딩하는 폴리뉴클레오티드의 5' 말단의 출발 코돈 (즉, ATG)이 발현되었기 때문이다. (아미노에서 카르복시 방향으로) 구축물 중 첫번째 단량체 또한 메티오닌을 포함할 수 있다 (예컨대 mM-mM, mM-mM-mM 또는 mM-mM-mM-mM).
2개 이상의 단량체는 함께 직접적으로 유전자적으로 융합될 수 있다. 단량체는 바람직하게 링커를 사용하여 유전자적으로 융합된다. 링커는 단량체의 이동성을 제한하도록 디자인될 수 있다. 바람직한 링커는 아미노산 서열 (즉, 펩티드 링커)이다. 상기에서 논의된 펩티드 링거 중 임의의 것이 사용될 수 있다. 구축물은 바람직하게 서열 번호 29에 제시된 서열 또는 그의 변이체를 포함한다. 서열 번호 29의 각 단량체는 서열 번호 2에 제시된 서열 또는 그의 변이체를 포함한다. 두번째 단량체 또한 상기 기술된 바와 같이 그의 아미노 말단에 메티오닌을 포함한다. 두 단량체는 펩티드 링커에 의해 연결된다. 서열 번호 29의 변이체는 서열 번호 2의 변이체를 참조로 하여 상기에서 논의된 방식 중 임의의 것으로 서열 번호 29로부터 변이될 수 있다. 링커는 또한 상기에서 논의된 펩티드 링커로 변형되거나, 치환될 수 있다.
또 다른 바람직한 실시양태에서, 단량체는 화학적으로 융합된다. 두 부분이 예를 들어, 화학적 가교제를 통해 화학적으로 부착되어 있다면, 서브유닛은 효소에 화학적으로 융합된다. 상기에서 논의된 화학적 가교제 중 임의의 것이 사용될 수 있다. 링커는 본 발명의 돌연변이체 단량체로 도입된 하나 이상의 시스테인 잔기에 부착될 수 있다. 별법으로, 링커는 구축물 중 한 단량체의 말단에 부착될 수 있다.
구축물이 상이한 단량체를 포함할 경우, 방대한 과량의 단량체 중의 링커의 농도를 유지시킴으로써 단량체의 그 자신에의 가교결합을 막을 수 있다. 별법으로, 2개의 링커가 사용되는 "록(lock)" 및 "키(key)" 배열이 사용될 수 있다. 각 링커 중 단 하나의 말단만이 함께 반응하여 보다 긴 장쇄의 링커를 형성할 수 있고, 링커의 나머지 다른 한 말단은 다른 단량체와 반응한다. 상기 링커는 국제 출원 번호 PCT/GB10/000132 (공개 공보 WO 2010/086602)에 기술되어 있다.
폴리뉴클레오티드
본 발명은 또한 본 발명의 돌연변이체 단량체를 코딩하는 폴리뉴클레오티드 서열을 제공한다. 돌연변이체 단량체는 상기에서 논의된 것 중 임의의 것일 수 있다. 폴리뉴클레오티드 서열은 바람직하게 전체 서열에 걸쳐 뉴클레오티드 동일성 기준으로 서열 번호 1의 서열과 50%, 60%, 70%, 80%, 90% 또는 95% 이상 상동성인 서열을 포함한다. 300개 이상, 예를 들어, 375, 450, 525 또는 600개 이상의 연속된 뉴클레오티드로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 뉴클레오티드가 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산될 수 있다. 폴리뉴클레오티드 서열은 유전자 코드의 축퇴성에 근거하여 서열 번호 1과 상이한 서열을 포함할 수 있다.
본 발명은 또한 본 발명의 유전자적으로 융합된 구축물 중 어느 것을 코딩하는 폴리뉴클레오티드 서열을 제공한다. 폴리뉴클레오티드는 바람직하게 상기 기술된 바와 같이 서열 번호 1에 제시된 서열 또는 그의 변이체를 2개 이상 포함한다. 폴리뉴클레오티드 서열은 바람직하게 서열 번호 28의 서열, 또는 전체 서열에 걸쳐 뉴클레오티드 동일성 기준으로 서열 번호 28의 서열과 50%, 60%, 70%, 80%, 90% 또는 95% 이상 상동성인 서열을 포함한다. 600개 이상, 예를 들어, 750, 900, 1050 또는 1,200개 이상의 연속된 뉴클레오티드로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 뉴클레오티드가 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산될 수 있다. 폴리뉴클레오티드 서열은 유전자 코드의 축퇴성에 근거하여 서열 번호 28과 상이한 서열을 포함할 수 있다.
폴리뉴클레오티드 서열은 당업계의 표준 방법을 사용하여 유도되고 복제될 수 있다. 야생형 Msp를 코딩하는 염색체 DNA는 제조 유기체, 예컨대 미코박테리움 스메그마티스로부터 추출될 수 있다. 세공 서브유닛을 코딩하는 유전자는 특이 프라이머를 포함하는 PCR을 사용하여 증폭시킬 수 있다. 이어서, 증폭된 서열을 부위-지정 돌연변이유발에 의해 돌연변이화시킬 수 있다. 적합한 부위-지정 돌연변이유발 방법이 당업계에 공지되어 있으며, 그 예로는 예를 들어, 조합 연쇄 반응을 포함한다. 본 발명의 구축물을 코딩하는 폴리뉴클레오티드는 주지된 기법, 예컨대 문헌 [Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.]에 기술되어 있는 것을 사용하여 제조될 수 있다.
이어서, 생성된 폴리뉴클레오티드 서열을 재조합 복제가능한 벡터, 예컨대 클로닝 벡터 내로 도입할 수 있다. 벡터를 사용하여 적합성 숙주 세포에서 폴리뉴클레오티드를 복제할 수 있다. 따라서, 폴리뉴클레오티드 서열은 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고, 상기 벡터를 적합성 숙주 세포 내로 도입하고, 벡터를 복제시킬 수 있는 조건하에서 상기 숙주 세포를 성장시킴으로써 제조할 수 있다. 벡터를 숙주 세포로부터 회수할 수 있다. 폴리뉴클레오티드의 클로닝에 적합한 숙주 세포는 당업계에 공지되어 있고, 이는 하기에서 더욱 상세하게 기술된다.
폴리뉴클레오티드 서열은 적합한 발현 벡터로 클로닝될 수 있다. 발현 벡터에서, 폴리뉴클레오티드 서열은 전형적으로 숙주 세포에 의해 코딩 서열이 발현될 수 있도록 하는 제어 서열에 작동가능하게 연결되어 있다. 상기 발현 벡터를 사용하여 세공 서브유닛을 발현시킬 수 있다.
"작동가능하게 연결된"이라는 용어는 기술된 성분들이 그의 의도된 방식으로 기능을 할 수 있도록 허용하는 관계를 맺고 있는 병렬 배치를 의미한다. 코딩 서열에 제어 서열은 "작동가능하게 연결되어 있는" 제어 서열은 제어 서열과 적합성이 조건하에서 코딩 서열의 발현이 이루어질 수 있도록 하는 방식으로 결찰되어 있다. 동일하거나, 또는 상이한 폴리뉴클레오티드 서열의 다중 카피를 벡터 내로 도입할 수 있다.
이어서, 발현 벡터를 적합한 숙주 세포 내로 도입할 수 있다. 따라서, 본 발명의 돌연변이체 단량체 또는 구축물은 폴리뉴클레오티드 서열을 발현 벡터 내로 삽입하고, 상기 벡터를 적합성 박테리아 숙주 세포 내로 도입하고, 폴리뉴클레오티드 서열을 발현시킬 수 있는 조건하에서 상기 숙주 세포를 성장시킴으로써 제조할 수 있다. 재조합적으로 발현된 단량체 또는 구축물은 숙주 세포막에서 세공 내로 자가 조립될 수 있다. 별법으로, 상기 방식으로 제조된 재조합 세공을 숙주 세포로부터 제거하고, 또 다른 막 내로 삽입할 수 있다. 2개 이상의 상이한 서브유닛을 포함하는 세공을 제조할 때, 상이한 서브유닛이 상기 기술된 바와 같이 상이한 숙주 세포에서 별개로 발현될 수 있고, 상기 숙주 세포로부터 이를 제거하고, 별개의 막, 예컨대 토끼 세포막에서 세공 내로 조립할 수 있다.
벡터는 예를 들어, 복제 기점과 함께, 임의로는 상기 폴리뉴클레오티드 서열의 발현을 위한 프로모터와 함께, 및 임의로는 프로모터의 조절 인자와 함께 제공되는 플라스미드, 바이러스 또는 파지 벡터일 수 있다. 벡터는 하나 이상의 선별가능한 마커 유전자, 예를 들어, 테트라시클린 내성 유전자를 포함할 수 있다. 프로모터 및 다른 발현 조절 신호는 발현 벡터를 디자인하는 데 있어서 숙주 세포와 적합성을 띠는 것으로 선택될 수 있다. 전형적으로는 T7, trc , lac, ara 또는 λL 프로모터가 사용된다.
숙주 세포는 전형적으로 세공 서브유닛을 고수준으로 발현한다. 폴리뉴클레오티드 서열로 형질전환된 숙주 세포는 상기 세포를 형질전환시키는 데 사용되는 발현 벡터와 적합성을 띠는 것으로 선택될 것이다. 숙주 세포는 전형적으로 박테리아, 및 바람직하게는 에스케리키아 콜라이(Escherichia coli). λ DE3 용원을 포함하는 임의의 세포, 예를 들어, C41 (DE3), BL21 (DE3), JM109 (DE3), B834 (DE3), TUNER, Origami 및 Origami B는 T7 프로모터를 포함하는 벡터를 발현시킬 수 있다. 상기 열거된 조건 이외에도, 문헌 [Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20647-52]에서 인용된 방법 중 임의의 것이 Msp 단백질을 발현시키는 데 사용될 수 있다.
세공
본 발명은 또한 다양한 세공을 제공한다. 본 발명의 세공은 상이한 뉴클레오티드들 간을 고감도로 판별할 수 있기 때문에 핵산 서열의 특징을 규명하는 데, 예컨대 서열분석하는 데 이상적이다. 놀랍게도 세공은 DNA 및 RNA의 4가지 뉴클레오티드들을 구별해 낼 수 있다. 본 발명의 세공은 심지어 메틸화된 및 메틸화되지 않은 뉴클레오티드들을 구별해 낼 수 있다. 놀랍게도 본 발명의 세공에 대한 기본 해상도는 높다. 세공은 4가지 DNA 뉴클레오티드 모두를 거의 완전하게 분리해낼 수 있는 것으로 보인다. 세공은 추가로 세공에서의 체류 시간 및 세공을 통해 유동하는 전류에 근거하여 데옥시시티딘 모노포스페이트 (dCMP) 및 메틸-dCMP을 판별해 낸다.
본 발명의 세공은 또한 다양한 조건하에서 상이한 뉴클레오티드들을 판별해낼 수 있다. 특히, 세공은 핵산의 특징을 규명하는 데, 예컨대 서열분석하는 데 바람직한 조건하에서 뉴클레오티드들을 판별해낼 것이다. 본 발명의 세공이 상이한 뉴클레오티드들을 판별해낼 수 있는 판별 정도는 적용 전위, 염 농도, 완충제, 온도 및 첨가제, 예컨대 우레아, 베타인 및 DTT의 존재 여부를 변경함으로써 조절될 수 있다. 이를 통해 세공의 기능은 미세 조정될 수 있고, 특히 서열분석시에 그러하다. 이는 하기에서 더욱 상세하게 논의된다. 본 발명의 세공은 또한 뉴클레오티드별로 하나씩 하는 것에 기초하는 것보다는 하나 이상의 단량체와의 상호작용으로부터 핵산 중합체를 확인하는 데 사용될 수 있다.
본 발명의 세공은 단리될 수 있거나, 실질적으로 단리될 수 있거나, 정제될 수 있거나, 또는 실질적으로 정제될 수 있다. 본 발명의 세공에 임의의 다른 성분, 예컨대 지질 또는 다른 세공이 완전하게 존재하지 않는다면, 이는 단리 또는 정제된 것이다. 세공이 그의 의도된 용도를 방해하지 않는 담체 또는 희석제와 함께 혼합되어 있다면, 이는 실질적으로 단리되어 있는 것이다. 예를 들어, 세공이 10% 미만, 5% 미만, 2% 미만 또는 1% 미만으로 다른 성분, 예컨대 지질 또는 다른 세공을 포함하는 형태로 나타난다면, 이는 실질적으로 단리된 것이거나, 또는 실질적으로 정제된 것이다. 별법으로, 본 발명의 세공은 지질 이중층에 존재할 수 있다.
본 발명의 세공은 개별 또는 단일 세공으로서 존재할 수 있다. 별법으로, 본 발명의 세공은 2개 이상의 세공으로 이루어진 동종성 또는 이종성 집단으로 존재할 수 있다.
동종올리고머
세공
본 발명은 또한 본 발명의 동일한 돌연변이체 단량체를 포함하는, Msp로부터 유래된 동종올리고머 세공을 제공한다. 동종올리고머 세공은 바람직하게 표 1, 2 및 3에 제시되어 있는 돌연변이체 중 하나를 포함한다. 본 발명의 동종올리고머 세공은 핵산의 특징을 규명하는 데, 예컨대 서열분석하는 데 이상적이다. 본 발명의 동종올리고머 세공은 상기 논의된 장점들 중 임의의 것을 가질 수 있다. 본 발명의 구체적인 동종올리고머 세공이 가지는 장점은 표 1, 2 및 3에 명시되어 있다.
동종올리고머 세공은 임의의 개수의 돌연변이체 단량체를 포함할 수 있다. 세공운 전형적으로 7, 8, 9 또는 10개의 동일한 돌연변이체 단량체를 포함한다. 세공은 바람직하게 8개의 동일한 돌연변이체 단량체를 포함한다. 바람직하게는 상기에서 논의된 바와 같이 하나 이상, 예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이체 단량체는 화학적으로 변형된 것이다.
세공을 제조하는 방법은 하기에서 더욱 상세하게 논의된다.
이종올리고머
세공
본 발명은 또한 본 발명의 1개 이상의 돌연변이체 단량체를 포함하며, 여기서 8개의 단량체 중 1개 이상은 나머지 다른 단량체와 상이한 것인, Msp로부터 유래된 이종올리고머 세공을 제공한다. 본 발명의 이종올리고머 세공은 핵산의 특징을 규명하는 데, 예컨대 서열분석하는 데 이상적이다. 이종올리고머 세공은 당업계에 공지된 방법을 사용하여 제조될 수 있다 (예컨대 문헌 [Protein Sci. 2002 Jul;11(7): 1813-24]).
이종올리고머 세공은 세공을 형성하는 데 충분한 개수의 단량체를 포함한다. 단량체는 임의의 유형일 수 있다. 세공은 전형적으로 7, 8, 9 또는 10개의 단량체를 포함한다. 세공은 바람직하게 8개의 단량체를 포함한다.
세공은 본 발명의 돌연변이체 단량체에 필요한 돌연변이를 포함하지 않는 (a) 서열 번호 2에 제시된 서열, 또는 (b) 그의 변이체를 포함하는 1개 이상의 단량체를 포함할 수 있다. 적합한 변이체는 상기에서 논의된 바 있다. 본 실시양태에서, 나머지 단량체는 바람직하게 본 발명의 돌연변이체 단량체이다. 그러므로, 세공은 본 발명의 돌연변이체 단량체를 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 포함할 수 있다.
바람직한 실시양태에서, 세공은 (a) 1개의 돌연변이체 단량체 및 (b) 7개의 동일한 단량체를 포함하는데, 여기서 (a)의 돌연변이체 단량체는 (b)의 동일한 단량체와 상이한 것이다. (b)의 동일한 단량체는 바람직하게는 본 발명의 돌연변이체 단량체에 존재하는 돌연변이를 포함하지 않는 (i) 서열 번호 2에 제시된 서열, 또는 (ii) 그의 변이체를 포함한다.
바람직한 세공은 하기 중 임의의 것을 포함하나, 이에 한정되지 않는다:
(a) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 치환 N90R, N90K, N90Y, N90Q, N90W 또는 N90C를 포함하는 1개의 돌연변이체 단량체. 이러한 세공은 단일의 입체구조적 아미노산 (Y 또는 W), 단일의 하전된 아미노산 (K 또는 R) 또는 내부 협착부 내로 도입된 단일의 반응성 아미노산 (C)을 가진다.
(b) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 치환 N91R, N91K, N91Y, N91Q, N91W 또는 N91C를 포함하는 1개의 돌연변이체 단량체. 이러한 세공은 단일의 입체구조적 아미노산 (Y 또는 W), 단일의 하전된 아미노산 (K 또는 R) 또는 내부 협착부 내로 도입된 단일의 반응성 아미노산 (C)을 가진다.
(c) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 치환 L88C, S103C 또는 I105C를 포함하는 1개의 돌연변이체 단량체. 이러한 세공은 세공 내로 도입된 반응성 아미노산을 가진다.
또 다른 바람직한 실시양태에서, 단량체들 모두 (즉, 10, 9, 8 또는 7개의 단량체) 본 발명의 돌연변이체 단량체이고, 그 중 1개 이상은 나머지 다른 단량체와 상이한 것이다. 더욱 바람직한 실시양태에서, 세공은 본 발명의 8개의 돌연변이체 단량체를 포함하고, 그 중 1개 이상은 나머지 다른 단량체와 상이한 것이다.
상기 논의된 모든 실시양태에서, 하나 이상, 예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이체 단량체는 바람직하게 상기에서 논의된 바와 같이 화학적으로 변형된 것이다. 상기의 바람직한 세공 (a) 내지 (c)는 바람직하게 도입된 시스테인 중 하나 이상에의 분자의 부착에 의해 화학적으로 변형된 것이다.
세공을 제조하는 방법은 하기에서 더욱 상세하게 논의된다.
구축물-함유 세공
본 발명은 또한 본 발명의 구축물을 1개 이상 포함하는 세공을 제공한다. 본 발명의 구축물은 Msp로부터 유래된, 2개 이상의 공유적으로 부착된 단량체를 포함한다. 다시 말해, 구축물은 1개 초과의 단량체를 포함하여야 한다. 세공은 세공을 형성하는 데 충분한 개수의 구축물, 및 필요할 경우, 단량체를 포함한다. 예를 들어, 팔량체 세공은 (a) 각각이 4개의 단량체를 포함하는 것인 2개의 구축물, 또는 (b) 2개의 단량체를 포함하는 1개의 구축물과, 구축물의 일부를 형성하지 않는 6개의 단량체를 포함할 수 있다. 세공 중 2개 이상의 단량체가 본 발명의 구축물 형태를 띤다. 단량체는 임의의 유형일 수 있다. 세공은 전형적으로 총 7, 8, 9 또는 10개의 단량체를 포함한다 (이중 2개 이상이 구축물 중에 존재하여야 한다). 세공은 바람직하게 8개의 단량체를 포함한다 (이중 2개 이상이 구축물 중에 존재하여야 한다).
세공은 전형적으로 (a) 2개의 단량체를 포함하는 1개의 구축물과, (b) 5, 6, 7 또는 8개의 단량체를 포함한다. 구축물은 상기에서 논의된 것 중 임의의 것일 수 있다. 단량체는 본 발명의 돌연변이체 단량체를 비롯한, 상기에서 논의된 것 중 임의의 것일 수 있다.
또 다른 전형적인 세공은 1개 초과의 본 발명의 구축물, 예컨대 2, 3, 또는 4개의 본 발명의 구축물을 포함한다. 상기 세공은 추가로 세공을 형성하는 충분한 개수의 단량체를 포함한다. 단량체는 상기에서 논의된 것 중 임의의 것일 수 있다. 본 발명의 추가의 세공은 2개의 단량체를 포함하는 단 1개의 구축물을 포함하고, 예를 들어, 세공은 2개의 단량체를 포함하는 4, 5, 6, 7 또는 8개의 구축물을 포함할 수 있다. 본 발명에 따른 구체적인 세공은 각각이 2개의 단량체를 포함하는 것인 4개의 구축물을 포함한다. 구축물은 구축물의 단 하나의 단량체만이 세공의 베럴 또는 전정부에 기여하도록 하는 구조를 가진 세공으로 올리고머화될 수 있다. 전형적으로, 구축물의 나머지 다른 단량체는 세공의 베럴 또는 전정부의 바깥쪽에 위치할 것이다. 예를 들어, 본 발명의 세공은 베럴 또는 전정부가 8개의 단량체를 포함하는 것인, 2개의 단량체를 포함하는 5, 6, 7 또는 8개의 구축물을 포함할 수 있다.
상기 기술된 바와 같이, 돌연변이가 구축물 내로 도입될 수 있다. 돌연변이는 교대로 있을 수 있고, 즉, 2개의 단량체를 포함하는 구축물 내에서 돌연변이는 각 단량체에 대해 상이하며, 구축물은 동종올리고머로서 조립되어 교대 변형을 형성할 수 있다. 다시 말해, MutA 및 MutB를 포함하는 단량체가 융합되고 조립됨으로써 A-B:A-B:A-B:A-B 세공을 형성한다. 별법으로, 이웃해 있을 수 있고, 즉, 동일한 돌연변이가 구축물 중 2개의 단량체 내로 도입되고, 이어서, 상이한 돌연변이체 단량체로 올리고머화된다. 다시 말해, MutA를 포함하는 단량체가 융합된 후, MutB 함유 단량체와 올리고머화하여 A-A:B:B:B:B:B:B를 형성한다.
구축물을 함유하는 세공 중 하나 이상의 본 발명의 단량체는 상기에서 논의된 바와 같이 화학적으로 변형될 수 있다.
개별 뉴클레오티드를 확인하는 방법
본 발명은 또한 개별 뉴클레오티드의 특징을 규명하는 방법을 제공한다. 본 방법은 뉴클레오티드를 본 발명의 세공과 접촉시켜 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 상호작용하는 동안 세공을 통해 통과하는 전류를 측정하는 단계, 및 이로써 뉴클레오티드의 특징을 규명하는 단계를 포함한다. 그러므로, 본 발명은 개별 뉴클레오티드의 나노세공 감지를 포함한다. 본 발명은 또한 상호작용하는 동안 세공을 통해 통과하는 전류를 측정하는 단계, 및 이로써 뉴클레오티드의 정체를 확인하는 단계를 포함하는, 개별 뉴클레오티드를 확인하는 방법을 제공한다. 본 발명의 세공 중 임의의 것이 사용될 수 있다. 본 발명의 세공은 바람직하게 상기에서 논의된 바와 같이 분자 어댑터로 화학적으로 변형된다.
전류가 뉴클레오티드에 대해 특이적인 방식으로 세공을 통해 유동한다면 (즉, 뉴클레오티드와 관련된 독특한 전류가 세공을 통해 유동하는 것이 검출된다면), 그 뉴클레오티드는 존재하는 것이다. 전류가 뉴클레오티드에 대해 특이적인 방식으로 세공을 통해 유동하지 않는다면, 그 뉴클레오티드는 존재하지 않는 것이다.
본 발명은 세공을 통해 통과하는 전류에 미치는 상이한 효과에 근거하여 유사한 구조를 가지는 뉴클레오티드를 구별하는 데 사용될 수 있다. 개별 뉴클레오티드는 그가 세공과 상호작용할 때, 그의 전류 진폭으로부터 단일 분자로 확인될 수 있다. 본 발명은 또한 샘플 중 특정의 뉴클레오티드가 존재하는지 여부를 측정하는 데 사용될 수 있다. 본 발명은 또한 샘플 중 특정 뉴클레오티드의 농도를 측정하는 데 사용될 수 있다.
본 발명은 본 발명의 세공이 막 내로 삽입되어 있는 임의의 적합한 막/세공 시스템을 사용하여 수행될 수 있다. 본 방법은 전형적으로 (i) 본 발명의 세공을 포함하는 인공막, (ii) 본 발명의 세공을 포함하는, 단리된, 천연적으로 발생된 막, 또는 (iii) 본 발명에 따라 변형된 세공을 발현하는 세포를 사용하여 수행될 수 있다. 본 방법은 바람직하게 인공막을 사용하여 수행된다. 상기 막은 본 발명의 세공 이외에도, 다른 막횡단 및/또는 막내 단백질 뿐만 아니라, 다른 분자를 포함할 수 있다.
막은 이온, 뉴클레오티드 및 핵산의 유동을 막는 장벽을 형성한다. 임의의 막이 본 발명에 따라 사용될 수 있다. 적합한 막은 당업계에 주지되어 있다. 막 은 바람직하게 양친매성 층이다. 양친매성 층은 친수성 및 친유성 특성 둘 모두를 가지는 양친매성 분자, 예컨대 인지질로부터 형성된 층이다. 양친매성 물질은 합성 또는 천연적으로 발생된 것일 수 있다. 양친매성 층은 단층 또는 이중층일 수 있다. 비천연적으로 발생된 양친매성 물질 및 단층을 형성하는 양친매성 물질은 당업계에 공지되어 있고, 예를 들어, 블록 공중합체를 포함한다 (문헌 [Gonzalez-Perez et al., Langmuir, 2009, 25, 10447-10450]).
막은 지질 이중층일 수 있다. 본 발명에 따라 사용하기에 적합한 지질 이중층은 당업계에 공지되어 있는 방법을 사용하여 제조될 수 있다. 예를 들어, 지질 이중층 막은 문헌 [Montal and Mueller (1972)]의 방법을 사용하여 형성될 수 있다. 지질 이중층은 또한 국제 출원 번호 PCT/GB08/000563에 기술되어 있는 방법을 사용하여 형성될 수도 있다.
본 발명의 방법은 인지질, 당지질, 콜레스테롤, 미콜산 및 그의 혼합물을 포함하나, 이에 한정되지 않는 임의의 막 지질로부터 형성된 지질 이중층을 사용하여 수행될 수 있다. 국제 출원 번호 PCT/GB08/000563에 기술된 지질 중 임의의 것이 사용될 수 있다.
또 다른 바람직한 실시양태에서, 막은 고상 층이다. 고상 층은 생물학적 기원의 것은 아니다. 다시 말해, 고상 층은 생물학적 환경, 예컨대 유기체 또는 세포로부터 유래되거나, 단리되거나 한 것이 아니거나, 또는 합성적으로 제조된, 생물학상 이용가능한 구조체이다. 고상 층은 마이크로전자 물질, 절연체, 예컨대 Si3N4, Al2O3, 및 SiO, 유기 및 무기 중합체, 예컨대 폴리아미드, 플라스틱, 예컨대 테플론(Teflon)® 또는 엘라스토머, 예컨대 제2성분 부가 경화형 실리콘 고무, 및 유리를 포함하나, 이에 한정되지 않는, 유기 및 무기 물질 둘 모두로부터 형성될 수 있다. 고상 층은 단원자 층, 예컨대 그래핀, 또는 단지 몇 안되는 원자 두께를 가지는 층으로부터 형성될 수 있다. 적합한 그래핀 층은 국제 출원 번호 PCT/US2008/010637 (공개 공보 WO 2009/035647)에 개시되어 있다. 양친매성 층은 고상 세공 건너편에 형성될 수 있다. 이는 하이브리드 세공 형성으로서 기술되어 있다 (문헌 [Hall et al., Nat Nanotechnol., 2010, 5, 874-877]).
세공을 막, 예컨대 지질 이중층 내로 삽입하는 방법은 당업계에 공지되어 있다. 예를 들어, 세공이 지질 이중층으로 확산되고, 지질 이중층에 의해 결합 및 기능적 상태로의 조립에 의해 삽입될 수 있도록 지질 이중층을 함유하는 용액 중에 세공을 정제된 형태로 현탁시킬 수 있다. 별법으로, 문헌 [M.A. Holden, H. Bayley. J. Am. Chem. Soc. 2005, 127, 6502-6503] 및 국제 출원 번호 PCT/GB2006/001057 (공개 공보 WO 2006/100484)에 기술되어 있는 "픽 앤 플레이스(pick and place)" 방법을 사용하여 세공을 직접 막 내로 삽입시킬 수 있다.
본 발명의 방법은 전형적으로는 시험관내에서 수행된다.
개별 뉴클레오티드
개별 뉴클레오티드는 단일의 뉴클레오티드이다. 개별 뉴클레오티드는 뉴클레오티드 결합에 의해 또 다른 뉴클레오티드 또는 핵산에 결합되어 있지 않은 것이다. 뉴클레오티드 결합은 또 다른 뉴클레오티드의 당 기에 결합되는 한 뉴클레오티드의 포스페이트 기 중 하나를 포함한다. 개별 뉴클레오티드는 전형적으로 5개 이상, 10개 이상, 20개 이상, 50개 이상, 100개 이상, 200개 이상, 500개 이상, 1,000개 이상, 또는 5,000개 이상의 뉴클레오티드로 이루어진, 뉴클레오티드 결합에 의해 또 다른 핵산 서열에 결합되어 있지 않은 것이다. 예를 들어, 개별 뉴클레오티드는 표적 폴리뉴클레오티드 서열, 예컨대 DNA 또는 RNA 가닥으로부터 분해된 것이다.
본 발명의 방법은 임의의 뉴클레오티드를 확인하는 데 사용될 수 있다. 뉴클레오티드는 천연적으로 발생된 것이거나, 인공의 것일 수 있다. 뉴클레오티드는 전형적으로 뉴클레오염기, 당, 및 1개 이상의 포스페이트 기를 포함한다. 뉴클레오염기는 전형적으로 헤테로시클릭이다. 적합한 뉴클레오염기는 퓨린 및 피리미딘을 포함하고, 더욱 구체적으로는 아데닌, 구아닌, 티민, 우라실 및 시토신을 포함한다. 당은 전형적으로 5탄당이다. 적합한 당은 리보스 및 데옥시리보스를 포함하나, 이에 한정되지 않는다. 뉴클레오티드는 전형적으로 리보뉴클레오티드 또는 데옥시리보뉴클레오티드이다. 뉴클레오티드는 전형적으로 모노포스페이트, 디포스페이트 또는 트리포스페이트를 포함한다.
적합한 뉴클레오티드는 아데노신 모노포스페이트 (AMP), 아데노신 디포스페이트 (ADP), 아데노신 트리포스페이트 (ATP), 구아노신 모노포스페이트 (GMP), 구아노신 디포스페이트 (GDP), 구아노신 트리포스페이트 (GTP), 티미딘 모노포스페이트 (TMP), 티미딘 디포스페이트 (TDP), 티미딘 트리포스페이트 (TTP), 우리딘 모노포스페이트 (UMP), 우리딘 디포스페이트 (UDP), 우리딘 트리포스페이트 (UTP), 시티딘 모노포스페이트 (CMP), 시티딘 디포스페이트 (CDP), 시티딘 트리포스페이트 (CTP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시아데노신 디포스페이트 (dADP), 데옥시아데노신 트리포스페이트 (dATP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시구아노신 디포스페이트 (dGDP), 데옥시구아노신 트리포스페이트 (dGTP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시티미딘 디포스페이트 (dTDP), 데옥시티미딘 트리포스페이트 (dTTP), 데옥시우리딘 모노포스페이트 (dUMP), 데옥시우리딘 디포스페이트 (dUDP), 데옥시우리딘 트리포스페이트 (dUTP), 데옥시시티딘 모노포스페이트 (dCMP), 데옥시시티딘 디포스페이트 (dCDP) 및 데옥시시티딘 트리포스페이트 (dCTP)를 포함하나, 이에 한정되지 않는다. 뉴클레오티드는 바람직하게 AMP, TMP, GMP, UMP, dAMP, dTMP, dGMP 또는 dCMP이다.
뉴클레오티드는 핵산 서열, 예컨대 리보핵산 (RNA) 또는 데옥시리보핵산의 분해로부터 유도될 수 있다. 핵산 서열은 당업계에 공지된 임의의 방법을 사용하여 분해될 수 있다. 적합한 방법은 효소 또는 촉매를 사용하는 것을 포함하나, 이에 한정되지 않는다. 핵산의 촉매적 분해는 문헌 [Deck et al., Inorg. Chem, 2002; 41: 669-677]에 개시되어 있다.
핵산 전체 또는 그 일부의 서열을 분석하기 위하여 단일의 핵산 서열로부터의 개별 뉴클레오티드를 순차적인 방식으로 세공과 접촉시킬 수 있다. 핵산 서열분석은 하기에서 더욱 상세하게 논의된다.
예컨대 뉴클레오티드가 핵산 서열의 분해로부터 유도된 것인 경우, 뉴클레오티드는 전형적으로 변형되지 않은 것이다. 별법으로, 뉴클레오티드는 변형되거나, 손상된 것일 수 있다. 뉴클레오티드는 전형적으로 메틸화되거나, 산화된 것이다. 뉴클레오티드는 시현용 표지로 표지화될 수 있다. 시현용 표지는 뉴클레오티드가 검출될 수 있도록 하는데 적합한 임의의 표지일 수 있다. 적합한 표지로는 형광성 분자, 방사성 동위 원소, 예컨대 125I, 35S, 및 링커, 예컨대 비오틴을 포함한다.
뉴클레오티드는 전형적으로 임의의 적합한 생물학적 샘플 중에 존재한다. 적합한 생물학적 샘플은 상기에서 논의된 것이다.
세공과 뉴클레오티드 사이의 상호작용
뉴클레오티드를 막 양측의 세공과 접촉시킬 수 있다. 뉴클레오티드를 막 양측의 세공에 도입시킬 수 있다. 뉴클레오티드가 세공을 통해 막의 나머지 다른 한쪽으로 통과할 수 있도록 허용하는 막의 한 측과 뉴클레오티드를 접촉시킬 수 있다. 예를 들어, 뉴클레오티드가 세공을 통해 통과할 수 있도록 그의 천연 환경하에서 이온 또는 소형 분자, 예컨대 뉴클레오티드가 세공의 베럴 또는 채널 내로 유입될 수 있도록 허용하는 세공의 한쪽 단부와 뉴클레오티드를 접촉시킨다. 상기와 같은 경우, 뉴클레오티드는 세공의 베럴 또는 채널을 통해 막을 통과함에 따라 세공 및/또는 어댑터와 상호작용하게 된다. 별법으로, 뉴클레오티드가 어댑터를 통해 또는 그와 함께 세공과 상호작용하고, 세공으로부터 해리되고, 막의 같은 측면 상에 남아있을 수 있도록 막의 한 측면과 접촉시킬 수 있다. 본 발명은 어댑터의 위치가 고정되어 있는 것인 세공을 제공한다. 그 결과, 뉴클레오티드는 바람직하게 어댑터가 뉴클레오티드와 상호작용할 수 있도록 허용하는 세공의 단부과 접촉한다.
뉴클레오티드는 임의의 방식으로 임의의 부위에서 세공과 상호작용할 수 있다. 상기에서 논의된 바와 같이, 뉴클레오티드는 바람직하게 어댑터를 통해 또는 그와 함께 세공에 가역적으로 결합한다. 가장 바람직하게 뉴클레오티드는 막을 가로질로 세공을 통해 통과함에 따라 어댑터를 통해 또는 그와 함께 세공에 가역적으로 결합한다. 뉴클레오티드는 또한 막을 가로질로 세공을 통해 통과함에 따라 어댑터를 통해 또는 그와 함께 세공의 베럴 또는 채널에 가역적으로 결합할 수 있다.
뉴클레오티드와 세공이 상호작용하는 동안, 뉴클레오티드는 상기 뉴클레오티드에 특이적인 방식으로 세공을 통해 유동하는 전류에 영향을 미친다. 예를 들어, 특정 뉴클레오티드는 특정의 평균 시간 동안 특정 정도로까지 세공을 통해 유동하는 전류를 감소시킬 것이다. 다시 말해, 세공을 통해 유동하는 전류는 특정 뉴클레오티드에 독특한 것이다. 특정 뉴클레오티드가 세공을 통해 유동하는 전류에 대해 미치는 효과를 측정하기 위해 대조군 실험을 수행할 수 있다. 이어서, 샘플 중에 특정 뉴클레오티드를 확인하기 위해, 또는 특정 뉴클레오티드가 샘플 중에 존재하는지 여부를 측정하기 위해 본 발명의 방법을 수행하여 얻은 시험 샘플에 대한 결과를 상기 대조군 실험으로부터 유도된 것과 비교할 수 있다. 특정 뉴클레오티드임을 나타내는 방식으로 세공을 통해 유동하는 전류가 영향을 받는 빈도를 사용하여 샘플 중의 상기 뉴클레오티드의 농도를 측정할 수 있다. 샘플 내의 상이한 뉴클레오티드의 비 또한 계산할 수 있다. 예를 들어, dCMP 대 메틸-dCMP의 비를 계산할 수 있다.
장치
본 방법은 본 발명의 세공이 막 내로 삽입되어 있는 막/세공 시스템을 조사하는 데 적합한 임의의 장치를 사용함으로써 수행될 수 있다. 본 방법은 나노세공 감지에 적합한 임의의 장치를 사용함으로써 수행될 수 있다. 예를 들어, 본 장치는 수용액을 포함하는 챔버, 및 챔버를 두 섹션으로 분리하는 장벽을 포함한다. 장벽은 세공을 포함하는 막이 형성되는 곳에 개구부를 가진다. 뉴클레오티드를 챔버 내로 도입함으로써 뉴클레오티드를 세공과 접촉시킬 수 있다. 뉴클레오티드를 챔버의 두 섹션 중 하나로 도입할 수 있다.
본 방법은 국체 출원 번호 PCT/GB08/000562에 기술되어 있는 장치를 사용함으로써 수행될 수 있다.
본 발명의 방법은 뉴클레오티드와의 상호작용 동안 세공을 통과하는 전류를 측정하는 단계를 포함한다. 따라서, 본 장치는 또한 전위를 적용할 수 있고, 막 및 세공을 가로지르는 전기 신호를 측정할 수 있는 전기 회로를 포함한다. 본 방법은 패치 클램프 또는 전압 클램프를 사용함으로써 수행될 수 있다. 본 방법은 바람직하게 전압 클램프를 사용하는 것을 포함한다.
샘플
뉴클레오티드는 임의의 적합한 샘플 중에 존재한다. 본 발명은 전형적으로 뉴클레오티드를 함유하거나, 함유할 것으로 의심되는 것으로 알려져 있는 샘플에 대해 수행된다. 본 발명은 그의 정체가 알려져 있지 않은 하나 이상의 뉴클레오티드를 함유하는 샘플에 대해 수행될 수 있다. 별법으로, 본 발명은 샘플 중에 그가 존재하는 것으로 알려져 있거나, 그러할 것으로 기대되는 하나 이상의 뉴클레오티드의 정체를 확인하기 위해 샘플에 대해 수행될 수 있다.
샘플은 생물학적 샘플일 수 있다. 본 발명은 임의의 유기체 또는 미생물로부터 수득되거나, 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 유기체 또는 미생물은 전형적으로 원핵생물 또는 진핵생물이고, 이는 전형적으로 5개의 생물계: 식물계, 동물계, 진균계, 모네라계 및 원생생물계 중 하나에 속한다. 본 발명은 임의의 바이러스로부터 수득되거나, 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 샘플은 바람직하게 유체 샘플이다. 샘플은 전형적으로 환자의 체액을 포함한다. 샘플은 뇨, 림프액, 타액, 점액 또는 양수일 수 있지만, 바람직하게는 혈액, 혈장 또는 혈청이다. 전형적으로, 샘플은 인간 기원의 것이지만, 별법으로는 또 다른 포유동물로부터 유래된 것, 예컨대 상업상의 사육 동물, 예컨대 말, 소, 양 또는 돼지로부터 유래된 것일 수 있거나, 별법으로, 애완동물, 예컨대 고양이 또는 개일 수 있다. 별법으로, 식물 기원의 샘플은 전형적으로 상업 작물, 예컨대 시리얼, 콩과 식물, 과일, 또는 야채, 예를 들어, 밀, 보리, 귀리, 카놀라, 옥수수, 콩, 벼, 바나나, 사과, 토마토, 감자, 포도, 담배, 콩류, 렌틸, 사탕수수, 코코아, 목화, 홍차, 커피로부터 수득된다.
샘플은 비-생물학적 샘플일 수 있다. 비-생물학적 샘플은 바람직하게 유체 샘플이다. 비-생물학적 샘플의 예로는 수술 유체, 물, 예컨대 식수, 해수 또는 강물, 및 실험실 시험용 시약을 포함한다.
샘플은 전형적으로 검정되기 전에 예를 들어, 원심분리에 의해 또는 원치않는 분자 또는 세포, 예컨대 적혈구를 걸러내는 막을 통해 통과시킴으로써 프로세싱된다. 샘플은 채취 즉시 측정될 수 있다. 샘플은 또한 전형적으로는 검정 이전에 바람직하게는 -70℃ 미만의 온도에서 보관될 수 있다.
조건
본 발명의 방법은 뉴클레오티드와의 상호작용 동안 세공을 통과하는 전류를 측정하는 단계를 포함한다. 막횡단 단백질 세공을 통과하는 이온 전류를 측정하는 데 적합한 조건은 당업계에 공지되어 있고, 실시예에 개시되어 있다. 본 방법은 막 및 세공을 가로질러 적용되는 전압을 사용하여 수행된다. 사용 전압은 전형적으로 -400 mV 내지 +400 mV이다. 사용 전압은 바람직하게는 하한이 -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20 mV 및 0 mV로부터 선택되고, 상한은 독립적으로 +10 mV, +20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV 및 +400 mV로부터 선택되는 범위의 값이다. 사용 전압은 더욱 바람직하게는 100 mV 내지 240 mV 범위이고, 가장 바람직하게는 160 mV 내지 240 mV 범위이다. 증가된 적용 전위를 사용함으로써 본 발명에 의해 상이한 뉴클레오티드 간의 판별을 증가시킬 수 있다.
본 방법은 전형적으로 임의의 알칼리 금속 클로라이드 염의 존재하에서 수행된다. 상기에서 논의된 예시적인 장치에서, 염은 챔버 중 수용액 중에 존재한다. 전형적으로 염화칼륨 (KCl), 염화나트륨 (NaCl) 또는 염화세슘 (CsCl)이 사용된다. KCl이 바람직하다. 염 농도는 전형적으로 0.1 내지 2.5 M, 0.3 내지 1.9 M, 0.5 내지 1.8 M, 0.7 내지 1.7 M, 0.9 내지 1.6 M 또는 1 M 내지 1.4 M이다. 염 농도는 바람직하게 150 mM 내지 1 M이다. 고염 농도가 높은 신호 대 노이즈 비를 제공하고, 그러한 고염 농도를 통해 뉴클레오티드의 존재를 나타내는 전류를 표준 전류 파동의 배경으로부터 확인할 수 있다. 저염 농도는 뉴클레오티드 검출이 효소의 존재하에서 수행되는 경우, 예컨대 핵산을 서열분석할 때 사용될 수 있다. 이러한 내용은 하기에서 더욱 상세하게 논의된다.
본 방법은 전형적으로 완충제의 존재하에서 수행된다. 상기에서 논의된 예시적인 장치에서, 완충제는 챔버 중 수용액 중에 존재한다. 본 발명의 방법에서 임의의 완충제가 사용될 수 있다. 한 적합한 완충제는 트리스-HCl 완충제이다. 본 방법은 전형적으로 pH 4.0 내지 12.0, 4.5 내지 10.0, 5.0 내지 9.0, 5.5 내지 8.8, 6.0 내지 8.7 또는 7.0 내지 8.8 또는 7.5 내지 8.5에서 수행된다. 사용되는 pH는 바람직하게 약 7.5이다.
본 방법은 전형적으로 0℃ 내지 100℃, 15℃ 내지 95℃, 16℃ 내지 90℃, 17℃ 내지 85℃, 18℃ 내지 80℃, 19℃ 내지 70℃, 또는 20℃ 내지 60℃에서 수행된다. 본 방법은 실온에서 수행될 수 있다. 본 방법은 바람직하게 효소 기능을 지원하는 온도, 예컨대 약 37℃에서 수행된다.
핵산의 특징을 규명하는 방법
본 발명은 또한 표적 핵산 서열의 특징을 규명하는 방법을 제공한다. 표적 핵산 서열의 하나 이상의 특징이 측정될 수 있다. 본 방법은 표적 핵산 서열의 2, 3, 4, 또는 5개 이상의 특징을 측정하는 것을 포함한다. 하나 이상의 특징은 바람직하게 (i) 표적 핵산 서열의 길이 (ii) 표적 핵산 서열의 정체, (iii) 표적 핵산 서열의 서열, (iv) 표적 핵산 서열의 2차 구조 및 (v) 표적 핵산 서열의 변형 여부로부터 선택된다. 본 발명에 따라 (i) 내지 (v)의 임의의 조합이 측정될 수 있다.
(i)의 경우, 핵산 서열의 길이는 표적 핵산 서열과 세공 사이의 상호작용수를 사용하여 측정될 수 있다.
(ii)의 경우, 핵산 서열의 정체는 여러 가지 방법으로 측정될 수 있다. 핵산 서열의 정체는 표적 핵산 서열의 서열 측정과 함께, 또는 표적 핵산 서열의 서열 측정없이 측정될 수 있다. 전자의 경우가 간단한데; 핵산을 서열분석함으로써 확인된다. 후자의 경우는 여러 방법으로 수행될 수 있다. 예를 들어, (폴리뉴클레오티드의 남은 서열을 측정하지 않고) 핵산 서열 중 특정 모티프의 존재를 측정할 수 있다. 별법으로, 본 방법에서 특정의 전기 신호를 측정함으로써 표적 핵산 서열은 특정의 근원으로부터 생겨나는 것임을 확인할 수 있다.
(iii)의 경우, 핵산 서열의 서열은 앞서 기술된 바와 같이 측정될 수 있다. 적합한 서열분석 방법, 특히, 전기 측정을 사용하는 것은 문헌 [Stoddart D et al., Proc Natl Acad Sci, 12;106(19):7702-7], [Lieberman KR et al, J Am Chem Soc. 2010;132(50):17961-72], 및 국체 출원 WO 2000/28312에 기술되어 있다.
(iv)의 경우, 2차 구조는 다양한 방법으로 측정될 수 있다. 예를 들어, 2차 구조는 체류 시간 변화 또는 세공을 통해 유동하는 전류의 변화를 사용함으로써 측정될 수 있다.
본 발명은 또한 표적 핵산 서열의 서열을 추정하는 방법을 제공한다. 본 발명은 추가로 표적 핵산 서열의 서열분석 방법을 제공한다.
핵산은 2개 이상의 뉴클레오티드를 포함하는 거대분자이다. 뉴클레오티드는 상기에서 논의된 것 중 임의의 것일 수 있다.
한 실시양태에서, 본 방법은 (a) 표적 서열을 본 발명의 세공 및 핵산 결합 단백질과 접촉시켜, 상기 단백질이 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여 예컨대 표적 서열의 서열을 추정하거나, 또는 표적 서열을 서열분석하는 것과 같이, 특징을 규명하는 단계를 포함한다. 그러므로, 본 방법은 표적 서열을 서열분석하는 것과 같이, 특징을 규명하기 위해 뉴클레오티드가 베럴 또는 채널을 통해 통과함에 따라 표적 핵산 서열 중 일부의 뉴클레오티드를 나노세공 감지하는 것을 포함한다.
또 다른 실시양태에서, 본 방법은 (a) 표적 서열을 본 발명의 세공 및 엑소뉴클레아제와 접촉시켜 엑소뉴클레아제가 표적 서열의 한쪽 말단으로부터 개별 뉴클레오티드를 분해할 수 있도록 하는 단계; (b) 뉴클레오티드를 세공과 접촉시켜 뉴클레오티드가 어댑터와 상호작용하도록 하는 단계; (c) 상호작용 동안 세공을 통과하는 전류를 측정하여 뉴클레오티드의 특징을 규명하는 단계; 및 (d) 표적 서열의 같은 쪽 말단에서 단계 (a) 내지 (c)를 반복함으로써 표적 서열의 특징을 규명하는 단계를 포함한다. 그러므로, 본 방법은 표적 서열의 특징을 규명하기 위해 연속 방식으로 표적 핵산 서열 중 일부의 뉴클레오티드를 나노세공 감지하는 것을 포함한다. 바람직한 실시양태에서, 본 방법은 표적 핵산 서열을 서열분석하는 것에 관한 것이고, 단계 (a)는 뉴클레오티드의 정체를 측정하는 것을 포함한다. 개별 뉴클레오티드는 상기에 기술되어 있다.
본 발명의 세공은 개선된 뉴클레오티드 판별을 보이는 바, 이는 특히 상기 방법에 적합하다. 특히, 증가된 전류 범위 (이로써 상이한 뉴클레오티드들 간의 판별은 더욱 쉬워진다), 및 감소된 상태 변동 (이로써 신호 대 노이즈 비는 증가한다)을 보인다. 추가로, 전자의 실시양태와 관련하여, 핵산이 세공을 통해 이동함에 따라 전류에 기여하는 뉴클레오티드의 개수는 감소하게 된다. 이로써 핵산이 세공을 통해 이동함에 따라 관찰되는 전류 결과와 핵산 서열 사이의 직접적인 관계를 더욱 쉽게 확인할 수 있게 된다. 본 발명의 세공은 바람직하게 상기에서 논의된 바와 같이, (1) 분자 어댑터 및/또는 (2) 핵산 결합 단백질 또는 엑소뉴클레아제로 화학적으로 변형된다.
상기 방법을 사용함으로써 표적 핵산 서열 전체, 또는 단지 그의 일부만을 특징 규명, 예컨대 서열분석할 수 있다. 핵산 서열은 임의의 길이일 수 있다. 예를 들어, 핵산 서열의 길이는 10개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 400개 이상 또는 500개 이상의 뉴클레오티드 길이일 수 있다. 핵산 서열의 길이는 1,000개 이상 뉴클레오티드 또는 5,000개 이상의 뉴클레오티드 길이일 수 있다. 핵산 서열은 천연적으로 발생된 것 또는 인공의 것일 수 있다. 예를 들어, 본 방법은 제조된 올리고뉴클레오티드의 서열을 확인하는 데 사용될 수 있다. 본 방법은 전형적으로 시험관내에서 수행된다.
본 방법은 세공이 막 내로 삽입되어 있는 임의의 적합한 막/세공 시스템을 사용하여 수행될 수 있다. 본 방법은 전형적으로 상기에 개시되어 있는 시스템, 장치, 또는 조건 중 임의의 것을 사용하여 수행될 수 있다.
상기에서 언급된 바와 같이, 우수한 뉴클레오티드 판별은 온도가 상승하게 되면 저염 농도에서 달성될 수 있다. 용액의 온도를 상승시키는 것 이외에도, 효소 활성에 적합한 조건은 유지시키면서, 용액의 전도도를 증가시키는 데 사용될 수 있는 다른 전략법은 다수 존재한다. 그러한 한가지 전략법으로는 효소 한쪽의 염 농도는 저염 농도로, 및 반대쪽은 고염 농도로 하는 것과 같이, 염 용액의 농도를 상이한 2가지 농도로 나누는 지질 이중층을 사용하는 것이 있다. 상기 전략법의 일례는 막의 시스 쪽에서는 200 mM의 KCl을 사용하고, 트랜스 챔버에서는 500 mM의 KCl을 사용하는 것이다. 이러한 조건하에서 세공을 통과하는 전도도는 표준 조건하의 400 mM의 KCl의 것에 대략적으로 등가인 것으로 예측되며, 효소는 단지 시스 쪽에 배치되었을 경우에만 200 mM을 경험하게 된다. 비대칭적 염 농도를 사용하는 것이 가지는 또 다른 가능한 이점은 세공을 가로질러 유도되는 삼투 구배이다. 이러한 물의 순 유동을 사용하여 검출을 위해 뉴클레오티드를 세공 내로 끌어올 수 있다. 유사한 효과는 중성 삼투질, 예컨대 수크로스, 글리세롤 또는 PEG를 사용함으로써 달성될 수 있다. 또 다른 가능성은 상대적으로 낮은 수준의 KCl을 포함하는 용액을 사용하고, 효소 활성에는 지장을 덜 주는 추가의 전하 보유 종에 의존하는 것에 있다.
벌크 용액 중에 있는 동안 결합 단백질 또는 엑소뉴클레아제의 작용으로부터 서열을 보호하기 위해 분석되는 표적 서열을 공지된 보호 화학법과 조합할 수 있다. 이어서, 세공을 사용하여 보호 화학법을 제거할 수 있다. 이는 적용 전위하에 세공, 결합 단백질 또는 효소에 의해 하이브리드화되지 않는 보호기를 사용함으로써 (WO 2008/124107), 또는 세공에 매우 근접하게 고정되어 있을 때에는 결합 단백질 또는 효소에 의해 제거되는 보호 화학법을 사용함으로써 (문헌 [J Am Chem Soc. 2010 Dec 22;132(50):17961-72]) 달성될 수 있다.
가닥 서열분석
가닥 서열분석은 세공을 통과하는 핵산 중합체의 조절형의 단계식 전좌를 포함한다. 본 발명의 세공은 가닥 서열분석에 사용될 수 있다. 본 발명의 한 방법은 세공을 통과하는 표적 서열의 이동을 제어하기 위해 핵산 결합 단백질을 사용한다. 상기 단백질의 예로는 핵산 처리 효소, 예컨대 뉴클레아제, 폴리머라제, 토포이소머라제, 리가제 및 헬리카제, 및 비-촉매성 결합 단백질, 예컨대 핵산-결합 단백질 수퍼패밀리(Nucleic acid-binding protein superfamily) (50249)하에 SCOP (단백질의 구조 분류(Structural Classification of Proteins))에 의해 분류된 것을 포함하나, 이에 한정되지 않는다. 결합 단백질은 단일 가닥 결합 단백질 (SSB)일 수 있다.
핵산은 2개 이상의 뉴클레오티드를 포함하는 거대분자이다. 단백질에 결합된 핵산은 임의의 뉴클레오티드의 임의의 조합을 포함할 수 있다. 뉴클레오티드는 상기에서 논의된 것 중 임의의 것일 수 있다. 핵산은 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)일 수 있다. 핵산은 당업계에 공지된 임의의 합성 핵산, 예컨대 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 가지는 다른 합성 중합체일 수 있다. 단백질에 결합된 핵산은 단일 가닥, 예컨대 cDNA, RNA, GNA, TNA 또는 LNA, 또는 이중 가닥, 예컨대 DNA일 수 있다. 단일 가닥 핵산에 결합하는 단백질은, 이중 가닥 DNA가 그에 단백질이 결합하기 이전에 단일 가닥으로 해리되는 한, 이중 가닥 DNA의 서열을 분석하는 데 사용될 수 있다.
핵산 결합 단백질은 바람직하게 핵산 처리 효소이다. 핵산 처리 효소는 핵산과 상호작용하고, 그의 1개 이상의 특성을 변형시킬 수 있는 폴리펩티드이다. 효소는 핵산을 절단하여 개별 뉴클레오티드 또는 더 짧은 단쇄의 뉴클레오티드, 예컨대 디- 또는 트리뉴클레오티드를 형성함으로써 핵산을 변형시킬 수 있다. 효소는 핵산을 배향시키거나, 그를 특이 위치로 이동시킴으로써 핵산을 변형시킬 수 있다. 핵산 처리 효소는 표적 서열에 결합할 수 있고, 세공을 통과하는 그의 이동을 조절할 수 있는 한, 효소 활성을 보여야 할 필요는 없다. 예를 들어, 효소는 그의 효소 활성을 제거하기 위해 변형될 수 있거나, 또는 그가 효소로서 작용하지 못하도록 하는 조건하에서 사용될 수 있다. 그러한 조건은 하기에서 상세하게 논의된다.
핵산 처리 효소는 바람직하게 뉴클레오티드 분해 효소로부터 유도된 것이다. 효소의 구축물에 사용되는 핵산 처리 효소는 더욱 바람직하게는 효소 분류(EC: Enzyme Classification) 군 3.1.11, 3.1.13, 3.1.14, 3.1.15, 3.1.16, 3.1.21, 3.1.22, 3.1.25, 3.1.26, 3.1.27, 3.1.30 및 3.1.31 중 임의의 것의 구성원으로부터 유도된 것이다. 효소는 국제 출원 번호 PCT/GB10/000133 (공개 공보 WO 2010/086603)에 개시된 것 중 임의의 것일 수 있다.
바람직한 효소는 폴리머라제, 엑소뉴클레아제, 헬리카제 및 토포이소머라제, 예컨대 기라제이다. 적합한 효소로는 E. 콜라이로부터의 엑소뉴클레아제 I (서열 번호 6), E. 콜라이로부터의 엑소뉴클레아제 III (서열 번호 8), T. 써모필루스로부터의 RecJ (서열 번호 10) 및 박테리오파지 람다 엑소뉴클레아제 (서열 번호 12) 및 그의 변이체를 포함하나, 이에 한정되지 않는다. 서열 번호 10에 제시된 서열 또는 그의 변이체를 포함하는 3개의 서브유닛은 상호작용하여 삼량체 엑소뉴클레아제를 형성한다. 효소는 바람직하게 Phi29 DNA 폴리머라제 (서열 번호 4)에 기반한 것이다.
서열 번호 4, 6, 8, 10 또는 12의 변이체는 서열 번호 4, 6, 8, 10 또는 12의 것으로부터 변이되고, 핵산 결합 능력을 보유하는 아미노산 서열을 가지는 효소이다. 변이체는 핵산 결합을 촉진시키고/거나, 고염 농도 및/또는 실온에서 그의 활성을 촉진시키는 변형을 포함할 수 있다.
변이체는 바람직하게 서열 번호 4, 6, 8, 10 또는 12의 전장의 아미노산 서열에 걸쳐 아미노산 동일성 기준으로 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게는, 변이체 폴리펩티드는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 4, 6, 8, 10 또는 12의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 상동성, 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 200개 이상, 예를 들어, 230, 250, 270 또는 280개 이상의 연속된 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 아미노산이 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산된다. 변이체는 서열 번호 2를 참고로 하여 상기에서 논의된 방법 중 임의의 것으로 야생형 서열과 다를 수 있다. 효소는 상기에서 논의된 바와 같이 세공에 공유적으로 부착될 수 있다.
뉴클레오티드가 일련으로 무질서하게 세공의 감지 모이어티에 도달할 가능성은 없기 때문에, 효소는 개별 뉴클레오티드 서열분석을 위한 경우에서와 같이 세공 루멘에 매우 근접해 있을 필요는 없다.
단일 가닥 DNA 서열분석을 위한 2가지 전략법은 적용 전위에 따라 또는 그와 반대로, 시스에서 트랜스로 및 트랜스에서 시스로인 둘 모두로 나노세공을 통과하는 DNA의 전좌이다. 가닥 서열분석을 위해 가장 이로운 기전은 적용 전위하에서 나노세공을 통한 단일 가닥 DNA의 조절형 전좌이다. 이중 가닥 DNA에 대해 점진적으로 또는 진행적으로 작용하는 엑소뉴클레아제는 적용 전위하에 그를 통해 나머지 단일 가닥을 공급하는 세공의 시스 쪽에서, 또는 역방향 전위하에 트랜스 쪽에서 사용될 수 있다. 유사하게, 이중 가닥 DNA를 푸는 헬리카제 또한 유사한 방식으로 사용될 수 있다. 적용 전위에 대해 반대되는 가닥 전좌를 필요로 하는 서열분석에 적용될 수 있지만, DNA는 먼저 역방향 전위하에서 또는 전위가 없는 조건하에서 효소에 의해 "포획"되어야 한다. 이어서, 전위가 결합 후에 이전 방향으로 되돌아가게 되면, 가닥은 세공을 통해 시스에서 트랜스로 통과할 것이고, 전류 유동에 의해 확장된 입체구조로 유지될 수 있다. 단일 가닥 DNA 엑소뉴클레아제 또는 단일 가닥 DNA 의존 폴리머라제는 적용 전위에 대해 반대 방향으로 트랜스에서 시스로 세공을 통해 최근에 전좌된 단일 가닥을 조절형의 단계식 방식으로 풀백(pull back)시키는 분자 모터로서의 역할을 할 수 있다.
엑소뉴클레아제
-기반 방법
한 실시양태에서, 표적 핵산 서열의 특징을 규명하는 방법은 표적 서열을 엑소뉴클레아제 효소와 접촉시키는 단계를 포함한다. 상기에서 논의된 엑소뉴클레아제 효소 중 임의의 것이 본 방법에서 사용될 수 있다. 엑소뉴클레아제는 표적 서열의 한쪽 말단으로부터 개별 뉴클레오티드를 유리시킨다. 효소는 상기에서 논의된 바와 같이 세공에 공유적으로 부착될 수 있다.
엑소뉴클레아제는 전형적으로는 핵산 서열의 한쪽 말단에 래칭하여 상기 말단으로부터 한번에 뉴클레오티드 1개씩 서열을 분해하는 효소이다. 엑소뉴클레아제는 5'→3' 방향으로, 또는 3'→5' 방향으로 핵산을 분해할 수 있다. 엑소뉴클레아제가 결합하는 핵산의 말단은 전형적으로는 사용되는 효소의 선택 및/또는 당업계에 공지된 방법을 사용함으로써 결정된다. 전형적으로 엑소뉴클레아제의 핵산 서열의 특정 말단에의 결합을 방해하거나, 또는 촉진시키는 데 핵산 서열의 한쪽 말단의 히드록실 기 또는 캡 구조가 사용될 수 있다.
본 방법은 핵산 서열을 엑소뉴클레아제와 접촉시켜 상기에서 논의된 바와 같이 뉴클레오티드의 일부의 특징을 규명하거나, 그를 확인할 수 있을 정도의 속도로 뉴클레오티드를 핵산의 말단으로부터 분해시키는 단계를 포함한다. 이를 수행하는 방법은 당업계에 주지되어 있다. 예를 들어, 에드만 분해(Edman degradation)를 사용하여 폴리펩티드의 말단으로부터 단일 아미노산을 연속하여 분해함으로써 이를 고성능 액체 크로마토그래피 (HPLC)를 이용하여 확인할 수 있다. 본 발명에서는 상동성 방법이 사용될 수 있다.
엑소뉴클레아제의 작용 속도는 전형적으로 야생형 엑소뉴클레아제의 최적의 속도보다 느리다. 본 발명의 방법에서 엑소뉴클레아제의 적합한 활성 속도는 1초당 0.5 내지 1,000개의 뉴클레오티드, 1초당 0.6 내지 500개의 뉴클레오티드, 1초당 0.7 내지 200개의 뉴클레오티드, 1초당 0.8 내지 100개의 뉴클레오티드, 1초당 0.9 내지 50 뉴클레오티드, 또는 1초당 1 내지 20개 내지 10개의 뉴클레오티드를 분해하는 것을 포함한다. 상기 속도는 1초당 1, 10, 100, 500 또는 1,000개의 뉴클레오티드인 것인 바람직하다. 엑소뉴클레아제의 적합한 활성 속도는 다양한 방법으로 달성될 수 있다. 예를 들어, 최적의 활성 속도가 감소된 변이체 엑소뉴클레아제가 본 발명에 따라 사용될 수 있다.
Msp
및
Phi29
DNA
폴리머라제
바람직한 실시양태에서, 특징 규명, 예컨대 가닥 서열분석은 Msp로부터 유래된 세공 및 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 방법은 (a) 표적 서열을 Msp로부터 유래된 세공 및 Phi29 DNA 폴리머라제와 접촉시켜, 상기 폴리머라제가 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, (b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여 예컨대 표적 서열의 서열을 측정하는 것과 같이, 특징을 규명하는 단계를 포함하며, 여기서 단계 (a) 및 (b)는 세공을 가로질러 적용되는 전압을 사용하여 수행된다. 표적 서열이 Phi29 DNA 폴리머라제 및 Msp로부터 유래된 세공과 접촉할 경우, 표적 서열은 먼저 Phi29 DNA 폴리머라제와 함께 복합체를 형성한다. 세공을 가로질러 전압이 적용되었을 때, 표적 서열/Phi29 DNA 폴리머라제 복합체는 세공과 함께 복합체를 형성하고, 세공을 통과하는 표적 서열의 이동을 조절한다.
이러한 실시양태는 예상 밖의 3가지 장점을 가지고 있다. 첫번째로, 표적 서열은 상업적으로 실행 가능한 속도로 세공을 통해 이동하지만, 효과적으로 서열분석이 이루어질 수 있다. 표적 서열은 헤몰리신 세공을 통해 이동할 때보다 더욱 빠르게 Msp 세공을 통해 이동한다. 두번째로, 핵산이 세공을 통해 이동함에 따라 전류 범위는 증가하는 것이 관찰되는데, 이로써 서열은 보다 쉽게 측정될 수 있다. 세번째로, 특이 세공 및 폴리머라제가 함께 사용될 때, 전류 변동이 감소하는 것이 관찰되며, 이로써 신호 대 노이즈 비는 증가하게 된다.
상기 기술된 임의의 핵산 서열은 특징 규명될 수 있거나, 또는 서열분석될 수 있다. 핵산 서열 중 적어도 일부는 이중 가닥인 것이 바람직하다.
세공은 상기에서 논의된 세공 중 임의의 것일 수 있다. 세공은 바람직하게 본 발명의 세공이다. 세공은 서열 번호 2, 16, 17 또는 18에 제시된 서열 또는 그의 변이체를 포함하는 8개의 단량체를 포함할 수 있다. 세공이 본 발명의 돌연변이 중 임의의 것을 포함할 필요는 없다.
야생형 Phi29 DNA 폴리머라제는 폴리머라제 및 엑소뉴클레아제 활성을 가진다. 이는 또한 올바른 조건하에서는 이중 가닥 핵산을 언지핑할 수 있다. 그러므로, 효소는 3가지 모드로 작동할 수 있다. 이는 하기에서 더욱 상세하게 논의된다.
Phi29 DNA 폴리머라제는 서열 번호 4에 제시된 서열 또는 그의 변이체를 포함할 수 있다. 서열 번호 4의 변이체는 서열 번호 4의 것으로부터 변이되고, 핵산 결합 활성을 보유하는 아미노산 서열을 가지는 효소이다. 변이체는 하기에서 논의되는 3가지 모드 중 1개 이상의 모드로 작동할 수 있다. 바람직하게, 변이체는 3가지 모드 모두로 작동한다. 변이체는 핵산의 처리를 촉진시키고/거나, 고염 농도 및/또는 실온에서 그의 활성을 촉진시키는 변형을 포함할 수 있다.
변이체는 바람직하게 서열 번호 4의 전장의 아미노산 서열에 걸쳐 아미노산 동일성 기준으로 상기 서열과 40% 이상 상동성일 것이다. 더욱 바람직하게는, 변이체 폴리펩티드는 전체 서열에 걸쳐 아미노산 동일성 기준으로 서열 번호 4의 아미노산 서열과 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상 및 더욱 바람직하게는, 95% 이상, 97% 이상 또는 99% 이상 상동성일 수 있다. 200개 이상, 예를 들어, 230, 250, 270 또는 280개 이상의 연속된 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85% 이상, 90% 이상 또는 95% 이상으로 아미노산이 동일할 수 있다 ("강력한 상동성"). 상동성은 상기 기술된 바와 같이 계산된다. 변이체는 서열 번호 2를 참고로 하여 상기에서 논의된 방법 중 임의의 것으로 야생형 서열과 다를 수 있다. 효소는 상기에서 논의된 바와 같이 세공에 공유적으로 부착될 수 있다.
상기에서 논의된 시스템, 장치, 또는 조건 중 임의의 것이 본 바람직한 실시양태에 따라 사용될 수 있다. 염 농도는 전형적으로 0.15 M 내지 0.6 M이다. 염 은 바람직하게 KCl이다.
본 방법은 3가지 모드의 Phi29 DNA 폴리머라제에 기초하여 3가지 바람직한 방법 중 하나로 수행될 수 있다. 각 방법은 서열을 교정(proof reading)하는 방법을 포함한다. 첫번째, 본 방법은 바람직하게 폴리머라제로서 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 실시양태에서, 단계 (a) 및 (b)를 유리 뉴클레오티드 및 효소 보조인자의 존재하에서 수행하여, 폴리머라제가 적용 전압으로부터 생성되는 장(field)에 대해 반대로 표적 서열을 세공을 통해 이동시키도록 한다. 표적 서열은 5'→3' 방향으로 이동한다. 유리 뉴클레오티드는 상기에서 논의된 개별 뉴클레오티드 중 하나 이상의 임의의 것일 수 있다. 효소 보조인자는 Phi29 DNA 폴리머라제가 폴리머라제 또는 엑소뉴클레아제로서 작용할 수 있도록 하는 인자이다. 효소 보조인자는 바람직하게 2가 금속 양이온이다. 2가 금속 양이온은 바람직하게 Mg2 +, Mn2+, Ca2 + 또는 Co2 +이다. 효소 보조인자는 가장 바람직하게는 Mg2+이다. 본 방법은 바람직하게 (c) 유리 뉴클레오티드를 제거하여, 폴리머라제가 적용 전압으로부터 생성되는 장을 따라 (즉, 3'→5' 방향으로) 표적 서열을 세공을 통해 이동시키도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (d) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 단계 (b)에서 수득된 표적 서열의 서열을 교정하는 단계를 추가로 포함하며, 여기서 단계 (c) 및 (d)는 또한 세공을 가로질러 적용되는 전압을 사용하여 수행된다.
두번째로, 본 방법은 바람직하게 엑소뉴클레아제로서 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 실시양태에서, 단계 (a) 및 (b)를 유리 뉴클레오티드의 부재하에 및 효소 보조인자의 존재하에서 수행하여, 폴리머라제가 적용 전압으로부터 생성되는 장을 따라 표적 서열을 세공을 통해 이동시키도록 한다. 표적 서열은 3'→5' 방향으로 이동한다. 본 방법은 바람직하게 (c) 유리 뉴클레오티드를 부가하여, 폴리머라제가 적용 전압으로부터 생성되는 장에 대해 반대로 (즉, 5'→3' 방향으로) 표적 서열을 세공을 통해 이동시키도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (d) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 단계 (b)에서 수득된 표적 서열의 서열을 교정하는 단계를 추가로 포함하며, 여기서 단계 (c) 및 (d)는 또한 세공을 가로질러 적용되는 전압을 사용하여 수행된다.
세번째로, 본 방법은 바람직하게 언지핑 모드로 Phi29 DNA 폴리머라제를 사용함으로써 수행된다. 본 실시양태에서, 단계 (a) 및 (b)를 유리 뉴클레오티드의 부재하 및 효소 보조인자의 부재하에서 수행하여, 폴리머라제가 (그가 언지핑됨에 따라) 적용 전압으로부터 생성되는 장을 따라 표적 서열의 세공을 통한 이동을 제어하도록 한다. 본 실시양태에서, 폴리머라제는 적용되는 전압의 영향하에서 표적 서열이 세공을 통해 매우 빠르게 이동하지 못하도록 막는 브레이크와 같은 역할을 한다. 본 방법은 바람직하게 (c) 세공을 가로질러 적용되는 전압을 강하시켜, 표적 서열이 세공을 통해 반대 방향으로 단계 (a) 및 (b)의 방향으로 (즉, 재-어닐링됨에 따라) 이동하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계, 및 (d) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 단계 (b)에서 수득된 표적 서열의 서열을 교정하는 단계를 추가로 포함하며, 여기서 단계 (c) 및 (d)는 또한 세공을 가로질러 적용되는 전압을 사용하여 수행된다.
본 발명은 또한 (a) 표적 핵산 서열의 존재하에서 Msp로부터 유래된 세공을 Phi29 DNA 폴리머라제와 접촉시키는 단계, 및 (b) 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 표적 핵산 서열의 서열분석을 위한 센서를 형성하는 단계를 포함하는, 표적 핵산 서열의 서열분석을 위한 센서를 형성하는 방법을 제공한다. 본 발명은 추가로 핵산 서열의 존재하에서 Phi29 DNA 폴리머라제를 Msp로부터 유래된 세공과 접촉시키는 단계, 및 세공을 가로질러 전압을 적용하여 세공과 폴리머라제 사이에 복합체를 형성하고, 이로써 Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 단계를 포함하는, Phi29 DNA 폴리머라제의 활성 속도를 증가시키는 방법을 제공한다.
키트
본 발명은 또한 예컨대 표적 핵산 서열의 서열분석과 같이 특징 규명을 위한 키트를 제공한다. 한 키트는 (a) 본 발명의 세공 및 (b) 핵산 처리 효소를 포함한다. 또 다른 키트는 (a) Msp로부터 유래된 세공 및 (b) Phi29 DNA 폴리머라제를 포함한다. 본 발명의 방법을 참고로 하여 상기에서 논의된 실시양태 중 임의의 것이 본 발명의 키트에 동등하게 적용될 수 있다.
본 발명의 키트는 추가로 상기에서 언급된 실시양태 중 임의의 것이 수행될 수 있도록 하는 하나 이상의 다른 시약 또는 장치를 포함할 수 있다. 그러한 시약 또는 장치로는 하기: 적합한 완충제(들) (수용액), 대상체로부터 샘플을 수득하기 위한 수단 (예컨대 베쓸 또는 바늘을 포함하는 장치), 폴리뉴클레오티드 서열을 증폭 및/또는 발현시키기 위한 수단, 상기 정의된 것과 같은 막, 또는 전압 또는 패치 클램프 장치 중 하나 이상을 포함한다. 시약은 유체 샘플이 시약을 재현탁시킬 수 있도록 건식 상태로 키트 중에 존재할 수 있다. 키트는 또한 임의적으로 본 발명의 방법에서의 키트 사용 설명서 또는 본 방법은 어떤 환자에 대해 사용될 수 있는지에 관한 상세한 설명을 포함할 수 있다. 키트는 임의적으로 뉴클레오티드를 포함할 수 있다.
장치
본 발명은 또한 예컨대 샘플 중의 표적 핵산 서열의 서열분석과 같이 특징 규명을 위한 장치를 제공한다. 장치는 (a) 다수의 본 발명의 세공 및 (b) 다수의 핵산 처리 효소를 포함할 수 있다. 별법으로, 본 발명은 다수의 Msp로부터 유래된 세공 및 다수의 Phi29 DNA 폴리머라제를 포함할 수 있다. 장치는 임의의 통상적인 피분석물 분석용 장치, 예컨대 어레이 또는 칩일 수 있다.
장치는 바람직하게
- 다수의 세공을 지지할 수 있으며 세공 및 효소를 사용하여 핵산 특징 규명 또는 서열분석을 수행하도록 작동가능한 센서 장치;
- 특징 규명 또는 서열분석 수행용 물질을 담아두기 위한 1개 이상의 저장소;
- 물질을 1개 이상의 저장소로부터 센서 장치로 제어가능하게 공급하도록 구성된 유체 시스템; 및
- 각 샘플을 수용하기 위한 다수의 용기를 포함하며, 상기 유체 시스템은 샘플을 용기로부터 센서 장치로 선택적으로 공급하도록 구성된 것이다. 장치는 국제 출원 번호 PCT/GB10/000789 (공개 공보 WO 2010/122293), 국제 출원 번호 PCT/GB10/002206 (아직 공개되지 않음) 또는 국제 출원 번호 PCT/US99/25679 (공개 공보 WO 00/28312)에 기술되어 있는 것 중 임의의 것일 수 있다.
하기 실시예가 본 발명을 설명한다:
실시예
1
동종올리고머는 단량체 단위 모두가 동일한 세공이다. 단량체 단위는 자가 조립하기 때문에, 이는 제조하기 가장 간단한 구축물이다. 염기 판독기 특성을 개선시키기 위한 본 발명자들의 전략법은 하기 카테고리로 분리될 수 있다:
· 입체구조 (아미노산 잔기의 크기를 증가 또는 축소)
· 전하 (DNA 와 상호작용하는 + ve 전하 도입)
· 수소 결합 (염기쌍에 수소 결합할 수 있는 잔기)
· 파이 스태킹 (비국소화된 전자 파이계를 통해 상호작용하는 아미노산)
입체구조/파이
스태킹
증가 (모두
NNN
-
RRK
배경):
입체구조 - 벌크한 잔기 (예컨대 페닐알라닌, 트립토판, 티로신, 히스티딘)치환
파이 스태킹 - 방향족 잔기 (예컨대 페닐알라닌, 트립토판, 티로신, 히스티딘) 치환
하기 표 (6-11)에는 서열 번호 2에 대한 돌연변이가 제시되어 있다. B1 = 서열 번호 2.
입체구조 감소 - 크기가 보다 작은 잔기 (예컨대 세린, 트레오닌, 글리신, 알라닌, 발린) 치환
전하 - 양전하 잔기(예컨대 아르기닌, 리신, 히스티딘) 치환
수소 결합 - 결합능이 있는 잔기 (예컨대 아스파라긴, 글루타민, 티로신, 히스티딘) 치환
동종올리고머는 또한 반응성 기를 포함하도록 변형될 수 있고, 이는 이어서 화학적으로 변형될 수 있다.
실시예
2
상기 단량체 단위를 조합하여 신규한 올리고머 세공을 제조할 수 있다. 올리고머가 1개 초과의 상이한 서브유닛을 포함할 때 (예컨대 MS -( MutA ) 6 ( MutB ) 1 (MutC) 1 ), 세공은 이종올리고머이다. 이종올리고머에서는 전형적으로 오직 한 단위만이 변형된다 (예컨대 MS -( MutA ) 7 ( MutB ) 1 ). 다른 비율의 이종올리고머 또한 형성될 수 있다 (예컨대 MS -( MutA ) 6 ( MutB ) 2 ). 서브유닛은 또한 서열 번호 2를 포함할 수 있다.
이종올리고머가 가지는 장점은 (모든 단량체 단위에 변화를 도입한다기 보다는) 세공에 단일로 화학적으로 변화시킬 수 있다는 점이다. 이는 동종올리고머보다는 구조에 대해서 덜 급격한 변화이며, 이를 통해 동종올리고머의 경우에는 작동하지 않은 위치의 세공 내로 잔기를 도입할 수 있다. DNA와 상호작용하는 단일 잔기는 다중 단위에 비하여 유익할 수 있다 (예컨대 팔량체 상의 8개의 Arg에 비하여 이종팔량체 상의 단일의 Arg). 돌연변이체는 또한 조합되어 같은 잔기에서 상이한 효과를 발휘할 수 있는데, 그 예로는 하나의 크기는 증가시키면서, 7개의 단위의 크기는 축소시키는 것이 있을 수 있다 (예컨대 MS -( D90G ) 8 ( D90Y ) 1 ).
돌연변이체 디자인 규칙은 동종올리고머에 대하여 상기 제시된 것과 유사할 것이다.
단일 입체구조 잔기 도입
단일 하전된 잔기 도입
단일 반응성 잔기 도입
실시예
3
화학적 변형을 위한 단일 반응성 잔기 도입.
실시예
4
하기 표에는 본 발명의 돌연변이체 세공이 요약되어 있다. 첫번째 것은 동종올리고머에 관한 것이고, 두번째 것은 이종올리고머에 관한 것이다.
실시예
5 -
MspA
와
HL
의 비교
본 발명자들은 세공을 통과하는 DNA 가닥의 이동을 조절하기 위해 분자 모터로서의 Phi29 DNA 폴리머라제 (DNAP)를 돌연변이체 MspA 나노세공과 조합하였다. 세공을 가로질러 전압을 적용하였고, 나노세공 양측의 염 용액 중 이온 이동으로부터 전류가 생성되었다. DNA가 세공을 통해 이동함에 따라, 세공을 통과하는 이온 유동은 DNA에 대하여 변화하였다. 이러한 정보는 서열에 의존하는 것으로 나타났다.
본 발명자들은 헤몰리신의 돌연변이체 형태를 MspA, 특히 MS-(B1)8과 비교하였다. MspA의 전류 범위는 헤몰리신 (HL)과 비교하여 더 높았다. 추가로, MspA의 전류 범위는 또한 DNA의 가닥이 세공으로 쓰레딩되었을 때(threaded), 더 크다.
본 발명자들은 MspA와 Phi29 DNAP를 함께 조합함에 따라 예상하지 못했던 MspA의 놀라운 특징들이 다수 존재한다는 것을 밝혀냈다. 주요 차이는:
1. HL과 비교하였을 때, 더욱 신속한 가닥 이동 (언지핑 모드).
2. 세공을 통과하는 가닥 이동시, 전류 범위 증가.
3. HL 돌연변이체와 비교하였을 때, 전류 수준 변동 감소.
더욱 신속한 가닥 이동
134 mer ssDNA 주형 (서열 번호 13)을 84 mer ssDNA (서열 번호 14)에 하이브리드화시켜 50 mer ssDNA 5' 오버행을 가지는 84 mer dsDNA 주형을 형성하였다. 이 가닥은 언지핑 모드로 Phi29 DNAP를 이용하여 MS-(B1)8 MspA 돌연변이체 및 헤몰리신 돌연변이체를 통해 이동하였다. 모두 실온하에 10 mM Hepes (pH 8.0), 1 mM EDTA, 1 mM DTT에서 2개의 런(run): 하나는 400 mM KCl에서, 나머지 다른 하나는 600 mM KCl에서 획득하였다. 각 돌연변이체 구축물에 대해 적용 전위를 최적화시켰다; HL은 220 mV 에서 및 MspA는 180 mV에서 실행되었다.
전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.
모든 언지핑 실행의 경우, 언지핑 속도가 가닥 전체에 걸쳐 일관되지는 않았다.
이는 이벤트 인덱스의 사분위수로 나뉜, 이벤트 지속 기간의 평균을 계산함으로써 제시될 수 있다 (도 1). 제1 사분위수는 다음 사분위수보다 지속 기간이 훨씬 더 긴 이벤트를 제공하였고, 이는 HL 및 MspA 둘 모두에 대해 해당되었다. 제1 사분위수의 경우, 평균 이벤트 길이는 MspA의 경우, 400 mM KCl일 때 가장 짧고, HL의 경우는 600 mM일 때 가장 짧았다. 그러나, Q2, Q3 및 Q4에서, MspA의 경우, 두 염 조건 모두에서 보다 짧은 이벤트가 일어났다. 신호 대 노이즈가 충분하다고 가정할 때, 짧은 이벤트는 세공을 통과하는 DNA 가닥의 빠른 이동을 나타내는 것이고, 이로써, 실험 처리량은 증가하게 되는 바, 짧은 이벤트가 바람직할 수 있다.
전류 범위 증가 및 변동 감소
본원에 기술된 나노세공 실험에서, 전류 수준은 주로 염 농도, 적용된 전압, 및 온도에 의존한다. 600 mM KCl, 10 mM Hepes, 1 mM EDTA, 1 mM DTT (pH 8.0), +220 mV로 물리적 조건을 설정하고, Phi29 DNA 폴리머라제를 사용하여 언지핑 모드로 HL 및 MS-(B1)8 MspA 돌연변이체를 비교하였다. 본 실험에서 사용되는 DNA는 34 mer 단일 가닥 5' 오버행 (서열 번호 15)을 가지는 100 mer 헤어핀이었다. 런을 실온에서 수행하였다.
전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다 (도 2 및 3).
범위가 대략 20 pA인 HL 돌연변이체와 비교해 볼 때, MspA 돌연변이체는 대략 50 pA로 유의적으로 더 큰 전류 범위를 제공한다는 것이 본 실험으로부터 분명해졌다 (도 2 및 3). 큰 전류 범위는 더욱 큰 신호 대 노이즈 비를 제공할 것이며, 이로써 더욱 쉽게 상이한 전류 상태를 구별할 수 있게 되는 바, 이롭다. 이는 N 염기가 전류 신호에 기여할 수 있고, 이로써 4N 가능한 전류 상태에 이르게 될 때, 서열분석 적용에 있어서 특이 유익하다.
상태 변동 또한 HL과 비교하였을 때, MspA 돌연변이체의 경우에 감소된다. 이는 상기 자취에서 이벤트의 표준 편차로 제시된다 (도 2 및 3). 상기 가닥의 경우, MspA 가닥에 대한 모든 이벤트 전체 걸친 평균의 표준 편차는 HL의 경우, 4.5인 것과 비교하여 3.6이었다. 상태 변동이 낮은 것은 이를 통해 이벤트 전류 수준을 정확하게 추정할 수 있기 때문에 바람직할 수 있다.
실시예
6 -
MS
-(B1)8 기준과
MS
-(B1-
I105
)8 돌연변이체의 개방 세공 전류 비교
MspA 세공의 전류 수준은 단백질 중 I105 위치를 돌연변이화시킴으로써 조절될 수 있다. 본 발명자들은 개방 세공 전류가 MspA 단량체에 대한 단일 돌연변이화의 결과로서 80% 초과만큼 증가할 수 있다는 것을 입증하였다.
하기 조건: 400 mM KCl, 10 mM Hepes (pH 8.0), 실온하에 단일 채널을 지질 막 내로 삽입하였다. -200 mV 내지 200 mV의 적용 전위 범위에 걸쳐 개방 세공 전류 수준을 기록하여 IV 곡선을 작성하였다. 여러 세공에 대해 실험을 반복함으로써 샘플의 분포를 평가하였다. IV 곡선 런으로부터 얻은 데이터의 예는 (도 4에서) 볼 수 있다.
본 발명자들의 실험에서, 기준 MS-(B1)8 돌연변이체가 +160 mV에서 대략 150 pA의 개방 세공 전류를 가지는 세공을 생성하였다 (도 5).
본 실험을 MS-(B1-I105Y)8 돌연변이체에 대해 반복하였는데, 이는 잔류 전류가 보다 높은 다수의 세공을 나타내었다. 이러한 채널의 경우, 개방 세공 전류는 +160 mV에서 대략 200 pA였다 (도 6).
본 실험을 MS-(B1-I105N)8 돌연변이체에 대해 반복하였는데, 이는 2개의 주된 전류 수준 분포를 나타내었다. 16개의 세공 중 10개가 조밀한 분포로 더 높은 잔류 전류를 제공하였다. 이러한 채널의 경우, 개방 세공 전류는 +160 mV에서 대략 280 pA였다 (도 7).
실시예
7 - 자발적으로 전도도를 변화시키는
MS
-(B1-
I105A
)8 세공
MspA 돌연변이체 세공은 전기 기록 실험 동안 자발적으로 전도도를 변화시키는 것으로 관찰되었다.
MS-(B1-I105A)8 돌연변이체 세공을 사용하여 실시예 6에 기술된 바와 같이 전기 측정을 하였다.
단일 MspA 돌연변이체 세공은 고 전도도와 저 전도도 상태 사이를 자발적으로 상호교환할 수 있다 (도 8). 이는 MspA에 대한 돌연변이를 통해 기준 MS-(B1)8 세공에서는 거의 관찰되지 않는 입체구조 변화가 일어날 수 있다는 것을 제안하는 것이다. I105 위치에서의 돌연변이는 세공의 고 전도도 상태를 안정화시키는 것도 가능하다.
실시예
8 -
MS
-(B1-
I105A
)8 세공과의 비교로서, 기준
MS
-(B1)8 세공을 통해 DNA를 이동시킬 때의
DNA
전류 비교
400 mM KCl, 10 mM Hepes, 1 mM EDTA, 1 mM DTT (pH 8.0), +180 mV로 물리적 조건을 설정하고, Phi29 DNA 폴리머라제를 사용하여 언지핑 모드로 MS-(B1)8 세공 및 MS-(B1-I105N)8 세공을 비교하였다. 본 실험에서 사용되는 DNA는 34 mer 단일 가닥 5' 오버행 (서열 번호 15)을 가지는 100 mer 헤어핀이었다. 런을 실온에서 수행하였다.
전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.
MS-(B1)8 돌연변이체를 통해 이동하는 DNA 가닥으로부터의 전류 수준의 범위는 상기 조건하에서 ~30 pA였다 (도 9). MS-(B1-I105A)8 돌연변이체를 사용하여 같은 실험을 반복하였는데, 전류 수준은 같은 DNA 가닥에 대하여 ~40 pA 범위를 보였다 (도 10). 나노세공 내에서 뉴클레오티드의 조합을 판별하는 데에는 MS-(I105A)8 돌연변이체의 보다 큰 전류 범위가 바람직할 수 있다.
실시예
9 -
MS
-(B1)8 기준과
MS
-(B1-
L88N
)8 돌연변이체의 신호 노이즈 비교
MspA 세공의 노이즈 수준은 MspA 단량체 서열 중 L88 위치를 돌연변이화시킴으로써 조절될 수 있다. 노이즈 수준은 MspA 단량체에 대한 단일 돌연변이화의 결과로서 19%만큼 감소할 수 있다는 것이 입증되었다.
본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 헬리카제를 이용함으로써 전좌 모드로 MS-(B1)8 세공 및 MS-(B1-L88N)8 세공을 비교하였다.
물질
PhiX174의 ~400 bp 단편을 증폭시키기 위해 프라이머를 디자인하였다. 상기 프라이머의 각각의 5'-말단은 동종중합체 스트레치 또는 10개의 뉴클레오티드로 된 동종중합체 섹션의 반복 단위부인 50개의 뉴클레오티드 비-상보적(complimentary) 영역을 포함한다. 이는 나노세공을 통과하는 상기 가닥의 전자 조절을 위한 식별자로서 뿐만 아니라, 전자의 방향성을 결정짓는 데에도 역할을 한다. 추가로, 정방향 프라이머의 5'-말단은 "캡핑"되어 4개의 2'-O-메틸-우라실 (mU) 뉴클레오티드를 포함하고, 역방향 프라이머의 5'-말단은 화학적으로 인산화되었다. 이어서, 상기 프라이머 변형을 통해 람다 엑소뉴클레아제를 사용하여 오직 안티센스 가닥만을 지배적으로 분해하는 것을 조절할 수 있었다. mU 캡핑은 뉴클레아제 분해로부터 센스 가닥을 보호하는 반면, 안티센스 가닥의 5'의 PO4는 그를 촉진시켰다. 그러므로, 람다 엑소뉴클레아제와의 인큐베이션 후, 이중체 중 오직 센스 가닥만이 온전한 상태 그대로 유지되고, 즉, 단일 가닥 DNA (ssDNA)로 남게 되었다. 이어서, 앞서 기술된 바와 같이, 생성된 ssDNA를 PAGE 정제하였다.
본 실험에서 사용된 DNA 기질 디자인은 도 11에 제시되어 있다 (서열 번호 19 및 20 (하기 제시되는 서열 및 태그)). DNA 기질은 나노세공에 의한 포획을 돕기 위한 50T 5'-리더와 함께, PhiX로부터의 ssDNA의 400개의 염기 섹션으로 구성되었다. 이중층 표면 상에 DNA를 강화시키고, 이로써 포획 효율을 개선시키기 위하여, 3' 콜레스테롤 태그 (3' 콜레스테릴-TEG)를 포함하는 프라이머를 50T 리더 바로 뒤의 상기 가닥에 어닐링시켰다.
서열 번호 19
서열 번호 20 (+ 3' 콜레스테릴-TEG 태그)
실험 방법
완충 처리된 용액: 400 mM NaCl, 10 mM Hepes (pH 8.0), 1 mM ATP, 1 mM MgCl2, 1 mM DTT
나노세공: MS(B1)8 MspA
MS(B1-L88N)8 MspA
효소: 헬리카제
1,2-디피타노일-글리세로-3-포스포콜린 지질 (아반티 폴라 리피드(Avanti Polar Lipids)) 이중층에 삽입된 단일 MspA 나노세공으로부터 전기 측정을 하였다. 2개의 1 mL 완충 처리된 용액을 분리하면서, 몬탈-뮐러(Montal-Mueller) 기법을 통해 (주문 제작된 델린(Delrin) 챔버 중) 20 ㎛ 두께의 PTFE 필름에서 개구부 직경이 ~100 ㎛인 이중층을 형성하였다. 모든 실험은 언급된 완충 처리된 용액 중에서 수행하였다. 1440A 디지타이저가 장착된 아폭스패치 200B(Axopatch 200B) 증폭기 (몰레큘러 디바이시즈(Molecular Devices)) 상에서 단일 채널 전류를 측정하였다. (나노세공 및 효소/DNA 둘 모두가 첨가되는) 시스 구획을 아폭스패치 헤드스테이지의 접지에 연결하고, 트랜스 구획을 헤드스테이지의 활성 전극에 연결시키기 위해 Ag/AgCl 전극을 완충 처리된 용액에 연결시켰다.
이중층에서 MS(B1)8 또는 MS(B1-L88N)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 19 및 20) 및 헬리카제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다 (DNA = 1.5 nM, 효소 = 1 μM). 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.15 nM, 효소 = 0.1 μM이 되도록 만들었다). 필요에 따라 2가 금속 (1 mM MgCl2) 및 NTP (1 mM ATP)를 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시시켰다. 실험은 +140 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.
MspA 세공 MS-(B1)8을 사용하였을 때, +140 mV의 적용 전위에서 검출된 이벤트 중 31.08%의 표준 편차가 >2.0이었다 (추가 데이터는 하기 표 18에 요약되어 있다). 본 실험을 MS-(B1-L88N)8 돌연변이체에 대해 반복하였는데, +140 mV의 적용 전위에서 검출된 이벤트 중 단 12.38%만의 표준 편차가 >2.0이었다 (추가 데이터는 하기 표 18에 요약되어 있다). 그러므로, MspA 단량체 서열 중 L88에서의 점 돌연변이는 관찰되는 노이즈 범위를 19%만큼 감소시켰다.
실시예
10 -
MS
-(B1)8 기준과
MS
-(B1-
L88N
)8,
MS
-(B1-
L88S
)8 및
MS
-(B1-L88Q)8 돌연변이체의 신호
노이즈
비교
MspA 세공의 노이즈 수준은 단백질 중 L88 위치를 돌연변이화시킴으로써 변경될 수 있다. 노이즈 수준은 MspA 단량체에 대한 단일 돌연변이화의 결과로서 감소될 수 있다는 것이 입증되었다.
본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 Phi29 DNA 폴리머라제를 이용함으로써 언지핑 모드로 MS-(B1)8 세공과 MS-(B1-L88N)8, MS-(B1-L88S)8 및 MS-(B1-L88Q)8 세공을 비교하였다. 본 실시예에서 기술된 실험 모두에서 사용된 DNA 기질 디자인은 도 12에 제시되어 있다 (서열 번호 21, 22 및 23). 서열 번호 23은 하기 제시된 바와 같이, IDT Int Spacer 9 (iSp9) 및 3' 콜레스테릴-TEG (3CholTEG)로 태깅하였다. +180 mV의 적용 전위에서 실온하에 런을 수행하였다.
서열 번호 23:
실험 방법
완충 처리된 용액: 400 mM KCl, 10 mM Hepes (pH 8.0), 1 mM EDTA, 1 mM DTT
나노세공: MS(B1)8 MspA;
MS-(B1-L88N)8 MspA;
MS-(B1-L88S)8 MspA;
MS-(B1-L88Q)8 MspA;
효소: Phi29 DNA 폴리머라제 (서열 번호 4)
실시예 9에 기술된 바와 같이 전기 측정을 하였다. 이중층에서 MS(B1)8, MS(B1-L88N)8, MS(B1-L88S)8 또는 MS(B1-L88Q)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 21, 22 및 23) 및 Phi29 DNA 폴리머라제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다. 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 폴리머라제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.5 nM, 효소 = 0.1 μM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.
본 실험에서, 기준 MS-(B1)8 돌연변이체는 +180 mV에서 높은 잡은 수준을 보였다 (76.15%의 표준 편차가 > 2.0, 하기 표 19 참조). 시험된 다른 나머지 3개의 돌연변이체인 L88 위치에 단일의 점 돌연변이를 가지고 있는 (MS-(B1-L88N)8, MS-(B1-L88S)8 및 MS-(B1-L88Q)8)은 모두 같은 DNA 가닥 서열에 걸쳐 기준 세공보다 노이즈 수준이 더 낮은 것으로 관찰되었다 (표 19 참조). 그러므로, MspA 단량체 서열 중 L88 위치에 점 돌연변이를 적용시킴으로써 신호 노이즈를 감소시킬 수 있었다.
실시예
11 -
MS
-(B1)8 기준과 다른
MspA
돌연변이체의 전체 신호 범위 비교
MspA 세공의 신호 범위는 MspA 단백질 단량체 서열 중 다양한 위치를 돌연변이화시킴으로써 증가될 수 있다.
본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 Phi29 DNA 폴리머라제를 이용함으로써 언지핑 모드로 MS-(B1)8 세공을 하기 세공- MS-(B1-D90Q)8, MS-(B1-I105L)8, MS-(B1-I105Y)8, MS-(B1-I89Y-D90S)8, MS-(B1-N86T)8 및 MS-(B1-S103G)8 세공과 비교하였다. 본 실시예에서 기술된 실험 모두에서 사용된 DNA 기질 디자인은 도 12에 제시되어 있다 (서열 번호 21, 22 및 23). iSp9 및 3CholTEG로 태깅된 서열 번호 23은 상기에 제시되어 있다. +180 mV의 적용 전위에서 실온하에 런을 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.
실험 방법
완충 처리된 용액: 400 mM KCl, 10 mM Hepes (pH 8.0), 1 mM EDTA, 1 mM DTT
나노세공: MS(B1)8 MspA;
MS-(B1-D90Q)8 MspA;
MS-(B1-I105L)8 MspA;
MS-(B1-I105Y)8 MspA;
MS-(B1-I89Y-D90S)8 MspA;
MS-(B1-N86T)8 MspA;
MS-(B1-S103G)8 MspA;
효소: Phi29 DNA 폴리머라제 (서열 번호 4)
실시예 10에 기술된 바와 같이 전기 측정을 하였다. 이중층에서 MS(B1)8, MS(B1-D90Q)8, MS(B1-I105L)8, MS(B1-I105Y)8, MS-(B1-I189Y-D90S)8, MS-(B1-N86T)8 또는 MS-(B1-S103G)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 21, 22 및 23) 및 Phi29 DNA 폴리머라제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다. 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 폴리머라제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.5 nM, 효소 = 0.1 μM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.
본 실험에서, 기준 MS-(B1)8 돌연변이체는 +180 mV에서 35 pA인 최대 범위를 보였다 (표 20). 시험된 다른 나머지 6개의 돌연변이체인 (MS-(B1-D90Q)8, MS-(B1-I105L)8, MS-(B1-I105Y)8, MS-(B1-I89Y-D90S)8, MS-(B1-N86T)8 및 MS-(B1-S103G)8)은 모두 같은 DNA 가닥 서열에 걸쳐 기준 세공보다 더 큰 최대 범위를 가지는 것으로 관찰되었다 (표 20 참조). 그러므로, MspA 단량체 서열 중 다양한 위치에 점 돌연변이를 적용시킴으로써 신호 범위를 증가시킬 수 있었다.
실시예
12 -
MS
-(B1)8 기준과
MspA
돌연변이체와의 전반적인 서열분석 프로파일 비교
MspA 세공의 서열분석 프로파일은 MspA 단백질 단량체 서열 중 다양한 위치를 돌연변이화시킴으로써 조절할 수 있다.
본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥의 이동을 조절하기 위해 헬리카제를 이용함으로써 전좌 모드로 MS-(B1)8 세공을 MS-(B1-D90Q-D93S-I105A)8, MS-(B1-D90Q-Q126R)8, MS-(B1-L88N-D90Q-D91M)8, MS-(B1-L88N-D90Q-D91 S)8 및 MS-(B1-G75S-G77S-L88N-Q126R)8 세공과 비교하였다
실험 방법
완충 처리된 용액: 400 mM NaCl, 10 mM Hepes (pH 8.0), 1 mM ATP, 1 mM MgCl2, 1 mM DTT
나노세공:
MS(B1)8 MspA;
MS(B1-D90Q-D93S-I105A)8 MspA;
MS(B1-D90Q-Q126R)8 MspA;
MS(B1-L88N-D90Q-D91M)8 MspA;
MS(B1-L88N-D90Q-D91S)8 MspA;
MS(B1-G75S-G77S-L88N-Q126R)8 MspA;
효소: 헬리카제
실시예 9에 기술된 바와 같이 실험 설정을 수행하였다. 이중층에서 MS-(B1)8, MS-(B1-D90Q-D93S-I105A)8, MS-(B1-D90Q-Q126R), MS-(B1-L88N-D90Q-D91M)8, MS-(B1-L88N-D90Q-D91S)8 또는 MS-(B1-G75S-G77S-L88N-Q126R)8 중 하나의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 19 및 20 (상기 제시된 서열 및 태크)) 및 헬리카제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다 (DNA = 1.5 nM, 효소 = 1 μM). 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.15 nM, 효소 = 0.1 μM이 되도록 만들었다). 필요에 따라 2가 금속 (1 mM MgCl2) 및 NTP (1 mM ATP)를 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시시켰다. 실험은 +140 mV의 정전위에서 수행하였다. DNA가 효소 결합 상태일 때 관찰되는 전류 수준을 인덱싱하고, 전류 수준, 그의 지속 기간 및 변동을 기록하였다.
본 실험에서, 기준 MS-(B1)8 돌연변이체를 통해 도 13a에 제시된 서열분석 프로파일이 작성되었다. 본 실험을 하기 돌연변이체 MS-(B1-D90Q-D93S-I105A)8, MS-(B1-D90Q-Q126R), MS-(B1-L88N-D90Q-D91M)8, MS-(B1-L88N-D90Q-D91S)8 및 MS-(B1-G75S-G77S-L88N-Q126R)8을 이용하여 반복하였는데, 이들은 다양하게 다른 서열분석 프로파일을 나타내었다 (도 13b-f 참조). 그러므로, MspA 단량체 서열내 다양한 위치에서 점 돌연변이를 일으킴으로써 검출되는 서열분석 프로파일을 변경시킬 수 있었다.
실시예
13 -
MS
-(B1)8 기준 세공을 사용한
RNA
가닥 서열의 분석
본 실시예는 RNA 가닥의 서열을 분석하기 위해 사용될 수 있는, Phi29 DNA 폴리머라제와 함께 조합된 MspA 기준 세공 MS-(B1)8의 사용 방법을 기술한다.
본 실시예에서는 나노세공을 통과하는 RNA 가닥의 이동을 조절하기 위해 Phi29 DNA 폴리머라제를 이용함으로써 언지핑 모드로 MS-(B1)8 세공을 이용하였다. 본 실험에서 사용된 RNA/DNA 하이브리드 기질 디자인은 도 14에 제시되어 있다 (서열 번호 24 및 25). 서열 번호 24 및 25는 하기에 제시되어 있다 (RNA는 굵은체로 표시). 실온에서 +180 mV의 적용 전위하에서 런을 수행하였다.
서열 번호 24:
서열 번호 25 (+ 콜레스테롤 태그):
물질
RNA/DNA 하이브리드 가닥 (길이 120 mer)을 합성하기 위해서는 서열 번호 24 및 25를 함께 결찰시켜야 했다. 이는 상기 두 가닥이 매우 근접해 있도록 하기 위해 상보적인 DNA 어댑터 가닥 서열 번호 26을 사용함으로써 달성하였고, 여기서 이는 함께 결찰됨으로써 120 mer DNA/RNA 하이브리드 서열 번호 27이 형성되었다.
서열 번호 27 (+ 콜레스테롤 태그; RNA은 굵은체 표시):
실험 방법
완충처리된 용액: 400 mM KCl, 10 mM Hepes (pH 8.0), 1 mM EDTA, 1 mM DTT
나노세공: MS(B1)8 MspA;
효소: Phi29 DNA 폴리머라제 (서열 번호 4)
실시예 10에 기술된 바와 같이 전기 측정을 하였다. 이중층에서 MS(B1)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 24 및 25) 및 Phi29 DNA 폴리머라제를 100 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다. 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 900 ㎕의 완충제에 첨가하여 MspA 나노세공 중 폴리머라제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 0.2 nM, 효소 = 0.2 μM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내고, 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.
본 실험에서, 분자 모터로서의 Phi29 DNA 폴리머라제와 조합된 기준 MS-(B1)8 돌연변이체에서는 RNA 가닥이 세공을 통해 쓰레딩됨에 따라 뚜렷이 다른 전류 수준이 검출되는 것이 관찰되었다. 이어서, 이러한 전류 신호를 사용함으로써 표적 서열을 측정하였다. Phi29 DNA 폴리머라제 언지핑 모드에서의 전형적인 RNA 전좌 이벤트는 도 15에 제시되어 있다.
실시예
14 -
MspA
이량체
및 세공 형성을 위한
올리고머화
본 실시예는 MspA 이량체의 제조 및 올리고머화를 기술한다.
이량체
제조
MspA NNNRRK 단량체 단백질은 184개의 아미노산 잔기로 구성된다. MspA-NNNRRK 단백질의 이량체 버전을 제조하기 위해 단일 폴리펩티드를 디자인하였다.
184개의 잔기로 이루어진 MspA-NNNRRK 폴리펩티드를 코딩하는 DNA 서열을 짧은 DNA 링커 서열을 통해 동일한 폴리펩티드를 쇄를 코딩하는 제2 DNA 서열에 연결시켰다. 링커 DNA 서열은 SGSGSGDDDDDDDDSGSGSS (서열 번호 33; -(SG)3-D8-(SG)2(SS)-로 제시됨)를 코딩한다. 제1 염기 바로 앞에 개시 인자 코돈 (ATG)을 부가하고, 종결 코돈 2개를 코딩하는 DNA (TAATAG)는 마지막 염기 다음에 부가하였다. 그러므로, MspA-NNNRRK-(SG)3-D8-(SG)2(SS)-MspA-NNNRRK를 코딩하는 전체 DNA 서열은 서열 번호 28에 제시되어 있다.
진스크립트 USA 인코퍼레이티드(GenScript USA Inc)에서 DNA를 합성하였고, 이를 발현 목적으로 pT7 벡터로 클로닝하였다.
환형 DNA용 E. 콜라이 T7-S30 추출 시스템 (프로메가(Promega))을 사용하여 커플링된 시험관내 전사 및 번역 (IVTT)에 의해 단백질을 생성하였다.
시스테인이 없는 완전한 1 mM 아미노산 혼합물 및 메티오닌이 없는 완전한 1 mM 아미노산 혼합물을 동일한 부피로 혼합하여 고농도의 단백질을 생성하는 데 필요한 작업 아미노산 용액을 수득하였다. 아미노산 믹스 (2.5.0 ㎕), 프리믹스 용액 (10 ㎕), [35S]L-메티오닌 (0.5 ㎕) 및 리팜피신 (2 ㎕, 50 mg/mL)을 플라스미드 DNA (4 ㎕, 400 ng/mL) 및 T7 S30 추출물 (7.5 ㎕)과 함께 혼합하였다. 37℃에서 90 min 동안 합성을 수행하여 MspA-NNNRRK 단량체 및 이량체에 대한 25 ㎕의 IVTT 단백질을 생성하였다. 반응 후, 샘플을 25,000 g으로 10 min 동안 원심분리하고, 상청액을 버렸다. 펠릿을 100 ㎕의 MBSA (10 mM MOPS, 150 mM NaCl (pH 7.4), 1 mg/mL BSA 함유)로 세척하고, 25 ㎕ 라멜라(Lamellae) 샘플 완충제 중에 재현탁시켰다. 샘플을 10% 겔 상에서 SDS-PAGE하였다. 겔을 80℃에서 45 min 동안 건조시키고, 2시간 동안 X선 필름에 노출시켰다. 겔은 2개의 상이한 밴드를 나타내었는데, 하나는 MspA 이량체에 상응하는 것이고, 또 다른 하나는 MspA 단량체에 상응하는 것이었다.
단량체 및
이량체의
올리고머화
합성 지질 소포체의 존재하에서 이량체, 및 별도로 단량체의 발현을 수행하여 올리고머화를 촉진시켰다. 5가지 성분으로 이루어진 지질 혼합물 (PS:SM:PE: PC:콜레스테롤의 비 10:10:20:30:30, 25 mg/mL)을 사용하였다. 50 ㎕의 지질 혼합물을 1.5 mL 에펜도르프 튜브 중에서 25,000 g에서 10 min 동안 원심분리하고, 상청액을 버렸다. 시스테인이 없는 완전한 1 mM 아미노산 혼합물 및 메티오닌이 없는 완전한 1 mM 아미노산 혼합물을 동일한 부피로 혼합하여 고농도의 단백질을 생성하는 데 필요한 작업 아미노산 용액을 수득하였다. 막 펠릿을 아미노산 믹스 (10.0 ㎕), 프리믹스 용액 (40 ㎕), [35S]L-메티오닌 및 리팜피신 (2 ㎕, 50 mg/mL)와 함께 재현탁시켰다. 플라스미드 DNA (16 ㎕, 400 ng/mL) 및 T7 S30 추출물 (30.0 ㎕)을 첨가하여 합성을 개시시켰다. 37℃에서 90 min 동안 합성을 수행하여 100 ㎕의 IVTT 단백질을 생성하였다. IVTT 반응 샘플을 원심분리하고 (25,000 g, 10 min) 및 생성된 막 펠릿을 MBSA로 세척하고, 7.5% 겔 중에서 SDS-폴리아크릴아미드 겔 전기영동을 하였다. 겔을 50℃에서 3시간 동안 와트맨(watman) 3M 종이 상에서 건조시키고, 2시간 동안 X선 필름에 노출시켰다. 겔은 올리고머화된 MspA 이량체에 대하여 8개의 상이한 밴드를 나타내었는데, 이들 모두 SDS PAGE에서 올리고머화된 단량체보다 더 느린 속도로 이동하였다.
이중층
실험을 위한 단백질 정제
이량체 올리고머화 실험으로부터 얻은 3개의 단백질 밴드를 겔로부터 잘라내고, 정제하였다. 주형으로서 오토라디오그램을 이용하여, 밴드를 절단하고, 완충제 (150 내지 200 ㎕의 25 mM 트리스.HCl (pH 8.0)) 중에 재수화시켰다. 종이를 제거하고, 막자를 사용하여 겔 조각을 파쇄시켰다. 25,000 x g로 10 min 동안 원심분리하여 퀴아슈레더(QIAshredder) 칼럼 (퀴아젠(Qiagen)))을 통해 슬러리를 여과하였다. 이어서, 단량체 수준으로부터 세번째 밴드로부터 생성된 단백질을 실시예 15에 기술되는 전기생리 실험에서 사용하였다.
실시예
15 - 단량체로부터
올리고머화된
MS
-(B1)8과
이량체로부터
올리고머화된
MS
-(B1-B1)4의 비교
본 실시예에서는 나노세공을 통과하는 온전한 DNA 가닥 (서열 번호 19 및 20 (상기 제시된 서열 및 태그))의 이동을 조절하기 위해 헬리카제를 이용함으로써 전좌 모드로 단량체로부터 올리고머화된 MS-(B1)8 세공 (서열 번호 2)을 이량체로부터 올리고머화된 MS-(B1-B1)4 세공 (서열 번호 29)을 비교하였다.
실험 방법
완충 처리된 용액: 400 mM NaCl, 10 mM Hepes (pH 8.0), 1 mM ATP, 1 mM MgCl2, 1 mM DTT
나노세공: MS-(B1)8;
MS-(B1-B1)4
효소: 헬리카제
은 도금된 128 웰 실리콘 칩 (포맷 75 ㎛ 직경, 20 ㎛ 깊이 및 250 ㎛ 피치)을 사용하여 전기 측정을 하였다 (WO 2009/077734). 먼저, 칩을 20 mL 에탄올로 세척한 후, 20 mL dH2O, 이어서, CF4 플라즈마 처리 이전에 20 mL 에탄올로 세척하였다. 이어서, 사용되는 칩을 딥 코팅하여 전처리하고, 진공 밀봉하고, 4℃에서 보관하였다. 사용하기 전, 칩을 20분 이상 동안 실온으로 가온시켰다.
1 M KCl, 10 mM 트리스 (pH 7.5)에 용해된 3.6 mg/mL 1,2-디피타노일-글리세로-3-포스포콜린 지질 (DPhPC, 아반티 폴라 리피드(미국 앨라배마주))로 이루어진 일련의 슬러그를 0.45 ㎕/s로 칩을 통해 통과시킴으로써 이중층을 형성하였다. 먼저, 칩을 통과하도록 지질 슬러그 (250 ㎕)를 유동시킨 후, 100 ㎕의 대기 슬러그를 유동시켰다. 이어서, 각각 100 ㎕의 대기 슬러그로 분리되어 있는, 155 ㎕ 및 150 ㎕의 지질 용액으로 이루어진 2개의 추가의 슬러그를 칩 상에 통과시켰다. 이중층 형성 후, 3 ㎕/s 유속으로 3 mL의 완충제로 챔버를 플러싱하였다. 1.0 pF의 적분 정전 용량을 이용하여 10 kHz에서 이중층 형성의 전기 기록을 수행하였다.
단량체로부터 올리고머화된 MS-(B1)8 세공 또는 이량체로부터 올리고머화된 MS-(B1-B1)4 세공을 사용하여 10 mM 트리스, 1 mM EDTA (pH 8.0) 중에서 생물학적 나노세공의 용액을 제조하였다. +180 mV의 유지 전위를 적용하고, 용액을 칩 상에 유동시키고, 세공이 이중층 내로 유입될 수 있도록 하였다. 이어서, 샘플링 속도 및 적분 정전 용량은 각각 10 kHz 및 1.0 pF로 유지시키고, 적용 전위를 0까지 감소시켰다.
+180 mV의 유지 전위를 적용하는 대조군 프로그램을 실행시켰다. DNA 폴리뉴클레오티드 (서열 번호 19 및 20) 및 헬리카제를 5 min 동안 사전 인큐베이션시켰다. 이어서, 상기 사전 인큐베이션 믹스 (MgCl2 및 ATP 포함)를 칩 상에 유동시켜 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 1.5 nM, 효소 = 10 nM이 되도록 만들었다). 실험은 +180 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻었다. 이 이벤트와 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.
본 실험에서, 이량체의 올리고머화로부터 형성된 기준 MS-(B1-B1)4 돌연변이체 세공은 단량체의 올리고머화로부터 형성된 MS(B1)8 세공만큼 효과적으로 지질 이중층 내로 삽입하였다 (MS(B1)8 및 MS-(B1-B1)4에 대한 세공 삽입을 보여주는 도 16 참조). 단량체 및 이량체 올리고머화된 세공을 분자 모터로서 헬라카제와 함께 조합하였을 때, DNA 가닥이 세공을 통해 쓰레딩됨에 따라 뚜렷이 다른 전류 수준이 검출될 수 있었다. 헬리카제 전좌 모드의 전형적인 DNA 전좌 이벤트는 단량체의 올리고머화로부터 형성된 MS-(B1)8 세공의 경우, 도 17에, 및 이량체의 올리고머화로부터 형성된 MS-(B1-B1)4 세공의 경우, 도 18에 제시되어 있다. 그러므로, 이량체 단위로부터 올리고머화된 MS-(B1-B1)4 세공 돌연변이체가 단량체 단위로부터 올리고머화된 MS-(B1)8 세공 돌연변이체만큼 우수한 세공이라는 것이 밝혀졌다.
실시예
16 - 시토신으로부터 5-
메틸시토신을
구별하기 위한
MS
-(B1-
L88N
)8 돌연변이체
MspA
세공의 용도
본 실시예는 시토신을 그의 후생학적 방식으로 변형된 염기 5-메틸시토신으로부터 구별해내기 위해 사용될 수 있는 MspA의 MS-(B1-L88N)8 돌연변이체 세공의 사용 방법을 기술한다. 본 실험에서 사용된 DNA 기질 디자인은 도 19에 제시되어 있고, 하기 서열을 가진다:
(상기 서열은 9T 뉴클레오티드 및 5' 말단에 IDT Int d Spacer (idSp)를 포함하는 서열 번호 30이다). mC는 5-메틸시토신
물질
도 19에 제시된 DNA 가닥 구축물을 형성하기 위해서는 서열 번호 30, 31 및 32를 함께 하이브리드화시켜야 했다. 이는 3가닥 모두를 동시에 사전 인큐베이션시킴으로써 수행되었다.
실험 방법
완충 처리된 용액: 1 M KCl, 10 mM Hepes (pH 8.0), 1 mM ATP, 1 mM MgCl2, 1 mM DTT
나노세공: MS(B1-L88N)8 MspA
효소: 헬리카제
실시예 9에 기술된 바와 같이 실험 설정을 수행하였다. 이중층에서 MS-(B1-L88N)8의 단일 세공을 얻은 후, DNA 폴리뉴클레오티드 (서열 번호 30, 31 및 32) 및 헬리카제를 50 ㎕의 완충제에 첨가하고, 5 min 동안 사전 인큐베이션시켰다 (DNA = 5 nM, 효소 = 100 nM). 이 사전 인큐베이션 믹스를 전기생리 챔버의 시스 구획 중의 950 ㎕의 완충제에 첨가하여 MspA 나노세공 중 헬리카제-DNA 복합체의 포획을 개시시켰다 (최종 농도가 DNA = 5 nM, 효소 = 100 nM이 되도록 만들었다). 필요에 따라 2가 금속 (1 mM MgCl2) 및 NTP (1 mM ATP)를 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시시켰다. 실험은 +120 mV의 정전위에서 수행하였다. 전류 수준을 효소 결합 상태인 DNA로부터의 이벤트로서 얻어내었다. 본 이벤트를 인덱싱하고, 이벤트의 전류 수준, 지속 기간 및 변동을 기록하였다.
본 실험에서는 시토신 및 5-메틸시토신이 헬리카제의 조절하에 MS-(B1-L88N)8 세공을 통해 전좌되었을 때, 다른 전류 수준을 생성한 것으로 관찰되었다 (도 20 참조). 그러므로, 이러한 돌연변이화된 형태의 MspA를 사용함으로써 시토신을 그의 후생학적 방식으로 변형된 염기 5-메틸시토신으로부터 구별해낼 수 있었다.
SEQUENCE LISTING
<110> Oxford Nanopore Technologies Limited
<120> Mutant Pores
<130> N.112981B
<150> US 61/441,718
<151> 2011-02-11
<160> 33
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> Artificial Sequence
<220>
<223> NNN-RRK mutant MspA monomer
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<223> Mature form of NNN-RRK mutant of the MspA monomer
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 1830
<212> DNA
<213> Bacillus subtilis phage Phi29
<400> 3
atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60
gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120
ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180
cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240
tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300
tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360
gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420
gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480
gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540
tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600
atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660
gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720
gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780
cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840
tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900
accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960
ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020
gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080
aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140
ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200
ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260
acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320
accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380
catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440
ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500
atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560
tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620
gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680
gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740
tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800
tggagccacc cgcagtttga aaaataataa 1830
<210> 4
<211> 608
<212> PRT
<213> Bacillus subtilis phage Phi29
<400> 4
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser
565 570 575
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser
580 585 590
Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
595 600 605
<210> 5
<211> 1390
<212> DNA
<213> Escherichia coli
<400> 5
atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60
acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120
aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180
ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240
gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300
ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360
tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420
atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480
ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540
catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600
cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660
attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720
ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780
atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840
gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900
gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960
gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020
ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080
gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140
aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200
aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260
tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320
cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380
gtggcgctgc 1390
<210> 6
<211> 485
<212> PRT
<213> Escherichia coli
<400> 6
Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr
1 5 10 15
Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala
20 25 30
Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val
35 40 45
Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val
50 55 60
Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn
65 70 75 80
Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys
85 90 95
Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr
100 105 110
Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp
115 120 125
Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys
130 135 140
Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly
145 150 155 160
Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu
165 170 175
His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala
180 185 190
Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu
195 200 205
Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro
210 215 220
Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg
225 230 235 240
Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg
245 250 255
Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu
260 265 270
Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr
275 280 285
Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn
290 295 300
Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala
305 310 315 320
Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile
325 330 335
Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala
340 345 350
Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr
355 360 365
Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu
370 375 380
Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp
385 390 395 400
Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro
405 410 415
Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg
420 425 430
Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln
435 440 445
Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu
450 455 460
Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His
465 470 475 480
His His His His His
485
<210> 7
<211> 804
<212> DNA
<213> Escherichia coli
<400> 7
atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60
atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120
atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180
ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240
cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300
ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360
aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420
aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480
atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540
ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600
catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660
gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720
tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780
cccgtctggg cgaccttccg ccgc 804
<210> 8
<211> 268
<212> PRT
<213> Escherichia coli
<400> 8
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro
245 250 255
Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 9
<211> 1275
<212> DNA
<213> Thermus thermophilus
<400> 9
atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60
cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120
ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180
ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240
atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300
attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360
gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420
ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480
catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540
attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600
cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660
ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720
ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780
ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840
cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900
ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960
gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020
gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080
ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140
gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200
ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260
gaaccgctgt tcctg 1275
<210> 10
<211> 425
<212> PRT
<213> Thermus thermophilus
<400> 10
Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro
1 5 10 15
Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg
20 25 30
Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu
35 40 45
Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp
50 55 60
Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu
65 70 75 80
Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr
85 90 95
Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu
100 105 110
Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr
115 120 125
Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys
130 135 140
Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu
145 150 155 160
His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala
165 170 175
Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg
180 185 190
Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val
195 200 205
Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val
210 215 220
Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu
225 230 235 240
Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala
245 250 255
Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg
260 265 270
Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp
275 280 285
Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly
290 295 300
Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro
305 310 315 320
Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro
325 330 335
Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg
340 345 350
Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu
355 360 365
Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro
370 375 380
Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly
385 390 395 400
Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly
405 410 415
Glu Gly Asn Pro Glu Pro Leu Phe Leu
420 425
<210> 11
<211> 738
<212> DNA
<213> Bacteriophage lambda
<400> 11
tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60
gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120
gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180
cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240
ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300
ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360
agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420
aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480
aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540
tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600
cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660
gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720
tccggcagcg gttccgga 738
<210> 12
<211> 226
<212> PRT
<213> Bacteriophage lambda
<400> 12
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 13
<211> 134
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in Example 2
<400> 13
cccccccccc cccccccccc cccccccccc cacccccccc cccccccccc cctaaagcta 60
catcgtcaac gttatatttt gatagtttga cggttaatgc tggtaatggt ggttttcttc 120
aaaatttgtt agcc 134
<210> 14
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in Example 2
<400> 14
ggctaacaaa ttttgaagaa aaccaccatt accagcatta accgtcaaac tatcaaaata 60
taacgttgac gatgtagctt tagg 84
<210> 15
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in Example 2
<400> 15
cccccccccc cccccacccc cccccccccc ccccctattc tgtttatgtt tcttgtttgt 60
tagccttttg gctaacaaac aagaaacata aacagaatag 100
<210> 16
<211> 184
<212> PRT
<213> Mycobacterium smegmatis
<400> 16
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 17
<211> 184
<212> PRT
<213> Mycobacterium smegmatis
<400> 17
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 18
<211> 183
<212> PRT
<213> Mycobacterium smegmatis
<400> 18
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 19
<211> 454
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<220>
<221> modified_base
<222> (1)..(4)
<223> 2'-O-Methyl-Uracil
<400> 19
nnnntttttt tttttttttt tttttttttt tttttttttt tttttttttt ttttggttgt 60
ttctgttggt gctgatattg cttttgatgc cgaccctaaa ttttttgcct gtttggttcg 120
ctttgagtct tcttcggttc cgactaccct cccgactgcc tatgatgttt atcctttgaa 180
tggtcgccat gatggtggtt attataccgt caaggactgt gtgactattg acgtccttcc 240
ccgtacgccg ggcaataacg tttatgttgg tttcatggtt tggtctaact ttaccgctac 300
taaatgccgc ggattggttt cgctgaatca ggttattaaa gagattattt gtctccagcc 360
acttaagtga ggtgatttat gtttggtgct attgctggcg gtattgcttc tgctcttgct 420
ggtggcgcca tgtctaaatt gtttggaggc ggtc 454
<210> 20
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 20
gcaatatcag caccaacaga aacaaccttt tttttttttt tttttttttt ttttttt 57
<210> 21
<211> 139
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 21
tttttttttt tttttttttt tccccccccc ccccctattc tgtttatgtt tcttgtttgt 60
tagccccctt tgataagaca aatacaaaga acaaacaatc ggccctttag tggagcgagt 120
gcgagaggcg agcggtcaa 139
<210> 22
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 22
gtatctccat cgctgttgac cgctcgcctc tcgcactcgc tccactaaag ggccgattgt 60
ttgttctttg tatttgtctt atcaaagggg gctaacaaac aagaaacata aacagaatag 120
<210> 23
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 23
cagcgatgga gatac 15
<210> 24
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 24
cccccccccc cccccacccc cccccccccc cccccuauuc uguuuauguu ucuuguuugu 60
<210> 25
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 25
uauucuguuu auguuucuug uuuguuagcc cccuuugaua agacaaauac aaagaacaaa 60
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 26
agaaacataa acagaataac aaacaagaaa cataaacaga atag 44
<210> 27
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 27
cccccccccc cccccacccc cccccccccc cccccuauuc uguuuauguu ucuuguuugu 60
uauucuguuu auguuucuug uuuguuagcc cccuuugaua agacaaauac aaagaacaaa 120
<210> 28
<211> 1176
<212> DNA
<213> Artificial Sequence
<220>
<223> Dimer of NNN-RRK in Example 14
<400> 28
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactcggg ttcaggatcc ggagatgacg atgatgacga cgatgactcc 600
ggatcgggtt cttccatggg tctggataat gaactgagcc tggtggacgg tcaagatcgt 660
accctgacgg tgcaacaatg ggataccttt ctgaatggcg tttttccgct ggatcgtaat 720
cgcctgaccc gtgaatggtt tcattccggt cgcgcaaaat atatcgtcgc aggcccgggt 780
gctgacgaat tcgaaggcac gctggaactg ggttatcaga ttggctttcc gtggtcactg 840
ggcgttggta tcaacttctc gtacaccacg ccgaatattc tgatcaacaa tggtaacatt 900
accgcaccgc cgtttggcct gaacagcgtg attacgccga acctgtttcc gggtgttagc 960
atctctgccc gtctgggcaa tggtccgggc attcaagaag tggcaacctt tagtgtgcgc 1020
gtttccggcg ctaaaggcgg tgtcgcggtg tctaacgccc acggtaccgt tacgggcgcg 1080
gccggcggtg tcctgctgcg tccgttcgcg cgcctgattg cctctaccgg cgacagcgtt 1140
acgacctatg gcgaaccgtg gaatatgaac taatag 1176
<210> 29
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> Dimer of NNN-RRK used in Example 14
<400> 29
Met Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr
1 5 10 15
Leu Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu
20 25 30
Asp Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys
35 40 45
Tyr Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu
50 55 60
Leu Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn
65 70 75 80
Phe Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr
85 90 95
Ala Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro
100 105 110
Gly Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu
115 120 125
Val Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala
130 135 140
Val Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu
145 150 155 160
Leu Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr
165 170 175
Thr Tyr Gly Glu Pro Trp Asn Met Asn Ser Gly Ser Gly Ser Gly Asp
180 185 190
Asp Asp Asp Asp Asp Asp Asp Ser Gly Ser Gly Ser Ser Met Gly Leu
195 200 205
Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu Thr Val
210 215 220
Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg Asn
225 230 235 240
Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr Ile Val
245 250 255
Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly Tyr
260 265 270
Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser Tyr
275 280 285
Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala Pro Pro
290 295 300
Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly Val Ser
305 310 315 320
Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala Thr
325 330 335
Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val Ser Asn
340 345 350
Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg Pro
355 360 365
Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr Gly
370 375 380
Glu Pro Trp Asn Met Asn
385 390
<210> 30
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in Example 16
<220>
<221> modified_base
<222> (9)..(9)
<223> 5-methylcytosine
<220>
<221> modified_base
<222> (27)..(27)
<223> 5-methylcytosine
<400> 30
ttttttttnt tttttttctt ttttttngtt ttttttcgtt ttttttgtat ctccatcgct 60
gccccctttt tccccctttt t 81
<210> 31
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in Example 16
<400> 31
ggcagcgatg gagatacttg aggcgagcgg tcaa 34
<210> 32
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence used in Example 16
<400> 32
ttgaccgctc gcctc 15
<210> 33
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Sequence used in the Examples
<400> 33
Ser Gly Ser Gly Ser Gly Asp Asp Asp Asp Asp Asp Asp Asp Ser Gly
1 5 10 15
Ser Gly Ser Ser
20
Claims (52)
- 서열 번호 2에 제시된 서열의 변이체를 포함하며, 여기서 변이체는 L88N 치환을 포함하는 것인, 돌연변이체 Msp 단량체.
- 제1항에 있어서, 변이체가 G75S, G77S 및 Q126R 치환 중 하나 이상을 더 포함하는 것인 돌연변이체 Msp 단량체.
- 제2항에 있어서, 변이체가 G75S, G77S 및 Q126R 치환 모두를 더 포함하는 것인 돌연변이체 Msp 단량체.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 변이체가 하기 돌연변이 중 하나 이상을 더 포함하는 것인 돌연변이체 Msp 단량체:
(a) 90번 위치의 세린 (S), 글루타민 (Q) 또는 티로신 (Y);
(b) 105번 위치의 류신 (L) 또는 세린 (S);
(c) 59번 위치의 아르기닌 (R);
(d) 78번 위치의 류신 (L);
(e) 81번 위치의 아스파라긴 (N);
(f) 83번 위치의 아스파라긴 (N);
(g) 86번 위치의 세린 (S) 또는 트레오닌 (T);
(h) 87번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(i) 89번 위치의 페닐알라닌 (F), 발린 (V) 또는 류신 (L);
(j) 90번 위치의 류신 (L), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 트레오닌 (T), 글리신 (G), 알라닌 (A), 발린 (V), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(k) 91번 위치의 세린 (S), 글루타민 (Q), 류신 (L), 메티오닌 (M), 이소류신 (I), 알라닌 (A), 발린 (V), 글리신 (G), 페닐알라닌 (F), 트립토판 (W), 티로신 (Y), 히스티딘 (H), 트레오닌 (T), 아르기닌 (R), 리신 (K), 아스파라긴 (N) 또는 시스테인 (C);
(l) 92번 위치의 알라닌 (A) 또는 세린 (S);
(m) 93번 위치의 세린 (S), 알라닌 (A), 트레오닌 (T) 또는 글리신 (G);
(n) 94번 위치의 류신 (L);
(o) 95번 위치의 발린 (V);
(p) 96번 위치의 아르기닌 (R), 아스파르트산 (D), 발린 (V), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T);
(q) 97번 위치의 세린 (S);
(r) 98번 위치의 세린 (S);
(s) 99번 위치의 세린 (S);
(t) 100번 위치의 세린 (S);
(u) 101번 위치의 페닐알라닌 (F);
(v) 102번 위치의 리신 (K), 세린 (S) 또는 트레오닌 (T);
(w) 103번 위치의 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 글리신 (G) 또는 트레오닌 (T);
(x) 104번 위치의 이소류신 (I);
(y) 105번 위치의 티로신 (Y), 알라닌 (A), 글루타민 (Q), 아스파라긴 (N), 트레오닌 (T), 페닐알라닌 (F), 트립토판 (W), 히스티딘 (H), 글리신 (G), 발린 (V), 아르기닌 (R), 리신 (K), 프롤린 (P) 또는 시스테인 (C);
(z) 106번 위치의 페닐알라닌 (F), 이소류신 (I), 발린 (V) 또는 세린 (S);
(aa) 108번 위치의 프롤린 (P) 또는 세린 (S);
(bb) 118번 위치의 아스파라긴 (N);
(cc) 103번 위치의 세린 (S) 또는 시스테인 (C); 및
(dd) 10 내지 15번 위치, 51 내지 60번 위치, 136 내지 139번 위치 및 168 내지 172번 위치 중 하나 이상의 위치의 시스테인 (C). - 제1항 내지 제3항 중 어느 한 항에 있어서, 변이체가 하기 치환 중 하나 이상의 치환을 포함하는 것인 돌연변이체 Msp 단량체:
(a) 75번 위치의 세린 (S), 77번 위치의 세린 (S), 88번 위치의 아스파라긴 (N), 90번 위치의 글루타민 (Q) 및 126번 위치의 아르기닌 (R);
(b) (i) 90번 위치의 글루타민 (Q) 및 (ii) 105번 위치의 알라닌 (A) 중 하나 이상;
(c) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 세린 (S) 중 하나 이상;
(d) (i) 87번 위치의 글루타민 (Q) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상;
(e) (i) 89번 위치의 티로신 (Y) 및 (ii) 90번 위치의 세린 (S) 중 하나 이상;
(f) (i) 90번 위치의 세린 (S) 및 (ii) 92번 위치의 알라닌 (A) 중 하나 이상;
(g) (i) 90번 위치의 세린 (S) 및 (ii) 94번 위치의 아스파라긴 (N) 중 하나 이상;
(h) (i) 90번 위치의 세린 (S) 및 (ii) 104번 위치의 이소류신 (I) 중 하나 이상;
(i) (i) 90번 위치의 글루타민 (Q), (ii) 93번 위치의 세린 (S) 및 (iii) 105번 위치의 알라닌 (A) 중 하나 이상;
(j) (i) 90번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H), (ii) 91번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H), 및 (iii) 105번 위치의 페닐알라닌 (F), 트립토판 (W), 티로신 (Y) 또는 히스티딘 (H) 중 하나 이상;
(k) (i) 90번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V), (ii) 91번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V), 및 (iii) 105번 위치의 세린 (S), 트레오닌 (T), 글리신 (G), 알라닌 (A) 또는 발린 (V) 중 하나 이상;
(l) 90번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H), 및/또는 91번 위치의 세린 (S), 아르기닌 (R), 리신 (K) 또는 히스티딘 (H);
(m) 90번 위치의 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 히스티딘 (H), 및/또는 91번 위치의 세린 (S), 트레오닌 (T), 아스파라긴 (N), 글루타민 (Q), 티로신 (Y) 또는 히스티딘 (H); 및
(n) 90, 91 및 103번 위치 중 하나 이상의 위치의 시스테인 (C). - 제1항 내지 제3항 중 어느 한 항에 있어서, (i) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착, 분자의 하나 이상의 비천연 아미노산에의 부착, 에피토프의 효소 변형 또는 말단의 변형에 의해 화학적으로 변형되거나; (ii) 분자의 하나 이상의 시스테인에의 부착에 의해 화학적으로 변형되며, 하나 이상의 시스테인이 치환에 의해 돌연변이체에 도입된 것이거나; (iii) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착 또는 분자의 하나 이상의 비천연 아미노산에의 부착에 의해 화학적으로 변형되며, 분자가 (a) 단량체를 포함하는 세공과 표적 뉴클레오티드 또는 표적 핵산 서열 사이의 상호작용을 촉진하는 분자 어댑터(adaptor) 또는 (b) 핵산 결합 단백질이거나; (iv) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착 또는 분자의 하나 이상의 비천연 아미노산에의 부착에 의해 화학적으로 변형되며, 부착이 링커를 통해 이루어지는 것이거나; 또는 (v) 분자의 하나 이상의 시스테인에의 부착, 분자의 하나 이상의 리신에의 부착 또는 분자의 하나 이상의 비천연 아미노산에의 부착에 의해 화학적으로 변형되며, 분자가 서열 번호 2의 90, 91 및 103번 위치 중 하나 이상의 위치에 부착되는 것인 돌연변이체 Msp 단량체.
- Msp로부터 유래된 2개 이상의 공유적으로 부착된 단량체를 포함하며, 여기서 단량체 중 1개 이상이 제1항에서 정의된 바와 같은 돌연변이체 Msp 단량체인 구축물.
- 제8항에 있어서, (a) 2개 이상의 단량체가 동일하거나 상이한 것이거나; (b) 1개 이상의 단량체가 서열 번호 2에 제시된 서열을 포함하는 것이거나; (c) 2개의 단량체를 포함하고, 단량체 중 1개 이상이 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 돌연변이체 Msp 단량체이거나; (d) 단량체가 유전자적으로 융합되는 것이거나; 또는 (e) 단량체가 링커를 통해 부착되는 것인 구축물.
- 제1항 내지 제3항 중 어느 한 항에 따른 돌연변이체 Msp 단량체 또는 제8항에 따른 구축물을 코딩하는 폴리뉴클레오티드.
- 제1항에 따른 동일한 돌연변이체 Msp 단량체를 포함하는, Msp로부터 유래된 동종올리고머 세공.
- 제11항에 있어서, 8개의 동일한 돌연변이체 Msp 단량체를 포함하는 동종올리고머 세공.
- 제1항에 따른 1개 이상의 돌연변이체 Msp 단량체를 포함하며, 여기서 8개의 단량체 중 1개 이상은 나머지 다른 단량체와 상이한 것인, Msp로부터 유래된 이종올리고머 세공.
- 제13항에 있어서, (i) 제1항 내지 제3항 중 어느 한 항에 따른 8개의 돌연변이체 Msp 단량체를 포함하고, 그 중 1개 이상은 나머지 다른 단량체와 상이한 것이거나; (ii) 서열 번호 2에 제시된 서열을 포함하는 1개 이상의 단량체를 포함하거나; (iii) (a) 1개의 돌연변이체 단량체 및 (b) 7개의 동일한 단량체를 포함하며, 여기서 (a)의 돌연변이체 단량체는 (b)의 동일한 단량체와 상이한 것이거나; 또는 (iv) (a) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 N90R, N90K, N90Y, N90Q, N90W 또는 N90C 치환을 더 포함하는 제1항 내지 제3항 중 어느 한 항에 따른 1개의 돌연변이체 Msp 단량체; (b) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 N91R, N91K, N91Y, N91Q, N91W 또는 N91C 치환을 포함하는 제1항 내지 제3항 중 어느 한 항에 따른 1개의 돌연변이체 Msp 단량체; 또는 (c) 서열 번호 2에 제시된 서열을 포함하는 7개의 단량체, 및 L88C, S103C 또는 I105C 치환을 포함하는 제1항 내지 제3항 중 어느 한 항에 따른 1개의 돌연변이체 Msp 단량체를 포함하는 이종올리고머 세공.
- 제8항에 따른 1개 이상의 구축물을 포함하는 세공.
- 제15항에 있어서,
- 각각 2개의 단량체를 포함하며 단량체 중 1개 이상은 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 돌연변이체 Msp 단량체인 4개의 구축물; 또는
- 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 돌연변이체 Msp 단량체, 및 각각 (i) 서열 번호 2에 제시된 서열 또는 (ii) 제1항 내지 제3항 중 어느 한 항에서 정의된 바와 같은 서열 번호 2의 변이체를 포함하는 6개의 단량체를 포함하는 1개의 구축물
을 포함하는 세공. - (a) 표적 서열을 제11항 내지 제13항 및 제15항 중 어느 한 항에 따른 세공 및 핵산 결합 단백질과 접촉시켜, 상기 단백질이 세공을 통과하는 표적 서열의 이동을 제어하도록 하고, 표적 서열 중 일부의 뉴클레오티드가 세공과 상호작용하도록 하는 단계; 및
(b) 각 상호작용 동안 세공을 통과하는 전류를 측정하여, 표적 서열의 특징을 규명하는 단계
를 포함하는, 표적 핵산 서열의 특징을 규명하는 방법. - 제17항에 있어서, 표적 핵산 서열의 특징을 규명하는 단계가 표적 핵산 서열의 서열을 추정하거나 또는 표적 핵산 서열을 서열분석하는 것을 포함하는 것인 방법.
- (a) 제11항 내지 제13항 및 제15항 중 어느 한 항에 따른 세공 및 (b) 뉴클레아제, 폴리머라제, 토포이소머라제, 리가제 또는 헬리카제를 포함하는, 표적 핵산 서열의 특징 규명을 위한 키트.
- (a) 다수의 제11항 내지 제13항 및 제15항 중 어느 한 항에 따른 세공 및 (b) 다수의 뉴클레아제, 폴리머라제, 토포이소머라제, 리가제 또는 헬리카제를 포함하는, 샘플 중의 표적 핵산 서열의 특징 규명을 위한 장치.
- 제20항에 있어서,
다수의 세공을 지지할 수 있으며 세공 및 효소를 사용하여 핵산 특징 규명을 수행하도록 작동가능한 센서 장치;
특징 규명 수행용 물질을 담아두기 위한 1개 이상의 저장소;
물질을 1개 이상의 저장소로부터 센서 장치로 제어가능하게 공급하도록 구성된 유체 시스템; 및
각 샘플을 수용하기 위한 다수의 용기
를 포함하며, 상기 유체 시스템은 샘플을 용기로부터 센서 장치로 선택적으로 공급하도록 구성된 것인 장치. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161441718P | 2011-02-11 | 2011-02-11 | |
US61/441,718 | 2011-02-11 | ||
PCT/GB2012/050301 WO2012107778A2 (en) | 2011-02-11 | 2012-02-10 | Mutant pores |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140049511A KR20140049511A (ko) | 2014-04-25 |
KR101939420B1 true KR101939420B1 (ko) | 2019-01-16 |
Family
ID=45592746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137023664A KR101939420B1 (ko) | 2011-02-11 | 2012-02-10 | 돌연변이체 세공 |
Country Status (9)
Country | Link |
---|---|
US (1) | US9751915B2 (ko) |
EP (1) | EP2673638B1 (ko) |
JP (2) | JP6169976B2 (ko) |
KR (1) | KR101939420B1 (ko) |
CN (1) | CN103460040B (ko) |
AU (1) | AU2012215135B9 (ko) |
BR (1) | BR112013020411B1 (ko) |
CA (1) | CA2826374C (ko) |
WO (1) | WO2012107778A2 (ko) |
Families Citing this family (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HUE029215T2 (en) | 2008-09-22 | 2017-02-28 | Univ Washington | MSP nanopores and related procedures |
CN102369298B (zh) | 2009-01-30 | 2017-03-22 | 牛津纳米孔技术有限公司 | 跨膜测序中用于核酸构建体的衔接体 |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
CA2837306C (en) | 2011-05-27 | 2020-03-10 | Oxford Nanopore Technologies Limited | Determining the presence, absence or characteristics of an analyte coupled to a membrane |
KR20140050067A (ko) | 2011-07-25 | 2014-04-28 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 막횡단 포어를 사용한 이중 가닥 폴리뉴클레오티드 서열분석을 위한 헤어핀 루프 방법 |
EP2768977B1 (en) | 2011-10-21 | 2015-09-23 | Oxford Nanopore Technologies Limited | Method of characterizing a target polynucleotide using a pore and a hel308 helicase |
EP2798083B1 (en) | 2011-12-29 | 2017-08-09 | Oxford Nanopore Technologies Limited | Method for characterising a polynucelotide by using a xpd helicase |
EP2798084B1 (en) | 2011-12-29 | 2017-04-19 | Oxford Nanopore Technologies Limited | Enzyme method |
GB201202519D0 (en) | 2012-02-13 | 2012-03-28 | Oxford Nanopore Tech Ltd | Apparatus for supporting an array of layers of amphiphilic molecules and method of forming an array of layers of amphiphilic molecules |
EP2815235B1 (en) | 2012-02-15 | 2020-04-15 | Oxford Nanopore Technologies Limited | Aptamer method |
CA2866587C (en) | 2012-02-16 | 2022-07-26 | Oxford Nanopore Technologies Limited | Analysis of measurements of a polymer |
US9777049B2 (en) | 2012-04-10 | 2017-10-03 | Oxford Nanopore Technologies Ltd. | Mutant lysenin pores |
WO2014013259A1 (en) * | 2012-07-19 | 2014-01-23 | Oxford Nanopore Technologies Limited | Ssb method |
BR112015001054A8 (pt) | 2012-07-19 | 2022-08-02 | Oxford Nanopore Tech Ltd | Helicase monomérica que é membro da superfamília 1 ou superfamília 2, helicase hel308 isolada, método para caracterizar um polinucleotídeo alvo, e, sensor para a caracterização de um polinucleotídeo alvo |
JP6429773B2 (ja) | 2012-07-19 | 2018-11-28 | オックスフォード ナノポール テクノロジーズ リミテッド | 酵素構築物 |
EP2895618B1 (en) | 2012-09-14 | 2017-07-26 | Oxford Nanopore Technologies Limited | Sample preparation method |
GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
US9995728B2 (en) | 2012-11-06 | 2018-06-12 | Oxford Nanopore Technologies Ltd. | Quadruplex method |
GB201222928D0 (en) * | 2012-12-19 | 2013-01-30 | Oxford Nanopore Tech Ltd | Analysis of a polynucleotide |
EP2953524B1 (en) | 2013-02-06 | 2018-08-01 | Freenome Holdings Inc. | Systems and methods for early disease detection and real-time disease monitoring |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
GB201318465D0 (en) * | 2013-10-18 | 2013-12-04 | Oxford Nanopore Tech Ltd | Method |
CA2901545C (en) | 2013-03-08 | 2019-10-08 | Oxford Nanopore Technologies Limited | Use of spacer elements in a nucleic acid to control movement of a helicase |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
JP6677640B2 (ja) | 2013-10-18 | 2020-04-08 | オックスフォード ナノポール テクノロジーズ リミテッド | 修飾酵素 |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
JP6749243B2 (ja) | 2014-01-22 | 2020-09-02 | オックスフォード ナノポール テクノロジーズ リミテッド | 1つまたは複数のポリヌクレオチド結合タンパク質を標的ポリヌクレオチドに付着させる方法 |
GB201406155D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
WO2015126494A1 (en) | 2014-02-19 | 2015-08-27 | University Of Washington | Nanopore-based analysis of protein characteristics |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
WO2015148567A1 (en) * | 2014-03-24 | 2015-10-01 | Bernick David L | Molecular adapter for capture and manipulation of transfer rna |
US10337060B2 (en) | 2014-04-04 | 2019-07-02 | Oxford Nanopore Technologies Ltd. | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
WO2015161117A2 (en) | 2014-04-16 | 2015-10-22 | The Uab Research Foundation | Msp nanopores and uses thereof |
WO2015166275A1 (en) * | 2014-05-02 | 2015-11-05 | Oxford Nanopore Technologies Limited | Mutant pores |
GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
WO2016034591A2 (en) * | 2014-09-01 | 2016-03-10 | Vib Vzw | Mutant pores |
US10266885B2 (en) | 2014-10-07 | 2019-04-23 | Oxford Nanopore Technologies Ltd. | Mutant pores |
GB201418159D0 (en) | 2014-10-14 | 2014-11-26 | Oxford Nanopore Tech Ltd | Method |
EP3207154B1 (en) | 2014-10-16 | 2022-03-16 | Oxford Nanopore Technologies PLC | Analysis of a polymer |
KR102457147B1 (ko) | 2014-10-17 | 2022-10-19 | 옥스포드 나노포어 테크놀로지즈 피엘씨 | 나노 세공 rna 특징 규명을 위한 방법 |
GB201418469D0 (en) | 2014-10-17 | 2014-12-03 | Oxford Nanopore Tech Ltd | Method |
EP4293349A3 (en) | 2015-02-05 | 2024-02-21 | President and Fellows of Harvard College | Nanopore sensor including fluidic passage |
GB201502810D0 (en) * | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Method |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
CN107735686B (zh) | 2015-04-14 | 2021-06-11 | 鲁汶天主教大学 | 具有内部蛋白质衔接子的纳米孔 |
GB201508003D0 (en) | 2015-05-11 | 2015-06-24 | Oxford Nanopore Tech Ltd | Apparatus and methods for measuring an electrical current |
JP7237586B2 (ja) | 2015-12-08 | 2023-03-13 | カトリック ユニヴェルシテット ルーヴェン カーユー ルーヴェン リサーチ アンド ディベロップメント | 修飾ナノポア、それを含む組成物およびその使用 |
JP6990963B2 (ja) | 2016-02-03 | 2022-02-03 | 教文館管財株式会社 | オゾンガス消毒器 |
CN108884150A (zh) | 2016-03-02 | 2018-11-23 | 牛津纳米孔技术公司 | 突变孔 |
WO2017174990A1 (en) * | 2016-04-06 | 2017-10-12 | Oxford Nanopore Technologies Limited | Mutant pore |
GB201609220D0 (en) | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
GB201609221D0 (en) | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
GB201611770D0 (en) | 2016-07-06 | 2016-08-17 | Oxford Nanopore Tech | Microfluidic device |
GB201616590D0 (en) | 2016-09-29 | 2016-11-16 | Oxford Nanopore Technologies Limited | Method |
GB201617886D0 (en) | 2016-10-21 | 2016-12-07 | Oxford Nanopore Technologies Limited | Method |
GB201620450D0 (en) | 2016-12-01 | 2017-01-18 | Oxford Nanopore Tech Ltd | Method |
US11840556B2 (en) | 2017-02-10 | 2023-12-12 | Oxford Nanopore Technologies Plc | Modified nanopores, compositions comprising the same, and uses thereof |
EP3583420B1 (en) | 2017-02-14 | 2023-08-16 | Axbio Inc. | Apparatus and methods for continuous diagnostics of macromolecules |
GB201707138D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Machine learning analysis of nanopore measurements |
GB201707122D0 (en) * | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
GB201707140D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Method |
CN117106038A (zh) | 2017-06-30 | 2023-11-24 | 弗拉芒区生物技术研究所 | 新颖蛋白孔 |
GB2568895B (en) | 2017-11-29 | 2021-10-27 | Oxford Nanopore Tech Ltd | Microfluidic device |
GB2569630B (en) | 2017-12-21 | 2022-10-12 | Sharp Life Science Eu Ltd | Droplet Interfaces in Electro-wetting Devices |
GB201807793D0 (en) | 2018-05-14 | 2018-06-27 | Oxford Nanopore Tech Ltd | Method |
GB201808556D0 (en) | 2018-05-24 | 2018-07-11 | Oxford Nanopore Tech Ltd | Method |
CN112203767B (zh) | 2018-05-24 | 2023-04-11 | 牛津纳米孔科技公司 | 电润湿装置中的液滴界面 |
GB201809323D0 (en) | 2018-06-06 | 2018-07-25 | Oxford Nanopore Tech Ltd | Method |
GB201814369D0 (en) | 2018-09-04 | 2018-10-17 | Oxford Nanopore Tech Ltd | Method for determining a polymersequence |
EP3877547A1 (en) * | 2018-11-08 | 2021-09-15 | Oxford Nanopore Technologies Limited | Pore |
GB201819378D0 (en) | 2018-11-28 | 2019-01-09 | Oxford Nanopore Tech Ltd | Analysis of nanopore signal using a machine-learning technique |
CN113164954B (zh) | 2018-11-28 | 2023-10-20 | 牛津纳米孔科技公开有限公司 | 感测系统和操作方法 |
GB201821155D0 (en) | 2018-12-21 | 2019-02-06 | Oxford Nanopore Tech Ltd | Method |
GB201907246D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
GB201907243D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Sensing interactions between molecular entities and nanapores |
GB201907244D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
EP4036107A4 (en) * | 2019-09-29 | 2024-01-17 | Qitan Technology Ltd., Beijing | MMUP MONOMER VARIANT AND ITS APPLICATION |
IL291788A (en) * | 2019-09-29 | 2022-07-01 | Qitan Tech Ltd Beijing | mnep monomer variant and its application |
WO2021056599A1 (zh) | 2019-09-29 | 2021-04-01 | 北京齐碳科技有限公司 | 一种Mnep单体变体及其应用 |
GB201917060D0 (en) | 2019-11-22 | 2020-01-08 | Oxford Nanopore Tech Ltd | Method |
AU2020395930A1 (en) | 2019-12-02 | 2022-05-26 | Oxford Nanopore Technologies Plc | Method of characterising a target polypeptide using a nanopore |
GB201917742D0 (en) | 2019-12-04 | 2020-01-15 | Oxford Nanopore Tech Ltd | Method |
NL2024579B1 (en) * | 2019-12-24 | 2021-09-06 | Univ Delft Tech | Protein and peptide fingerprinting and sequencing by nanopore translocation of peptide-oligonucleotide complexes |
JP2023513128A (ja) * | 2020-02-06 | 2023-03-30 | エフ. ホフマン-ラ ロシュ アーゲー | ナノポアへの鋳型の貫通を低減する組成物 |
GB202004944D0 (en) | 2020-04-03 | 2020-05-20 | King S College London | Method |
GB202009349D0 (en) | 2020-06-18 | 2020-08-05 | Oxford Nanopore Tech Ltd | Method |
US20240076729A9 (en) | 2020-06-18 | 2024-03-07 | Oxford Nanopore Technologies Plc | Method |
EP4168582A1 (en) | 2020-06-18 | 2023-04-26 | Oxford Nanopore Technologies plc | A method of selectively characterising a polynucleotide using a detector |
US20230266268A1 (en) | 2020-07-22 | 2023-08-24 | Oxford Nanopore Technologies Inc. | Solid state nanopore formation |
EP4222742A1 (en) | 2020-09-29 | 2023-08-09 | Ecole Polytechnique Federale De Lausanne (Epfl) | Systems and methods for digital information decoding and data storage in hybrid macromolecules |
GB202107192D0 (en) | 2021-05-19 | 2021-06-30 | Oxford Nanopore Tech Ltd | Method |
GB202107354D0 (en) | 2021-05-24 | 2021-07-07 | Oxford Nanopore Tech Ltd | Method |
GB2610380A (en) | 2021-08-23 | 2023-03-08 | Cambridge Entpr Ltd | Nucleic acid detection |
CN113735948B (zh) * | 2021-09-28 | 2024-02-02 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
GB202113935D0 (en) | 2021-09-29 | 2021-11-10 | Cambridge Entpr Ltd | Nucleic acid characterisation |
EP4441744A1 (en) | 2021-11-29 | 2024-10-09 | Oxford Nanopore Technologies Ltd. | Nanopore measurement signal analysis |
GB202118908D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
GB202118906D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
WO2023222657A1 (en) | 2022-05-17 | 2023-11-23 | Oxford Nanopore Technologies Plc | Method and adaptors |
GB202207267D0 (en) | 2022-05-18 | 2022-06-29 | Oxford Nanopore Tech Plc | Calibration and profiling of a nanopore array device |
GB202215442D0 (en) | 2022-10-19 | 2022-11-30 | Oxford Nanopore Tech Plc | Analysis of a polymer |
WO2024089270A2 (en) * | 2022-10-28 | 2024-05-02 | Oxford Nanopore Technologies Plc | Pore monomers and pores |
GB202216162D0 (en) | 2022-10-31 | 2022-12-14 | Oxford Nanopore Tech Plc | Method |
WO2024094966A1 (en) | 2022-11-01 | 2024-05-10 | Oxford Nanopore Technologies Plc | Biochemical analysis system and method of controlling a biochemical analysis system |
GB202216905D0 (en) | 2022-11-11 | 2022-12-28 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
GB202301095D0 (en) | 2023-01-25 | 2023-03-08 | Oxford Nanopore Tech Plc | Calibration of a nanopore array device |
GB202304324D0 (en) | 2023-03-24 | 2023-05-10 | Oxford Nanopore Tech Plc | Method and kits |
GB202307486D0 (en) | 2023-05-18 | 2023-07-05 | Oxford Nanopore Tech Plc | Method |
GB202401864D0 (en) | 2024-02-12 | 2024-03-27 | Fund Centre De Regulacio Genòmica | A method of detecting non-canonical bases in sequencing data |
GB202407228D0 (en) | 2024-05-21 | 2024-07-03 | Oxford Nanopore Tech Plc | Method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010004273A1 (en) * | 2008-07-07 | 2010-01-14 | Oxford Nanopore Technologies Limited | Base-detecting pore |
WO2010034018A2 (en) * | 2008-09-22 | 2010-03-25 | University Of Washington | Msp nanopores and related methods |
Family Cites Families (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI82266C (fi) | 1982-10-19 | 1991-02-11 | Cetus Corp | Foerfarande foer framstaellning av il-2 -mutein. |
EP0753071A1 (en) | 1993-04-28 | 1997-01-15 | Worcester Foundation For Experimental Biology | Cell-targeted lytic pore-forming agents |
US5777078A (en) | 1993-04-28 | 1998-07-07 | Worcester Foundation For Experimental Biology | Triggered pore-forming agents |
DE4320201A1 (de) | 1993-06-18 | 1995-01-12 | Asta Medica Ag | Verwendung von Cetrorelix und weiteren Nona- und Dekapeptiden zur Herstellung eines Arzneimittels zur Bekämpfung von Aids und zur Wachstumsstimulation |
US5386373A (en) | 1993-08-05 | 1995-01-31 | Pavilion Technologies, Inc. | Virtual continuous emission monitoring system with sensor validation |
US7569341B2 (en) | 1994-01-31 | 2009-08-04 | Trustees Of Boston University | Nucleic acid directed immobilization arrays and methods of assembly |
US5561043A (en) | 1994-01-31 | 1996-10-01 | Trustees Of Boston University | Self-assembling multimeric nucleic acid constructs |
US6362002B1 (en) | 1995-03-17 | 2002-03-26 | President And Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
US5795782A (en) | 1995-03-17 | 1998-08-18 | President & Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
AU8586298A (en) | 1997-07-25 | 1999-02-16 | University Of Massachusetts | Designed protein pores as components for biosensors |
US6087099A (en) | 1997-09-08 | 2000-07-11 | Myriad Genetics, Inc. | Method for sequencing both strands of a double stranded DNA in a single sequencing reaction |
US6127166A (en) | 1997-11-03 | 2000-10-03 | Bayley; Hagan | Molluscan ligament polypeptides and genes encoding them |
JPH11137260A (ja) | 1997-11-06 | 1999-05-25 | Soyaku Gijutsu Kenkyusho:Kk | 抗インフルエンザウイルス環状ダンベル型rna−dnaキメラ化合物及び抗インフルエンザウイルス剤 |
US6123819A (en) | 1997-11-12 | 2000-09-26 | Protiveris, Inc. | Nanoelectrode arrays |
DE19826758C1 (de) | 1998-06-15 | 1999-10-21 | Soft Gene Gmbh | Darstellung von linearen kovalent geschlossenen DNA-Molekülen als Expressionskonstrukte |
US7155344B1 (en) | 1998-07-27 | 2006-12-26 | Caliper Life Sciences, Inc. | Distributed database for analytical instruments |
US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
US6426231B1 (en) | 1998-11-18 | 2002-07-30 | The Texas A&M University System | Analyte sensing mediated by adapter/carrier molecules |
NO986133D0 (no) | 1998-12-23 | 1998-12-23 | Preben Lexow | FremgangsmÕte for DNA-sekvensering |
EP2383776B1 (en) | 1999-06-22 | 2015-02-25 | President and Fellows of Harvard College | Solid state nanopore device for evaluating biopolymers |
US7087729B1 (en) | 1999-06-29 | 2006-08-08 | University Health Network | Peptide conjugates for the stabilization of membrane proteins and interactions with biological membranes |
JP2003508054A (ja) * | 1999-08-31 | 2003-03-04 | ニーデルバイス,ミヒャエル | チャンネル形成性タンパク質の製造方法 |
AU1804001A (en) | 1999-12-02 | 2001-06-12 | Molecular Staging, Inc. | Generation of single-strand circular dna from linear self-annealing segments |
EP1255772A2 (en) | 2000-02-11 | 2002-11-13 | The Texas A & M University System | Biosensor compositions and methods of use |
AU5091201A (en) | 2000-03-21 | 2001-10-03 | Curagen Corp | Vegf-modulated genes and methods employing them |
AU2001247781C1 (en) | 2000-03-22 | 2006-08-17 | Curagen Corporation | Novel polypeptides, and nucleic acids encoding the same |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
ATE369697T1 (de) | 2000-09-25 | 2007-08-15 | Sensovation Ag | Vorrichtung und verfahren zur optischen messung |
WO2002042496A2 (en) | 2000-11-27 | 2002-05-30 | The Regents Of The University Of California | Methods and devices for characterizing duplex nucleic acid molecules |
US20030087232A1 (en) | 2001-01-25 | 2003-05-08 | Fred Christians | Methods for screening polypeptides |
US7807408B2 (en) | 2001-03-19 | 2010-10-05 | President & Fellows Of Harvard College | Directed evolution of proteins |
US6995236B2 (en) | 2001-05-08 | 2006-02-07 | Riken | Sphingomyelin detecting probe |
US6863833B1 (en) | 2001-06-29 | 2005-03-08 | The Board Of Trustees Of The Leland Stanford Junior University | Microfabricated apertures for supporting bilayer lipid membranes |
EP1585954B1 (en) | 2001-07-03 | 2014-03-26 | The Regents of The University of California | Mammalian sweet and amino acid heterodimeric taste receptors |
EP1504114B1 (en) | 2002-05-10 | 2017-07-12 | The Texas A & M University System | Stochastic sensing through covalent interactions |
US7163658B2 (en) | 2003-04-23 | 2007-01-16 | Rouvain Bension | Rapid sequencing of polymers |
US7344882B2 (en) | 2003-05-12 | 2008-03-18 | Bristol-Myers Squibb Company | Polynucleotides encoding variants of the TRP channel family member, LTRPC3 |
WO2005056750A2 (en) | 2003-12-11 | 2005-06-23 | Quark Biotech, Inc. | Inversion-duplication of nucleic acids and libraries prepared thereby |
WO2006028508A2 (en) | 2004-03-23 | 2006-03-16 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
WO2005124888A1 (en) | 2004-06-08 | 2005-12-29 | President And Fellows Of Harvard College | Suspended carbon nanotube field effect transistor |
CA2577079C (en) | 2004-08-13 | 2014-05-20 | President And Fellows Of Harvard College | An ultra high-throughput opti-nanopore dna readout platform |
US20060105461A1 (en) | 2004-10-22 | 2006-05-18 | May Tom-Moy | Nanopore analysis system |
WO2007084103A2 (en) | 2004-12-21 | 2007-07-26 | The Texas A & M University System | High temperature ion channels and pores |
GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
US7272518B2 (en) | 2005-07-01 | 2007-09-18 | Square D Company | Automated hierarchy classification in utility monitoring systems |
WO2007024997A2 (en) | 2005-08-22 | 2007-03-01 | Fermalogic, Inc. | Methods of increasing production of secondary metabolites |
US7877154B2 (en) | 2005-09-30 | 2011-01-25 | Fisher-Rosemount Systems, Inc. | Method and system for controlling a batch process |
KR100730350B1 (ko) | 2005-10-17 | 2007-06-19 | 삼성전자주식회사 | 표면처리된 나노포어를 이용한 dna 검출방법 및검출장치 |
GB0523282D0 (en) | 2005-11-15 | 2005-12-21 | Isis Innovation | Methods using pores |
AU2006331512B2 (en) | 2005-12-22 | 2012-02-23 | Pacific Biosciences Of California, Inc. | Active surface coupled polymerases |
US7932029B1 (en) | 2006-01-04 | 2011-04-26 | Si Lok | Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities |
CA2663047A1 (en) | 2006-09-06 | 2008-03-13 | Phase Bioscience, Inc. | Therapeutic elastin-like polypeptide (elp) fusion proteins |
US7638034B2 (en) | 2006-09-21 | 2009-12-29 | Los Alamos National Security, Llc | Electrochemical detection of single molecules using abiotic nanopores having electrically tunable dimensions |
US20100311602A1 (en) | 2006-10-13 | 2010-12-09 | J. Craig Venter Institute, Inc. | Sequencing method |
US8594848B2 (en) | 2006-11-28 | 2013-11-26 | Lester F. Ludwig | Reconfigurable chemical process systems |
US20100196203A1 (en) | 2007-02-20 | 2010-08-05 | Gurdial Singh Sanghera | Formation of Lipid Bilayers |
JP5646987B2 (ja) * | 2007-04-04 | 2014-12-24 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | ナノポアを使用するための組成物、デバイス、システム、及び方法 |
GB0716005D0 (en) | 2007-08-16 | 2007-09-26 | Imp Innovations Ltd | Single molecule spectroscopy using nanoporpus membranes |
GB0716264D0 (en) | 2007-08-21 | 2007-09-26 | Isis Innovation | Bilayers |
US8698481B2 (en) | 2007-09-12 | 2014-04-15 | President And Fellows Of Harvard College | High-resolution molecular sensor |
GB2453377A (en) | 2007-10-05 | 2009-04-08 | Isis Innovation | Transmembrane protein pores and molecular adapters therefore. |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
EP2232233B1 (en) | 2007-12-31 | 2014-03-12 | Fujirebio Inc. | Clusters of microresonators for cavity mode optical sensing |
US8231969B2 (en) | 2008-03-26 | 2012-07-31 | University Of Utah Research Foundation | Asymmetrically functionalized nanoparticles |
AU2009229157B2 (en) | 2008-03-28 | 2015-01-29 | Pacific Biosciences Of California, Inc. | Compositions and methods for nucleic acid sequencing |
US8772041B2 (en) | 2008-05-22 | 2014-07-08 | The Regents Of The University Of California | Membrane precursors and membranes formed therefrom |
EP2682460B1 (en) | 2008-07-07 | 2017-04-26 | Oxford Nanopore Technologies Limited | Enzyme-pore constructs |
GB0820927D0 (en) | 2008-11-14 | 2008-12-24 | Isis Innovation | Method |
EP2359289A4 (en) | 2008-11-26 | 2015-11-11 | Illumina Inc | METHODS AND SYSTEMS FOR ANALYZING SEQUENCING DATA |
CN102369298B (zh) | 2009-01-30 | 2017-03-22 | 牛津纳米孔技术有限公司 | 跨膜测序中用于核酸构建体的衔接体 |
KR20110125226A (ko) | 2009-01-30 | 2011-11-18 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 혼성화 링커 |
RU2011138951A (ru) | 2009-02-23 | 2013-03-27 | Сайтомкс Терапьютикс, Инк. | Пропротеины и способы их применения |
FR2943656A1 (fr) | 2009-03-25 | 2010-10-01 | Air Liquide | Procede et installation de production d'hydrogene mettant en oeuvre un compresseur thermocinetique |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
EP2422198B1 (en) | 2009-04-20 | 2013-09-25 | Oxford Nanopore Technologies Limited | Lipid bilayer sensor array |
AU2010326349B2 (en) | 2009-12-01 | 2015-10-29 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument |
FR2955773B1 (fr) | 2010-02-01 | 2017-05-26 | Commissariat A L'energie Atomique | Complexe moleculaire de ciblage des antigenes vers les cellules presentatrices d'antigene et ses applications pour la vaccination |
CN103370617B (zh) | 2010-10-01 | 2015-11-25 | 牛津纳米孔技术有限公司 | 生物化学分析设备和旋转阀 |
GB201100516D0 (en) | 2011-01-12 | 2011-02-23 | Isis Innovation | Method using fluorinated amphiphiles |
CA2837306C (en) | 2011-05-27 | 2020-03-10 | Oxford Nanopore Technologies Limited | Determining the presence, absence or characteristics of an analyte coupled to a membrane |
US9777049B2 (en) | 2012-04-10 | 2017-10-03 | Oxford Nanopore Technologies Ltd. | Mutant lysenin pores |
TWI655213B (zh) | 2012-07-13 | 2019-04-01 | 目立康股份有限公司 | 自我組織化肽衍生物的製造方法 |
US20140206842A1 (en) | 2013-01-22 | 2014-07-24 | Muhammed Majeed | Peptides Modified with Triterpenoids and Small Organic Molecules: Synthesis and use in Cosmeceutical |
-
2012
- 2012-02-10 BR BR112013020411-7A patent/BR112013020411B1/pt active IP Right Grant
- 2012-02-10 JP JP2013553029A patent/JP6169976B2/ja active Active
- 2012-02-10 KR KR1020137023664A patent/KR101939420B1/ko active IP Right Grant
- 2012-02-10 WO PCT/GB2012/050301 patent/WO2012107778A2/en active Application Filing
- 2012-02-10 CN CN201280017717.6A patent/CN103460040B/zh active Active
- 2012-02-10 EP EP12703872.7A patent/EP2673638B1/en active Active
- 2012-02-10 US US13/984,628 patent/US9751915B2/en active Active
- 2012-02-10 AU AU2012215135A patent/AU2012215135B9/en active Active
- 2012-02-10 CA CA2826374A patent/CA2826374C/en active Active
-
2017
- 2017-03-22 JP JP2017055552A patent/JP2017148052A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010004273A1 (en) * | 2008-07-07 | 2010-01-14 | Oxford Nanopore Technologies Limited | Base-detecting pore |
WO2010034018A2 (en) * | 2008-09-22 | 2010-03-25 | University Of Washington | Msp nanopores and related methods |
Non-Patent Citations (1)
Title |
---|
PNAS, Vol.105, No.52, pp.20647-20652 (2008.12.) |
Also Published As
Publication number | Publication date |
---|---|
JP2017148052A (ja) | 2017-08-31 |
AU2012215135B9 (en) | 2017-03-09 |
AU2012215135B2 (en) | 2017-02-02 |
CA2826374A1 (en) | 2012-08-16 |
CA2826374C (en) | 2024-01-23 |
US20140186823A1 (en) | 2014-07-03 |
CN103460040A (zh) | 2013-12-18 |
CN103460040B (zh) | 2016-08-17 |
EP2673638B1 (en) | 2019-10-30 |
WO2012107778A2 (en) | 2012-08-16 |
BR112013020411B1 (pt) | 2021-09-08 |
JP2014506575A (ja) | 2014-03-17 |
JP6169976B2 (ja) | 2017-07-26 |
US9751915B2 (en) | 2017-09-05 |
KR20140049511A (ko) | 2014-04-25 |
WO2012107778A3 (en) | 2012-11-29 |
EP2673638A2 (en) | 2013-12-18 |
BR112013020411A2 (pt) | 2017-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101939420B1 (ko) | 돌연변이체 세공 | |
KR102222191B1 (ko) | 돌연변이체 기공 | |
US11845780B2 (en) | Mutant lysenin pores | |
US10472673B2 (en) | Hetero-pores | |
CN106459159B (zh) | 突变孔 | |
EP3204511B1 (en) | Mutant pores | |
KR20230125853A (ko) | 돌연변이체 csgg 포어 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |