ES2962666T3 - Síntesis quimioenzimática de liraglutida, semaglutida y GLP-1 - Google Patents
Síntesis quimioenzimática de liraglutida, semaglutida y GLP-1 Download PDFInfo
- Publication number
- ES2962666T3 ES2962666T3 ES19709061T ES19709061T ES2962666T3 ES 2962666 T3 ES2962666 T3 ES 2962666T3 ES 19709061 T ES19709061 T ES 19709061T ES 19709061 T ES19709061 T ES 19709061T ES 2962666 T3 ES2962666 T3 ES 2962666T3
- Authority
- ES
- Spain
- Prior art keywords
- glu
- gly
- ala
- peptide
- ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108010019598 Liraglutide Proteins 0.000 title claims description 38
- 229960002701 liraglutide Drugs 0.000 title claims description 38
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 title claims description 37
- DLSWIYLPEUIQAV-UHFFFAOYSA-N Semaglutide Chemical compound CCC(C)C(NC(=O)C(Cc1ccccc1)NC(=O)C(CCC(O)=O)NC(=O)C(CCCCNC(=O)COCCOCCNC(=O)COCCOCCNC(=O)CCC(NC(=O)CCCCCCCCCCCCCCCCC(O)=O)C(O)=O)NC(=O)C(C)NC(=O)C(C)NC(=O)C(CCC(N)=O)NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)C(CC(C)C)NC(=O)C(Cc1ccc(O)cc1)NC(=O)C(CO)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(Cc1ccccc1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)C(C)(C)NC(=O)C(N)Cc1cnc[nH]1)C(C)O)C(C)O)C(C)C)C(=O)NC(C)C(=O)NC(Cc1c[nH]c2ccccc12)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CCCNC(N)=N)C(=O)NCC(O)=O DLSWIYLPEUIQAV-UHFFFAOYSA-N 0.000 title claims description 30
- 108010060325 semaglutide Proteins 0.000 title claims description 29
- 229950011186 semaglutide Drugs 0.000 title claims description 29
- 101710198884 GATA-type zinc finger protein 1 Proteins 0.000 title claims 2
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 title claims 2
- 230000015572 biosynthetic process Effects 0.000 title description 44
- 238000003786 synthesis reaction Methods 0.000 title description 43
- 102100025101 GATA-type zinc finger protein 1 Human genes 0.000 title 1
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 252
- 150000002148 esters Chemical class 0.000 claims abstract description 105
- 150000001413 amino acids Chemical class 0.000 claims abstract description 97
- 238000000034 method Methods 0.000 claims abstract description 92
- 238000005859 coupling reaction Methods 0.000 claims abstract description 87
- 238000010168 coupling process Methods 0.000 claims abstract description 80
- 230000008878 coupling Effects 0.000 claims abstract description 79
- 125000006239 protecting group Chemical group 0.000 claims abstract description 46
- 150000007970 thio esters Chemical class 0.000 claims abstract description 36
- 108010033276 Peptide Fragments Proteins 0.000 claims abstract description 30
- 102000007079 Peptide Fragments Human genes 0.000 claims abstract description 30
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical group CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 claims abstract description 17
- 101800001415 Bri23 peptide Proteins 0.000 claims abstract description 15
- 101800000655 C-terminal peptide Proteins 0.000 claims abstract description 15
- 102400000107 C-terminal peptide Human genes 0.000 claims abstract description 15
- 125000000524 functional group Chemical group 0.000 claims abstract description 13
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 9
- 150000001412 amines Chemical group 0.000 claims abstract description 7
- 235000001014 amino acid Nutrition 0.000 claims description 108
- 229940024606 amino acid Drugs 0.000 claims description 91
- 230000035772 mutation Effects 0.000 claims description 74
- 102000003960 Ligases Human genes 0.000 claims description 72
- 108090000364 Ligases Proteins 0.000 claims description 72
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 69
- 239000012038 nucleophile Substances 0.000 claims description 67
- 210000004899 c-terminal region Anatomy 0.000 claims description 61
- 230000002255 enzymatic effect Effects 0.000 claims description 59
- 108010056079 Subtilisins Proteins 0.000 claims description 49
- 102000005158 Subtilisins Human genes 0.000 claims description 49
- 125000000446 sulfanediyl group Chemical group *S* 0.000 claims description 42
- -1 17-carboxyheptadecanoyl group Chemical group 0.000 claims description 39
- 108090000787 Subtilisin Proteins 0.000 claims description 23
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 102220281620 rs551111938 Human genes 0.000 claims description 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 6
- 125000001301 ethoxy group Chemical group [H]C([H])([H])C([H])([H])O* 0.000 claims description 6
- 125000001312 palmitoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 claims description 6
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 claims description 5
- 102220499814 Carbonic anhydrase 2_N62A_mutation Human genes 0.000 claims description 5
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 claims description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 5
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 claims description 5
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 claims description 5
- 235000016491 selenocysteine Nutrition 0.000 claims description 5
- 229940055619 selenocysteine Drugs 0.000 claims description 5
- YQZVQKYXWPIKIX-UHFFFAOYSA-N 2-[2-[2-[[2-[2-(2-aminoethoxy)ethoxy]acetyl]amino]ethoxy]ethoxy]acetic acid Chemical compound NCCOCCOCC(=O)NCCOCCOCC(O)=O YQZVQKYXWPIKIX-UHFFFAOYSA-N 0.000 claims description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 4
- 239000004475 Arginine Substances 0.000 claims description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 3
- 235000004279 alanine Nutrition 0.000 claims description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 3
- 229960000310 isoleucine Drugs 0.000 claims description 3
- 229930182817 methionine Natural products 0.000 claims description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 3
- 239000004474 valine Substances 0.000 claims description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 2
- 102400000322 Glucagon-like peptide 1 Human genes 0.000 claims 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 49
- 239000012634 fragment Substances 0.000 description 47
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 42
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 39
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 37
- 239000000047 product Substances 0.000 description 37
- 102000004190 Enzymes Human genes 0.000 description 35
- 108090000790 Enzymes Proteins 0.000 description 35
- 102000004196 processed proteins & peptides Human genes 0.000 description 35
- 239000000243 solution Substances 0.000 description 34
- 125000000539 amino acid group Chemical group 0.000 description 30
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 27
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 26
- 239000000203 mixture Substances 0.000 description 25
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 24
- 108090000623 proteins and genes Proteins 0.000 description 23
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 22
- 238000009833 condensation Methods 0.000 description 18
- 230000005494 condensation Effects 0.000 description 18
- 230000007062 hydrolysis Effects 0.000 description 15
- 238000006460 hydrolysis reaction Methods 0.000 description 15
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 14
- 125000000534 N(2)-L-lysino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C([H])([H])C(C([H])([H])N([H])[H])([H])[H] 0.000 description 14
- 239000007997 Tricine buffer Substances 0.000 description 14
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 14
- 238000003776 cleavage reaction Methods 0.000 description 13
- 238000004108 freeze drying Methods 0.000 description 13
- 235000018102 proteins Nutrition 0.000 description 13
- 102000004169 proteins and genes Human genes 0.000 description 13
- 102000035195 Peptidases Human genes 0.000 description 12
- 108091005804 Peptidases Proteins 0.000 description 12
- 239000004365 Protease Substances 0.000 description 12
- 238000013459 approach Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 11
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 11
- 229940098779 methanesulfonic acid Drugs 0.000 description 11
- 238000002953 preparative HPLC Methods 0.000 description 11
- 239000011541 reaction mixture Substances 0.000 description 11
- 230000007017 scission Effects 0.000 description 11
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 10
- SEQKRHFRPICQDD-UHFFFAOYSA-N N-tris(hydroxymethyl)methylglycine Chemical compound OCC(CO)(CO)[NH2+]CC([O-])=O SEQKRHFRPICQDD-UHFFFAOYSA-N 0.000 description 10
- 239000000872 buffer Substances 0.000 description 10
- 238000004128 high performance liquid chromatography Methods 0.000 description 10
- 108010038807 Oligopeptides Proteins 0.000 description 9
- 102000015636 Oligopeptides Human genes 0.000 description 9
- 125000003277 amino group Chemical group 0.000 description 9
- 239000012429 reaction media Substances 0.000 description 9
- 239000007858 starting material Substances 0.000 description 9
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 239000011347 resin Substances 0.000 description 8
- 229920005989 resin Polymers 0.000 description 8
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 7
- 150000004665 fatty acids Chemical class 0.000 description 7
- 238000010647 peptide synthesis reaction Methods 0.000 description 7
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 6
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 6
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 6
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 6
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 6
- 235000008206 alpha-amino acids Nutrition 0.000 description 6
- 239000012431 aqueous reaction media Substances 0.000 description 6
- 239000007864 aqueous solution Substances 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 235000014113 dietary fatty acids Nutrition 0.000 description 6
- 229930195729 fatty acid Natural products 0.000 description 6
- 239000000194 fatty acid Substances 0.000 description 6
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 6
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- QKFJKGMPGYROCL-UHFFFAOYSA-N phenyl isothiocyanate Chemical compound S=C=NC1=CC=CC=C1 QKFJKGMPGYROCL-UHFFFAOYSA-N 0.000 description 6
- 239000002243 precursor Substances 0.000 description 6
- 238000010532 solid phase synthesis reaction Methods 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- ZGYICYBLPGRURT-UHFFFAOYSA-N tri(propan-2-yl)silicon Chemical compound CC(C)[Si](C(C)C)C(C)C ZGYICYBLPGRURT-UHFFFAOYSA-N 0.000 description 6
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- UZMAPBJVXOGOFT-UHFFFAOYSA-N Syringetin Natural products COC1=C(O)C(OC)=CC(C2=C(C(=O)C3=C(O)C=C(O)C=C3O2)O)=C1 UZMAPBJVXOGOFT-UHFFFAOYSA-N 0.000 description 5
- 230000002378 acidificating effect Effects 0.000 description 5
- 125000002252 acyl group Chemical group 0.000 description 5
- 125000000217 alkyl group Chemical group 0.000 description 5
- 238000010511 deprotection reaction Methods 0.000 description 5
- KCFYHBSOLOXZIF-UHFFFAOYSA-N dihydrochrysin Natural products COC1=C(O)C(OC)=CC(C2OC3=CC(O)=CC(O)=C3C(=O)C2)=C1 KCFYHBSOLOXZIF-UHFFFAOYSA-N 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000007306 functionalization reaction Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 4
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical group NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- LGDSHSYDSCRFAB-UHFFFAOYSA-N Methyl isothiocyanate Chemical compound CN=C=S LGDSHSYDSCRFAB-UHFFFAOYSA-N 0.000 description 4
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 4
- SECXISVLQFMRJM-UHFFFAOYSA-N N-Methylpyrrolidone Chemical compound CN1CCCC1=O SECXISVLQFMRJM-UHFFFAOYSA-N 0.000 description 4
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 4
- 239000000654 additive Substances 0.000 description 4
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 239000003480 eluent Substances 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000003301 hydrolyzing effect Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 229930182852 proteinogenic amino acid Natural products 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108010004034 stable plasma protein solution Proteins 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- SOWBFZRMHSNYGE-UHFFFAOYSA-N Monoamide-Oxalic acid Natural products NC(=O)C(O)=O SOWBFZRMHSNYGE-UHFFFAOYSA-N 0.000 description 3
- 235000021314 Palmitic acid Nutrition 0.000 description 3
- 101710118538 Protease Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 125000001797 benzyl group Chemical class [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 3
- 150000001576 beta-amino acids Chemical class 0.000 description 3
- 150000001732 carboxylic acid derivatives Chemical group 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 239000012043 crude product Substances 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 150000002540 isothiocyanates Chemical class 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229940117953 phenylisothiocyanate Drugs 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 3
- 230000006340 racemization Effects 0.000 description 3
- 238000007086 side reaction Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 108010037022 subtiligase Proteins 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 2
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 2
- XTHFKEDIFFGKHM-UHFFFAOYSA-N Dimethoxyethane Chemical compound COCCOC XTHFKEDIFFGKHM-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 150000008575 L-amino acids Chemical group 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- FXHOOIRPVKKKFG-UHFFFAOYSA-N N,N-Dimethylacetamide Chemical compound CN(C)C(C)=O FXHOOIRPVKKKFG-UHFFFAOYSA-N 0.000 description 2
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- DKGAVHZHDRPRBM-UHFFFAOYSA-N Tert-Butanol Chemical compound CC(C)(C)O DKGAVHZHDRPRBM-UHFFFAOYSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- RHQDFWAXVIIEBN-UHFFFAOYSA-N Trifluoroethanol Chemical compound OCC(F)(F)F RHQDFWAXVIIEBN-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- DJPVONPSNBLDSU-UHFFFAOYSA-A [Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O Chemical compound [Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O DJPVONPSNBLDSU-UHFFFAOYSA-A 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 150000001408 amides Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 101150009206 aprE gene Proteins 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 125000001584 benzyloxycarbonyl group Chemical group C(=O)(OCC1=CC=CC=C1)* 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000002843 carboxylic acid group Chemical group 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000006482 condensation reaction Methods 0.000 description 2
- 239000006184 cosolvent Substances 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000002473 insulinotropic effect Effects 0.000 description 2
- 230000017730 intein-mediated protein splicing Effects 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- BNJOQKFENDDGSC-UHFFFAOYSA-N octadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCCCC(O)=O BNJOQKFENDDGSC-UHFFFAOYSA-N 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 150000003354 serine derivatives Chemical class 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- 235000017557 sodium bicarbonate Nutrition 0.000 description 2
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- 238000000825 ultraviolet detection Methods 0.000 description 2
- DDCPKNYKNWXULB-YFKPBYRVSA-N (2s)-2-azaniumyl-3-[(2-methylpropan-2-yl)oxy]propanoate Chemical compound CC(C)(C)OC[C@H]([NH3+])C([O-])=O DDCPKNYKNWXULB-YFKPBYRVSA-N 0.000 description 1
- DVBUCBXGDWWXNY-SFHVURJKSA-N (2s)-5-(diaminomethylideneamino)-2-(9h-fluoren-9-ylmethoxycarbonylamino)pentanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C3=CC=CC=C3C2=C1 DVBUCBXGDWWXNY-SFHVURJKSA-N 0.000 description 1
- 125000006273 (C1-C3) alkyl group Chemical group 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 125000006701 (C1-C7) alkyl group Chemical group 0.000 description 1
- BYEAHWXPCBROCE-UHFFFAOYSA-N 1,1,1,3,3,3-hexafluoropropan-2-ol Chemical compound FC(F)(F)C(O)C(F)(F)F BYEAHWXPCBROCE-UHFFFAOYSA-N 0.000 description 1
- BDNKZNFMNDZQMI-UHFFFAOYSA-N 1,3-diisopropylcarbodiimide Chemical compound CC(C)N=C=NC(C)C BDNKZNFMNDZQMI-UHFFFAOYSA-N 0.000 description 1
- JFLSOKIMYBSASW-UHFFFAOYSA-N 1-chloro-2-[chloro(diphenyl)methyl]benzene Chemical compound ClC1=CC=CC=C1C(Cl)(C=1C=CC=CC=1)C1=CC=CC=C1 JFLSOKIMYBSASW-UHFFFAOYSA-N 0.000 description 1
- 125000000453 2,2,2-trichloroethyl group Chemical group [H]C([H])(*)C(Cl)(Cl)Cl 0.000 description 1
- 125000004206 2,2,2-trifluoroethyl group Chemical group [H]C([H])(*)C(F)(F)F 0.000 description 1
- AOQBFUJPFAJULO-UHFFFAOYSA-N 2-(4-isothiocyanatophenyl)isoindole-1-carbonitrile Chemical compound C1=CC(N=C=S)=CC=C1N1C(C#N)=C2C=CC=CC2=C1 AOQBFUJPFAJULO-UHFFFAOYSA-N 0.000 description 1
- HOZZVEPRYYCBTO-UHFFFAOYSA-N 2-(9h-fluoren-9-ylmethoxycarbonylamino)-2-methylpropanoic acid Chemical compound C1=CC=C2C(COC(=O)NC(C)(C)C(O)=O)C3=CC=CC=C3C2=C1 HOZZVEPRYYCBTO-UHFFFAOYSA-N 0.000 description 1
- XQPYRJIMPDBGRW-UHFFFAOYSA-N 2-[2-[2-(9h-fluoren-9-ylmethoxycarbonylamino)ethoxy]ethoxy]acetic acid Chemical compound C1=CC=C2C(COC(=O)NCCOCCOCC(=O)O)C3=CC=CC=C3C2=C1 XQPYRJIMPDBGRW-UHFFFAOYSA-N 0.000 description 1
- HXMVNCMPQGPRLN-UHFFFAOYSA-N 2-hydroxyputrescine Chemical compound NCCC(O)CN HXMVNCMPQGPRLN-UHFFFAOYSA-N 0.000 description 1
- MZGXHCHKGRQLHR-UHFFFAOYSA-N 5-(dimethylamino)-n-(4-isothiocyanatophenyl)naphthalene-1-sulfonamide Chemical compound C1=CC=C2C(N(C)C)=CC=CC2=C1S(=O)(=O)NC1=CC=C(N=C=S)C=C1 MZGXHCHKGRQLHR-UHFFFAOYSA-N 0.000 description 1
- HWFBOFAKQCMAPO-UHFFFAOYSA-N 7-isothiocyanato-2,1,3-benzoxadiazole-4-sulfonamide Chemical compound NS(=O)(=O)C1=CC=C(N=C=S)C2=NON=C12 HWFBOFAKQCMAPO-UHFFFAOYSA-N 0.000 description 1
- SUOZAUUDBKHLHQ-UHFFFAOYSA-N 7-isothiocyanato-n,n-dimethyl-2,1,3-benzoxadiazole-4-sulfonamide Chemical compound CN(C)S(=O)(=O)C1=CC=C(N=C=S)C2=NON=C12 SUOZAUUDBKHLHQ-UHFFFAOYSA-N 0.000 description 1
- DBTMQODRSDEGRZ-UHFFFAOYSA-N 9h-fluoren-9-ylmethyl n-(2-oxoethyl)carbamate Chemical compound C1=CC=C2C(COC(=O)NCC=O)C3=CC=CC=C3C2=C1 DBTMQODRSDEGRZ-UHFFFAOYSA-N 0.000 description 1
- NTFTULBKHJJQAW-HNNXBMFYSA-N 9h-fluoren-9-ylmethyl n-[(2s)-4-methyl-1-oxopentan-2-yl]carbamate Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CC(C)C)C=O)C3=CC=CC=C3C2=C1 NTFTULBKHJJQAW-HNNXBMFYSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical group [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 101100455752 Caenorhabditis elegans lys-3 gene Proteins 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-N Carbamic acid Chemical compound NC(O)=O KXDHJXZQYSOELW-UHFFFAOYSA-N 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 108010088406 Glucagon-Like Peptides Proteins 0.000 description 1
- 239000006173 Good's buffer Substances 0.000 description 1
- 101000788682 Homo sapiens GATA-type zinc finger protein 1 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Natural products N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108010026809 Peptide deformylase Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 150000001371 alpha-amino acids Chemical class 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 125000001743 benzylic group Chemical group 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 239000006177 biological buffer Substances 0.000 description 1
- 239000012267 brine Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 150000001733 carboxylic acid esters Chemical class 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 108091006116 chimeric peptides Proteins 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- LCFXLZAXGXOXAP-DAXSKMNVSA-N ethyl (2z)-2-cyano-2-hydroxyiminoacetate Chemical compound CCOC(=O)C(=N/O)\C#N LCFXLZAXGXOXAP-DAXSKMNVSA-N 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012262 fermentative production Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- IRXSLJNXXZKURP-UHFFFAOYSA-N fluorenylmethyloxycarbonyl chloride Chemical compound C1=CC=C2C(COC(=O)Cl)C3=CC=CC=C3C2=C1 IRXSLJNXXZKURP-UHFFFAOYSA-N 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229940025708 injectable product Drugs 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 235000020845 low-calorie diet Nutrition 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 101150112117 nprE gene Proteins 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 238000005897 peptide coupling reaction Methods 0.000 description 1
- UYWQUFXKFGHYNT-UHFFFAOYSA-N phenylmethyl ester of formic acid Natural products O=COCC1=CC=CC=C1 UYWQUFXKFGHYNT-UHFFFAOYSA-N 0.000 description 1
- NMHMNPHRMNGLLB-UHFFFAOYSA-N phloretic acid Chemical compound OC(=O)CCC1=CC=C(O)C=C1 NMHMNPHRMNGLLB-UHFFFAOYSA-N 0.000 description 1
- 230000037081 physical activity Effects 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000003223 protective agent Substances 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 235000003441 saturated fatty acids Nutrition 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229910052938 sodium sulfate Inorganic materials 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- WINGEFIITRDOLJ-UHFFFAOYSA-N tert-butyl 2-hydroxyacetate Chemical compound CC(C)(C)OC(=O)CO WINGEFIITRDOLJ-UHFFFAOYSA-N 0.000 description 1
- FZQIQTXXAATZOS-UHFFFAOYSA-N tert-butyl n-[(4-isothiocyanatophenyl)methyl]carbamate Chemical compound CC(C)(C)OC(=O)NCC1=CC=C(N=C=S)C=C1 FZQIQTXXAATZOS-UHFFFAOYSA-N 0.000 description 1
- 125000005931 tert-butyloxycarbonyl group Chemical group [H]C([H])([H])C(OC(*)=O)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 125000004044 trifluoroacetyl group Chemical group FC(C(=O)*)(F)F 0.000 description 1
- 101150079396 trpC2 gene Proteins 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/02—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length in solution
- C07K1/026—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length in solution by fragment condensation in solution
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/605—Glucagons
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
- C12N9/54—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21062—Subtilisin (3.4.21.62)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Endocrinology (AREA)
- Toxicology (AREA)
- Analytical Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
La invención se refiere a un método para sintetizar un péptido que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala. -Y-Glu-Phe-lle-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly, que comprende acoplar enzimáticamente (a) un éster o tioéster peptídico C-terminal que comprende un primer fragmento peptídico que comprende la secuencia His-X - Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster; y (b) un péptido nudófilo que tiene una amina N-terminal no protegida que comprende un segundo fragmento peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-lle-Ala- Trp-Leu-Val-Z-Gly-Arg-Gly en donde - X es Ala o un residuo de ácido α-amino-isobutírico (Aib) - Y es Lys, Lys que tiene un grupo ε-amino libre en la cadena lateral o del cual Lys, el grupo ε-amino de la cadena lateral está protegido con un grupo protector o del cual Lys, el grupo ε-amino de la cadena lateral está funcionalizado con un aminoácido u otro grupo funcional: Z es Arg o Lys. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Síntesis quimioenzimática de liraglutida, semaglutida y GLP-1
La invención se refiere a un método en el que se lleva a cabo enzimáticamente el acoplamiento de un fragmento peptídico en presencia de una ligasa para sintetizar un péptido que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly.
En la técnica se conocen bien varios péptidos que comprenden la secuencia de aminoácidos H-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly-OH como péptidos insulinotrópicos. Estos péptidos incluyen GLP-1, liraglutida y semaglutida.
El GLP-1 (péptido similar al glucagón tipo 1) humano tiene la fórmula H-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Gly-OH.
La liraglutida es un análogo de Arg<20>-GLP-1 sustituido en el grupo ε-amino de la lisina en la posición 20 de la secuencia anterior con un ácido palmítico espaciado con Glu. Por tanto, la liraglutida tiene la fórmula H-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(Pal-γ-Glu)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH (todos los residuos de aminoácido quirales son residuos de L-aminoácido). En Lys(Pal-γ-Glu), el grupo ε-amino del residuo de Lys está unido con la cadena lateral de γ-Glu-carboxilo y la Glu está N-palmitoilada. La semaglutida tiene la fórmula H-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(AEEA-AEEA-γ-Glu-17-carboxiheptadecanoil)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH. En el presente documento, AEEA-AEEA-γ-Glu-17-carboxiheptadecanoílo es N-(17-carboxi-1-oxoheptadecil)-L-γ-glutamil-2-[2-(2-aminoetoxi)etoxi]acetil-2-[2-(2-aminoetoxi)etoxi]acetilo (todos los residuos de aminoácido quirales son residuos de L-aminoácido).
Estos péptidos pueden usarse, por ejemplo, en el tratamiento de diabetes tipo II. Además, por ejemplo, la liraglutida puede usarse en el tratamiento de obesidad, como producto inyectable complementario a una dieta baja en calorías y al aumento de la actividad física para el tratamiento de peso crónico en pacientes adultos.
En la técnica se conocen procedimientos para sintetizar péptidos, incluyendo oligopéptidos como GLP-1, liraglutida y semaglutida. Se describen métodos para sintetizar péptidos insulinotrópicos, tales como GLP-1 y análogos del mismo, en el documento D3 WO2007147816 y en el documento D2 WO2016/046753. En los “ANTECEDENTES DE LA INVENCIÓN” del documento D2 WO2016/046753 se proporciona una descripción detallada de métodos de preparación adecuados, concretamente metodología recombinante, síntesis secuencial sobre un soporte sólido, síntesis en fase sólida de liraglutida que implica el acoplamiento de una secuencia peptídica que contiene los residuos de aminoácido (1-10) a una secuencia que contiene los residuos de aminoácido (11-31), o síntesis en fase sólida de liraglutida que implica la preparación de secuencias peptídicas que contienen los residuos de aminoácido (1-4), (15-16) y (17-31), el acoplamiento de los péptidos que contienen los residuos de aminoácido (15-16) con (17-31) y la adición secuencial de aminoácidos antes del acoplamiento con el péptido que contiene la secuencia de aminoácidos (1-4).
Según el documento D2 WO2016/046753, los péptidos de GLP-1 se preparan en un procedimiento que comprende síntesis peptídica en fase líquida o sólida, o una combinación de las mismas, en el que el procedimiento comprende una etapa de acoplamiento final en la que al menos dos fragmentos se acoplan en un residuo de Gly terminal, y en el que al menos uno de los fragmentos se prepara mediante el acoplamiento de al menos dos subfragmentos. En particular, la liraglutida se obtiene mediante el acoplamiento de His-Ala-Glu-Gly y Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(Pal-Glu-OX)-Glu-Phe-lle-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH. En esta secuencia, X representa H o un grupo protector para el grupo ácido α-carboxílico de Glu.
Según los “ANTECEDENTES DE LA INVENCIÓN” del documento D2 WO2016/046753, sigue existiendo la necesidad de descubrir nuevos métodos para la síntesis de proteínas GLP-1 tales como liraglutida o semaglutida para proporcionar un procedimiento mejor, más eficiente y/o más barato o para proporcionar un producto que pueda purificarse más fácilmente con el fin de lograr un producto con rendimiento y pureza mejorados. En particular, expresa la necesidad de proporcionar un método para preparar GLP-1 y análogos, tales como liraglutida o semaglutida, especialmente a escala industrial, que no debe requerir el uso de reactivos tóxicos o de otro modo indeseables, con buenos rendimientos, y que puedan purificarse fácilmente para obtener un producto que tenga alta pureza.
No se sugiere ninguna síntesis enzimática de GLP-1 o un análogo del mismo, como liraglutida o semaglutida, en el documento D3 WO2007147816 ni en el documento D2 WO2016/046753, centrándose ambos en la síntesis química. Sin embargo, la síntesis totalmente química de péptidos presenta desventajas, tal como también se comenta en la técnica anterior citada anteriormente. Además, los péptidos de más de 15 aminoácidos a menudo son difíciles de sintetizar sobre la fase sólida debido a reacciones secundarias. Como consecuencia, la purificación es problemática. Por tanto, los péptidos de más de 10 aminoácidos a menudo se sintetizan mediante una combinación de síntesis en fase sólida de fragmentos oligopeptídicos con cadenas laterales protegidas que posteriormente se condensan químicamente en disolución, por ejemplo, como en una condensación 10 10 para preparar un péptido de 20 aminoácidos. El principal inconveniente de la condensación química de fragmentos oligopeptídicos con cadenas laterales protegidas es que, tras la activación del residuo de aminoácido C-terminal del donante de acilo, se produce la racemización. En cambio, los acoplamientos peptídicos catalizados por enzimas carecen completamente de racemización y tienen varias otras ventajas con respecto a la síntesis química de péptidos, tales como la ausencia de reacciones secundarias en las funcionalidades de las cadenas laterales. Para la aplicación industrial, un concepto de síntesis enzimática de péptidos basado en un enfoque cinético, es decir, usando un éster C-terminal donante de acilo, es el más atractivo (véase, por ejemplo, N. Sewald y H.-D. Jakubke, en: “Peptides: Chemistry and Biology”, 1ª reimpresión, Ed. Wiley-VCH Verlag GmbH, Weinheim 2002).
Un problema con el acoplamiento enzimático en disoluciones acuosas es que la presencia de agua tiende a fomentar la hidrólisis en lugar del acoplamiento. Se han publicado algunos informes sobre la condensación enzimática de fragmentos oligopeptídicos en disolución acuosa (Kumaranet al. Protein Science, 2000, 9, 734; Björupet al. Bioorg. Med. Chem. 1998, 6, 891; Homandberget al. Biochemistry, 1981, 21, 3387; Komoriyaet al. Int. J. Pep. Prot. Res.1980, 16, 433).
Wellset al. (documento US 5.403.737) hallaron que la condensación enzimática de oligopéptidos en disolución acuosa puede mejorarse significativamente alterando el sitio activo de subtilisina BPN’, una subtilisina deB. amyloliquefaciens(SEQ ID NO: 2). Cuando se introdujeron dos mutaciones, es decir, S221C y P225A, se obtuvo una variante de subtilisina BPN’ denominada subtiligasa que tenía una razón de síntesis con respecto a hidrólisis (razón S/H) aumentada en 500 veces en comparación con subtilisina BPN’ de tipo natural. En experimentos adicionales, Wellset al. añadieron cinco mutaciones adicionales a la subtiligasa para hacer que la enzima fuera más estable (Proc. Natl. Acad. Sci. USA, 1994, 91, 12544). El nuevo mutante, denominado estabiligasa, parecía moderadamente más resistente al dodecasulfato de sodio y al clorhidrato de guanidinio, pero la hidrólisis todavía era una reacción secundaria principal.
En el documento WO 2016/056913 se proporciona una solución para la actividad hidrolítica indeseablemente alta hallada en enzimas como la subtiligasa o la estabiligasa cuando se usan para la síntesis de (oligo)péptidos en un entorno acuoso, al dotar a variantes de subtilisina BPN’, o a homólogos de las mismas, de mutaciones específicas. Estas variantes u homólogos son particularmente adecuados para catalizar la síntesis de péptidos mediante el acoplamiento de un primer fragmento peptídico y un segundo fragmento peptídico, en el que el primer fragmento es un éster o tioéster C-terminal peptídico y el segundo fragmento es un nucleófilo peptídico que tiene una amina no protegida de manera N-terminal.
Documentos adicionales de la técnica anterior son los siguientes:
- El documento D1 WO 2017/007324 A1 (ENZYPEP) da a conocer un método para identificar fragmentos peptídicos a partir de los cuales se sintetizaría un péptido de interés mediante condensación enzimática de fragmentos usando una ligasa; cuando se aplica a la liraglutida, tal método proporcionó fragmentos que son diferentes de los fragmentos usados en la presente invención (véanse los ejemplos 10 y 11).
- El documento D4 “Chemo-enzymatic peptide synthesis (CEPS) using omniligases and selective peptiligases - Efficient biocatalysts for assembling linear and cyclic peptides and protein conjugates”, CHIMICA OGGI, TEKNOSCIENZE, MILÁN, IT, vol. 34, n.º 6, 1 de noviembre de 2016 (01-11-2016), páginas 16-19; y el documento D5 “Engineering a Diverse Ligase Toolbox for Peptide Segment Condensation”, Advanced Synthesis & Catalysis, vol.358, n.º 24, 8 de diciembre de 2016 (08-12-2016), páginas 4041-4048, ambos de Nuijenset al., dan a conocer el uso de variantes de subtilisina BPN’ como ligasas peptídicas.
- El documento D6 WO 2005/081619 A2 (NEURONOVA) da a conocer que los análogos de GLP-1 pueden presentar una o más modificaciones de la secuencia N-terminal de GLP-1, que incluye la secuencia HAEGTFTSDVS (SEQ ID NO: 30), pero este péptido no se usó para la síntesis de GLP-1 mediante ligación a otros péptidos.
- El documento D7 WO 96/09396 A1 (UNIV MARYLAND) y el documento D8 WO 02/26956 A1 (UNIV MARYLAND BIOTECH INST) dan a conocer variantes de subtilisina que tienen una deleción aa75-83 y una mutación S221C.
Los inventores consideraron aplicar la condensación enzimática de fragmentos para la síntesis de GLP-1, liraglutida y semaglutida partiendo de los fragmentos peptídicos mencionados en el documento D3 WO2007147816 o en el documento D2 WO2016/046753. Entre otras cosas, los inventores consideraron acoplar el péptido de 10-meros que tiene residuos de aminoácido 1-10 al péptido de 21-meros que contiene los residuos de aminoácido 11-31 de liraglutida, semaglutida o GLP-1 mediante condensación enzimática de fragmentos, siendo el 10-mero el (tio)éster y siendo el 21-mero el nucleófilo. Para el acoplamiento del (tio)éster C-terminal peptídico que tiene los residuos de aminoácido 1-10 a un nucleófilo peptídico que contiene los residuos de aminoácido 11-31, se halló que la presencia de una serina tanto en P1’ como en P2’ era desventajosa para el nucleófilo peptídico. Posibles motivos adicionales de una falta de acoplamiento eficaz podrían ser la presencia de un aminoácido no hidrófobo en P4 (treonina) del (tio)éster C-terminal peptídico. Además, los inventores intentaron acoplar un (tio)éster C-terminal peptídico que tenía los residuos de aminoácido 1-4 a un nucleófilo peptídico que contenía los residuos de aminoácido 5-31, sin éxito. Los inventores concluyeron que, en particular, la presencia de histidina en P4 y/o la presencia de glicina en P1 del (tio)éster C-terminal peptídico son perjudiciales para un acoplamiento eficaz. Tal como se ilustra en los ejemplos 1 y 2 de la presente divulgación, se halló que es posible preparar estos péptidos mediante acoplamiento enzimático en presencia de una ligasa, también en un medio de reacción acuoso, pero que el rendimiento era inesperadamente bajo para varios procedimientos diseñados basándose en consideraciones científicas, tales como la consideración de que una ligasa como una variante de subtilisina o un homólogo de la misma favorece el acoplamiento de los (tio)ésteres C-terminales peptídicos que tienen un residuo de aminoácido hidrófobo en la posición P4 (el cuarto aminoácido desde el extremo C-terminal) del éster o tioéster C-terminal peptídico. Entre otras cosas, se llevó a cabo un método en el que se preparó el péptido con la secuencia de aminoácidos de liraglutida (“H-liraglutida-1-31-OH”) mediante el acoplamiento enzimático del éster C-terminal de 13-meros His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-OCam-Leu-OH y el nucleófilo peptídico de 18-meros H-Leu-Glu-Gly-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en presencia de una variante de subtilisina BPN’. Aunque se esperaba que la presencia del residuo de aminoácido hidrófobo, Val, en la posición P4 del éster C-terminal hiciera que estos fragmentos fueran fragmentos particularmente buenos para preparar la secuencia de aminoácidos de liraglutida con un alto rendimiento, este péptido se obtuvo con un rendimiento muy bajo (véase el ejemplo 1). Tal como ilustra el ejemplo 2, el rendimiento mediante la preparación enzimática de H-liraglutida-1-31-OH a partir del éster C-terminal de 9-meros y el nucleófilo peptídico de 22-meros correspondientes fue incluso menor, aunque se esperaba que la presencia de un residuo de Phe hidrófobo en la posición P4 hiciera que estos fragmentos fueran fragmentos particularmente buenos para una reacción de condensación enzimática.
Un objeto de la presente invención es proporcionar un novedoso método para sintetizar enzimáticamente GLP-1 o un análogo del mismo, en particular liraglutida o semaglutida. En general, existe la necesidad de procedimientos alternativos de síntesis enzimática de péptidos para estos péptidos, en particular con el fin de ampliar la gama de herramientas para su preparación. En particular, un objeto es proporcionar un procedimiento de este tipo que supere uno o más de los problemas mencionados anteriormente o comentados en la técnica anterior citada anteriormente, más particularmente un rendimiento global mejorado o una selectividad mejorada.
Uno o más de otros objetos que pueden ser el objeto de la invención se desprenden a partir de la siguiente descripción.
Ahora se ha hallado sorprendentemente que se cumplen uno o más de estos objetos mediante un método en el que se prepara GLP-1 o un análogo del mismo en un método que comprende la síntesis enzimática de un péptido mediante condensación de fragmentos, en el que dos fragmentos específicos de dicho péptido se acoplan en presencia de una ligasa, en particular una variante o un homólogo de subtilisina.
Por consiguiente, la presente invención se refiere a un método para sintetizar un péptido que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly, en la que
-Xes Ala o un residuo de ácido α-amino-isobutírico (Aib);
-Yes Lys, Lys que tiene un grupo ε-amino de cadena lateral libre (es decir, un residuo de lisina no derivatizado), o cuyo grupo ε-amino de cadena lateral está protegido con un grupo protector o está funcionalizado con un aminoácido u otro grupo funcional;
-Zes Arg o Lys;
comprendiendo el método acoplar enzimáticamente
(a) un éster o tioéster C-terminal peptídico que comprende un primer fragmento peptídico que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y
(b) un nucleófilo peptídico que tiene una amina no protegida de manera N-terminal que comprende un segundo fragmento peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly;
acoplamiento enzimático que está catalizado por una ligasa, en el que la ligasa es una variante de subtilisina BPN’ o un homólogo de la misma, que comprende las siguientes mutaciones en comparación con subtilisina BPN’ representada por SEQ ID NO: 2 o una secuencia homóloga de la misma:
- una deleción de los aminoácidos correspondientes a las posiciones 75-83;
- una mutación en la posición de aminoácido correspondiente a S221, siendo la mutación selenocisteína S221C o S221;
- preferiblemente una mutación en la posición de aminoácido correspondiente a P225;
en el que las posiciones de aminoácido se definen según la secuencia de subtilisina BPN’ representada por SEQ ID NO: 2,
y en el que dicha ligasa es una variante de subtilisina BPN’ o un homólogo de la misma que tiene al menos el 80 %, o el 85 %, o el 90 %, preferiblemente el 95 %, de identidad de secuencia con SEQ ID NO: 2.
En particular, es sorprendente que un método según la invención permite la síntesis del péptido de interés (el producto de ligación) con un alto rendimiento, también cuando se lleva a cabo en un medio de reacción acuoso. Después de todo, la Ser en la posición P4 del fragmento de (tio)éster C-terminal es polar, que desde una perspectiva científica se esperaba que fuera desfavorable para la reacción de acoplamiento enzimático.
Eso se ha logrado sin la necesidad de ningún grupo protector de cadenas laterales en los fragmentos peptídicos y sin la necesidad de dotar a uno o ambos de los fragmentos de un grupo funcional para aumentar la solubilidad (por ejemplo, un grupo 2-hidroxi-4-metoxibencilamida en la funcionalidad amida de la estructura principal peptídica o una etiqueta peptídica de aminoácidos polares en los extremos terminales de los fragmentos respectivos que no participan en la reacción de acoplamiento), aunque en una realización específica pueden usarse grupos protectores o grupos potenciadores de solubilidad. La alta razón S/H sin la necesidad de un grupo potenciador de solubilidad es sorprendente porque la solubilidad del nucleófilo peptídico es baja.
En un método según la invención, la Y del nucleófilo peptídico puede ser una Lys que tiene un grupo ε-amino de cadena lateral libre (es decir, un residuo de lisina no derivatizado). Sin embargo, la invención también permite el acoplamiento de un nucleófilo peptídico en el que Y es una Lys cuyo grupo ε-amino de cadena lateral comprende un grupo funcional, en particular en el que Y es Lys-γ-Glu, Lys(AEEA-AEEA-γ-Glu), Lys(Pal-γ-Glu-OH) o Lys(AEEA-AEEA-γ-Glu-17-carboxiheptadecanoil-OH). En particular, es sorprendente que también es posible el acoplamiento enzimático eficiente usando tales nucleófilos peptídicos, a pesar de la presencia de tales grupos que son estéricamente muy exigentes. A este respecto, además es sorprendente que también se logra una alta tasa de síntesis con respecto a hidrólisis (razón S/H) en un medio de reacción acuoso al tiempo que el nucleófilo peptídico tiene una alta hidrofobia, que aumenta por la presencia de un grupo hidrófobo (tal como una cola de ácido graso) en el grupo ε-amino de cadena lateral de la Lys. Generalmente, es un hallazgo de los inventores que la razón S/H está directamente relacionada con la concentración del nucleófilo y, por tanto, con la solubilidad del nucleófilo en disolución acuosa. Puesto que la presencia de un grupo funcional hidrófobo hace que la solubilidad de las moléculas resultantes sea muy baja, por tanto es muy sorprendente que las razones S/H todavía son muy altas, cuando se acopla el (tio)éster con el nucleófilo peptídico tal como se define en la presente invención, es decir, que comprende el (tio)éster peptídico de 11-meros y el nucleófilo peptídico de 20-meros. Los métodos de referencia en los que se intentó obtener el mismo producto de ligación mediante el acoplamiento de un (tio)éster y nucleófilo peptídico diferentes dotado o no de la funcionalidad de cadena en la posición Y, por ejemplo, el (tio)éster de 9-meros y el nucleófilo peptídico de 22-meros correspondientes, no tuvieron éxito.
En particular, se ha hallado que es posible el acoplamiento con un nucleófilo peptídico en el que Y es una Lys cuyo grupo ε-amino de cadena lateral se ha funcionalizado con un aminoácido u otro grupo funcional con variantes de subtilisina BPN’, tal como se describe en más detalle en otras partes en el presente documento. Las realizaciones preferidas de métodos en los que el acoplamiento se lleva a cabo usando un nucleófilo peptídico en el que Y es una Lys cuyo grupo ε-amino de cadena lateral está funcionalizado también se describirán en más detalle a continuación. Para el propósito de esta invención, “razón de síntesis con respecto a hidrólisis” (razón S/H) quiere decir la cantidad de producto (oligo)peptídico enzimáticamente sintetizado dividido entre la cantidad de (oligo)éster o tioéster C-terminal peptídico cuyo grupo éster o tioéster se ha hidrolizado. Para más detalles sobre la determinación de la razón S/H, se hace referencia al documento WO 2016/056913.
El término “o”, tal como se usa en el presente documento, se define como “y/o” a menos que se especifique lo contrario o se deduzca a partir del contexto que significa “o bien… o bien...”.
El término “un” o “una”, tal como se usa en el presente documento, se define como “al menos uno” a menos que se especifique lo contrario o se deduzca a partir del contexto que debe referirse al singular únicamente.
Cuando se hace referencia un sustantivo (por ejemplo, un compuesto, un aditivo, etc.) en singular, se pretende que se incluya el plural, a menos que se deduzca a partir del contexto que debe referirse al singular únicamente.
El término “pH” se usa en el presente documento para el pH aparente, es decir, el pH tal como se mide con un electrodo de pH calibrado convencional.
Para el propósito de esta invención, “péptidos” quiere decir cualquier cadena compuesta por dos o más aminoácidos. Por tanto, los péptidos generalmente son amidas compuestas al menos conceptualmente por dos o más moléculas de ácido aminocarboxílico (es decir, aminoácidos) mediante la formación de un enlace covalente a partir del carbono del carbonilo de una con el átomo de nitrógeno de otra con pérdida formal de agua. El término “péptido” se aplica habitualmente a estructuras formadas a partir de α-aminoácidos, aunque un péptido puede comprender otros aminoácidos, tales como uno o más beta-aminoácidos y/o uno o más γ-aminoácidos.
La secuencia de aminoácidos de un péptido se denomina estructura primaria. En una realización, el péptido está esencialmente libre de una estructura secundaria y esencialmente libre de una estructura terciaria.
En una realización, un péptido que se ha sintetizado o que va a acoplarse en un método según la invención consiste esencialmente en residuos de aminoácido. Por ejemplo, GLP-1 consiste en residuos de aminoácido. En una realización adicional, el péptido consiste esencialmente en unidades de aminoácido y grupos protectores.
En una realización adicional, un péptido que se ha sintetizado o que va a acoplarse en un método según la invención es un conjugado de una cadena peptídica y otro residuo, tal como un ácido graso. Estos péptidos se denominan lipopéptidos. Por ejemplo, pueden usarse ácidos grasos para cambiar la solubilidad. Ejemplos de ácidos grasos adecuados son ácidos grasos saturados C8-C24 y ácidos grasos insaturados C8-C24. Si se desea, se proporciona un ligador polar entre el péptido y el ácido graso, por ejemplo, para aumentar la solubilidad en un entorno acuoso. La liraglutida y la semaglutida son péptidos que son conjugados de una cadena peptídica y un ácido graso. La semaglutida comprende un ligador polar entre el péptido y el residuo de ácido graso.
Normalmente, los péptidos, término que incluye oligopéptidos, proteínas y péptidos quiméricos, comprenden hasta aproximadamente 35.000 unidades de aminoácidos, en particular 3-20.000, más en particular 4-1000 ó 5-500 unidades de aminoácidos. La ligasa, que no forma parte de la invención, puede usarse para la síntesis de otros péptidos distintos de His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly. Tales péptidos pueden comprender 500 unidades de aminoácidos o menos, en particular 200 o menos, o 100 o menos.
“Oligopéptidos” quiere decir, dentro del contexto de la invención, un péptido compuesto por 2-200 unidades de aminoácidos, en particular compuesto por 5-100 unidades de aminoácidos, más en particular compuesto por 10-50 unidades de aminoácidos.
Para el propósito de esta invención, “enlace peptídico” quiere decir el enlace amida entre (i) o bien el extremo αamino terminal de un α-aminoácido o bien el extremo beta-amino terminal de un beta-aminoácido y (ii) o bien el extremo α-carboxilo terminal de otro α-aminoácido o bien el extremo beta-carboxilo terminal de otro betaaminoácido. Preferiblemente, el enlace peptídico es entre el extremo α-amino terminal de un α-aminoácido y el extremo α-carboxilo terminal de otro α-aminoácido.
En el contexto de la invención, “cadena lateral de aminoácido” quiere decir cualquier cadena lateral de aminoácido proteinogénico o no proteinogénico.
Los aminoácidos proteinogénicos son los aminoácidos que está codificados por el código genético. Los aminoácidos proteinogénicos incluyen: alanina (Ala), valina (Val), leucina (Leu), isoleucina (Ile), serina (Ser), treonina (Thr), metionina (Met), cisteína (Cys), asparagina (Asn), glutamina (Gln), tirosina (Tyr), triptófano (Trp), glicina (Gly), ácido aspártico (Asp), ácido glutámico (Glu), histidina (His), lisina (Lys), arginina (Arg), prolina (Pro) y fenilalanina (Phe). La selenocisteína (Sec, U) es un aminoácido, cuya estructura corresponde a cisteína, con la condición de que contenga un selenio en lugar de un átomo de azufre. Los aminoácidos proteinogénicos son los L-éstereoisómeros de dichos aminoácidos (excepto para la glicina, que no tiene ninguna forma estereoisomérica).
El aminoácido no proteinogénico de interés particular en un método según la presente invención es ácido 2-aminoisobutírico (Aib), que forma parte de la cadena peptídica de la semaglutida.
El término “(tio)éster” se usa en el presente documento como abreviatura de la expresión “éster o tioéster”.
El término “protección N-terminal” se usa en el presente documento para indicar que un grupo amina N-terminal de un péptido, normalmente el grupo α-amina N-terminal, está dotado de un grupo protector que generalmente protege al menos sustancialmente el grupo amina N-terminal frente al acoplamiento con un grupo carboxílico C-terminal de otro péptido o de la misma molécula peptídica.
El término “protección C-terminal” se usa en el presente documento para indicar que un grupo carboxílico C-terminal de un péptido, normalmente el grupo α-carboxílico C-terminal, está dotado de un grupo protector que generalmente protege al menos sustancialmente el grupo carboxílico frente al acoplamiento con un grupo amina N-terminal de otro péptido o de la misma molécula peptídica.
El término “mutado” o “mutación”, tal como se usa en el presente documento con respecto a proteínas o polipéptidos, en particular enzimas tales como ligasas, significa que al menos un aminoácido en la secuencia de polipéptido o proteína que se produce de manera natural o de tipo natural se ha reemplazado por un aminoácido diferente, se ha insertado en, se ha unido a o se ha delecionado de la secuencia mediante mutagénesis de ácidos nucleicos que codifican para estos aminoácidos. La mutagénesis es un método bien conocido en la técnica e incluye, por ejemplo, mutagénesis dirigida al sitio por medio de PCR o mediante mutagénesis mediada por oligonucleótidos tal como se describe en Sambrooket al., Molecular Cloning - A Laboratory Manual, 2ª ed., vol. 1-3 (1989). El término “mutado” o “mutación”, tal como se usa en el presente documento con respecto a genes, significa que al menos un nucleótido en la secuencia de ácido nucleico de ese gen o una secuencia reguladora del mismo se ha reemplazado por un nucleótido diferente, se ha insertado en, se ha unido a o se ha delecionado de la secuencia mediante mutagénesis, dando como resultado la transcripción de una secuencia de proteína con una función cualitativa o cuantitativamente alterada o dando como resultado la atenuación de ese gen.
En la presente memoria descriptiva, una abreviatura para indicar sustituciones de aminoácidos emplea el código de aminoácidos de una sola letra del aminoácido que se sustituye, seguido del número que designa dónde se realiza la sustitución en la secuencia de aminoácidos de la proteína. Este número es la posición de aminoácido de la secuencia de aminoácidos de tipo natural. Por tanto, para la secuencia de aminoácidos mutada, es la posición de aminoácido correspondiente a la posición con ese número en la enzima de tipo natural. Debido a una o más de otras mutaciones en una posición posterior (adiciones, inserciones, deleciones, etc.), no es necesario que la posición actual sea la misma. El experto podrá determinar las posiciones correspondientes usando una técnica de alineación generalmente conocida, tal como NEEDLE. Al número le sigue el código de una sola letra del aminoácido que reemplaza al aminoácido de tipo natural en la misma. Por ejemplo, S221C indica la sustitución de serina en la posición correspondiente a la posición 221 por cisteína. X se usa para indicar cualquier otro aminoácido proteinogénico distinto del aminoácido que va a sustituirse. Por ejemplo, S221X indica la sustitución de serina en la posición correspondiente a la posición 221 por cualquier otro aminoácido proteinogénico.
El término “ligasa” se usa en el presente documento para una enzima que tiene actividad catalítica en el acoplamiento de dos péptidos al catalizar la formación de un enlace peptídico mediante el acoplamiento del extremo C-terminal de un primer péptido y el extremo N-terminal de otro péptido. Generalmente, la ligasa usada en un método según la invención tiene actividad ligasa con respecto al acoplamiento de un (tio)éster de 11-meros His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser y un nucleófilo peptídico de 20-meros H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly.
Tal como definen Schechter y Berger, los residuos de sitio activo en las proteasas, incluyendo ligasas, están compuestos por bolsillos contiguos denominados subsitios. Cada bolsillo de subsitio se une a un residuo correspondiente en la secuencia de sustrato peptídica, denominado en el presente documento posición de secuencia. Según esta definición, los residuos de aminoácido en la secuencia de sustrato están numerados consecutivamente hacia fuera desde los sitios de escisión como .-P4-P3-P2-P1-P1’-P2’-P3’-P4’-. (el enlace escindible está ubicado entre las posiciones P1 y P1’), mientras que los subsitios (bolsillos) en el sitio activo están marcados correspondientemente como .-S4-S3-S2-S1-S1’-S2’-S3’-S4’-. (Schechter y Berger, Biochem Biophys Res Commun. 20 de abril de1967;27(2):157-62). Cabe destacar que no todas las proteasas tienen la totalidad de dichos subsitios. Por ejemplo, un bolsillo S3’ y/o S4’ puede estar ausente en una variante de subtilisina BPN’ o un homólogo de la misma usado en un método según la invención.
Para el propósito de esta invención, “bolsillo S1, S2, S3 y S4” quiere decir los aminoácidos de una proteasa (en particular una ligasa) que interaccionan con los aminoácidos de un péptido donante de acilo. El aminoácido C-terminal (1<er>aminoácido; P1) del péptido donante de acilo interacciona con los aminoácidos en el bolsillo S1 de la proteasa. El penúltimo aminoácido (2º aminoácido desde el extremo C-terminal; P2) del péptido donante de acilo interacciona con los aminoácidos en el bolsillo S2 de la proteasa, el tercer aminoácido (P3) con el bolsillo S3 y el cuarto aminoácido (P4) con el bolsillo S4. Los bolsillos de unión S1-S4 de una proteasa están definidos por varios aminoácidos que pueden estar distantes en la estructura primaria de la proteasa, pero están próximos en el espacio tridimensional. Para el propósito de esta invención, “bolsillo S1’ y S2’” quiere decir los aminoácidos de una proteasa que interaccionan con los aminoácidos N-terminales de un nucleófilo peptídico. El aminoácido N-terminal del nucleófilo peptídico interacciona con los aminoácidos en el bolsillo S1’ de la proteasa. El penúltimo aminoácido N-terminal del nucleófilo peptídico interacciona con los aminoácidos en el bolsillo S2’ de la proteasa. Los bolsillos de unión S1’ y S2’ de una proteasa están definidos por varios aminoácidos que pueden estar distantes en la estructura primaria de la proteasa, pero están próximos en el espacio tridimensional.
Cuando se menciona una enzima con referencia a una clase de enzima (EC) entre corchetes, la clase de enzima es una clase en la que la enzima se clasifica o puede clasificarse, basándose en la Nomenclatura de Enzimas proporcionada por el Comité de Nomenclatura de la Unión Internacional de Bioquímica y Biología Molecular (NC-IUBMB), nomenclatura que puede encontrarse en http://www.chem.qmul.ac.uk/iubmb/enzyme/. Se pretende que se incluyan otras enzimas adecuadas que (aún) no se han clasificado en una clase especificada, pero que pueden clasificarse como tal.
Los homólogos normalmente tienen una función prevista en común con el péptido o la enzima, del cual es un homólogo, tal como la capacidad de catalizar la misma reacción, en particular un acoplamiento enzimático de un método según la invención.
Se dice que las secuencias de aminoácidos o nucleótidos son homólogas cuando presentan un determinado nivel de similitud. Si dos secuencias homólogas están estrechamente relacionadas o más distantemente relacionadas se indica mediante el “porcentaje de identidad” o el “porcentaje de similitud”, que es alto o bajo, respectivamente.
Los términos “homología”, “porcentaje de homología”, “porcentaje de identidad” o “porcentaje de similitud” se usan indistintamente en el presente documento. Para el propósito de esta invención, en el presente documento se define que con el fin de determinar el porcentaje de identidad de dos secuencias de aminoácidos, se alinean las secuencias completas con el propósito de una comparación óptima. Con el fin de optimizar la alineación entre las dos secuencias, pueden introducirse huecos en cualquiera de las dos secuencias que se comparan. Tal alineación se lleva a cabo a lo largo de toda la longitud de las secuencias que están comparándose. Alternativamente, la alineación puede llevarse a cabo a lo largo de una longitud más corta, por ejemplo, a lo largo de aproximadamente 20, aproximadamente 50, aproximadamente 100 o más ácidos nucleicos o aminoácidos. El porcentaje de identidad es el porcentaje de coincidencias idénticas entre las dos secuencias a lo largo de la región alineada notificada. Una comparación de secuencias y la determinación del porcentaje de identidad entre dos secuencias pueden lograrse usando un algoritmo matemático. El experto será consciente del hecho de que están disponibles varios programas informáticos diferentes para alinear dos secuencias y determinar la homología entre dos secuencias (Kruskal, J. B. (1983) An overview of sequence comparison En D. Sankoff y J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, págs. 1-44 Addison Wesley). El porcentaje de identidad entre dos secuencias de aminoácidos puede determinarse usando el algoritmo de Needleman y Wunsch para la alineación de dos secuencias. (Needleman, S. B. y Wunsch, C. D. (1970) J. Mol. Biol.
48, págs. 443-453). El algoritmo de Needleman-Wunsch se ha implementado en el programa informático NEEDLE. Para el propósito de esta invención, se usó el programa NEEDLE del paquete EMBOSS (versión 2.8.0 o superior, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice, P. Longden, I. y Bleasby, A. Trends in Genetics 16, (6) págs. 276-277, http://emboss.bioinformatics.nl/). Para las secuencias de proteínas, se usa EBLOSUM62 para la matriz de sustitución. Pueden especificarse otras matrices. Los parámetros opcionales usados para la alineación de secuencias de aminoácidos son una penalización por hueco abierto de 10 y una penalización por extensión de hueco de 0,5. El experto apreciará que todos estos parámetros diferentes producirán resultados ligeramente diferentes, pero que el porcentaje de identidad global de dos secuencias no se altera significativamente cuando se usan algoritmos diferentes.
La homología o identidad entre las dos secuencias alineadas se calcula de la siguiente manera: el número de posiciones correspondientes en la alineación que muestran un aminoácido idéntico en ambas secuencias dividido entre la longitud total de la alineación después de la resta del número total de huecos en la alineación. La identidad, tal como se define en el presente documento, puede obtenerse a partir de NEEDLE usando la opción NOBRIEF y se etiqueta en el resultado del programa como “identidad más larga”. Para los propósitos de la invención, el nivel de identidad (homología) entre dos secuencias se calcula según la definición de “identidad más larga” tal como puede llevarse a cabo usando el programa NEEDLE.
Las secuencias de polipéptido, en particular las secuencias de enzimas, pueden usarse adicionalmente como “secuencia de consulta” para realizar una búsqueda frente a bases de datos de secuencias, por ejemplo, para identificar otros miembros de la familia o secuencias relacionadas. Tales búsquedas pueden realizarse usando los programas BLAST. El software para realizar análisis BLAST está disponible públicamente a través del Centro Nacional para la Información Biotecnológica (http://www.ncbi.nlm.nih.gov). BLASTP se usa para secuencias de aminoácidos. El programa BLAST usa como parámetros por defecto:
- Coste para abrir el hueco: por defecto = 11 para proteínas
- Coste para extender el hueco: por defecto = 1 para proteínas
- Valor esperado: por defecto = 10
- Tamaño de palabra: por defecto = 28 para megablastos / 3 para proteínas
Además, el grado de identidad (homología) local entre la secuencia de aminoácidos de consulta y las secuencias homólogas recuperadas se determina mediante el programa BLAST. Sin embargo, sólo se comparan aquellos segmentos de secuencia que proporcionan una coincidencia por encima de un determinado umbral. Por consiguiente, el programa calcula la identidad sólo para estos segmentos coincidentes. Por tanto, la identidad calculada de este modo se denomina identidad local.
El término “homólogo” se usa en el presente documento en particular para péptidos, más en particular para enzimas, que tienen una identidad de secuencia de al menos el 50 %, preferiblemente al menos el 60 %, más preferiblemente al menos el 70 %, al menos el 80 %, al menos el 90 %, al menos el 95 %, al menos el 96 %, al menos el 97 %, al menos el 98 % o al menos el 99 %, con el péptido, en particular con la enzima, con el que se compara el péptido o la enzima homólogo. Evidentemente, la identidad de secuencia será menor del 100 %. El porcentaje de identidad de secuencia dependerá del número de mutaciones y de la longitud del péptido (enzima) con el que se compara el homólogo. En la alineación de la “identidad más larga”, no se tienen en cuenta las deleciones.
Para el propósito de esta invención, “condensación” quiere decir la formación de un nuevo enlace amida entre la función carboxílica C-terminal de un péptido con la función amina N-terminal de un nucleófilo, en particular otro péptido.
El término “análogo” de un péptido se usa en particular para péptidos que son análogos estructurales y/o análogos funcionales de dicho péptido. Los análogos funcionales tienen la misma dianain vivo(por ejemplo, el mismo receptor diana en una membrana celular); los análogos estructurales tienen una alta similitud en cuanto a secuencia de aminoácidos. Los análogos funcionales de un péptido pueden tener una identidad de secuencia de aminoácidos relativamente baja, por ejemplo, de aproximadamente el 50 % o menos, con respecto a la secuencia de aminoácidos completa, aun así una alta identidad de secuencia (y, por tanto, una alta similitud estructural) con el péptido del cual son análogos en un segmento de la secuencia de aminoácidos, tal como cerca de la parte N-terminal o cerca de la parte C-terminal. En particular, un análogo estructural comprende una secuencia de aminoácidos que tiene al menos el 60 %, más en particular al menos el 70 %, preferiblemente al menos el 80 %, más preferiblemente al menos el 90 % de identidad de secuencia, más preferiblemente al menos el 95 % identidad de secuencia, con la secuencia de aminoácidos del péptido del cual un péptido es un análogo. Los términos usados en el presente documento que no se definen específicamente en el presente documento son tal como se definen en el documento WO 2016/056913, o si no se definen en ese documento, se usan según el conocimiento general común.
El éster o tioéster C-terminal peptídico comprende un primer fragmento peptídico que comprende la secuencia de aminoácidos His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, en la que X es Ala o una unidad de ácido αamino-isobutírico (Aib). Se han logrado resultados particularmente buenos con un primer fragmento peptídico, en el que ésta es la secuencia de aminoácidos del primer fragmento peptídico. En una realización específica, el extremo N-terminal está ampliado con al menos un aminoácido (Wv, véase más adelante), por ejemplo, Gly o Phe, y el extremo N-terminal del péptido ampliado se dota de un grupo protector, normalmente un grupo protector de tipo Edman (véase también más adelante). Si se desea, el extremo N-terminal puede dotarse de una etiqueta peptídica, por ejemplo, para modificar la solubilidad en el medio de reacción. Sin embargo, generalmente esto no se requiere, especialmente no en un medio de reacción acuoso.
El éster o tioéster C-terminal peptídico es normalmente un (tio)éster activado, es decir, contiene un grupo éster carboxílico o tioéster carboxílico que puede participar en la reacción de acoplamiento enzimático. En principio, puede usarse cualquier (tio)éster alquílico (sustituido o no sustituido) o arílico (sustituido o no sustituido). Ejemplos típicos de (tio)ésteres que pueden participar en la reacción de acoplamiento enzimático son(tio)ésteres metílicos, etílicos, propílicos, isopropílicos, fenílicos, bencílicos (tales como p-carboxi-bencílicos), 2,2,2-tricloroetílicos, 2,2,2-trifluoroetílicos, cianometílicos y carboxiamidometílicos.
Se han obtenido resultados particularmente buenos con ésteres de tipo carboxiamidometilo (Cam-ésteres) representados por la fórmula péptido-(C=O)-O-CX1X2-C(=O)N-R1R2. En el presente documento, cada X1y X2representa independientemente un átomo de hidrógeno o un grupo alquilo. Se han logrado resultados buenos cuando tanto X1como X2son un átomo de hidrógeno (péptido-(C=O)-O-CH2-C(=O)N-R1R2). En el presente documento, R1representa un átomo de hidrógeno o un grupo alquilo y R2representa un átomo de hidrógeno o un grupo alquilo o un aminoácido o un residuo peptídico con una funcionalidad carboxiamida o ácido carboxílico C-terminal, opcionalmente protegido en la funcionalidad de cadena lateral del aminoácido o en una o más de las funcionalidades de cadena lateral de los aminoácidos. En el presente documento, cada grupo alquilo puede representar independientemente un grupo alquilo C1-C7 (sustituido o no sustituido), preferiblemente un grupo alquilo C1-C6 lineal (sustituido o no sustituido), más preferiblemente grupo alquilo C1-C3 lineal (sustituido o no sustituido), y lo más preferiblemente un grupo metilo. En particular, se han logrado buenos resultados en un método de la invención en el que tanto R1como R2representan un átomo de hidrógeno o en el que R1representa un átomo de hidrógeno y R2representa un aminoácido o un residuo peptídico con una funcionalidad carboxiamida o ácido carboxílico C-terminal, opcionalmente protegido en la funcionalidad de cadena lateral del aminoácido o en una o más de las funcionalidades de cadena lateral de los aminoácidos.
Es especialmente ventajoso usar un Cam-AA1-AA2-éster, en el que AA1 es un primer residuo de aminoácido y AA2 es un segundo residuo de aminoácido. En el presente documento, AA1 es un residuo de aminoácido hidrófobo, tal como una unidad de alanina, valina, leucina, isoleucina, fenilalanina, metionina o triptófano. AA2 es un residuo de aminoácido básico, tal como una unidad de arginina o lisina. Se prefieren particularmente Cam-Phe-Arg y Cam-Phe-Lys. AA1 y AA2 normalmente tienen una funcionalidad de cadena lateral libre, es decir, que carece de un grupo protector u otro residuo.
También se han obtenido resultados particularmente buenos con ésteres bencílicos carboxilo-sustituidos, en particular con ésteres bencílicos p-carboxilo-sustituidos representados por la fórmula péptido-(C=O)-O-CH2-C6H4-CO2E, en la que E representa un átomo de hidrógeno, un ion de sal cargado positivamente tal como un ion de amonio, o un aminoácido o un residuo peptídico con una funcionalidad carboxiamida o ácido carboxílico C-terminal, opcionalmente protegido en la funcionalidad de cadena lateral del aminoácido o en una o más de las funcionalidades de cadena lateral de los aminoácidos. También se han obtenido buenos resultados con ésteres bencílicos pcarboxilo-sustituidos representados por la fórmula péptido-(C=O)-O-CH2-C6H4-CO2E, en la que E se define tal como antes y en la que uno o más átomos de hidrógeno en el anillo de fenilo (C6H4en la fórmula anterior) se reemplazan por un sustituyente, tal como hidroxilo, alcoxilo, ariloxilo o halógeno.
El (tio)éster C-terminal peptídico puede estar protegido de manera N-terminal o no estar protegido de manera N-terminal.
Grupos protectores N-terminales adecuados son aquellos grupos N-protectores que pueden usarse para la síntesis de péptidos. Tales grupos son conocidos por el experto en la técnica. Los ejemplos de grupos N-protectores adecuados incluyen grupos protectores de tipo carbamato o acilo, por ejemplo “Cbz” (benciloxicarbonilo), “Boc” (tercbutiloxicarbonilo), “For” (formilo), “Fmoc” (9-fluorenilmetoxicarbonilo), “PhAc” (fenacetilo) y “Ac” (acetilo). Los grupos For, PhAc y Ac pueden introducirse y escindirse enzimáticamente usando las enzimas péptido desformilasa, PenG acilasa o acilasa, respectivamente.
Los inventores se dieron cuenta además de que un grupo tiocarbamoílo sustituido, tal como un grupo feniltiocarbamoílo (PTC), es un grupo protector útil para la función α-amina N-terminal del (tio)éster C-terminal en un método para sintetizar enzimáticamente péptidos por condensación de fragmentos. El uso de tales grupos como tal se conoce bien, por ejemplo, a partir de los procedimientos de degradación de Edman. Los agentes protectores que pueden usarse para la secuenciación de aminoácidos de tipo Edman también se denominan en el presente documento agentes protectores de tipo Edman, y del mismo modo los agentes acoplados con un grupo amina (en particular, la amina N-terminal) de un péptido se denominan en el presente documento grupos protectores de tipo Edman. Los inventores hallaron que un agente protector de tipo Edman, unido a la función α-amino N-terminal a través de un aminoácido adicional de unión, por ejemplo glicina, forma un grupo protector eficaz cuando, después de la reacción de acoplamiento enzimático, es necesario dotar al péptido obtenido de un grupo funcional en la posición Y para obtener liraglutida o semaglutida, por ejemplo, cuando se acopla Pal con Lys-γ-Glu (Y) o cuando se acopla ácido 17-carboxiheptadecanoico con Lys-AEEA-AEEA-γ-Glu (Y). Pueden dotarse grupos tiocarbamoílo sustituidos a la función α-amino N-terminal haciendo reaccionar dicha función amina con el isotiocianato correspondiente en condiciones (ligeramente) alcalinas. Por tanto, puede introducirse un grupo feniltiocarbamoílo (PTC) usando fenilisotiocianato (PITC) y puede introducirse un grupo metiltiocarbamoílo (MTC) usando metilisotiocianato (MITC). En condiciones ácidas, tales grupos tiocarbamoílo sustituidos se escinden del péptido junto con el α-aminoácido al que están unidos en forma de un derivado de tiazolinona.
Se ha hallado que este nuevo modo de proporcionar protección N-terminal es ventajoso, por ejemplo, con respecto a Fmoc en cuanto a la solubilidad en un sistema de reacción acuoso. Se ha hallado que es ventajoso, por ejemplo, con respecto a Boc en cuanto a compatibilidad cuando se usa síntesis en fase sólida. Un grupo protector de tipo Edman, tal como un resto tiocarbamoílo sustituido, funciona particularmente bien como grupo protector a pH neutro o alcalino y puede eliminarse fácilmente a pH ácido. Por tanto, tal grupo se emplea habitualmente en una reacción de acoplamiento a pH neutro o alcalino, usando una ligasa que tiene una buena razón S/H a tal pH, como una variante o un homólogo de subtilisina BPN’, tal como se describe en más detalle en otras partes en el presente documento.
Las condiciones de protección/desprotección adecuadas cuando se usan restos protectores de tipo Edman incluyen aquellas que se conocen generalmente en la técnica para usar tal resto en métodos de degradación de tipo Edman. Se ha hallado que un grupo tiocarbamoílo sustituido es particularmente eficaz, en combinación con su contribución a una buena solubilidad, también en un medio de reacción acuoso. El grupo tiocarbamoílo sustituido puede ser aromático o alifático. Preferiblemente, el grupo tiocarbamoílo sustituido es un grupo tiocarbamoílo sustituido con arilo o un grupo tiocarbamoílo sustituido con alquilo. Grupos tiocarbamoílo sustituidos con arilo particularmente preferidos son grupos tiocarbamoílo sustituidos con arilo C6-C12, más en particular feniltiocarbamoílo (PTC). Grupos tiocarbamoílo sustituidos con alquilo particularmente preferidos son grupos tiocarbamoílo sustituidos con alquilo C1-C6, más en particular metiltiocarbamoílo (MTC). Ejemplos adicionales de isotiocianatos preferidos que van a usarse para la introducción de grupos tiocarbamoílo sustituidos son los mencionados en H. Matsunaga, T. Santa, K. Hagiwara, H. Homma, K. Imai, S. Uzu, K. Nakashima, S. Akiyama, Anal. Chem. 1995, 67, 4276, tales como FITC, BAMPITC, DNTC, DNSAPITC, dansilamino-PITC, 3-POPICs, 4-POPICs, CIPIC e isotiocianato de 7-[(N,N-dimetilamino)sulfonil]-2,1,3-benzoxadiazol-4-ilo (DBD-NCS), véase el párrafo que hace de puente entre las columnas de la izquierda y de la derecha de la página 4276. Aún otro ejemplo preferido es isotiocianato de 7-aminosulfonil-4-(2,1,3-benzoxadiazolilo) (ABD-NCS).
Como alternativa a un resto tiocarbamoílo sustituido, puede usarse como grupo protector otro resto adecuado para secuenciar aminoácidos en un péptido con un método de degradación de tipo Edman de manera similar, es decir, marcando el extremo N-terminal del éster C-terminal peptídico con dicho resto a través de un aminoácido de unión y, después del acoplamiento enzimático con el nucleófilo peptídico, escindiendo el resto junto con el residuo de aminoácido de unión a partir de la parte restante del producto de acoplamiento. Por tanto, los restos protectores adecuados que pueden usarse para marcar el extremo N-terminal de un péptido a través de un residuo de aminoácido de unión y escindirse junto con el residuo de aminoácido de unión también se denominan en el presente documento “grupos protectores de tipo Edman”.
Además, es posible unir un grupo protector de tipo Edman al (tio)éster C-terminal peptídico a través de más de un aminoácido (es decir, a través de una cadena peptídica). Los aminoácidos de unión pueden eliminarse entonces mediante varios ciclos de marcaje con el resto y de escisión del resto más el aminoácido, de manera similar tal como se realiza en un método de secuenciación de péptidos. El uso de aminoácidos de unión adicionales no es necesario, pero pueden usarse, si se desea, por ejemplo, para modificar la solubilidad del (tio)éster C-terminal peptídico en un medio de reacción de elección.
Por tanto, en una realización específica preferida, un método según la invención comprende el acoplamiento enzimático de
(a) un éster o tioéster C-terminal peptídico representado por la fórmula P-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster con (b) el nucleófilo peptídico. En el presente documento, P representa el grupo protector de tipo Edman, preferiblemente un resto feniltiocarbamoílo (PTC) o metiltiocarbamoílo (MTC). En el presente documento, v es un número entero de al menos 1, habitualmente de 1-10, preferiblemente 1-4, más preferiblemente 1, 2 ó 3, lo más preferiblemente 1, y v representa el número de residuos de aminoácido W. Cada W puede ser el mismo o diferente. Habitualmente cada W se selecciona del grupo de aminoácidos proteinogénicos, aunque en principio podría usarse otro aminoácido, siempre que pueda escindirse como P-W en las condiciones de escisión de tipo Edman.
Este (tio)éster C-terminal peptídico protegido de manera N-terminal se acopla con el nucleófilo (b), mediante lo cual se forma el péptido protegido de manera N-terminal P-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly. Después de eso, este péptido se somete a una reacción de escisión en la que se forma el péptido Wv-1-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly (péptido que puede alargarse en el extremo C-terminal). Si v-1 > 0, un grupo P se acopla con la función α-amino N-terminal de W del péptido, tras lo cual se elimina P-W por escisión. Luego se repite un ciclo de acoplamiento y escisión hasta que se obtiene el péptido<1>His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly. El marcaje del extremo N-terminal del péptido con P se logra de una manera conocida por sí misma, basándose en la metodología de tipo Edman conocida para dicho P, normalmente en condiciones ligeramente alcalinas, por ejemplo, a un pH de aproximadamente 8. La escisión de P-W a partir del extremo N-terminal del péptido se logra de una manera conocida por sí misma,basándose en la metodología de tipo Edman conocida para dicho P, normalmente en condiciones ácidas, habitualmente a un pH de aproximadamente 4 o menos, en particular en el intervalo de aproximadamente 3 o menos, por ejemplo, de 0-2. Por ejemplo, puede usarse ácido trifluoroacético (TFA).
En particular, la protección N-terminal del (tio)éster peptídico es útil en un método en el que Y comprende un resto Lys(γ-Glu-OH) que porta una función α-amino libre que debe acoplarse a ácido palmítico o si Y comprende un resto Lys(AEEA-AEEA-γ-Glu-OH) que porta una función α-amino libre que debe acoplarse a ácido 17-carboxiheptadecanoico.
En particular, se han logrado buenos resultados con un (tio)éster C-terminal peptídico sin funcionalidades de cadena lateral protegidas. Sin embargo, en una realización, una o más funcionalidades de cadena lateral, por ejemplo, todas las funcionalidades de cadena lateral, se dotan de un grupo protector. Los grupos protectores adecuados son conocidos por el experto en la técnica. Los grupos ácido carboxílico pueden protegerse, por ejemplo, con un grupo ciclohexilo, bencilo o alilo.
El grupo (tio)éster C-terminal activado del (tio)éster C-terminal peptídico puede sintetizarse usando síntesis en fase sólida con alto rendimiento y pureza sin racemización. Una ventaja adicional del uso de (tio)ésteres del tipo carboxiamidometilo, en los que R1representa un átomo de hidrógeno y R2representa un aminoácido o un residuo peptídico con una funcionalidad ácido carboxílico C-terminal, opcionalmente protegido en la funcionalidad de cadena lateral del aminoácido o en una o más de las funcionalidades de cadena lateral de los aminoácidos, es que su grupo éster o tioéster C-terminal activado puede sintetizarse usando la resina de cloruro de 2-clorotritilo barata y disponible industrialmente.
El grupo (tio)éster C-terminal activado del (tio)éster C-terminal peptídico también puede sintetizarse mediante síntesis en fase de disolución o mediante fermentación, es decir, usando un microorganismo. Tal como se conoce generalmente en la técnica, los procedimientos fermentativos incluyen la producción de un compuesto, es decir, un péptido, en condiciones aerobias o anaerobias. Un método fiable para obtener (tio)ésteres peptídicos usando fermentación es a través de la denominada expresión de inteína (véase, por ejemplo, E.K. Lee, Journal of Chemical Technology and Biotechnology, 2010, 9, 11-18). Hay disponibles comercialmente diferentes kits de sistemas de expresión de inteína (por ejemplo, el kit IMPACT<™>). En la técnica se conocen otros métodos para la producción fermentativa de (tio)ésteres peptídicos.
El nucleófilo peptídico que tiene una amina no protegida de manera N-terminal comprende la secuencia de aminoácidos H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly (“segundo fragmento peptídico”). Se han logrado resultados particularmente buenos con un nucleófilo peptídico en el que ésta es la secuencia de aminoácidos del nucleófilo peptídico. En particular, una ventaja importante de la presente invención es que, también en un sistema acuoso, el acoplamiento enzimático funciona bien sin la necesidad de alargar el extremo C-terminal con una etiqueta peptídica u otro derivado para potenciar la solubilidad o reactividad del nucleófilo peptídico.
En una realización, el nucleófilo peptídico está protegido de manera C-terminal. En otra realización, carece de protección C-terminal.
En particular, se han logrado buenos resultados con nucleófilos peptídicos sin funcionalidades de cadena lateral protegidas.
En una realización, una o más funcionalidades de cadena lateral (en particular, uno o más grupos hidroxilo, carboxilo o amina) del nucleófilo peptídico se dotan de un grupo protector. Los grupos protectores adecuados son conocidos por el experto en la técnica. Los grupos ácido carboxílico pueden protegerse, por ejemplo, con un grupo ciclohexilo, bencilo o alilo; las funcionalidades amina pueden protegerse, por ejemplo, con un grupo aliloxicarbonilo o un grupo trifluoroacetilo.
El nucleófilo peptídico puede sintetizarse usando métodos conocidos en la técnica, tales como síntesis en fase sólida, síntesis en fase de disolución o mediante fermentación.
Tal como se mencionó anteriormente, Y es Lys, Lys cuyo grupo ε-amino de cadena lateral puede estar protegido con un grupo protector. Sin embargo, generalmente no es necesario proteger el grupo ε-amino de cadena lateral para conseguir una tasa y un rendimiento de acoplamiento satisfactorios, en particular no si se usa una subtilisina o un homólogo de la misma como ligasa. En particular, una variante o un homólogo de subtilisina BPN’ tal como se describe en el presente documento es adecuado para acoplar ambos fragmentos también cuando el grupo ε-amino de Lys en la posición Y carece de un grupo protector.
Por consiguiente, habitualmente Y del nucleófilo peptídico es un residuo de lisina que tiene una cadena lateral de εamino libre o que tiene una cadena lateral de ε-amino funcionalizada. El producto obtenido mediante el acoplamiento enzimático puede ser el péptido de interés (opcionalmente después de la eliminación de los grupos protectores, si los hay), por ejemplo, si GLP-1 es el péptido de interés que va a sintetizarse o si Y del nucleófilo peptídico ya comprende la funcionalización necesaria para obtener liraglutida o semaglutida. Alternativamente, el producto obtenido mediante acoplamiento enzimático puede someterse posteriormente a reacciones adicionales para su funcionalización, en particular con un aminoácido u otro grupo funcional, más en particular un grupo funcional seleccionado del grupo que consiste en Pal-γ-Glu-OH y AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH, en el que Pal es palmitoílo y AEEA-AEEA es 2-[2-(2-aminoetoxi)etoxi]acetil-2-[2-(2-aminoetoxi)etoxi]acetilo. Los modos para funcionalizar la cadena lateral de aminoácidos libre de Y para producir liraglutida o semaglutida o para proporcionar el nucleófilo peptídico adecuado para sintetizar liraglutida o semaglutida pueden estar basados en metodología generalmente conocida en la técnica o pueden estar basados en los presentes ejemplos o en la tecnología descrita en la bibliografía a la que se hace referencia en las referencias citadas en el presente documento. En particular, puede usarse un protocolo de funcionalización basado en el documento US 6.451.974 B1.
En una realización particularmente preferida, el péptido que se sintetiza en un método según la invención es liraglutida.
La presente invención es ventajosa porque permite acoplar enzimáticamente (a) el éster o tioéster C-terminal peptídico que comprende el primer fragmento peptídico, comprendiendo dicho primer fragmento la secuencia His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y (b) el nucleófilo peptídico que comprende el segundo fragmento peptídico, comprendiendo dicho segundo fragmento la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es Lys(Pal-γ-Glu-OH). Por tanto, el acoplamiento enzimático puede llevarse a cabo acoplando el (tio)éster C-terminal peptídico de 11-meros y el nucleófilo N-terminal de 20-meros correspondientes, obteniendo de ese modo liraglutida. Aunque la función α-amino N-terminal del (tio)éster peptídico puede dotarse de un grupo protector tal como un grupo representado por P-Wv, tal como se define en otras partes en el presente documento cuando se describen grupos protectores de tipo Edman, entre otras cosas se han logrado resultados particularmente buenos con un método en el que el nucleófilo peptídico que tiene Y = Lys(Pal-γ-Glu-OH) se acopla con el éster o tioéster C-terminal peptídico representado por la fórmula His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster sin ninguna protección del extremo N-terminal del (tio)éster peptídico y sin la necesidad de ningún grupo protector adicional.
En una realización adicional preferida, se prepara liraglutida en un método que comprende acoplar enzimáticamente (a) el éster o tioéster C-terminal peptídico que comprende el primer fragmento peptídico, comprendiendo dicho primer fragmento la secuencia His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y (b) el nucleófilo peptídico que comprende el segundo fragmento peptídico, comprendiendo dicho segundo fragmento la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly; y después de eso dotar a dicho residuo de Lys(γ-Glu-OH) de un grupo palmitoílo (Pal), obteniendo de ese modo la liraglutida. En esta realización, la función α-amino N-terminal del éster o tioéster C-terminal peptídico se protege habitualmente durante el acoplamiento enzimático, preferiblemente con un grupo protector de tipo Edman.
En una realización particularmente preferida adicional, se prepara liraglutida mediante un método que comprende acoplar enzimáticamente (a) el éster o tioéster C-terminal peptídico que comprende el primer fragmento peptídico, comprendiendo dicho primer fragmento la secuencia His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y (b) el nucleófilo peptídico que comprende el segundo fragmento peptídico, comprendiendo dicho segundo fragmento la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es un residuo de lisina que tiene una cadena lateral de ε-amino libre; y después de eso dotar a dicha cadena lateral de εamino de Pal-γ-Glu-OH, obteniendo de ese modo la liraglutida. En esta realización, se han logrado resultados particularmente buenos sin usar ningún grupo protector en la función α-amino N-terminal del (tio)éster peptídico.
En una realización alternativa, un método según la invención comprende la síntesis de semaglutida.
En una realización ventajosa, la síntesis de semaglutida comprende acoplar enzimáticamente (a) el éster o tioéster C-terminal peptídico que comprende el primer fragmento peptídico, comprendiendo dicho primer fragmento la secuencia His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y (b) el nucleófilo peptídico que comprende el segundo fragmento peptídico, comprendiendo dicho segundo fragmento la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es Lys(AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH). De ese modo puede obtenerse directamente la semaglutida. Aunque la función α-amino N-terminal del (tio)éster peptídico puede dotarse de un grupo protector tal como un grupo representado por P-Wv, tal como se define en otras partes en el presente documento cuando se describen grupos protectores de tipo Edman, entre otras cosas se han logrado resultados particularmente buenos con un método en el que el nucleófilo peptídico con Y = Lys(AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH) se acopla con el éster o tioéster C-terminal peptídico representado por la fórmula His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster sin ninguna protección de la función α-amino N-terminal del (tio)éster peptídico y sin la necesidad de ningún grupo protector adicional.
En una realización adicional, un método para la síntesis de semaglutida comprende acoplar enzimáticamente (a) el éster o tioéster C-terminal peptídico que comprende el primer fragmento peptídico, comprendiendo dicho primer fragmento la secuencia His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y (b) el nucleófilo peptídico que comprende el segundo fragmento peptídico, comprendiendo dicho segundo fragmento la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es Lys(AEEA-AEEA-γ-Glu-OH), y después de eso dotar al resto Lys(AEEA-AEEA-γ-Glu-OH) de un grupo 17-carboxiheptadecanoílo. Por tanto, puede obtenerse la semaglutida mediante funcionalización adicional después del acoplamiento enzimático. En esta realización, la función α-amino N-terminal del éster o tioéster C-terminal peptídico se protege habitualmente durante el acoplamiento enzimático, preferiblemente con un grupo protector de tipo Edman.
En una realización adicional, la semaglutida se obtiene mediante un método que comprende acoplar enzimáticamente (a) el éster o tioéster C-terminal peptídico que comprende el primer fragmento peptídico, comprendiendo dicho primer fragmento la secuencia His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y (b) el nucleófilo peptídico que comprende el segundo fragmento peptídico, comprendiendo dicho segundo fragmento la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es un residuo de lisina que tiene una cadena lateral de ε-amino libre, y después de eso dotar a dicha cadena lateral de εamino de un grupo AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH, obteniendo de ese modo la semaglutida. Por tanto, puede obtenerse la semaglutida mediante funcionalización después del acoplamiento enzimático. En esta realización, se han logrado resultados particularmente buenos sin usar ningún grupo protector en la función α-amino N-terminal del (tio)éster peptídico (o ninguna funcionalidad de cadena lateral).
En aún otra realización alternativa, el péptido que se sintetiza es GLP-1.
La ligasa usada para catalizar el acoplamiento del (tio)éster C-terminal peptídico y el nucleófilo peptídico puede ser cualquier ligasa que tenga actividad catalítica en el acoplamiento de ambos péptidos al catalizar la formación de un enlace peptídico entre el extremo C-terminal del (tio)éster C-terminal peptídico y el extremo N-terminal del nucleófilo peptídico, en el que la razón S/H para el acoplamiento frente a la hidrólisis del producto de acoplamiento en el medio de reacción usado es mayor de 1. Habitualmente, la ligasa puede clasificarse como serina proteasa que puede clasificarse generalmente en EC 3.4.21. Generalmente, tiene una tríada catalítica en el orden Asp, His y Ser.
En particular, una ligasa usada en un método según la invención es una enzima aislada. Por tanto, se aísla a partir del organismo en el que se ha expresado, normalmente un organismo recombinante, si se ha producido en un organismo, respectivamente se aísla a partir del medio de reacción en el que se ha sintetizado. En particular, una enzima usada en un método de la invención se considera aislada para el propósito de la invención o bien en forma en bruto o bien sustancialmente purificada mediante cualquier técnica adecuada tal como, por ejemplo, el método de purificación de una sola etapa dado a conocer en Smith y Johnson, Gene 67:31-40 (1988).
En particular, la ligasa puede ser una serina endoproteasa. La ligasa tiene normalmente una razón S/H mayor de 1, preferiblemente de 2 o más, en particular de 5 o más, en el medio de reacción usado, en particular en un medio de reacción que comprende agua, más en particular un medio acuoso. El valor superior de este cociente no es crítico; en la práctica, puede ser, por ejemplo, de 100 o menos, en particular de 20 o menos. La ligasa usada en un método según la invención tiene generalmente una “razón de síntesis con respecto a hidrólisis” (razón S/H) mejorada, al menos en comparación con subtilisina BPN’.
La razón S/H de las ligasas usadas en un método según la invención dividido entre la razón S/H de subtilisina BPN’, al menos en las condiciones descritas en los ejemplos, es habitualmente de más de 100, preferiblemente de 250 o más, más preferiblemente de 500 o más, en particular de 1000 o más. El valor superior de este cociente no es crítico; puede aproximarse a infinito.
En particular, se han logrado muy buenos resultados con una variante de subtilisina BPN’ o un homólogo de la misma.
Especialmente cuando se lleva a cabo el acoplamiento enzimático en un medio de reacción que comprende agua como disolvente principal (por ejemplo, el 50-100 % en peso basado en el líquido total), se ha hallado que una variante de subtilisina BPN’ o un homólogo de la misma según el documento WO 2016/056913 es particularmente adecuada.
Por tanto, la ligasa usada para la reacción de acoplamiento es una variante de subtilisina BPN’ o un homólogo de la misma que comprende las siguientes mutaciones en comparación con subtilisina BPN’ representada por SEQ ID NO: 2 o una secuencia homóloga de la misma:
- una deleción de los aminoácidos correspondientes a las posiciones 75-83;
- una mutación en la posición de aminoácido correspondiente a S221, siendo la mutación selenocisteína S221C o S221;
- preferiblemente una mutación en la posición de aminoácido correspondiente a P225;
- en el que las posiciones de aminoácido se definen según la secuencia de subtilisina BPN’ representada por SEQ ID NO: 2, y en el que dicha ligasa es una variante de subtilisina BPN’ o un homólogo de la misma que tiene al menos el 80 %, o el 85 %, o el 90 %, preferiblemente el 95 %, de identidad de secuencia con SEQ ID NO: 2.
Las ligasas preferidas adicionales para su uso en un método según la invención pueden comprender una o más mutaciones adicionales, en particular una o más mutaciones adicionales tal como se identifican en otras partes en el presente documento o en el documento WO 2016/056913.
La mutación en la posición de aminoácido correspondiente a S221 de la ligasa, en particular la variante de subtilisina BPN’ o un homólogo de la misma, es preferiblemente S221C.
La mutación en la posición de aminoácido correspondiente a P225 es habitualmente ventajosa para la razón S/H para el acoplamiento enzimático. La mutación se selecciona habitualmente del grupo de P225N, P225D, P225S, P225C, P225G, P225A, P225T, P225V, P225I, P225L, P225H, P225Q, preferiblemente del grupo de P225N, P225D, P225S, P225C y P225G, más preferiblemente de P225N o P225D, lo más preferiblemente es P225N.
Para una buena estabilidad enzimática, la ligasa, en particular la variante de subtilisina BPN’ o un homólogo de la misma, comprende preferiblemente una o más mutaciones seleccionadas del grupo de mutaciones en una posición de aminoácido correspondiente a Q2, S3, P5, S9, I31, K43, M50, A73, S188, Q206, N212, N218, T254 y Q271 de SEQ ID NO: 2.
Una mutación preferida en la posición correspondiente a Q2 corresponde a Q2K.
Una mutación preferida en la posición correspondiente a S3 corresponde a S3C.
Una mutación preferida en la posición correspondiente a P5 corresponde a P5S.
Una mutación preferida en la posición correspondiente a S9 corresponde a S9A.
Una mutación preferida en la posición correspondiente a I31 corresponde a I31L.
Una mutación preferida en la posición correspondiente a K43 corresponde a K43N.
Una mutación preferida en la posición correspondiente a M50 corresponde a M50F.
Una mutación preferida en la posición correspondiente a A73 corresponde a A73L.
Una mutación preferida en la posición correspondiente a S188 corresponde a S188P.
Una mutación preferida en la posición correspondiente a Q206 corresponde a Q206C.
Una mutación preferida en la posición correspondiente a N212 corresponde a N212G.
Una mutación preferida en la posición correspondiente a T254 corresponde a T254A.
Una mutación preferida en la posición correspondiente a Q271 corresponde a Q271E.
En una realización particularmente preferida, la ligasa, en particular la variante de subtilisina BPN’ o un homólogo de la misma, comprende al menos seis, preferiblemente al menos ocho, más preferiblemente al menos 10, en particular 12, 13 ó 14, de dichas mutaciones seleccionadas del grupo de mutaciones en las posiciones correspondientes a Q2, S3, P5, S9, I31, K43, M50, A73, S188, Q206, N212, T254 y Q271. En particular, esto se prefiere para la estabilidad enzimática en un medio de reacción que comprende agua como disolvente principal o único. La ligasa puede tener mutaciones adicionales en comparación con subtilisina BPN’, siempre que tenga actividad de condensación enzimática de fragmentos (actividad de acoplamiento) en la preparación de los péptidos según la presente invención.
Alternativas a la subtilisina BPN’, como enzimas molde a partir de las cuales puede derivarse por mutagénesis una enzima usada en un método según la invención, en particular un homólogo de una variante de subtilisina BPN’, son otras subtilisinas.
Las secuencias de subtilisinas adecuadas pueden recuperarse a partir de la base de datos de secuencias UNIPROT (http://www.uniprot.org/), disponible el 11 de agosto de 2014, realizando una búsqueda BLAST en la base de datos con subtilisina BPN’ (SEQ ID NO: 2) como consulta. Sin embargo, la recuperación de secuencias no se limita a UNIPROT ni a la fecha. El experto en la técnica sabe cómo consultar depositarios de secuencias alternativos o recopilar secuencias homólogas adicionales mediante secuenciación (véase, por ejemplo, Zooming in on metagenomics: molecular microdiversity of Subtilisin Carlsberg in soil. Gabor E, Niehaus F, Aehle W, Eck J.J Mol Biol.20 de abril de 2012;418(1-2):16-20).
En particular, el método según la invención se refiere además a variantes que tienen al menos dichas deleciones de los aminoácidos correspondientes a L75 hasta e incluyendo G83 de subtilisina BPN’, cisteína o selenocisteína en una posición correspondiente a la posición 221 en subtilisina BPN’ y al menos una de dichas mutaciones adicionales en la presente reivindicación 1.
La secuencia de subtilisina BPN’ se proporciona en SEQ ID NO: 2 (forma madura). El gen que codifica para los aminoácidos -107 a 275 de subtilisina BPN’ se proporciona en SEQ ID NO: 1. La variante u homólogo de subtilisina BPN’ puede estar basado en las enzimas según el documento WO2016/056913, con la condición de que tenga las mutaciones descritas anteriormente.
En una realización ventajosa, la ligasa es una variante de subtilisina BPN’ que tiene una deleción de los aminoácidos correspondientes a las posiciones 75-83, la mutación S221C y una o más mutaciones adicionales, preferiblemente al menos 3 mutaciones adicionales, en particular 5-8 mutaciones adicionales, en las posiciones de aminoácido correspondientes a M222, Y217, P225, F189, N218, E156, G166 y N62 de subtilisina BPN’ de tipo natural (madura). De estas mutaciones, en particular se han logrado buenos resultados con las mutaciones correspondientes a: M222P, Y217H, P225N, F189W, N218D, E156N, G166E, N62A. SEQ ID NO: 3 muestra una variante de subtilisina BPN’ para su uso en un método según la invención con deleción del bucle de unión a Ca<2+>, S221C y que tiene dichas mutaciones adicionales. La etiqueta de His se incluyó para facilitar la purificación y no es necesaria para la actividad ligasa. Las enzimas preferidas adicionales pueden comprender una o más mutaciones adicionales, en particular una o más mutaciones adicionales tal como se identifica en otras partes en el presente documento o en el documento WO 2016/056913.
En un método de la invención, la reacción enzimática se realiza normalmente en un fluido que comprende agua. Preferiblemente, la reacción se realiza en un fluido tamponado. El contenido de agua es habitualmente del 10-100 % en volumen, basado en los líquidos totales, preferiblemente del 20 % en volumen o más, preferiblemente del 40 % en volumen o más, en particular del 50 % en volumen o más, más en particular del 60 % en volumen o más. En particular se han logrado buenos resultados en un medio de reacción que comprende el 70-100 % en volumen de agua, más en particular el 90-100 % en volumen, el 95-100 % en volumen o el 98-100 % en volumen de agua. El término “acuoso” se usa para medios que consisten al menos sustancialmente en agua.
En principio, cualquier tampón es adecuado. Los tampones buenos son conocidos por un experto en la técnica. Véase, por ejemplo, David Sheehan en Physical Biochemistry, 2ª ed. Wiley-VCH Verlag GmbH, Weinheim 2009; http://www.sigmaaldrich.com/life-science/core-bioreagents/biological-buffers/learning-center/buffer-calculator.html. Por ejemplo, se han logrado resultados particularmente buenos con un tampón de Good, tal como tricina. La concentración del tampón puede elegirse dentro de límites amplios, por ejemplo, en el intervalo de 10-1000 mM, en particular en el intervalo de 25-500 mM, más en particular en el intervalo de 50-250 mM. Se ha hallado que una molaridad relativamente baja del tampón es ventajosa para acoplar un nucleófilo peptídico en el que Y es Lys(Pal-γ-Glu-OH) o similar.
El pH del tampón para una reacción de acoplamiento en un método según la invención puede ser de al menos 5, en particular de al menos 6, preferiblemente de al menos 7. Un pH deseado es habitualmente menor de 11, en particular menor de 10, incluso más preferiblemente menor de 9. Habitualmente, el pH óptimo para el acoplamiento enzimático es de entre 7 y 9.
Debido a la alta razón S/H, generalmente no es necesario un gran exceso del éster o tioéster C-terminal peptídico o del nucleófilo peptídico para alcanzar un alto rendimiento en la reacción de condensación. Generalmente, se ponen en contacto en una razón aproximadamente estequiométrica o en un exceso del éster C-terminal peptídico, en particular en una razón molar de (a) el éster o tioéster C-terminal peptídico con respecto a (b) el nucleófilo peptídico en el intervalo de 1:1 a 5:1. Aunque se logran resultados satisfactorios con una razón estequiométrica, se ha hallado que un exceso del (tio)éster C-terminal peptídico es ventajoso para la velocidad de reacción. Por tanto, preferiblemente la razón molar de (a) el éster o tioéster C-terminal peptídico con respecto a (b) el nucleófilo peptídico está en el intervalo de 1,05:1,0 a 4:1, más preferiblemente en el intervalo de 1,1:1,0 a 3:1, incluso más preferiblemente en el intervalo de 1,2:1,0 a 2,5:1,0, en particular en el intervalo de 1,2:1,0 a 2,0:1,0.
En un método de la invención, puede ser ventajoso añadir aditivos al fluido en el que se lleva a cabo la reacción para mejorar la solubilidad de los fragmentos peptídicos o para mejorar el rendimiento de reacción. Tales aditivos pueden ser una sal o una molécula orgánica, por ejemplo, clorhidrato de guanidinio, urea, dodecasulfato de sodio o Tween. Sin embargo, se han logrado buenos resultados sin tal aditivo, también en un medio de reacción completamente acuoso, por ejemplo, en una realización en la que Y es Lys(Pal-γ-Glu-OH) o similar.
La reacción puede llevarse a cabo en un fluido completamente acuoso o en una mezcla de agua y un codisolvente miscible en agua tal como N,N-dimetilformamida (DMF), N-metil-pirrolidinona (NMP), N,N-dimetilacetamida (DMA), dimetilsulfóxido (DMSO), acetonitrilo, un éter, tal como tetrahidrofurano (THF), 2-metil-tetrahidrofurano (Me-THF) o 1,2-dimetoxietano, o un alcohol (halogenado), tal como metanol, etanol, isopropanol, terc-butanol, 2,2,2-trifluoroetanol (TFE), 1,1,1,3,3,3-hexafluoroisopropanol, o una mezcla de estos disolventes orgánicos. En función de la estabilidad de la variante de subtilisina BPN’ y de la solubilidad de los sustratos peptídicos, la cantidad de codisolvente es preferiblemente inferior al 70 % en volumen, más preferiblemente inferior al 60 % en volumen, incluso más preferiblemente inferior al 50 % en volumen, y lo más preferiblemente inferior al 40 %.
En principio, la temperatura durante la condensación enzimática de fragmentos no es crítica, siempre que se elija una temperatura a la que la ligasa que va a usarse muestre actividad y estabilidad suficientes. Una temperatura de este tipo puede determinarse de manera rutinaria. Generalmente, la temperatura puede ser de al menos -10 ºC, en particular de al menos 0 ºC o de al menos 10 ºC. Generalmente, la temperatura puede ser de 70 ºC o menos, en particular de 60 ºC o menos o de 50 ºC o menos. Un experto en la técnica puede identificar fácilmente las condiciones óptimas de temperatura para una ligasa específica para una condensación enzimática de fragmentos específica mediante experimentación de rutina basándose en el conocimiento general común y la información dada a conocer en el presente documento. En general, la temperatura está ventajosamente en el intervalo de 20-50 ºC.
La invención se refiere además al uso de un agente de tipo Edman para proporcionar un grupo protector en la síntesis de un péptido en un método que comprende el acoplamiento enzimático de péptidos mediante condensación de fragmentos. Por consiguiente, la invención se refiere además a un método para sintetizar un péptido que comprende el acoplamiento enzimático de (a) un éster o tioéster C-terminal peptídico representado por la fórmula P-Wv-AAn-(tio)éster con un nucleófilo peptídico representado por la fórmula AAm, acoplamiento que está catalizado por una ligasa, preferiblemente una variante o un homólogo de subtilisina BPN’, tal como se describe en otras partes en el presente documento.
En el presente documento, P representa el grupo protector de tipo Edman, tal como se definió anteriormente, preferiblemente un grupo tiocarbamoílo. El acoplamiento de P con el extremo N-terminal del péptido se logra de una manera conocida por sí misma, basándose en la metodología de tipo Edman conocida para dicho P, normalmente en condiciones ligeramente alcalinas, por ejemplo, un pH de aproximadamente 8. En el presente documento, v es un número entero de al menos 1, de manera habitualmente preferible 1-10, preferiblemente 1-5, más preferiblemente 1, 2 ó 3, lo más preferiblemente 1, y v representa el número de residuos de aminoácido W, en el que cada W puede ser igual o diferente, y preferiblemente es tal como se definió anteriormente. Cada AA representa un residuo de aminoácido, n es un número entero que representa el número de residuos de aminoácido del éster o tioéster C-terminal peptídico, y m es un número entero que representa el número de residuos de aminoácido del nucleófilo peptídico. Normalmente, la suma de n y v es de al menos 4 con el fin de permitir el reconocimiento por la ligasa. Preferiblemente, n está en el intervalo de 3-200, en particular en el intervalo de 3-50, más en particular en el intervalo de 3-25. En una realización específica, n es al menos 4, al menos 6, al menos 8, al menos 10, al menos 15 o al menos 20. Preferiblemente, m está en el intervalo de 3-200, en particular en el intervalo de 5-50, más en particular en el intervalo de 8-30. En una realización específica, m es al menos 4, al menos 10, al menos 15 o al menos 20.
El producto de acoplamiento, P-Wv-AAn-AAm, se somete a una reacción de escisión en la que se forma el péptido Wv-1-AAn-AAm. Normalmente, la escisión se logra en condiciones ácidas. Si v-1 > 0, después de eso se acopla un grupo P con W en la posición N-terminal del péptido Wv-1-AAn-AAmpara formar P-Wv-1-AAn-AAm, tras lo cual se escinde P-W. Luego se repite esto hasta que se obtiene el péptido representado por la fórmula AAn-AAm.
Por consiguiente, la presente invención se refiere a un método para sintetizar un péptido que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly, en la que
-Xes Ala o un residuo de ácido α-amino-isobutírico (Aib);
-Yes Lys, Lys que tiene un grupo ε-amino de cadena lateral libre (es decir, un residuo de lisina no derivatizado) o Lys cuyo grupo ε-amino de cadena lateral está protegido con un grupo protector o Lys cuyo grupo ε-amino de cadena lateral está funcionalizado con un aminoácido u otro grupo funcional;
-Zes Arg o Lys;
comprendiendo el método el acoplamiento enzimático de
(c) un primer fragmento de éster o tioéster C-terminal peptídico que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y
(d) un segundo fragmento de nucleófilo peptídico que tiene una amina no protegida de manera N-terminal que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly;
acoplamiento enzimático que está catalizado por una ligasa, en el que dicha ligasa es una variante de subtilisina BPN’ o un homólogo de la misma que tiene al menos el 80 %, o el 85 %, o el 90 %, preferiblemente el 95 %, de identidad de secuencia con SEQ ID NO: 2. Preferiblemente, la ligasa es una variante de subtilisina BPN’ que tiene una deleción de los aminoácidos correspondientes a las posiciones 75-83, la mutación S221C y una o más mutaciones adicionales, preferiblemente al menos 3 mutaciones adicionales, en particular 5-8 mutaciones adicionales, en las posiciones de aminoácido correspondientes a M222, Y217, P225, F189, N218, E156, G166 y N62 de subtilisina BPN’ de tipo natural (madura), de las cuales lo más preferiblemente es una mutación en P225.
En una realización particularmente ventajosa, la ligasa usada en el método según la invención es una variante de subtilisina BPN’ o un homólogo de la misma que tiene al menos el 80 %, o el 85 %, o el 90 %, preferiblemente el 95 %, de identidad de secuencia con SEQ ID NO: 14, que comprende las mutaciones Q2K, S3C, P5S, S9A, I31L, K43N, M50F, A73L, ∆75-83, E156S, G166S, G169A, S188P, Q206C, N212G, Y217H, S221C, M222P, P225N, T254A, y Q271E, que comprende opcionalmente una etiqueta de His.
En otra realización preferida, la ligasa usada en el método según la invención es una variante de subtilisina BPN’ con SEQ ID NO: 3, o un homólogo de la misma que tiene al menos el 80 %, o el 85 %, o el 90 %, preferiblemente el 95 %, de identidad de secuencia con SEQ ID NO: 3, que comprende las mutaciones Q2K, S3C, P5S, S9A, I31L, K43N, M50F, N62A, A73L, ∆75-83, E156N, G166E, G169A, S188P, F189W, Q206C, N212G, Y217H, N218D, S221C, M222P, P225N, T254A, Q271E, que comprende opcionalmente una etiqueta de His.
SEQ ID NO: 14 muestra una variante de subtilisina BPN’ para su uso en un método según la invención con deleción del bucle de unión a Ca<2+>, S221C y mutaciones adicionales. La etiqueta de His se incluyó para facilitar la purificación y no es necesaria para la actividad ligasa.
En una realización preferida, el método está caracterizado además porqueYes una Lys, cuyo grupo ε-amino de cadena lateral está funcionalizado con un grupo funcional, seleccionado del grupo que consiste en γ-Glu-OH, Pal-γ-Glu-OH, AEEA-AEEA-γ-Glu-OH y AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH, en el que Pal es palmitoílo y AEEA-AEEA es -2-[2-(2-aminoetoxi)etoxi]acetil-2-[2-(2-aminoetoxi)etoxi]acetilo.
En una realización incluso más preferida, dicha Y es Lys(γ-Glu-OH), Lys(AEEA-AEEA-γ-Glu-OH), Lys(Pal-γ-Glu-OH) o Lys(AEEA-AEEA-γ-Glu-17-carboxiheptadecanoil-OH).
El término “fragmento peptídico” o “fragmento” quiere decir un péptido con una secuencia de aminoácidos parcial, con referencia a un péptido más largo con una secuencia definida.
La invención se ilustrará ahora mediante los siguientes ejemplos, sin limitarse a los mismos.
Ejemplos
Producción de ligasas
Mutagénesis, clonación y expresión
SEQ ID NO: 1 muestra el gen de tipo natural que codifica para los aminoácidos -107 a 275 de subtilisina BPN’. En el presente documento, están presentes los codones que codifican para los aminoácidos -107 a -1. Estos aminoácidos comprenden la secuencia señal, la presecuencia y una prosecuencia que se escinden tras la maduración completa. SEQ ID NO: 2 muestra la subtilisina BPN’ de tipo natural madura (es decir, sin los aminoácidos -107 a -1). La ligasa usada para los ejemplos fue tal como se muestra en SEQ ID NO: 3. En comparación con la subtilisina BPN’ de tipo natural madura, esta ligasa tenía las mutaciones Q2K, S3C, P5S, S9A, I31L, K43N, M50F, N62A, A73L, ∆75-83, E156N, G166E, G169A, S188P, F189W, Q206C, N212G, Y217H, N218D, S221C, M222P, P225N, T254A y Q271E. Además, con el fin de facilitar una purificación rápida y eficiente, después del aminoácido 275 se une una etiqueta de His C-terminal tal como se muestra en SEQ ID NO: 3. La secuencia de aminoácidos correspondiente se enumera según el esquema de numeración de subtilisina BPN’. Por tanto, con el fin de mantener la numeración de la subtilisina BPN’ para las ligasas usadas, la enumeración salta desde 74 hasta 83.
El gen que codifica para la ligasa usada para los siguientes ejemplos de síntesis se obtuvo de GenScript. Los genes se clonaron (por parte de GenScript) en un vector lanzadera pUB-110 deE. coli-B. subtilis(pBES) usando el vector basado en los sitios Mlul y BamHl. En el vector lanzadera, la expresión del gen se encuentra bajo el control del promotor aprE. El vector contenía el origen de replicación pUB paraBacillusy un marcador de resistencia a la kanamicina. El vector también contenía el origen de replicación ColE1 y un marcador de resistencia a la ampicilina para el mantenimiento enE. coli.El plásmido pBES-ligasa-HIS resultante se propagó en TOP10 deE. coliy se transformó en GX4935 deB. subtilis(trpC2 metB10 lys-3∆nprE∆aprE).
Producción y purificación de las ligasas
Una única colonia microbiana deB. subtilisque contenía un plásmido con el gen de variante de subtilisina de interés se inoculó en 5 ml de LB con kanamicina (10 µg/ml) a 37 ºC en una incubadora con agitación. A los 30 ml de caldo Terrific complementado con antibiótico (10 µg/ml de kanamicina) y aminoácidos (100 mg/l de Trp, 100 mg/l de Met y 100 mg/l de Lys) se les añadieron 0,6 ml del cultivo durante la noche. Las células se hicieron crecer durante 48 h a 37 ºC en una incubadora con agitación (200 rpm). Las células se recogieron mediante centrifugación (15 min, 4.000 rpm, 4 ºC). El medio (30 ml) se decantó y concentró en una unidad Sartorius Vivaspin 15R (15 ml, corte de PM de 10 kDa) en dos etapas de centrifugación (15 min, 4.000 rpm, 4 ºC). Luego se intercambió el medio concentrado (0,5 ml) por tampón A (tricina 25 mM, pH 7,5, NaCl 0,5 M) en tres etapas de lavado/concentración (14 ml de tampón A, 10 min, 4.000 rpm, 4 ºC). Para la purificación de la etiqueta de His, se añadió una resina Talon (2,5 ml, Clonetech) a un cartucho de columna de plástico. La resina se lavó con 20 ml de agua MilliQ y se equilibró con 20 ml de tampón A. La enzima en bruto se cargó en la columna y se lavó con 5 ml de tampón A. La enzima se eluyó con 15 ml de tampón B (tricina 25 mM, pH 7,5, NaCl 0,5 M, imidazol 500 mM). El eluato se concentró en una unidad Sartorius Vivaspin 15R (15 ml, corte de PM de 10 kDa) mediante centrifugación (15 min, 4.000 rpm, 4 ºC) y se intercambió el tampón por tricina 25 mM, pH 7,5, en tres etapas de lavado/concentración (15 ml de tampón, 10 min, 4.000 rpm, 4 ºC).
La pureza de la proteína se analizó mediante SDS-PAGE y la concentración de enzima se determinó tal como se describe en el documento WO2016056913 (A1). La pureza fue mayor del 90 %. La disolución acuosa obtenida (tricina 25 mM, pH 7,5) que contenía aproximadamente 2 mg/ml de la enzima obtenida se usó como tal para las condensaciones de fragmentos oligopeptídicos.
Ejemplos de condensación enzimática de fragmentos
Materiales y métodos
A menos que se indique lo contrario, los productos químicos se obtuvieron de fuentes comerciales y se usaron sin purificación adicional. En todas las condensaciones enzimáticas de fragmentos se usó la ligasa de SEQ ID NO: 3. La HPLC analítica se realizó en un cromatógrafo de líquidos Agilent 1260 Infinity, usando una columna de fase inversa (Phenomenex, C18, tamaño de partícula de 5 µm, 250 × 4,6 mm) a 40 ºC. La detección UV se realizó a 220 nm usando un espectrómetro UV-VIS 204 Linear. El programa de gradiente fue: 0-25 min de rampa de gradiente lineal desde el 5 % hasta el 98 % de eluyente B y desde 25,1-30 min el 5 % de eluyente B (eluyente A: 0,5 ml/l de ácido metanosulfónico (MSA) en H2O, eluyente B: 0,5 ml/l de MSA en acetonitrilo). El flujo fue de 1 ml/min desde 0-25,1 min y de 2 ml/min desde 25,2-29,8 min, luego de vuelta a 1 ml/min hasta la detención a 30 min. Los volúmenes de inyección fueron de 10 µl. La HPLC preparativa se realizó en un sistema Varian PrepStar usando una columna de fase estacionaria (Phenomenex, C18, tamaño de partícula de 10 µm, 250 × 50 mm). La CL-EM se realizó en un cromatógrafo de líquidos de la serie Agilent 1200, usando una columna de fase inversa (Phenomenex, C18, tamaño de partícula de 5 µm, 150 × 4,6 mm) a 40 ºC. La detección UV y el programa de gradiente fueron tal como se describieron para la HPLC analítica. Los pesos moleculares se determinaron usando un sistema de CL-EM de cuadrupolo Agilent 6130.
Protocolo 1: Síntesis de Fmoc-ácido glicólico
Se disolvió 2-hidroxi-acetato de terc-butilo (2,5 g) en una mezcla de piridina (15 ml) y diclorometano (DCM, 30 ml). Luego se añadió gota a gota Fmoc-cloruro (5 g) en DCM seco (15ml) a 0 ºC. Se agitó la mezcla de reacción a temperatura ambiente durante 24 horas. Se eliminó el disolvente a vacío y se redisolvió el residuo en DCM (40 ml), se lavó con disolución de bicarbonato de sodio 1 M (20 ml) dos veces, disolución de salmuera (20 ml) dos veces, se secó sobre sulfato de magnesio anhidro y se concentró. Se disolvió el éster terc-butílico de Fmoc-ácido glicólico obtenido (4 g) en ácido trifluoroacético (TFA), triisopropilsilano (TIS) y agua (95/2,5/2,5, v/v/v, 15 ml) y se agitó durante 120 min. Se eliminó el disolvente a vacío y se redisolvió el residuo viscoso en disolución de bicarbonato de sodio al 5 % (150 ml), se lavó con dietil éter (75 ml) 3 veces. Luego se mezcló la disolución acuosa con acetato de etilo (45 ml) y se acidificó con ácido fosfórico al 40 % hasta pH = 2 a 0 ºC. Se recogió la fase orgánica y se secó con sulfato de magnesio anhidro. Se eliminó el disolvente a vacío para proporcionar el producto final Fmoc-ácido glicólico (Fmoc-GA).
Protocolo 2: Síntesis de ésteres oligopéptido-OCam-Leu-OH
Se lavó 1 gramo de resina de Fmoc-Leu-Wang precargada (con una carga de 0,81 mmol/gramo) con DCM (2 × 2 min, 10 ml) y N,N’-dimetilformamida (DMF, 2 × 2 min, 10 ml) y se desprotegió de Fmoc usando piperidina/DMF (1/5, v/v, 2 × 8 min, 10 ml). Después del lavado con DMF (6 × 2 min, 10 ml), se acopló Fmoc-GA (4 equiv.) con la resina usando hexafluorofosfato de 2-(1H-benzotriazol-1-il)-1,1,3,3-tetrametiluronio (HBTU, 4 equiv.), OxymaPure (4 equiv.) y diisopropiletilamina (DIPEA, 8 equiv.) en DMF (45 min, 10 ml). Después del lavado con DMF (2 × 2 min, 10 ml), la resina se desprotegió de Fmoc usando piperidina/DMF (1/5, v/v, 2 × 8 min, 10 ml). Se formó el éster Cam-Leu-OH mediante el acoplamiento del primer aminoácido protegido con Fmoc usando 4 equiv. de Fmoc-Xxx-OH, 4 equiv. de N,N’-diisopropilcarbodiimida (DIC) y 0,1 equiv. de 4-dimetilaminopiridina (DMAP) en DMF (2 × 60 min, 10 ml). En este caso y en otras partes de la divulgación, “Xxx” representa un aminoácido (variable tal como se indica en las secuencias en los ejemplos a continuación). Para el material de partida de la semaglutida, se usó un elemento estructural Fmoc-Aib-OH disponible comercialmente.
Después del lavado con DMF (6 × 2 min, 10 ml), se siguieren protocolos de SPPS convencionales para alargar el péptido (Weng C. Chan y Peter White, OUP Oxford, 2000). Se realizaron la escisión a partir de la resina y la desprotección de cadena lateral usando una mezcla de TFA/TIS/agua (95/2,5/2,5, v/v/v, 15 ml) durante 120 min. Se precipitó el péptido en bruto usando metil terc-butil éter (MTBE)/n-heptanos (1/1, v/v, 50 ml). Se recogió el péptido precipitado mediante centrifugación y se lavó dos veces con MTBE/n-heptanos (1/1, v/v, 50 ml), seguido de liofilización a partir de acetonitrilo/agua (1/1, v/v, 50 ml). Se purificaron los productos en bruto mediante HPLC preparativa seguido de liofilización de las fracciones puras.
Tal como se describió anteriormente, pero entonces en una resina de Fmoc-Arg(Pbf)-Rink precargada (con una carga de 0,62 mmol/gramo), se prepararon varios Cam-ésteres peptídicos alternativos, es decir, H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Phe-Arg-NH2, H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-Arg-NH2y H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Trp-Arg-NH2.Protocolo 3: Síntesis de nucleófilos ácidos C-terminales oligopeptídicos
Se lavó 1 gramo de resina de Fmoc-Gly-Wang precargada (con una carga de 0,30 mmol/gramo) con DCM (2 × 2 min, 10 ml) y DMF (2 × 2 min, 10 ml) y se desprotegió de Fmoc usando piperidina/DMF (1/5, v/v, 2 × 8 min, 10 ml). Se siguieron protocolos de SPPS convencionales para alargar el péptido (Weng C. Chan y Peter White, OUP Oxford, 2000). Se realizaron la escisión a partir de la resina y la desprotección de cadena lateral usando una mezcla de TFA/TIS/agua (95/2,5/2,5, v/v/v, 15 ml) durante 120 min. Se precipitó el péptido en bruto usando MTBE/nheptanos (1/1, v/v, 50 ml). Se recogió el péptido precipitado mediante centrifugación y se lavó dos veces con MTBE/n-heptanos (1/1, v/v, 50 ml), seguido de liofilización a partir de acetonitrilo/agua (1/1, v/v, 50 ml). Se purificaron los productos en bruto mediante HPLC preparativa seguido de liofilización de las fracciones puras.
Protocolo 4: Protección con PTC de H-Gly-1His-7Ala-7Glu-7Gly-5Thr-6Phe-7Thr-sSer-9Asp-10Val-11Ser-OCam-Leu-OHSe disolvieron 100 mg de H-Gly-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH en 10 ml de piridina/agua (1/1, v/v). A esta mezcla se le añadieron 25 mg de fenilisotiocianato y se agitó la disolución a temperatura ambiental durante 14 horas. Se diluyó la mezcla de reacción en bruto con 50 ml de agua y se lavó tres veces con 50 ml de diclorometano (DCM). Se purificó la fase acuosa mediante HPLC preparativa seguido de liofilización de las fracciones puras, proporcionando el péptido protegido con PTC-Gly.
Protocolo 5: Síntesis de péptidos que contienenγ-Glu o Pal-γ-Glu
Se siguió el protocolo general 3 usando elementos estructurales Fmoc-Lys(Boc-γ-Glu-OtBu)-OH o Fmoc-Lys(Pal-γ-Glu-OtBu)-OH disponibles comercialmente.
Protocolo6:Síntesis del fragmento de semaglutida H-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH)-21Glu-22Phe-22Ile-24Ala-25Trp-29Leu-27Val-28Arg-29Gly-30Arg-31Gly-OHSe siguió el protocolo general 3 usando los elementos estructurales Fmoc-<20>Lys(Mtt)-OH y Boc-<12>Ser(tBu)-OH disponibles comercialmente. Después de SPPS del fragmento de Boc-12-31-Wang, se eliminó el grupo protector Mtt usando 10 ml de TIS/TFA/DCM (1/1/48, v/v/v, 3 ⨯ 15 min). Se usaron procedimientos de SPPS convencionales para el acoplamiento de Fmoc-AEEA-OH (dos veces), Fmoc-Glu-O<t>Bu y 17-carboxiheptadecanoil-O<t>Bu. Se realizaron la escisión a partir de la resina y la desprotección de cadena lateral usando una mezcla de TFA/TIS/agua (95/2,5/2,5, v/v/v, 15 ml) durante 120 min. Se precipitó el péptido en bruto usando MTBE/n-heptano (1/1, v/v, 50 ml). Se recogió el péptido precipitado mediante centrifugación y se lavó dos veces con MTBE/n-heptano (1/1, v/v, 50 ml), seguido de liofilización a partir de acetonitrilo/agua (1/1, v/v, 50 ml). Se purificaron los productos en bruto mediante HPLC preparativa seguido de liofilización de las fracciones puras.
EJEMPLO 1 (referencia):
Síntesis enzimática del precursor de liraglutida H-liraglutida-1-31-OH usando un enfoque de 13-meros 18-meros. En un vial de HPLC, se disolvieron 6 mg de H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<8>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-OCam-Leu-OH y 9 mg de H-<14>Leu-<15>Glu-<18>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<28>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 800 µl de cloruro de guanidinio acuoso 2 M. A esta mezcla, se le añadieron 50 µl de tampón tricina 1 M pH 9,0 y se ajustó el pH a 8,3 usando una disolución de NaOH 4 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (tris(2-carboxietil)fosfina) (100 mg/ml en agua) y 100 µl de disolución de ligasa (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extrajeron 10 µl de la mezcla de reacción y se extinguieron en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 90 minutos se había consumido todo el material de partida de Cam-éster, y se integraron los picos de producto y de hidrólisis. El producto de ligación H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH representaba el 14 % del área y el Cam-éster hidrolizado H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-OH representaba el 86 % del área.
El producto H-liraglutida-1-31-OH pudo obtenerse mediante HPLC preparativa seguido de liofilización de las fracciones puras.
EJEMPLO 2 (referencia):
Síntesis enzimática del precursor de liraglutida H-liraglutida-1-31-OH usando un enfoque de 9-meros 22-meros. En un vial de HPLC, se disolvieron 6 mg de H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-OCam-Leu-OH y 10 mg de H-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>lle-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 800 µl de cloruro de guanidinio acuoso 2 M. A esta mezcla, se le añadieron 50 µl de tampón tricina 1 M pH 9,0 y se ajustó el pH a 8,3 usando una disolución de NaOH 4 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (100 mg/ml en agua) y 100 µl de disolución de ligasa (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extinguieron 10 µl de la mezcla de reacción en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 300 minutos se había consumido todo el material de partida de Cam-éster, y se integraron los picos de producto y de hidrólisis. El producto de ligación H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH representaba el 8 % del área y el Cam-éster hidrolizado H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-OH representaba el 92 % del área.
El producto H-liraglutida-1-31-OH pudo obtenerse mediante HPLC preparativa seguido de liofilización de las fracciones puras.
EJEMPLO 3: Síntesis enzimática de H-liraglutida-1-31-OH usando un enfoque de 11-meros 20-meros.
En un vial de HPLC, se disolvieron 6 mg de H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH y 10 mg de H-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 800 µl de cloruro de guanidinio acuoso 2 M. A esta mezcla, se le añadieron 50 µl de tampón tricina 1 M pH 9,0 y se ajustó el pH a 8,3 usando una disolución de NaOH 4 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (100 mg/ml en agua) y 100 µl de disolución de ligasa (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extrajeron 10 µl de la mezcla de reacción y se extinguieron en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 180 minutos se había consumido todo el material de partida de Cam-éster, y se integraron los picos de producto y de hidrólisis. El producto de ligación H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH representaba el 96 % del área y el Cam-éster hidrolizado H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-OH representaba el 4 % del área.
El producto H-liraglutida-1-31-OH pudo obtenerse mediante HPLC preparativa seguido de liofilización de las fracciones puras.
Por tanto, se demuestra que un método según la invención proporciona inesperadamente el producto acoplado deseado (es decir, H-liraglutida-1-31-OH, el péptido que tiene la secuencia de aminoácidos de liraglutida sin derivatización en<20>Lys) con un rendimiento mucho mayor que en un método comparable en el que el sitio de acoplamiento para el (tio)éster C-terminal y el nucleófilo peptídico es dos enlaces amida hacia el extremo C-terminal o N-terminal de H-liraglutida-1-31-OH.
EJEMPLO 4: Síntesis enzimática de PTC-Gly-liraglutida-1-31-[<20>Lys(γ-Glu)]-OH usando un enfoque de 11-meros 20-meros.
En un vial de HPLC, se disolvieron 6 mg de PTC-Gly-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<8>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH y 10 mg de H-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<18>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<28>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 800 µl de cloruro de guanidinio acuoso 2 M.
A esta mezcla, se le añadieron 50 µl de tampón tricina 1 M pH 9,0 y se ajustó el pH a 8,3 usando una disolución de NaOH 4 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (100 mg/ml en agua) y 100 µl de disolución de ligasa (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extrajeron 10 µl de la mezcla de reacción y se extinguieron en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 180 minutos se había consumido todo el material de partida de Cam-éster, y se integraron los picos de producto y de hidrólisis. El producto de ligación PTC-Gly-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH representaba el 93 % del área y el Cam-éster hidrolizado PTC-Gly-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OH representaba el 7 % del área.
El producto PTC-Gly-liraglutida-1-31-[<20>Lys(γ-Glu)]-OH pudo obtenerse mediante HPLC preparativa seguido de liofilización de las fracciones puras.
EJEMPLO 5: Síntesis de H-liraglutida-1-31-[<20>Lys(Pal-γ-Glu)]-OH usando el precursor PTC-Gly-liraglutida-1-31-[<20>Lys(γ-Glu)1-OH del ejemplo 4.
Se disolvieron 2 mg de PTC-Gly-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 500 µl de agua y 500 µl de piridina. A esta disolución, se le añadieron 2 mg de éster de N-hidroxisuccinimida de ácido palmítico (Pal-OSu) y se dejó reaccionar la mezcla a temperatura ambiental durante 5 horas, seguido de la evaporación de los disolventes a vacío.Se disolvió el producto en bruto PTC-Gly-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en ácido trifluoroacético al 5 % en volumen en agua para la escisión (desprotección) del grupo PTC-Gly.
Después de completarse (15 min), se obtuvo el producto H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH y se purificó mediante HPLC preparativa seguido de liofilización de las fracciones puras.
EJEMPLO 6: Síntesis enzimática de H-liraglutida-1-31-[<20>Lys(Pal-γ-Glu)]-OH usando un enfoque de 11-meros 20-meros (Pal = palmitoílo).
En un vial de HPLC, se disolvieron 6 mg de H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<8>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH y 10 mg de H-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 950 µl de agua. A esta mezcla, se le añadieron 50 µl de tampón tricina 1 M pH 9,0 y se ajustó el pH a 8,1 usando una disolución de NaOH 3 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (100 mg/ml en agua) y 100 µl de disolución de ligasa (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extrajeron 10 µl de la mezcla de reacción y se extinguieron en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 180 minutos se había consumido todo el material de partida de Cam-éster y se integraron los picos de producto y de hidrólisis. El producto de ligación H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH representaba el 95 % del área y el Cam-éster hidrolizado H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OH representaba el 5 % del área.
Este ejemplo muestra que la presente invención permite la síntesis directa de liraglutida en una sola etapa de acoplamiento enzimático con alto rendimiento.
Se realizó una reacción de ligación idéntica tal como se describió anteriormente excepto porque se usaron varios Cam-ésteres peptídicos alternativos, es decir, (1) H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<8>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Phe-Arg-NH2, (2) H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-Arg-NH2y (3) H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Trp-Arg-NH2. En general, las reacciones avanzaron más rápido que para el éster H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH (180 min), dando como resultado una conversión completa después de 80 min para (1), 100 min para (2) y 85 min para (3).
EJEMPLO 7: Síntesis de H-liraglutida-1-31-[<20>Lys(Pal-γ-Glu)]-OH a partir del precursor enzimáticamente sintetizado H-liraglutida-1-31-OH del ejemplo 3.
Al precursor H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH se le acopló el resto Pal-γ-Glu para obtener el producto H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH usando los protocolos descritos en el documento US 6451974 B1.
EJEMPLO 8: Síntesis de H-semaglutida-1-31-[<20>Lys(AEEA-AEEA-Y-Glu-N-17-carboxiheptadecanoil-OH)]-OH usando un enfoque de 11-meros 20-meros.
En un vial de HPLC, se disolvieron 6 mg de H-<1>His-<2>Aib-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH y 10 mg de H-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<18>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<28>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 950 µl de agua. A esta mezcla, se le añadieron 50 µl de tampón tricina 1 M pH 9,0 y se ajustó el pH a 8,1 usando una disolución de NaOH 3 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (100 mg/ml en agua) y 100 µl de disolución de ligasa (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extrajeron 10 µl de la mezcla de reacción y se extinguieron en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 180 minutos se había consumido todo el material de partida de Cam-éster y se integraron los picos de producto y de hidrólisis. El producto de ligación H-<1>His-<2>Aib-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH representaba el 96 % del área y el Cam-éster hidrolizado H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OH representaba el 4 % del área.
Este ejemplo muestra que la presente invención permite la síntesis directa de semaglutida en una sola etapa de acoplamiento enzimático con alto rendimiento.
EJEMPLO 9: Síntesis enzimática de H-liraglutida-1-31-OH usando un enfoque de 11-meros 20-meros con la variante de enzima de SEQ ID NO: 14
En un vial de HPLC, se disolvieron 10 mg de H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH y 10 mg de H-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH en 500 µl de tampón tricina 50 mM pH 9,0. Se ajustó el pH a 8,3 usando una disolución de NaOH 3 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (100 mg/ml en agua) y 100 µl de disolución de ligasa (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extrajeron 10 µl de la mezcla de reacción y se extinguieron en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 240 minutos se había consumido todo el material de partida de Cam-éster, y se integraron los picos de producto y de hidrólisis. El producto de ligación H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH representaba el 92 % del área y el Cam-éster hidrolizado H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OH representaba el 8 % del área.
El producto H-liraglutida-1-31-OH pudo obtenerse mediante HPLC preparativa seguido de liofilización de las fracciones puras.
EJEMPLO 10: Identificación de fragmentos adecuados para la síntesis enzimática de liraglutida usando serina endoproteasa derivada de una variante de subtilisina BPN’ con SEQ ID NO: 3 (con mutación C221S)
Se disolvió 1 mg de liraglutida 1-31 (con y sin Pal-γ-Glu en la lisina en la posición 20) en 1 ml de tampón tricina (50 mM, pH = 8,0). A esta mezcla, se ale añadió 1 µl de disolución de endoproteasa (1 mg/ml) y se agitó la mezcla de reacción a temperatura ambiente.
Se monitorizó la actividad hidrolítica analizando las muestras cada 30 min usando análisis por CL-EM.
Para ambos péptidos, la actividad hidrolítica más alta se observó en el enlace entre el aminoácido 25 y el aminoácido 26 (produciendo los fragmentos 1-25 26-31), seguido de la actividad hidrolítica en el enlace entre los aminoácidos 5 y 6 (produciendo los fragmentos 1-5 6-31). La idoneidad de un enfoque de 25-meros 6-meros se sometió a prueba en el ejemplo 11 de comparación.
EJEMPLO 11: Síntesis enzimática del precursor de liraglutida H-liraglutida-1-31-OH usando en paralelo un enfoque de 25-meros 6-meros (referencia), un enfoque de 5-meros 26-meros (referencia) o un enfoque de 11-meros 20-meros (según la invención)
En un vial de HPLC, se disolvieron 3 µmol de éster (1: H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-OCam-Leu-OH, 2: H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-OCam-Leu-OH o 3: H-<1>His-<2>Ala-<3>Glu-<4>Gly-<5>Thr-<8>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser-OCam-Leu-OH) y 2 µmol de amina (1: H-<28>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH, 2: H-<6>Phe-<7>Thr-<8>Ser-<9>Asp-<10>Val-<11>Ser<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH o 3: H-<12>Ser-<13>Tyr-<14>Leu-<15>Glu-<16>Gly-<17>Gln-<18>Ala-<19>Ala-<20>Lys(Pal-γ-Glu)-<21>Glu-<22>Phe-<23>Ile-<24>Ala-<25>Trp-<26>Leu-<27>Val-<28>Arg-<29>Gly-<30>Arg-<31>Gly-OH) en 950 µl de agua. A esta mezcla, se le añadieron 50 µl de tampón tricina 1 M pH 9,0 y se ajustó el pH a 8,1 usando una disolución de NaOH 3 M. Posteriormente, se añadieron 10 µl de disolución de TCEP (100 mg/ml en agua) y 100 µl de disolución de ligasa (según SEQ ID NO: 3) (10 mg/ml). Se dejó reaccionar la mezcla a temperatura ambiental. Cada 15 minutos, se extrajeron 10 µl de la mezcla de reacción y se extinguieron en 980 µl de MSA al 5 % en volumen en acetonitrilo/agua (2/1, v/v), y se analizó usando CL-EM.
Después de 180 minutos se había consumido todo el material de partida de Cam-éster para cada una de las tres reacciones. Se analizaron muestras de la mezcla de productos resultante y se integraron los picos de producto y de hidrólisis. El producto de ligación era para 1: el 72 % del área, para 2: el 53 % del área y para 3: el 95 % del área.
Secuencias
SEQ ID NO: 1: gen de tipo natural que codifica para los aminoácidos -107 a 275 de subtilisina BPN’
ENA|K02496|K02496.1 B. Subtilisina BPN’ deBacillus amyloliquefaciens
SEQ ID NO: 2: subtilisina BPN’ de tipo natural (madura)
>SUBT_BACAM Subtilisina BPN’ madura deBacillus amyloliquefaciens1 a 275
>sp|P00782|108-382
SEQ ID NO: 3: variante de subtilisina BPN’ que tiene las mutaciones Q2K, S3C, P5S, S9A, I31L, K43N, M50F, N62A, A73L, ∆75-83, E156N, G166E, G169A, S188P, F189W, Q206C, N212G, Y217H, N218D, S221C, M222P, P225N, T254A y Q271E y una etiqueta de His
SEQ ID NO: 14: variante de subtilisina BPN’ que tiene las mutaciones Q2K, S3C, P5S, S9A, I31L, K43N, M50F, A73L, ∆75-83, E156S, G166S, G169A, S188P, Q206C, N212G, Y217H, S221C, M222P, P225N, T254A y Q271E y una etiqueta de His
Claims (14)
1. Método para sintetizar un péptido que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly, que comprende el acoplamiento enzimático de
(a) un éster o tioéster C-terminal peptídico que comprende un primer fragmento peptídico que comprende la secuencia His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster; y
(b) un nucleófilo peptídico que tiene una amina no protegida de manera N-terminal que comprende un segundo fragmento peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly
en las que
- X es Ala o un residuo de ácido α-amino-isobutírico (Aib);
- Y es Lys, Lys que tiene un grupo ε-amino de cadena lateral libre o Lys cuyo grupo ε-amino de cadena lateral está protegido con un grupo protector o Lys cuyo grupo ε-amino de cadena lateral está funcionalizado con un aminoácido u otro grupo funcional, en particular un grupo funcional seleccionado del grupo que consiste en γ-Glu-OH, Pal-γ-Glu-OH, AEEA-AEEA-γ-Glu-OH y AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH,
en el que Pal es palmitoílo y AEEA-AEEA es -2-[2-(2-aminoetoxi)etoxi]acetil-2-[2-(2-aminoetoxi)etoxi]acetilo; - Z es Arg o Lys;
acoplamiento enzimático que está catalizado por una ligasa, en el que la ligasa es una variante de subtilisina BPN’ o un homólogo de la misma, que comprende las siguientes mutaciones en comparación con subtilisina BPN’ representada por SEQ ID NO: 2 o una secuencia homóloga de la misma:
- una deleción de los aminoácidos correspondientes a las posiciones 75-83;
- una mutación en la posición de aminoácido correspondiente a S221, siendo la mutación selenocisteína S221C o S221;
- preferiblemente una mutación en la posición de aminoácido correspondiente a P225;
en el que las posiciones de aminoácido se definen según la secuencia de subtilisina BPN’ representada por SEQ ID NO: 2,
y en el que dicha ligasa es una variante de subtilisina BPN’ o un homólogo de la misma que tiene al menos el 80 %, o el 85 %, o el 90 %, preferiblemente el 95 %, de identidad de secuencia con SEQ ID NO: 2.
2. Método según la reivindicación 1, en el que el péptido que se sintetiza es liraglutida.
3. Método según la reivindicación 2, que comprende el acoplamiento enzimático, catalizado por la ligasa, de (a) el éster o tioéster C-terminal peptídico que comprende la secuencia His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y
(b) el nucleófilo peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es Lys(Pal-γ-Glu-OH).
4. Método según la reivindicación 2, que comprende
el acoplamiento enzimático catalizado por la ligasa de
(a) el éster o tioéster C-terminal peptídico representado por la fórmula P-Wv-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster,
en la que P es un grupo protector, v es un número entero que tiene un valor de al menos 0, preferiblemente de 1-5, más preferiblemente de 1-3, lo más preferiblemente 1, y cada W representa independientemente el mismo residuo de aminoácido o uno diferente, y
(b) el nucleófilo peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly; y después de eso dotar a dicho Lys(γ-Glu-OH) de un grupo palmitoílo (Pal).
5. Método según la reivindicación 2, que comprende
el acoplamiento enzimático catalizado por la ligasa de
(a) el éster o tioéster C-terminal peptídico que comprende la secuencia His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y
(b) el nucleófilo peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es un residuo de lisina que tiene una cadena lateral de εamino libre; y después de eso dotar a dicha cadena lateral de amino de Pal-γ-Glu-OH.
6. Método según la reivindicación 1, en el que el péptido que se sintetiza es semaglutida.
7. Método según la reivindicación 6, que comprende el acoplamiento enzimático, catalizado por la ligasa, de (a) el éster o tioéster C-terminal peptídico que comprende la secuencia His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y
(b) el nucleófilo peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es Lys(AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH).
8. Método según la reivindicación 6, que comprende el acoplamiento enzimático, catalizado por la ligasa, de (a) el éster o tioéster C-terminal peptídico representado por la fórmula P-Wv-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster,
en la que P es un grupo protector, v es un número entero que tiene un valor de al menos 0, preferiblemente de 1-5, más preferiblemente de 1-3, lo más preferiblemente 1, y cada W representa independientemente el mismo residuo de aminoácido o uno diferente, y
(b) el nucleófilo peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es Lys(AEEA-AEEA-γ-Glu-OH), y después de eso dotar al Lys(AEEA-AEEA-γ-Glu-OH) de un grupo 17-carboxiheptadecanoílo.
9. Método según la reivindicación 6, que comprende el acoplamiento enzimático, catalizado por la ligasa, de (a) el éster o tioéster C-terminal peptídico que comprende la secuencia His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(tio)éster, y
(b) el nucleófilo peptídico que comprende la secuencia H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly, en la que Y es un residuo de lisina que tiene una cadena lateral libre, y después de eso dotar a la cadena lateral de ε-amino de la Lys de un grupo AEEA-AEEA-γ-Glu-N-17-carboxiheptadecanoil-OH.
10. Método según la reivindicación 1, en el que el péptido que se sintetiza es GLP-1.
11. Método según la reivindicación 4 u 8, en el que v es 1.
12. Método según cualquiera de las reivindicaciones anteriores, en el que la ligasa comprende al menos 6, preferiblemente al menos 8, más preferiblemente al menos 10, y lo más preferiblemente 12 ó 13 mutaciones seleccionadas del grupo de mutaciones en una posición de aminoácido correspondiente a Q2, S3, P5, S9, I31, K43, M50, A73, S188, Q206, N212, T254 y Q271 de SEQ ID NO: 2, en el que preferiblemente una o más de dichas mutaciones, más preferiblemente al menos seis de dichas mutaciones, lo más preferiblemente al menos doce de dichas mutaciones, se seleccionan del grupo de posiciones correspondientes a Q2K, S3C, P5S, S9A, I31L, K43N, M50F, A73L, S188P, Q206C, N212G, T254A y Q271E.
13. Método según cualquiera de las reivindicaciones anteriores, en el que el (tio)éster del éster o tioéster C-terminal peptídico es un Cam-AA1-AA2-éster, en el que AA1 representa una unidad de alanina, valina, leucina, isoleucina, fenilalanina, metionina o triptófano con una funcionalidad de cadena lateral no protegida, y AA2 representa una unidad de arginina o lisina con una funcionalidad de cadena lateral no protegida.
14. Método según la reivindicación 12, en el que la ligasa es una variante de subtilisina BPN’ con SEQ ID NO:
3, que comprende las mutaciones Q2K, S3C, P5S, S9A, I31L, K43N, M50F, N62A, A73L, ∆75-83, E156N, G166E, G169A, S188P, F189W, Q206C, N212G, Y217H, N218D, S221C, M222P, P225N, T254A, Q271E, o una variante de subtilisina BPN’ con SEQ ID NO: 14, que comprende las mutaciones Q2K, S3C, P5S, S9A, I31L, K43N, M50F, A73L, ∆75-83, E156S, G166S, G169A, S188P, Q206C, N212G, Y217H, S221C, M222P, P225N, T254A, y Q271E, o un homólogo de las mismas, que tiene al menos el 80 %, preferiblemente el 95 %, de identidad de secuencia con SEQ ID NO: 3 o con SEQ ID NO: 14, respectivamente, y que comprende respectivamente dichas mutaciones, que comprende opcionalmente una etiqueta de His.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18161084 | 2018-03-09 | ||
PCT/EP2019/056046 WO2019170918A1 (en) | 2018-03-09 | 2019-03-11 | Chemo-enzymatic synthesis of liraglutide, semaglutide and glp-1 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2962666T3 true ES2962666T3 (es) | 2024-03-20 |
Family
ID=61800262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES19709061T Active ES2962666T3 (es) | 2018-03-09 | 2019-03-11 | Síntesis quimioenzimática de liraglutida, semaglutida y GLP-1 |
Country Status (9)
Country | Link |
---|---|
US (2) | US10883132B2 (es) |
EP (1) | EP3704143B1 (es) |
JP (2) | JP2021516556A (es) |
KR (1) | KR20200130712A (es) |
CN (1) | CN111819191B (es) |
CA (1) | CA3093221A1 (es) |
ES (1) | ES2962666T3 (es) |
PL (1) | PL3704143T3 (es) |
WO (1) | WO2019170918A1 (es) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019048486A1 (de) * | 2017-09-05 | 2019-03-14 | Henkel Ag & Co. Kgaa | Leistungsverbesserte proteasevarianten ii |
PT4122954T (pt) | 2018-04-05 | 2024-06-05 | Sun Pharmaceutical Ind Ltd | Novos análogos de glp-1 |
CN110590934B (zh) * | 2019-09-25 | 2020-12-08 | 北京乐普医药科技有限公司 | 一种glp-1化合物 |
WO2021224938A1 (en) * | 2020-05-05 | 2021-11-11 | Neuland Laboratories Limited | Improved process for the preparation of semaglutide |
IL304214B1 (en) | 2021-01-20 | 2024-09-01 | Viking Therapeutics Inc | Preparations and methods for the treatment of metabolic and liver disorders |
EP4291647A1 (en) | 2021-02-12 | 2023-12-20 | Fresenius Kabi iPSUM S.r.l. | Subtilisin variants and their use |
WO2024133313A1 (en) | 2022-12-19 | 2024-06-27 | Enzypep B.V. | Thermostable subtilisin variants and their use |
WO2024163600A1 (en) * | 2023-02-01 | 2024-08-08 | Danisco Us Inc. | Subtilisin variants and methods of use |
WO2024163584A1 (en) * | 2023-02-01 | 2024-08-08 | Danisco Us Inc. | Subtilisin variants and methods of use |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2087342C (en) | 1990-08-09 | 2003-12-23 | Lars Abrahmsen | Serine protease variants having peptide ligase activity |
US5567601A (en) * | 1993-06-01 | 1996-10-22 | University Of Maryland | Subtilisin mutants lacking a primary calcium binding site |
US6451974B1 (en) | 1999-03-17 | 2002-09-17 | Novo Nordisk A/S | Method of acylating peptides and novel acylating agents |
US6541235B1 (en) | 2000-09-29 | 2003-04-01 | University Of Maryland Biotechnology Institute | Calcium free subtilisin mutants |
EP1750752A2 (en) * | 2003-11-20 | 2007-02-14 | Neuronova AB | Compounds and methods for increasing neurogenesis |
DE602007006310D1 (es) * | 2006-06-23 | 2010-06-17 | Hoffmann La Roche | |
WO2014199397A2 (en) | 2013-06-11 | 2014-12-18 | Mylan Laboratories Ltd | Process for the preparation of liraglutide |
GR20140100479A (el) | 2014-09-23 | 2016-05-05 | Novetide, Ltd., | Συνθεση λιραγλουτιδης |
US10138268B2 (en) * | 2014-10-10 | 2018-11-27 | Enzypep B.V. | Peptide fragment condensation and cyclisation using a subtilisin variant with improved synthesis over hydrolysis ratio |
WO2017007324A1 (en) * | 2015-07-09 | 2017-01-12 | Enzypep B.V. | Designing an enzymatic peptide fragment condensation strategy |
WO2018032521A1 (zh) | 2016-08-19 | 2018-02-22 | 深圳市健元医药科技有限公司 | 一种利拉鲁肽的合成方法 |
-
2019
- 2019-03-11 ES ES19709061T patent/ES2962666T3/es active Active
- 2019-03-11 CN CN201980018036.3A patent/CN111819191B/zh active Active
- 2019-03-11 PL PL19709061.6T patent/PL3704143T3/pl unknown
- 2019-03-11 JP JP2020570646A patent/JP2021516556A/ja active Pending
- 2019-03-11 KR KR1020207028592A patent/KR20200130712A/ko not_active Application Discontinuation
- 2019-03-11 US US16/463,471 patent/US10883132B2/en active Active
- 2019-03-11 WO PCT/EP2019/056046 patent/WO2019170918A1/en unknown
- 2019-03-11 EP EP19709061.6A patent/EP3704143B1/en active Active
- 2019-03-11 CA CA3093221A patent/CA3093221A1/en active Pending
-
2020
- 2020-02-06 US US16/783,570 patent/US10920258B2/en active Active
-
2023
- 2023-11-09 JP JP2023191845A patent/JP2024010221A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20200347427A1 (en) | 2020-11-05 |
EP3704143B1 (en) | 2023-10-18 |
US10883132B2 (en) | 2021-01-05 |
KR20200130712A (ko) | 2020-11-19 |
EP3704143A1 (en) | 2020-09-09 |
CN111819191B (zh) | 2024-08-20 |
EP3704143C0 (en) | 2023-10-18 |
JP2024010221A (ja) | 2024-01-23 |
US10920258B2 (en) | 2021-02-16 |
PL3704143T3 (pl) | 2024-04-15 |
JP2021516556A (ja) | 2021-07-08 |
CA3093221A1 (en) | 2019-09-12 |
WO2019170918A1 (en) | 2019-09-12 |
CN111819191A (zh) | 2020-10-23 |
US20190345529A1 (en) | 2019-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2962666T3 (es) | Síntesis quimioenzimática de liraglutida, semaglutida y GLP-1 | |
US10858414B2 (en) | Chemo-enzymatic synthesis of semaglutide, liraglutide and GLP-1 | |
EP2270025A1 (en) | Solid phase peptide synthesis of peptide alcohols | |
US20180187231A1 (en) | Designing an enzymatic peptide fragment condensation strategy | |
US9598714B2 (en) | Side-chain protected oligopeptide fragment condensation using subtilisins in organic solvents | |
Nakamura et al. | Synthesis of peptide thioesters via an N–S acyl shift reaction under mild acidic conditions on an N‐4, 5‐dimethoxy‐2‐mercaptobenzyl auxiliary group | |
US10336994B2 (en) | Subtilisin variants having a mutation in the S2 or S2# pocket | |
US20240043897A1 (en) | Subtilisin variants and their use | |
US20130267680A1 (en) | Total chemical synthesis of ubiquitin, ubiquitin mutants and derivatives thereof | |
WO2011048029A1 (en) | Cyclic peptide synthesis | |
WO2017222369A1 (en) | Enzymatic coupling of (oligo)peptides to the b-chain of an insulin receptor ligand | |
CN117098843A (zh) | 枯草杆菌蛋白酶变体及其用途 | |
EP3299085A1 (en) | Peptide coupling molecule | |
US20080242836A1 (en) | Convergent Solid Phase Peptide Synthesis By Reaction Of Two Fragments Bound To Solid Support |