CN110331159B - 一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法 - Google Patents
一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法 Download PDFInfo
- Publication number
- CN110331159B CN110331159B CN201910616814.0A CN201910616814A CN110331159B CN 110331159 B CN110331159 B CN 110331159B CN 201910616814 A CN201910616814 A CN 201910616814A CN 110331159 B CN110331159 B CN 110331159B
- Authority
- CN
- China
- Prior art keywords
- saccharomyces cerevisiae
- insulin
- expression
- insulin glargine
- glargine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229960002869 insulin glargine Drugs 0.000 title claims abstract description 155
- 108010057186 Insulin Glargine Proteins 0.000 title claims abstract description 142
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 title claims abstract description 139
- 240000004808 Saccharomyces cerevisiae Species 0.000 title claims abstract description 129
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 title claims abstract description 129
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000003248 secreting effect Effects 0.000 title claims abstract description 22
- 230000014509 gene expression Effects 0.000 claims abstract description 69
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 40
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 39
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 27
- 230000004186 co-expression Effects 0.000 claims abstract description 22
- 239000001963 growth medium Substances 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 11
- 239000013612 plasmid Substances 0.000 claims description 62
- 239000006228 supernatant Substances 0.000 claims description 19
- 101001007681 Candida albicans (strain WO-1) Kexin Proteins 0.000 claims description 18
- 108010076181 Proinsulin Proteins 0.000 claims description 13
- 238000000338 in vitro Methods 0.000 claims description 13
- 230000028327 secretion Effects 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 230000037361 pathway Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 108090001061 Insulin Proteins 0.000 abstract description 86
- 102000004877 Insulin Human genes 0.000 abstract description 84
- 210000004027 cell Anatomy 0.000 abstract description 45
- 238000000746 purification Methods 0.000 abstract description 32
- 230000008569 process Effects 0.000 abstract description 20
- 230000004048 modification Effects 0.000 abstract description 16
- 238000012986 modification Methods 0.000 abstract description 16
- 238000004519 manufacturing process Methods 0.000 abstract description 9
- 108090000631 Trypsin Proteins 0.000 abstract description 7
- 102000004142 Trypsin Human genes 0.000 abstract description 7
- 238000000855 fermentation Methods 0.000 abstract description 7
- 230000004151 fermentation Effects 0.000 abstract description 7
- 239000002609 medium Substances 0.000 abstract description 7
- 239000012588 trypsin Substances 0.000 abstract description 7
- 238000005342 ion exchange Methods 0.000 abstract description 5
- 239000006227 byproduct Substances 0.000 abstract description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 abstract description 3
- 229910052799 carbon Inorganic materials 0.000 abstract description 3
- 235000015097 nutrients Nutrition 0.000 abstract description 2
- 210000005253 yeast cell Anatomy 0.000 abstract description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 157
- 229940125396 insulin Drugs 0.000 description 77
- 238000003776 cleavage reaction Methods 0.000 description 52
- 230000007017 scission Effects 0.000 description 51
- 102000037865 fusion proteins Human genes 0.000 description 37
- 108020001507 fusion proteins Proteins 0.000 description 37
- 235000018102 proteins Nutrition 0.000 description 34
- 102000004190 Enzymes Human genes 0.000 description 32
- 108090000790 Enzymes Proteins 0.000 description 32
- 229940088598 enzyme Drugs 0.000 description 32
- 108020004414 DNA Proteins 0.000 description 30
- 239000005090 green fluorescent protein Substances 0.000 description 30
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 29
- 238000005520 cutting process Methods 0.000 description 25
- 239000000523 sample Substances 0.000 description 22
- 230000003834 intracellular effect Effects 0.000 description 20
- 108090000765 processed proteins & peptides Proteins 0.000 description 20
- 235000001014 amino acid Nutrition 0.000 description 19
- 150000001413 amino acids Chemical class 0.000 description 17
- 230000000694 effects Effects 0.000 description 17
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 17
- 239000012634 fragment Substances 0.000 description 16
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 16
- 150000002500 ions Chemical class 0.000 description 15
- 238000002965 ELISA Methods 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 13
- 238000004949 mass spectrometry Methods 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 238000001262 western blot Methods 0.000 description 13
- 239000007788 liquid Substances 0.000 description 12
- 238000001819 mass spectrum Methods 0.000 description 12
- 230000003321 amplification Effects 0.000 description 11
- 238000005277 cation exchange chromatography Methods 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 238000010276 construction Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 230000014759 maintenance of location Effects 0.000 description 9
- 238000011160 research Methods 0.000 description 9
- 239000013613 expression plasmid Substances 0.000 description 8
- 238000003259 recombinant expression Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 239000002699 waste material Substances 0.000 description 8
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 7
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 7
- 125000003275 alpha amino acid group Chemical group 0.000 description 7
- 238000011033 desalting Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 108091005804 Peptidases Proteins 0.000 description 6
- 239000004365 Protease Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 239000007791 liquid phase Substances 0.000 description 6
- 239000002243 precursor Substances 0.000 description 6
- 238000004153 renaturation Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000001976 enzyme digestion Methods 0.000 description 5
- 229940060975 lantus Drugs 0.000 description 5
- 238000004811 liquid chromatography Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 4
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 229930182830 galactose Natural products 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 230000004481 post-translational protein modification Effects 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- -1 salt ion Chemical class 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 3
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 238000000246 agarose gel electrophoresis Methods 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005336 cracking Methods 0.000 description 3
- 239000012228 culture supernatant Substances 0.000 description 3
- 239000008367 deionised water Substances 0.000 description 3
- 229910021641 deionized water Inorganic materials 0.000 description 3
- 210000001163 endosome Anatomy 0.000 description 3
- 239000012535 impurity Substances 0.000 description 3
- 238000001254 matrix assisted laser desorption--ionisation time-of-flight mass spectrum Methods 0.000 description 3
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 238000002331 protein detection Methods 0.000 description 3
- 239000012474 protein marker Substances 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000000108 ultra-filtration Methods 0.000 description 3
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- 102000005367 Carboxypeptidases Human genes 0.000 description 2
- 108010006303 Carboxypeptidases Proteins 0.000 description 2
- 238000008157 ELISA kit Methods 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 101500021084 Locusta migratoria 5 kDa peptide Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108010031271 Saccharomyces cerevisiae Proteins Proteins 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical group C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 2
- 238000012528 insulin ELISA Methods 0.000 description 2
- 239000004026 insulin derivative Substances 0.000 description 2
- 150000008040 ionic compounds Chemical class 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000002572 peristaltic effect Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000020978 protein processing Effects 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 239000007974 sodium acetate buffer Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 1
- 208000013016 Hypoglycemia Diseases 0.000 description 1
- 101150045458 KEX2 gene Proteins 0.000 description 1
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 1
- 101710192606 Latent membrane protein 2 Proteins 0.000 description 1
- 108010092217 Long-Acting Insulin Proteins 0.000 description 1
- 102000016261 Long-Acting Insulin Human genes 0.000 description 1
- 229940100066 Long-acting insulin Drugs 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical group NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 244000302274 Saccharomyces cerevisiae W303 Species 0.000 description 1
- 235000011859 Saccharomyces cerevisiae W303 Nutrition 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 206010042434 Sudden death Diseases 0.000 description 1
- 206010042618 Surgical procedure repeated Diseases 0.000 description 1
- 101710109576 Terminal protein Proteins 0.000 description 1
- 241001052560 Thallis Species 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 125000001314 canonical amino-acid group Chemical group 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010612 desalination reaction Methods 0.000 description 1
- 229940079919 digestives enzyme preparation Drugs 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 239000006167 equilibration buffer Substances 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010083391 glycinin Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000002218 hypoglycaemic effect Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000008105 immune reaction Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000010039 intracellular degradation Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000000752 ionisation method Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 230000009962 secretion pathway Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 238000002211 ultraviolet spectrum Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/58—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
- C12N9/60—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi from yeast
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Mycology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Endocrinology (AREA)
- Diabetes (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明公开了一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法。该方法首先构建过表达Kex2的底盘细胞,然后将串联信号肽及密码子优化的甘精胰岛素DNA转入过表达Kex2的底盘细胞中,形成酿酒酵母共表达体系,进行蛋白表达纯化,即可得到甘精胰岛素。该方法极大降低了甘精胰岛素生产工艺难度,使传统工艺中下游多步繁琐复杂的加工流程得以简化,让酵母细胞在胞内直接完成修饰工作。同时,此法降低了纯化复杂性,可通过一步成本相对低的离子交换纯化直接从培养基中提取成熟的胰岛素蛋白。另外,由于避免使用胰蛋白酶等成分,避免了原有工艺中接近50%的副产物,提升了培养基中碳源等营养物质的发酵使用效率,具有很好的推广应用前景。
Description
技术领域
本发明属于蛋白药物生产技术领域。更具体地,涉及一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法。
背景技术
糖尿病是当今社会高发的慢性疾病。胰岛素类产品是糖尿病市场第一大用药品种,占据53%左右市场份额,其中又以三代重组胰岛素为主。甘精胰岛素属于第三代重组胰岛素,是一种长效胰岛素,没有明显峰值及其引发的低血糖、猝死等风险,由于其安全性、长效性的特点,甘精胰岛素Lantus持续数年成为胰岛素市场中市场份额最大的产品,占整体胰岛素市场的30%以上。
现有甘精胰岛素生产方式多为通过大肠杆菌生产甘精胰岛素单链前体,经过体外变复性后,通过胰蛋白酶、羧肽酶等蛋白酶在体外水解加工形成成熟双链结构,继而通过一系列纯化手段去除混杂的蛋白酶及其他衍生物杂质后,纯化得到甘精胰岛素。然而,该方法有一定缺陷,首先,大肠杆菌实现高产量的原因是通过内涵体大量聚集胰岛素蛋白,但这为下游分离纯化工作带来巨大挑战,相比较于分泌表达而言大幅提升了生产成本。破碎收集内涵体的过程会引入大量大肠杆菌宿主中内源蛋白及内毒素等物质,需要再纯化过程中将这类蛋白严格去除掉以避免人体严重的免疫反应(Nilsson et al.,1996)。并且,内涵体的变复性条件控制较为严苛,显著影响胰岛素得率。并且变复性涉及强酸强碱尿素等物质,对工业设备要求较高。其次,大肠杆菌缺乏翻译后修饰的能力,二硫键无法形成,且蛋白无法正确折叠。此过程需要让胰岛素以内涵体形式生产后,通过体外的变复性以及氧化的过程使得二硫键正常形成并正确折叠(Walsh et al.,2006)。另外,由于大肠杆菌胞内包含大量各类蛋白酶体,避免蛋白在胞内降解也是胰岛素菌株选择过程中一个重要问题。使用大肠杆菌作为宿主,现有技术首先发酵获得胰岛素原的包涵体,之后在体外经过繁琐复杂、成本高昂的变复性、酶切、纯化形成成熟胰岛素。由于B链中包含碱性氨基酸残基赖氨酸、精氨酸会被胰蛋白酶识别为切割位点,因此使用胰蛋白酶体外处理胰岛素原时,会产生接近50%的副产物,浪费了原材料的同时,增添了纯化成本(Zimmerman et al.,2012)。
另外,也有通过酵母发酵的方法,然而生产工艺仍然是先通过酵母发酵生产甘精胰岛素单链前体,经过体外变复性后,通过胰蛋白酶、羧肽酶等蛋白酶在体外水解加工形成成熟双链结构,继而通过一系列纯化手段去除混杂的蛋白酶及其他衍生物杂质后,纯化得到甘精胰岛素。一方面酿酒酵母作为胰岛素生产宿主,相比大肠杆菌显著简化了纯化步骤、降低了纯化成本。然而,使用酿酒酵母生产仍然未能避免在体外进行酶切以及形成大量副产物,浪费碳源原材料的同时,也浪费了生物酶制剂,并非精巧高效的生产方法。
发明内容
本发明要解决的技术问题是克服现有甘精胰岛素制备工艺的缺陷和不足,通过酿酒酵母作为表达体系,借助酿酒酵母的蛋白加工系统,过表达内源性Kex2蛋白酶,对甘精胰岛素前体的Arg-Arg识别位点进行切割,使胰岛素在酿酒酵母细胞内进行加工修饰,直接形成双链且带有二硫键的成熟胰岛素。之后借助酿酒酵母的蛋白分泌系统,通过信号肽将胰岛素分泌到细胞外,通过简单的离子交换纯化即可得到成熟的甘精胰岛素。
本发明的目的是提供一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法。
本发明上述目的通过以下技术方案实现:
一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法,是在酿酒酵母细胞中,共表达优化的Kex2蛋白酶及含有分泌信号肽的甘精胰岛素原,使得甘精胰岛素原在酿酒酵母细胞分泌途径中被共表达的Kex2蛋白酶修饰切割,由甘精胰岛素原单链结构转变为成熟双链结构的甘精胰岛素,并借助分泌信号肽分泌到酿酒酵母细胞外,直接获得序列结构正确、无需体外加工的甘精胰岛素。
所用酿酒酵母细胞,包括常见实验室及工业生产菌株。优选为酿酒酵母Saccharomycess cerevisiae。
优选地,所述利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法包括如下步骤:
S1.分别构建Kex2His6表达框和alpha-Glargine表达框;
S2.将含有S1中两个表达框的DNA序列共转化酿酒酵母;
S3.将筛选的阳性酿酒酵母使用合适培养基进行蛋白表达纯化,从培养基上清液中纯化得到甘精胰岛素;
其中,步骤S1中,所述Kex2His6表达框选自满足如下一个或一个以上条件的分子:
(1)序列如SEQ ID NO.1所示;
(2)SEQ ID NO.1中包含的被后截断的Kex2序列替换为Kex2全长序列,所得序列;
(3)SEQ ID NO.1中包含的被后截断的Kex2序列替换为Kex2蛋白序列第599位氨基酸后截断序列,所得序列;
(4)表达框末尾His6序列替换为其他10aa以内的亲水性短肽;
(5)表达框起始部分信号肽替换为其他胞内导向的信号肽;
(6)相同氨基酸的兼并密码子替换。
步骤S1中,所述alpha-Glargine表达框选自满足如下一个或一个以上条件的分子:
(1)序列如SEQ ID NO.4所示;
(2)表达框起始部分信号肽(alpha)替换为其他胞内导向的信号肽;
(3)相同氨基酸的兼并密码子替换;
(4)甘精胰岛素B链及A链之间添加末端可被Kex2识别并切割的连接序列。
在所述形成的酿酒酵母共表达体系中,Kex2对甘精胰岛素前体进行充分修饰,并通过alpha信号肽将成熟的双链胰岛素引导分泌至细胞外培养基中,alpha信号肽被Kex2蛋白酶切割去除,形成无任何氨基酸附加的成体甘精胰岛素。表达的甘精胰岛素经过鉴定验证,本发明通过酿酒酵母细胞胞内加工修饰的甘精胰岛素,与标准品在生化结构上相同。本工艺使用酿酒酵母为宿主,实现了在培养基中直接分泌表达成熟甘精胰岛素。
优选地,步骤S2中,使用质粒作为表达框承载体。即将分别将两个表达框连接入表达载体后,再共转化酿酒酵母。
优选地,Kex2His6表达框插入在质粒pYES3的HindIII及PmeI酶切位点之间,构成重组质粒pYES3-Kex2His6。Kex2His6表达框经过截短及增加末端序列等优化,可实现在酿酒酵母细胞内最大的Kex2蛋白酶酶切效率,充分切割与其共表达的重组甘精胰岛素原。
优选地,alpha-Glargine表达框插入在质粒pYES2的HindIII及PmeI酶切位点之间,构成重组质粒pYES2-alpha-Glargine。alpha-Glargine表达框经过密码子优化可实现在含有Kex2His6共表达的酿酒酵母细胞内,实现高纯度成熟胰岛素的表达。
本发明上述方法制备得到的甘精胰岛素,氨基酸序列为:FVNQHLCGSHL VEALYLVCGERGFFYTPKTRRGIVEQCCTSICSLYQLENYCG。
另外,基于本发明的研究,以下组分均是本发明首次研究得出,且对本发明利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法具有重要的影响,因此也应在本发明的保护范围之内:
优化的甘精胰岛素DNA,序列如SEQ ID NO.3所示。
优化的Kex2蛋白酶DNA,即Kex2His6表达框,序列如SEQ ID NO.1所示。
包含有SEQ ID NO.1所示序列的重组质粒。优选为上述重组质粒pYES3-Kex2His6。
上述序列如SEQ ID NO.4所示的alpha-Glargine表达框。
包含有SEQ ID NO.4所示序列的重组质粒。优选为上述重组质粒pYES2-alpha-Glargine。
含有Kex2His6表达框和alpha-Glargine表达框的重组酿酒酵母。
含有重组质粒pYES3-Kex2His6和pYES2-alpha-Glargine的重组酿酒酵母。最后,由本发明上述方法制备得到的甘精胰岛素,也属于本发明的保护范围之内。
本发明开发酿酒酵母本身的细胞潜能,使其不仅仅可以简单地生产单链胰岛素原,更能使用其作为真核细胞所具备的翻译后修饰能力,直接在胞内完成甘精胰岛素的修饰工作,合成并分泌成熟的甘精胰岛素,无需后续人工体外修饰处理,直接纯化获得。由于酿酒酵母内源的Kex2酶切效率很低,其本身的alpha信号肽尚且无法完成充分切割,更无法承担大量重组蛋白的切割修饰。因此,本发明Kex2的底盘细胞构建优化了细胞内Kex2的切割能力,共表达的Kex2满足了重组蛋白的切割修饰,并且通过MBP-linker-GFP充分证明了共表达的Kex2在分泌途径上的内切酶活性。
其中,由于Kex2无法实现对大量胞内重组蛋白进行切割修饰,因此在研究中首先建立了Kex2的共表达体系,通过含有酶切位点linker的融合蛋白MBP-linker-GFP证明了Kex2的胞内酶活,另外借助此融合蛋白,探索了其他Kex2共表达体系的切割修饰效率,确定了最优的Kex2共表达体系。在此基础上,合成了针对酿酒酵母密码子优化的甘精胰岛素DNA序列并进行了共表达实验。对表达出的重组蛋白从免疫学角度通过ELISA验证了其胰岛素的双链结构,之后借助阳离子交换层析纯化后,通过MALDI-TOF质谱及源内裂解的二级质谱,鉴定了重组胰岛素的氨基酸组成与甘精胰岛素完全相同,并且通过酶切+还原的方法通过肽指纹图确定了其二硫键位置及双链切割位置与甘精胰岛素完全一致。另外,通过液质联用及二级质谱,验证了重组表达的甘精胰岛素保留时间与标准品一致,并且蛋白中的氨基酸序列与标准品完全一致。综上,证明了重组表达的甘精胰岛素在氨基酸组分上、翻译后的双链切割上、及翻译后二硫键形成上,均与成熟的双链甘精胰岛素完全一致。
本发明具有以下有益效果:
本发明在酿酒酵母细胞中,通过优化Kex2的切割活性,对共表达的胰岛素完成胞内修饰,直接表达出成熟双链无需体外加工甘精胰岛素。具体是使用酿酒酵母为宿主,通过Kex2共表达体系,以及借助酿酒酵母分泌途径,实现了在培养基中从酿酒酵母细胞中直接分泌表达成熟的、无需后续加工、无需体外人工处理、可直接使用的甘精胰岛素。该方法借助了酿酒酵母的蛋白加工系统,过表达内源性Kex2蛋白酶,对甘精胰岛素前体的Arg-Arg识别位点进行切割,使得胰岛素加工修饰在酿酒酵母细胞内完成,直接形成双链且带有二硫键的成熟胰岛素。之后借助酿酒酵母的蛋白分泌系统,通过信号肽将胰岛素分泌到细胞外,经过一步简单的离子交换纯化即可得到成熟的甘精胰岛素。
该方法极大降低了甘精胰岛素生产工艺难度,使传统工艺中下游6-8步繁琐复杂的加工流程得以简化,让酵母细胞在胞内直接完成修饰工作。同时,此法降低了纯化复杂性,可通过一步成本相对低的离子交换纯化直接从培养基中提取成熟的胰岛素蛋白。另外,由于避免使用胰蛋白酶等成分,避免了原有工艺中接近50%的副产物,提升了培养基中碳源等营养物质的发酵使用效率。
附图说明
图1为实施例1中Western blot检测Kex2的表达;泳道1为含有空质粒pYES3的酿酒酵母蛋白空白对照,泳道2为含有质粒pYES3-Kex2His6的酿酒酵母蛋白实验组,泳道3为蛋白marker。
图2为MBP-linker-GFP融合蛋白经过Kex2胞内切割修饰后分离示意图。
图3为Western blot检测Kex2的共表达。
图4为Western blot通过融合蛋白MBP-linker-GFP及其对照检测重组Kex2的胞内酶活性。
图5为优化Kex2酶切能力,在Kex2全长上做更换启动子、信号肽、截短等操作示意图。
图6为Western blot通过融合蛋白MBP-linker-GFP摸索优化Kex2蛋白酶切割效率。
图7为重组甘精胰岛素在分泌途径中的翻译后修饰过程示意图。
图8为ELISA免疫鉴定重组胰岛素在酿酒酵母培养上清中表达情况。
图9使用AKTA pure及阳离子交换层析纯化表达的重组胰岛素。
图10纯化前所表达胰岛素的MALDI-TOF质谱结果。
图11纯化后所表达胰岛素的MALDI-TOF质谱结果。
图12所表达胰岛素与甘精胰岛素国家标准品使用MALDI-TOF比对结果;上图为研究中所表达的甘精胰岛素,下图为甘精胰岛素国家标准品。
图13通过LC/MS鉴定重组表达的胰岛素并与国家标准品甘精胰岛素比对;上图为研究中所表达的甘精胰岛素,下图为甘精胰岛素国家标准品。
图14单纯使用DTT还原所表达的胰岛素及商用甘精胰岛素Lantus,使用MALDI-TOF鉴定肽指纹图;上图为研究中所表达的甘精胰岛素,下图为Lantus。
图15单纯使用Glu-C酶解所表达的胰岛素及商用甘精胰岛素Lantus,使用MALDI-TOF鉴定肽指纹图;上图为研究中所表达的甘精胰岛素,下图为Lantus。
图16为DTT还原+Glu-C酶解所表达的胰岛素及商用甘精胰岛素Lantus,使用MALDI-TOF鉴定肽指纹图;上图为研究中所表达的甘精胰岛素,下图为Lantus。
具体实施方式
以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。
除非特别说明,以下实施例所用试剂和材料均为市购。
实施例1 Kex2蛋白酶重组表达体系的构建
本发明整体目标为:从酿酒酵母细胞中,直接合成并分泌成熟的甘精胰岛素。其中,要首先实现对甘精胰岛素原进行胞内酶切形成双链结构。甘精胰岛素分子结构中,B链末端包含双碱性氨基酸Arg-Arg的结构,可以被Kex2识别并切割。因此实现胰岛素酶切的途径,可以采用酵母中天然存在的内源Kex2。但由于内源性Kex2在酿酒酵母细胞内表达量不足,对于其本身的alpha因子的切割尚且存在切割不完全的情况。因此若要实现甘精胰岛素在酿酒酵母中重组表达,则需共表达更高水平、更高效率的Kex2以完成充分切割。因此,要实现甘精胰岛素在酿酒酵母的直接合成,首先要实现建立具有充足Kex2胞内活性的底盘细胞作为支持。本实验首先构建了酿酒酵母中613氨基酸残基位截短型Kex2重组表达菌株,在C末端连接了6xHis标签作为Western blot检测标记以及纯化标签。通过pYES3诱导表达体系,重组Kex2的表达通过Western blot验证。由于直接通过甘精胰岛素难以检测重组表达的Kex2是否真正发挥了胞内酶活性。因此,根据甘精胰岛素待切割位点为设计基础,设计了(alpha分泌信号肽—MBP—酶切位点linker—GFP)的融合蛋白来表征Kex2的胞内酶活性。通过Western blot确定了Kex2在酿酒酵母胞内对融合蛋白完成了切割,同时释放了被切割后的MBP以及GFP到胞外培养基中。另外,为了进一步优化Kex2酶切效率,尝试了通过不同位置对Kex2进行截短,以确定最合理的截短位点,以发挥Kex2胞内酶活性的最佳能力。通过上述共表达融合蛋白并鉴定其被切割情况,最佳的Kex2截短位点与构建形式得以确定。
因此,本实施例主要的工作是:(1)在酿酒酵母细胞中过表达Kex2蛋白酶,westernblot确认表达成功;(2)在酿酒酵母细胞中过表达Kex2蛋白酶的同时,共表达MBP-GFP融合蛋白,通过融合蛋白在胞内被切割,确认了过表达的Kex2具有预期胞内活性;(3)通过一系列实验,确认了最佳的Kex2构建方式(截短表达并增加尾巴),使得其胞内酶活性最大,切割效果最好。具体实验方法和结果如下:
1、实验方法
(1)使用Benchling网站,获取到所有待拼接的DNA序列,例如质粒DNA、Maltose-binding protein的DNA及Green-fluorescent-protein的DNA,设计将要构建的目标序列。
(2)设计目标序列当中的linker序列。为了使得MBP及GFP以柔性方式连接,并且两者间蛋白折叠互不干扰,因此使用了甘氨酸、丝氨酸间隔的长达10个氨基酸长度左右的柔性链作为linker基础。
(3)另外加入Kex2酶切识别位点的过程中,考虑到为后续甘精胰岛素的切割做铺垫,因此在设计Kex2酶切位点时,直接采用了甘精胰岛素中待被Kex2识别的酶切位点。研究选取了甘精胰岛素酶切位点前四后一共五个氨基酸残基【KTRRG】作为融合蛋白linker中的Kex2识别位点,插入到linker中间。
(4)在Benchling中,设计将alpha信号肽、MBP、linker、GFP的序列拼接在一起后,不考虑限制性内切酶位点,无缝插入到pYES2的多克隆位点中。
含酶切位点linker的蛋白序列和DNA序列分别如SEQ ID NO.5和6所示,不含酶切位点linker的蛋白序列和DNA序列分别如SEQ ID NO.7和8所示。
2、实验结果
(1)Kex2蛋白酶在酿酒酵母中的构建和表达
根据GenBank中酿酒酵母基因组中KEX2的基因序列,设计了扩增引物oAD039及oAD040(序列如SEQ ID NO.9和10所示)。通过酵母基因组提取试剂盒,酿酒酵母W303中的基因组被提取,并以此为模板,通过Kex2扩增引物将Kex2-His片段扩增出来,并同时在DNA末端添加了6xHis标签及Xpress标签以进行后续Western blot以及潜在的蛋白纯化。
之后,使用扩增引物oAD050及oAD051(序列如SEQ ID NO.11和12所示)反向扩增了pYES3酿酒酵母表达型质粒。片段通过琼脂糖凝胶电泳以及DNA测序验证了序列的正确性。之后使用桥接法,将Kex2-His以及pYES3表达质粒无缝连接起来,转化入大肠杆菌DH5α感受态细胞中。隔日,使用鉴定引物oAD006及oAD007(序列如SEQ ID NO.13和14所示),对相应氨苄平板的克隆进行菌落PCR鉴定。确定出阳性克隆后,挑取单菌落对相应菌株培养,抽提其中DNA质粒送测序鉴定序列无误后,对相应菌株sAD106予以保存。
将DH5α扩增的pYES3-Kex2His6质粒通过试剂盒提取后,通过酶标板检测DNA浓度。之后,将合适浓度的pYES3-Kex2His6质粒与制备好的INVsc1双倍体酵母感受态细胞孵育,进行酵母转化。转化后的酵母在TRP1营养缺陷型平板上进行筛选,选取若干个酵母克隆,使用鉴定引物oAD006及oAD007进行酵母菌落PCR鉴定。确定出阳性克隆后,挑取单菌落对相应菌株培养,对相应酿酒酵母菌株sAD132予以保存。
使用INVsc1作为表达菌株的原因,是INVsc1为双倍体菌株,并且为营养缺陷型,无法在缺少His/Ura/Leu/Trp的平板上生长,除此之外与野生型酵母无区别。INVsc1酿酒酵母既可以在生长能力和表达能力上与野生型酿酒酵母持平,又可以通过简单的营养缺陷标记进行筛选。
之后,将含有质粒pYES3-Kex2His6的酿酒酵母sAD132,以及含有空质粒载体pYES3的酿酒酵母sAD134培养过夜,扩增培养后,对新鲜的酵母使用半乳糖培养基进行诱导表达。表达24h后,收集菌体,加入0.2M氢氧化钠并煮沸裂解,释放酵母胞内蛋白后,进行Westernblot蛋白检测。结果如图1所示,使用His抗体进行孵育,可观察到69kDa处的泳道2上,显示为一条明显的条带,而含有空质粒的空白对照在泳道1无明显条带,说明Kex2-His蛋白被成功表达,且表达量较高。
(2)Kex2蛋白酶in vivo酶活性的表征
Kex2表达成功后,为了鉴定Kex2是否拥有所期望的胞内蛋白酶生物活性,设计了如下实验:选取酿酒酵母细胞中,表达较为成熟稳定的Maltose Binding protein(MBP)及Green fluorescentprotein(GFP),通过柔性linker连接为融合蛋白。在相应的柔性linker的中间位置,加入了后续将在甘精胰岛素B链及A链的连接处进行切割的酶切位点序列,形成了【GGSKTRRGSGGGS】13个氨基酸构成的linker序列。其中,第四个残基开始的【KTRR】,为甘精胰岛素中B链的末尾氨基酸残基。第八个残基【G】,为甘精胰岛素中A链的起始氨基酸残基。其中,Kex2将会识别linker中的【RR】位点,并对其进行切割,linker中的其余甘氨酸和丝氨酸,为柔性连接融合蛋白常见的氨基酸残基组成。
如果重组表达的Kex2-His在酿酒酵母细胞内含有酶活性,则会对分泌表达的融合蛋白MBP-linker-GFP进行切割,使原有的68.8kDa的融合蛋白变为42.5kDa的MBP及26.9kDa的GFP独立的两个蛋白,在培养基中检测到。
同时,如果检测到以上结果,则从另一角度说明,后续甘精胰岛素中的KTRRG的酶切位点序列,也可以在酿酒酵母细胞内被重组表达的Kex2酶切,从而实现直接在酿酒酵母胞内完成甘精胰岛素单链到双链的转换。
图2为MBP-linker-GFP融合蛋白经过Kex2胞内切割修饰后分离示意图。
根据GenBank中Maltose Binding protein(MBP)、Green fluorescentprotein(GFP)以及alpha信号肽的序列,设计了oAD028、oAD035、oAD036、oAD038、oAD042、oAD043的片段扩增引物(序列分别如SEQ ID NO.15-20所示)。以实验室中质粒为模板,相应扩增出了MBP、GFP以及酿酒酵母alpha分泌信号肽。之后,使用扩增引物oAD050及oAD051反向扩增了pYES2酿酒酵母表达型质粒。
片段通过琼脂糖凝胶电泳以及DNA测序验证了序列的正确性。之后使用桥接法,将MBP、GFP、alpha分泌信号肽以及pYES2表达质粒无缝连接起来,转化入大肠杆菌DH5α感受态细胞中。隔日,使用鉴定引物oAD006及oAD007,对相应氨苄平板的克隆进行菌落PCR鉴定。确定出阳性克隆后,挑取单菌落对相应菌株培养,抽提其中DNA质粒送测序鉴定序列无误后,对相应菌株sAD123予以保存。
另外,根据类似方法,克隆构建了含有质粒pYES2-a-MBP的菌株sAD125、含有质粒pYES2-a-GFP的菌株sAD127,以及含有质粒pYES2-alpha-MBP-GFP的菌株sAD121作为对照组。其中,sAD125单独分泌表达MBP,sAD127单独分泌表达GFP,sAD121分泌表达不含有【KTRRG】酶切位点的MBP-GFP融合蛋白。
将DH5α扩增的pYES2-a-MBP-linker-GFP、pYES2-alpha-MBP-GFP、pYES2-a-MBP、pYES2-a-GFP质粒通过试剂盒提取后,通过酶标板检测DNA浓度。之后,将合适浓度的pYES3-Kex2His6以及上述4种质粒等摩尔数混合,与制备好的INVsc1双倍体酵母感受态细胞孵育,进行酵母共转化。
转化后的酵母在TRP1、URA3双营养缺陷型平板上进行筛选,选取若干个酵母克隆,使用鉴定引物进行酵母菌落PCR鉴定。确定出双质粒共转化成功的阳性克隆后,挑取单菌落,使用URA3、TRP1双营养缺陷的液体培养基培养相应菌株,对培养后的酿酒酵母菌株sAD136、sAD137、sAD138、sAD139予以保存。
之后,将含有质粒pYES3-Kex2His6+pYES2-a-MBP-linker-GFP的酿酒酵母sAD136、含有质粒pYES3-Kex2His6+pYES2-a-MBPGFP的酿酒酵母sAD137、含有质粒pYES3-Kex2His6+pYES2-a-MBP的酿酒酵母sAD138、含有质粒pYES3-Kex2His6+pYES2-a-MBP-linker-GFP的酿酒酵母sAD139,以及含有空质粒载体pYES2+pYES3的酿酒酵母sAD135培养过夜,扩增培养后,对新鲜的酵母使用半乳糖培养基进行诱导表达。表达24h后,收集培养基上清液,取10ul进行Western blot蛋白检测,结果如图3所示。
首先,使用His抗体进行孵育,检测Kex2在共表达体系中的表达情况。其中,泳道1为蛋白marker,泳道2为含有质粒pYES3-Kex2His6+pYES2-a-MBP-linker-GFP的酿酒酵母细胞裂解液,泳道3为含有质粒pYES3-Kex2His6+pYES2-alpha-MBP-GFP的酿酒酵母细胞裂解液。可观察到69kDa处的泳道2、3上,显示为一条明显的条带,说明Kex2-His蛋白在共表达体系中正常表达。
之后通过融合蛋白观察被Kex2的胞内切割情况,如图4所示。
图4结果中,左边为GFP抗体孵育结果,右图为MBP抗体孵育结果。两图中,泳道1为含有质粒pYES3-Kex2His6+pYES2-a-MBP-linker-GFP的酿酒酵母表达上清液,泳道2为含有质粒pYES3-Kex2His6+pYES2-alpha-MBP-GFP的酿酒酵母表达上清液,泳道3为含有质粒pYES3-Kex2His6+pYES2-a-MBP的酿酒酵母表达上清液,泳道4为含有质粒pYES3-Kex2His6+pYES2-a-GFP的酿酒酵母表达上清液,泳道5为蛋白marker。
从第一幅图中GFP抗体孵育情况可发现如下情况。第一泳道中,在约27kDa处有明显单一条带,与第四泳道中单独表达的GFP在同一水平线,形成单独的GFP条带,在69kDa除几乎看不到融合蛋白的条带,由此说明,第一泳道中含有linker的融合蛋白MBP-linker-GFP被重组表达的Kex2成功切割,从68.8kDa的融合蛋白中释放出29kDa的GFP。而第二泳道中,在69kDa处可见明显条带,而29kDa处无条带,说明不含酶切位点linker的融合蛋白MBP-linker-GFP无法被重组表达的Kex2切割。第三泳道为分泌表达MBP无法被GFP抗体检测,第四泳道为分泌表达GFP对照。
从第二幅图中MBP抗体孵育情况可发现与上述一致的结果。第一泳道中,在约40kDa处有明显条带,与第三泳道中单独表达的MBP对照在同一水平线,在69kDa可看较弱的融合蛋白的条带,由此说明,第一泳道中含有linker的融合蛋白MBP-linker-GFP被重组表达的Kex2成功切割,从68.8kDa的融合蛋白中释放出42kDa的MBP,但切割并不完全,仍含有一定融合蛋白条带。而第二泳道中,在69kDa处可见明显条带,说明不含酶切位点linker的融合蛋白MBP-linker-GFP无法被重组表达的Kex2切割。第三泳道为分泌表达MBP对照,第四泳道为分泌表达GFP无法被MBP抗体检测。其中MBP抗体显示多个条带,可能由于MBP末端位置含有一个Kex2酶切位点,切割后形成大小不一的蛋白被MBP抗体所识别。
由以上结果可得知,胞内共表达Kex2及其融合蛋白底物,可实现相应酶切位点的有效切割,使原有的68.8kDa的融合蛋白变为42.5kDa的MBP及26.9kDa的GFP独立的两个蛋白,在培养基中检测到。由此,Kex2的胞内酶活性被表征。
(3)Kex2蛋白酶最佳构建方法的确定
通过上述结果可发现,Kex2的酶切效果被表征,但其切割并非充分彻底。鉴于此,考虑通过如下方案对Kex2蛋白酶活性进行进一步优化。
1)更换Kex2重组表达的启动子。由Gal诱导表达变为TEF启动子或GPD启动子控制的组成型表达。
2)更换Kex2的前导信号肽。由原有的Kex2信号肽更换为alpha信号肽。
3)使用不同截短型的Kex2,根据文献中报道的结构,截短长度及对应菌株编号如图5所示。
根据以上思路,以上述pYES3-Kex2His6-his为基础,另外构建了7个Kex2的表达质粒,共8种Kex2表达质粒,连同包含linker酶切位点的融合蛋白pYES2-a-MBP-linker-GFP,使用与上述类似的实验方法,构建了如下表1所示的酿酒酵母共表达菌株。
表1优化Kex2酶切能力所构建的质粒及相应菌株
将上述菌株培养过夜,扩增培养后,对新鲜的酵母使用半乳糖培养基进行诱导表达。表达24h后,收集培养基上清液,取10ul进行Western blot蛋白检测,结果如图6所示。
图6为经过MBP抗体孵育的Western blot结果,可从图中看到,绝大多数泳道在40kDa位置处有相应单独MBP的条带,且70kDa位置处有融合蛋白的条带。其中,泳道1-8为上述列表中1-8酵母菌株,泳道9为无重组Kex2单独表达MBP-linker-GFP融合蛋白。从以上结果可发现,更换为组成型启动子、alpha信号肽,对切割效率无明显提升。
Kex2的不同截短构建中,从599位开始截短,明显使得Kex2丧失了其生物学活性,在40kDa位置处相应单独MBP的条带消失。另外,从660位到814位Kex2全长,可看到在40kDa位置处相应单独MBP的条带逐渐变弱,且70kDa位置处融合蛋白的条带逐渐增强。此结果说明了游离表达的Kex2确实酶切效率更高,含有高尔基体膜锚定末端的Kex2酶切效果非常有限,与无Kex2共表达的阴性对照效果相近。
另外,从结果中可发现,在613位截短且在末端增加6xHis-Xpress标签的Kex2的酶切效果最好,几乎看不到70kDa处的融合蛋白条带。这暗示了在Kex2末端增加阻碍膜锚定的标签,会使得Kex2游离效果更好,继而提升了Kex2的酶切效果。
由此,Kex2重组表达的共表达底盘体系建立完成,且最佳菌株为4号菌株,该菌株包含两个重组质粒pYES3-Kex2His6和pYES2-alpha-MBP-linker-eGFP,重组质粒pYES3-Kex2His6中片段Kex2His6(序列如SEQ ID NO.1所示)插入在质粒pYES3的HindIII及PmeI酶切位点之间,重组质粒pYES2-alpha-MBP-linker-eGFP中片段alpha-MBP-linker-eGFP(序列如SEQ ID NO.2所示)插入在质粒pYES2的HindIII及PmeI酶切位点之间。含有甘精胰岛素酶切位点的MBP-linker-GFP在酿酒酵母细胞内被高效率切割,释放出单独的MBP及GFP蛋白。由于linker中的酶切位点周边序列,与后续将要进行的胰岛素酶切位点序列完全一致,且胰岛素的空间位阻相对于融合蛋白而言要明显更小,因此有信心将相应融合蛋白换为甘精胰岛素原后,甘精胰岛素原中的相应酶切位点也可被高效切割。
综上所述结果显示,本发明在酿酒酵母中成功重组表达了截短并修饰的Kex2蛋白酶,并且通过含有甘精胰岛素酶切位点的融合蛋白充分证明了共表达Kex2的高效切割能力,并以此确定了Kex2的最佳构建体系,实现构建了Kex2共表达的底盘细胞,此细胞可以切割酿酒酵母细胞分泌途径上,含有KR或RR氨基酸序列蛋白或多肽,为后续甘精胰岛素的表达做铺垫。
实施例2甘精胰岛素的直接合成及分泌
本实施例是在实施例1的研究基础上,选择实施例1中构建好的4号菌株,按照相同的方法,将重组质粒pYES2-alpha-MBP-linker-eGFP中的片段MBP-linker-eGFP替换为优化的甘精胰岛素序列(如SEQ ID NO.3所示),构建了甘精胰岛素及Kex2的共表达体系。之后对表达的蛋白通过ELISA从免疫学角度对其表征,并确认共表达的胰岛素被Kex2切割。使用阳离子交换层析纯化后,使用MALDI-TOF验证了表达蛋白的分子量,并进一步确定了其肽指纹图,验证了其二硫键位置及Kex2切割位置。另外使用液质联用质谱验证了其保留时间,并通过源内裂解方法测序搜库确定了氨基酸序列。质谱鉴定表达的胰岛素全分子量与标准品一致;液相鉴定表达的胰岛素保留时间与标准品一致;质谱鉴定表达的胰岛素肽指纹图与标准品一致,及二硫键、切割位点均与预期一致。(纯度较高无杂峰);质谱鉴定表达的胰岛素蛋白序列与标准品一致。以上多角度共同验证了重组胰岛素的生化结构,证明了成熟甘精胰岛素从酿酒酵母中被成功表达。
具体实验方法和结果如下:
1、实验方法
(1)在实施例1中构建好的4号菌株的基础上,按照相同的方法,将重组质粒pYES2-alpha-MBP-linker-eGFP中的片段MBP-linker-eGFP替换为优化的甘精胰岛素序列(如SEQID NO.3所示),构建了甘精胰岛素及Kex2的共表达体系进行表达。
(2)阳离子交换层析纯化重组的甘精胰岛素
1)阳离子交换层析纯化柱使用GE SP Sepharose FastFlow 5mL;
2)蛋白纯化仪使用GE AKTApure 25;
3)胰岛素纯化Buffer A平衡缓冲液:20mM醋酸钠缓冲对,醋酸调节至pH=4
4)胰岛素纯化Buffer B洗脱缓冲液:20mM醋酸钠缓冲对,1mM氯化钠,醋酸调节至pH=4;
纯化方法为常规甘精胰岛素阳离子交换层析梯度纯化方法。
(3)超滤脱盐浓缩纯化后的甘精胰岛素
1)将超滤膜包与管路相连,组装至蠕动泵中,流入液管路接到上液缸、滤出液管路接废液缸、流出液管路接回到上液缸。上液缸中样品4度冰浴。
2)启动蠕动泵,100RPM运行。运行过程中,上液缸中液体不断减少。
3)为上液缸中补加去盐的平衡缓冲液,等体积添加3次缓冲液使得盐离子浓度下降至10mM以下。
4)收集最终上液缸中的样品,并且使用平衡缓冲液将管路中的样品顶出,一并收集到离心管中,4度保存,待后续鉴定。
(4)肽指纹图酶切还原前处理甘精胰岛素
1)取500ng表达的甘精胰岛素,加10mM DTT(10ul 1M DTT,990ul 25mM NH4HCO3配制)150ul,56℃水浴1hr;
2)4℃离心,吸干,快速加55mM IAM(55ul 1M IAM,945ul 25mM NH4HCO3配制)150ul,置于暗室45min;
3)将干粉Glu-C加入500uL去离子水溶解,加入上述500ng胰岛素还原剂混合液,5uL过量Glu-C蛋白酶溶液,10uL2X GluC Reaction Buffer,加去离子水至总体积20uL置37℃水浴锅,消化过夜;
4)加入1%甲酸终止反应,使甲酸终浓度为0.1%,振荡混匀,离心。保存于4℃冰箱中。
(说明:对于单独还原的样品,则省略第三步;对于单独酶切的样品省略1、2步,酶切+还原则无省略步骤。甘精胰岛素标准品,取用等量的胰岛素,使用相同操作步骤方法平行处理。
(5)质谱前样品脱盐
1)配置脱盐溶液:
Activation Solution:50%CAN
Equilibration Solution:0.5%FA in 5%CAN
Sample Buffer:2%FA in 20%CAN
Wash Solution:0.5%FA in 5%ACN
ElutionBuffer:70%CAN
2)脱盐流程:加入200μL of Activation Solution并1500×g for 1min离心浸润填料,倒掉废液。重复2-3次该步骤。加入200μL of Equilibration Solution并1500×gfor 1min离心,倒掉废液。重复1次该步骤。将脱盐样品加入脱盐柱中,最多添加400ul,可重复2-3次该步骤。1500×g for 1min离心,倒掉废液。将绑定蛋白样品的脱盐柱放入一个收集离心管中。加入200μL of Equilibration Solution并1500×g for 1min离心,倒掉废液。重复1次该步骤。将洗涤后的蛋白样品的脱盐柱放入一个新的收集离心管中。加入20-40μL of Elution Buffer并1500×g for 1min离心,倒掉废液。重复1次该步骤。直接检测或冷藏样品待后续检测。
MALDI-TOF胰岛素全分子量鉴定
MALDI-TOF使用了Bruker的UltraFlex TOF/TOF,具体参数如表2所示。
表2 MALDI-TOF质谱全分子量鉴定参数
鉴定过程中,使用了线性模式及HCCA基质,取1ul脱盐后的待测样品,加到Groundsteel target 384孔板的HCCA基质上,自然风干后,推入质谱仪中根据上述参数表进行检测。
(6)MALDI-TOF胰岛素肽指纹图鉴定
肽指纹图鉴定时,质谱仪信号收集模式使用了反射模式及线性模式,根据结果情况进行取舍。线性模式参数同上,反射模式的参数表如表3所示。
表3 MALDI-TOF质谱肽指纹图鉴定参数
质谱仪上样检测操作流程同上不再赘述。
液质联用鉴定胰岛素保留时间及分子量
液相方法如表4所示:
表4 LC/MS全分子鉴定液相方法
LC/MS参数配置如表5所示:
表5 LC/MS液相质谱参数
取30ul脱盐后的待测样品,加到上样小瓶中,放入液质联用自动进样仪中,根据上述参数表进行检测。
液质联用质谱源内裂解胰岛素搜库比对
使用Thermo Proteome Discoverer软件进行二级质谱搜库。提供了甘精胰岛素的理论序列进行比对。软件中Enzyme Name设置为Trypsin,Fragment Mass Tolerance设置为0.8Da,Precursor mass tolerance设置为10ppm。对重组表达的胰岛素进行源内裂解,与提供的理论序列实用软件进行比对。
2、实验结果
(1)甘精胰岛素的构建及表达
首先,根据Kex2共表达的实验结果,设计了甘精胰岛素在细胞中的预期切割过程,据此设计了甘精胰岛素重组表达所使用的蛋白序列。表达框中的蛋白序列包含如下三部分:alpha分泌信号肽、胰岛素B链、胰岛素A链。其中信号肽末端蛋白序列为Lys-Arg,此为天然内源alpha信号肽中的蛋白序列,可被Kex2识别并切割去除信号肽。其后的B链末端的蛋白序列为Arg-Arg,可被Kex2所识别并切割,分离B链和A链。
直接将B链与A链直接相连,其中不包含人胰岛素结构中的C链的原因,是因为已有研究表明,B链A链之间的C链,在胰岛素的成熟过程中不发挥任何作用,且在切割修饰过程中也对酶切位点无效率增强的效果(Steiner et al.,2004)。因此,为尽可能提升氨基酸利用率,且避免增加多余Kex2酶切位点,直接设计了B链与A链直接相连。由此,甘精胰岛素表达框的蛋白序列可被Kex2在分泌途径中修饰,形成不含有任何多余氨基酸的甘精胰岛素。
图7为重组甘精胰岛素在分泌途径中的翻译后修饰过程示意图。
根据表达框蛋白序列,经过IDT网站对酿酒酵母进行密码子优化,确定相应DNA序列后,提交给睿博公司对DNA序列进行合成。使用PCR对相应片段进行扩增后,使用扩增引物oAD050及oAD051反向扩增了pYES2酿酒酵母表达型质粒。片段通过琼脂糖凝胶电泳以及DNA测序验证了序列的正确性。之后使用桥接法,将片段alpha-B-A以及pYES2表达质粒无缝连接起来,转化入大肠杆菌DH5α感受态细胞中。隔日,使用鉴定引物oAD006及oAD007,对相应氨苄平板的克隆进行菌落PCR鉴定。确定出阳性克隆后,挑取单菌落对相应菌株培养,抽提其中DNA质粒送测序鉴定序列无误后,对相应菌株sAD140予以保存。
将DH5α扩增的pYES2-alpha-Glargine质粒通过试剂盒提取后,通过酶标板检测DNA浓度。之后,将合适浓度的pYES3-Kex2His6以及pYES2-alpha-Glargine质粒等摩尔数混合,与制备好的INVsc1双倍体酵母感受态细胞孵育,进行酵母共转化。使用类似的方法,另外得到了单独转化pYES2-alpha-Glargine质粒的酵母菌株。
转化后的酵母在TRP1、URA3双营养缺陷型平板上进行筛选,选取若干个酵母克隆,使用鉴定引物进行酵母菌落PCR鉴定。确定出双质粒共转化成功的阳性克隆后,挑取单菌落,使用URA3、TRP1双营养缺陷的液体培养基培养相应菌株,对培养后的酿酒酵母菌株sAD172予以保存。
之后,将含有质粒pYES3-Kex2His6+pYES2-alpha-Glargine的酿酒酵母sAD172、含有质粒pYES2-alpha-Glargine的酿酒酵母sAD173、以及含有空质粒载体pYES2+pYES3的酿酒酵母sAD135培养过夜,扩增培养后,对新鲜的酵母使用半乳糖培养基进行诱导表达。表达24h后,收集培养基上清液,取培养基上清液25ul进行ELISA检测。
所使用的ELISA试剂盒为Crystal Chem的人胰岛素ELISA试剂盒,其附带的免疫酶联抗体对甘精胰岛素的活力为104%,可正常检测出重组表达的成熟甘精胰岛素,但对单链的胰岛素的检测效率只有1.2%。因此,该试剂盒可分辨所表达的甘精胰岛素是否被切割形成双链结构。如果样本为双链胰岛素,则可正常显色;如果样本为胰岛素原的单链形式,则应当为阴性不显色。
对上述菌株发酵表达24h的上清液,通过ELISA检测,酶标仪结果如表6。
表6 ELISA免疫鉴定重组胰岛素在酿酒酵母培养上清中表达情况
图8中,从左到右依次为含有质粒pYES3-Kex2His6+pYES2-alpha-Glargine的酿酒酵母sAD172诱导上清,去离子水,胰岛素ELISA试剂盒标准品,含有pYES2+pYES3空载体的酿酒酵母sAD135诱导上清,含有质粒pYES3-Kex2His6的酿酒酵母sAD132诱导上清,含有质粒pYES2-alpha-Glargine的酿酒酵母sAD173诱导上清。
从图8中可得知,含有质粒pYES3-Kex2His6+pYES2-alpha-Glargine的共表达体系,与ELISA试剂盒所附带的标准品度数结果相当,浓度接近150mU/L。而只含有pYES2-alpha-Glargine的组,与ddH2O组、pYES2+pYES3空载体组、pYES3-Kex2His6等阴性对照组,度数结果相差不超过30%,说明其表达的重组蛋白无双链胰岛素结构或只有少部分被酿酒酵母细胞内源的Kex2切割修饰成功使得度数稍高于其他阴性对照组。
由以上结果可得知,酿酒酵母pYES3-Kex2His6+pYES2-alpha-Glargine的共表达体系,实现了直接表达切割成熟的双链胰岛素,其双链结构通过能特异性识别双链胰岛素的ELISA酶联免疫抗体所鉴定。而无共表达Kex2的菌株无法正常合成并分泌切割成熟的双链胰岛素。
通过ELISA实验,可以得知双链胰岛素被成功合成,但对于其真正的氨基酸组成无法通过ELISA鉴定。因此,需要通过质谱手段对表达的胰岛素进行鉴定已确定其为甘精胰岛素类似物而非其他胰岛素类似物。
(2)使用阳离子交换层析对重组胰岛素纯化
质谱检测灵敏度低于ELISA检测几个数量级,而且需要样品纯度及浓度达到一定水平,并且不含有盐离子。因此进行质谱鉴定前,需要对发酵上清液中的双链胰岛素进行纯化。由于发酵上清体积较大,并且工业界对甘精胰岛素的纯化方法较为成熟,因此采用阳离子交换层析方法进行纯化。
离子交换层析是在以离子交换剂为固定相,液体为流动相的系统中进行的。离子交换剂由基质、电荷基团和反离子构成。离子交换剂与水溶液中离子或离子化合物的反应主要以离子交换方式进行,或借助离子交换剂电荷基团对溶液中离子或离子化合物的吸附作用进行。
由于被纯化的物质为等电点为6.4的甘精胰岛素,在pH=4的条件下完全溶解,在中性或碱性环境中不溶解,因此可使用强酸性的阳离子交换柱进行纯化。在强酸性的缓冲液下,蛋白质分子带正电荷,与带负电荷的阳离子交换剂相结合。在高盐条件下,蛋白质与阳离子交换剂之前的电荷相互作用由于盐离子竞争被破坏,导致蛋白分子在高盐下根据与交换剂的结合强弱被依次洗脱出来,通过紫外光谱仪器可读取出峰,继而收集纯化样品。
根据以上设计,使用20mM的醋酸钠:醋酸缓冲对作为Buffer A维持缓冲液在pH=4,使用含有1M氯化钠的Buffer A作为Buffer B作为高盐洗脱剂。采用AKTA pure作为仪器,通过HiTrap SP FF阳离子交换层析柱对表达的胰岛素纯化。紫外检测结果如图9所示。
图9中粉色、红色、蓝色线,为波长200nm、214nm、280nm对蛋白出峰检测。胰岛素在短波长紫外线190-220nm之间吸收明显,对280nm波长吸收不明显。绿色线为缓冲液B的成分占比,棕色线为电导率。从图9可得知,表达的胰岛素蛋白在电导率为54-62mS/cm时被洗脱出峰,相应流出液被收集并在脱盐后进行后续质谱检测。
(3)使用MALDI-TOF对重组胰岛素全分子量鉴定
ELISA方法是快速鉴定胰岛素的方法之一,但无法对胰岛素及其不同氨基酸修饰的胰岛素类似物进行区分鉴定。因此,若要进一步阐明通过酿酒酵母Kex2共表达体系所生产的重组蛋白为成熟甘精胰岛素而非其他胰岛素类似物,则只能通过质谱手段,对其精细的分子量进行测定,继而确定其分子组成。
基质辅助激光解吸电离飞行时间质谱(MALDI-TOF)是鉴定生物大分子分子量的常用手段,其操作及样品要求与传统质谱对比而言都十分简单高效,可识别分子量范围广且避免了样品间交叉污染,可在短时间内完成大量样品的测定。
仪器由基质辅助激光解吸电离离子源(MALDI)和飞行时间质量分析器(TOF)两部分组成。MALDI的原理是用激光照射样品与基质形成的共结晶薄膜,基质从激光中吸收能量传递给生物分子,而电离过程中将质子转移到生物分子或从生物分子得到质子,而使生物分子电离的过程。因此它是一种软电离技术,适用于混合物及生物大分子的测定。TOF的原理是离子在电场作用下加速飞过飞行管道,根据到达检测器的飞行时间不同而被检测即测定离子的质荷比(M/Z)与离子的飞行时间成正比。MALDI-TOF-MS具有灵敏度高、准确度高及分辨率高等特点。
对于纯化前后的样品,以及甘精胰岛素国家标准品,进行脱盐后上样MALDI-TOF进行检测,结果如图10所示。
由图10、图11及图12结果可知,通过阳离子交换层析,0-8000kDa的杂蛋白分子被明显去除,较为干净地保留了所重组表达的胰岛素。另外,图谱结果中显示了清晰单一的峰,并且分子量为6043左右,与标准品干粉6061仅相差18分子量,据推测可能由于在高强度激光电离时导致其中一个氧原子及两个氢原子脱落所致。由于分子量相差量远小于单个氨基酸的分子质量,因此可以认为所表达的重组甘精胰岛素的氨基酸组分与甘精胰岛素无明显差异。
(4)使用LC/MS对重组胰岛素保留时间鉴定
液质联用(LC/MS)是一种高精度的生化分析方法。通过液相色谱-质谱连用的方法,能对小分子及生物大分子进行分离的同时,对其质量进行鉴定。其基本原理是,物质首先经过液相色谱的手段进行分离,经过离子源离子化被测物质,之后通过质谱检测仪对目标物质进行质量鉴定。与普通HPLC的紫外检测器相比,LC/MS所使用的质谱检测器对物质鉴定的灵敏度显著提升,并且使得鉴定方法不仅仅局限与色谱的出峰的保留时间上,质谱检测器对物质分子质量的鉴定,给予了对目标分子更直接的确定。
为了进一步确定重组表达的胰岛素目标分子,研究中使用了液质联用的方法,从反向液相色谱及高精度质谱层面,对目标全分子进行鉴定。使用美国药典中甘精胰岛素的液相色谱鉴定程序,对经过纯化并脱盐的重组胰岛素,以及对应的国家标准品甘精胰岛素,分别平行使用相同的液相程序及质谱方法进行鉴定,结果如图13所示。
图13中上方两图为重组表达胰岛素的液相及13.5分钟的质谱图。上方两图为国家标准品甘精胰岛素的液相及13.5分钟的质谱图。从结果中可见,重组表达的胰岛素与国家甘精胰岛素标准品,均在13.5分钟形成明显的单峰,两者保持一致。并且,通过质谱检测器结果可见,保留时间为13.5分钟的分子,进入质谱中形成单多价态离子的分子量,与标准品相比相差18分子量((1011-1008)x6)。其原因推测是鉴定过程中失去一个水分子导致。此结果与上节中MALDI-TOF中的结果一致。
由此,重组胰岛素分子的液相色谱保留时间,以及对应保留时间分子的全分子量,与标准品一致。因此可认为所表达的重组甘精胰岛素的氨基酸组分与甘精胰岛素完全一致。
(5)使用肽指纹图对重组胰岛素修饰鉴定
仅仅通过全分子量推测氨基酸组成一致,并不足以说明,所表达的重组甘精胰岛素与商用的甘精胰岛素在二硫键、两条肽链的组分完全一致。因此,需要通过对所表达的甘精胰岛素进行二硫键的还原、以及Glu-C蛋白酶对齐进行酶解,之后与标准品比对两者产生的肽指纹图谱,才能更加充分证明其结构特性。
Glu-C(也被称为V8蛋白酶)是一种高度专一性的蛋白内切酶,识别位点为谷氨酸(Glu,E)的羧基端,常用于胰岛素等多肽分子在肽指纹图上的酶切鉴定。通过强还原剂DTT,以及Glu-C,可使胰岛素分子形成多条特异性降解的肽段,以此与标准品相应降解的肽段作比对,可充分证明两者分子上的异同。
对酿酒酵母直接分泌表达的甘精胰岛素Glargine,以及商用甘精胰岛素Lantus,进行相同如下方式处理:单纯使用DTT还原、单纯进行Glu-C酶切、DTT还原+Glu-C酶切,之后使用MALDI-TOF鉴定,获得了三组对照比对结果,如图14-16所示。
从单纯DTT还原的结果中可见,研究中所表达的甘精胰岛素与市面上赛诺菲的Lantus,被DTT还原后的图谱结果基本完全一致。其中明显可见的3742Da的峰为A、B链之间的二硫键还原打开后,B链单独的分子量,说明研究中所表达的甘精胰岛素被共表达的Kex2在预期位点完美切割,形成分离的B链及A链双链结构。
从单纯使用Glu-C酶解、以及使用DTT还原+Glu-C酶解结果中可见,研究中所表达的甘精胰岛素与市面上赛诺菲的Lantus,图谱结果基本完全一致。由此肽指纹图,说明了经过Glu-C酶切的甘精胰岛素,其中的二硫键打开或未还原打开,其图谱均与相同处理的市面上甘精胰岛素Lantus完全一致,说明了其中二硫键在结构上形成完全正确,经历了酿酒酵母的分泌途径后,分子中的二硫键自动形成了正确形态。
(6)使用二级质谱对重组胰岛素全序列鉴定
另外,除了通过酶切及还原的肽指纹图的方法,还使用了二级质谱的方法,对重组表达的甘精胰岛素全分子源内裂解形成小肽碎片,对碎片进行数据库比对,以验证其B链及A链的氨基酸序列组成。结果如表7所示。
表7源内裂解二级质谱鉴定重组表达的甘精胰岛素B链及A链的氨基酸组成
由表7结果可见,源内裂解产生的碎片完全覆盖理论上的甘精胰岛素的氨基酸序列,说明了重组表达的甘精胰岛素的氨基酸测序结果与理论一致。
由以上多方面的质谱结果,完整说明了重组表达的甘精胰岛素在氨基酸组分上、翻译后的双链切割上、以及翻译后二硫键形成上,均与市面上商业使用的Lantus甘精胰岛素完全一致。
综上结果显示,使用实施例1构建的Kex2共表达底盘细胞,对甘精胰岛素进行分泌表达,双链结构的胰岛素被成功表达到培养基中。通过阳离子交换层析法对培养上清中的重组胰岛素进行纯化,0-8000Da的杂多肽被明显去除,在生化结构上确认了直接分泌表达的胰岛素为目标的甘精胰岛素。因此,实现了使用酿酒酵母直接表达合成、修饰切割并分泌出无需后续加工的成熟甘精胰岛素。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
序列表
<110> 中山大学
<120> 一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法
<160> 20
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1890
<212> DNA
<213> 重组质粒pYES3-Kex2His6中片段Kex2His6的序列(artifical sequence)
<400> 1
atgaaagtga ggaaatatat tactttatgc ttttggtggg ccttttcaac atccgctctt 60
gtatcatcac aacaaattcc attgaaggac catacgtcac gacagtattt tgctgtagaa 120
agcaatgaaa cattatcccg cttggaggaa atgcatccaa attggaaata tgaacatgat 180
gttcgagggc taccaaacca ttatgttttt tcaaaagagt tgctaaaatt gggcaaaaga 240
tcatcattag aagagttaca gggggataac aacgaccaca tattatctgt ccatgattta 300
ttcccgcgta acgacctatt taagagacta ccggtgcctg ctccaccaat ggactcaagc 360
ttgttaccgg taaaagaagc tgaggataaa ctcagcataa atgatccgct ttttgagagg 420
cagtggcact tggtcaatcc aagttttcct ggcagtgata taaatgttct tgatctgtgg 480
tacaataata ttacaggcgc aggggtcgtg gctgccattg ttgatgatgg ccttgactac 540
gaaaatgaag acttgaagga taatttttgc gctgaaggtt cttgggattt caacgacaat 600
accaatttac ctaaaccaag attatctgat gactaccatg gtacgagatg tgcaggtgaa 660
atagctgcca aaaaaggtaa caatttttgc ggtgtcgggg taggttacaa cgctaaaatc 720
tcaggcataa gaatcttatc cggtgatatc actacggaag atgaagctgc gtccttgatt 780
tatggtctag acgtaaacga tatatattca tgctcatggg gtcccgctga tgacggaaga 840
catttacaag gccctagtga cctggtgaaa aaggctttag taaaaggtgt tactgaggga 900
agagattcca aaggagcgat ttacgttttt gccagtggaa atggtggaac tcgtggtgat 960
aattgcaatt acgacggcta tactaattcc atatattcta ttactattgg ggctattgat 1020
cacaaagatc tacatcctcc ttattccgaa ggttgttccg ccgtcatggc agtcacgtat 1080
tcttcaggtt caggcgaata tattcattcg agtgatatca acggcagatg cagtaatagc 1140
cacggtggaa cgtctgcggc tgctccatta gctgccggtg tttacacttt gttactagaa 1200
gccaacccaa acctaacttg gagagacgta cagtatttat caatcttgtc tgcggtaggg 1260
ttagaaaaga acgctgacgg agattggaga gatagcgcca tggggaagaa atactctcat 1320
cgctatggct ttggtaaaat cgatgcccat aagttaattg aaatgtccaa gacctgggag 1380
aatgttaacg cacaaacctg gttttacctg ccaacattgt atgtttccca gtccacaaac 1440
tccacggaag agacattaga atccgtcata accatatcag aaaaaagtct tcaagatgct 1500
aacttcaaga gaattgagca cgtcacggta actgtagata ttgatacaga aattagggga 1560
actacgactg tcgatttaat atcaccagcg gggataattt caaaccttgg cgttgtaaga 1620
ccaagagatg tttcatcaga gggattcaaa gactggacat tcatgtctgt agcacattgg 1680
ggtgagaacg gcgtaggtga ttggaaaatc aaggttaaga caacagaaaa tggacacagg 1740
attgacttcc acagttggag gctgaagctc tttggggaat ccattgattc atctaaaaca 1800
gaaactttcg tctttggaaa cgataaagag gaggttgaag gatcccatca tcaccatcac 1860
catgatctgt acgacgatga cgataagtga 1890
<210> 2
<211> 2127
<212> DNA
<213> 重组质粒pYES2-alpha-MBP-linker-eGFP中片段alpha-MBP-linker-eGFP的序列(artifical sequence)
<400> 2
atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120
tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180
aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240
tctctcgaga aaagaatgaa aatcgaagaa ggtaaactgg taatctggat taacggcgat 300
aaaggctata acggtctcgc tgaagtcggt aagaaattcg agaaagatac cggaattaaa 360
gtcaccgttg agcatccgga taaactggaa gagaaattcc cacaggttgc ggcaactggc 420
gatggccctg acattatctt ctgggcacac gaccgctttg gtggctacgc tcaatctggc 480
ctgttggctg aaatcacccc ggacaaagcg ttccaggaca agctgtatcc gtttacctgg 540
gatgccgtac gttacaacgg caagctgatt gcttacccga tcgctgttga agcgttatcg 600
ctgatttata acaaagatct gctgccgaac ccgccaaaaa cctgggaaga gatcccggcg 660
ctggataaag aactgaaagc gaaaggtaag agcgcgctga tgttcaacct gcaagaaccg 720
tacttcacct ggccgctgat tgctgctgac gggggttatg cgttcaagta tgaaaacggc 780
aagtacgaca ttaaagacgt gggcgtggat aacgctggcg cgaaagcggg tctgaccttc 840
ctggttgacc tgattaaaaa caaacacatg aatgcagaca ccgattactc catcgcagaa 900
gctgccttta ataaaggcga aacagcgatg accatcaacg gcccgtgggc atggtccaac 960
atcgacacca gcaaagtgaa ttatggtgta acggtactgc cgaccttcaa gggtcaacca 1020
tccaaaccgt tcgttggcgt gctgagcgca ggtattaacg ccgccagtcc gaacaaagag 1080
ctggcaaaag agttcctcga aaactatctg ctgactgatg aaggtctgga agcggttaat 1140
aaagacaaac cgctgggtgc cgtagcgctg aagtcttacg aggaagagtt ggtgaaagat 1200
ccgcgtattg ccgccactat ggaaaacgcc cagaaaggtg aaatcatgcc gaacatcccg 1260
cagatgtccg ctttctggta tgccgtgcgt actgcggtga tcaacgccgc cagcggtcgt 1320
cagactgtcg atgaagccct gaaagacgcg cagactaatt cgagctcggg cggctcaaag 1380
actcgtcgtg gatccggagg tggctcaatg gtgagcaagg gcgaggagct gttcaccggg 1440
gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc 1500
ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc 1560
ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc 1620
ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa 1680
ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc 1740
gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc 1800
aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc 1860
tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac 1920
atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac 1980
ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac 2040
cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact 2100
ctcggcatgg acgagctgta caagtaa 2127
<210> 3
<211> 162
<212> DNA
<213> 优化的甘精胰岛素DNA序列(artifical sequence)
<400> 3
ttcgtgaatc aacacttatg tggttcacac ttagtcgagg cgttatattt agtatgcggg 60
gagcgtggtt ttttttacac tcctaaaacg cgtcgtggga tcgtcgaaca gtgctgcaca 120
tcaatctgtt ctttatacca gttagagaac tattgtgggt aa 162
<210> 4
<211> 417
<212> DNA
<213> alpha-Glargine DNA序列(artifical sequence)
<400> 4
atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120
tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180
aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240
tctctcgaga aaagattcgt gaatcaacac ttatgtggtt cacacttagt cgaggcgtta 300
tatttagtat gcggggagcg tggttttttt tacactccta aaacgcgtcg tgggatcgtc 360
gaacagtgct gcacatcaat ctgttcttta taccagttag agaactattg tgggtaa 417
<210> 5
<211> 17
<212> PRT
<213> 含酶切位点linker氨基酸序列(artifical sequence)
<400> 5
Asn Ser Ser Ser Gly Gly Ser Lys Thr Arg Arg Gly Ser Gly Gly Gly
1 5 10 15
Ser
<210> 6
<211> 51
<212> DNA
<213> 含酶切位点linker的DNA序列(artifical sequence)
<400> 6
aattcgagct cgggcggctc aaagactcgt cgtggatccg gaggtggctc a 51
<210> 7
<211> 4
<212> PRT
<213> 不含酶切位点linker氨基酸序列(linker)
<400> 7
Asn Ser Ser Ser
1
<210> 8
<211> 12
<212> DNA
<213> 不含酶切位点linker的DNA序列(linker)
<400> 8
aattcgagct cg 12
<210> 9
<211> 47
<212> DNA
<213> 引物oAD039(artifical sequence)
<400> 9
tcacttatcg tcatcgtcgt acagatcatg gtgatggtga tgatggg 47
<210> 10
<211> 35
<212> DNA
<213> 引物oAD040(artifical sequence)
<400> 10
atgaaagtga ggaaatatat tactttatgc ttttg 35
<210> 11
<211> 34
<212> DNA
<213> 引物oAD050(artifical sequence)
<400> 11
ggtaagctta atattcccta tagtgagtcg tatt 34
<210> 12
<211> 22
<212> DNA
<213> 引物oAD051(artifical sequence)
<400> 12
tgagtttaaa cccgctgatc ct 22
<210> 13
<211> 29
<212> DNA
<213> 引物oAD006(artifical sequence)
<400> 13
ccggatcgga ctactagcag ctgtaatac 29
<210> 14
<211> 23
<212> DNA
<213> 引物oAD007(artifical sequence)
<400> 14
tgatgcggcc ctctaggatc agc 23
<210> 15
<211> 23
<212> DNA
<213> 引物oAD028(artifical sequence)
<400> 15
ttacttgtac agctcgtcca tgc 23
<210> 16
<211> 20
<212> DNA
<213> 引物oAD035(artifical sequence)
<400> 16
cgagctcgaa ttagtctgcg 20
<210> 17
<211> 29
<212> DNA
<213> 引物oAD036(artifical sequence)
<400> 17
atgaaaatcg aagaaggtaa actggtaat 29
<210> 18
<211> 56
<212> DNA
<213> 引物oAD038(artifical sequence)
<400> 18
ggcggctcaa agactcgtcg tggatccgga ggtggctcaa tggtgagcaa gggcga 56
<210> 19
<211> 28
<212> DNA
<213> 引物oAD042(artifical sequence)
<400> 19
atgagatttc cttcaatttt tactgcag 28
<210> 20
<211> 27
<212> DNA
<213> 引物oAD043(artifical sequence)
<400> 20
tcttttctcg agagataccc cttcttc 27
Claims (1)
1.一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法,其特征在于,在酿酒酵母细胞中,共表达优化的Kex2 蛋白酶及含有分泌信号肽的甘精胰岛素原,使得甘精胰岛素原在酿酒酵母细胞分泌途径中被共表达的Kex2 蛋白酶修饰切割,由甘精胰岛素原单链结构转变为成熟双链结构的甘精胰岛素,并借助分泌信号肽分泌到酿酒酵母细胞外,直接获得序列结构正确、无需体外加工的甘精胰岛素;
具体地,所述方法包括如下步骤:
S1.分别构建Kex2His6表达框和alpha-Glargine表达框;
S2.将含有S1中两个表达框的DNA序列共转化酿酒酵母;
S3.将筛选的阳性酿酒酵母使用培养基进行蛋白表达纯化,从培养基上清液中纯化得到甘精胰岛素;
其中,步骤S1中,所述Kex2His6 表达框选自序列如SEQ ID NO.1所示分子;所述alpha-Glargine表达框选自序列如SEQ ID NO.4所示分子;
其中,步骤S2中,使用质粒作为表达框承载体再转化酿酒酵母;
其中,所述的Kex2His6表达框插入在质粒pYES3的HindIII及PmeI酶切位点之间,构成重组质粒pYES3-Kex2His6;alpha-Glargine表达框插入在质粒pYES2的HindIII及PmeI酶切位点之间,构成重组质粒pYES2-alpha-Glargine。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910020321 | 2019-01-09 | ||
CN2019100203210 | 2019-01-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110331159A CN110331159A (zh) | 2019-10-15 |
CN110331159B true CN110331159B (zh) | 2021-08-03 |
Family
ID=68145053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910616814.0A Active CN110331159B (zh) | 2019-01-09 | 2019-07-09 | 一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110331159B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113773392B (zh) * | 2020-06-09 | 2023-04-07 | 宁波鲲鹏生物科技有限公司 | 一种甘精胰岛素的制备方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103833828A (zh) * | 2012-11-21 | 2014-06-04 | 广东东阳光药业有限公司 | 一种甘精胰岛素前体蛋白的提取方法 |
-
2019
- 2019-07-09 CN CN201910616814.0A patent/CN110331159B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103833828A (zh) * | 2012-11-21 | 2014-06-04 | 广东东阳光药业有限公司 | 一种甘精胰岛素前体蛋白的提取方法 |
Non-Patent Citations (4)
Title |
---|
Disruption of KEX1 gene reduces the proteolytic degradation of secreted two-chain Insulin glargine in Pichia pastoris;Suma Sreenivas et al.;《Protein Expression and Purification》;20151022;第1-9页 * |
Enhancement in production of recombinant two-chain Insulin Glargine by over-expression of Kex2 protease in Pichia pastoris;Suma Sreenivas et al.;《Appl Microbiol Biotechnol》;20140920;图2,第328页右栏倒数第2段-第334页右栏第1段 * |
Kex2p在甲醇酵母中的分泌表达;艾敏榕等;《华中理工大学学报》;20020430;摘要,第163页左栏倒数第1段-右栏第1段 * |
艾敏榕等.Kex2p在甲醇酵母中的分泌表达.《华中理工大学学报》.2002, * |
Also Published As
Publication number | Publication date |
---|---|
CN110331159A (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102559311B1 (ko) | 재조합 인간 xvii형 콜라겐, 제조방법 및 응용 | |
CN110343183B (zh) | 一种重组表达载体及其构建方法和应用 | |
CN109486800B (zh) | 一种新型赖氨酰肽链内切酶及其制备方法 | |
CN110331159B (zh) | 一种利用酿酒酵母直接分泌表达成熟双链甘精胰岛素的方法 | |
Wu et al. | Expression, purification, and characterization of the Degludec precursor DesB30 | |
US20220411764A1 (en) | Thioredoxin mutant, preparation method thereof, and application thereof in production of recombinant fusion protein | |
US20190016754A1 (en) | Methods of producing and purifying matrix-binding fusion proteins by ion-exchange chromatography | |
WO2019062709A1 (zh) | 一种重组牛血清蛋白成熟肽及其制备方法和应用 | |
JP7266325B2 (ja) | 蛍光タンパク質フラグメントを含む融合タンパク質およびその用途 | |
CN109957003B (zh) | 一种稳定的saa突变体及其在疾病检测中的应用 | |
US11267863B2 (en) | N-terminal fusion partner for producing recombinant polypeptide, and method for producing recombinant polypeptide using same | |
CN114933658B (zh) | 一种短肽元件及其应用方法 | |
CN115947864A (zh) | 一种融合蛋白、生长激素及其制备方法 | |
CN103709253A (zh) | 一种生物合成制备glp-1及其类似物的方法 | |
KR20180099427A (ko) | 생체 스트레스 진단용 항원의 제조방법, 생체 스트레스 진단용 항체의 제조방법, 생체 스트레스 진단용 조성물 및 진단용 키트 | |
KR102064810B1 (ko) | 재조합 폴리펩타이드 생산용 n-말단 융합 파트너 및 이를 이용하여 재조합 폴리펩타이드를 생산하는 방법 | |
FRYKLUND | Production of authentic recombinant somatropin | |
US10150803B2 (en) | Method of preparing glucagon-like peptide-2 (GLP-2) analog | |
CN113493780A (zh) | 一种利用sumo融合表达系统制备重组肝素酶ii的方法及其所制备的sumo_肝素酶ii融合蛋白 | |
CN111018965A (zh) | 一种重组甲状旁腺素pth(1-34)的纯化方法 | |
CN105112382B (zh) | 一种基于家蚕-杆状病毒系统制备人髓过氧化物酶的方法 | |
CN114369173B (zh) | 一种利用融合蛋白标签促进人颗粒溶素及动物NK lysin在毕赤酵母中表达的方法 | |
KR102345012B1 (ko) | GroES 융합을 이용한 인간부갑상선호르몬 1-34의 생산방법 | |
CN117801123B (zh) | 沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 | |
KR102345013B1 (ko) | GroES 융합을 이용한 글루카곤 유사 펩타이드-2 또는 이의 유사체의 생산방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |