BE1023841A1 - Cellules de mammiferes exprimant des antigenes du cytomegalovirus - Google Patents
Cellules de mammiferes exprimant des antigenes du cytomegalovirus Download PDFInfo
- Publication number
- BE1023841A1 BE1023841A1 BE20165877A BE201605877A BE1023841A1 BE 1023841 A1 BE1023841 A1 BE 1023841A1 BE 20165877 A BE20165877 A BE 20165877A BE 201605877 A BE201605877 A BE 201605877A BE 1023841 A1 BE1023841 A1 BE 1023841A1
- Authority
- BE
- Belgium
- Prior art keywords
- ser
- leu
- val
- thr
- lys
- Prior art date
Links
- 241000701022 Cytomegalovirus Species 0.000 title claims abstract description 116
- 241000124008 Mammalia Species 0.000 title description 4
- 239000000427 antigen Substances 0.000 title description 4
- 108091007433 antigens Proteins 0.000 title description 4
- 102000036639 antigens Human genes 0.000 title description 4
- 210000004027 cell Anatomy 0.000 claims abstract description 227
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 164
- 239000012634 fragment Substances 0.000 claims abstract description 115
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 103
- 210000004978 chinese hamster ovary cell Anatomy 0.000 claims abstract description 55
- 108091026890 Coding region Proteins 0.000 claims abstract description 39
- 230000014509 gene expression Effects 0.000 claims description 102
- 101000864837 Homo sapiens SIN3-HDAC complex-associated factor Proteins 0.000 claims description 83
- 102100030066 SIN3-HDAC complex-associated factor Human genes 0.000 claims description 58
- 230000000694 effects Effects 0.000 claims description 58
- 108020004414 DNA Proteins 0.000 claims description 14
- 239000000203 mixture Substances 0.000 claims description 13
- 108091033319 polynucleotide Proteins 0.000 claims description 9
- 102000040430 polynucleotide Human genes 0.000 claims description 9
- 239000002157 polynucleotide Substances 0.000 claims description 9
- 229960005486 vaccine Drugs 0.000 abstract description 10
- 235000018102 proteins Nutrition 0.000 description 100
- 108010091175 Matriptase Proteins 0.000 description 93
- 102100037942 Suppressor of tumorigenicity 14 protein Human genes 0.000 description 76
- 210000004962 mammalian cell Anatomy 0.000 description 75
- 101001090901 Homo sapiens Retroelement silencing factor 1 Proteins 0.000 description 66
- 108010076504 Protein Sorting Signals Proteins 0.000 description 46
- 241000880493 Leptailurus serval Species 0.000 description 44
- 238000000034 method Methods 0.000 description 41
- 241000282414 Homo sapiens Species 0.000 description 40
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 40
- 102100034981 Retroelement silencing factor 1 Human genes 0.000 description 36
- 241000234435 Lilium Species 0.000 description 35
- 241000699802 Cricetulus griseus Species 0.000 description 34
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 31
- 230000035772 mutation Effects 0.000 description 29
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 26
- 108010050848 glycylleucine Proteins 0.000 description 26
- 108010092854 aspartyllysine Proteins 0.000 description 25
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 24
- 108010009298 lysylglutamic acid Proteins 0.000 description 24
- 108010073969 valyllysine Proteins 0.000 description 24
- 108010003700 lysyl aspartic acid Proteins 0.000 description 23
- 108010022394 Threonine synthase Proteins 0.000 description 21
- 102000004419 dihydrofolate reductase Human genes 0.000 description 21
- 108010034529 leucyl-lysine Proteins 0.000 description 21
- 238000004519 manufacturing process Methods 0.000 description 20
- 108010065920 Insulin Lispro Proteins 0.000 description 19
- 108010005233 alanylglutamic acid Proteins 0.000 description 19
- 125000000539 amino acid group Chemical group 0.000 description 19
- 210000000349 chromosome Anatomy 0.000 description 19
- 108010051242 phenylalanylserine Proteins 0.000 description 19
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 18
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 17
- 108010068380 arginylarginine Proteins 0.000 description 17
- 230000003197 catalytic effect Effects 0.000 description 17
- 239000003550 marker Substances 0.000 description 17
- 150000007523 nucleic acids Chemical class 0.000 description 17
- 108010026333 seryl-proline Proteins 0.000 description 17
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 16
- 108010077245 asparaginyl-proline Proteins 0.000 description 16
- 210000004899 c-terminal region Anatomy 0.000 description 16
- 238000012217 deletion Methods 0.000 description 16
- 230000037430 deletion Effects 0.000 description 16
- 108010092114 histidylphenylalanine Proteins 0.000 description 16
- 108010057821 leucylproline Proteins 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 15
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 15
- 235000001014 amino acid Nutrition 0.000 description 15
- 108010018006 histidylserine Proteins 0.000 description 15
- 229960000485 methotrexate Drugs 0.000 description 15
- 239000002773 nucleotide Substances 0.000 description 15
- 125000003729 nucleotide group Chemical group 0.000 description 15
- 241000272186 Falco columbarius Species 0.000 description 14
- 241000699666 Mus <mouse, genus> Species 0.000 description 14
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 14
- 125000003275 alpha amino acid group Chemical group 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 14
- 108010047857 aspartylglycine Proteins 0.000 description 14
- 108010049041 glutamylalanine Proteins 0.000 description 14
- 108010004914 prolylarginine Proteins 0.000 description 14
- 241000894007 species Species 0.000 description 14
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 13
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 13
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 13
- 230000010354 integration Effects 0.000 description 13
- 108090000765 processed proteins & peptides Proteins 0.000 description 13
- 108010077112 prolyl-proline Proteins 0.000 description 13
- 108010071207 serylmethionine Proteins 0.000 description 13
- 210000002845 virion Anatomy 0.000 description 13
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 12
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 12
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 12
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 12
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 12
- 108010087924 alanylproline Proteins 0.000 description 12
- 108010081551 glycylphenylalanine Proteins 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 12
- 108010000761 leucylarginine Proteins 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 230000009467 reduction Effects 0.000 description 12
- 241000699800 Cricetinae Species 0.000 description 11
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 11
- 108010060199 cysteinylproline Proteins 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 11
- 108010037850 glycylvaline Proteins 0.000 description 11
- 108010031719 prolyl-serine Proteins 0.000 description 11
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 10
- 208000037088 Chromosome Breakage Diseases 0.000 description 10
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 10
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 10
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 10
- 108091005804 Peptidases Proteins 0.000 description 10
- 102000035195 Peptidases Human genes 0.000 description 10
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 10
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 10
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 10
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 10
- 108010062796 arginyllysine Proteins 0.000 description 10
- 230000009260 cross reactivity Effects 0.000 description 10
- 108010016616 cysteinylglycine Proteins 0.000 description 10
- 230000037433 frameshift Effects 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 230000001900 immune effect Effects 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 108010048818 seryl-histidine Proteins 0.000 description 10
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 10
- 241001529453 unidentified herpesvirus Species 0.000 description 10
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 9
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 9
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 9
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 9
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 9
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 9
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 9
- 101150088904 UL130 gene Proteins 0.000 description 9
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 9
- 108010013835 arginine glutamate Proteins 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 210000002919 epithelial cell Anatomy 0.000 description 9
- 108010064235 lysylglycine Proteins 0.000 description 9
- 108010017391 lysylvaline Proteins 0.000 description 9
- 108010012581 phenylalanylglutamate Proteins 0.000 description 9
- 108010070643 prolylglutamic acid Proteins 0.000 description 9
- 108010053725 prolylvaline Proteins 0.000 description 9
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 9
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 8
- 102000003964 Histone deacetylase Human genes 0.000 description 8
- 108090000353 Histone deacetylase Proteins 0.000 description 8
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 8
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 8
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 8
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 8
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 8
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 8
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 8
- 238000001261 affinity purification Methods 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 108010020532 tyrosyl-proline Proteins 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 7
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 7
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 7
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 7
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 7
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 7
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 7
- 108700024394 Exon Proteins 0.000 description 7
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 7
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 7
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 7
- 241000282412 Homo Species 0.000 description 7
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 7
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 7
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 7
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 7
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 7
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 7
- 241000699660 Mus musculus Species 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- 108010066427 N-valyltryptophan Proteins 0.000 description 7
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 7
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 7
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 7
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 7
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 7
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 7
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 7
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 7
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 7
- 238000004113 cell culture Methods 0.000 description 7
- 230000002950 deficient Effects 0.000 description 7
- 210000002889 endothelial cell Anatomy 0.000 description 7
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 108010085325 histidylproline Proteins 0.000 description 7
- 210000003734 kidney Anatomy 0.000 description 7
- 108010038320 lysylphenylalanine Proteins 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 108010079317 prolyl-tyrosine Proteins 0.000 description 7
- 108010090894 prolylleucine Proteins 0.000 description 7
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- 108020005345 3' Untranslated Regions Proteins 0.000 description 6
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 6
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 6
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 6
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 6
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 6
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 6
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 6
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 6
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 6
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 6
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 6
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 6
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 6
- 102100032581 Caprin-2 Human genes 0.000 description 6
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 6
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 6
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 6
- 102000003886 Glycoproteins Human genes 0.000 description 6
- 108090000288 Glycoproteins Proteins 0.000 description 6
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 6
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 6
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 6
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 6
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 6
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 6
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 6
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 6
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 6
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 6
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 6
- 108700029942 Megaloblastic Anemia due to Dihydrofolate Reductase Deficiency Proteins 0.000 description 6
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 6
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 6
- 101100059040 Mus musculus Caprin2 gene Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 6
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 6
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 6
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 6
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 6
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 6
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 6
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 6
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 6
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 6
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 6
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 6
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 6
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 6
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 6
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 6
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 6
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 6
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 6
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 6
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 6
- 208000015806 constitutional megaloblastic anemia with severe neurologic disease Diseases 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 210000002950 fibroblast Anatomy 0.000 description 6
- 230000030279 gene silencing Effects 0.000 description 6
- 102000005396 glutamine synthetase Human genes 0.000 description 6
- 108020002326 glutamine synthetase Proteins 0.000 description 6
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 230000002779 inactivation Effects 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 108010078580 tyrosylleucine Proteins 0.000 description 6
- 108010003137 tyrosyltyrosine Proteins 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 5
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 5
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 5
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 5
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 5
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 5
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 5
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 5
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 5
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 5
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 5
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 5
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 5
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 5
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 5
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 5
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 5
- QTKYFZCMSQLYHI-UBHSHLNASA-N Asn-Trp-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O QTKYFZCMSQLYHI-UBHSHLNASA-N 0.000 description 5
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 5
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 5
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 5
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 5
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 5
- 238000002965 ELISA Methods 0.000 description 5
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 5
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 5
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 5
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 5
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 5
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 5
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 5
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 5
- UVUIXIVPKVMONA-CIUDSAMLSA-N His-Cys-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CN=CN1 UVUIXIVPKVMONA-CIUDSAMLSA-N 0.000 description 5
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 5
- YIGCZZKZFMNSIU-RWMBFGLXSA-N His-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YIGCZZKZFMNSIU-RWMBFGLXSA-N 0.000 description 5
- BFOGZWSSGMLYKV-DCAQKATOSA-N His-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N BFOGZWSSGMLYKV-DCAQKATOSA-N 0.000 description 5
- JGFWUKYIQAEYAH-DCAQKATOSA-N His-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JGFWUKYIQAEYAH-DCAQKATOSA-N 0.000 description 5
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 5
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 5
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 5
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 5
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 5
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 5
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 5
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 5
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 5
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 5
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 5
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 5
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 5
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 5
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 5
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 5
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 5
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 5
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 5
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 5
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 5
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 5
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 5
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 5
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 5
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 5
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 108010079364 N-glycylalanine Proteins 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 5
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 5
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 5
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 5
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 5
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 5
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 5
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 5
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 5
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 5
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 5
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- 241000283984 Rodentia Species 0.000 description 5
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 5
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 5
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 5
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 5
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 5
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 5
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 5
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 5
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 5
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 5
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 5
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 5
- 108020004459 Small interfering RNA Proteins 0.000 description 5
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 5
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 5
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 5
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 5
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 5
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 5
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 5
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 5
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 5
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 5
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 5
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 5
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 5
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 5
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 5
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 5
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 5
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 5
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 5
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 5
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 5
- 108010047495 alanylglycine Proteins 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 230000008045 co-localization Effects 0.000 description 5
- 238000004132 cross linking Methods 0.000 description 5
- 108010004073 cysteinylcysteine Proteins 0.000 description 5
- 239000007850 fluorescent dye Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000001502 gel electrophoresis Methods 0.000 description 5
- 238000012226 gene silencing method Methods 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 239000003112 inhibitor Substances 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 108010068488 methionylphenylalanine Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000002035 prolonged effect Effects 0.000 description 5
- 230000017854 proteolysis Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 5
- 108010005652 splenotritin Proteins 0.000 description 5
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 108010009962 valyltyrosine Proteins 0.000 description 5
- 108010027345 wheylin-1 peptide Proteins 0.000 description 5
- FIXDIFPJOFIIEC-RITPCOANSA-N (3r)-3-hydroxy-n-[(3s)-2-oxooxolan-3-yl]butanamide Chemical compound C[C@@H](O)CC(=O)N[C@H]1CCOC1=O FIXDIFPJOFIIEC-RITPCOANSA-N 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 108010036211 5-HT-moduline Proteins 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 4
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 4
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 4
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 4
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 4
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 4
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 4
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 4
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 4
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 4
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 4
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 4
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 4
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 4
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 4
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 4
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 4
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 4
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 4
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 4
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 4
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 4
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 4
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 4
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 4
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 4
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 4
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 4
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 4
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 4
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 4
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 4
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 4
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 4
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 4
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 4
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 4
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 4
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 4
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 4
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 4
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 4
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 4
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 4
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 4
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 4
- 102000005720 Glutathione transferase Human genes 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 4
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 4
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 4
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 4
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 4
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 4
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 4
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 4
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 4
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 4
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 4
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 4
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 4
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 4
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 4
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 4
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- -1 Ipo8 Proteins 0.000 description 4
- 102100031607 Kunitz-type protease inhibitor 1 Human genes 0.000 description 4
- 101710165137 Kunitz-type protease inhibitor 1 Proteins 0.000 description 4
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 4
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 4
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 4
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 4
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 4
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 4
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 4
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 4
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 4
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 4
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 4
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 4
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 4
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 4
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 4
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 4
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 4
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 4
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 4
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 4
- 101100009280 Mus musculus Dennd5b gene Proteins 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 4
- 230000004988 N-glycosylation Effects 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 4
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 4
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 4
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 4
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 4
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 4
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 4
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 4
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 4
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 4
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 4
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 4
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 4
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 4
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 4
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 4
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 4
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 4
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 4
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 4
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 4
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 4
- LDEBVRIURYMKQS-WISUUJSJSA-N Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO LDEBVRIURYMKQS-WISUUJSJSA-N 0.000 description 4
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 4
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 4
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 4
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 4
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 4
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 4
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 4
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 4
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 4
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 4
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 4
- DNCUODYZAMHLCV-XGEHTFHBSA-N Thr-Pro-Cys Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N)O DNCUODYZAMHLCV-XGEHTFHBSA-N 0.000 description 4
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 4
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 4
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 4
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 4
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 4
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 4
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 4
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 4
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 4
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 4
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 4
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 4
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 4
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 4
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 4
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 4
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000010261 cell growth Effects 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 108010069495 cysteinyltyrosine Proteins 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 230000003511 endothelial effect Effects 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 4
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 4
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 4
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000028993 immune response Effects 0.000 description 4
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- SXTAYKAGBXMACB-UHFFFAOYSA-N methionine sulfoximine Chemical compound CS(=N)(=O)CCC(N)C(O)=O SXTAYKAGBXMACB-UHFFFAOYSA-N 0.000 description 4
- 230000003472 neutralizing effect Effects 0.000 description 4
- 210000001672 ovary Anatomy 0.000 description 4
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 4
- 235000019833 protease Nutrition 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 108010036387 trimethionine Proteins 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- ZXJZGWOMAFPSJH-DCAQKATOSA-N (2S)-1-[2-[[2-[[(2S)-2-[[(2S)-2-[(2-aminoacetyl)amino]-3-carboxypropanoyl]amino]-3-hydroxypropanoyl]amino]acetyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O ZXJZGWOMAFPSJH-DCAQKATOSA-N 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 3
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 3
- PJNSIUPOXFBHDM-GUBZILKMSA-N Ala-Arg-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O PJNSIUPOXFBHDM-GUBZILKMSA-N 0.000 description 3
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 3
- IXTPACPAXIOCRG-ACZMJKKPSA-N Ala-Glu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N IXTPACPAXIOCRG-ACZMJKKPSA-N 0.000 description 3
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 3
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 3
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 3
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 3
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 3
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 3
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 3
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 3
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 3
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 3
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 3
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 3
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 3
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 3
- JTWOBPNAVBESFW-FXQIFTODSA-N Arg-Cys-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N JTWOBPNAVBESFW-FXQIFTODSA-N 0.000 description 3
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 3
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 3
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 3
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 3
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 3
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 3
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 3
- JJIBHAOBNIFUEL-SRVKXCTJSA-N Arg-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)N JJIBHAOBNIFUEL-SRVKXCTJSA-N 0.000 description 3
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 3
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 3
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 3
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 3
- JBQORRNSZGTLCV-WDSOQIARSA-N Arg-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 JBQORRNSZGTLCV-WDSOQIARSA-N 0.000 description 3
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 3
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 3
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 3
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 3
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 3
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 3
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 3
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 3
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 3
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 3
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 3
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 3
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 3
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 3
- QXNGSPZMGFEZNO-QRTARXTBSA-N Asn-Val-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QXNGSPZMGFEZNO-QRTARXTBSA-N 0.000 description 3
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 3
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 3
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 3
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 3
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 3
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 3
- QQXOYLWJQUPXJU-WHFBIAKZSA-N Asp-Cys-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O QQXOYLWJQUPXJU-WHFBIAKZSA-N 0.000 description 3
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 3
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 3
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 3
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 3
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 3
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 3
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 3
- ZOLXQKZHYOHHMD-DLOVCJGASA-N Cys-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N ZOLXQKZHYOHHMD-DLOVCJGASA-N 0.000 description 3
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 3
- XGIAHEUULGOZHH-GUBZILKMSA-N Cys-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N XGIAHEUULGOZHH-GUBZILKMSA-N 0.000 description 3
- QDFBJJABJKOLTD-FXQIFTODSA-N Cys-Asn-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QDFBJJABJKOLTD-FXQIFTODSA-N 0.000 description 3
- VZKXOWRNJDEGLZ-WHFBIAKZSA-N Cys-Asp-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O VZKXOWRNJDEGLZ-WHFBIAKZSA-N 0.000 description 3
- ZJBWJHQDOIMVLM-WHFBIAKZSA-N Cys-Cys-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZJBWJHQDOIMVLM-WHFBIAKZSA-N 0.000 description 3
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 3
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 3
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 3
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 3
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 3
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 3
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 3
- ZLFRUAFDAIFNHN-LKXGYXEUSA-N Cys-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O ZLFRUAFDAIFNHN-LKXGYXEUSA-N 0.000 description 3
- IRKLTAKLAFUTLA-KATARQTJSA-N Cys-Thr-Lys Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCCCN)C(O)=O IRKLTAKLAFUTLA-KATARQTJSA-N 0.000 description 3
- 101150074155 DHFR gene Proteins 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 3
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 3
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 3
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 3
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 3
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 3
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 3
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 3
- WVWZIPOJECFDAG-AVGNSLFASA-N Glu-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N WVWZIPOJECFDAG-AVGNSLFASA-N 0.000 description 3
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 3
- GTFYQOVVVJASOA-ACZMJKKPSA-N Glu-Ser-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N GTFYQOVVVJASOA-ACZMJKKPSA-N 0.000 description 3
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 3
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 3
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 3
- OLTHVCNYJAALPL-BHYGNILZSA-N Glu-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OLTHVCNYJAALPL-BHYGNILZSA-N 0.000 description 3
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 3
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 3
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 3
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 3
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 3
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 3
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 3
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 3
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 3
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 3
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 3
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 3
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 3
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 3
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 3
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 3
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 3
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 3
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 3
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 3
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 3
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 3
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 3
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 3
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 3
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 3
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 3
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 3
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 3
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 3
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 3
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 3
- 102000006947 Histones Human genes 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 101000831567 Homo sapiens Toll-like receptor 2 Proteins 0.000 description 3
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 3
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 3
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 3
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 3
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 3
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 3
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 3
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 3
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 3
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 3
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 3
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 3
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 3
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 3
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 3
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 3
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 3
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 3
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 3
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 3
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 3
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 3
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 3
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 3
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 3
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 3
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 3
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 3
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 3
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 3
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 3
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 3
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 3
- YRWCPXOFBKTCFY-NUTKFTJISA-N Lys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N YRWCPXOFBKTCFY-NUTKFTJISA-N 0.000 description 3
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 3
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 3
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 3
- RDIILCRAWOSDOQ-CIUDSAMLSA-N Lys-Cys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RDIILCRAWOSDOQ-CIUDSAMLSA-N 0.000 description 3
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 3
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 3
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 3
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 3
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 3
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 3
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 3
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 3
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 3
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 3
- JCVOHUKUYSYBAD-DCAQKATOSA-N Lys-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CS)C(=O)O JCVOHUKUYSYBAD-DCAQKATOSA-N 0.000 description 3
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 3
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 3
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 3
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 3
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 3
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 3
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 3
- JUXONJROIXKHEV-GUBZILKMSA-N Met-Cys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCNC(N)=N JUXONJROIXKHEV-GUBZILKMSA-N 0.000 description 3
- YKWHHKDMBZBMLG-GUBZILKMSA-N Met-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N YKWHHKDMBZBMLG-GUBZILKMSA-N 0.000 description 3
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 3
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 3
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 3
- KKXGLCPUAWODHF-GUBZILKMSA-N Met-Met-Cys Chemical compound N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(O)=O KKXGLCPUAWODHF-GUBZILKMSA-N 0.000 description 3
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 3
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 3
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 3
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 3
- 108060004795 Methyltransferase Proteins 0.000 description 3
- 102000016397 Methyltransferase Human genes 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 3
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 3
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 3
- YZJKNDCEPDDIDA-BZSNNMDCSA-N Phe-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 YZJKNDCEPDDIDA-BZSNNMDCSA-N 0.000 description 3
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 3
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 3
- YDUGVDGFKNXFPL-IXOXFDKPSA-N Phe-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YDUGVDGFKNXFPL-IXOXFDKPSA-N 0.000 description 3
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 3
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 3
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 3
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 3
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 3
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 3
- NUZHSNLQJDYSRW-BZSNNMDCSA-N Pro-Arg-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NUZHSNLQJDYSRW-BZSNNMDCSA-N 0.000 description 3
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 3
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 3
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 3
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 3
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 3
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 3
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 3
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 3
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 3
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 3
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 3
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 3
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 3
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 3
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 3
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 3
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 3
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 3
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 3
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 3
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 3
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 3
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 3
- 241000700157 Rattus norvegicus Species 0.000 description 3
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 3
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 3
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 3
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 3
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 3
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 3
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 3
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 3
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 3
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 3
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 3
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 3
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 3
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 3
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 3
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 3
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 3
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 3
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 3
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 3
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 108010022999 Serine Proteases Proteins 0.000 description 3
- 102000012479 Serine Proteases Human genes 0.000 description 3
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 3
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 3
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 3
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 3
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 3
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 3
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 3
- CUTPSEKWUPZFLV-WISUUJSJSA-N Thr-Cys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(O)=O CUTPSEKWUPZFLV-WISUUJSJSA-N 0.000 description 3
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 3
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 3
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 3
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 3
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 3
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 3
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 3
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 3
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 3
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 3
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 3
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 3
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 3
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 3
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 3
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 3
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 3
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 3
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 3
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 3
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 3
- 102000006601 Thymidine Kinase Human genes 0.000 description 3
- 108020004440 Thymidine kinase Proteins 0.000 description 3
- 102100024333 Toll-like receptor 2 Human genes 0.000 description 3
- OZUJUVFWMHTWCZ-HOCLYGCPSA-N Trp-Gly-His Chemical compound N[C@@H](Cc1c[nH]c2ccccc12)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OZUJUVFWMHTWCZ-HOCLYGCPSA-N 0.000 description 3
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 3
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 3
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 3
- QUIXRGCMQOXUSV-SZMVWBNQSA-N Trp-Pro-Pro Chemical compound O=C([C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O QUIXRGCMQOXUSV-SZMVWBNQSA-N 0.000 description 3
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 3
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 3
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 3
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 3
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 3
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 3
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 3
- QRCBQDPRKMYTMB-IHPCNDPISA-N Tyr-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N QRCBQDPRKMYTMB-IHPCNDPISA-N 0.000 description 3
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 3
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 3
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 3
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 3
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 3
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 3
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 3
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 3
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 3
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 3
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 3
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 3
- CFIBZQOLUDURST-IHRRRGAJSA-N Val-Tyr-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N CFIBZQOLUDURST-IHRRRGAJSA-N 0.000 description 3
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 3
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 3
- 238000001994 activation Methods 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 239000000074 antisense oligonucleotide Substances 0.000 description 3
- 238000012230 antisense oligonucleotides Methods 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 239000006143 cell culture medium Substances 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 230000003833 cell viability Effects 0.000 description 3
- 238000011490 co-immunoprecipitation assay Methods 0.000 description 3
- 235000014510 cooky Nutrition 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 231100000221 frame shift mutation induction Toxicity 0.000 description 3
- 238000012224 gene deletion Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 201000000050 myeloid neoplasm Diseases 0.000 description 3
- 210000004897 n-terminal region Anatomy 0.000 description 3
- 230000035515 penetration Effects 0.000 description 3
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 3
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 238000012289 standard assay Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 108010087967 type I signal peptidase Proteins 0.000 description 3
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 2
- 102100028552 40S ribosomal protein S4, Y isoform 2 Human genes 0.000 description 2
- 101150045892 AMN1 gene Proteins 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 2
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 2
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 2
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 2
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 2
- XYKDZXKKYOOTGC-FXQIFTODSA-N Ala-Cys-Met Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)O)N XYKDZXKKYOOTGC-FXQIFTODSA-N 0.000 description 2
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- 108010076441 Ala-His-His Proteins 0.000 description 2
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 2
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 101100421779 Arabidopsis thaliana SNL3 gene Proteins 0.000 description 2
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 2
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 2
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- NAARDJBSSPUGCF-FXQIFTODSA-N Arg-Cys-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N NAARDJBSSPUGCF-FXQIFTODSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 2
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 2
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 2
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 2
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 2
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 2
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 2
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 2
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 2
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 2
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 2
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 2
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 2
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 2
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 2
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 2
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 2
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 2
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 2
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 2
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- MUWDILPCTSMUHI-ZLUOBGJFSA-N Asp-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O MUWDILPCTSMUHI-ZLUOBGJFSA-N 0.000 description 2
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 2
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 2
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- AAIUGNSRQDGCDC-ZLUOBGJFSA-N Asp-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O AAIUGNSRQDGCDC-ZLUOBGJFSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 2
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 2
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 2
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 2
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 2
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 2
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 2
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 2
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 2
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 2
- TULNGKSILXCZQT-IMJSIDKUSA-N Cys-Asp Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O TULNGKSILXCZQT-IMJSIDKUSA-N 0.000 description 2
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 2
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 2
- VNXXMHTZQGGDSG-CIUDSAMLSA-N Cys-His-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O VNXXMHTZQGGDSG-CIUDSAMLSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 2
- HSAWNMMTZCLTPY-DCAQKATOSA-N Cys-Met-Leu Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HSAWNMMTZCLTPY-DCAQKATOSA-N 0.000 description 2
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 2
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 2
- VCPHQVQGVSKDHY-FXQIFTODSA-N Cys-Ser-Met Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O VCPHQVQGVSKDHY-FXQIFTODSA-N 0.000 description 2
- FANFRJOFTYCNRG-JYBASQMISA-N Cys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N)O FANFRJOFTYCNRG-JYBASQMISA-N 0.000 description 2
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 2
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 2
- 206010011831 Cytomegalovirus infection Diseases 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 2
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 2
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 2
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 2
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 2
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 2
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 2
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 2
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 2
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 2
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 2
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 2
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 2
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 2
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 2
- YDJOULGWHQRPEV-SRVKXCTJSA-N Glu-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N YDJOULGWHQRPEV-SRVKXCTJSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 2
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 2
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 2
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 2
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 2
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- 108010024636 Glutathione Proteins 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 2
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 2
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 2
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 2
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 2
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 2
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 2
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 2
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 2
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- 241000700586 Herpesviridae Species 0.000 description 2
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 2
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 2
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 2
- BKOVCRUIXDIWFV-IXOXFDKPSA-N His-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 BKOVCRUIXDIWFV-IXOXFDKPSA-N 0.000 description 2
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 2
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 2
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 2
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 2
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 2
- CMPHFUWXKBPNRS-WDSOQIARSA-N His-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 CMPHFUWXKBPNRS-WDSOQIARSA-N 0.000 description 2
- 101000696127 Homo sapiens 40S ribosomal protein S4, Y isoform 2 Proteins 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 2
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 2
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- 108700002232 Immediate-Early Genes Proteins 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 2
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 2
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 2
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 2
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 2
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 2
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 2
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- QBGPXOGXCVKULO-BQBZGAKWSA-N Lys-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(O)=O QBGPXOGXCVKULO-BQBZGAKWSA-N 0.000 description 2
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 2
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 2
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 2
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- ZCWWVXAXWUAEPZ-SRVKXCTJSA-N Lys-Met-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZCWWVXAXWUAEPZ-SRVKXCTJSA-N 0.000 description 2
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- IVCPHARVJUYDPA-FXQIFTODSA-N Met-Asn-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IVCPHARVJUYDPA-FXQIFTODSA-N 0.000 description 2
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 2
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 2
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 2
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 2
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 2
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 2
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 2
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 2
- KZKVVWBOGDKHKE-QTKMDUPCSA-N Met-Thr-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 KZKVVWBOGDKHKE-QTKMDUPCSA-N 0.000 description 2
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 2
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 2
- MUDYEFAKNSTFAI-JYJNAYRXSA-N Met-Tyr-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O MUDYEFAKNSTFAI-JYJNAYRXSA-N 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 2
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 2
- PSBJZLMFFTULDX-IXOXFDKPSA-N Phe-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N)O PSBJZLMFFTULDX-IXOXFDKPSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 2
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- ILGCZYGFYQLSDZ-KKUMJFAQSA-N Phe-Ser-His Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ILGCZYGFYQLSDZ-KKUMJFAQSA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 2
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 2
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 2
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 2
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 2
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 2
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 2
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 2
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 2
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 2
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 2
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 2
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- QCARZLHECSFOGG-CIUDSAMLSA-N Pro-Glu-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O QCARZLHECSFOGG-CIUDSAMLSA-N 0.000 description 2
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 2
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 2
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 2
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 2
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 2
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 2
- SHTKRJHDMNSKRM-ULQDDVLXSA-N Pro-Tyr-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O SHTKRJHDMNSKRM-ULQDDVLXSA-N 0.000 description 2
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 101100042631 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SIN3 gene Proteins 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- CTLVSHXLRVEILB-UBHSHLNASA-N Ser-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N CTLVSHXLRVEILB-UBHSHLNASA-N 0.000 description 2
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- DBIDZNUXSLXVRG-FXQIFTODSA-N Ser-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N DBIDZNUXSLXVRG-FXQIFTODSA-N 0.000 description 2
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 2
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 2
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 2
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 2
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 2
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 2
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 2
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 2
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 2
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 2
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 2
- OHDXOXIZXSFCDN-RCWTZXSCSA-N Thr-Met-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OHDXOXIZXSFCDN-RCWTZXSCSA-N 0.000 description 2
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 2
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 2
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 2
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 2
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 2
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 2
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 2
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 2
- XKGZEDNYGPNJAR-XIRDDKMYSA-N Trp-Asn-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N XKGZEDNYGPNJAR-XIRDDKMYSA-N 0.000 description 2
- AZBIIKDSDLVJAK-VHWLVUOQSA-N Trp-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N AZBIIKDSDLVJAK-VHWLVUOQSA-N 0.000 description 2
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 2
- MYVYPSWUSKCCHG-JQWIXIFHSA-N Trp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 MYVYPSWUSKCCHG-JQWIXIFHSA-N 0.000 description 2
- CYLQUSBOSWCHTO-BPUTZDHNSA-N Trp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N CYLQUSBOSWCHTO-BPUTZDHNSA-N 0.000 description 2
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 2
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 2
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 2
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 2
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 2
- FGJWNBBFAUHBEP-IHPCNDPISA-N Tyr-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FGJWNBBFAUHBEP-IHPCNDPISA-N 0.000 description 2
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 2
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 2
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 2
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 2
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 2
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 2
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 2
- XYNFFTNEQDWZNY-ULQDDVLXSA-N Tyr-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N XYNFFTNEQDWZNY-ULQDDVLXSA-N 0.000 description 2
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 2
- VNYDHJARLHNEGA-RYUDHWBXSA-N Tyr-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 2
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 2
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 2
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- XKVXSCHXGJOQND-ZOBUZTSGSA-N Val-Asp-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XKVXSCHXGJOQND-ZOBUZTSGSA-N 0.000 description 2
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 2
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 2
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 2
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 2
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 2
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 2
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 2
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- STTYIMSDIYISRG-UHFFFAOYSA-N Valyl-Serine Chemical compound CC(C)C(N)C(=O)NC(CO)C(O)=O STTYIMSDIYISRG-UHFFFAOYSA-N 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000000749 co-immunoprecipitation Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 210000001723 extracellular space Anatomy 0.000 description 2
- 101150015940 gL gene Proteins 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 229960003180 glutathione Drugs 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 210000002288 golgi apparatus Anatomy 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 230000002028 premature Effects 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 210000003079 salivary gland Anatomy 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000004114 suspension culture Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 238000002255 vaccination Methods 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 1
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- DYJJJCHDHLEFDW-FXQIFTODSA-N Ala-Pro-Cys Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N DYJJJCHDHLEFDW-FXQIFTODSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- AETQNIIFKCMVHP-UVBJJODRSA-N Ala-Trp-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AETQNIIFKCMVHP-UVBJJODRSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- ANNKVZSFQJGVDY-XUXIUFHCSA-N Ala-Val-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ANNKVZSFQJGVDY-XUXIUFHCSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 229920000856 Amylose Polymers 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- HJWQFFYRVFEWRM-SRVKXCTJSA-N Arg-Arg-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O HJWQFFYRVFEWRM-SRVKXCTJSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 1
- OANWAFQRNQEDSY-DCAQKATOSA-N Arg-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N OANWAFQRNQEDSY-DCAQKATOSA-N 0.000 description 1
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- DTBPLQNKYCYUOM-JYJNAYRXSA-N Arg-Met-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DTBPLQNKYCYUOM-JYJNAYRXSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 1
- STHNZYKCJHWULY-AVGNSLFASA-N Arg-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O STHNZYKCJHWULY-AVGNSLFASA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- BXLDDWZOTGGNOJ-SZMVWBNQSA-N Arg-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N BXLDDWZOTGGNOJ-SZMVWBNQSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- BFDDUDQCPJWQRQ-IHRRRGAJSA-N Arg-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O BFDDUDQCPJWQRQ-IHRRRGAJSA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- KEZVOBAKAXHMOF-GUBZILKMSA-N Arg-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N KEZVOBAKAXHMOF-GUBZILKMSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- CGXQUULXFWRJOI-SRVKXCTJSA-N Arg-Val-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O CGXQUULXFWRJOI-SRVKXCTJSA-N 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- XXAOXVBAWLMTDR-ZLUOBGJFSA-N Asn-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N XXAOXVBAWLMTDR-ZLUOBGJFSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 1
- BSBNNPICFPXDNH-SRVKXCTJSA-N Asn-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BSBNNPICFPXDNH-SRVKXCTJSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- KVPHTGVUMJGMCX-BIIVOSGPSA-N Asp-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)C(=O)O KVPHTGVUMJGMCX-BIIVOSGPSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 1
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- AKKUDRZKFZWPBH-SRVKXCTJSA-N Asp-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N AKKUDRZKFZWPBH-SRVKXCTJSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- DWOSGXZMLQNDBN-FXQIFTODSA-N Asp-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CS)C(=O)O DWOSGXZMLQNDBN-FXQIFTODSA-N 0.000 description 1
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- FIRWLDUOFOULCA-XIRDDKMYSA-N Asp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N FIRWLDUOFOULCA-XIRDDKMYSA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- GZYDPEJSZYZWEF-MXAVVETBSA-N Asp-Val-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O GZYDPEJSZYZWEF-MXAVVETBSA-N 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 241000701021 Betaherpesvirinae Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101000782236 Bothrops leucurus Thrombin-like enzyme leucurobin Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- 108050006400 Cyclin Proteins 0.000 description 1
- 102000016736 Cyclin Human genes 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- PRVVCRZLTJNPCS-FXQIFTODSA-N Cys-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N PRVVCRZLTJNPCS-FXQIFTODSA-N 0.000 description 1
- CEZSLNCYQUFOSL-BQBZGAKWSA-N Cys-Arg-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O CEZSLNCYQUFOSL-BQBZGAKWSA-N 0.000 description 1
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 1
- NQSUTVRXXBGVDQ-LKXGYXEUSA-N Cys-Asn-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NQSUTVRXXBGVDQ-LKXGYXEUSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- UYYZZJXUVIZTMH-AVGNSLFASA-N Cys-Glu-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UYYZZJXUVIZTMH-AVGNSLFASA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 1
- WAJDEKCJRKGRPG-CIUDSAMLSA-N Cys-His-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N WAJDEKCJRKGRPG-CIUDSAMLSA-N 0.000 description 1
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 1
- DIHCYBRLTVEPBW-SRVKXCTJSA-N Cys-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N DIHCYBRLTVEPBW-SRVKXCTJSA-N 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- XZFYRXDAULDNFX-UWVGGRQHSA-N Cys-Phe Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UWVGGRQHSA-N 0.000 description 1
- BSGXXYRIDXUEOM-IHRRRGAJSA-N Cys-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N BSGXXYRIDXUEOM-IHRRRGAJSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 1
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 1
- HMWBPUDETPKSSS-DCAQKATOSA-N Cys-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCCN)C(=O)O HMWBPUDETPKSSS-DCAQKATOSA-N 0.000 description 1
- LKHMGNHQULEPFY-ACZMJKKPSA-N Cys-Ser-Glu Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O LKHMGNHQULEPFY-ACZMJKKPSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- JIVJQYNNAYFXDG-LKXGYXEUSA-N Cys-Thr-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JIVJQYNNAYFXDG-LKXGYXEUSA-N 0.000 description 1
- OELDIVRKHTYFNG-WDSKDSINSA-N Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CS OELDIVRKHTYFNG-WDSKDSINSA-N 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- GUBGYTABKSRVRQ-WFVLMXAXSA-N DEAE-cellulose Chemical compound OC1C(O)C(O)C(CO)O[C@H]1O[C@@H]1C(CO)OC(O)C(O)C1O GUBGYTABKSRVRQ-WFVLMXAXSA-N 0.000 description 1
- 229940021995 DNA vaccine Drugs 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 108091005515 EGF module-containing mucin-like hormone receptors Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 1
- 108010092526 GKPV peptide Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- PYUCNHJQQVSPGN-BQBZGAKWSA-N Gly-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)CN=C(N)N PYUCNHJQQVSPGN-BQBZGAKWSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- HHSOPSCKAZKQHQ-PEXQALLHSA-N Gly-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN HHSOPSCKAZKQHQ-PEXQALLHSA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 1
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- JSHOVJTVPXJFTE-HOCLYGCPSA-N His-Gly-Trp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JSHOVJTVPXJFTE-HOCLYGCPSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 1
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 1
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 1
- WPUAVVXYEJAWIV-KKUMJFAQSA-N His-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WPUAVVXYEJAWIV-KKUMJFAQSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- ULRFSEJGSHYLQI-YESZJQIVSA-N His-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ULRFSEJGSHYLQI-YESZJQIVSA-N 0.000 description 1
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 1
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- JUCZDDVZBMPKRT-IXOXFDKPSA-N His-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O JUCZDDVZBMPKRT-IXOXFDKPSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- HIJIJPFILYPTFR-ACRUOGEOSA-N His-Tyr-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HIJIJPFILYPTFR-ACRUOGEOSA-N 0.000 description 1
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 1
- 101000954986 Homo sapiens Merlin Proteins 0.000 description 1
- 101000763579 Homo sapiens Toll-like receptor 1 Proteins 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- 101100315698 Human cytomegalovirus (strain Merlin) UL131A gene Proteins 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- UWBDLNOCIDGPQE-GUBZILKMSA-N Ile-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN UWBDLNOCIDGPQE-GUBZILKMSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 101710165138 Kunitz-type protease inhibitor 2 Proteins 0.000 description 1
- 102100039020 Kunitz-type protease inhibitor 2 Human genes 0.000 description 1
- 101150062031 L gene Proteins 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 1
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- BCUVPZLLSRMPJL-XIRDDKMYSA-N Leu-Trp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N BCUVPZLLSRMPJL-XIRDDKMYSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- MSFITIBEMPWCBD-ULQDDVLXSA-N Leu-Val-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MSFITIBEMPWCBD-ULQDDVLXSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- JBRWKVANRYPCAF-XIRDDKMYSA-N Lys-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N JBRWKVANRYPCAF-XIRDDKMYSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 1
- NDSNUWJPZKTFAR-DCAQKATOSA-N Lys-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN NDSNUWJPZKTFAR-DCAQKATOSA-N 0.000 description 1
- KSFQPRLZAUXXPT-GARJFASQSA-N Lys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)C(=O)O KSFQPRLZAUXXPT-GARJFASQSA-N 0.000 description 1
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 1
- TYEJPFJNAHIKRT-DCAQKATOSA-N Lys-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N TYEJPFJNAHIKRT-DCAQKATOSA-N 0.000 description 1
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 1
- KVNLHIXLLZBAFQ-RWMBFGLXSA-N Lys-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N KVNLHIXLLZBAFQ-RWMBFGLXSA-N 0.000 description 1
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- MSSABBQOBUZFKZ-IHRRRGAJSA-N Lys-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O MSSABBQOBUZFKZ-IHRRRGAJSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 1
- DRINJBAHUGXNFC-DCAQKATOSA-N Met-Asp-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O DRINJBAHUGXNFC-DCAQKATOSA-N 0.000 description 1
- SDTSLIMYROCDNS-FXQIFTODSA-N Met-Cys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O SDTSLIMYROCDNS-FXQIFTODSA-N 0.000 description 1
- IZLCDZDNZFEDHB-DCAQKATOSA-N Met-Cys-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N IZLCDZDNZFEDHB-DCAQKATOSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- ULLIQRYQNMAAHC-RWMBFGLXSA-N Met-His-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N ULLIQRYQNMAAHC-RWMBFGLXSA-N 0.000 description 1
- SCKPOOMCTFEVTN-QTKMDUPCSA-N Met-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCSC)N)O SCKPOOMCTFEVTN-QTKMDUPCSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- WOGNGBROIHHFAO-JYJNAYRXSA-N Met-Tyr-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N WOGNGBROIHHFAO-JYJNAYRXSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 101710187427 Methyltransferase-like protein Proteins 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241000701029 Murid betaherpesvirus 1 Species 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010023243 NFI Transcription Factors Proteins 0.000 description 1
- 102000011178 NFI Transcription Factors Human genes 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- JVTMTFMMMHAPCR-UBHSHLNASA-N Phe-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JVTMTFMMMHAPCR-UBHSHLNASA-N 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- FSPGBMWPNMRWDB-AVGNSLFASA-N Phe-Cys-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FSPGBMWPNMRWDB-AVGNSLFASA-N 0.000 description 1
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- VHDNDCPMHQMXIR-IHRRRGAJSA-N Phe-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHDNDCPMHQMXIR-IHRRRGAJSA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- 108010076039 Polyproteins Proteins 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- UCXDHBORXLVBNC-ZLUOBGJFSA-N Ser-Asn-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O UCXDHBORXLVBNC-ZLUOBGJFSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 1
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- WTPKKLMBNBCCNL-ACZMJKKPSA-N Ser-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N WTPKKLMBNBCCNL-ACZMJKKPSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 1
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- WOJYIMBIKTWKJO-KKUMJFAQSA-N Ser-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N WOJYIMBIKTWKJO-KKUMJFAQSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- LSHUNRICNSEEAN-BPUTZDHNSA-N Ser-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N LSHUNRICNSEEAN-BPUTZDHNSA-N 0.000 description 1
- 229940122055 Serine protease inhibitor Drugs 0.000 description 1
- 101710102218 Serine protease inhibitor Proteins 0.000 description 1
- 241001522306 Serinus serinus Species 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 102000005161 Sin3 Histone Deacetylase and Corepressor Complex Human genes 0.000 description 1
- 108010056024 Sin3 Histone Deacetylase and Corepressor Complex Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241001441724 Tetraodontidae Species 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 1
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 1
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- LUMXICQAOKVQOB-YWIQKCBGSA-N Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O LUMXICQAOKVQOB-YWIQKCBGSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- 102100027010 Toll-like receptor 1 Human genes 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- OHGNSVACHBZKSS-KWQFWETISA-N Trp-Ala Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](C)C([O-])=O)=CNC2=C1 OHGNSVACHBZKSS-KWQFWETISA-N 0.000 description 1
- GHXXDFDIDHIEIL-WFBYXXMGSA-N Trp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GHXXDFDIDHIEIL-WFBYXXMGSA-N 0.000 description 1
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 1
- IQLVYVFBJUWZNT-BPUTZDHNSA-N Trp-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N IQLVYVFBJUWZNT-BPUTZDHNSA-N 0.000 description 1
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 1
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 1
- VDCGPCSLAJAKBB-XIRDDKMYSA-N Trp-Ser-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VDCGPCSLAJAKBB-XIRDDKMYSA-N 0.000 description 1
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 1
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 1
- DVLHKUWLNKDINO-PMVMPFDFSA-N Trp-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DVLHKUWLNKDINO-PMVMPFDFSA-N 0.000 description 1
- UOXPLPBMEPLZBW-WDSOQIARSA-N Trp-Val-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 UOXPLPBMEPLZBW-WDSOQIARSA-N 0.000 description 1
- 108091005956 Type II transmembrane proteins Proteins 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 1
- YLHFIMLKNPJRGY-BVSLBCMMSA-N Tyr-Arg-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YLHFIMLKNPJRGY-BVSLBCMMSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- ONWMQORSVZYVNH-UWVGGRQHSA-N Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UWVGGRQHSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- OSXNCKRGMSHWSQ-ACRUOGEOSA-N Tyr-His-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSXNCKRGMSHWSQ-ACRUOGEOSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- OFHKXNKJXURPSY-ULQDDVLXSA-N Tyr-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O OFHKXNKJXURPSY-ULQDDVLXSA-N 0.000 description 1
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 1
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 1
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 1
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 1
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 1
- 101150032047 UL131 gene Proteins 0.000 description 1
- 101150049363 UL131A gene Proteins 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 238000004115 adherent culture Methods 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 102000003801 alpha-2-Antiplasmin Human genes 0.000 description 1
- 108090000183 alpha-2-Antiplasmin Proteins 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 206010002022 amyloidosis Diseases 0.000 description 1
- 230000037037 animal physiology Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000004019 antithrombin Substances 0.000 description 1
- NOFOAYPPHIUXJR-APNQCZIXSA-N aphidicolin Chemical compound C1[C@@]23[C@@]4(C)CC[C@@H](O)[C@@](C)(CO)[C@@H]4CC[C@H]3C[C@H]1[C@](CO)(O)CC2 NOFOAYPPHIUXJR-APNQCZIXSA-N 0.000 description 1
- SEKZNWAQALMJNH-YZUCACDQSA-N aphidicolin Natural products C[C@]1(CO)CC[C@]23C[C@H]1C[C@@H]2CC[C@H]4[C@](C)(CO)[C@H](O)CC[C@]34C SEKZNWAQALMJNH-YZUCACDQSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 201000008873 bone osteosarcoma Diseases 0.000 description 1
- 201000008275 breast carcinoma Diseases 0.000 description 1
- 210000003123 bronchiole Anatomy 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 229920001429 chelating resin Polymers 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 101150040312 cho gene Proteins 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006196 deacetylation Effects 0.000 description 1
- 238000003381 deacetylation reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 238000002079 electron magnetic resonance spectroscopy Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 230000003241 endoproteolytic effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 210000000918 epididymis Anatomy 0.000 description 1
- 201000010063 epididymitis Diseases 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 101150055782 gH gene Proteins 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 230000000477 gelanolytic effect Effects 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000034756 hair follicle development Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 102000044162 human IGF1 Human genes 0.000 description 1
- 102000051039 human ST14 Human genes 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 230000037451 immune surveillance Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000012007 large scale cell culture Methods 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- DAZSWUUAFHBCGE-KRWDZBQOSA-N n-[(2s)-3-methyl-1-oxo-1-pyrrolidin-1-ylbutan-2-yl]-3-phenylpropanamide Chemical compound N([C@@H](C(C)C)C(=O)N1CCCC1)C(=O)CCC1=CC=CC=C1 DAZSWUUAFHBCGE-KRWDZBQOSA-N 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 230000017095 negative regulation of cell growth Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000004789 organ system Anatomy 0.000 description 1
- 201000008482 osteoarthritis Diseases 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000007420 reactivation Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 210000001625 seminal vesicle Anatomy 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000003001 serine protease inhibitor Substances 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 230000008591 skin barrier function Effects 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000008732 thymoma Diseases 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 201000010653 vesiculitis Diseases 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000008979 vitamin B4 Nutrition 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0681—Cells of the genital tract; Non-germinal cells from gonads
- C12N5/0682—Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
- C12N2510/02—Cells for production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16151—Methods of production or purification of viral material
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Virology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Cell Biology (AREA)
- Reproductive Health (AREA)
- General Engineering & Computer Science (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
Cette invention concerne des protéines du cytomégalovirus (CMV) appropriées pour des utilisations vaccinales. Sont fournies ici des cellules hôtes de mammifères, en particulier des cellules CHO, dans lesquelles la ou les séquences codant pour les protéines du CMV gH, gL, pUL128, pUL130, pUL131 (ou 5 l'un de leurs fragments formant un complexe) sont intégrées de façon stable dans le génome.
Description
CELLULES DE MAMMIFERES EXPRIMANT DES ANTIGENES DU
CYTOMEGALOVIRUS
Domaine de 1'invention [0001] Cette invention concerne des cellules hôtes exprimant des protéines du cytomégalovirus (CMV) appropriées pour des utilisations vaccinales.
Contexte de l'invention [0002] Le cytomégalovirus est un genre de virus qui appartient à la famille virale connue sous le nom de Herpèsviridés ou herpèsvirus. L'espèce qui infecte les êtres humains est couramment connue sous le nom de cytomégalovirus humain (HCMV) ou d'herpèsvirus-5 (HHV-5) humain. Parmi les Herpèsviridés, le HCMV appartient à la sous-famille des Bêta-herpesvirinés, qui comprend également les cytomégalovirus d'autres mammifères.
[0003] Bien qu'on puisse les trouver dans tout le corps, les infections à HCMV sont fréquemment associées aux glandes salivaires. Le hCMV infecte entre 50 % et 80 % des adultes aux Etats-Unis (40 % dans le monde), comme cela est indiqué par la présence d'anticorps chez une grande proportion de la population générale. Le HCMV passe généralement inaperçu chez les personnes en bonne santé, mais il peut menacer la vie des immunocompromis, comme les personnes infectées par le VIH, les receveurs de transplantation d'organe ou les nourrissons nouveau-nés. Le HCMV est le virus le plus fréquemment transmis aux fœtus en développement. Après une infection, le HCMV a la capacité de demeurer latent au sein du corps la vie durant de l'hôte, avec des réactivations occasionnelles depuis l'état latent. Etant donné la gravité et l'importance de cette maladie, l'obtention d'un vaccin efficace est considérée comme une priorité absolue pour la santé publique (Sung, H., et al., (2010) Expert review of vaccines 9, 1303-1314 ; Schleiss, Expert Opin Ther Pat. Apr 2010; 20(4): 597-602).
[0004] Les génomes de plus de 20 souches différentes du HCMV ont été séquencés, y compris ceux à la fois de souches de laboratoire et d'isolats. Par exemple, les souches suivantes du HCMV ont été séquencées : Towne (GL239909366), ADI 69 (GI: 219879600), Toledo (GL290564358 ) et Merlin (GI: 155573956). Les souches du HCMV AD169, Towne et Merlin peuvent être obtenues auprès de 1'American Type Culture Collection (ATCC VR538, ATCC VR977 et ATCC VR1590, respectivement).
[0005] Le CMV contient un nombre inconnu de complexes de protéines membranaires. Parmi les approximativement 30 glycoprotéines connues dans l'enveloppe virale, la gH et la gL sont apparues comme étant particulièrement intéressantes en raison de leur présence dans plusieurs complexes différents : le dimère gH/gL, le trimère gH/gL/gO (également connu comme le complexe gCIII), et le pentamère gH/gL/pUL128/pUL130/pUL131 (la pUL131 est également appelée « pUL131A », « pUL131a », ou « UL131A » ; les sous-unités pULl28, pULl30, et pUL131 sont parfois également appelées UL128, UL130, UL131). On pense que le CMV utilise les complexes pentamères pour pénétrer dans les cellules épithéliales et endothéliales par endocytose et fusion dépendante d'un pH bas mais on pense qu'il pénètre dans les fibroblastes par fusion directe à la membrane plasmatique dans un processus impliquant le complexe gH/gL ou éventuellement gH/gL/gO. Le (s) complexe(s) gH/gL et/ou gH/gL/gO est/sont suffisant(s) pour l'infection des fibroblastes, tandis que le complexe pentamère est requis pour infecter les cellules endothéliales et épithéliales.
[0006] Le complexe pentamère est considéré comme une cible majeure pour la vaccination contre le CMV. Les gènes viraux UL128, UL130 et UL131 sont nécessaires à la pénétration dans les cellules endothéliales (Hahn, Journal of Virology 2004; 78: 10023-33). Les souches à tropisme non endothélial adaptées aux fibroblastes contiennent des mutations dans au moins trois de ces gènes. La souche Towne, par exemple, contient une insertion de 2 paires de bases provoquant un décalage du cadre dans le gène UL130, tandis que AD169 contient une insertion de 1 paire de bases dans le gène UL131. A la fois Towne et AD169 ont pu être adaptées pour une croissance dans des cellules endothéliales, et dans les deux cas, les mutations de décalage du cadre dans les gènes UL130 ou UL131 ont été réparées.
[0007] Le brevet US 7 704 510 divulgue que la pUL131A est nécessaire pour un tropisme des cellules épithéliales. Le brevet US 7 704 510 divulgue également que la pUL128 et la pULl30 forment un complexe avec gH/gL, qui est incorporé dans les virions. Ce complexe est nécessaire pour infecter les cellules endothéliales et épithéliales mais pas les fibroblastes. Il a été découvert que des anticorps anti-CD46 inhibent l'infection par le HCMV des cellules épithéliales.
[0008] Des vaccins contre le CMV testés dans des essais cliniques comprennent le vaccin à base de Towne, des chimères Towne-Toledo, un réplicon d'alphavirus avec la gB comme antigène, un vaccin à base de gB/MF59, un vaccin à base de gB produit par GlaxoSmithKline, et un vaccin à base d'ADN utilisant la gB et la pp65. La pp65 est une protéine virale qui est un inducteur puissant des réponses CD8+ dirigées contre le CMV. Ces vaccins sont tous des inducteurs médiocres d'anticorps qui bloquent la pénétration du virus dans les cellules endothéliales/épithéliales (Adler, S. P. (2013), British Medical Bulletin, 107, 57-68. doi: 10.1093/bmb/ldt023) .
[0009] On pense de façon générale que des anticorps neutralisants dirigés contre le complexe pentamère (gH/gLpUL128/pUL130/pUL131) seront significativement plus puissants que des anticorps neutralisants dirigés contre la sous-unité gB, ou le complexe dimère gH/gL du CMV. Par conséquent, pour développer un vaccin efficace contre le CMV, il existe un besoin urgent de production de grandes quantités (par exemple, à des échelles commerciales) du complexe pentamère du CMV.
[0010] Toutefois, la production recombinante du complexe pentamère du CMV demeure un défi. Les cinq sous-unités doivent être exprimées (de préférence dans une quantité substantiellement égale, et de préférence pendant une période de temps prolongée), repliées correctement, et assemblées de façon correcte en un pentamère. En outre, il existe également un besoin d'éviter l'assemblage non souhaité de complexes contaminants (comme le dimère gH/gL, le tétramère gH/gL (deux copies de gH et deux copies de gL) , le tétramère gH/gLpUL128/pUL130, etc.).
[0011] L' expression recombinante d'un tel complexe de protéines eucaryotes nécessitera l'identification de constructions appropriées et d'hôtes appropriés, pour l'expression de quantités suffisantes de protéines repliées correctement pendant une période de temps prolongée, qui peuvent ensuite s'assembler correctement en complexes de protéines. En outre, la sélection d'un hôte d'expression approprié a un impact significatif sur le rendement et la qualité des protéines, ainsi que sur les coûts véritables du procédé de production. Résumé de l'invention [0012] Il est divulgué et exemplifié ici des cellules hôtes de mammifères, en particulier des cellules CHO, dans lesquelles la/les séquence(s) codant pour les protéines du CMV gH, gL, pUL128, pUL130, pUL131 (ou l'un de leurs fragments formant un complexe) est/sont intégrée (s) de façon stable dans le génome. De telles cellules hôtes fournissent une source fiable où le complexe pentamère gH/gL/pUL128/pUL130/pUL131 peut être produit de façon recombinante.
[0013] Dans un aspect, l'invention propose une cellule de mammifère recombinante, comme une cellule de rongeur (par exemple, une cellule CHO) comprenant une ou plusieurs séquences polynucléotidiques codant pour le complexe pentamère du cytomégalovirus (CMV), où ledit complexe pentamère comprend (i) la gH ou l'un de ses fragments formant un complexe, (ii) la gL ou l'un de ses fragments formant un complexe, (iii) la pUL128 ou l'un de ses fragments formant un complexe, (iv) la pUL130 ou l'un de ses fragments formant un complexe, et (v) la pUL131 ou l'un de ses fragments formant un complexe, où lesdites une ou plusieurs séquences polynucléotidiques sont intégrées dans l'ADN génomique de ladite cellule de mammifère. Parce que les séquences nucléotidiques sont intégrées de façon stable dans l'ADN génomique de la cellule, elles peuvent être transmises à la descendance comme faisant partie des séquences génomiques. De telles cellules sont souvent qualifiées dans l'art de lignées cellulaires stables. En particulier, la cellule ne comprend pas les séquences virales du CMV qui pourraient entraîner la production de virus CMV infectieux. Dans certains modes de réalisation, la cellule de mammifère est une cellule CHO. Lorsqu'elle est cultivée dans des conditions appropriées, ledit complexe pentamère du CMV est exprimé par ladite cellule hôte.
[0014] Les cellules CHO appropriées comprennent, par exemple, toutes les lignées cellulaires CHO disponibles à l'American Type Culture Collection (ATCC) ou à 1'European Collection of Cell Cultures (ECACC). Les exemples de lignées cellulaires CHO comprennent, par exemple, les cellules CHO-Kl, CH0-DUXB11, CHO-DG44, ou CHO-S. Pour faciliter la sélection des clones intégrés de façon stable, les cellules hôtes peuvent être déficientes pour la dihydrofolate réductase (DHFR). L'expression de protéines de recombinaison dans des lignées cellulaires déficientes pour la DHFR ou compétentes pour la DHFR peut être également criblée par une sélection au méthotrexate (MTX).
[0015] La cellule hôte peut comporter une ou plusieurs modifications supplémentaires pour encore amplifier la production du complexe pentamère du CMV. Dans certains modes de réalisation, le taux d'expression ou l'activité de la protéine C12orf35 est réduit dans la cellule hôte, comparativement à un témoin. Dans certains modes de réalisation, le taux d'expression ou l'activité de la protéine FAM60A est réduit dans la cellule hôte, comparativement à un témoin. Dans certains modes de réalisation, le taux d'expression ou l'activité de la matriptase est réduit dans la cellule hôte, comparativement à un témoin. Les modifications décrites ici peuvent être utilisées seules ou dans n'importe quelle combinaison.
[0016] Le complexe pentamère du CMV produit de façon recombinante peut être soluble (par exemple, auquel il manque le domaine transmembranaire de la gH) . Pour faciliter la production, le complexe pentamère du CMV produit de façon recombinante peut être sécrété à partir de la cellule hôte dans le milieu de culture.
[0017] Les cellules hôtes de mammifères décrites ici sont particulièrement appropriées pour une production à grande échelle, comme des cultures qui ont une taille d'au moins 20 litres (par exemple, 50 litres, 100 litres, etc.). Dans certains modes de réalisation, le rendement du complexe pentamère du CMV est d'au moins 0,05 g/1, ou d'au moins 0,1 g/1.
Brève description des figures [0018] La figure 1 illustre diverses stratégies de conception pour la coexpression des cinq composants du pentamère.
[0019] La figure 2 représente les cartes plasmidiques des vecteurs d'expression utilisés pour la transfection de cellules CHO.
[0020] La figure 3 représente l'analyse SDS-PAGE du pentamère purifié produit avec les 12 principaux clones.
[0021] La figure 4 illustre les conceptions expérimentales utilisées pour étudier la stabilité des 12 principaux clones.
[0022] La figure 5 représente le rendement du pentamère produit par le clone principal VF7.
Description détaillée de l'invention 1. Généralités [0023] L'une des cibles principales pour une vaccination contre le CMV est le complexe pentamère (gH/gL/pUL128/pUL130/pUL131). Pour produire un pentamère recombinant du CMV à une échelle commerciale, il existe le besoin d'identifier des constructions appropriées et des hôtes appropriés, de telle façon que les cinq sous-unités du pentamère peuvent être exprimées dans des quantités suffisantes pendant une période de temps prolongée, et peuvent s'assembler correctement en un complexe pentamère. Le pentamère du CMV est une cible primaire des anticorps neutralisants dirigés contre le CMV humain.
[0024] Le pentamère du CMV a été produit de façon recombinante en utilisant des cellules HEK293 en tant que cellules hôtes. Voir, le document WO 2014/005959. Toutefois, la lignée cellulaire HEK293 est généralement reconnue dans l'art comme l'une des meilleures lignées de cellules hôtes pour une expression transitoire de gènes. Voir, Meyer et al., PLoS One, 2013 Jul 17; 8 (7) : e68674 . doi: 10.1371/journal.pone.0068674 . Toutefois, il sera difficile de maintenir l’expression du pentamère pendant une période de temps prolongée dans des cellules HEK293 transfectées de façon transitoire. En outre, dans les exemples divulgués dans le document WO 2014/005959, les cinq sous-unités du pentamère ont été introduites dans des cellules HEK293 par l’intermédiaire de cinq plasmides différents. Dans cette configuration, il sera facile de maintenir l’expression de chaque sous-unité du pentamère à un taux substantiellement égal. Une quantité inégale des sous-unités peut réduire l’efficacité de l’assemblage du pentamère, d'autant plus que ces sous-unités ont déjà une tendance à former des complexes contaminants, comme le dimère gH/gL, le tétramère gH/gL (2 copies de gH et 2 copies de gL) , le tétramère gH/gLpUL128/pUL130. En outre, le plasmide codant pour la gH a été sélectionné par la néomycine, les quatre plasmides codant pour les gL, pUL128, pUL130, et pUL131, respectivement, ont tous été sélectionnés par la kanamycine. Par conséquent, parce que les quatre plasmides ont été sélectionnés par la kanamycine, la perte d’un seul plasmide dans une cellule hôte ne pourra pas être facilement détectée, mais la perte d’un seul plasmide empêchera l’assemblage du pentamère.
[0025] Comme cela est divulgué et exemplifié ici, les inventeurs ont surmonté les difficultés de la production recombinante du pentamère du CMV en utilisant des cellules d’ovaire de hamster de Chine (CHO) . Dans ces cellules CHO, les séquences codant pour les gH, gL, pUL128, pUL130, pUL131 (ou l’un de leurs fragments formant un complexe) sont intégrées de façon stable dans le génome des cellules CHO. En intégrant les séquences codant pour le pentamère dans le génome de la cellule CHO, les inventeurs ont obtenu une expression génomique stable du pentamère recombinant, avec une efficacité et une stabilité génomique élevées. Comme cela est exemplifié dans la section des exemples, il a été découvert que, comparativement aux cellules HEK293 transfectées de façon transitoire, les lignées CHO stables ont obtenu de façon régulière des rendements 100 fois supérieurs, rendant ces lignées cellulaires CHO particulièrement appropriées pour la production commerciale du pentamère du CMV. L'intégration stable permet également une manipulation aisée d'une culture cellulaire à grande échelle, comparativement aux cellules HEK transfectées de façon transitoire avec cinq plasmides exogènes. En fait, les clones principaux ont produit le pentamère avec un rendement aussi élevé que 0,1 g/1 à 0,5 g/1.
[0026] D'autres améliorations des cellules hôtes pour la production du pentamère du CMV sont également fournies ici. En particulier, trois cellules hôtes modifiées sont exemplifiées : (i) des cellules hôtes dans lesquelles le taux d'expression ou l'activité de la protéine C12orf35 est réduit, comparativement à un témoin ; (ii) des cellules hôtes dans lesquelles le taux d'expression ou l'activité de la protéine FAM60A est réduit, comparativement à un témoin ; (iii) des cellules hôtes dans lesquelles le taux d'expression ou l'activité de la matriptase est réduit comparativement à un témoin. Il a été découvert que la réduction du taux d'expression ou de l'activité de la protéine C12orf35 ou de la protéine FAM60A entraîne une augmentation significative du taux d'expression d'une protéine recombinante. Il a été également découvert que la réduction du taux d'expression ou de l'activité de la matriptase diminue significativement la dégradation protéolytique (« coupure ») d'une protéine recombinante. Ces modifications peuvent être utilisées seules ou dans n'importe quelle combinaison.
[0027] Par conséquent, il est proposé ici des cellules hôtes de mammifères, en particulier des cellules CHO, dans lesquelles la/les séquence(s) polynucléotidique (s) codant pour le complexe pentamère du CMV comprenant les gH, gL, pUL128, pUL130, pUL131 (ou l'un de leurs fragments formant un complexe) sont intégrées de façon stable dans 1'ADN génomique. Lorsqu'elles sont cultivées dans des conditions appropriées, ledit complexe pentamère du CMV est exprimé par lesdites cellules hôtes.
[0028] Il est également proposé ici un complexe pentamère du cytomégalovirus (CMV) produit par les cellules de mammifères décrites ici.
[0029] Il est également proposé ici un procédé de production du complexe pentamère du cytomégalovirus (CMV), dans lequel ledit complexe pentamère comprend : la gH ou l'un de ses fragments formant un complexe, la gL ou l'un de ses fragments formant un complexe, la pUL128 ou l'un de ses fragments formant un complexe, la pUL130 ou l'un de ses fragments formant un complexe, et la pUL131 ou l'un de ses fragments formant un complexe, comprenant : (i) la culture de la cellule de mammifère telle que décrite ici dans des conditions appropriées, exprimant de cette façon ledit complexe pentamère ; et la récolte dudit complexe pentamère à partir de la culture. Le complexe pentamère peut être en outre purifié. Il est également proposé ici un complexe pentamère du cytomégalovirus (CMV) produit par ce procédé.
[0030] Il est également proposé ici une composition comprenant le complexe pentamère décrit ici. La composition peut comprendre un complexe pentamère du CMV purifié qui est approprié pour une administration in vivo. Par exemple, le complexe pentamère dans une telle composition peut avoir une pureté d'au moins 85 %, d'au moins 86 %, d'au moins 87 %, d'au moins 88 %, d'au moins 89 %, d'au moins 90 %, d'au moins 91 %, d'au moins 92 %, d'au moins 93 %, d'au moins 94 %, d'au moins 95 %, d'au moins 96 %, d'au moins 97 %, d'au moins 98 %, ou d'au moins 99 %, en masse. La composition peut comprendre en outre un adjuvant, comme un sel d'aluminium, ou le MF59.
[0031] Il est également proposé ici une composition pour une utilisation dans l'induction d'une réponse immunitaire contre le CMV. L'utilisation de la composition décrite ici pour l'induction d'une réponse immunitaire contre le CMV et l'utilisation de la composition décrite ici dans la fabrication d'un médicament destiné à l'induction d'une réponse immunitaire contre le CMV sont également fournies.
2. Complexes pentamères du CMV et séquences codantes A. Complexes pentamères du CMV
[0032] Dans un aspect, l'invention propose une cellule hôte de mammifère qui exprime le complexe pentamère du CMV, où ledit complexe pentamère comprend (i) la gH ou l'un de ses fragments formant un complexe, (ii) la gL ou l'un de ses fragments formant un complexe, (iii) la pUL128 ou l'un de ses fragments formant un complexe, (iv) la pUL130 ou l'un de ses fragments formant un complexe, et (v) la pUL131 ou l'un de ses fragments formant un complexe. Les séquences polynucléotidiques codant pour le complexe pentamère du CMV sont intégrées dans 1'ADN génomique de la cellule hôte, et, lorsqu'elles sont cultivées dans des conditions appropriées, ledit complexe pentamère du CMV est exprimé par ladite cellule hôte.
[0033] Dans certains modes de réalisation, ledit complexe pentamère est soluble. Le complexe pentamère soluble peut être obtenu, par exemple, en utilisant un fragment de la gH dans lequel le domaine transmembranaire de la sous-unité gH est délété, comme cela est décrit en détail ci-dessous.
[0034] Dans certains modes de réalisation, ledit complexe pentamère est sécrété à partir de la cellule hôte. Il a été rapporté que la présence des cinq sous-unités, gH, gL, pUL128, pUL131, et pUL131, est suffisante pour l'assemblage du complexe pentamère dans le RE avant son exportation vers l'appareil de Golgi. Voir, Ryckman et al., J Virol. Jan 2008; 82(1): 60-70. En variante ou en outre, un peptide signal approprié peut être utilisé dans une ou plusieurs des cinq sous-unités (par exemple, en fabriquant une protéine de fusion avec un signal sécrétoire) . Les séquences signal (et la cassette d'expression) pour la production de protéine sécrétoire sont connues dans l'art. En général, les peptides de tête ont une longueur de 5 à 30 acides aminés, et ils sont généralement présents à l'extrémité N-terminale d'une protéine nouvellement synthétisée. Le cœur du peptide signal contient généralement une longue séquence d'acides aminés hydrophobes qui a tendance à former une seule hélice alpha. En outre, de nombreux peptides signal débutent par une séquence d'acides aminés chargés positivement, qui peut aider à l'application de la topologie correcte du polypeptide durant la translocation. A la fin du peptide signal, il y a généralement une séquence d'acides aminés qui est reconnue et clivée par une signal peptidase. La signal peptidase peut cliver soit durant soit après la complétion de la translocation pour produire un peptide signal libre et une protéine mature.
[0035] La glycoprotéine H (gH) du CMV humain, codée par le gène UL75, est une glycoprotéine de virion qui est essentielle à l'infectivité et qui est conservée parmi les membres des alpha-, bêta- et gamma-herpèsvirus. Elle peut former un complexe stable avec la gL, et la formation de ce complexe facilite l'expression à la surface cellulaire de la gH. En se basant sur les structures cristallines des complexes gH/gL du HSV-2 et de 1'EBV, la sous-unité gL et les résidus N-terminaux de la gH forment un domaine globulaire à une extrémité de la structure (la « tête ») , qui est impliqué dans les interactions avec la gB et l'activation de la fusion membranaire. Le domaine C-terminal de la gH, proximal à la membrane virale (la « queue »), est également impliqué dans la fusion membranaire. La gH affiche des déterminants qui sont reconnus par le facteur de l'hôte TLR2, et elle interagit directement avec un hétérodimère formé entre les facteurs de l'hôte TLR2 et TLR1. Le TLR2 médie l'activation du NF-κΒ et les réponses des cytokines inflammatoires à partir des cellules.
[0036] La gH provenant de la souche du CMV Merlin est représentée par SEQ ID NO : 1 (GI: 52139248, 742 résidus d'acides aminés). La gH provenant de la souche du CMV Towne est représentée par SEQ ID NO : 2 (GI:138314, également 742 résidus d'acides aminés) . La gH de Towne a été caractérisée comme comportant : (i) six sites de N-glycosylation (au niveau des résidus 55, 62, 67, 192, 641 et 700) ; (ii) une séquence signal hydrophobe à son extrémité N-terminale (résidus d'acides aminés 1 à 23) ; (iii) un ectodomaine (résidus 24 à 717) qui se projette hors de la cellule dans l'espace extracellulaire ; (iv) un domaine transmembranaire (TM) hydrophobe (résidus 718 à 736) ; et (v) un domaine cytoplasmique C-terminal (résidus 737 à 742). SEQ ID NO : 2 partage 99 % et 96 % d'identité de séquence d'acides aminés avec SEQ ID NO : 1, et la gH provenant de la souche du CMV AD169 (GI:138313, SEQ ID NO : 3) , respectivement.
[0037] Généralement, la séquence signal N-terminale de la protéine gH pleine longueur est clivée par une signal peptidase de la cellule hôte pour produire une protéine gH mature. En tant que telle, à la protéine gH exprimée par la cellule hôte décrite ici, il peut manquer la séquence signal N-terminale (par exemple, la gH est codée par une séquence nucléotidique à laquelle il manque la séquence codant pour la séquence signal N-terminale).
[0038] Sont également englobés dans l'invention, des fragments formant un complexe de la gH, comme un fragment de la gH auquel il manque le domaine transmembranaire (TM) (par exemple, les résidus 718 à 736 de SEQ ID NO : 2), le domaine C-terminal (par exemple, les résidus 737 à 742 de SEQ ID NO : 2), la séquence signal N-terminale (par exemple, les résidus 1 à 23 de SEQ ID NO : 2), ou l'une de leurs combinaisons. Un fragment formant un complexe de la gH peut être toute partie ou portion de la protéine gH qui conserve la capacité de former un complexe avec une autre protéine du CMV. Dans certains modes de réalisation, un fragment formant un complexe de la gH forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131. Par exemple, l'expression de la séquence de la gH pleine longueur peut gêner la purification du complexe pentamère soluble parce que le domaine TM de la gH est hydrophobe. A la place, le complexe pentamère peut comprendre un fragment de la gH avec au moins une portion du domaine TM de la gH délétée.
[0039] Par exemple, un fragment de la gH comprenant la séquence signal N-terminale et 1'ectodomaine de la gH, mais pas le domaine TM, peut être utilisé. Un fragment approprié de la gH peut également comprendre une portion de 1'ectodomaine de la gH (par exemple, au moins environ 70 %, au moins environ 80 %, au moins environ 85 %, au moins environ 90 %, au moins environ 95 %, au moins environ 96 %, au moins environ 97 %, au moins environ 98 %, ou au moins environ 99 % de la séquence de 1 ' ectodomaine de la gH) , mais aucune, ou seulement une petite portion du domaine TM. En variante, au fragment de la gH décrit ici, il peut manquer entre 1 et 20 résidus d'acides aminés (par exemple 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 résidus d'acides aminés, ou il manque 1 à 20 résidus, 1 à 15 résidus, 1 à 10 résidus, 2 à 20 résidus, 2 à 15 résidus, 2 à 10 résidus, 5 à 20 résidus, 5 à 15 résidus, ou 5 à 10 résidus) à l'extrémité N-terminale et/ou à l'extrémité C-terminale de 1'ectodomaine pleine longueur. On pense que les résidus au niveau des domaines C-terminaux ne sont pas nécessaires à l'immunogénicité. Un exemple de fragment approprié de la gH décrit ici est représenté par SEQ ID NO : 4, qui correspond aux résidus d'acides aminés 1 à 715 de SEQ ID NO : 1. Un autre exemple de fragment de la gH décrit ici est représenté par SEQ ID NO : 5, auquel il manque la séquence signal N-terminale, le domaine TM et le domaine C-terminal de la gH, et correspond aux résidus d'acides aminés 24 à 715 de SEQ ID NO : 1. Un autre exemple de fragment de la gH décrit comprend la séquence signal N-terminale entière et 1'ectodomaine, mais auquel il manque le domaine C-terminal.
[0040] L'ectodomaine de la gH correspond au domaine extracellulaire de la gH. La localisation et la longueur de 1 ' ectodomaine d'une gH (ou de l'un de ses homologues ou de ses variants) peuvent être prédites en se basant sur un alignement par paires de sa séquence avec les SEQ ID NO : 1, 2, 3, 4, ou 5, par exemple en alignant la séquence d'acides aminés d'une gH avec SEQ ID NO : 1, et en identifiant la séquence qui s'aligne avec les résidus 24 à 717 de SEQ ID NO : 1. De façon similaire, les localisations de la séquence signal, du domaine TM, et du domaine C-terminal peuvent être prédites en alignant la séquence d'acides aminés d'une gH avec les SEQ ID NO : 1, 2, 3, 4, ou 5, et en identifiant les séquences qui s'alignent avec les régions correspondantes (par exemple, les résidus 1 à 23 (séquence signal), 718 à 736 (TM) et 737 à 742 (domaine C-terminal) de SEQ ID NO : 1, respectivement). En variante, la localisation et la longueur de 1'ectodomaine, de la séquence signal, du domaine TM, et du domaine C-terminal peuvent être prédites en se basant sur une analyse informatique de l'hydrophobicité tout le long d'une séquence de gH donnée. La séquence signal et le domaine TM présentent les taux les plus élevés d'hydrophobicité et ces deux régions flanquent 1'ectodomaine, qui est moins hydrophobe.
[0041] Un fragment formant un complexe approprié de la gH peut être également obtenu ou déterminé par des tests classiques connus dans l'art, comme un test de coimmunoprécipitation, la réticulation, ou la co-localisation par coloration fluorescente, etc. Une SDS-PAGE ou une analyse Western blot peut être également utilisée (par exemple, en montrant que les cinq sous-unités sont présentes dans une électrophorèse sur gel). Dans certains modes de réalisation, le fragment formant un complexe de la gH (i) forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; (ii) comprend au moins un épitope provenant de SEQ ID NO : 1, SEQ ID NO : 2, SEQ ID NO : 3, SEQ ID NO : 4, ou SEQ ID NO : 5 ; et/ou (iii) peut déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0042] D'autres protéines gH appropriées peuvent être des variants de la gH qui présentent divers degrés d'identité avec SEQ ID NO : 1, 2, 3, 4, ou 5, comme au moins identiques à 60 %, 70 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % avec la séquence citée dans SEQ ID NO : 1, SEQ ID NO : 2, SEQ ID NO : 3, SEQ ID NO : 4, ou SEQ ID NO : 5. Dans certains modes de réalisation, les protéines variantes de la gH : (i) forment une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; (ii) comprennent au moins un épitope provenant de SEQ ID NO : 1, SEQ ID NO : 2, SEQ ID NO : 3, SEQ ID NO : 4, ou SEQ ID NO : 5 ; et/ou (iii) peuvent déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0043] La glycoprotéine L (gL) du CMV humain est codée par le gène UL115. On pense que la gL est essentielle à la réplication virale et toutes les propriétés fonctionnelles connues de la gL sont directement associées à sa dimérisation avec la gH. Le complexe gL/gH est nécessaire pour la fusion des membranes virale et plasmatique menant à la pénétration du virus dans les cellules hôtes. Il a été rapporté que la gL provenant de la souche du CMV Merlin (GI: 39842115, SEQ ID NO : 6) et de la souche du CMV Towne (GI: 239909463, SEQ ID NO : 7) a une longueur de 278 acides aminés. Il a été rapporté que la gL provenant de la souche du HCMV AD169 (GI: 2506510, SEQ ID NO : 8) a une longueur de 278 acides aminés, avec une séquence signal à son extrémité N-terminale (résidus d'acides aminés 1 à 35), deux sites de N-glycosylation (au niveau des résidus 74 et 114), et à laquelle il manque un domaine TM. La séquence signal N-terminale dans SEQ ID NO : 6 est prédite pour comprendre les résidus d'acides aminés 1 à 30. SEQ ID NO : 7 partage 98 % d'identité de séquence d'acides aminés avec SEQ ID NO : 6. Le séquençage du gène de la gL pleine longueur provenant de 22 à 39 isolats cliniques, ainsi que de souches de laboratoire AD169, Towne et Toledo a révélé moins de 2 % de variation dans les séquences d'acides aminés parmi les isolats.
[0044] Généralement, la séquence signal N-terminale de la protéine gL pleine longueur est clivée par un signal peptidase de la cellule hôte pour produire une protéine gL mature. En tant que telle, à la protéine gL exprimée par la cellule hôte décrite ici, il peut manquer la séquence signal N-terminale (par exemple, la gL est codée par une séquence nucléotidique à laquelle il manque la séquence codant pour la séquence signal N-terminale). Un exemple d'une gL à laquelle il manque la séquence signal est SEQ ID NO : 9, qui comprend les résidus d'acides aminés 31 à 278 de SEQ ID NO : 6, et à laquelle il manque une séquence signal N-terminale de SEQ ID NO : 6. La séquence signal d'autres protéines gL peut être déterminée par alignement des séquences ou des outils d'analyse des séquences tels que décrits ci-dessus.
[0045] Sont également englobés dans l'invention des fragments formant un complexe de la gL. Un fragment formant un complexe de la gL peut être toute partie ou portion de la protéine gL qui conserve la capacité de former un complexe avec une autre protéine du CMV. Dans certains modes de réalisation, un fragment formant un complexe de la gL forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131.
[0046] Un fragment formant un complexe approprié de la gL peut être obtenu ou déterminé par des tests classiques connus dans l'art, comme un test de co-immunoprécipitation, la réticulation, ou la co-localisation par coloration fluorescente, etc. Une SDS-PAGE ou une analyse Western blot peut être également utilisée (par exemple, en montrant que les cinq sous-unités sont présentes dans une électrophorèse sur gel) . Dans certains modes de réalisation, le fragment formant un complexe de la gL (i) forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; (ii) comprend au moins un épitope provenant de SEQ ID NO : 6, SEQ ID NO : 7, SEQ ID NO : 8, ou SEQ ID NO : 9 ; et/ou (iii) peut déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0047] D'autres protéines gL appropriées peuvent être des variants de la gL (et des fragments de variants) qui présentent divers degrés d'identité avec SEQ ID NO : 6, 7, 8, ou 9, comme au moins identiques à 60 %, 70 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % avec la séquence citée par SEQ ID NO : 6, SEQ ID NO : 7, SEQ ID NO : 8, ou SEQ ID NO : 9. Dans certains modes de réalisation, les protéines variantes de la gL : (i) forment une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; (ii) comprennent au moins un épitope provenant de SEQ ID NO : 6, SEQ ID NO : 7, SEQ ID NO : 8, ou SEQ ID NO : 9 ; et/ou (iii) peuvent déclencher des anticorps in vivo présentent une réactivité croisée immunologique avec un virion du CMV.
[0048] Il a été rapporté que la pUL128 provenant de la souche du CMV humain Merlin (GI: 39842124, SEQ ID NO : 10) comporte 130 résidus d'acides aminés, et avec 1 substitution de nucléotide provoquant une terminaison prématurée. Il a été rapporté que la pUL128 provenant des souches du CMV humain Towne (GI: 39841882, SEQ ID NO : 11) et AD169 (GI: 59803078, SEQ ID NO : 12) comporte 171 résidus d'acides aminés. SEQ ID NO : 10 et 12 partagent plus de 99 % d'identité de séquence sur la pleine longueur de SEQ ID NO : 10 ; toutefois, à cause de la terminaison prématurée de la traduction, SEQ ID NO : 10 ne comporte pas les 41 résidus d'acides aminés C-terminaux de SEQ ID NO : 12 (environ 75 % d'identité de séquence sur la pleine longueur de SEQ ID NO : 12).
[0049] Il est prédit que la pULl28 comporte une séquence signal N-terminale, qui est localisée au niveau des résidus 1 à 27 de SEQ ID NO : 10, mais il est prédit qu'il lui manque un domaine TM. La séquence signal N-terminale de la protéine pULl28 pleine longueur peut être clivée par une signal peptidase de la cellule hôte pour produire une protéine pUL128 mature. En tant que telle, à la protéine pUL128 exprimée par la cellule hôte décrite ici, il peut manquer la séquence signal N-terminale (par exemple, la pUL128 est codée par une séquence nucléotidique à laquelle il manque la séquence codant pour la séquence signal N-terminale). Un exemple d'une protéine pULl28 mature est SEQ ID NO : 13, à laquelle il manque une séquence signal N-terminale et qui correspond aux résidus d'acides aminés 28 à 171 de SEQ ID NO : 11. SEQ ID NO : 13 correspond également aux acides aminés 28 à 171 de SEQ ID NO : 12.
[0050] Sont également englobés dans l'invention des fragments formant un complexe de la pUL128. Un fragment formant un complexe de la pUL128 peut être toute partie ou portion de la protéine pUL128 qui conserve la capacité de former un complexe avec une autre protéine du CMV. Dans certains modes de réalisation, un fragment formant un complexe de la pUL128 forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131.
[0051] Un fragment formant un complexe approprié de la pUL128 peut être obtenu ou déterminé par des tests classiques connus dans l'art, comme un test de co-immunoprécipitation, la réticulation, ou la co-localisation par coloration fluorescente, etc. Une SDS-PAGE ou une analyse Western blot peut être également utilisée (par exemple, en montrant que les cinq sous-unités sont présentes dans une électrophorèse sur gel) . Dans certains modes de réalisation, le fragment formant un complexe de la pUL128 (i) forme une partie du complexe pentamère gH/gL/pUL128/pULl30/pUL131 ; (ii) comprend au moins un épitope provenant de SEQ ID NO : 10, SEQ ID NO : 11, SEQ ID NO : 12, ou SEQ ID NO : 13 ; et/ou (iii) peut déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0052] D'autres protéines pUL128 appropriées peuvent être des variants de la pUL128 (et des fragments de variants) qui présentent divers degrés d'identité avec SEQ ID NO : 10, 11, 12, ou 13, comme au moins identiques à 60 %, 70 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % avec la séquence citée par SEQ ID NO : 10, SEQ ID NO : 11, SEQ ID NO : 12, ou SEQ ID NO : 13. Dans certains modes de réalisation, les protéines variantes de la pUL128 : (i) forment une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; (ii) comprennent au moins un épitope provenant de SEQ ID NO : 10, SEQ ID NO : 11, SEQ ID NO : 12, ou SEQ ID NO : 13 ; et/ou (iii) peuvent déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0053] UL130 est le gène central et le plus grand (214 codons) du locus UL131A-128. La traduction conceptuelle du gène prédit une longue séquence signal N-terminale (25 acides aminés) qui précède une protéine hydrophile, avec deux sites potentiels de N-glycosylation (Asn85 et Asnll8) au sein d'un domaine de chimiokine putatif (acides aminés 46 à 120), et un site supplémentaire de N-glycosylation (Asn201) proche de l'extrémité d'une région C-terminale unique. Il est prédit qu'à la pUL130 il manque un domaine TM. Il a été rapporté qu'il s'agit d'une glycoprotéine luminale qui est sécrétée de façon inefficace à partir de cellules infectées mais qui est incorporée dans l'enveloppe du virion sous une forme mature après passage dans l'appareil de Golgi. Les séquences de la pUL130 provenant des souches du CMV humain Merlin et Towne sont disponibles au public (GI: 39842125, SEQ ID NO : 14, 214 résidus d'acides aminés ; et GI : 239909473, SEQ ID NO : 15, 229 résidus d'acides aminés, respectivement) . Il a été rapporté que SEQ ID NO : 15 contient une mutation de décalage du cadre dans la région C-terminale de la pUL130, et elle partage 94 % d'identité avec la SEQ ID NO : 14 du HCMV sur la pleine longueur de SEQ ID NO : 14.
[0054] La séquence signal N-terminale de la protéine pUL130 pleine longueur peut être clivée par une signal peptidase de la cellule hôte pour produire une protéine pUL130 mature. En tant que telle, à la protéine pUL130 exprimée par la cellule hôte décrite ici, il peut manquer la séquence signal N-terminale (par exemple, la pUL130 est codée par une séquence nucléotidique à laquelle il manque la séquence codant pour la séquence signal N-terminale). Un exemple d'une protéine pULl30 mature est SEQ ID NO : 16, à laquelle il manque une séquence signal N-terminale, et qui correspond aux résidus d'acides aminés 26 à 214 de SEQ ID NO : 14.
[0055] Sont également englobés dans l'invention des fragments formant un complexe de la pUL130. Un fragment formant un complexe de la pUL130 peut être toute partie ou portion de la protéine pUL130 qui conserve la capacité de former un complexe avec une autre protéine du CMV. Dans certains modes de réalisation, un fragment formant un complexe de la pUL130 forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131.
[0056] Un fragment formant un complexe approprié de la pUL30 peut être obtenu ou déterminé par des tests classiques connus dans l'art, comme un test de co-immunoprécipitation, la réticulation, ou la co-localisation par coloration fluorescente, etc. Une SDS-PAGE ou une analyse Western blot peut être également utilisée (par exemple, en montrant que les cinq sous-unités sont présentes dans une électrophorèse sur gel) . Dans certains modes de réalisation, le fragment formant un complexe de la pUL130 (i) forme une partie du complexe pentamère gH/gL/pULl28/pUL130/pUL131 ; (ii) comprend au moins un épitope provenant de SEQ ID NO : 14, SEQ ID NO : 15, ou SEQ ID NO : 16 ; et/ou (iii) peut déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0057] D'autres protéines pUL130 appropriées peuvent être des variants de la pUL130 (et des fragments de variants) qui présentent divers degrés d'identité avec SEQ ID NO : 14, 15, ou 16, comme au moins identiques à 60 %, 70 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % avec la séquence citée dans SEQ ID NO : 14, SEQ ID NO : 15, ou SEQ ID NO : 16. Dans certains modes de réalisation, les protéines variantes de la pUL130 : (i) forment une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; (ii) comprennent au moins un épitope provenant de SEQ ID NO : 14, SEQ ID NO : 15, ou SEQ ID NO : 16 ; et/ou (iii) peuvent déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0058] La fonction de la pUL131A est requise pour la réplication du CMV humain non seulement dans les cellules endothéliales mais également dans les cellules épithéliales. Il a été rapporté la pUL131A provenant des souches du CMV humain Merlin (GI: 39842126, SEQ ID NO : 17, 129 acides aminés) et Towne (GI: 239909474, SEQ ID NO : 18, 129 acides aminés) et AD169 (GI: 219879712, SEQ ID NO : 19, 76 acides aminés). Il est prédit que la PUL131A contienne une séquence signal N-terminale, qui est localisée au niveau des résidus 1 à 18 de SEQ ID NO : 18, et à laquelle il manque un domaine TM. Il a été rapporté que la pUL131A provenant de la souche AD169 contient une insertion de 1 paire de bases, qui provoque un décalage du cadre. SEQ ID NO : 17 est identique à 96 % avec SEQ ID NO : 19 sur les 28 acides aminés N-terminaux, mais elle est seulement identique à 36 % avec SEQ ID NO : 19 sur la pleine longueur de SEQ ID NO : 17, à cause du décalage du cadre dans le gène UL131A de AD169.
[0059] La séquence signal N-terminale de la protéine pUL131 pleine longueur peut être clivée par une signal peptidase de la cellule hôte pour produire une protéine pUL131 mature. En tant que telle, à la protéine pUL131 exprimée par la cellule hôte décrite ici il peut manquer la séquence signal N-terminale (par exemple, la pUL131 est codée par une séquence nucléotidique à laquelle il manque la séquence codant pour la séquence signal N-terminale) . Un exemple de protéine pUL130 mature est SEQ ID NO : 20, à laquelle il manque une séquence signal N-terminale et qui correspond aux résidus d'acides aminés 19 à 129 de SEQ ID NO : 17. SEQ ID NO : 35 correspond également aux résidus d'acides aminés 19 à 129 de SEQ ID NO : 18.
[0060] Sont également englobés dans l'invention des fragments formant un complexe de la pUL131. Un fragment formant un complexe de la pUL131 peut être toute partie ou portion de la protéine pUL131 qui conserve la capacité de former un complexe avec une autre protéine du CMV. Dans certains modes de réalisation, un fragment formant un complexe de la pUL131 forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131.
[0061] Un fragment formant un complexe approprié de la pUL31 peut être obtenu ou déterminé par des tests classiques connus dans l'art, comme un test de co-immunoprécipitation, la réticulation, ou la co-localisation par coloration fluorescente, etc. Une SDS-PAGE ou une analyse Western blot peut être également utilisée (par exemple, en montrant que les cinq sous-unités sont présentes dans une électrophorèse sur gel) . Dans certains modes de réalisation, le fragment formant un complexe de la pUL131 (i) forme une partie du complexe pentamère gH/gL/pULl28/pUL130/pUL131 ; (ii) comprend au moins un épitope provenant de SEQ ID NO : 17, SEQ ID NO : 18, SEQ ID NO : 19, ou SEQ ID NO : 20 ; et/ou (iii) peut déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0062] D'autres protéines pUL131 appropriées peuvent être des variants de la pUL131 (et des fragments de variants) qui présentent divers degrés d'identité avec SEQ ID NO : 17, 18, 19, ou 20, comme au moins identiques à 60 %, 70 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % avec la séquence citée dans SEQ ID NO : 17, SEQ ID NO : 18, SEQ ID NO : 19, ou SEQ ID NO : 20. Dans certains modes de réalisation, les protéines variantes de la pUL131 : (i) forment une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; (ii) comprennent au moins un épitope provenant de SEQ ID NO : 17, SEQ ID NO : 18, SEQ ID NO : 19, ou SEQ ID NO : 20 ; et/ou (iii) peuvent déclencher des anticorps in vivo qui présentent une réactivité croisée immunologique avec un virion du CMV.
[0063] Dans certains modes de réalisation, les gH, gL, pUL128, pUL130, pUL131 (ou l'un de leurs fragments) décrites ici peuvent contenir des résidus d'acides aminés supplémentaires, comme des extensions N-terminales ou C-terminales. De telles extensions peuvent comprendre un ou plusieurs marqueurs, qui peuvent faciliter la détection (par exemple, un marqueur épitopique pour la détection par des anticorps monoclonaux) et/ou la purification (par exemple, un marqueur polyhistidine pour permettre la purification sur une résine chélatrice de nickel) des protéines. Les exemples de marqueurs pour la purification par affinité comprennent, par exemple, le marqueur His (hexahistidine (SEQ ID NO : 36), se lie aux ions métalliques), la protéine de liaison du maltose (MBP) (se lie à l'amylose), la glutathion-S-transférase (GST) (se lie au glutathion), le marqueur FLAG (Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys (SEQ ID NO : 37), se lie à un anticorps anti-flag), le marqueur Strep (Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly (SEQ ID NO : 38), ou Trp-Ser- His-Pro-Gln-Phe-Glu-Lys (SEQ ID NO : 39), se lient à la streptavidine ou l'un de ses dérivés).
[0064] Dans un certain mode de réalisation, des lieurs clivables peuvent être utilisés. Ceci permet de séparer le marqueur du complexe purifié, par exemple par l'addition d'un agent capable de cliver le lieur. Un certain nombre de lieurs clivables différents sont connus de l'homme du métier. De tels lieurs peuvent être clivés, par exemple, par irradiation d'une liaison photolabile ou hydrolyse catalysée par un acide. Il existe également des lieurs polypeptidiques qui incorporent un site de reconnaissance de protéase et qui peuvent être clivés par l'addition d'une enzyme protéase appropriée.
[0065] Dans d'autres modes de réalisation, il peut être souhaitable d’avoir les protéines gH, gL, pULl28, pUL130, pULl31 (ou l’un de leurs fragments) qui ne comprennent pas de séquence marqueur exogène, par exemple, pour des raisons de sécurité clinique ou d’efficacité.
[0066] Bien qu’il soit parfois fait référence aux protéines gH, gL, pUL130 comme à des glycoprotéines, cette nomenclature ne devra pas être prise comme signifiant que ces protéines doivent être glycosylées lorsqu'elles sont utilisées avec l’invention. Alors qu'il a été fait référence ci-dessus à des souches spécifiques, il faudra comprendre que les protéines du CMV gH, gL, pUL128, pUL130, pUL131 (ou leurs fragments) de souches différentes du CMV peuvent être utilisées. A titre d’exemple non limitatif, les autres souches du CMV peuvent comprendre les souches Towne, Toledo, AD169, Merlin, TB20, et VR1814.
B. Acide nucléique codant pour les protéines et les complexes du CMV
[0067] Sont également proposés ici des acides nucléiques codant pour les protéines et les complexes du CMV pour une intégration génomique, et l’expression subséquente du pentamère du CMV.
[0068] Une ou plusieurs constructions d’acide nucléique codant pour les protéines et les complexes du CMV décrits ici peuvent être utilisées pour une intégration génomique. Par exemple, une seule construction d’acide nucléique codant pour les cinq sous-unités, gH, gL, pUL128, pUL130, pUL131 (ou leurs fragments), peut être introduit dans une cellule hôte. En variante, les séquences codant pour les cinq sous-unités (ou leurs fragments) peuvent être portées par deux constructions d’acide nucléique ou plus, qui sont ensuite introduites dans la cellule hôte simultanément ou séquentiellement.
[0069] Par exemple, dans un exemple de mode de réalisation, l'invention propose une seule construction d'acide nucléique codant pour : 1'ectodomaine des gH, gL, pUL128, pUL130, et pUL131. Dans un autre exemple de mode de réalisation, l'invention propose deux constructions d'acide nucléique codant pour : 1'ectodomaine des gH, gL, pUL128, pUL130, et pUL131. Voir, figure 1. Dans les deux exemples, il a été obtenu une intégration génomique couronnée de succès.
[0070] La construction d'acide nucléique peut comprendre de l'ADN génomique qui comprend un ou plusieurs introns, ou de l'ADNc. Certains gènes sont exprimés plus efficacement lorsque des introns sont présents. La séquence génomique native codant pour la pUL128 comprend deux introns, la séquence génomique native codant pour la pUL131 comprend un exon, tandis que la séquence génomique native codant pour la pUL130 ne comprend aucun intron. La séquence génomique native codant pour la pUL128 comprend trois exons, la séquence génomique native codant pour la pUL131 comprend deux exons, et la séquence génomique native codant pour la pUL130 comprend un exon. En particulier, la séquence d'acide nucléique est appropriée pour l'expression de polypeptides exogènes dans ladite cellule de mammifère.
[0071] Sont également proposés ici, des vecteurs qui comprennent des séquences codant pour les gH, gL, pULl28, pUL130, et/ou pUL131 (ou l'un de leurs fragments). Les exemples de vecteurs comprennent des plasmides qui sont capables de se répliquer de façon autonome ou d'être répliqués dans une cellule de mammifère. Les vecteurs d'expression types contiennent des promoteurs, des amplificateurs, et des terminateurs appropriés qui sont utiles pour la régulation de l'expression de la ou des séquences codantes dans la construction d'expression. Les vecteurs peuvent également comprendre des marqueurs de sélection pour fournir un trait phénotypique pour la sélection des cellules hôtes transformées (comme la transmission d'une résistance à des antibiotiques tels que l'ampicilline ou la néomycine).
[0072] Les promoteurs appropriés comprennent, par exemple, le promoteur du CMV, un adénovirus, EFla, le promoteur de la GAPDH métallothionéine, le promoteur précoce du SV-40, le promoteur tardif du SV-40, le promoteur du virus de la tumeur mammaire de la souris, le promoteur du virus du sarcome de Rous, le promoteur de la polyhédrine, etc. Les promoteurs peuvent être constitutifs ou inductibles. Un ou plusieurs vecteurs peuvent être utilisés (par exemple, un vecteur codant pour les cinq sous-unités ou des fragments de celles-ci, ou deux vecteurs ou plus ensemble codant pour les cinq sous-unités ou des fragments de celles-ci) ; voir, par exemple, la figure 1.
[0073] Lorsque la cellule hôte est une cellule CHO, le promoteur, l'amplificateur, ou le terminateur est actif dans les cellules CHO. Un promoteur fréquemment utilisé est le promoteur pour le gène immédiat précoce (IE) du cytomégalovirus humain (hCMV). Le promoteur de ce gène dirige des taux élevés d'expression de transgène dans une large diversité de types cellulaires. L'activité de ce promoteur dépend d'une série de répétitions imparfaites de 17, 18, 19, et 21 pb, dont certaines lient des facteurs de transcription des familles de la protéine de liaison sensible à l'AMPc (CREB) NF-κΒ et du facteur nucléaire 1.
[0074] Un promoteur fort est un promoteur qui provoque l'initiation des ARNm à une fréquence élevée égale ou supérieure à celle du fragment promoteur/amplificateur central du hCMV (décrit dans le brevet US No. 5 168 062) dans une cellule CHO. Un tel promoteur peut être un promoteur fort dépendant du type cellulaire, comme ceux décrits dans le brevet US No. 5 589 392, ou un promoteur fort actif de façon ubiquitaire. Les exemples de promoteurs viraux actifs de façon constitutive comprennent, par exemple, les promoteurs précoce et tardif du virus SV40, le promoteur immédiat précoce du cytomégalovirus humain (hCMV) ou du cytomégalovirus murin (mCMV), le promoteur de la thymidine kinase (TK) ou le virus Herpes Simplex, ou le promoteur des longues répétitions terminales du virus du sarcome de Rous (RS-LTR). D'autres exemples comprennent, par exemple, le promoteur MIE du hCMV tel que défini par le fragment Pst I de 2,1 kb décrit dans le brevet US No. 5 385 839 et/ou dans le document EP-323 997-A1 ou une partie fonctionnelle de celui-ci possédant une activité de promoteur.
[0075] Des séquences de sites internes d'entrée du ribosome (1RES) et de peptide 2A peuvent être également utilisées. Les 1RES et peptide 2A fournissent des variantes d'approches pour la coexpression de séquences multiples. 1RES est une séquence nucléotidique qui permet l'initiation de la traduction dans le milieu de la séquence d'un ARN messager (ARNm) faisant partie du plus grand processus de synthèse des protéines. Habituellement, chez les eucaryotes, la traduction peut être initiée uniquement à l'extrémité 5' de la molécule d'ARNm. Les éléments 1RES permettent l'expression de gènes multiples dans un transcrit. Des vecteurs polycistroniques à base d'IRES, qui expriment des protéines multiples à partir d'un transcrit, peuvent réduire l'échappement des clones non exprimant de la sélection.
[0076] Le peptide 2A permet la traduction de protéines multiples dans un seul cadre de lecture ouvert dans une polyprotéine qui est ensuite clivée en protéines individuelles par l'intermédiaire d'un mécanisme de saut ribosomique. Le peptide 2A peut fournir une expression plus équilibrée de multiples produits protéiniques.
[0077] Les exemples de séquences d'IRES comprennent, par exemple, les 1RES de l'EV71, les 1RES de 1'EMCV, les 1RES DU VHC .
[0078] Pour l'intégration génomique, l'intégration peut être spécifique du site ou aléatoire. Une recombinaison spécifique du site peut être obtenue par introduction d'une ou de plusieurs séquences homologues dans les constructions d'acide nucléique décrites ici. Une telle séquence homologue correspond potentiellement à la séquence endogène au niveau d'un site cible spécifique dans le génome de l'hôte. En variante, une intégration aléatoire peut être utilisée. Parfois, le taux d'expression d'une protéine peut varier selon le site d'intégration. Par conséquent, il peut être souhaitable de sélectionner un certain nombre de clones selon le taux d'expression de la protéine recombinante pour identifier un clone qui atteint le taux d'expression souhaité. 3. Cellules hôtes [0079] Dans un autre aspect, l'invention propose des cellules hôtes dans lesquelles les séquences codant pour le pentamère sont intégrées de façon stable dans le génome des cellules hôtes, et, lorsqu'elles sont cultivées dans des conditions appropriées, elles expriment le pentamère du CMV tel que divulgué ici. Dans certains modes de réalisation, la cellule hôte est une cellule de mammifère. Dans certains modes de réalisation, la cellule hôte est une cellule de rongeur.
[0080] Les exemples de lignées cellulaires de rongeurs comprennent par exemple, les lignées cellulaires de rein du hamster bébé (BHK) (par exemple, BHK21, BH TK), de Sertoli de souris (TM4), de foie du rat buffalo (BRL 3A) , de tumeur mammaire de la souris (MMT), d'hépatome du rat (HTC), de myélome de la souris (NSO), d'hybridome murin (Sp2/0), de thymome de la souris (EL4), d'ovaire du hamster de Chine (CHO) et des dérivés des cellules CHO, embryonnaires murines (NIH/3T3, 3T3 Li), myocardiques du rat (H9c2), de myoblastes de la souris (C2C12), et de rein de la souris (miMCD-3).
[0081] Dans un mode de réalisation, la cellule de rongeur est une cellule CHO. Les cellules CHO appropriées comprennent, par exemple, les lignées DUXB11 et DG44. Ces deux lignées cellulaires sont déficientes en activité dihydrofolate réductase (DHFR), et par conséquent dépendantes d'une source exogène de précurseurs nucléotidiques pour leur croissance. La déficience en DHFR est un phénotype facilement manipulé approprié pour sélectionner l'intégration génomique et l'expression stable d'ADN exogène. L'intégration génomique est accomplie par transfection des cellules avec des cassettes d'expression pour le gène d'intérêt et un gène DHFR. Après la transfection, les cellules sont placées dans un milieu de sélection auquel il manque les précurseurs nucléotidiques.
[0082] L' expression de protéines de recombinaison dans des lignées cellulaires déficientes en DHFR peut être en outre amplifiée par l'addition de méthotrexate (MTX) aux cultures, de telle façon qu'il est possible de sélectionner un nombre élevé de copies du vecteur d'expression introduit. Le MTX est un inhibiteur compétitif de l'enzyme DHFR. L'application de cette pression de sélection supplémentaire en plus de l'absence des précurseurs nucléotidiques permet la sélection et l'isolement de la population mineure de cellules qui ont subi une amplification spontanée du vecteur d'expression intégré contenant le marqueur sélectionnable DHFR et, dans la plupart des cas, le gène d'intérêt. La présence de copies multiples du gène permet d'obtenir un taux élevé d'expression des protéines exogènes. En variante, la sélection par le MTX peut être réalisée indépendamment de la déficience en DHFR (c'est-à-dire, l'utilisation de MTX pour sélectionner une cellule hôte qui est à l'origine compétente en DHFR), comme cela est exemplifié dans les exemples divulgués ici.
[0083] Une autre lignée cellulaire CHO appropriée est la lignée cellulaire CHO-K1 de type sauvage, et son dérivé CHO-K1SV.
[0084] Un procédé de sélection couramment utilisé pour les lignées cellulaires CHO-K1 consiste en la sélection par la glutamine synthétase (GS) . En l'absence d'une source exogène de glutamine, la survie cellulaire dépend de l'enzyme GS pour produire la glutamine. Avec des lignées de cellules hôtes telles que les cellules NS/0 dérivées de myélome murin et les cellules CHO, qui présentent une activité enzymatique GS endogène relativement basse, le procédé permet un schéma de sélection simple lors de l'utilisation d'un marqueur sélectionnable GS dans le vecteur d'expression et d'un milieu de sélection dépourvu de glutamine. Similaire au système DHFR/MTX, l'inhibiteur compétitif de la GS, le méthionine sulfoximine (MSX) peut être ajouté au milieu pour appliquer une pression supplémentaire et sélectionner les cellules CHO qui dirigent des taux élevés d'expression à partir du vecteur intégré.
[0085] Les cellules CHO-K1, ou toutes autres cellules CHO couramment utilisées, peuvent être également sélectionnées en se basant sur la déficience en DHFR comme il a été décrit ci-dessus. Par exemple, une cellule CH0-K1, ou tout autre type de cellule CHO, peut présenter une déficience en DHFR, comme une délétion dans laquelle au moins une copie de la séquence génomique du gène de la dihydrofdate réductase (DHFR) , ou au moins 30 % (par exemple, au moins 40 %, au moins 50 %, au moins 60 %, au moins 70 %, au moins 80 %, au moins 90 %, ou 100 %) de la séquence codante dudit gène DHFR, est délétée. D'autres moyens pour introduire une déficience en DHFR comprennent la création de mutations dans le gène DHFR endogène. Les lignées cellulaires peuvent être en outre amplifiées par l'addition de méthotrexate (MTX) aux cultures comme il a été décrit ci-dessus.
[0086] Les cellules CHO-K1, ou toutes autres cellules CHO couramment utilisées, peuvent être également sélectionnées en se basant sur le MTX, avec ou sans déficience en DHFR. Dans les exemples fournis ici, les cellules CHO ont été sélectionnées en se basant sur le MTX, sans déficience en DHFR (c'est-à-dire que la cellule CHO d'origine utilisée pour l'intégration génomique est compétente pour la DHFR). Dans un tel système, généralement, le nombre de copies des séquences exogènes (par exemple, les séquences codant pour les protéines du CMV) est généralement bas. Il est estimé que les lignées cellulaires dans les exemples décrits ici comportent environ 1 à 10 copies des séquences exogènes codant pour les protéines du CMV, au niveau d'un nombre très limité de sites d'intégration (par exemple, 1 ou 2 sites d'intégration). En général, lorsqu'une lignée cellulaire déficiente en DFHR est utilisée, le nombre de copies des séquences exogènes est généralement de beaucoup supérieur, parfois aussi élevé que quelques centaines de copies. On s'attend à ce que les deux procédés soient appropriés pour la production des lignées cellulaires CHO divulguées ici, bien que lorsque le nombre de copies est élevé, la cellule hôte puisse perdre une ou plusieurs copies des séquences exogènes durant le repiquage et/ou l'expansion de la lignée cellulaire.
[0087] D'autres souches des cellules CHO appropriées pour l'invention décrite ici comprennent, par exemple, des cellules CHO-ICAM-1, et des cellules CHO-hIFNy. Ces cellules génétiquement modifiées permettent une insertion stable d'ADN recombinant dans un gène spécifique ou une région d'expression des cellules, l'amplification de l'ADN inséré, et la sélection des cellules présentant un taux élevé d'expression de la protéine recombinante.
[0088] Les exemples de lignées cellulaires CHO disponibles à 1'European Collection of Cell Cultures (ECACC) sont énumérés dans le tableau 1. Toutes les cellules CHO énumérées dans le tableau 1 peuvent être utilisées.
Tableau 1
[0089] Diverses lignées cellulaires CHO sont également disponibles auprès de 1'American Type Culture Collection (ATCC), comme les lignées cellulaires CHO hCBEll (ATCC® PTA-3357™), E77.4 (ATCC® PTA-3765™), hLT-B : R-hGl CHO No. 14 (ATCC® CRL-11965™), MOR-CHO- MORAb-003-RCB (ATCC® PTA-7552™),
AQ.C2 clone 11B (ATCO® PTA-3274™) , AQ.C2 clone 11B (ATCO® PTA-327 4™) , hsAQC2 dans CHO-DG44 (ATCC® PTA-3356™) , xrs5 (ATCO® CRL-2348™), CH0-K1 (ATCC® CCL-61™), Lecl [nommée à l'origine Pro-5WgaRI3C] (ATCC® CRL-1735™), Pro-5 (ATCODCRL-1781™), ACY1-E (ATCC® 65421™), ACY1-E (ATCC® 65420™), pgsE-606 (ATCC® CRL-2 246™) , CHO-CD36 (ATCC® CRL-2092™), pgsC-605 (ATCC® CRL-2245™), MC2/3 (ATCC® CRL-2143™), CHO-ICAM-1 (ATCC® CRL-2093™), et pgsB-618 (ATCC® CRL-2241™). L’une quelconque de ces lignées cellulaires CHO peut être utilisée.
[0090] D'autres lignées cellulaires CHO disponibles dans le commerce comprennent, par exemple, les cellules FreeStyle™ CHO-S et la lignée cellulaire Flp-In™-CHO de Life Technologies.
[0091] Des procédés pour exprimer des protéines recombinantes dans des cellules CHO en général ont été divulgués. Voir, par exemple, dans les brevets US No. 4 816 567 et No. 5 981 214.
[0092] En plus des cellules CHO, d'autres cellules de mammifères peuvent être également utilisées en tant qu'hôtes. Les exemples de cellules de rongeurs comprennent des cellules BHK21, des cellules NSO, des cellules Sp2/0, des cellules EL4, des cellules NIH/3T3, des cellules 3T3-L1, des cellules ES-D3, des cellules H9c2, des cellules C2C12, YB2/0, des cellules mimcd 3, etc. Les exemples de cellules humaines comprennent : des cellules SH-SY5Y, des cellules IM 32, des cellules LAN, des cellules MCFIOA, des cellules 293T, des cellules SK-BR3, des cellules huvec, des cellules huasmc, des cellules HKB-1, des cellules hmsc, des cellules U293, des cellules HE 293, des cellules PERC6®, des cellules Jurkai, des cellules HT-29, des cellules Incap.FGC, des cellules A549, des cellules MDA MB453, des cellules hepg2, des cellules THP-1, des cellules bxpc-3, des cellules Capan-1, des cellules DU145, et des cellules PC-3.
[0093] Par exemple, la lignée cellulaire PERC6®, les cellules NSO de myélome de souris, les cellules de rat de hamster bébé (BHK), et la lignée cellulaire de rein embryonnaire humain (HEK293) ont reçu une approbation réglementaire pour la production de protéines recombinantes.
[0094] Les exemples de lignées cellulaires de primates non humains utiles dans des procédés fournis ici comprennent les lignées cellulaires de rein de singe (CVI-76), de rein de singe vert d'Afrique (VERO-76), de fibroblastes de singe vert (COS-1), et des cellules de rein de singe (CVI) transformées par le SV40 (COS-7). D'autres lignées cellulaires de mammifères sont connues d'une personne ayant des compétences moyennes dans le domaine et sont cataloguées à 1'American Type Culture Collection (Manassas, VA).
[0095] Dans certains modes de réalisation, les cellules hôtes sont appropriées pour une croissance dans des cultures en suspension. Les cellules hôtes compétentes en suspension sont généralement monodispersées ou se développent en agrégats lâches sans agrégation substantielle. Les cellules hôtes compétentes en suspension comprennent des cellules qui sont appropriées pour une culture en suspension sans adaptation ni manipulation (par exemple, des cellules hématopoïétiques, des cellules lymphoïdes) et des cellules qui ont été rendues compétentes en suspension par modification ou adaptation de cellules dépendantes de la fixation (par exemple, des cellules épithéliales, des fibroblastes).
[0096] Dans certains modes de réalisation, la cellule hôte est une cellule dépendante de la fixation qui est cultivée et maintenue dans une culture adhérente. Les exemples de lignées cellulaires adhérentes humaines utiles dans des procédés fournis ici comprennent les lignées cellulaires de neuroblastome humain (SH-SY5 Y, IMR32, et LANS), de carcinome du col de l'utérus humain (HeLa) , de l'épithélium de sein humain (MCFIOA), de rein embryonnaire humain (293T), et de carcinome du sein humain (SK-BR3). Gènes C12orf35 et protéines C12orf35 [0097] Dans certains modes de réalisation, la cellule hôte est une cellule dans laquelle le taux d'expression ou l'activité de la protéine C12orf35 est réduit, comparativement à un témoin. Dans un certain mode de réalisation, une telle cellule est une cellule CHO. La demande de brevet US provisoire No. 61/919 313, déposée le 20 décembre 2013, et incorporée ici en référence, fournit une description détaillée de cellules de mammifères dans lesquelles le taux d'expression ou l'activité de la protéine C12orf35 est réduit comparativement à un témoin.
[0098] Divers témoins peuvent être utilisés. Le taux d'expression ou l'activité de la protéine C12orf35 à partir d'une cellule de type sauvage correspondante peut être utilisé en tant que témoin. En variante, un témoin peut être un taux prédéterminé ou un taux seuil qui peut être identifié dans la littérature ou une base de données.
[0099] Le gène C12orf35 humain se rapporte à la séquence nucléotidique codant pour le cadre de lecture ouvert 35 du chromosome 12. La protéine C12orf35 codée n'est pas caractérisée. On pense que l'homologue chez Cricetulus griseus (hamster de Chine) du gène C12orf35 humain, nommé Kiaal551, est localisé sur le chromosome 8. On pense que l'homologue chez Mus musculus du gène C12orf35 humain est localisé sur le chromosome 6. L'ID de gène pour le gène CHO C12orf35 est publié comme l'ID de gène GenBank No. 100762086 ; et pour le gène C12orf35 humain, il est publié comme l'ID de gène GenBank No. 55196. Les informations concernant le gène C12orf35 chez Cricetulus griseus, la séquence codante et la protéine C12orf35 prédite sont également disponibles à la GenBank par le numéro d'accession NCBI : XM_003512865.
[0100] Le gène C12orf35 est exprimé de façon endogène dans des cellules eucaryotes telles que, par exemple, d'espèces de mammifères comme l'être humain, la souris et le hamster. La protéine prédite codée par le gène C12orf35 est une grosse protéine dépassant 1500 résidus. La liste des séquences présente des exemples de séquences d'acides aminés ou de séquences d'acides aminés putatives de la protéine codée par le gène C12orf35 endogène de différentes espèces de mammifères comme le hamster (SEQ ID NO : 21 et 22), l'être humain (SEQ ID NO : 23 et 24), et la souris (SEQ ID NO : 35). La CDS (séquence d'ADN codante) de C12orf35 du hamster de Chine est représentée par SEQ ID NO : 25. En outre, une section de l'UTR en 5' (voir SEQ ID NO : 26) et de l'UTR en 3' (voir SEQ ID NO : 27) de l'ARNm de C12orf35 du hamster de Chine a été séquencée.
[0101] Chez l'être humain, le gène C12orf35 est également appelé KIAA1551. Le gène C12orf35 est également appelé de type C12orf35 ou homologue de C12orf35 chez le hamster ou 2810474O19Rik chez la souris. Différents noms peuvent être alloués dans différentes espèces pour la protéine ou le gène et des variantes non limitantes de noms (alias) sont également énumérées ci-dessus dans le tableau 2. Pour simplifier, dans cette divulgation, les homologues et les orthologues de différentes espèces sont tous appelés « gène C12orf35 » ou « protéine C12orf35 ».
[0102] A 1' encontre de ce contexte scientifique, il est surprenant et inattendu que lorsque le taux d'expression ou l'activité de la protéine C12orf35 est réduit comparativement à un témoin (par exemple, par délétion du gène Cl2orf35, ou par introduction de mutations), le rendement de la protéine recombinante est significativement amélioré. En tant que telles, des cellules hôtes de mammifères (par exemple, des cellules CHO) avec un taux d'expression ou une activité réduit de la protéine C12orf35 sont particulièrement appropriées pour la production recombinante du complexe pentamère.
[0103] La réduction du taux d'expression ou de l'activité d'une protéine C12orf35 peut être obtenue par divers moyens. Par exemple, le taux d'expression ou l'activité d'une protéine C12orf35 peut être réduit par inactivation de gène, mutation de gène, délétion de gène, silençage de gène, ou une combinaison quelconque des précédents. L'inactivation de gène est une technique génétique par laquelle un gène est rendu inopérant par perturbation de sa fonction. Par exemple, un acide nucléique peut être inséré dans la séquence codante, perturbant de cette façon la fonction du gène. En outre, le gène C12orf35 pleine longueur (ou l'un de ses fragments) peut être délété, grâce à quoi l'expression de la protéine C12orf35 fonctionnelle est substantiellement éliminée. Par exemple, la délétion peut être d'au moins 30 %, d'au moins 40 %, d'au moins 50 %, d'au moins 55 %, d'au moins 60 %, d'au moins 65 %, d'au moins 70 %, d'au moins 75 %, d'au moins 80 %, d'au moins 85 %, d'au moins 90 %, d'au moins 95 %, ou de 100 % de la séquence codante du gène C12orf35. Une autre option est d'introduire une ou plusieurs mutations dans la séquence codante, ce qui rend une protéine C12orf35 non fonctionnelle ou moins fonctionnelle. Par exemple, une ou plusieurs mutations de décalage du cadre peuvent être introduites, produisant une protéine C12orf35 non fonctionnelle ou moins fonctionnelle. En variante ou en outre, un ou plusieurs codons d'arrêt peuvent être introduits dans la séquence codante si bien qu'il est obtenu une protéine tronquée, non fonctionnelle ou moins fonctionnelle. D'autres options comprennent, mais n'y sont pas limitées, une ou plusieurs mutations dans le promoteur, dans l'UTR en 5' et/ou en 3' ou d'autres éléments régulateurs, par exemple par introduction d'une délétion du promoteur ou par introduction d'une construction entre le promoteur et le départ de la transcription. Les procédés pour la perturbation de gènes afin de supprimer ou d'éliminer l'expression du gène cible sont également bien connus de l'homme du métier.
[0104] Puisque chaque cellule comporte deux copies du gène C12orf35 dans son génome, dans certains modes de réalisation, au moins une copie de la séquence génomique du gène C12orf35, ou au moins 50 % de la séquence codante dudit gène C12orf35, est délétée. Dans certains modes de réalisation, les deux copies des séquences génomiques du gène C12orf35 (ou au moins 50 % de la séquence codante dudit gène C12orf35 à partir de chaque copie) sont délétées.
[0105] Dans certains modes de réalisation, la séquence délétée comprend une portion de la région télomérique du chromosome 8 d'une cellule CHO. Une région télomérique est une région de séquences nucléotidiques répétitives à chaque extrémité d'une chromatide, qui protège l'extrémité du chromosome contre la détérioration ou contre la fusion avec des chromosomes voisins. Dans certains modes de réalisation, au moins 30 %, au moins 40 %, au moins 50 %, au moins 55 %, au moins 60 %, au moins 65 %, au moins 70 %, au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 %, au moins 95 %, ou 100 % de la séquence nucléotidique de la région télomérique du chromosome 8 d'une cellule CHO est délétée.
[0106] Dans certains modes de réalisation, la séquence délétée comprend en outre la délétion d'un gène choisi dans le groupe constitué de : Bicdl, Amnl, protéine 20 de type méthyltransférase, Dennd5b, FAM60A, Caprin2, Ipo8, RPS4Y2, et l'une de leurs combinaisons.
[0107] Dans certains modes de réalisation, la délétion du gène C12orf35 (ou de l'un de ses fragments) est due à une cassure chromosomique. Une cassure chromosomique peut être induite par exemple en traitant les cellules eucaryotes avec un agent toxique qui favorise la cassure chromosomique, comme par exemple le MTX, 1'aphidicoline ou 1'hygromycine. D'autres options pour induire des cassures chromosomiques comprennent, mais n'y sont pas limitées, des radiations, des irradiations, des mutagènes, des substances cancérigènes et la bléomycine. Des cassures chromosomiques peuvent également se produire spontanément durant la transfection, par exemple, 1'électroporation. Des procédés pour induire une cassure chromosomique sont également connus de l'homme du métier et ainsi, n'ont pas besoin d'une description détaillée quelconque ici. Après l'induction d'une cassure chromosomique, les cellules eucaryotes comportant le point de rupture souhaité (qui produit une délétion du gène C12orf35, ou de l'un de ses fragments) peuvent être identifiées, par exemple, en analysant l'ADN ou en utilisant le procédé selon le cinquième aspect de la présente divulgation. Par exemple, le profil d'expression des cellules traitées peut être analysé pour déterminer si le gène Cl2orf35 ou les gènes localisés en position centromérique du gène C12orf35 sont exprimés, si l'expression est réduite ou si les gènes ne sont pas exprimés. Par exemple, dans le cas de cellules de souris ou de hamster, il peut être analysé si le gène C12orf35 est exprimé et en variante ou en outre à ceci, il peut être analysé si un ou plusieurs gènes choisis dans le groupe constitué de la protéine 20 de type méthyltransférase, Dennd5b, FAM60A, Caprin2, Ipo8, Tmtcl ou des gènes qui sont localisés en position télomérique des gènes susmentionnés (où télomérique a cet égard signifie dans la direction de l'extrémité télomérique) sont exprimés par la cellule et/ou si l'expression est réduite ou substantiellement éliminée.
[0108] La réduction du taux d'expression de la protéine C12orf35 peut être obtenue par un silençage du gène après la transcription, par exemple, par des molécules d'acide nucléique antisens, ou des molécules qui médient une interférence par ARN. Des exemples non limitants comprennent des ARNsi, des ARNsh, des miARN, des oligonucléotides antisens, etc., tous étant bien connus dans l'art.
[0109] Le taux d'expression de la protéine C12orf35 peut être estimé par des procédés connus dans l'art, par exemple, en mesurant le taux d'ARNm codant pour la protéine C12orf35, ou la protéine C12orf35 elle-même. De tels procédés comprennent, par exemple, les analyses Northern blot, FACS, ImageStream, Western blot, qPCR, RT-PCR, qRT-PCR, ELISA, Luminex, Multiplex, etc.
[0110] Dans certains modes de réalisation, le taux d'expression ou l'activité de la protéine C12orf35 est réduit d'au moins 3 fois, d'au moins 5 fois, d'au moins 10 fois, d'au moins 20 fois, d'au moins 30 fois, d'au moins 40 fois, d'au moins 50 fois, d'au moins 60 fois, d'au moins 70 fois, d'au moins 75 fois, d'au moins 80 fois, d'au moins 90 fois, d'au moins 100 fois, comparativement à un témoin.
Gènes FAM60A et protéines FAM60A
[0111] Dans certains modes de réalisation, la cellule hôte est une cellule dans laquelle le taux d'expression ou l'activité de la protéine FAM60A est réduit, comparativement à un témoin. Dans un certain mode de réalisation, une telle cellule est une cellule CHO. La demande de brevet US provisoire No. 61/919 340, déposée le 20 décembre 2013, et incorporée ici en référence, fournit une description détaillée de cellules de mammifères dans lesquelles le taux d'expression ou l'activité de la protéine FAM60A est réduit.
[0112] Divers témoins peuvent être utilisés comme il a été discuté ci-dessus. Le taux d'expression ou l'activité de la protéine FAM60A à partir d'une cellule de type sauvage correspondante peut être utilisé en tant que témoin. En variante, un témoin peut être un taux prédéterminé ou un taux seuil qui peut être identifié dans la littérature ou une base de données.
[0113] La protéine FAM60A est une sous-unité du complexe SIN3-histone désacétylase (HDAC) (complexe SIN3/HDAC) qui fonctionne dans la répression de la transcription (Munoz et al., 2012, THE Journal of Biological Chemistry VOL. 287, NO. 39, pp. 32346-32353 ; Smith et ai., 2012, Mol Cell Proteomics 11 (12) : 1815-1828) . Les histone désacétylases (HDAC) catalysent l'élimination des groupes acétyle à partir des histones. L'acétylation des histones sur les lysines est un mécanisme majeur pour la modulation de la conformation de la chromatine. L'acétylation des histones favorise un état de la chromatine relâché, transcriptionnellement actif tandis que la désacétylation catalysée par les histone désacétylases (HDAC) favorise un état inactif silencieux. L'analyse de bases de données a révélé la présence d'au moins un orthologue de la FAM60A chez la plupart des métazoaires, mais pas chez les nématodes. Le gène FAM60A est conservé chez les métazoaires et peut être trouvé dans les génomes de tous les vertébrés et de la plupart des invertébrés qui ont été complètement séquencés. La recherche de similarité de séquence des homologues de la FAM60A indique que principalement, il n'existe qu'un seul membre représentatif de cette famille dans le génome. Il n'existe que quelques exceptions. Selon Smith et al., 2012, la protéine FAM60A a une séquence unique à laquelle il manque n'importe quel domaine connu de protéine. En outre, il a été décrit par Smith et al. 2012, qu'elle ne présente aucune homologie de séquence avec d'autres protéines connues dans le protéome humain. La comparaison des séquences entre les protéines FAM60A provenant de différentes espèces a montré que la protéine FAM60A comprend généralement trois régions : (1) une extrémité N-terminale comprenant des segments hautement conservés chez tous les métazoaires ; (2) une région moyenne qui est hautement conservée parmi les vertébrés tandis que chez les invertébrés elle est constituée d'un espaceur non conservé d'une longueur variable ; (3) une extrémité C-terminale comprenant des segments hautement conservés chez tous les métazoaires. Ainsi, la conservation la plus élevée a été observée dans les régions N- et C-terminales de la FAM60A.
[0114] Des études indiquent que la protéine FAM60A s'associe aux complexes SIN3/HDAC dans divers types de cellules eucaryotes comme en particulier des cellules de mammifères. Toutefois, jusqu'à ce jour, les informations fonctionnelles concernant la protéine FAM60A sont limitées. Des études fonctionnelles récentes (voir Smith et al., 2012) indiquent que la protéine FAM60A peut réprimer l'expression génique et régule un sous-ensemble spécifique de gènes. Smith et al. 2012 rapportent un rôle de la protéine FAM60A dans la régulation de la voie de signalisation du TGF-bêta, qui joue un rôle pivot dans des processus comme la progression d'un cancer, les métastases, la migration cellulaire et la surveillance immunitaire. Il existe des découvertes indiquant que la protéine FAM60A agit comme un répresseur de la transcription des composants de la voie de signalisation du TGF-bêta tandis que cette fonction de la protéine FAM60A semble être permise par l'intermédiaire de son rôle dans le complexe SIN3-HDAC. L'appauvrissement de la protéine FAM60A dans différentes lignées de cellules cancéreuses en utilisant des ARNsi contre la séquence codante de la FAM60A a produit un changement de la morphologie normale des cellules cancéreuses. En outre, il a été trouvé que les taux de protéine FAM60A changent périodiquement au cours du cycle cellulaire dans des cellules U20S (Munoz et al., 2012). Des expériences de répression de la FAM60A en utilisant des ARNsi dirigés contre la FAM60A dans des cellules d'ostéosarcome osseux humain U20S ont révélé que la protéine FAM60A restreint l'expression du gène de la cycline DI.
[0115] A l'encontre de ce contexte scientifique, il a été trouvé de façon surprenante que la réduction de l'expression ou de l'activité de la protéine FAM60A dans une cellule de mammifère augmente la stabilité de l'expression des protéines recombinantes, sans affecter négativement d'autres caractéristiques de la cellule qui sont importantes pour l'expression recombinante. Cette corrélation entre les effets de la protéine FAM60A et la stabilité de l'expression durant une culture prolongée des cellules était inattendue. En tant que telles, des cellules hôtes de mammifères (par exemple, des cellules CHO) avec un taux d'expression ou une activité réduit de la protéine FAM60A sont particulièrement appropriées pour la production recombinante du complexe pentamère.
[0116] Le gène FAM60A est exprimé de façon endogène chez les métazoaires et par conséquent dans des espèces de mammifères telles que l'être humain, la souris, le rat et le hamster, et la séquence d'acides aminés de la FAM60A est hautement conservée dans les espèces de mammifères ainsi que chez les vertébrés. Différents noms peuvent être alloués dans différentes espèces pour la protéine ou le gène et des variantes de noms non limitantes (alias) sont également énumérées dans le tableau 2 (ci-dessous). Pour simplifier, dans cette divulgation, les homologues et les orthologues de différentes espèces sont tous appelés « gène FAM60A » ou « protéine FAM60A ».
[0117] La liste des séquences présente des exemples de séquences d'acides aminés de protéines FAM60A connues et/ou prédites de différentes espèces de vertébrés, notamment Homo sapiens (SEQ ID NO : 28), Mus musculus (SEQ ID NO : 29), Cricetulus griseus (SEQ ID NO : 30). L'ADNc de FAM60A prédit de Cricetulus griseus est représenté par SEQ ID NO : 31 (séquence codante de 14 à 679 ; voir également la séquence de référence du NCBI : XM_003505482.1) . La protéine FAM60A n'a pas été décrite en détail dans la littérature. Ainsi, il était surprenant que la stabilité de l'expression d'une cellule hôte recombinante puisse être améliorée, si le génome de la cellule hôte est modifié de telle façon que le taux d'expression ou l'activité de la protéine endogène FAM60A est réduit, comparativement à un témoin. Il était inattendu que la protéine FAM60A influence la stabilité de l'expression d'un produit recombinant d'intérêt.
[0118] Les séquences du gène FAM60A codant pour la protéine FAM60A ont été rapportées chez Homo sapiens (ID du gène du NCBI : 58516) ; Rattus norvegicus (ID du gène du NCBI : 686611) ; Mus musculus (ID du gène du NCBI : 56306) ; Bos Taurus (ID du gène du NCBI : 538649) et d'autres. Des variants de transcrits peuvent exister d'une façon dépendante de l'espèce et dans des nombres différents (par exemple, le gène FAM60A humain exprime trois isoformes de transcrits putatifs qui diffèrent dans les UTR mais qui codent pour la même protéine).
[0119] La réduction du taux d'expression ou de l'activité d'une protéine FAM60A peut être obtenue par divers moyens. Par exemple, le taux d'expression ou l'activité d'une protéine FAM60A peut être réduit par inactivation de gène, mutation de gène, délétion de gène, silençage de gène ou une combinaison quelconque des précédents. L'inactivation de gène est une technique génétique qui rend un gène inopérant par perturbation de sa fonction. Par exemple, un acide nucléique peut être inséré dans la séquence codante, perturbant de cette façon la fonction du gène. En outre, le gène FAM60A pleine longueur (ou l'un de ses fragments) peut être délété, grâce à quoi l'expression de la protéine FAM60A fonctionnelle est substantiellement éliminée. Par exemple, la délétion peut être d'au moins 30 %, d'au moins 40 %, d'au moins 50 %, d'au moins 55 %, d'au moins 60 %, d'au moins 65 %, d'au moins 70 %, d'au moins 75 %, d'au moins 80 %, d'au moins 85 %, d'au moins 90 %, d'au moins 95 %, ou de 100 % de la séquence codante du gène FAM60A. Une autre option est d'introduire une ou plusieurs mutations dans la séquence codante, ce qui rend une protéine FAM60A non fonctionnelle ou moins fonctionnelle. Par exemple, une ou plusieurs mutations de décalage du cadre peuvent être introduites, produisant une protéine FAM60A non fonctionnelle ou moins fonctionnelle. En variante ou en outre, un ou plusieurs codons d'arrêt peuvent être introduits dans la séquence codante si bien qu'il est obtenu une protéine tronquée, non fonctionnelle ou moins fonctionnelle. D'autres options comprennent, mais n'y sont pas limitées, une ou plusieurs mutations dans le promoteur, dans les UTR en 5' et/ou en 3' ou d'autres éléments régulateurs, par exemple par introduction d'une délétion du promoteur ou par introduction d'une construction entre le promoteur et le départ de la transcription. Des procédés de perturbation de gènes pour supprimer ou éliminer l'expression du gène cible sont également bien connus de l'homme du métier.
[0120] Puisque chaque cellule comporte deux copies du gène FAM60A dans son génome, dans certains modes de réalisation, au moins une copie de la séquence génomique du gène FAM60A, ou au moins 50 % de la séquence codante dudit gène FAM60A, est délétée. Dans certains modes de réalisation, les deux copies des séquences génomiques du gène FAM60A (ou au moins 50 % de la séquence codante dudit gène FAM60A à partir de chaque copie) sont délétées.
[0121] Dans certains modes de réalisation, la séquence délétée comprend une portion de la région télomérique du chromosome 8 d'une cellule CHO. Une région télomérique est une région de séquences nucléotidiques répétitives à chaque extrémité d'une chromatide, qui protège l'extrémité du chromosome contre la détérioration ou contre la fusion avec des chromosomes voisins. Dans certains modes de réalisation, au moins 30 %, au moins 40 %, au moins 50 %, au moins 55 %, au moins 60 %, au moins 65 %, au moins 70 %, au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 %, au moins 95 %, ou 100 % de la séquence nucléotidique de la région télomérique du chromosome 8 d'une cellule CHO est délétée.
[0122] Dans certains modes de réalisation, la séquence délétée comprend en outre une délétion d'un gène choisi dans le groupe constitué de : Caprin2 et Ipo8, et l'une de leurs combinaisons.
[0123] Dans certains modes de réalisation, la délétion du gène FAM60A est due à une cassure chromosomique. Une cassure chromosomique peut être induite par des procédés décrits ci-dessus. Après l'induction d'une cassure chromosomique, les cellules comportant le point de rupture souhaité (qui entraîne une délétion du gène FAM60A) peuvent être identifiées, par exemple, en analysant l'ADN ou en utilisant le procédé selon le cinquième aspect de la présente divulgation. Par exemple, le profil d'expression des cellules traitées peut être analysé pour déterminer si le gène FAM60A ou des gènes localisés en position centromérique du gène FAM60A sont exprimés, si l'expression est réduite ou si les gènes ne sont pas exprimés. Par exemple, dans le cas de cellules de souris ou de hamster, il peut être analysé si le gène FAM60A est exprimé et en variante ou en outre à ceci, il peut être analysé si un ou plusieurs gènes choisis dans le groupe constitué de Bicdl, C12orf35, protéine 20 de type méthyltransférase, Dennd5b, Caprin2, Ipo8, Tmtcl ou des gènes qui sont localisés en position télomérique des gènes susmentionnés (où télomérique a cet égard signifie dans la direction de l'extrémité télomérique) sont exprimés par la cellule et/ou si l'expression est réduite ou substantiellement éliminée.
[0124] La réduction du taux d'expression de la protéine FAM60A peut être obtenue par un silençage de gène après la transcription, par exemple, par des molécules d'acide nucléique antisens, ou des molécules qui médient une interférence par ARN. Des exemples non limitants comprennent des ARNsi, des ARNsh, des miARN, des oligonucléotides antisens, etc., tous étant bien connus dans l'art.
[0125] Le taux d'expression de la protéine FAM60A peut être estimé par des procédés bien connus, par exemple, en mesurant le taux d'ARNm codant pour la protéine FAM60A, ou la protéine FAM60A elle-même. De tels procédés comprennent, par exemple, les analyses Northern blot, FACS, ImageStream, Western blot, qPCR, RT-PCR, qRT-PCR, ELISA, Luminex, Multiplex, etc.
[0126] Dans certains modes de réalisation, le taux d'expression ou l'activité de la protéine FAM60A est réduit d'au moins 3 fois, d'au moins 5 fois, d'au moins 10 fois, d'au moins 20 fois, d'au moins 30 fois, d'au moins 40 fois, d'au moins 50 fois, d'au moins 60 fois, d'au moins 70 fois, d'au moins 75 fois, d'au moins 80 fois, d'au moins 90 fois, d'au moins 100 fois, comparativement à un témoin. Gènes de matriptases et matriptases [0127] Dans certains modes de réalisation, la cellule hôte est une cellule dans laquelle le taux d'expression ou l'activité de la matriptase est réduit, comparativement à un témoin. Dans un certain mode de réalisation, une telle cellule est une cellule CHO. La demande de brevet US provisoire
No. 61/985 589, déposée le 29 avril 2014 et incorporée ici en référence, et la demande de brevet US provisoire
No. 61/994 310, déposée le 16 mai 2014 et incorporée ici en référence, fournissent une description détaillée de cellules de mammifères dans lesquelles le taux d'expression ou l'activité de la matriptase est réduit.
[0128] Divers témoins peuvent être utilisés comme il a été discuté ci-dessus. Le taux d'expression ou l'activité de la matriptase provenant d'une cellule de type sauvage correspondante peut être utilisé en tant que témoin. En variante, un témoin peut être un taux prédéterminé ou un taux seuil qui peut être identifié dans la littérature ou une base de données.
[0129] La matriptase a été décrite pour la première fois en 1993 comme une nouvelle activité gélatinolytique dans des cellules cultivées de cancer du sein. La matriptase appartient à la famille des sérine protéases transmembranaires de type II (TTSP) . Des orthologues de la matriptase sont présents dans différentes espèces de vertébrés, y compris des espèces de mammifères, et ils ont été identifiés, par exemple, chez l'être humain, le chimpanzé, le chien, la souris, le rat, le poulet, le poisson zèbre, le poisson-globe à taches vertes et le poisson-globe tigre, ce qui suggère une fonction conservée dans l'évolution. La matriptase est énoncée dans la nomenclature des enzymes IÜBMB sous la référence EC 3.4.21.109. La matriptase est également connue comme une sérine protéase de type membranaire 1 (MT-SP1) et un suppresseur de la tumorigénicité-14 (ST14) (voir Chen et al., The Transmembrane Serine Protease Matriptase: Implications for Cellular Biology and Human Diseases J Med Sei 2012; 32 (3) : 097-108) . Il s'agit d'une protéine intégrale de la membrane avec un seul domaine transmembranaire proche de l'extrémité N-terminale cytoplasmatique. La partie extracellulaire est constituée d'une région de tige (comprenant un seul domaine SEA, 2 domaines CUB et 4 domaines LDLRA) et du domaine sérine protéase C-terminal qui est structuralement hautement similaire aux autres TTSP et comprend une triade catalytique conservée histidine/acide aspartique/sérine (HDS) essentielle à l'activité catalytique (voir, par exemple, List et al., Matriptase: Potent
Proteolysis on the cell Surface; Mol Med 12 (1-3) 1-7,
January-March 2006 et Chen et al., The Transmembrane Serine Protease Matriptase: Implications for Cellular Biology and Human Diseases J Med Sei 2012; 32 (3) : 097-108) . La matriptase est décrite comme étant exprimée dans les épithéliums dans de nombreux systèmes d'organes tels que la peau, le sein, le poumon, l'épiderme, la cornée, la glande salivaire, les cavités orales et nasales, la thyroïde, le thymus, l'œsophage, la trachée, les bronchioles, les alvéoles, l'estomac, le pancréas, la vésicule biliaire, le duodénum, l'intestin grêle, le côlon, le rectum, le rein, les surrénales, la vessie, l’uretère, les vésicules séminales, l’épididyme, la prostate, les ovaires, l'utérus et le vagin (voir, List et al., 2006 et Chen et al., 2012). La matriptase est synthétisée sous la forme d'un zymogène inactif et elle est convertie en sa forme active par l'intermédiaire d'un processus compliqué. Des détails concernant le processus d'activation qui implique des clivages endoprotéolytiques sont décrits pour la matriptase humaine dans List et al. 2006 et Chen et al. 2012. La matriptase est liée à la membrane en tant que protéine transmembranaire de type II avec le domaine catalytique orienté dans l'espace extracellulaire. En outre, il est décrit dans la littérature qu'une excrétion significative de la matriptase, respectivement sa partie extracellulaire, se produit in vivo (voir List et al., 2006 et Chen et al. 2012). Il est décrit dans la littérature que la matriptase est excrétée sous la forme d'un complexe, par exemple, complexée à l'inhibiteur de la sérine protéase de type Kunitz HAI-1. Différentes études suggèrent que dans des cellules humaines, l'inhibiteur spécifique HAI-1 facilite le transport de la matriptase vers la membrane cellulaire car il a été montré que l'élimination voire même des mutations ponctuelles simples dans HAI-1 mènent à une accumulation de la matriptase dans le compartiment de Golgi. Dans la littérature, plusieurs inhibiteurs endogènes différents de la matriptase en dehors de HAI-1 ont été décrits comme HAI-2, l'antithrombine, 1'alpha-l-antitrypsine et 1 'alpha-2-antiplasmine. En outre, également d'autres inhibiteurs de la matriptase ont été décrits (voir, par exemple, Chen et al., 2012). Il est décrit dans la littérature que la matriptase peut jouer de nombreux rôles dans la physiologie animale comme la fonction de barrière cutanée, l'intégrité épithéliale, le développement des follicules pileux, et l'homéostasie du thymus, et dans des pathologies humaines, comme l'arthrose, l'athérosclérose, et la progression, l'invasion et les métastases tumorales.
[0130] A l'encontre de ce contexte scientifique, qui n'est pas apparenté à la production recombinante d'une protéine, la présente découverte que la matriptase est une protéase impliquée dans la coupure des protéines produites de façon recombinante qui sont sécrétées par les cellules hôtes dans le milieu de culture cellulaire a été hautement surprenante. En prenant en considération le grand nombre et la diversité des protéases exprimées dans les cellules des vertébrés, comme en particulier les cellules de mammifères, il a été encore plus surprenant que la réduction du taux d'expression de l'activité de cette protéine puisse réduire significativement la coupure du polypeptide d'intérêt sécrété dans le milieu de culture cellulaire. Ces effets avantageux ne sont pas observés avec d'autres protéases, même des protéases étroitement apparentées. En tant que telles, des cellules hôtes de mammifères (par exemple, des cellules CHO) avec un taux d'expression ou une activité réduit de la matriptase sont particulièrement appropriées pour la production recombinante du complexe pentamère.
[0131] La liste des séquences présente des exemples de séquences d'acides aminés de la matriptase provenant de différentes espèces de vertébrés comme le hamster (SEQ ID NO : 32 - séquence de référence du NCBI : XP_003495890) , l'être humain (SEQ ID NO : 33 - séquence de référence du NCBI : NP_068813) , la souris (SEQ ID NO : 34 -séquence de référence du NCBI : NP_035306).
[0132] Les séquences nucléotidiques codant pour la matriptase provenant de différentes espèces de mammifères ont été également rapportées. Voir, par exemple, le hamster de Chine (ID du gène du NCBI : 100755225) ; Homo sapiens (ID du gène du NCBI : 6768) ; Mus musculus (ID du gène du NCBI : 19143) ; Rattus norvegicus (ID du gène du NCBI : 114093) ; Pan Troglodytes (ID du gène du NCBI : 100188950) et d'autres. Des synonymes pour certains du gène de la matriptase sont énumérés dans le tableau 3, parmi lesquels sont couramment utilisés « ST14 » ou « Stl4 ».
[0133] Comme cela est montré dans le tableau 3, la matriptase est également appelée « protéine suppresseur de la tumorigénicité 14 » (par exemple, pour l'être humain) et « homologue de la protéine suppresseur de la tumorigénicité 14 » (par exemple, chez la souris et le hamster de Chine) . Pour simplifier, dans cette divulgation, les homologues et les orthologues de différentes espèces sont tous appelés « gène de la matriptase » ou « matriptase » (protéine).
[0134] Sont également décrits ici des variants fonctionnels d'une matriptase (des variants qui possèdent substantiellement les mêmes activités catalytiques qu'une matriptase de type sauvage) . Par exemple, un variant de la matriptase peut comprendre une séquence qui est identique au moins à 50 %, au moins à 60 %, au moins à 70 %, au moins à 75 %, au moins à 80 %, au moins à 85 %, au moins à 90 %, au moins à 95 %, au moins à 96 %, au moins à 97 %, au moins à 98 % ou au moins à 99 % avec l'une quelconque des séquences de SEQ ID NO : 32 à 34, et qui possède les mêmes ou substantiellement les mêmes activités catalytiques qu'une protéine matriptase de type sauvage. L'activité catalytique d'un variant de la matriptase peut être estimée, par exemple, par la réaction chimique pour cliver divers substrats synthétiques avec Arg ou Lys en position PI et il est préféré des acides aminés à petite chaîne latérale, tels que Ala et Gly, en position P2 (voir, EC 3.4.21.109).
[0135] Sont également décrits ici des fragments fonctionnels d'une matriptase (des fragments qui possèdent substantiellement les mêmes activités catalytiques qu'une matriptase pleine longueur). Un fragment fonctionnel d'une matriptase peut être un sous-ensemble d'acides aminés consécutifs de la matriptase pleine longueur divulguée ici, et qui possède les mêmes ou substantiellement les mêmes activités catalytiques que la séquence de la protéine pleine longueur. L'activité catalytique d'un fragment de la matriptase peut être estimée, par exemple, par la réaction chimique pour cliver divers substrats synthétiques avec Arg ou Lys en position PI et il est préféré des acides aminés à petite chaîne latérale, tels que Ala et Gly, en position P2 (voir, EC 3.4.21.109).
[0136] La réduction du taux d'expression ou de l'activité d'une matriptase peut être obtenue par divers moyens. Par exemple, le taux d'expression ou l'activité d'une matriptase peut être réduit par inactivation de gène, mutation de gène, délétion de gène, silençage de gène, ou une combinaison quelconque des précédents. L'inactivation de gène est une technique génétique par laquelle un gène est rendu inopérant par perturbation de sa fonction. Par exemple, un acide nucléique peut être inséré dans la séquence codante, perturbant de cette façon la fonction du gène. En outre, le gène de la matriptase pleine longueur (ou l'un de ses fragments) peut être délété, grâce à quoi l'expression de la matriptase fonctionnelle est substantiellement éliminée. Par exemple, la délétion peut être d'au moins 30 %, d'au moins 40 %, d'au moins 50 %, d'au moins 55 %, d'au moins 60 %, d'au moins 65 %, d'au moins 70 %, d'au moins 75 %, d'au moins 80 %, d'au moins 85 %, d'au moins 90 %, d'au moins 95 %, ou de 100 % de la séquence codante du gène de la matriptase. Une autre option est d'introduire une ou plusieurs mutations dans la séquence codante, ce qui rend une matriptase non fonctionnelle ou moins fonctionnelle. Par exemple, une ou plusieurs mutations de décalage du cadre peuvent être introduites, produisant une matriptase non fonctionnelle ou moins fonctionnelle. En variante ou en outre, un ou plusieurs codons d'arrêt peuvent être introduits dans la séquence codante de telle façon qu'il est obtenu une protéine tronquée, non fonctionnelle ou moins fonctionnelle. D'autres options comprennent, mais n'y sont pas limitées, une ou plusieurs mutations dans le promoteur, dans les UTR en 5' et/ou en 3' ou d'autres éléments régulateurs, par exemple par introduction d'une délétion du promoteur ou par introduction d'une construction entre le promoteur et le départ de la transcription. Des procédés pour la perturbation de gènes pour supprimer ou éliminer l'expression du gène cible sont bien connus de l'homme du métier.
[0137] Puisque chaque cellule comporte deux copies du gène de la matriptase dans son génome, dans certains modes de réalisation, au moins une copie de la séquence génomique du gène de la matriptase, ou au moins 50 % de la séquence codante dudit gène de la matriptase, ou d'un fragment fonctionnel gène de la matriptase, est délétée. Dans certains modes de réalisation, les deux copies des séquences génomiques du gène de la matriptase (ou au moins 50 % de la séquence codante dudit gène de la matriptase, ou d'un fragment fonctionnel dudit gène de la matriptase, à partir de chaque copie) sont délétées.
[0138] Dans certains modes de réalisation, la cellule hôte comprend une mutation dans l'exon 2 du gène de la matriptase. L'exon 2 est particulièrement approprié en tant que cible pour modifier l'activité matriptase parce qu'il existe plusieurs variants d'épissage fonctionnels différents. Ainsi, les exons proches de l'extrémité N-terminale de la matriptase comme par exemple l'exon 1, l'exon 2 et l'exon 3, sont avantageux pour introduire une ou plusieurs mutations, en particulier une ou plusieurs mutations de décalage du cadre. Une mutation de décalage du cadre dans l'un de ces exons mène le plus vraisemblablement à un codon d'arrêt précoce dans la séquence. Des mutations peuvent être également introduites dans l'un des exons subséquents, par exemple choisis parmi les exons 4 à 19.
[0139] Dans certains modes de réalisation, la matriptase comprend une mutation dans le domaine catalytique. Le domaine catalytique est la région d'une enzyme qui interagit avec son substrat pour provoquer la réaction enzymatique. Une ou plusieurs mutations peuvent être introduites dans ce domaine de telle façon que l'activité catalytique de la protéine est réduite comparativement à un témoin. Le domaine catalytique comprend des séquences codées par les exons 16, 17, 18 et 19. Les mutations peuvent être une délétion, une insertion, une substitution, ou l'une de leurs combinaisons. Les mutations peuvent provoquer une mutation de décalage du cadre, une mutation ponctuelle spécifique, une mutation de codon d'arrêt, ou l'une de leurs combinaisons, dans la séquence codant pour le domaine catalytique. Des mutants inactifs du point de vue catalytique de la matriptase comme par exemple la G827R-matriptase ou la S805A-matriptase ont été également décrits dans la littérature (voir Désilets et al., The Journal of Biological Chemistry Vol. 283, No. 16, pp. 10535-10542, 2008). En outre, la structure cristalline du domaine catalytique d'une matriptase recombinante est connue. D'après cette structure et les données sur la séquence, l'homme du métier peut dériver d'autres cibles spécifiques pour des mutations afin d'altérer la fonction catalytique de la matriptase.
[0140] La réduction du taux d'expression de la matriptase peut être obtenue par un silençage de gène après la transcription, par exemple par des molécules d'acide nucléique antisens, ou des molécules qui médient une interférence par ARN. Les exemples non limitants comprennent des ARNsi, des ARNsh, des miARN, des oligonucléotides antisens, etc., tous étant bien connus dans l’art.
[0141] Le taux d’expression de la matriptase peut être estimé par des procédés connus dans l’art, par exemple, en mesurant le taux d’ARNm codant pour la matriptase, ou la matriptase elle-même. De tels procédés comprennent, par exemple, les analyses Northern blot, FACS, ImageStream, Western blot, qPCR, RT-PCR, qRT-PCR, ELISA, Luminex, Multiplex, etc. L’activité de la matriptase peut être estimée, par exemple, selon son activité enzymatique.
[0142] Da ns certains modes de réalisation, le taux d’expression ou l’activité de la matriptase est réduit d’au moins 3 fois, d’au moins 5 fois, d’au moins 10 fois, d’au moins 20 fois, d’au moins 30 fois, d’au moins 40 fois, d’au moins 50 fois, d’au moins 60 fois, d’au moins 70 fois, d’au moins 75 fois, d’au moins 80 fois, d’au moins 90 fois, d’au moins 100 fois, comparativement à un témoin.
Tableau 2
Abréviations et variantes de noms (alias) de produits codés par des gènes localisés dans le chromosome 8 du hamster de Chine ou le chromosome 6 de la souris.
Tableau 3
Exemples de variantes de noms du gène de la matriptase et/ou du produit de la protéine codée de la matriptase utilisés dans la littérature (ordre alphabétique)
[0143] Une cellule hôte appropriée peut comporter des combinaisons quelconques des modifications décrites ici, par exemple, une cellule dans laquelle à la fois le taux d'expression ou l'activité de la protéine C12orf35 est réduit dans ladite cellule, comparativement à un témoin, et le taux d'expression ou l'activité de la protéine FAM60A est réduit dans ladite cellule, comparativement à un témoin. D'autres combinaisons comprennent, par exemple, la réduction de du taux d'expression ou de l'activité de la protéine C12orf35, et la réduction du taux d'activité ou de l'activité de la matriptase ; la réduction du taux d'expression ou de l'activité de la protéine FAM60A, et la réduction du taux d'expression ou de l'activité de la matriptase ; la réduction du taux d'expression ou de l'activité de la protéine C12orf35, la réduction du taux d'expression ou de l'activité de la protéine FAM60A, et la réduction du taux d'expression ou de l'activité de la matriptase ; la réduction du taux d'expression ou de l'activité de la protéine C12orf35, et l'inclusion de la séquence de la dihydrofolate réductase (DHFR) en tant que marqueur de sélection, etc.
[0144] Les cellules hôtes décrites ici sont appropriées pour une culture à grande échelle. Par exemple, les cultures cellulaires peuvent être de 10 1, 30 1, 50 1, 100 1, 150 1, 200 1, 300 1, 500 1, 1000 1, 2000 1, 3000 1, 4000 1, 5000 1, 10,000 1 ou plus grandes. Dans certains modes de réalisation, la taille de la culture cellulaire peut se situer dans la plage de 10 1 à 5000 1, de 10 1 à 10,000 1, de 10 1 à 20 000 1, de 10 là 50 000 1, de 40 là 50 000 1, de 100 1 à 50 000 1, de 500 1 à 50 000 1, de 1000 1 à 50 000 1, de 2000 1 à 50 000 1, de 3000 1 à 50 000 1, de 4000 1 à 50 000 1, de 4500 1 à 50 000 1, de 1000 1 à 10 000 1, de 1000 1 à 20 000 1, de 1000 1 à 25 000 1, de 1000 1 à 30 000 1, de 15 1 à 2000 1, de 40 1 à 1000 1, de 100 1 à 500 1, de 200 1 à 400 1, ou tout nombre entier entre ces valeurs.
[0145] Les composants des milieux pour culture cellulaire sont connus dans l'art, et ils peuvent comprendre, par exemple, un tampon, une teneur en acides aminés, une teneur en vitamines, une teneur en sels, une teneur en minéraux, une teneur en sérum, une teneur en source de carbone, une teneur en lipides, une teneur en acides nucléiques, une teneur en hormones, une teneur en oligo-éléments, une teneur en ammoniac, une teneur en cofacteurs, une teneur en indicateurs, une teneur en petites molécules, une teneur en hydrolysats et une teneur en modulateurs enzymatiques. 4. Purification du complexe pentamère à partir de la culture cellulaire [0146] Le complexe pentamère produit conformément au procédé décrit ici peut être récolté à partir des cellules hôtes, et purifié en utilisant tout procédé approprié. Les procédés appropriés comprennent la précipitation et divers types de chromatographie, comme l'interaction hydrophobe, l'échange d'ions, l'affinité, la chélation, et l'exclusion par la taille, tous étant connus dans l'art. Des schémas de purification appropriés peuvent être créés en utilisant deux ou plus de ces procédés appropriés ou d'autres. Si c'est souhaité, une ou plusieurs des sous-unités du complexe pentamère peuvent comprendre un « marqueur » qui facilite la purification, comme un marqueur épitopique ou un marqueur HIS, un marqueur Strep. De tels polypeptides marqués peuvent être purifiés de façon pratique, par exemple à partir de milieux conditionnés, par chromatographie chélatrice ou chromatographie d'affinité. Eventuellement, la séquence du marqueur peut être clivée après la purification.
[0147] Par exemple, le document WO 2014/005959 divulgue des exemples de procédés de purification du complexe pentamère par chromatographie d'affinité.
[0148] Dans certains modes de réalisation, une ou plusieurs sous-unités du complexe pentamère comprennent un marqueur pour une purification par affinité. Les exemples de marqueurs pour une purification par affinité comprennent, par exemple, le marqueur His (se lie aux ions métalliques), un anticorps (se lie à la protéine A ou à la protéine G) , la protéine de liaison du maltose (MBP) (se lie à l'amylose), la glutathion-S-transférase (GST) (se lie au glutathion), le marqueur FLAG (Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys (SEQ ID NO : 37)) (se lie à un anticorps anti-flag), le marqueur Strep (se lie à la streptavidine ou à l'un de ses dérivés).
[0149] La structure du complexe pentamère gH/gL/pUL128/pUL130/pUL131 est inconnue. Toutefois, si le marqueur pour la purification par affinité est fixé à un site qui interfère avec la formation du complexe pentamère, ou à un site qui est enterré au sein du complexe, la purification par affinité ne sera pas couronnée de succès. On pense que les sites suivants sont appropriés pour fixer un marqueur pour la purification par affinité, car le marqueur ne semble pas interférer avec la formation du complexe pentamère, et semble être exposé à la surface d'un pentamère assemblé : (i) la région C-terminale de la pUL130, (ii) la région N-terminale de la pUL130, (iii) la région C-terminale de la pUL131, (iv) la région N-terminale de la pUL131, (v) la région C-terminale de la pUL128, (vi) la région N-terminale de la pUL128, ou l'une de leurs combinaisons.
[0150] Dans certains modes de réalisation, le complexe pentamère ne comprend pas de marqueur pour la purification.
[0151] Un autre procédé approprié est la chromatographie par échange d'ions. Les exemples de matériaux utiles dans la chromatographie par échange d'ions comprennent la DEAE-cellulose, la QAE-cellulose, la DEAE-céphalose, la QAE-céphalose, DEAE-Toyopearl, QAE-Toyopearl, Mono Q, Mono S, Q sepharose, SP sepharose, etc. Dans un exemple de mode de réalisation, le procédé utilise une colonne de Mono S. Dans un autre exemple de mode de réalisation, le procédé utilise une colonne de Mono Q.
[0152] Dans certains modes de réalisation, le rendement du complexe pentamère du CMV est d'au moins environ 0,01 g/1, d'au moins environ 0,02 g/1, d'au moins environ 0,03 g/1, d'au moins environ 0,05 g/1, d'au moins environ 0,06 g/1, d'au moins environ 0,07 g/1, d'au moins environ 0,08 g/1, d'au moins environ 0,09 g/1, d'au moins environ 0,1 g/1, d'au moins environ 0,15 g/1, d'au moins environ 0,20 g/1, d'au moins environ 0,25 g/1, d'au moins environ 0,3 g/1, d'au moins environ 0,35 g/1, d'au moins environ 0,4 g/1, d'au moins environ 0,45 g/1, d'au moins environ 0,5 g/1, d'au moins environ 0,55 g/1, d'au moins environ 0,6 g/1, d'au moins environ 0,65 g/1, d'au moins environ 0,7 g/1, d'au moins environ 0,75 g/1, d'au moins environ 0,8 g/1, d'au moins environ 0,85 g/1, d'au moins environ 0,9 g/1, d'au moins environ 0,95 g/1, ou d'au moins environ 1,0 g/1. 5. Définitions [0153] Le terme « fragment formant un complexe » d'une protéine du CMV (comme gH, gL, pUL128, pUL130, ou pUL131) se rapporte à toute partie ou portion de la protéine qui conserve la capacité de former un complexe avec une autre protéine du CMV. De tels complexes comprennent, par exemple, le complexe pentamère gH/gL/pUL128/pUL130/pUL131. Les fragments qui conservent la capacité de former le complexe pentamère sont également appelés « fragments formant le pentamère ».
[0154] Une « culture à grande échelle » se rapporte à une culture qui a une taille d'au moins environ 10 litres (par exemple, un volume d'au moins environ 10 1, d'au moins environ 20 1, d'au moins environ 30 , d'au moins environ 40 1, d'au moins environ 50 1, d'au moins environ 60 1, d'au moins environ 70 1, d'au moins environ 80 1, d'au moins environ 90 1, d'au moins environ 100 1, d'au moins environ 150 1, d'au moins environ 200 1, d'au moins environ 250 1, d'au moins environ 300 1, d'au moins environ 400 1, d'au moins environ 500 1, d'au moins environ 600 1, d'au moins environ 700 1, d'au moins environ 800 1, d'au moins environ 900 1, d'au moins environ 1000 1, d'au moins environ 2000 1, d'au moins environ 3000 1, d'au moins environ 4000 1, d'au moins environ 5000 1, d'au moins environ 6000 1, d'au moins environ 10 000 1, d'au moins environ 15 000 1, d'au moins environ 20 000 1, d'au moins environ 25 000 1, d'au moins environ 30 000 1, d'au moins environ 35 000 1, d'au moins environ 40 000 1, d'au moins environ 45 000 1, d'au moins environ 50 000 1, d'au moins environ 55 000 1, d'au moins environ 60 000 1, d'au moins environ 65 000 1, d'au moins environ 70 000 1, d'au moins environ 75 000 1, d'au moins environ 80 000 1, d'au moins environ 85 000 1, d'au moins environ 90 000 1, d'au moins environ 95 000 1, d'au moins environ 100 000 1, etc.).
[0155] Un complexe pentamère « soluble » se rapporte au complexe gH/gL/pUL128/pUL130/pUL131 dans lequel la sous-unité gH ne comprend pas le domaine transmembranaire.
[0156] Dans tout le mémoire, y compris les revendications, où le contexte le permet, le terme « comprenant » et ses variantes comme « comprend » ou « comprenant » doivent être interprétés comme incluant le nombre entier ou les nombres entiers indiqués sans exclure nécessairement tout autre nombre entier.
[0157] L'identité de séquence est calculée selon le pourcentage de correspondances de résidus entre deux séquences polypeptidiques, ou de correspondances de nucléotides entre deux séquences polynucléotidiques, alignées en utilisant un algorithme normalisé. Un tel algorithme peut insérer, d'une façon normalisée et reproductible, des brèches dans les séquences comparées afin d'optimiser l'alignement entre deux séquences, et par conséquent, obtenir une comparaison plus significative des deux séquences. Le pourcentage d'identité peut être mesuré sur la longueur d'une séquence définie entière, ou il peut être mesuré sur une longueur plus courte, par exemple, sur la longueur d'un fragment pris à partir d'une séquence définie plus grande, par exemple, un fragment d'au moins 45, d'au moins 60, d'au moins 90, d'au moins 120, d'au moins 150, d'au moins 210 ou d'au moins 450 résidus ou nucléotides consécutifs. Si la longueur n'est pas spécifiée, l'identité de séquence est calculée sur la pleine longueur de la plus courte des deux séquences.
[0158] Cette invention est en outre illustrée par les exemples suivants qui ne devront pas être interprétés comme limitants.
Exemples [0159] Cet exemple concerne la production du complexe protéinique pentamère du CMV par des lignées cellulaires CHO dans lesquelles les séquences codantes des sous-unités du pentamère ont été intégrées de façon stable dans le chromosome. Les lignées cellulaires sont également qualifiées de lignées cellulaires CHO stables.
[0160] Comme cela est montré dans cet exemple, ces lignées cellulaires CHO stables ont produit un pentamère fonctionnel du CMV, avec les cinq sous-unités assemblées dans la conformation naturelle. Le rendement est élevé, permettant de cette façon la production du complexe pentamère à une grande échelle commerciale. Ces lignées cellulaires sont particulièrement appropriées pour la fabrication à grande échelle de vaccins contre le CMV utilisant le pentamère.
[0161] Comme cela est montré dans cet exemple, les séquences nucléotidiques codant pour 1'ectodomaine de la gH, la gL, la pUL128, la pUL130 et la pUL131 ont été clonées dans des vecteurs d'expression simples ou doubles, avec des promoteurs subgénomiques et des 1RES pour diriger l'expression du composant individuel (figure 1). De façon spécifique, les séquences codant pour 1'ectodomaine de la gH, les gL, pUL128, pUL130 et pUL131 pleine longueur ont été optimisées pour les codons pour une expression en culture de cellules de mammifères, synthétisées et clonées dans un vecteur d'expression simple (avec sélection par Neo et DHFR) dirigé par le promoteur du CMV (pour les gH et UL128) et 1'1RES de l'EV71 (pour les gL, UL130, UL131) pour l'expression ; ou des vecteurs d'expression doubles, un avec sélection par Neo et DHFR pour la gH dirigé par le promoteur du CMV, et pour la gL dirigé par le promoteur du CMV ou l'IRES de l'EV71, et un avec sélection par Hyg et Fra pour la UL128 dirigé par le promoteur du CMV, pour les UL130 et UL131 dirigé par l'IRES de l'EV71 (figure 1) . Les marqueurs pour la purification par affinité comme le marqueur His et/ou le marqueur Strep ont été introduits à l'extrémité C-terminale de 1 ' ectodomaine de la gH et/ou de UL130 pour faciliter la purification. Le codon d'arrêt et le domaine transmembranaire de la gH ont été également introduits à l'extrémité C-terminale de 1'ectodomaine de la gH pour faciliter le sous-clonage par FACS (figure 1).
[0162] Le plasmide ou les plasmides d'expression ont été transfectés dans un panel de cellules hôtes CHO, comprenant les lignées cellulaires KO pour la matriptase (i) CHOC8TD, (ii) CH0HPT3 et (iii) CHOC8TD.
[0163] CHOC8TD est dérivée d'une lignée cellulaire CHO Kl et elle est en outre modifiée par délétion de la région télomérique du chromosome, si bien que cette lignée cellulaire a les caractéristiques suivantes : (i) télomère du chromosome 8 délété ; (ii) productivité élevée et bonne croissance cellulaire ; et (iii) problèmes potentiels de dégradation protéolytique élevée. CH0HPT3 est une lignée cellulaire CHO Kl montrant une activité protéolytique réduite, si bien que cette lignée cellulaire a les caractéristiques suivantes : (i) dégradation protéolytique inférieure à CHOC8TD, et (ii) croissance, productivité et efficacité du clonage inférieures à CHOC8TD. CHOC8TD KO pour la matriptase a été dérivée de CHOC8TD, avec la matriptase inactivée, si bien que cette lignée cellulaire a les caractéristiques suivantes : (i) matriptase (sérine protéase) inactivée ; et (ii) dégradation protéolytique moindre.
[0164] Le plasmide ou les plasmides d'expression comprenant les séquences codant pour les gH, gL, UL128, UL130 et UL131 ont été transfectés dans les trois cellules hôtes avec Nucleofection ΑΜΑΧΑ. Pour la stratégie à vecteur simple, les cellules transfectées ont été sélectionnées par G418 et MTX séquentiellement. Pour la stratégie à vecteur double, les cellules transfectées ont été sélectionnées par Hyg puis MTX séquentiellement.
[0165] Les groupes de cellules survivantes ont été cultivés en culture fermée pour produire les protéines du pentamère jusqu'à l'évaluation des protéines pour le rendement avec un test ELISA indirect, la contamination par gH/gL et la dégradation de gL avec les analyses Western et SDS-PAGE. En se basant sur le rendement du pentamère et la croissance des cellules, le groupe des cellules CHO transfectées avec la stratégie de vecteur 2 (figure 1) , en utilisant des cellules hôtes CH0C8TD, a été sélectionné pour le clonage des cellules simples (plasmide d'expression représenté sur la figure 2). Les clones sélectionnés montrent un rendement élevé et moins de contamination par gH/gL.
[0166] Les clones simples ont été triés avec une analyse FACS en utilisant des Acm spécifiques du pentamère (~ 200). Les 30 clones principaux ont été d'abord sélectionnés en se basant sur le titre du pentamère évalué par un test ELISA indirect et ils ont été en outre sélectionnés pour les ramener à 12 clones principaux. Une culture fermée suivie d'une purification par affinité à l'aide de Strep a montré que les 12 principaux peuvent produire le pentamère avec un rendement > 300 mg/1 et une pureté élevée (figure 3) . En fait, les clones principaux ont produit le pentamère avec un rendement d'environ 0,3 g/1 à environ 0,5 g/1. Le complexe protéinique purifié a été évalué pour sa liaison avec un panel d'Acm dirigés contre le pentamère, et il a été montré qu'ils présentaient tous les épitopes clés.
[0167] Les 12 clones principaux ont été en outre évalués à l'aide d'études de stabilité sur 14 semaines (figure 4). Les lots contrôlés et non contrôlés ont été évalués pour la croissance cellulaire et le titre du pentamère et le clone VF7 a été sélectionné.
[01 68] La production en bioréacteur du pentamère avec le clone principal VF7 a été également estimée. Ce clone a produit > 100 mg/1 de pentamère purifié (figure 5).
[0169] Comme cela est exemplifié ici, les cellules CHO stables peuvent être utilisées pour exprimer le pentamère. Ceci est en contraste avec l'expression transitoire par les cellules HEK293. Les lignées cellulaires CHO stables de l'invention peuvent produire les protéines du pentamère de façon régulière avec un rendement 100 fois supérieur.
[0170] La capacité à produire des lignées cellulaires CHO stables dans lesquelles les séquences codant pour les cinq sous-unités du pentamère sont intégrées dans le chromosome, comme cela est exemplifié ici, est plutôt remarquable. Il existe toujours des incertitudes quant à si une lignée cellulaire stable peut être produite, même pour une seule protéine. Par exemple, lorsqu'une séquence codant pour l'IGF-1 humain a été introduite dans des cellules CHO pour produire une lignée stable, il a été découvert que les lignées cellulaires IGF-l/CHO résultantes présentaient une inhibition de la croissance cellulaire et des titres bas. La mesure du titre maximal a été d'environ 8 pg/ml ce qui correspond à 100 mg/1 d'un titre d'anticorps (en se basant sur la masse molaire). Comparativement, les mesures de titre moyen d'un anticorps recombinant dans un procédé en bioréacteur sont autour de 3 g/1. Une cause du titre bas d'IGF-1 a été la réduction de la croissance cellulaire et la faible viabilité cellulaire des cellules exprimant l'IGF-1. Durant un procédé d'expression d'anticorps, des cellules dérivées de CHO-K1 se sont développées jusqu'à 2 x 107 cellules/ml et la viabilité cellulaire est supérieure à 97 % durant les 230 à 260 premières heures du temps de culture. Au contraire, des cellules dérivées de CHO-Kl exprimant l'IGF-1 ne se sont développées que jusqu'à 0,5 x 107 cellules/ml et la viabilité cellulaire avait déjà chuté au-dessous de 97 % après deux jours. Pour d'autres détails, voir, la demande US provisoire No. 61/738466, déposée le 18 décembre 2012 et la publication de demande PCT No. WO/2014/097113, déposée le 16 décembre 2013 .
[0171] Par conséquent, les inventeurs ont fait face à des difficultés supplémentaires significatives parce que les séquences codant pour les cinq sous-unités du pentamère du CMV doivent être intégrées de façon stable dans le génome de la cellule CHO. Les inventeurs ont surmonté ces difficultés, comme cela est mis en évidence par les clones sélectionnés montrant des rendements élevés, avec le pentamère produit de façon recombinante dans sa conformation naturelle et avec tous les épitopes clés.
[0172] Les diverses caractéristiques et les divers modes de réalisation de la présente invention, auxquels il est fait référence dans des sections individuelles ci-dessus s'appliquent, comme il est approprié, aux autres sections, mutatis mutandis. Par conséquent, les caractéristiques précisées dans une section peuvent être combinées avec des caractéristiques spécifiées dans d'autres sections, comme il est approprié.
[0173] Le mémoire est au mieux compris à la lumière des enseignements des références citées au sein du mémoire. Les modes de réalisation au sein du mémoire fournissent une illustration de modes de réalisation de l'invention et ne devront pas être interprétés comme limitant l'étendue de l'invention. L'homme du métier comprend facilement que de nombreux autres modes de réalisation sont englobés par l'invention. La totalité des publications, des brevets, et des séquences de GenBank cités dans cette divulgation sont incorporés en référence dans leur intégralité. Dans la mesure où le matériau incorporé en référence contredit ou est incohérent avec ce mémoire, le mémoire supplantera tout matériau de ce type. La citation de l'une quelconque des références ici n'est pas une admission que de telles références sont de l'art antérieur à la présente invention.
[0174] L'homme du métier reconnaîtra, ou sera capable de déterminer en utilisant une expérimentation ne dépassant pas la routine, de nombreux équivalents aux modes de réalisation spécifiques de l'invention décrite ici. De tels équivalents sont censés être englobés par les modes de réalisation suivants.
[0175] Les modes de réalisation particuliers de l'invention comprennent : 1. Une cellule recombinante de mammifère, comprenant : une ou plusieurs séquences polynucléotidiques codant pour le complexe pentamère du cytomégalovirus (CMV), où ledit complexe pentamère comprend : la gH ou l'un de ses fragments formant un complexe, la gL ou l'un de ses fragments formant un complexe, la pUL128 ou l'un de ses fragments formant un complexe, la pUL130 ou l'un de ses fragments formant un complexe, et la pUL131 ou l'un de ses fragments formant un complexe ; où lesdites une ou plusieurs séquences polynucléotidiques sont intégrées dans l'ADN génomique de ladite cellule de mammifère. 2. La cellule de mammifère du mode de réalisation 1, où ladite cellule de mammifère est une cellule d'ovaire de hamster de Chine (CHO). 3. La cellule de mammifère du mode de réalisation 2, où ladite cellule CHO est une cellule CHO-K1, CHO-DUXB11, ou CHO-DG44. 4. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 3, où le taux d'expression ou l'activité de la protéine C12orf35 est réduit dans ladite cellule, comparativement à un témoin. 5. La cellule de mammifère du mode de réalisation 4, où au moins une copie de la séquence génomique du gène C12orf35, ou au moins 50 % de la séquence codante dudit gène C12orf35, est délétée. 6. La cellule de mammifère du mode de réalisation 5, où les deux copies des séquences génomiques du gène C12orf35, ou au moins 50 % de la séquence codante dudit gène C12orf35 à partir de chaque copie, sont délétées. 7. La cellule de mammifère du mode de réalisation 4 ou 5, où au moins une copie de la région télomérique du chromosome 8 d'une cellule CHO qui comprend le gène C12orf35 est délétée. 8. La cellule de mammifère du mode de réalisation 7, où ladite région télomérique comprend en outre un gène choisi dans le groupe constitué de : Bicdl, Amnl, protéine 20 de type méthyltransférase, Dennd5b, FAM60A, Caprin2, Ipo8, RPS4Y2, et l’une de leurs combinaisons. 9. La cellule de mammifère de l’un quelconque des modes de réalisation 4 à 8, où ladite protéine C12orf35 comprend une séquence qui est au moins identique à 80 % avec l'une quelconque des séquences choisies dans le groupe constitué des SEQ ID NO : 21, 22, 23, 24 et 35. 10. La cellule de mammifère de l'un quelconque des modes de réalisation 4 à 9, où ledit gène C12orf35 comprend une séquence qui est au moins identique à 80 % avec SEQ ID NO : 25. 11. La cellule de mammifère du mode de réalisation 4, où ladite cellule comprend une mutation dans le promoteur, l'UTR en 5', ou l'UTR en 3' dudit gène C12orf35. 12. La cellule de mammifère du mode de réalisation 4, où ladite protéine C12orf35 comprend une mutation qui réduit son activité, comparativement à un témoin. 13. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 12, où le taux d'expression ou l'activité de la protéine FAM60A est réduit dans ladite cellule, comparativement à un témoin. 14. La cellule de mammifère du mode de réalisation 13, où au moins une copie de la séquence génomique du gène FAM60A, ou au moins 50 % de la séquence codante dudit gène FAM60A, est délétée. 15. La cellule de mammifère du mode de réalisation 14, où les deux copies des séquences génomiques du gène FAM60A, ou au moins 50 % de la séquence codante dudit gène FAM60A à partir de chaque copie, sont délétées. 16. La cellule de mammifère du mode de réalisation 13 ou 14, où ladite séquence délétée comprend une portion de la région télomérique du chromosome 8 d'une cellule CHO. 17. La cellule de mammifère du mode de réalisation 16, où ladite séquence délétée comprend en outre un gène choisi dans le groupe constitué de : Caprin2 et Ipo8, et l’une de leurs combinaisons. 18. La cellule de mammifère de l’un quelconque des modes de réalisation 13 à 17, où ladite protéine FAM60A comprend une séquence qui est au moins identique à 80 % avec l'une quelconque des séquences choisies dans le groupe constitué des SEQ ID NO : 28, 29, et 30. 19. La cellule de mammifère de l'un quelconque des modes de réalisation 13 à 18, où ledit gène FAM60A comprend une séquence qui est au moins identique à 80 % avec SEQ ID NO : 31. 20. La cellule de mammifère du mode de réalisation 13, où ladite cellule comprend une mutation dans le promoteur, l'ÜTR en 5', ou l'UTR en 3' dudit gène FAM60A. 21. La cellule de mammifère du mode de réalisation 13, où ladite protéine FAM60A comprend une mutation qui réduit son activité, comparativement à un témoin. 22. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 21, où le taux d'expression ou l'activité de la matriptase est réduit dans ladite cellule, comparativement à un témoin. 23. La cellule de mammifère du mode de réalisation 22, où au moins une copie de la séquence génomique du gène de la matriptase, ou au moins 50 % de la séquence codante du gène de la matriptase, est délétée. 24. La cellule de mammifère du mode de réalisation 23, où les deux copies des séquences génomiques du gène de la matriptase, ou au moins 50 % de la séquence codante dudit gène de la matriptase à partir de chaque copie, sont délétées. 25. La cellule de mammifère de l'un quelconque des modes de réalisation 22 à 25, où ladite matriptase comprend une séquence qui est au moins identique à 80 % avec l'une quelconque des séquences choisies dans le groupe constitué des SEQ ID NO : 32, 33, et 34. 26. La cellule de mammifère du mode de réalisation 22, où ladite cellule comprend une mutation dans 1'exon 2 du gène de la matriptase. 27. La cellule de mammifère du mode de réalisation 22, où ladite cellule comprend une mutation dans le promoteur, l'UTR en 5', ou l'UTR en 3' du gène de la matriptase. 28. La cellule de mammifère du mode de réalisation 22, où ladite matriptase comprend une mutation qui réduit son activité, comparativement à un témoin. 29. La cellule de mammifère du mode de réalisation 28, où ladite matriptase comprend une mutation dans le domaine catalytique. 30. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 29, où la dihydrofolate réductase (DHFR) endogène de ladite cellule de mammifère est déficiente. 31. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 29, où la dihydrofolate réductase (DHFR) endogène de ladite cellule de mammifère est compétente. 32. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 31, où ledit fragment formant un complexe de la gH ne comprend pas la séquence signal d'une protéine gH pleine longueur. 33. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 32, où ledit fragment formant un complexe de la gH ne comprend pas le domaine transmembranaire d'une protéine gH pleine longueur. 34. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 33, où ledit fragment formant un complexe de la gH comprend 1'ectodomaine d'une protéine gH pleine longueur. 35. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 34, où ladite gH comprend une séquence choisie dans le groupe constitué des SEQ ID NO : 1, 2, 3, 4, et 5. 36. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 35, où ledit fragment formant un complexe de la gH (i) forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; et (i i) comprend au moins un épitope provenant de SEQ ID NO : 1, SEQ ID NO : 2, SEQ ID NO : 3, SEQ ID NO : 4, ou SEQ ID NO : 5. 37. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 36, où ledit fragment formant un complexe de la gL ne comprend pas la séquence signal d'une protéine gL pleine longueur. 38. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 37, où ladite gL comprend une séquence choisie dans le groupe constitué des SEQ ID NO : 6, 7, 8, et 9. 39. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 38, où ledit fragment formant un complexe de la gL (i) forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; et (ii) comprend au moins un épitope provenant de SEQ ID NO : 6, SEQ ID NO : 7, SEQ ID NO : 8, ou SEQ ID NO : 9. 40. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 39, où ledit fragment formant un complexe de la pUL128 ne comprend pas la séquence signal d'une protéine pUL128 pleine longueur. 41. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 40, où ladite pUL128 comprend une séquence choisie dans le groupe constitué des SEQ ID NO : 10, 11, 12 et 13. 42. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 41, où ledit fragment formant un complexe de la pULl28 (i) forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; et (ii) comprend au moins un épitope provenant de SEQ ID NO : 10, SEQ ID NO : 11, SEQ ID NO : 12, ou SEQ ID NO : 13. 43. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 42, où ledit fragment formant un complexe de la pUL130 ne comprend pas la séquence signal d'une protéine pULl30 pleine longueur. 44. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 43, où ladite pUL130 comprend une séquence choisie dans le groupe constitué des SEQ ID NO : 14, 15, et 16. 45. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 44, où ledit fragment formant un complexe de la pULl30 (i) forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; et (ii) comprend au moins un épitope provenant de SEQ ID NO : 14, SEQ ID NO : 15, ou SEQ ID NO : 16. 46. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 45, où ledit fragment formant un complexe de la pUL131 ne comprend pas la séquence signal d'une protéine pUL131 pleine longueur. 47. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 46, où ladite pUL131 comprend une séquence choisie dans le groupe constitué des SEQ ID NO : 17, 18, 19, et 20. 48. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 47, où ledit fragment formant un complexe de la pUL131 (i) forme une partie du complexe pentamère gH/gL/pUL128/pUL130/pUL131 ; et (ii) comprend au moins un épitope provenant de SEQ ID NO : 17, SEQ ID NO : 18, SEQ ID NO : 19, ou SEQ ID NO : 20. 49. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 48, où ledit complexe pentamère est soluble. 50. La cellule de mammifère de l'un quelconque des modes de réalisation 1 à 49, où ledit complexe pentamère est sécrété à partir de la cellule hôte. 51. Une culture à grande échelle comprenant la cellule de mammifère de l'un quelconque des modes de réalisation 1 à 50, où ladite culture a une taille d'au moins 20 litres. 52. Une culture à grande échelle comprenant la cellule de mammifère de l'un quelconque des modes de réalisation 1 à 51, où ladite culture a une taille d'au moins 50 litres. 53. La culture à grande échelle du mode de réalisation 51 ou 52, où le rendement du complexe pentamère du CMV est d'au moins 0,05 g/1. 54. La culture à grande échelle du mode de réalisation 51 ou 52, où le rendement du complexe pentamère du CMV est d'au moins 0,1 g/1. 55. Un complexe pentamère du cytomégalovirus (CMV) produit par la cellule de mammifère de l'un quelconque des modes de réalisation 1 à 50, ou la culture à grande échelle de l'un quelconque des modes de réalisation 51 à 54. 56. Une composition comprenant le complexe pentamère du mode de réalisation 55. 57 . Un procédé de production du complexe pentamère du cytomégalovirus (CMV), où ledit complexe pentamère comprend : la gH ou l'un de ses fragments formant un complexe, la gL ou l'un de ses fragments formant un complexe, la pUL128 ou l'un de ses fragments formant un complexe, la pUL130 ou l'un de ses fragments formant un complexe, et la pUL131 ou l'un de ses fragments formant un complexe, comprenant : (i) la culture de la cellule de mammifère de l'un quelconque des modes de réalisation 1 à 50 dans des conditions appropriées, exprimant de cette façon ledit complexe pentamère ; et (ii) la récolte dudit complexe pentamère à partir de la culture. 58. Le procédé du mode de réalisation 57, comprenant en outre la purification dudit complexe pentamère. 59. Un complexe pentamère du cytomégalovirus (CMV) produit par le procédé du mode de réalisation 57 ou 58. 60. Une composition comprenant le complexe pentamère du mode de réalisation 59. 61. La composition du mode de réalisation 56 ou 60, où ledit complexe pentamère a une pureté d'au moins 95 %, en masse. 62. La composition du mode de réalisation 61, comprenant en outre un adjuvant, comme un sel d'aluminium, ou le MF59. 63. La composition du mode de réalisation 61 ou 62, pour une utilisation dans l’induction d’une réponse immunitaire contre le CMV. 64 . Le complexe pentamère du cytomégalovirus (CMV) du mode de réalisation 55, où ledit complexe pentamère est immunogène. 65. Le complexe pentamère du cytomégalovirus (CMV) du mode de réalisation 64, où les anticorps dirigés contre ledit complexe pentamère sont des anticorps neutralisants. Légendes des figures
Liste des séquences <110> GLAXOSMITHKLINE BIOLOGICALS sa
<120> CELLULES DE MAMMIFERES EXPRIMANT DES ANTIGENES DU CYTOMEGALOVIRUS <130> VN56323 <14 0> 14191385.5 <141> 31-10-2014 <160> 39 <170> Patentln version 3.5
<210> 1 <211> 742 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(742) <223> /note="Souche Merlin" <400> 1
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu 15 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu 20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro 35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gin Cys Thr Tyr Asn Ser Ser 50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe 65 70 75 80
Phe Gin Ser Tyr Asn Gin Tyr Tyr Val Phe His Met Pro Arg Cys Leu 85 90 95
Phe Ala Gly Pro Leu Ala Glu Gin Phe Leu Asn Gin Val Asp Leu Thr 100 105 110
Glu Thr Leu Glu Arg Tyr Gin Gin Arg Leu Asn Thr Tyr Ala Leu Val 115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gin Gin Leu Lys Ala 130 135 140
Gin Asp Ser Leu Gly Glu Gin Pro Thr Thr Val Pro Pro Pro Ile Asp 145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gin Thr Thr Pro His Gly 165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn 180 185 190
Gin Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val 195 200 205
Thr Pro Cys Leu His Gin Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr 210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile 225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val 245 250 255
Leu Phe Lys Ala Pro Tyr Gin Arg Asp Asn Phe Ile Leu Arg Gin Thr 260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gin Leu Asn Arg 275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe 290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr 305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gin Met Leu Asp Arg Arg 325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala 340 345 350
Arg Gin Glu Glu Ala Gly Ala Gin Val Ser Val Pro Arg Ala Leu Asp 355 360 365
Arg Gin Ala Ala Leu Leu Gin Ile Gin Glu Phe Met Ile Thr Cys Leu 370 375 380
Ser Gin Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val 385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gin Ile Thr Asp Ile 405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gin Asn Gin Gin 420 425 430
His Leu Ile Pro Gin Trp Ala Leu Arg Gin Ile Ala Asp Phe Ala Leu 435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg 450 455 460
Gin Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His 465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser 485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gin Leu Leu Ala His Pro His His 500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg 515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val 530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gin Pro 545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu 565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr 580 585 590
Asn Gin Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val 595 600 605
Val Gly Gin Ser Leu Ile Ile Thr Gin Thr Asp Ser Gin Thr Lys Cys 610 615 620
Glu Leu Thr Arg Asn Met Hls Thr Thr Hls Ser Ile Thr Val Ala Leu 625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gin Ser Ala Leu Leu Glu 645 650 655
Tyr Asp Asp Thr Gin Gly Val Ile Asn Ile Met Tyr Met His Asp Ser 660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser 675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu 690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu Met 705 710 715 720
Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu Tyr 725 730 735
Arg Met Leu Lys Thr Cys 740
<210> 2 <211> 742 <212> PRT <213> Herpèsvirus 5 humain <220> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1) .. (742) <223> /note="Souche Towne" <400> 2
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Val Leu Ala Val Cys Leu 15 10 15
Leu Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Ile Ser Glu 20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro 35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gin Cys Thr Tyr Asn Ser Ser 50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe 65 70 75 80
Phe Gin Ser Tyr Asn Gin Tyr Tyr Val Phe His Met Pro Arg Cys Leu 85 90 95
Phe Ala Gly Pro Leu Ala Glu Gin Phe Leu Asn Gin Val Asp Leu Thr 100 105 110
Glu Thr Leu Glu Arg Tyr Gin Gin Arg Leu Asn Thr Tyr Ala Leu Val 115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gin Gin Leu Lys Ala 130 135 140
Gin Asp Ser Leu Gly Glu Gin Pro Thr Thr Val Pro Pro Pro Ile Asp 145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gin Thr Thr Pro His Gly 165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn 180 185 190
Gin Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val 195 200 205
Thr Pro Cys Leu His Gin Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr 210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile 225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val 245 250 255
Leu Phe Lys Ala Pro Tyr Gin Arg Asp Asn Phe Ile Leu Arg Gin Thr 260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gin Leu Asn Arg 275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe 290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr 305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gin Met Leu Asp Arg Arg 325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala 340 345 350
Arg Gin Glu Glu Ala Gly Ala Gin Val Ser Val Pro Arg Ala Leu Asp 355 360 365
Arg Gin Ala Ala Leu Leu Gin Ile Gin Glu Phe Met Ile Thr Cys Leu 370 375 380
Ser Gin Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val 385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gin Ile Thr Asp Ile 405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gin Asn Gin Gin 420 425 430
His Leu Ile Pro Gin Trp Ala Leu Arg Gin Ile Ala Asp Phe Ala Leu 435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg 450 455 460
Gin Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His 465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser 485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gin Leu Leu Ala His Pro His His 500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg 515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val 530 535 540
Pro Thr Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gin Pro 545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu 565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Val Val Thr 580 585 590
Asn Gin Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val 595 600 605
Val Gly Gin Ser Leu Ile Ile Thr Gin Thr Asp Ser Gin Thr Lys Cys 610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Ala Ala Leu 625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gin Ser Ala Leu Leu Glu 645 650 655
Tyr Asp Asp Thr Gin Gly Val Ile Asn Ile Met Tyr Met His Asp Ser 660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser 675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu 690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu Met 705 710 715 720
Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu Tyr 725 730 735
Arg Met Leu Lys Thr Cys 740
<210> 3 <211> 743 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(743) <223> /note="Souche AD169" <400> 3
Met Arg Pro Gly Leu Pro Pro Tyr Leu Thr Val Phe Thr Val Tyr Leu 15 10 15
Leu Ser His Leu Pro Ser Gin Arg Tyr Gly Ala Asp Ala Ala Ser Glu 20 25 30
Ala Leu Asp Pro His Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg 35 40 45
Pro Ile Arg Phe Leu Arg Glu Asn Thr Thr Gin Cys Thr Tyr Asn Ser 50 55 60
Ser Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn 65 70 75 80
Phe Phe Gin Ser Tyr Asn Gin Tyr Tyr Val Phe His Met Pro Arg Cys 85 90 95
Leu Phe Ala Gly Pro Leu Ala Glu Gin Phe Leu Asn Gin Val Asp Leu 100 105 110
Thr Glu Thr Leu Glu Arg Tyr Gin Gin Arg Leu Asn Thr Tyr Ala Leu 115 120 125
Val Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gin Gin Leu Lys 130 135 140
Ala Gin Asp Ser Leu Gly Gin Gin Pro Thr Thr Val Pro Pro Pro Ile 145 150 155 160
Asp Leu Ser Ile Pro His Val Trp Met Pro Pro Gin Thr Thr Pro His 165 170 175
Asp Trp Lys Gly Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe 180 185 190
Asn Gin Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr 195 200 205
Val Thr Pro Cys Leu His Gin Gly Phe Tyr Leu Met Asp Glu Leu Arg 210 215 220
Tyr Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser 225 230 235 240
Ile Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg 245 250 255
Val Leu Phe Lys Ala Pro Tyr Gin Arg Asp Asn Phe Ile Leu Arg Gin 260 265 270
Thr Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Ala Gin Leu Asn 275 280 285
Arg His Ser Tyr Leu Lys Asp Ser Asp Phe Leu Asp Ala Ala Leu Asp 290 295 300
Phe Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg 305 310 315 320
Tyr Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gin Met Leu Asp Arg 325 330 335
Arg Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala 340 345 350
Ala Arg Gin Glu Glu Ala Gly Thr Glu Ile Ser Ile Pro Arg Ala Leu 355 360 365
Asp Arg Gin Ala Ala Leu Leu Gin Ile Gin Glu Phe Met Ile Thr Cys 370 375 380
Leu Ser Gin Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala 385 390 395 400
Val Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asp Gin Ile Thr Asp 405 410 415
Ile Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gin Asn Gin 420 425 430
Gin His Leu Ile Pro Gin Trp Ala Leu Arg Gin Ile Ala Asp Phe Ala 435 440 445
Leu Gin Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala 450 455 460
Arg Gin Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val 465 470 475 480
His Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys 485 490 495
Ser Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His 500 505 510
His Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg 515 520 525
Arg Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr 530 535 540
Val Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln 545 550 555 560
Pro Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly 565 570 575
Glu Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Val Val 580 585 590
Thr Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr 595 600 605
Val Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys 610 615 620
Cys Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Ala Ala 625 630 635 640
Leu Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu 645 650 655
Glu Tyr Asp Asp Thr Gin Gly Val Ile Asn Ile Met Tyr Met His Asp 660 665 670
Ser Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val 675 680 685
Ser Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val 690 695 700
Leu Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu 705 710 715 720
Met Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu 725 730 735
Tyr Arg Met Leu Lys Thr Cys 740
<210> 4 <211> 715 <212> PRT <213> Herpèsvirus 5 humain <220> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(715) <223> /note=”Souche Merlin" <400> 4
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu 15 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu 20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro 35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gin Cys Thr Tyr Asn Ser Ser 50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe 65 70 75 80
Phe Gin Ser Tyr Asn Gin Tyr Tyr Val Phe His Met Pro Arg Cys Leu 85 90 95
Phe Ala Gly Pro Leu Ala Glu Gin Phe Leu Asn Gin Val Asp Leu Thr 100 105 110
Glu Thr Leu Glu Arg Tyr Gin Gin Arg Leu Asn Thr Tyr Ala Leu Val 115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gin Gin Leu Lys Ala 130 135 140
Gin Asp Ser Leu Gly Glu Gin Pro Thr Thr Val Pro Pro Pro Ile Asp 145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gin Thr Thr Pro His Gly 165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn 180 185 190
Gin Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val 195 200 205
Thr Pro Cys Leu His Gin Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr 210 215 220
Val Lys Ile Ihr Leu Ihr Glu Asp Phe Phe Val Val Thr Val Ser Ile 225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val 245 250 255
Leu Phe Lys Ala Pro Tyr Gin Arg Asp Asn Phe Ile Leu Arg Gin Thr 260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gin Leu Asn Arg 275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe 290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr 305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gin Met Leu Asp Arg Arg 325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala 340 345 350
Arg Gin Glu Glu Ala Gly Ala Gin Val Ser Val Pro Arg Ala Leu Asp 355 360 365
Arg Gin Ala Ala Leu Leu Gin Ile Gin Glu Phe Met Ile Thr Cys Leu 370 375 380
Ser Gin Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val 385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gin Ile Thr Asp Ile 405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gin Asn Gin Gin 420 425 430
His Leu Ile Pro Gin Trp Ala Leu Arg Gin Ile Ala Asp Phe Ala Leu 435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg 450 455 460
Gin Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His 465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser 485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gin Leu Leu Ala Hrs Pro His His 500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg 515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val 530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gin Pro 545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu 565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr 580 585 590
Asn Gin Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val 595 600 605
Val Gly Gin Ser Leu Ile Ile Thr Gin Thr Asp Ser Gin Thr Lys Cys 610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Val Ala Leu 625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gin Ser Ala Leu Leu Glu 645 650 655
Tyr Asp Asp Thr Gin Gly Val Ile Asn Ile Met Tyr Met His Asp Ser 660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser 675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu 690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp 705 710 715
<210> 5 <211> 692 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(692) <223> /note="Souche Merlin" <400> 5
Arg Tyr Gly Ala Glu Ala Val Ser Glu Pro Leu Asp Lys Ala Phe His 15 10 15
Leu Leu Leu Asn Thr Tyr Gly Arg Pro Ile Arg Phe Leu Arg Glu Asn 20 25 30
Thr Thr Gin Cys Thr Tyr Asn Ser Ser Leu Arg Asn Ser Thr Val Val 35 40 45
Arg Glu Asn Ala Ile Ser Phe Asn Phe Phe Gin Ser Tyr Asn Gin Tyr 50 55 60
Tyr Val Phe His Met Pro Arg Cys Leu Phe Ala Gly Pro Leu Ala Glu 65 70 75 80
Gin Phe Leu Asn Gin Val Asp Leu Thr Glu Thr Leu Glu Arg Tyr Gin 85 90 95
Gin Arg Leu Asn Thr Tyr Ala Leu Val Ser Lys Asp Leu Ala Ser Tyr 100 105 110
Arg Ser Phe Ser Gin Gin Leu Lys Ala Gin Asp Ser Leu Gly Glu Gin 115 120 125
Pro Thr Thr Val Pro Pro Pro Ile Asp Leu Ser Ile Pro His Val Trp 130 135 140
Met Pro Pro Gin Thr Thr Pro His Gly Trp Thr Glu Ser His Thr Thr 145 150 155 160
Ser Gly Leu His Arg Pro His Phe Asn Gin Thr Cys Ile Leu Phe Asp 165 170 175
Gly His Asp Leu Leu Phe Ser Thr Val Thr Pro Cys Leu His Gin Gly 180 185 190
Phe Tyr Leu Ile Asp Glu Leu Arg Tyr Val Lys Ile Thr Leu Thr Glu 195 200 205
Asp Phe Phe Val Val Thr Val Ser Ile Asp Asp Asp Thr Pro Met Leu 210 215 220
Leu Ile Phe Gly His Leu Pro Arg Val Leu Phe Lys Ala Pro Tyr Gin 225 230 235 240
Arg Asp Asn Phe Ile Leu Arg Gin Thr Glu Lys His Glu Leu Leu Val 245 250 255
Leu Val Lys Lys Asp Gin Leu Asn Arg His Ser Tyr Leu Lys Asp Pro 260 265 270
Asp Phe Leu Asp Ala Ala Leu Asp Phe Asn Tyr Leu Asp Leu Ser Ala 275 280 285
Leu Leu Arg Asn Ser Phe His Arg Tyr Ala Val Asp Val Leu Lys Ser 290 295 300
Gly Arg Cys Gin Met Leu Asp Arg Arg Thr Val Glu Met Ala Phe Ala 305 310 315 320
Tyr Ala Leu Ala Leu Phe Ala Ala Ala Arg Gin Glu Glu Ala Gly Ala 325 330 335
Gin Val Ser Val Pro Arg Ala Leu Asp Arg Gin Ala Ala Leu Leu Gin 340 345 350
Ile Gin Glu Phe Met Ile Thr Cys Leu Ser Gin Thr Pro Pro Arg Thr 355 360 365
Thr Leu Leu Leu Tyr Pro Thr Ala Val Asp Leu Ala Lys Arg Ala Leu 370 375 380
Trp Thr Pro Asn Gin Ile Thr Asp Ile Thr Ser Leu Val Arg Leu Val 385 390 395 400
Tyr Ile Leu Ser Lys Gin Asn Gin Gin His Leu Ile Pro Gin Trp Ala 405 410 415
Leu Arg Gin Ile Ala Asp Phe Ala Leu Lys Leu His Lys Thr His Leu 420 425 430
Ala Ser Phe Leu Ser Ala Phe Ala Arg Gin Glu Leu Tyr Leu Met Gly 435 440 445
Ser Leu Val His Ser Met Leu Val His Thr Thr Glu Arg Arg Glu Ile 450 455 460
Phe Ile Val Glu Thr Gly Leu Cys Ser Leu Ala Glu Leu Ser His Phe 465 470 475 480
Thr Gin Leu Leu Ala His Pro His His Glu Tyr Leu Ser Asp Leu Tyr 485 490 495
Thr Pro Cys Ser Ser Ser Gly Arg Arg Asp His Ser Leu Glu Arg Leu 500 505 510
Thr Arg Leu Phe Pro Asp Ala Thr Val Pro Ala Thr Val Pro Ala Ala 515 520 525
Leu Ser Ile Leu Ser Thr Met Gin Pro Ser Thr Leu Glu Thr Phe Pro 530 535 540
Asp Leu Phe Cys Leu Pro Leu Gly Glu Ser Phe Ser Ala Leu Thr Val 545 550 555 560
Ser Glu His Val Ser Tyr Ile Val Thr Asn Gin Tyr Leu Ile Lys Gly 565 570 575
Ile Ser Tyr Pro Val Ser Thr Thr Val Val Gly Gin Ser Leu Ile Ile 580 585 590
Thr Gin Thr Asp Ser Gin Thr Lys Cys Glu Leu Thr Arg Asn Met His 595 600 605
Thr Thr His Ser Ile Thr Val Ala Leu Asn Ile Ser Leu Glu Asn Cys 610 615 620
Ala Phe Cys Gin Ser Ala Leu Leu Glu Tyr Asp Asp Thr Gin Gly Val 625 630 635 640
Ile Asn Ile Met Tyr Met His Asp Ser Asp Asp Val Leu Phe Ala Leu 645 650 655
Asp Pro Tyr Asn Glu Val Val Val Ser Ser Pro Arg Thr His Tyr Leu 660 665 670
Met Leu Leu Lys Asn Gly Thr Val Leu Glu Val Thr Asp Val Val Val 675 680 685
Asp Ala Thr Asp 690
<210> 6 <211> 278 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1) .. (278) <223> /note="Souche Merlin" <400> 6
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val 15 10 15
Ile Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Ala Ala 20 25 30
Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu Cys Pro 35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Glu Gly Asp Lys 50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Gly Arg Asp Gly 65 70 75 80
Pro Leu Ser Gin Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala 85 90 95
Asn Ser Val Leu Leu Asp Glu Ala Phe Leu Asp Thr Leu Ala Leu Leu 100 105 110
Tyr Asn Asn Pro Asp Gin Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser 115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys 130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg 145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu 165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val 180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu 195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly 210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gin Leu Asp Pro 225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu 245 250 255
Leu Lys Gin Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro 260 265 270
Gin Ala Val Asp Ala Arg 275
<210> 7 <211> 278 <212> PRT <213> Herpèsvirus 5 humain <220> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(278) <223> /note=”Souche Towne" <400> 7
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val 15 10 15
Ala Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Ala Thr 20 25 30
Val Ser Val Ala Pro Thr Val Ala Glu Lys Val Pro Ala Glu Cys Pro 35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Gin Gly Asp Lys 50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Arg Arg Asp Gly 65 70 75 80
Pro Leu Ser Gin Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala 85 90 95
Asn Ser Val Leu Leu Asp Asp Ala Phe Leu Asp Thr Leu Ala Leu Leu 100 105 110
Tyr Asn Asn Pro Asp Gin Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser 115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys 130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg 145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu 165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val 180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu 195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly 210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gin Leu Asp Pro 225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu 245 250 255
Leu Lys Gin Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro 260 265 270
Gin Ala Val Asp Ala Arg 275
<210> 8 <211> 278 <212> PRT <213> Herpèsvirus 5 humain <220> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(278) <223> /note=”Souche ÄD169" <400> 8
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val 15 10 15
Val Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Val Ala 20 25 30
Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu Cys Pro 35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Gin Gly Asp Lys 50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Arg Arg Asp Gly 65 70 75 80
Pro Leu Ser Gin Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala 85 90 95
Asn Ser Val Leu Leu Asp Asp Ala Phe Leu Asp Thr Leu Ala Leu Leu 100 105 110
Tyr Asn Asn Pro Asp Gin Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser 115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys 130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg 145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu 165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val 180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu 195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly 210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gin Leu Asp Pro 225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu 245 250 255
Leu Lys Gin Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro 260 265 270
Gin Ala Val Asp Ala Arg 275
<210> 9 <211> 248 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(248) <223> /note=”Souche Merlin" <400> 9
Ala Ala Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu 15 10 15
Cys Pro Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Glu Gly 20 25 30
Asp Lys Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Gly Arg 35 40 45
Asp Gly Pro Leu Ser Gin Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu 50 55 60
Ala Ala Asn Ser Val Leu Leu Asp Glu Ala Phe Leu Asp Thr Leu Ala 65 70 75 80
Leu Leu Tyr Asn Asn Pro Asp Gin Leu Arg Ala Leu Leu Thr Leu Leu 85 90 95
Ser Ser Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser 100 105 110
Glu Cys Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu 115 120 125
Cys Arg Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe 130 135 140
Thr Glu His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn 145 150 155 160
Val Val Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val 165 170 175
Arg Leu Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe 180 185 190
Tyr Gly Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gin Leu 195 200 205
Asp Pro Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro 210 215 220
Pro Glu Leu Lys Gin Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr 225 230 235 240
Gly Pro Gin Ala Val Asp Ala Arg 245
<210> 10 <211> 130 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(130) <223> /note="Souche Merlin" <400> 10
Met Ser Pro Lys Asp Leu Thr Pro Phe Leu Thr Ala Leu Trp Leu Leu 15 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu 20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met 35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys 50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met 65 70 75 80
Thr His Ser Leu Thr Arg Gin Val Val His Asn Lys Leu Thr Ser Cys 85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly 100 105 110
Lys Val Asn Asp Lys Ala Gin Tyr Leu Leu Gly Ala Ala Gly Ser Val 115 120 125
Pro Tyr 130
<210> 11 <211> 171 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1) . . (171) <223> /note="Souche Towne" <400> 11
Met Ser Pro Lys Asn Leu Thr Pro Phe Leu Thr Ala Leu Trp Leu Leu 15 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu 20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met 35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys 50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met 65 70 75 80
Thr His Ser Leu Thr Arg Gin Val Val His Asn Lys Leu Thr Ser Cys 85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly 100 105 110
Lys Val Asn Asp Lys Ala Gin Tyr Leu Leu Gly Ala Ala Gly Ser Val 115 120 125
Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys Ile Thr Arg Ile Val 130 135 140
Gly Leu Asp Gin Tyr Leu Glu Ser Val Lys Lys His Lys Arg Leu Asp 145 150 155 160
Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gin 165 170
<210> 12 <211> 171 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1) . . (171) <223> /note="Souche ÄD169" <400> 12
Met Ser Pro Lys Asp Leu Thr Pro Phe Leu Thr Thr Leu Trp Leu Leu 15 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu 20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met 35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys 50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met 65 70 75 80
Thr His Ser Leu Thr Arg Gin Val Val His Asn Lys Leu Thr Ser Cys 85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly 100 105 110
Lys Val Asn Asp Lys Ala Gin Tyr Leu Leu Gly Ala Ala Gly Ser Val 115 120 125
Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys Ile Thr Arg Ile Val 130 135 140
Gly Leu Asp Gin Tyr Leu Glu Ser Val Lys Lys His Lys Arg Leu Asp 145 150 155 160
Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gin 165 170
<210> 13 <211> 144 <212> PRT <213> Herpèsvirus 5 humain <400> 13
Glu Glu Cys Cys Glu Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys 15 10 15
Tyr Asp Phe Lys Met Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro 20 25 30
Asp Gly Glu Val Cys Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly 35 40 45
Ile Val Thr Thr Met Thr His Ser Leu Thr Arg Gin Val Val His Asn 50 55 60
Lys Leu Thr Ser Cys Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly 65 70 75 80
Arg Ile Arg Cys Gly Lys Val Asn Asp Lys Ala Gin Tyr Leu Leu Gly 85 90 95
Ala Ala Gly Ser Val Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys 100 105 110
Ile Thr Arg Ile Val Gly Leu Asp Gin Tyr Leu Glu Ser Val Lys Lys 115 120 125
His Lys Arg Leu Asp Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gin 130 135 140
<210> 14 <211> 214 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(214) <223> /note="Souche Merlin" <400> 14
Met Leu Arg Leu Leu Leu Arg His His Phe His Cys Leu Leu Leu Cys 15 10 15
Ala Val Trp Ala Thr Pro Cys Leu Ala Ser Pro Trp Ser Thr Leu Thr 20 25 30
Ala Asn Gin Asn Pro Ser Pro Pro Trp Ser Lys Leu Thr Tyr Ser Lys 35 40 45
Pro His Asp Ala Ala Thr Phe Tyr Cys Pro Phe Leu Tyr Pro Ser Pro 50 55 60
Pro Arg Ser Pro Leu Gin Phe Ser Gly Phe Gin Arg Val Ser Thr Gly 65 70 75 80
Pro Glu Cys Arg Asn Glu Thr Leu Tyr Leu Leu Tyr Asn Arg Glu Gly 85 90 95
Gin Thr Leu Val Glu Arg Ser Ser Thr Trp Val Lys Lys Val Ile Trp 100 105 110
Tyr Leu Ser Gly Arg Asn Gin Thr Ile Leu Gin Arg Met Pro Arg Thr 115 120 125
Ala Ser Lys Pro Ser Asp Gly Asn Val Gin Ile Ser Val Glu Asp Ala 130 135 140
Lys Ile Phe Gly Ala His Met Val Pro Lys Gin Thr Lys Leu Leu Arg 145 150 155 160
Phe Val Val Asn Asp Gly Thr Arg Tyr Gin Met Cys Val Met Lys Leu 165 170 175
Glu Ser Trp Ala His Val Phe Arg Asp Tyr Ser Val Ser Phe Gin Val 180 185 190
Arg Leu Thr Phe Thr Glu Ala Asn Asn Gin Thr Tyr Thr Phe Cys Thr 195 200 205
His Pro Asn Leu Ile Val 210
<210> 15 <211> 229 <212> PRT <213> Herpèsvirus 5 humain <220> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(229) <223> /note=”Souche Towne" <400> 15
Met Leu Arg Leu Leu Leu Arg His His Phe His Cys Leu Leu Leu Cys 15 10 15
Ala Val Trp Ala Thr Pro Cys Leu Ala Ser Pro Trp Ser Thr Leu Ihr 20 25 30
Ala Asn Gin Asn Pro Ser Pro Pro Trp Ser Lys Leu Thr Tyr Ser Lys 35 40 45
Pro His Asp Ala Ala Thr Phe Tyr Cys Pro Phe Leu Tyr Pro Ser Pro 50 55 60
Pro Arg Ser Pro Leu Gin Phe Ser Gly Phe Gin Arg Val Leu Thr Gly 65 70 75 80
Pro Glu Cys Arg Asn Glu Thr Leu Tyr Leu Leu Tyr Asn Arg Glu Gly 85 90 95
Gin Thr Leu Val Glu Arg Ser Ser Thr Trp Val Lys Lys Val Ile Trp 100 105 110
Tyr Leu Ser Gly Arg Asn Gin Thr Ile Leu Gin Arg Met Pro Arg Thr 115 120 125
Ala Ser Lys Pro Ser Asp Gly Asn Val Gin Ile Ser Val Glu Asp Ala 130 135 140
Lys Ile Phe Gly Ala His Met Val Pro Lys Gin Thr Lys Leu Leu Arg 145 150 155 160
Phe Val Val Asn Asp Gly Thr Arg Tyr Gin Met Cys Val Met Lys Leu 165 170 175
Glu Ser Trp Ala His Val Phe Arg Asp Tyr Ser Val Ser Phe Gin Val 180 185 190
Arg Leu Thr Phe Thr Glu Ala Asn Asn Gin Thr Phe Thr Pro Ser Ala 195 200 205
Pro Ile Pro Ile Ser Ser Phe Glu Pro Val Ala Arg Ala Gly Asn Phe 210 215 220
Glu Asn Arg Ala Ser 225
<210> 16 <211> 189 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(189) <223> /note="Souche Merlin" <400> 16
Ser Pro Trp Ser Thr Leu Thr Ala Asn Gin Asn Pro Ser Pro Pro Trp 15 10 15
Ser Lys Leu Thr Tyr Ser Lys Pro His Asp Ala Ala Thr Phe Tyr Cys 20 25 30
Pro Phe Leu Tyr Pro Ser Pro Pro Arg Ser Pro Leu Gin Phe Ser Gly 35 40 45
Phe Gin Arg Val Ser Thr Gly Pro Glu Cys Arg Asn Glu Thr Leu Tyr 50 55 60
Leu Leu Tyr Asn Arg Glu Gly Gin Thr Leu Val Glu Arg Ser Ser Thr 65 70 75 80
Trp Val Lys Lys Val Ile Trp Tyr Leu Ser Gly Arg Asn Gin Thr Ile 85 90 95
Leu Gin Arg Met Pro Arg Thr Ala Ser Lys Pro Ser Asp Gly Asn Val 100 105 110
Gin Ile Ser Val Glu Asp Ala Lys Ile Phe Gly Ala His Met Val Pro 115 120 125
Lys Gin Thr Lys Leu Leu Arg Phe Val Val Asn Asp Gly Thr Arg Tyr 130 135 140
Gin Met Cys Val Met Lys Leu Glu Ser Trp Ala His Val Phe Arg Asp 145 150 155 160
Tyr Ser Val Ser Phe Gin Val Arg Leu Thr Phe Thr Glu Ala Asn Asn 165 170 175
Gin Thr Tyr Thr Phe Cys Thr His Pro Asn Leu Ile Val 180 185
<210> 17 <211> 129 <212> PRT <213> Herpèsvirus 5 humain <220> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(129) <223> /note=”Souche Merlin" <400> 17
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val 15 10 15
Leu Gly Gin Cys Gin Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg 20 25 30
Val Pro His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gin Thr 35 40 45
Arg Tyr Lys Tyr Val Glu Gin Leu Val Asp Leu Thr Leu Asn Tyr His 50 55 60
Tyr Asp Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile 65 70 75 80
Asn Val Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gin Asn 85 90 95
Arg Arg Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser 100 105 110
Leu Ala Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala 115 120 125
Asn
<210> 18 <211> 129 <212> PRT <213> Herpèsvirus 5 humain <22 0> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(129) <223> /note="Souche Towne" <400> 18
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val 15 10 15
Leu Gly Gin Cys Gin Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg 20 25 30
Val Pro His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gin Thr 35 40 45
Arg Tyr Lys Tyr Val Glu Gin Leu Val Asp Leu Thr Leu Asn Tyr His 50 55 60
Tyr Asp Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile 65 70 75 80
Asn Val Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gin Asn 85 90 95
Arg Arg Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser 100 105 110
Leu Ala Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala 115 120 125
Asn
<210> 19 <211> 74 <212> PRT <213> Herpèsvirus 5 humain <220> <221> AUTRE(S) CARACTERISTIQUE(S) <222> (1)..(74) <223> /note=”Souche AD169" <400> 19
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val 15 10 15
Leu Gly Gin Cys Gin Arg Glu Thr Ala Glu Lys Lys Arg Leu Leu Pro 20 25 30
Ser Thr Ala Leu Leu Gly Arg Val Leu Ser Arg Ala Ala Arg Pro Asn 35 40 45
Pro Leu Gin Val Cys Gly Thr Ala Arg Gly Pro His Val Glu Leu Pro 50 55 60
Leu Arg Cys Glu Pro Arg Leu Gly Gin Leu 65 70 <210> 20 <211> 111
<212> PRT <213> Herpèsvirus 5 humain <400> 20
Gin Cys Gin Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg Val Pro 15 10 15
His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gin Thr Arg Tyr 20 25 30
Lys Tyr Val Glu Gin Leu Val Asp Leu Thr Leu Asn Tyr His Tyr Asp 35 40 45
Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile Asn Val 50 55 60
Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gin Asn Arg Arg 65 70 75 80
Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser Leu Ala 85 90 95
Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala Asn 100 105 110
<210> 21 <211> 1547 <212> PRT <213> Cricetulus griseus <400> 21
Met Asn Trp Asn Ala Lys Pro Glu Asn Ala Ala Pro Asn Pro Pro Tyr 15 10 15
Ser Lys Ser Gin Ser Ser Leu Leu Gin Gin Phe Leu Met Pro Ser Thr 20 25 30
Thr Ser Gin Ser Ser Phe Ser Cys Leu Pro His Asn Gin Glu Ala Cys 35 40 45
Ile Tyr Pro Thr Asn Ser Asn Ser Val Ser Gin Pro Leu Leu Asn Val 50 55 60
Arg Ser Phe Ile Asn Pro Pro Ile Ser Val Ser Asn Val His Asn Arg 65 70 75 80
Thr Val Val Ala Ser Gin Thr Ser Val Glu Arg Val Thr Tyr Thr Asn 85 90 95
Val Lys Gly Ala Gin Gin Pro Asn His Asn Leu Gin Thr Val Ser Ser 100 105 110
Gly Val Val Gin Asn Ala Trp Met Asn Ser Thr Met Arg Asn Phe Met 115 120 125
Pro Ser Leu Thr Glu Ala Thr Ile Ser His Lys Pro Asp Gly Gly Pro 130 135 140
Ser Met Pro Tyr Met His Ala Pro Gin Ser His Leu Val Thr Ser Asp 145 150 155 160
Thr Tyr Ser Val Gin Leu Gin Met Thr Pro Ser Asn Ser Val Arg Gly 165 170 175
Pro Val Thr Tyr Gin Gly Asn Tyr Gin Gly Asn Pro Gly Leu Asn His 180 185 190
Ser Met Ala Gly Glu Leu Gly Trp Val Gin Cys Ala Ser Ser Glu Leu 195 200 205
Thr Tyr Pro Asp Tyr Arg Pro Pro Pro Lys Gin Tyr Pro Tyr Leu Pro 210 215 220
Gin Ser Phe Val Gin Asp Thr Ser Val Gin Lys Gin Asn Phe Val Ser 225 230 235 240
Ser Thr Ser Leu Gin Val Lys Asn Asn Gin Leu Pro Pro Ser Thr Gin 245 250 255
Thr Leu Pro Ser Lys Arg Pro Val Pro Val Ser Ser Tyr Gin Tyr Ala 260 265 270
Ala Glu Thr Ser Lys Arg Leu Pro Pro Pro Pro Tyr Ser Cys Arg Tyr 275 280 285
Gly Ser Gin His Val Gin Asn Ser Gin Ser Val Ser Arg His Leu Pro 290 295 300
Val Glu Val Pro Gin Ser Ser Glu Met His Ser Ser Glu Lys Lys Lys 305 310 315 320
Asp Ala Tyr Lys Val Phe Gin Gin Gin Trp Gin Ser Thr Ser Lys Asn 325 330 335
Val Ser Thr Ile Gly Lys Phe Cys Glu Leu Lys Ile Asn Thr Lys Gin 340 345 350
Ser Tyr Asn Asp Ser Ala Gly Ser Ser Gly Asp Gly Val His Thr Leu 355 360 365
Val Gin Asn Asn Gin Glu Glu Arg Lys Tyr Ser Tyr Asn Pro Ser Thr 370 375 380
Asn Gin Ile Leu Asp Thr Asn Val Thr Lys Glu Lys Leu Val Arg Asp 385 390 395 400
Ile Lys Ser Leu Val Glu Ile Lys Lys Lys Phe Ser Glu Leu Ala Arg 405 410 415
Lys Ile Lys Ile Asn Lys Lys Leu Leu Met Ala Ala Gly Cys Ser Lys 420 425 430
Thr Ala Asn Thr Ser Tyr Thr Glu Pro Thr Arg His Ser Glu Phe Ser 435 440 445
Ala Lys Glu Met Ser Ala Lys Arg Asp Asn Gin Cys Ser Met Glu Leu 450 455 460
Leu Ala Thr Cys Leu Ser Leu Trp Lys Asn Gin Pro Pro Lys Thr Thr 465 470 475 480
Glu Glu Asn Val Ser Lys Pro Leu Glu Glu Lys Gin Tyr Asn Ala Ser 485 490 495
Arg Thr Ser Thr Thr Ala Val Gly Pro Ser Asn Pro Met Asn Glu Val 500 505 510
His Val Lys Asn Phe Cys Ser Gly Val Arg Asn Ser Gin Lys Ile Thr 515 520 525
Thr Ser Ser Gin Thr Val Leu Ser Val Leu Thr Pro Val Tyr Asp Ser 530 535 540
Ser Asp Val Ala Val Gly Lys Gly Thr Glu Leu Gin Ile Ala Val Val 545 550 555 560
Ser Pro Leu Ile Leu Ser Asp Val Ser Thr Val Pro Gly Lys Glu Leu 565 570 575
Ala Pro Glu Val Val Ser Glu Thr Val Tyr Pro Val Val Lys Glu Gly 580 585 590
Ser Val Cys Ser Leu Gin Asn Gin Gin Ala Glu Asn Ala Thr Val Thr 595 600 605
Ala Gly Leu Pro Phe Asp Val Ile Arg Ala Val Ala Ser Ala Thr Val 610 615 620
Ser Ala Glu Leu Ser Leu Pro Gly His Lys Glu Lys Gin His Lys Pro 625 630 635 640
Thr Gin Ser Asp Leu Asp Ile Ala Asp Gly Ser Leu Gly Lys His Ser 645 650 655
Pro Gin Gly Ala Glu Ala Leu Pro Asn Pro Arg Asp Ser Thr Ile Val 660 665 670
Ser Gly Pro Ile Leu Gin Ile Glu Ser Ile Cys Ser Leu Ala Glu Gly 675 680 685
Asp Val Ser Tyr Asn Ser Gin Ile Ala Glu Ile Phe Asn Ser Val Gin 690 695 700
Asn Glu Pro Gin Lys Pro Ser Pro Asp Gin Gin Val Ile Asn Ser Gin 705 710 715 720
Gin Glu Glu Gin Val Asp Lys Val Ala Glu Asn Lys Asp Leu Ser Phe 725 730 735
Leu Lys Asp Lys Cys Met Gin Cys Thr Asp Val Pro His Glu Val Thr 740 745 750
Glu Gin Pro Glu Pro Leu Gin Pro Leu Glu Thr Thr Ser Asp Glu Tyr 755 760 765
Val Glu Ala Asn Gly Glu Ile Leu Glu Glu Ser Ser Lys Glu Asn Pro 770 775 780
Gly Glu Lys Glu Met Thr Lys Asp Ile Leu Cys Ser Pro Ala Ala Val 785 790 795 800
Gin Gin Asp Pro Gin Pro Gin Glu Ile Asp Thr Ala Ser Ser Lys Ser 805 810 815
Gly His Ser Phe Ser Thr Val Asn Glu Ile Asn Asp Glu Asn Glu Pro 820 825 830
Val Ser Tyr Leu His Asp Gin Leu Leu Glu Leu Leu Lys Glu Phe Pro 835 840 845
Tyr Gly Ile Glu Thr Ile Ala Arg Pro Glu Val Tyr Val Gly Gin Gin 850 855 860
Lys Thr His Glu Ile Leu Glu Asn Gin Thr Gly Ser Lys Thr Gly Asn 865 870 875 880
Val Ser Gly Asp Asn Thr Asp Gin Ile Lys Ile Thr Val Leu Asn Ser 885 890 895
Glu Gin Ile Lys Glu Leu Phe Pro Glu Glu Asp Gin Pro Cys Asp Val 900 905 910
Asp Lys Leu Ala Glu Pro Glu Asn Thr Lys Ile Ile Ala Glu Val Lys 915 920 925
Ser Leu Cys Asp Ser Gin Val Pro Arg Glu Glu Ser His Asn Pro Gly 930 935 940
Met Leu Asp Leu Glu Lys Asp Lys Ile His Cys Cys Ala Leu Gly Trp 945 950 955 960
Leu Ser Met Val Tyr Glu Gly Val Pro Gin Cys Gin Cys Ser Ser Met 965 970 975
Glu Glu Lys Glu Lys Asp Gin Cys Ser Leu Glu Ile Ser Asn Cys Lys 980 985 990
Gin Gly Glu Gin Ala Cys Asn Ser Gly Ile Thr Ile Phe Glu Ile Asn 995 1000 1005
Pro Ile Ser Asn Asn Ser Lys Ser Pro Leu Ile Gin Glu Ser Glu 1010 1015 1020
Lys Gly His Phe Ser Asp Ile His Gly Glu Lys Ile Lys Thr Ser 1025 1030 1035
Glu Thr Lys Asn Ser Ser Ser Pro Arg Val Glu Gin Glu Leu Thr 1040 1045 1050
Gly His Phe Ser Met Lys Cys Tyr Gin Lys Asp Lys Ser Thr Thr 1055 1060 1065
Lys Gin Asp Ser Ser Leu Lys Thr Glu Gin Lys Ile Lys Asn Leu 1070 1075 1080
Ser Ser Lys Cys Asp Lys Pro Asn Pro Leu Lys Ser Ser Lys Ile 1085 1090 1095
Pro Thr Pro Glu Thr Phe Asn Val Val Thr Ser Asn Ser Asp Lys 1100 1105 1110
Asn Met Pro Ala Phe Ser Lys Gin Asp Ser Gin Gly Ser Leu Gin 1115 1120 1125
Lys Lys His Leu Phe Gin Asp Ser Asp Pro Val Lys Gly His Val 1130 1135 1140
Trp Leu Leu Pro Asn Lys Asp Pro Arg Arg Arg Asn Thr Phe Leu 1145 1150 1155
Val Gin Ser Val Ser Pro Glu Lys Lys Lys Leu Lys Phe Lys Ser 1160 1165 1170
Gly Ser Ser Lys Leu Lys Tyr Phe Glu Lys Arg Lys Met Asp His 1175 1180 1185
Leu Leu Ile Ser Asp Val Glu Ile Lys Lys Lys Lys Tyr Glu Lys 1190 1195 1200
Gin Glu Gin Asn Lys Asn Ala Gly Gly Thr Leu Lys Leu Cys Ser 1205 1210 1215
Thr Leu Thr Glu Pro Asn Glu Arg Ala Cys Ala Lys Glu Lys Ile 1220 1225 1230
Val Thr Asn Ser Glu Pro Ser Asp Ser Lys Gly Ser Ser Ser Lys 1235 1240 1245
Ser Thr Arg Val Ile Thr Val Gin Glu Tyr Leu Gin Arg Lys Lys 1250 1255 1260
Asp Lys His Val Ile Gly Asn Asn Ala Ser Lys Asn Ile Cys Val 1265 1270 1275
Glu Asn Val Pro Cys Asp Ser Glu Pro Met Lys Ser Ser Lys His 1280 1285 1290
Ser Ala Ser Pro Ser Leu Gly Lys Leu Ile Glu Gly Gin Gly Val 1295 1300 1305
Ser Ala Glu Thr Leu Lys Glu Val Glu His Asn Ser Thr Ser His 1310 1315 1320
Gly Lys Asn Leu Lys Thr His Arg Ser Glu Glu Thr Arg Pro Tyr 1325 1330 1335
Ser Val Ser Asn Ser Lys Glu Lys Phe Tyr Arg Thr His Pro Asp 1340 1345 1350
Lys Ser Tyr Ile Asp Lys Ala Lys Leu Glu Arg Leu Thr Ser Met 1355 1360 1365
Ser Ser Lys Ser Ser Gin Leu Gin Val Lys Glu Lys Arg Lys Gin 1370 1375 1380
Tyr Leu Asn Arg Val Ala Phe Lys Cys Thr Glu Gin Glu Ser Ile 1385 1390 1395
Cys Leu Thr Lys Leu Asp Ser Ala Ser Lys Lys Leu Ser Lys Glu 1400 1405 1410
Lys Glu Lys Ser Thr Ala Cys Ala Pro Met Thr Lys Asp Tyr Thr 1415 1420 1425
His Lys Pro Met Leu Glu Phe Lys Leu Cys Pro Asp Val Leu Leu 1430 1435 1440
Lys Asn Thr Ser Ser Ile Asp Lys Gly Asp Asp Pro Arg Pro Gly 1445 1450 1455
Pro Glu Lys Glu Arg Ala Pro Val Gin Val Ser Gly Ile Lys Thr 1460 1465 1470
Thr Lys Glu Asp Trp Leu Lys Cys Ile Pro Thr Arg Thr Lys Met 1475 1480 1485
Pro Glu Ser Ser Glu Gin Thr Asp Arg Ala Asp Ser Arg Leu Ser 1490 1495 1500
Lys Arg Ser Phe Ser Ala Asp Glu Phe Glu Thr Leu Gin Asn Pro 1505 1510 1515
Val Lys Asp Ser Asn Val Met Phe Arg Thr Phe Lys Lys Met Tyr 1520 1525 1530
Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser Ser Pro Val Lys 1535 1540 1545
<210> 22 <211> 1515 <212> PRT <213> Cricetinae sp. <22 0> <221> RESIDU MODIFIE <222> (879)..(879) <223> Tout acide aminé <400> 22
Met Asn Trp Asn Ala Lys Pro Glu Asn Ala Ala Pro Asn Pro Pro Tyr 15 10 15
Ser Lys Ser Gin Ser Ser Leu Leu Gin Gin Phe Leu Met Pro Ser Thr 20 25 30
Thr Ser Gin Ser Ser Phe Ser Cys Leu Pro His Asn Gin Glu Ala Cys 35 40 45
Ile Tyr Pro Thr Asn Ser Asn Ser Val Ser Gin Pro Leu Leu Asn Val 50 55 60
Arg Ser Phe Ile Asn Pro Pro Ile Ser Val Ser Asn Val His Asn Arg 65 70 75 80
Thr Val Val Ala Ser Gin Thr Ser Val Glu Arg Val Thr Tyr Thr Asn 85 90 95
Val Lys Gly Ala Gin Gin Pro Asn His Asn Leu Gin Thr Val Ser Ser 100 105 110
Gly Val Val Gin Asn Ala Trp Met Asn Ser Thr Met Arg Asn Phe Met 115 120 125
Pro Ser Leu Thr Glu Ala Thr Ile Ser His Lys Pro Asp Gly Gly Pro 130 135 140
Ser Met Pro Tyr Met His Ala Pro Gin Ser His Leu Val Thr Ser Asp 145 150 155 160
Thr Tyr Ser Val Gin Leu Gin Met Thr Pro Ser Asn Ser Val Arg Gly 165 170 175
Pro Val Thr Tyr Gin Gly Asn Tyr Gin Gly Asn Pro Gly Leu Asn His 180 185 190
Ser Met Ala Gly Glu Leu Gly Trp Val Gin Cys Ala Ser Ser Glu Leu 195 200 205
Thr Tyr Pro Asp Tyr Arg Pro Pro Pro Lys Gin Tyr Pro Tyr Leu Pro 210 215 220
Gin Ser Phe Val Gin Asp Thr Ser Val Gin Lys Gin Asn Phe Val Ser 225 230 235 240
Ser Thr Ser Leu Gin Val Lys Asn Asn Gin Leu Pro Pro Ser Thr Gin 245 250 255
Thr Leu Pro Ser Lys Arg Pro Val Pro Val Ser Ser Tyr Gin Tyr Ala 260 265 270
Ala Glu Thr Ser Lys Arg Leu Pro Pro Pro Pro Tyr Ser Cys Arg Tyr 275 280 285
Gly Ser Gin His Val Gin Asn Ser Gin Ser Val Ser Arg His Leu Pro 290 295 300
Val Glu Val Pro Gin Ser Ser Glu Met His Ser Ser Glu Lys Lys Lys 305 310 315 320
Asp Ala Tyr Lys Val Phe Gin Gin Gin Trp Gin Ser Thr Ser Lys Asn 325 330 335
Val Ser Thr Ile Gly Lys Phe Cys Glu Leu Lys Ile Asn Thr Lys Gin 340 345 350
Ser Tyr Asn Asp Ser Ala Gly Ser Ser Gly Asp Gly Val His Thr Leu 355 360 365
Val Gin Asn Asn Gin Glu Glu Arg Lys Tyr Ser Tyr Asn Pro Ser Thr 370 375 380
Asn Gin Ile Leu Asp Thr Asn Val Thr Lys Glu Lys Leu Val Arg Asp 385 390 395 400
Ile Lys Ser Leu Val Glu Ile Ser Trp Ala Met Val Ala His Ser Glu 405 410 415
Phe Ser Ala Lys Glu Met Ser Ala Lys Arg Asp Asn Gin Cys Ser Met 420 425 430
Glu Leu Leu Ala Thr Cys Leu Ser Leu Trp Lys Asn Gin Pro Pro Lys 435 440 445
Thr Thr Glu Glu Asn Val Ser Lys Pro Leu Glu Glu Lys Gin Tyr Asn 450 455 460
Ala Ser Arg Thr Ser Thr Thr Ala Val Gly Pro Ser Asn Pro Met Asn 465 470 475 480
Glu Val His Val Lys Asn Phe Cys Ser Gly Val Arg Asn Ser Gin Lys 485 490 495
Ile Thr Thr Ser Ser Gin Thr Val Leu Ser Val Leu Thr Pro Val Tyr 500 505 510
Asp Ser Ser Asp Val Ala Val Gly Lys Gly Thr Glu Leu Gin Ile Ala 515 520 525
Val Val Ser Pro Leu Ile Leu Ser Asp Val Ser Thr Val Pro Gly Lys 530 535 540
Glu Leu Ala Pro Glu Val Val Ser Glu Thr Val Tyr Pro Val Val Lys 545 550 555 560
Glu Gly Ser Val Cys Ser Leu Gin Asn Gin Gin Ala Glu Asn Ala Thr 565 570 575
Val Thr Ala Gly Leu Pro Phe Asp Val Ile Arg Ala Val Ala Ser Ala 580 585 590
Thr Val Ser Ala Glu Leu Ser Leu Pro Gly His Lys Glu Lys Gin Hrs 595 600 605
Lys Pro Thr Gin Thr Asp Leu Asp Thr Ala Asp Gly Ser Leu Gly Lys 610 615 620
His Ser Pro Gin Gly Ala Glu Ala Leu Pro Asn Pro Arg Asp Ser Thr 625 630 635 640
Ile Val Ser Gly Pro Ile Leu Gin Ile Glu Ser Ile Cys Ser Leu Ala 645 650 655
Glu Gly Asp Val Ser Tyr Asn Ser Gin Ile Ala Glu Ile Phe Asn Ser 660 665 670
Val Gin Asn Glu Pro Gin Lys Pro Ser Pro Asp Gin Gin Val Ile Asn 675 680 685
Ser Gin Gin Glu Glu Gin Val Asp Lys Val Ala Glu Asn Lys Asp Leu 690 695 700
Ser Phe Leu Lys Asp Lys Cys Met Gin Cys Thr Asp Val Pro His Glu 705 710 715 720
Val Thr Glu Gin Pro Glu Pro Leu Gin Pro Leu Glu Thr Thr Ser Asp 725 730 735
Glu Tyr Val Glu Ala Asn Gly Glu Ile Leu Glu Glu Ser Ser Lys Glu 740 745 750
Asn Pro Gly Glu Lys Glu Met Thr Lys Asp Ile Leu Cys Ser Pro Ala 755 760 765
Ala Val Gin Gin Asp Pro Gin Pro Gin Glu Ile Asp Thr Ala Ser Ser 770 775 780
Lys Ser Gly His Ser Phe Ser Thr Val Asn Glu Ile Asn Asp Glu Asn 785 790 795 800
Glu Pro Val Ser Tyr Leu His Asp Gin Leu Leu Glu Leu Leu Lys Glu 805 810 815
Phe Pro Tyr Gly Ile Glu Thr Ile Ala Arg Pro Glu Val Tyr Val Gly 820 825 830
Gin Gin Lys Thr His Glu Ile Leu Glu Asn Gin Thr Gly Ser Lys Thr 835 840 845
Gly Asn Val Ser Gly Asp Asn Thr Asp Gin Ile Lys Ile Thr Val Leu 850 855 860
Asn Ser Glu Gin Ile Lys Glu Leu Phe Pro Glu Glu Asp Gin Xaa Val 865 870 875 880
Asp Lys Leu Ala Glu Pro Glu Asn Thr Lys Ile Ile Ala Glu Val Lys 885 890 895
Ser Leu Cys Asp Ser Gin Val Pro Arg Glu Glu Ser His Asn Pro Gly 900 905 910
Met Leu Asp Leu Glu Lys Asp Lys Ile His Cys Cys Ala Leu Gly Trp 915 920 925
Leu Ser Met Val Tyr Glu Gly Val Pro Gin Cys Gin Cys Ser Ser Met 930 935 940
Glu Glu Lys Glu Lys Asp Gin Cys Ser Leu Glu Ile Ser Asn Cys Lys 945 950 955 960
Gin Gly Glu Gin Ala Cys Asn Ser Gly Ile Thr Ile Phe Glu Ile Asn 965 970 975
Pro Ile Ser Asn Asn Ser Lys Ser Pro Leu Ile Gin Glu Ser Glu Lys 980 985 990
Gly His Phe Ser Asp Ile His Gly Glu Lys Ile Lys Thr Ser Glu Thr 995 1000 1005
Lys Asn Ser Ser Ser Pro Arg Val Glu Gin Glu Leu Thr Gly His 1010 1015 1020
Phe Ser Met Lys Cys Tyr Gin Lys Asp Lys Ser Thr Thr Lys Gin 1025 1030 1035
Asp Ser Ser Leu Lys Thr Glu Gin Lys Ile Lys Asn Leu Ser Ser 1040 1045 1050
Lys Cys Asp Lys Pro Asn Pro Leu Lys Ser Ser Lys Ile Pro Thr 1055 1060 1065
Pro Glu Thr Phe Asn Val Val Thr Ser Asn Ser Asp Lys Asn Met 1070 1075 1080
Pro Ala Phe Ser Lys Gin Asp Ser Gin Gly Ser Leu Gin Lys Lys 1085 1090 1095
His Leu Phe Gin Asp Ser Asp Pro Val Lys Gly His Val Trp Leu 1100 1105 1110
Leu Pro Asn Lys Asp Pro Arg Arg Arg Asn Thr Phe Leu Val Gin 1115 1120 1125
Ser Val Ser Pro Glu Lys Lys Lys Leu Lys Phe Lys Ser Gly Ser 1130 1135 1140
Ser Lys Leu Lys Tyr Phe Glu Lys Arg Lys Met Asp His Leu Leu 1145 1150 1155
Ile Ser Asp Val Glu Ile Lys Lys Lys Lys Tyr Glu Lys Gin Glu 1160 1165 1170
Gin Asn Lys Asn Ala Gly Gly Thr Leu Lys Leu Cys Ser Thr Leu 1175 1180 1185
Thr Glu Pro Asn Glu Arg Ala Cys Ala Lys Glu Lys Ile Val Thr 1190 1195 1200
Asn Ser Glu Pro Ser Asp Ser Lys Gly Ser Ser Ser Lys Ser Thr 1205 1210 1215
Arg Val Ile Thr Val Gin Glu Tyr Leu Gin Arg Lys Lys Asp Lys 1220 1225 1230
His Val Ile Gly Asn Asn Ala Ser Lys Asn Ile Cys Val Glu Asn 1235 1240 1245
Val Pro Cys Asp Ser Glu Pro Met Lys Ser Ser Lys His Ser Ala 1250 1255 1260
Ser Pro Ser Leu Gly Lys Leu Ile Glu Gly Gin Gly Val Ser Ala 1265 1270 1275
Glu Thr Leu Lys Glu Val Glu His Asn Ser Ser Ser His Gly Lys 1280 1285 1290
Asn Leu Lys Thr His Arg Ser Glu Glu Thr Arg Pro Tyr Ser Val 1295 1300 1305
Ser Asn Ser Lys Glu Lys Phe Tyr Arg Thr His Pro Asp Lys Ser 1310 1315 1320
Tyr Ile Asp Lys Ala Lys Leu Glu Arg Leu Thr Ser Met Ser Ser 1325 1330 1335
Lys Ser Ser Gin Leu Gin Val Lys Glu Lys Arg Lys Gin Tyr Leu 1340 1345 1350
Asn Arg Val Ala Phe Lys Cys Thr Glu Gin Glu Ser Ile Cys Leu 1355 1360 1365
Thr Lys Leu Asp Ser Ala Ser Lys Lys Leu Ser Lys Glu Lys Glu 1370 1375 1380
Lys Ser Thr Ala Cys Ala Pro Met Thr Lys Asp Tyr Thr His Lys 1385 1390 1395
Pro Met Leu Glu Phe Lys Leu Cys Pro Asp Val Leu Leu Lys Asn 1400 1405 1410
Thr Ser Ser Ile Asp Lys Gly Asp Asp Pro Arg Pro Gly Pro Glu 1415 1420 1425
Lys Glu Arg Ala Pro Val Gin Val Ser Gly Ile Lys Thr Thr Lys 1430 1435 1440
Glu Asp Trp Leu Lys Cys Ile Pro Thr Arg Thr Lys Met Pro Glu 1445 1450 1455
Ser Ser Glu Gin Thr Asp Arg Ala Asp Ser Arg Leu Ser Lys Arg 1460 1465 1470
Ser Phe Ser Ala Asp Glu Phe Glu Thr Leu Gin Asn Pro Val Lys 1475 1480 1485
Asp Ser Asn Val Met Phe Arg Thr Phe Lys Lys Met Tyr Leu Glu 1490 1495 1500
Lys Arg Ser Arg Ser Leu Gly Ser Ser Pro Val Lys 1505 1510 1515
<210> 23 <211> 1747 <212> PRT <213> Homo sapiens <400> 23
Met Asn Trp Asn Glu Lys Pro Lys Ser Ala Thr Leu Pro Pro Leu Tyr 15 10 15
Pro Lys Ser Gin Pro Pro Phe Leu His Gin Ser Leu Ile Asn Gin Ile 20 25 30
Thr Thr Thr Ser Gin Ser Ser Phe Ser Tyr Pro Gly Ser Asn Gin Glu 35 40 45
Ala Cys Met Tyr Pro Gly Asn Ser Asn Pro Ile Ser Gin Pro Leu Leu 50 55 60
Asn Ile Gin Asn Tyr Pro Gin Gin Ile Ser Val Ser Asp Met His Asn 65 70 75 80
Gly Thr Val Val Ala Ser His Thr Ser Val Glu Arg Ile Thr Tyr Ala 85 90 95
Asn Val Asn Gly Pro Lys Gin Leu Thr His Asn Leu Gin Met Ser Ser 100 105 110
Gly Val Thr Gin Asn Val Trp Leu Asn Ser Pro Met Arg Asn Pro Val 115 120 125
His Ser His Ile Gly Ala Thr Val Ser His Gin Thr Asp Phe Gly Ala 130 135 140
Asn Val Pro Asn Met Pro Ala Leu Gin Ser Gin Leu Ile Thr Ser Asp 145 150 155 160
Thr Tyr Ser Met Gin Met Gin Met Ile Pro Ser Asn Ser Thr Arg Leu 165 170 175
Pro Val Ala Tyr Gin Gly Asn Gin Gly Leu Asn Gin Ser Phe Ser Glu 180 185 190
Gin Gin Val Asp Trp Thr Gin Gin Cys Ile Ser Lys Gly Leu Thr Tyr 195 200 205
Pro Asp Tyr Arg Pro Pro Pro Lys Leu Tyr Arg Tyr Ser Pro Gin Ser 210 215 220
Phe Leu Pro Asp Ser Thr Ile Gin Lys Gin Asn Phe Ile Pro His Thr 225 230 235 240
Ser Leu Gin Val Lys Asn Ser Gin Leu Leu Asn Ser Val Leu Thr Leu 245 250 255
Pro Ser Arg Gin Thr Ser Ala Val Pro Ser Gin Gin Tyr Ala Thr Gin 260 265 270
Thr Asp Lys Arg Pro Pro Pro Pro Pro Tyr Asn Cys Arg Tyr Gly Ser 275 280 285
Gin Pro Leu Gin Ser Thr Gin His Ile Thr Lys His Leu Ser Met Glu 290 295 300
Val Pro Gin Ser Arg Glu Met Leu Ser Ser Glu Ile Arg Thr Ser Phe 305 310 315 320
Gin Gin Gin Trp Gin Asn Pro Asn Glu Asn Val Ser Thr Ile Gly Asn 325 330 335
Phe Thr Asn Leu Lys Val Asn Thr Asn Ser Lys Gin Pro Phe Asn Ser 340 345 350
Pro Ile Arg Ser Ser Val Asp Gly Val Gin Thr Leu Ala Gin Thr Asn 355 360 365
Glu Glu Lys Ile Met Asp Ser Cys Asn Pro Thr Ser Asn Gin Val Leu 370 375 380
Asp Thr Ser Val Ala Lys Glu Lys Leu Val Arg Asp Ile Lys Thr Leu 385 390 395 400
Val Glu Ile Lys Gin Lys Phe Ser Glu Leu Ala Arg Lys Ile Lys Ile 405 410 415
Asn Lys Asp Leu Leu Met Ala Ala Gly Cys Ile Lys Met Thr Asn Thr 420 425 430
Ser Tyr Ser Glu Pro Ala Gin Asn Ser Lys Leu Ser Leu Lys Gin Thr 435 440 445
Ala Lys Ile Gin Ser Gly Pro Gin Ile Thr Pro Val Met Pro Glu Asn 450 455 460
Ala Glu Arg Gin Thr Pro Thr Val Val Glu Ser Ala Glu Thr Asn Lys 465 470 475 480
Thr Gin Cys Met Leu Asn Ser Asp Ile Gin Glu Val Asn Cys Arg Arg 485 490 495
Phe Asn Gin Val Asp Ser Val Leu Pro Asn Pro Val Tyr Ser Glu Lys 500 505 510
Arg Pro Met Pro Asp Ser Ser His Asp Val Lys Val Leu Thr Ser Lys 515 520 525
Thr Ser Ala Val Glu Met Thr Gln Ala Val Leu Asn Thr Gln Leu Ser 530 535 540
Ser Glu Asn Val Thr Lys Val Glu Gln Asn Ser Pro Ala Val Cys Glu 545 550 555 560
Thr Ile Ser Val Pro Lys Ser Met Ser Thr Glu Glu Tyr Lys Ser Lys 565 570 575
Ile Gln Asn Glu Asn Met Leu Leu Leu Ala Leu Leu Ser Gln Ala Arg 580 585 590
Lys Thr Gln Lys Thr Val Leu Lys Asp Ala Asn Gln Thr Ile Gln Asp 595 600 605
Ser Lys Pro Asp Ser Cys Glu Met Asn Pro Asn Thr Gln Met Thr Gly 610 615 620
Asn Gln Leu Asn Leu Lys Asn Met Glu Thr Pro Ser Thr Ser Asn Val 625 630 635 640
Ser Gly Arg Val Leu Asp Asn Ser Phe Cys Ser Gly Gln Glu Ser Ser 645 650 655
Thr Lys Gly Met Pro Ala Lys Ser Asp Ser Ser Cys Ser Met Glu Val 660 665 670
Leu Ala Thr Cys Leu Ser Leu Trp Lys Lys Gln Pro Ser Asp Thr Ala 675 680 685
Lys Glu Lys Glu Cys Asp Lys Leu Arg Thr Asn Thr Thr Ala Val Gly 690 695 700
Ile Ser Lys Pro Ala Asn Ile His Val Lys Ser Pro Cys Ser Val Val 705 710 715 720
Gly Asn Ser Asn Ser Gin Asn Lys Ile Ser Asn Pro Ser Gin Gin Thr 725 730 735
Ala Leu Ser Met Val Met His Asn Tyr Glu Ser Ser Gly Ile Asn Ile 740 745 750
Thr Lys Gly Thr Glu Leu Gin Ile Ala Val Val Ser Pro Leu Val Leu 755 760 765
Ser Glu Val Lys Thr Leu Ser Val Lys Gly Ile Thr Pro Ala Val Leu 770 775 780
Pro Glu Thr Val Tyr Pro Val Ile Lys Glu Gly Ser Val Cys Ser Leu 785 790 795 800
Gin Asn Gin Leu Ala Glu Asn Ala Lys Ala Thr Ala Ala Leu Lys Val 805 810 815
Asp Val Ser Gly Pro Val Ala Ser Thr Ala Thr Ser Thr Lys Ile Phe 820 825 830
Pro Leu Thr Gin Lys Glu Lys Gin Asn Glu Ser Thr Asn Gly Asn Ser 835 840 845
Glu Val Thr Pro Asn Val Asn Gin Gly Lys His Asn Lys Leu Glu Ser 850 855 860
Ala Ile His Ser Pro Met Asn Asp Gin Gin Ile Ser Gin Glu Ser Arg 865 870 875 880
Asn Ser Thr Val Val Ser Ser Asp Thr Leu Gin Ile Asp Asn Ile Cys 885 890 895
Ser Leu Val Glu Gly Asp Thr Ser Tyr Asn Ser Gin Ile Ala Lys Ile 900 905 910
Phe Ser Ser Leu Pro Leu Lys Met Val Glu Pro Gin Lys Pro Ser Leu 915 920 925
Pro Asn Gin Gin Gly Ile Gly Ser Arg Glu Pro Glu Lys Gin Leu Asp 930 935 940
Asn Thr Thr Glu Asn Lys Asp Phe Gly Phe Gin Lys Asp Lys Pro Val 945 950 955 960
Gin Cys Thr Asp Val Ser His Lys Ile Cys Asp Gin Ser Lys Ser Glu 965 970 975
Pro Pro Leu Glu Ser Ser Phe Asn Asn Leu Glu Thr Asn Arg Val Ile 980 985 990
Leu Glu Lys Ser Ser Leu Glu His Ala Thr Glu Lys Ser Thr Ala Asn 995 1000 1005
Asp Thr Cys Ser Ser Ala Ala Ile Gin Glu Asp Ile Tyr Pro Gin 1010 1015 1020
Glu Ile Asp Ala Ser Ser Asn Tyr Thr Pro Gin Asp Pro Ala Arg 1025 1030 1035
Asn Glu Ile His Ser Asp Lys Ala Pro Val Leu Tyr Leu His Asp 1040 1045 1050
Gin Leu Ser Glu Leu Leu Lys Glu Phe Pro Tyr Gly Ile Glu Ala 1055 1060 1065
Val Asn Thr Arg Glu Gly Ser Val Gly Gin Gin Thr Thr Tyr Gin 1070 1075 1080
Thr Ser Glu Asp Gin Thr Ala Asp Lys Thr Ser Ser Asp Ser Lys 1085 1090 1095
Asp Pro Ala Asp Gin Ile Gin Ile Thr Ile Leu Ser Ser Glu Gin 1100 1105 1110
Met Lys Glu Ile Phe Pro Glu Gin Asp Asp Gin Pro Tyr Val Val 1115 1120 1125
Asp Lys Leu Ala Glu Pro Gin Lys Glu Glu Pro Ile Thr Glu Val 1130 1135 1140
Val Ser Gin Cys Asp Leu Gin Ala Pro Ala Ala Gly Gin Ser Arg 1145 1150 1155
Asp Ser Val Ile Leu Asp Ser Glu Lys Asp Asp Ile His Cys Cys 1160 1165 1170
Ala Leu Gly Trp Leu Ser Met Val Tyr Glu Gly Val Pro Gin Cys 1175 1180 1185
Gin Cys Asn Ser Ile Lys Asn Ser Ser Ser Glu Glu Glu Lys Gin 1190 1195 1200
Lys Glu Gin Cys Ser Pro Leu Asp Thr Asn Ser Cys Lys Gin Gly 1205 1210 1215
Glu Arg Thr Ser Asp Arg Asp Val Thr Val Val Gin Phe Lys Ser 1220 1225 1230
Leu Val Asn Asn Pro Lys Thr Pro Pro Asp Gly Lys Ser His Phe 1235 1240 1245
Pro Glu Leu Gin Asp Asp Ser Arg Lys Asp Thr Pro Lys Thr Lys 1250 1255 1260
Hls Lys Ser Leu Pro Arg Thr Glu Gin Glu Leu Val Ala Gly Gin 1265 1270 1275
Phe Ser Ser Lys Cys Asp Lys Leu Asn Pro Leu Gin Asn His Lys 1280 1285 1290
Arg Lys Lys Leu Arg Phe His Glu Val Thr Phe His Ser Ser Asn 1295 1300 1305
Lys Met Thr Ala Ser Tyr Glu Gin Ala Ser Gin Glu Thr Arg Gin 1310 1315 1320
Lys Lys His Val Thr Gin Asn Ser Arg Pro Leu Lys Thr Lys Thr 1325 1330 1335
Ala Phe Leu Pro Asn Lys Asp Val Tyr Lys Lys His Ser Ser Leu 1340 1345 1350
Gly Gin Ser Leu Ser Pro Glu Lys Ile Lys Leu Lys Leu Lys Ser 1355 1360 1365
Val Ser Phe Lys Gin Lys Arg Lys Leu Asp Gin Gly Asn Val Leu 1370 1375 1380
Asp Met Glu Val Lys Lys Lys Lys His Asp Lys Gin Glu Gin Lys 1385 1390 1395
Gly Ser Val Gly Ala Thr Phe Lys Leu Gly Asp Ser Leu Ser Asn 1400 1405 1410
Pro Asn Glu Arg Ala Ile Val Lys Glu Lys Met Val Ser Asn Thr 1415 1420 1425
Lys Ser Val Asp Thr Lys Ala Ser Ser Ser Lys Phe Ser Arg Ile 1430 1435 1440
Leu Thr Pro Lys Glu Tyr Leu Gin Arg Gin Lys His Lys Glu Ala 1445 1450 1455
Leu Ser Asn Lys Ala Ser Lys Lys Ile Cys Val Lys Asn Val Pro 1460 1465 1470
Cys Asp Ser Glu His Met Arg Pro Ser Lys Leu Ala Val Gin Val 1475 1480 1485
Glu Ser Cys Gly Lys Ser Asn Glu Lys His Ser Ser Gly Val Gin 1490 1495 1500
Thr Ser Lys Glu Ser Leu Asn Gly Leu Thr Ser His Gly Lys Asn 1505 1510 1515
Leu Lys Ile His His Ser Gin Glu Ser Lys Thr Tyr Asn Ile Leu 1520 1525 1530
Arg Asn Val Lys Glu Lys Val Gly Gly Lys Gin Pro Asp Lys Ile 1535 1540 1545
Trp Ile Asp Lys Thr Lys Leu Asp Lys Leu Thr Asn Ile Ser Asn 1550 1555 1560
Glu Ala Gin Phe Ser Gin Met Pro Pro Gin Val Lys Asp Gin Lys 1565 1570 1575
Lys Leu Tyr Leu Asn Arg Val Gly Phe Lys Cys Thr Glu Arg Glu 1580 1585 1590
Ser Ile Ser Leu Thr Lys Leu Glu Ser Ser Pro Arg Lys Leu His 1595 1600 1605
Lys Asp Lys Arg Gin Glu Asn Lys His Lys Thr Phe Leu Pro Val 1610 1615 1620
Lys Gly Asn Thr Glu Lys Ser Asn Met Leu Glu Phe Lys Leu Cys 1625 1630 1635
Pro Asp Ile Leu Leu Lys Asn Thr Asn Ser Val Glu Glu Arg Lys 1640 1645 1650
Asp Val Lys Pro His Pro Arg Lys Glu Gin Ala Pro Leu Gin Val 1655 1660 1665
Ser Gly Ile Lys Ser Thr Lys Glu Asp Trp Leu Lys Phe Val Ala 1670 1675 1680
Thr Lys Lys Arg Thr Gin Lys Asp Ser Gin Glu Arg Asp Asn Val 1685 1690 1695
Asn Ser Arg Leu Ser Lys Arg Ser Phe Ser Ala Asp Gly Phe Glu 1700 1705 1710
Met Leu Gin Asn Pro Val Lys Asp Ser Lys Glu Met Phe Gin Thr 1715 1720 1725
Tyr Lys Gin Met Tyr Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser 1730 1735 1740
Ser Pro Val Lys 1745 <210> 24 <211> 1747
<212> PRT <213> Homo sapiens <400> 24
Met Asn Trp Asn Glu Lys Pro Lys Ser Ala Thr Leu Pro Pro Leu Tyr 15 10 15
Pro Lys Ser Gin Pro Pro Phe Leu His Gin Ser Leu Ile Asn Gin Ile 20 25 30
Thr Thr Thr Ser Gin Ser Ser Phe Ser Tyr Pro Gly Ser Asn Gin Glu 35 40 45
Ala Cys Met Tyr Pro Gly Asn Ser Asn Pro Ile Ser Gin Pro Leu Leu 50 55 60
Asn Ile Gin Asn Tyr Pro Gin Gin Ile Ser Val Ser Asp Met His Asn 65 70 75 80
Gly Thr Val Val Ala Ser His Thr Ser Val Glu Arg Ile Thr Tyr Ala 85 90 95
Asn Val Asn Gly Pro Lys Gin Leu Thr His Asn Leu Gin Met Ser Ser 100 105 110
Gly Val Thr Gin Asn Val Trp Leu Asn Ser Pro Met Arg Asn Pro Val 115 120 125
His Ser His Ile Gly Ala Thr Val Ser His Gin Thr Asp Phe Gly Ala 130 135 140
Asn Val Pro Asn Met Pro Ala Leu Gin Ser Gin Leu Ile Thr Ser Asp 145 150 155 160
Thr Tyr Ser Met Gin Met Gin Met Ile Pro Ser Asn Ser Thr Arg Leu 165 170 175
Pro Val Ala Tyr Gin Gly Asn Gin Gly Leu Asn Gin Ser Phe Ser Glu 180 185 190
Gin Gin Val Asp Trp Thr Gin Gin Cys Ile Ser Lys Gly Leu Thr Tyr 195 200 205
Pro Asp Tyr Arg Pro Pro Pro Lys Leu Tyr Arg Tyr Ser Pro Gin Ser 210 215 220
Phe Leu Pro Asp Ser Thr Ile Gin Lys Gin Asn Phe Ile Pro His Thr 225 230 235 240
Ser Leu Gin Val Lys Asn Ser Gin Leu Leu Asn Ser Val Leu Thr Leu 245 250 255
Pro Ser Arg Gin Thr Ser Ala Val Pro Ser Gin Gin Tyr Ala Thr Gin 260 265 270
Thr Asp Lys Arg Pro Pro Pro Pro Pro Tyr Asn Cys Arg Tyr Gly Ser 275 280 285
Gin Pro Leu Gin Ser Thr Gin His Ile Thr Lys His Leu Ser Met Glu 290 295 300
Val Pro Gin Ser Arg Glu Met Leu Ser Ser Glu Ile Arg Thr Ser Phe 305 310 315 320
Gin Gin Gin Trp Gin Asn Pro Asn Glu Asn Val Ser Thr Ile Gly Asn 325 330 335
Phe Thr Asn Leu Lys Val Asn Thr Asn Ser Lys Gin Pro Phe Asn Ser 340 345 350
Pro Ile Arg Ser Ser Val Asp Gly Val Gin Thr Leu Ala Gin Thr Asn 355 360 365
Glu Glu Lys Ile Met Asp Ser Cys Asn Pro Thr Ser Asn Gin Val Leu 370 375 380
Asp Thr Ser Val Ala Lys Glu Lys Leu Val Arg Asp Ile Lys Thr Leu 385 390 395 400
Val Glu Ile Lys Gin Lys Phe Ser Glu Leu Ala Arg Lys Ile Lys Ile 405 410 415
Asn Lys Asp Leu Leu Met Ala Ala Gly Cys Ile Lys Met Thr Asn Thr 420 425 430
Ser Tyr Ser Glu Pro Ala Gin Asn Ser Lys Leu Ser Leu Lys Gin Thr 435 440 445
Ala Lys Ile Gin Ser Gly Pro Gin Ile Thr Pro Val Met Pro Glu Asn 450 455 460
Ala Glu Arg Gin Thr Pro Thr Val Val Glu Ser Ala Glu Thr Asn Lys 465 470 475 480
Thr Gin Cys Met Leu Asn Ser Asp Ile Gin Glu Val Asn Cys Arg Arg 485 490 495
Phe Asn Gin Val Asp Ser Val Leu Pro Asn Pro Val Tyr Ser Glu Lys 500 505 510
Arg Pro Met Pro Asp Pro Ser His Asp Val Lys Val Leu Thr Ser Lys 515 520 525
Thr Ser Ala Val Glu Met Thr Gin Ala Val Leu Asn Thr Gin Leu Ser 530 535 540
Ser Glu Asn Val Thr Lys Val Glu Gln Asn Ser Pro Ala Val Cys Glu 545 550 555 560
Thr Ile Ser Val Pro Lys Ser Met Ser Thr Glu Glu Tyr Lys Ser Lys 565 570 575
Ile Gln Asn Glu Asn Met Leu Leu Leu Ala Leu Leu Ser Gln Ala Arg 580 585 590
Lys Thr Gln Lys Thr Val Leu Lys Asp Ala Asn Gln Thr Ile Gln Asp 595 600 605
Ser Lys Pro Asp Ser Cys Glu Met Asn Pro Asn Thr Gln Met Thr Gly 610 615 620
Asn Gln Leu Asn Leu Lys Asn Met Glu Thr Pro Ser Thr Ser Asn Val 625 630 635 640
Ser Gly Arg Val Leu Asp Asn Ser Phe Cys Ser Gly Gln Glu Ser Ser 645 650 655
Thr Lys Gly Met Pro Ala Lys Ser Asp Ser Ser Cys Ser Met Glu Val 660 665 670
Leu Ala Thr Cys Leu Ser Leu Trp Lys Lys Gln Pro Ser Asp Thr Ala 675 680 685
Lys Glu Lys Glu Cys Asp Lys Leu Arg Thr Asn Thr Thr Ala Val Gly 690 695 700
Ile Ser Lys Pro Ala Asn Ile His Val Lys Ser Pro Cys Ser Val Val 705 710 715 720
Gly Asn Ser Asn Ser Gln Asn Lys Ile Ser Asn Pro Ser Gln Gln Thr 725 730 735
Ala Leu Ser Met Val Met His Asn Tyr Glu Ser Ser Gly Ile Asn Ile 740 745 750
Thr Lys Gly Thr Glu Leu Gin Ile Ala Val Val Ser Pro Leu Val Leu 755 760 765
Ser Glu Val Lys Thr Leu Ser Val Lys Gly Ile Thr Pro Ala Val Leu 770 775 780
Pro Glu Thr Val Tyr Pro Val Ile Lys Glu Gly Ser Val Cys Ser Leu 785 790 795 800
Gin Asn Gin Leu Ala Glu Asn Ala Lys Ala Thr Ala Ala Leu Lys Val 805 810 815
Asp Val Ser Gly Pro Val Ala Ser Thr Ala Thr Ser Thr Lys Ile Phe 820 825 830
Pro Leu Thr Gin Lys Glu Lys Gin Asn Glu Ser Thr Asn Gly Asn Ser 835 840 845
Glu Val Thr Pro Asn Val Asn Gin Gly Lys His Asn Lys Leu Glu Ser 850 855 860
Ala Ile His Ser Pro Met Asn Asp Gin Gin Ile Ser Gin Glu Ser Arg 865 870 875 880
Asn Ser Thr Val Val Ser Ser Asp Thr Leu Gin Ile Asp Asn Ile Cys 885 890 895
Ser Leu Val Glu Gly Asp Thr Ser Tyr Asn Ser Gin Ile Ala Lys Ile 900 905 910
Phe Ser Ser Leu Pro Leu Lys Met Val Glu Pro Gin Lys Pro Ser Leu 915 920 925
Pro Asn Gin Gin Gly Ile Gly Ser Arg Glu Pro Glu Lys Gin Leu Asp 930 935 940
Asn Thr Thr Glu Asn Lys Asp Phe Gly Phe Gin Lys Asp Lys Pro Val 945 950 955 960
Gin Cys Thr Asp Val Ser His Lys Ile Cys Asp Gin Ser Lys Ser Glu 965 970 975
Pro Pro Leu Glu Ser Ser Phe Asn Asn Leu Glu Thr Asn Arg Val Ile 980 985 990
Leu Glu Lys Ser Ser Leu Glu His Ala Thr Glu Lys Ser Thr Ala Asn 995 1000 1005
Asp Thr Cys Ser Ser Ala Ala Ile Gin Glu Asp Ile Tyr Pro Gin 1010 1015 1020
Glu Ile Asp Ala Ser Ser Asn Tyr Thr Pro Gin Asp Pro Ala Arg 1025 1030 1035
Asn Glu Ile His Ser Asp Lys Ala Pro Val Leu Tyr Leu His Asp 1040 1045 1050
Gin Leu Ser Glu Leu Leu Lys Glu Phe Pro Tyr Gly Ile Glu Ala 1055 1060 1065
Val Asn Thr Arg Glu Gly Ser Val Gly Gin Gin Thr Thr Tyr Gin 1070 1075 1080
Thr Ser Glu Asp Gin Thr Ala Asp Lys Thr Ser Ser Asp Ser Lys 1085 1090 1095
Asp Pro Ala Asp Gin Ile Gin Ile Thr Ile Leu Ser Ser Glu Gin 1100 1105 1110
Met Lys Glu Ile Phe Pro Glu Gin Asp Asp Gin Pro Tyr Val Val 1115 1120 1125
Asp Lys Leu Ala Glu Pro Gin Lys Glu Glu Pro Ile Thr Glu Val 1130 1135 1140
Val Ser Gin Cys Asp Leu Gin Ala Pro Ala Ala Gly Gin Ser Arg 1145 1150 1155
Asp Ser Val Ile Leu Asp Ser Glu Lys Asp Asp Ile His Cys Cys 1160 1165 1170
Ala Leu Gly Trp Leu Ser Met Val Tyr Glu Gly Val Pro Gin Cys 1175 1180 1185
Gin Cys Asn Ser Ile Lys Asn Ser Ser Ser Glu Glu Glu Lys Gin 1190 1195 1200
Lys Glu Gin Cys Ser Pro Leu Asp Thr Asn Ser Cys Lys Gin Gly 1205 1210 1215
Glu Arg Thr Ser Asp Arg Asp Val Thr Val Val Gin Phe Lys Ser 1220 1225 1230
Leu Val Asn Asn Pro Lys Thr Pro Pro Asp Gly Lys Ser His Phe 1235 1240 1245
Pro Glu Leu Gin Asp Asp Ser Arg Lys Asp Thr Pro Lys Thr Lys 1250 1255 1260
His Lys Ser Leu Pro Arg Thr Glu Gin Glu Leu Val Ala Gly Gin 1265 1270 1275
Phe Ser Ser Lys Cys Asp Lys Leu Asn Pro Leu Gin Asn His Lys 1280 1285 1290
Arg Lys Lys Leu Arg Phe His Glu Val Thr Phe His Ser Ser Asn 1295 1300 1305
Lys Met Thr Ala Ser Tyr Glu Gin Ala Ser Gin Glu Thr Arg Gin 1310 1315 1320
Lys Lys His Val Thr Gin Asn Ser Arg Pro Leu Lys Thr Lys Thr 1325 1330 1335
Ala Phe Leu Pro Asn Lys Asp Val Tyr Lys Lys His Ser Ser Leu 1340 1345 1350
Gly Gin Ser Leu Ser Pro Glu Lys Ile Lys Leu Lys Leu Lys Ser 1355 1360 1365
Val Ser Phe Lys Gin Lys Arg Lys Leu Asp Gin Gly Asn Val Leu 1370 1375 1380
Asp Met Glu Val Lys Lys Lys Lys His Asp Lys Gin Glu Gin Lys 1385 1390 1395
Gly Ser Val Gly Ala Thr Phe Lys Leu Gly Asp Ser Leu Ser Asn 1400 1405 1410
Pro Asn Glu Arg Ala Ile Val Lys Glu Lys Met Val Ser Asn Thr 1415 1420 1425
Lys Ser Val Asp Thr Lys Ala Ser Ser Ser Lys Phe Ser Arg Ile 1430 1435 1440
Leu Thr Pro Lys Glu Tyr Leu Gin Arg Gin Lys His Lys Glu Ala 1445 1450 1455
Leu Ser Asn Lys Ala Ser Lys Lys Ile Cys Val Lys Asn Val Pro 1460 1465 1470
Cys Asp Ser Glu His Met Arg Pro Ser Lys Leu Ala Val Gin Val 1475 1480 1485
Glu Ser Cys Gly Lys Ser Asn Glu Lys His Ser Ser Gly Val Gin 1490 1495 1500
Thr Ser Lys Glu Ser Leu Asn Gly Leu Thr Ser His Gly Lys Asn 1505 1510 1515
Leu Lys Ile His His Ser Gin Glu Ser Lys Thr Tyr Asn Ile Leu 1520 1525 1530
Arg Asn Val Lys Glu Lys Val Gly Gly Lys Gin Pro Asp Lys Ile 1535 1540 1545
Trp Ile Asp Lys Thr Lys Leu Asp Lys Leu Thr Asn Ile Ser Asn 1550 1555 1560
Glu Ala Gin Phe Ser Gin Met Pro Pro Gin Val Lys Asp Gin Lys 1565 1570 1575
Lys Leu Tyr Leu Asn Arg Val Gly Phe Lys Cys Thr Glu Arg Glu 1580 1585 1590
Ser Ile Ser Leu Thr Lys Leu Glu Ser Ser Pro Arg Lys Leu Hrs 1595 1600 1605
Lys Asp Lys Arg Gin Glu Asn Lys His Lys Thr Phe Leu Pro Val 1610 1615 1620
Lys Gly Asn Thr Glu Lys Ser Asn Met Leu Glu Phe Lys Leu Cys 1625 1630 1635
Pro Asp Ile Leu Leu Lys Asn Thr Asn Ser Val Glu Glu Arg Lys 1640 1645 1650
Asp Val Lys Pro His Pro Arg Lys Glu Gin Ala Pro Leu Gin Val 1655 1660 1665
Ser Gly Ile Lys Ser Thr Lys Glu Asp Trp Leu Lys Phe Val Ala 1670 1675 1680
Thr Lys Lys Arg Thr Gin Lys Asp Ser Gin Glu Arg Asp Asn Val 1685 1690 1695
Asn Ser Arg Leu Ser Lys Arg Ser Phe Ser Ala Asp Gly Phe Glu 1700 1705 1710
Met Leu Gin Asn Pro Val Lys Asp Ser Lys Glu Met Phe Gin Thr 1715 1720 1725
Tyr Lys Gin Met Tyr Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser 1730 1735 1740
Ser Pro Val Lys 1745 <210> 25 <211> 4644
<212> ADN <213> Cricetulus griseus <400> 25 atgaattgga atgcaaaacc agagaatgct gccccaaacc caccatattc taaaagccag 60 tcgtctcttt tgcagcagtt tttaatgcct tccacaactt ctcaaagttc tttcagctgt 120 ctcccacata accaagaagc atgcatatat cccactaatt caaattcagt ttcacagcca 180 cttctgaacg tcaggagttt cataaatcct ccgatctctg tttctaatgt gcataatagg 240 acagttgtgg cctcacagac ctcagtagaa agagtcacat atacaaatgt taaaggagcc 300 caacaaccaa accacaattt gcaaacagtg tcttctggag ttgtgcaaaa tgcctggatg 360 aattcaacaa tgaggaattt tatgccttct cttacagagg caaccatatc tcataaacct 420 gatggtgggc ctagtatgcc atatatgcat gcaccacaga gtcatcttgt cacatcagac 480 acctactctg tgcaactaca gatgactcct tcaaactctg taagaggccc tgtaacttac 540 caaggaaatt atcaaggaaa tccgggactt aaccactcga tggcaggtga gcttggctgg 600 gtacaatgtg catccagtga acttacttat ccagattaca gaccacctcc aaagcaatat 660 ccttatttac cacaaagctt tgtgcaagac acttctgttc agaaacaaaa ctttgtgtca 720 tctacatcat tacaagttaa aaataatcag cttccacctt ctacacagac cttaccatca 780 aagcgccctg tacctgtgtc gtcatatcag tatgctgcag aaaccagcaa aagactccct 840 cccccccctt acagctgtag atatggaagc caacatgtgc aaaattctca gtctgtttct 900 agacacttgc ctgtggaagt tcctcagagt tcagaaatgc actcgtctga aaaaaagaaa 960 gatgcttaca aagtctttca acagcagtgg cagagcacta gtaaaaatgt cagtacaata 1020 ggaaaattct gtgagttgaa aattaataca aaacagtctt acaatgactc tgctggctct 1080 tctggggatg gtgttcatac tcttgttcaa aataatcaag aagaaagaaa gtattcttat 1140 aatccaagta caaatcaaat actagacaca aatgtcacaa aagaaaagct ggtgagggat 1200 attaaatcac tagtagaaat taaaaagaaa ttttcagaac ttgcaagaaa aattaaaatc 1260 aacaaaaagc ttttgatggc agctggttgc agtaaaacag ctaatacttc ttatactgaa 1320 ccaactcggc attctgaatt ttcagcaaaa gaaatgtctg ctaaaaggga caatcagtgc 1380 tccatggaat tgctagcaac atgcctttct ctttggaaaa accaacctcc aaaaaccaca 1440 gaagaaaatg tttcaaaacc tttagaagaa aaacaatata atgcatcaag aactagtaca 1500 acagcggttg gcccttcaaa tcccatgaat gaagttcatg tgaagaattt ttgttcaggt 1560 gttagaaatt ctcagaaaat aaccacctcg tcacaaacag tcttgtcagt tctcacacca 1620 gtttacgatt cttcagatgt agctgttgga aaaggaacag agcttcagat tgctgtggtt 1680 tcacctttaa ttctttcaga tgtcagtact gtacctggga aagagttagc tcctgaagtc 1740 gtatctgaaa ctgtatatcc agttgtgaag gaaggcagtg tttgtagctt acaaaaccag 1800 caggcagaaa atgcaacagt aactgctggt ttgccctttg atgttatcag agcagtagca 1860 agtgctactg tatcagctga gctatcactg cctgggcata aagaaaagca gcacaaacca 1920 acacagagtg atctagacat cgctgatggc agcctaggga aacactctcc ccagggtgct 1980 gaagctttgc ctaaccctag ggacagcacc attgtgagtg ggcctatatt acagattgaa 2040 agtatctgtt ctcttgcaga aggtgatgta tcttacaatt cccaaatagc agagatattc 2100 aactctgtac aaaatgagcc ccagaaacct tcacctgatc agcaagtaat taatagtcaa 2160 caagaagaac aagtagataa ggttgctgaa aataaagact taagttttct gaaagacaag 2220 tgtatgcagt gtacagatgt tcctcatgaa gtcactgaac agccagagcc actgcagcct 2280 ttagagacaa catctgatga gtatgttgaa gcaaacggag aaatcctaga ggaaagcagt 2340 aaggagaatc ctggtgaaaa agagatgact aaggacatat tgtgttcacc agctgctgtt 2400 cagcaagatc ctcaacctca ggaaattgac acagccagca gtaagtcagg acacagtttt 2460 tctacagtaa atgagattaa tgatgaaaat gaacctgtct catacctaca tgaccagctg 2520 ttagaacttc taaaagagtt tccttatggc attgaaacta ttgccaggcc tgaagtttat 2580 gtgggccaac aaaagacaca tgaaatctta gaaaatcaaa ctggtagtaa aactggtaat 2640 gtgtctgggg ataacacaga ccaaataaaa attacagtat taaactcaga acaaatcaaa 2700 gaattatttc ctgaagagga tcagccatgt gatgtagaca aattggcaga acccgagaat 2760 acaaaaatca ttgcagaagt aaagagcctg tgtgattcac aggtccccag agaagaaagt 2820 cacaaccctg gaatgttgga tctggagaaa gataaaatcc attgctgtgc cttgggctgg 2880 ctctcaatgg tttatgaagg tgtgccacag tgtcagtgca gttccatgga agagaaagag 2940 aaagaccagt gttctttgga aatctctaat tgcaaacaag gagagcaggc ctgcaatagt 3000 ggaatcacta tttttgaaat taatcctatt tctaataact caaaaagtcc tctgatccaa 3060 gaatctgaga aaggccattt ttctgacata catggtgaaa agataaaaac atctgaaaca 3120 aaaaacagca gctcaccaag ggtagaacag gaattaactg gtcatttttc aatgaaatgt 3180 taccagaaag ataaatctac aacaaaacag gatagctcac tgaaaacaga gcaaaaaata 3240 aaaaatcttt cttctaaatg tgacaaacca aatcccttaa aaagcagtaa aataccaacc 3300 cctgaaacat ttaatgtggt aacttccaac tctgataaaa atatgccagc attttctaaa 3360 caagattctc agggaagcct gcagaagaaa cacctattcc aagactcaga tccagtaaaa 3420 ggacatgtat ggcttttgcc aaataaagat ccacgcagga ggaatacctt tttagtacag 3480 tcagtatcac cagaaaagaa aaagttaaaa ttcaaatcgg gtagctccaa actgaaatat 3540 tttgaaaaaa gaaaaatgga ccatttgctt atctcagatg tggaaataaa aaagaagaaa 3600 tacgaaaaac aagagcagaa caaaaatgct ggaggcacac tcaaattatg tagtactctg 3660 actgaaccaa atgaaagagc ctgtgctaaa gaaaagatag tgacaaattc tgagccctca 3720 gactcaaagg gaagctcctc taagagtact agagttataa ctgtgcagga atatttacag 3780 cggaaaaaag acaaacatgt aataggaaat aatgcctcca aaaacatctg tgtagaaaat 3840 gtgccatgtg actctgaacc catgaagtcc agtaaacatt ctgcatcacc tagtttggga 3900 aaattaattg agggccaggg tgtcagtgca gagactttaa aagaagtaga acataattcc 3960 accagccatg gcaaaaatct caagacccac cgttctgagg agactaggcc atacagtgtg 4020 tcaaatagta aagagaaatt ttataggaca catccagaca aatcttacat tgataaagct 4080 aaattagaaa gattgaccag tatgagtagt aagtccagcc agctccaggt aaaggaaaaa 4140 aggaaacagt acctgaatcg agttgcattc aaatgcacag aacaggaaag catttgtctc 4200 accaaattgg acagtgcatc caagaagctt agtaaagaga aagaaaagag tacagcatgt 4260 gcacccatga caaaagacta cacacacaag cccatgttgg agtttaaatt atgtccagat 4320 gtgctattga agaatacaag ctccattgac aaaggggatg atccaaggcc tgggcctgag 4380 aaggagcgag cacctgtgca agtttcagga ataaaaacta caaaagaaga ctggttaaaa 4440 tgtatcccaa caaggacaaa gatgcccgaa tcaagtgaac aaacagatcg ggctgactca 4500 agactctcta agagaagctt cagtgcagat gaatttgaaa ctctacaaaa cccagtaaaa 4560 gactcaaatg tcatgttccg gactttcaaa aagatgtacc tggagaagag aagcaggagc 4620 etggggagca gtccagtgaa gtag 4644
<210> 26 <211> 112 <212> ADN <213> Cricetulus griseus <400> 26 tgctgggatt taaggggaaa gctttaataa aagatcttta tttgtatttc ttgcagattt 60 gtgacattca aaaccacaga ctatgcaaca ctactactaa accaggtcaa at 112
<210> 27 <211> 36 <212> ADN <213> Cricetulus griseus <400> 27 cttcgggata gagtggtttt gcttttacca ccagga 36
<210> 28 <211> 221 <212> PRT <213> Homo sapiens <400> 28
Met Phe Gly Phe His Lys Pro Lys Met Tyr Arg Ser Ile Glu Gly Cys 15 10 15
Cys Ile Cys Arg Ala Lys Ser Ser Ser Ser Arg Phe Thr Asp Ser Lys 20 25 30
Arg Tyr Glu Lys Asp Phe Gin Ser Cys Phe Gly Leu His Glu Thr Arg 35 40 45
Ser Gly Asp Ile Cys Asn Ala Cys Val Leu Leu Val Lys Arg Trp Lys 50 55 60
Lys Leu Pro Ala Gly Ser Lys Lys Asn Trp Asn His Val Val Asp Ala 65 70 75 80
Arg Ala Gly Pro Ser Leu Lys Thr Thr Leu Lys Pro Lys Lys Val Lys 85 90 95
Thr Leu Ser Gly Asn Arg Ile Lys Ser Asn Gin Ile Ser Lys Leu Gin 100 105 110
Lys Glu Phe Lys Arg His Asn Ser Asp Ala His Ser Thr Thr Ser Ser 115 120 125
Ala Ser Pro Ala Gin Ser Pro Cys Tyr Ser Asn Gin Ser Asp Asp Gly 130 135 140
Ser Asp Thr Glu Met Ala Ser Gly Ser Asn Arg Thr Pro Val Phe Ser 145 150 155 160
Phe Leu Asp Leu Thr Tyr Trp Lys Arg Gin Lys Ile Cys Cys Gly Ile 165 170 175
Ile Tyr Lys Gly Arg Phe Gly Glu Val Leu Ile Asp Thr His Leu Phe 180 185 190
Lys Pro Cys Cys Ser Asn Lys Lys Ala Ala Ala Glu Lys Pro Glu Glu 195 200 205
Gin Gly Pro Glu Pro Leu Pro Ile Ser Thr Gin Glu Trp 210 215 220
<210> 29 <211> 221 <212> PRT <213> Mus musculus <400> 29
Met Phe Gly Phe His Lys Pro Lys Met Tyr Arg Ser Ile Glu Gly Cys 15 10 15
Cys Ile Cys Arg Ala Lys Ser Ser Ser Ser Arg Phe Thr Asp Ser Lys 20 25 30
Arg Tyr Glu Lys Asp Phe Gin Ser Cys Phe Gly Leu His Glu Thr Arg 35 40 45
Ser Gly Asp Ile Cys Asn Ala Cys Val Leu Leu Val Lys Arg Trp Lys 50 55 60
Lys Leu Pro Ala Gly Ser Lys Lys Asn Trp Asn His Val Val Asp Ala 65 70 75 80
Arg Ala Gly Pro Ser Leu Lys Thr Thr Leu Lys Pro Lys Lys Val Lys 85 90 95
Thr Leu Ser Gly Asn Arg Met Lys Ser Asn Gin Ile Ser Lys Leu Gin 100 105 110
Lys Glu Phe Lys Arg His Asn Ser Asp Ala His Ser Thr Thr Ser Ser 115 120 125
Ala Ser Pro Ala Gin Ser Pro Cys Tyr Ser Asn Gin Ser Asp Glu Gly 130 135 140
Ser Asp Thr Glu Met Ala Ser Ser Ser Asn Arg Thr Pro Val Phe Ser 145 150 155 160
Phe Leu Asp Leu Thr Tyr Trp Lys Arg Gin Lys Ile Cys Cys Gly Ile 165 170 175
Ile Tyr Lys Gly Arg Phe Gly Glu Val Leu Ile Asp Thr His Leu Phe 180 185 190
Lys Pro Cys Cys Ser Ser Lys Lys Ala Ala Ala Glu Lys Pro Glu Glu 195 200 205
Gin Gly Pro Ala Pro Leu Pro Ile Ser Thr Gin Glu Trp 210 215 220
<210> 30 <211> 221 <212> PRT <213> Cricetulus griseus <400> 30
Met Phe Gly Phe His Lys Pro Lys Met Tyr Arg Ser Ile Glu Gly Cys 15 10 15
Cys Ile Cys Arg Ala Lys Ser Ser Ser Ser Arg Phe Thr Asp Ser Lys 20 25 30
Arg Tyr Glu Lys Asp Phe Gin Ser Cys Phe Gly Leu His Glu Thr Arg 35 40 45
Ser Gly Asp Ile Cys Asn Ala Cys Val Leu Leu Val Lys Arg Trp Lys 50 55 60
Lys Leu Pro Ala Gly Ser Lys Lys Asn Trp Asn His Val Ser His Ser 65 70 75 80
Arg Ala Gly Pro Ser Leu Lys Thr Thr Leu Lys Pro Lys Lys Val Lys 85 90 95
Thr Leu Ser Gly Asn Arg Met Lys Ser Asn Gin Ile Ser Lys Leu Gin 100 105 110
Lys Glu Phe Lys Arg His Asn Ser Asp Ala His Ser Thr Thr Ser Ser 115 120 125
Ala Ser Pro Ala Gin Ser Pro Cys Tyr Ser Asn Gin Ser Asp Asp Gly 130 135 140
Ser Asp Thr Glu Met Ala Ser Ser Ser Asn Arg Thr Pro Val Phe Ser 145 150 155 160
Phe Leu Asp Leu Thr Tyr Trp Lys Arg Gin Lys Ile Cys Cys Gly Ile 165 170 175
Ile Tyr Lys Gly Arg Phe Gly Glu Val Leu Ile Asp Thr His Leu Phe 180 185 190
Lys Pro Cys Cys Ser Ser Lys Lys Ala Ala Pro Glu Lys Pro Glu Glu 195 200 205
Gin Gly Pro Ala Pro Leu Pro Ile Ser Thr Gin Glu Trp 210 215 220
<210> 31 <211> 1236 <212> ADN <213> Cricetulus griseus <400> 31 ctcagaagaa aagatgtttg gttttcacaa gccaaagatg taccgaagta tagagggctg 60 ctgtatctgc agagccaagt cctccagctc tcggttcacg gacagtaaac gttatgaaaa 120 ggacttccag agctgttttg ggttgcacga gactcgctca ggagatatct gcaatgcctg 180 tgtgctgctt gtgaaaagat ggaagaagtt gccagcagga tcaaaaaaaa actggaatca 240 tgtgtcacac tcaagggcag gacccagtct aaagacaaca ttgaaaccaa agaaagtgaa 300 aactctatct ggaaacagga tgaaaagcaa ccagatcagt aaactgcaga aggagtttaa 360 acgccacaac tctgatgctc acagtaccac ctcaagtgcc tcgccagccc agtctccctg 420 ctacagtaac cagtcagatg atggctcaga cacagagatg gcttccagct ctaacagaac 480 tccagttttt tccttcttag atcttaccta ctggaaaaga cagaaaatat gttgtgggat 540 catctataag ggccgttttg gggaagtcct catcgacacg catctcttca agccttgctg 600 cagcagtaag aaggcagctc ctgagaagcc tgaggaacag ggaccagcgc ctctgcccat 660 ctctactcag gagtggtgac tgaggttcat gcagaaggga acaaagagca atttaaactt 720 tgaaaagacc acaaagcaac agactgaccc tcctattttt aacttggata cctgctattc 780 tgccaaaaga cattttctag aatagttttt aatgggttac ccatcccccc atccaacaaa 840 ctcggaagcc agttctagct tactgcaaga agagagtgta cataatattt aatatgctga 900 gtatttcata ggaaggctga atgctgctgt aaagtgctct ttaagtcttt tttttttttt 960 aatcccctct aatgaatgag attagggggg tttcagggga cagagatggg atttgttgtg 1020 tgataaacca tatgtagttt agtctttctg tggagaggca gtggttgggg cattttaaat 1080 ggctggctac acttgttttc ccctcatggt aatttgtcat aactcagtag cacgacctgc 1140 ccctagaagt agttaaagat ttttaaatgc taaggcgttg ccaaggttct gatgattcag 1200 acctgtacta ctgattatta agcaggacag actgag 1236
<210> 32 <211> 855 <212> PRT <213> Cricetulus griseus <400> 32
Met Gly Ser Asn Arg Gly Arg Lys Ala Gly Gly Ser Ser Lys Asp Phe 15 10 15
Gly Ala Arg Leu Lys Tyr Ser Ser Gly Leu Glu Asn Met Asn Gly Phe 20 25 30
Glu Glu Gly Val Glu Phe Leu Pro Val Asn Asn Ala Lys Lys Val Glu 35 40 45
Lys Arg Gly Pro Arg Arg Cys Val Val Leu Val Val Leu Leu Val Ser 50 55 60
Phe Leu Phe Leu Ser Leu Val Ala Gly Phe Leu Val Trp His Phe Leu 65 70 75 80
Tyr Ser Asn Val Arg Ile Gin Lys Val Phe Asn Gly His Leu Arg Val 85 90 95
Thr Asn Glu Asn Phe Leu Asp Ala Tyr Glu Asn Ser Asn Ser Thr Glu 100 105 110
Phe Lys Asp Leu Ala Asn Gin Val Lys Glu Ala Leu Lys Leu Leu Tyr 115 120 125
Ser Glu Val Pro Val Leu Gly Pro Tyr His Lys Arg Ser Ala Val Thr 130 135 140
Ala Phe Ser Glu Gly Ser Val Ile Ala Tyr Tyr Trp Ser Glu Phe Ser 145 150 155 160
Ile Pro Pro His Leu Ala Glu Glu Val Asp Arg Ala Met Ala Val Glu 165 170 175
Arg Val Val Thr Leu Pro Pro Arg Ala Arg Ala Leu Lys Ser Phe Val 180 185 190
Leu Thr Ser Val Val Ala Phe Pro Thr Asp Pro Arg Leu Leu Gly Arg 195 200 205
Thr Gin Asp Asn Ser Cys Asn Phe Ala Leu His Ala His Gly Gly Glu 210 215 220
Val Met Arg Phe Thr Thr Pro Gly Phe Pro Asn Ser Pro Tyr Pro Ala 225 230 235 240
His Ala Arg Cys Gin Trp Val Leu Arg Gly Asp Ala Asp Ser Val Leu 245 250 255
Ser Leu Thr Phe Arg Ser Phe Asp Val Ala Pro Cys Asp Glu Leu Gly 260 265 270
Asn Asp Leu Val Thr Val Tyr Asp Thr Leu Ser Pro Met Glu Pro His 275 280 285
Ala Val Val Arg Leu Cys Gly Thr Tyr Pro Pro Ser Tyr Asn Leu Thr 290 295 300
Phe Leu Ser Ser Gin Asn Val Phe Leu Val Thr Leu Ile Thr Asn Thr 305 310 315 320
Asp Arg Arg His Pro Gly Phe Glu Ala Thr Phe Phe Gin Leu Pro Lys 325 330 335
Met Arg Ser Cys Gly Gly Ser Leu Ser Glu Ala Gin Gly Leu Phe Ser 340 345 350
Ser Pro Tyr Tyr Pro Gly His Tyr Pro Pro Asn Ile Asp Cys Thr Trp 355 360 365
Asn Ile Lys Val Pro Asn Asn Arg Asn Val Lys Val Arg Phe Lys Leu 370 375 380
Phe Tyr Leu Val Asp Pro Asn Ile Pro Leu Gly Thr Cys Pro Lys Asp 385 390 395 400
Tyr Val Glu Ile Asn Gly Glu Arg Tyr Cys Gly Glu Lys Ser Gin Phe 405 410 415
Val Val Ser Ser Asn Ser Ser Lys Ile Thr Val Arg Phe His Ser Asp 420 425 430
His Ser Tyr Thr Asp Thr Gly Phe Leu Ala Glu Tyr Leu Ser Tyr Asp 435 440 445
Ser Asn Asp Pro Cys Pro Gly Met Phe Met Cys Asn Thr Gly Arg Cys 450 455 460
Ile Arg Lys Asp Leu Arg Cys Asp Gly Trp Ala Asp Cys Pro Asp Tyr 465 470 475 480
Ser Asp Glu His Phe Cys Arg Cys Asn Thr Thr His Gin Phe Met Cys 485 490 495
Lys Asn Lys Leu Cys Lys Pro Leu Phe Trp Val Cys Asp Asn Ile Asn 500 505 510
Asp Cys Gly Asp Gly Ser Asp Glu Glu Gly Cys Ser Cys Pro Ala Glu 515 520 525
Thr Phe Lys Cys Ser Asn Gly Lys Cys Leu Pro Gin Ser Gin Lys Cys 530 535 540
Asp Gly Lys Asp Asn Cys Gly Asp Gly Ser Asp Glu Ala Ser Cys Asp 545 550 555 560
Arg Val Lys Val Val Ser Cys Thr Lys Tyr Thr Tyr Arg Cys His Asn 565 570 575
Gly Leu Cys Leu Ser Lys Gly Asn Pro Glu Cys Asp Gly Lys Lys Asp 580 585 590
Cys Ser Asp Gly Ser Asp Glu Lys Asn Cys Asp Cys Gly Leu Arg Ser 595 600 605
Phe Thr Lys Gin Ala Arg Val Val Gly Gly Thr Asn Ala Asp Glu Gly 610 615 620
Glu Trp Pro Trp Gin Val Ser Leu His Ala Leu Gly Gin Gly His Leu 625 630 635 640
Cys Gly Ala Ser Leu Ile Ser Pro Asn Trp Leu Val Ser Ala Ala His 645 650 655
Cys Phe Met Asp Asp Arg Asn Phe Lys Tyr Ser Asp His Thr Lys Trp 660 665 670
Thr Ala Phe Leu Gly Leu Leu Asp Gin Ser Lys Arg Ser Ser Thr Gly 675 680 685
Val Gin Glu His Lys Leu Lys Arg Ile Ile Thr His Pro Leu Phe Asn 690 695 700
Glu Ile Thr Phe Asp Tyr Asp Ile Ala Leu Leu Glu Leu Glu Lys Pro 705 710 715 720
Ala Glu Tyr Ser Thr Val Val Arg Pro Ile Cys Leu Pro Asp Thr Thr 725 730 735
His Val Phe Pro Ala Gly Lys Ala Ile Trp Val Thr Gly Trp Gly His 740 745 750
Thr Gin Glu Gly Gly Thr Gly Ala Leu Ile Leu Gin Lys Gly Glu Ile 755 760 765
Arg Val Ile Asn Gin Thr Thr Cys Glu Asp Leu Met Pro Gin Gin Ile 770 775 780
Thr Pro Arg Met Met Cys Val Gly Phe Leu Ser Gly Gly Val Asp Ser 785 790 795 800
Cys Gin Gly Asp Ser Gly Gly Pro Leu Ser Ser Val Glu Thr Glu Gly 805 810 815
Arg Ile Phe Gin Ala Gly Val Val Ser Trp Gly Glu Gly Cys Ala Gin 820 825 830
Arg Asn Lys Pro Gly Val Tyr Thr Arg Leu Pro Ala Val Arg Asp Trp 835 840 845
Ile Lys Glu Gin Thr Gly Val 850 855
<210> 33 <211> 855 <212> PRT <213> Homo sapiens <400> 33
Met Gly Ser Asp Arg Ala Arg Lys Gly Gly Gly Gly Pro Lys Asp Phe 15 10 15
Gly Ala Gly Leu Lys Tyr Asn Ser Arg His Glu Lys Val Asn Gly Leu 20 25 30
Glu Glu Gly Val Glu Phe Leu Pro Val Asn Asn Val Lys Lys Val Glu 35 40 45
Lys His Gly Pro Gly Arg Trp Val Val Leu Ala Ala Val Leu Ile Gly 50 55 60
Leu Leu Leu Val Leu Leu Gly Ile Gly Phe Leu Val Trp His Leu Gin 65 70 75 80
Tyr Arg Asp Val Arg Val Gin Lys Val Phe Asn Gly Tyr Met Arg Ile 85 90 95
Thr Asn Glu Asn Phe Val Asp Ala Tyr Glu Asn Ser Asn Ser Thr Glu 100 105 110
Phe Val Ser Leu Ala Ser Lys Val Lys Asp Ala Leu Lys Leu Leu Tyr 115 120 125
Ser Gly Val Pro Phe Leu Gly Pro Tyr His Lys Glu Ser Ala Val Thr 130 135 140
Ala Phe Ser Glu Gly Ser Val Ile Ala Tyr Tyr Trp Ser Glu Phe Ser 145 150 155 160
Ile Pro Gin His Leu Val Glu Glu Ala Glu Arg Val Met Ala Glu Glu 165 170 175
Arg Val Val Met Leu Pro Pro Arg Ala Arg Ser Leu Lys Ser Phe Val 180 185 190
Val Thr Ser Val Val Ala Phe Pro Thr Asp Ser Lys Thr Val Gin Arg 195 200 205
Thr Gin Asp Asn Ser Cys Ser Phe Gly Leu His Ala Arg Gly Val Glu 210 215 220
Leu Met Arg Phe Thr Thr Pro Gly Phe Pro Asp Ser Pro Tyr Pro Ala 225 230 235 240
His Ala Arg Cys Gin Trp Ala Leu Arg Gly Asp Ala Asp Ser Val Leu 245 250 255
Ser Leu Thr Phe Arg Ser Phe Asp Leu Ala Ser Cys Asp Glu Arg Gly 260 265 270
Ser Asp Leu Val Thr Val Tyr Asn Thr Leu Ser Pro Met Glu Pro His 275 280 285
Ala Leu Val Gin Leu Cys Gly Thr Tyr Pro Pro Ser Tyr Asn Leu Thr 290 295 300
Phe His Ser Ser Gin Asn Val Leu Leu Ile Ihr Leu Ile Ihr Asn Thr 305 310 315 320
Glu Arg Arg His Pro Gly Phe Glu Ala Thr Phe Phe Gin Leu Pro Arg 325 330 335
Met Ser Ser Cys Gly Gly Arg Leu Arg Lys Ala Gin Gly Thr Phe Asn 340 345 350
Ser Pro Tyr Tyr Pro Gly His Tyr Pro Pro Asn Ile Asp Cys Thr Trp 355 360 365
Asn Ile Glu Val Pro Asn Asn Gin His Val Lys Val Arg Phe Lys Phe 370 375 380
Phe Tyr Leu Leu Glu Pro Gly Val Pro Ala Gly Thr Cys Pro Lys Asp 385 390 395 400
Tyr Val Glu Ile Asn Gly Glu Lys Tyr Cys Gly Glu Arg Ser Gin Phe 405 410 415
Val Val Thr Ser Asn Ser Asn Lys Ile Thr Val Arg Phe His Ser Asp 420 425 430
Gin Ser Tyr Thr Asp Thr Gly Phe Leu Ala Glu Tyr Leu Ser Tyr Asp 435 440 445
Ser Ser Asp Pro Cys Pro Gly Gin Phe Thr Cys Arg Thr Gly Arg Cys 450 455 460
Ile Arg Lys Glu Leu Arg Cys Asp Gly Trp Ala Asp Cys Thr Asp His 465 470 475 480
Ser Asp Glu Leu Asn Cys Ser Cys Asp Ala Gly His Gin Phe Thr Cys 485 490 495
Lys Asn Lys Phe Cys Lys Pro Leu Phe Trp Val Cys Asp Ser Val Asn 500 505 510
Asp Cys Gly Asp Asn Ser Asp Glu Gin Gly Cys Ser Cys Pro Ala Gin 515 520 525
Thr Phe Arg Cys Ser Asn Gly Lys Cys Leu Ser Lys Ser Gin Gin Cys 530 535 540
Asn Gly Lys Asp Asp Cys Gly Asp Gly Ser Asp Glu Ala Ser Cys Pro 545 550 555 560
Lys Val Asn Val Val Thr Cys Thr Lys His Thr Tyr Arg Cys Leu Asn 565 570 575
Gly Leu Cys Leu Ser Lys Gly Asn Pro Glu Cys Asp Gly Lys Glu Asp 580 585 590
Cys Ser Asp Gly Ser Asp Glu Lys Asp Cys Asp Cys Gly Leu Arg Ser 595 600 605
Phe Thr Arg Gin Ala Arg Val Val Gly Gly Thr Asp Ala Asp Glu Gly 610 615 620
Glu Trp Pro Trp Gin Val Ser Leu His Ala Leu Gly Gin Gly His Ile 625 630 635 640
Cys Gly Ala Ser Leu Ile Ser Pro Asn Trp Leu Val Ser Ala Ala His 645 650 655
Cys Tyr Ile Asp Asp Arg Gly Phe Arg Tyr Ser Asp Pro Thr Gin Trp 660 665 670
Thr Ala Phe Leu Gly Leu His Asp Gin Ser Gin Arg Ser Ala Pro Gly 675 680 685
Val Gin Glu Arg Arg Leu Lys Arg Ile Ile Ser His Pro Phe Phe Asn 690 695 700
Asp Phe Thr Phe Asp Tyr Asp Ile Ala Leu Leu Glu Leu Glu Lys Pro 705 710 715 720
Ala Glu Tyr Ser Ser Met Val Arg Pro Ile Cys Leu Pro Asp Ala Ser 725 730 735
His Val Phe Pro Ala Gly Lys Ala Ile Trp Val Thr Gly Trp Gly His 740 745 750
Thr Gin Tyr Gly Gly Thr Gly Ala Leu Ile Leu Gin Lys Gly Glu Ile 755 760 765
Arg Val Ile Asn Gin Thr Thr Cys Glu Asn Leu Leu Pro Gin Gin Ile 770 775 780
Thr Pro Arg Met Met Cys Val Gly Phe Leu Ser Gly Gly Val Asp Ser 785 790 795 800
Cys Gin Gly Asp Ser Gly Gly Pro Leu Ser Ser Val Glu Ala Asp Gly 805 810 815
Arg Ile Phe Gin Ala Gly Val Val Ser Trp Gly Asp Gly Cys Ala Gin 820 825 830
Arg Asn Lys Pro Gly Val Tyr Thr Arg Leu Pro Leu Phe Arg Asp Trp 835 840 845
Ile Lys Glu Asn Thr Gly Val 850 855
<210> 34 <211> 855 <212> PRT <213> Mus musculus <400> 34
Met Gly Ser Asn Arg Gly Arg Lys Ala Gly Gly Gly Ser Gin Asp Phe 15 10 15
Gly Ala Gly Leu Lys Tyr Asn Ser Arg Leu Glu Asn Met Asn Gly Phe 20 25 30
Glu Glu Gly Val Glu Phe Leu Pro Ala Asn Asn Ala Lys Lys Val Glu 35 40 45
Lys Arg Gly Pro Arg Arg Trp Val Val Leu Val Ala Val Leu Phe Ser 50 55 60
Phe Leu Leu Leu Ser Leu Met Ala Gly Leu Leu Val Trp His Phe His 65 70 75 80
Tyr Arg Asn Val Arg Val Gin Lys Val Phe Asn Gly His Leu Arg Ile 85 90 95
Thr Asn Glu Ile Phe Leu Asp Ala Tyr Glu Asn Ser Thr Ser Thr Glu 100 105 110
Phe Ile Ser Leu Ala Ser Gin Val Lys Glu Ala Leu Lys Leu Leu Tyr 115 120 125
Asn Glu Val Pro Val Leu Gly Pro Tyr His Lys Lys Ser Ala Val Thr 130 135 140
Ala Phe Ser Glu Gly Ser Val Ile Ala Tyr Tyr Trp Ser Glu Phe Ser 145 150 155 160
Ile Pro Pro His Leu Ala Glu Glu Val Asp Arg Ala Met Ala Val Glu 165 170 175
Arg Val Val Thr Leu Pro Pro Arg Ala Arg Ala Leu Lys Ser Phe Val 180 185 190
Leu Thr Ser Val Val Ala Phe Pro Ile Asp Pro Arg Met Leu Gin Arg 195 200 205
Thr Gin Asp Asn Ser Cys Ser Phe Ala Leu His Ala His Gly Ala Ala 210 215 220
Val Thr Arg Phe Thr Thr Pro Gly Phe Pro Asn Ser Pro Tyr Pro Ala 225 230 235 240
His Ala Arg Cys Gin Trp Val Leu Arg Gly Asp Ala Asp Ser Val Leu 245 250 255
Ser Leu Thr Phe Arg Ser Phe Asp Val Ala Pro Cys Asp Glu His Gly 260 265 270
Ser Asp Leu Val Thr Val Tyr Asp Ser Leu Ser Pro Met Glu Pro His 275 280 285
Ala Val Val Arg Leu Cys Gly Thr Phe Ser Pro Ser Tyr Asn Leu Thr 290 295 300
Phe Leu Ser Ser Gin Asn Val Phe Leu Val Thr Leu Ile Thr Asn Thr 305 310 315 320
Asp Arg Arg His Pro Gly Phe Glu Ala Thr Phe Phe Gin Leu Pro Lys 325 330 335
Met Ser Ser Cys Gly Gly Phe Leu Ser Asp Thr Gin Gly Thr Phe Ser 340 345 350
Ser Pro Tyr Tyr Pro Gly His Tyr Pro Pro Asn Ile Asn Cys Thr Trp 355 360 365
Asn Ile Lys Val Pro Asn Asn Arg Asn Val Lys Val Arg Phe Lys Leu 370 375 380
Phe Tyr Leu Val Asp Pro Asn Val Pro Val Gly Ser Cys Thr Lys Asp 385 390 395 400
Tyr Val Glu Ile Asn Gly Glu Lys Tyr Cys Gly Glu Arg Ser Gin Phe 405 410 415
Val Val Ser Ser Asn Ser Ser Lys Ile Thr Val His Phe His Ser Asp 420 425 430
His Ser Tyr Thr Asp Thr Gly Phe Leu Ala Glu Tyr Leu Ser Tyr Asp 435 440 445
Ser Asn Asp Pro Cys Pro Gly Met Phe Met Cys Lys Thr Gly Arg Cys 450 455 460
Ile Arg Lys Glu Leu Arg Cys Asp Gly Trp Ala Asp Cys Pro Asp Tyr 465 470 475 480
Ser Asp Glu Arg Tyr Cys Arg Cys Asn Ala Thr His Gin Phe Thr Cys 485 490 495
Lys Asn Gin Phe Cys Lys Pro Leu Phe Trp Val Cys Asp Ser Val Asn 500 505 510
Asp Cys Gly Asp Gly Ser Asp Glu Glu Gly Cys Ser Cys Pro Ala Gly 515 520 525
Ser Phe Lys Cys Ser Asn Gly Lys Cys Leu Pro Gin Ser Gin Lys Cys 530 535 540
Asn Gly Lys Asp Asn Cys Gly Asp Gly Ser Asp Glu Ala Ser Cys Asp 545 550 555 560
Ser Val Asn Val Val Ser Cys Thr Lys Tyr Thr Tyr Arg Cys Gin Asn 565 570 575
Gly Leu Cys Leu Ser Lys Gly Asn Pro Glu Cys Asp Gly Lys Thr Asp 580 585 590
Cys Ser Asp Gly Ser Asp Glu Lys Asn Cys Asp Cys Gly Leu Arg Ser 595 600 605
Phe Thr Lys Gin Ala Arg Val Val Gly Gly Thr Asn Ala Asp Glu Gly 610 615 620
Glu Trp Pro Trp Gin Val Ser Leu His Ala Leu Gly Gin Gly Hrs Leu 625 630 635 640
Cys Gly Ala Ser Leu Ile Ser Pro Asp Trp Leu Val Ser Ala Ala His 645 650 655
Cys Phe Gin Asp Asp Lys Asn Phe Lys Tyr Ser Asp Tyr Thr Met Trp 660 665 670
Thr Ala Phe Leu Gly Leu Leu Asp Gin Ser Lys Arg Ser Ala Ser Gly 675 680 685
Val Gin Glu Leu Lys Leu Lys Arg Ile Ile Thr Hrs Pro Ser Phe Asn 690 695 700
Asp Phe Thr Phe Asp Tyr Asp Ile Ala Leu Leu Glu Leu Glu Lys Ser 705 710 715 720
Val Glu Tyr Ser Thr Val Val Arg Pro Ile Cys Leu Pro Asp Ala Thr 725 730 735
His Val Phe Pro Ala Gly Lys Ala Ile Trp Val Thr Gly Trp Gly His 740 745 750
Thr Lys Glu Gly Gly Thr Gly Ala Leu Ile Leu Gin Lys Gly Glu Ile 755 760 765
Arg Val Ile Asn Gin Thr Thr Cys Glu Asp Leu Met Pro Gin Gin Ile 770 775 780
Thr Pro Arg Met Met Cys Val Gly Phe Leu Ser Gly Gly Val Asp Ser 785 790 795 800
Cys Gin Gly Asp Ser Gly Gly Pro Leu Ser Ser Ala Glu Lys Asp Gly 805 810 815
Arg Met Phe Gin Ala Gly Val Val Ser Trp Gly Glu Gly Cys Ala Gin 820 825 830
Arg Asn Lys Pro Gly Val Tyr Thr Arg Leu Pro Val Val Arg Asp Trp 835 840 845
Ile Lys Glu His Thr Gly Val 850 855
<210> 35 <211> 1521 <212> PRT <213> Mus musculus <400> 35
Met Asn Trp Asn Thr Lys Gin Glu Asn Val Pro Lys Pro Pro Pro Tyr 15 10 15
Ser Lys Thr Gin Ser Ser Ile Leu Gin His Phe Leu Met Thr Ser Thr 20 25 30
Thr Ser Gin Ser Ser Phe Asn Tyr Ser Pro His Asn Gin Glu Ala Ser 35 40 45
Gin Thr Ser Phe Asn Tyr Ser Leu His Asn Gin Glu Ala Cys Met Tyr 50 55 60
Ser Gly Asn Ser Asn Ser Val Ser Gin Pro Leu Leu Ser Gly Arg Asn 65 70 75 80
Tyr Ile Thr Pro Gin Thr Gin Ile Ser Val Ser Asn Met Pro Thr Arg 85 90 95
Thr Ile Val Ala Ser Gin Ser Ser Met Glu Arg Val Val Ser Thr Asn 100 105 110
Gly Lys Gly Pro Gin Gin Pro Asn His Asn Leu Gin Thr Val Ser Ser 115 120 125
Gly Ile Met Gin Asn Val Trp Leu Pro Ser His Thr Glu Ala Thr Ile 130 135 140
Ser His Asn Pro Asp Gly Gly Thr Asn Met Pro Tyr Met His Pro Pro 145 150 155 160
Gin Asn Gin Leu Val Thr Ser Asp Thr Tyr Ser Met Gin Leu Gin Met 165 170 175
Ala Pro Leu His Ser Gly Lys Val Pro Met Thr His Gin Gly Ser Gin 180 185 190
Gly Leu Asn His Phe Ile Pro Asp Gin Leu Val Asp Trp Thr Gin Tyr 195 200 205
Thr Ser Asn Glu Leu Ser Tyr Pro Glu Tyr Arg Pro Pro Pro Lys Gin 210 215 220
Tyr Ser Tyr Ile Leu Pro Ala Thr Thr Ser Leu Gin Val Lys Asn Asn 225 230 235 240
Gin Leu Pro Thr Tyr Thr Gin Ser Leu Gin Ser Lys His Ser Val Pro 245 250 255
Leu Ser Ser His Gin Tyr Ala Ala Glu Ala Ser Lys Arg Leu Ser Ala 260 265 270
Leu Pro Tyr Ser Cys Arg Tyr Glu Asn Gin His Val Gin Asn Ala Gin 275 280 285
Pro Val Ser Lys His Leu Pro Met Glu Val Pro Gin Ser Ser Glu Val 290 295 300
His Ser Ser Glu Lys Lys Lys Asp Thr Tyr Arg Gly Phe Lys Gin Gin 305 310 315 320
Trp Gin Asn Pro Asn Glu Lys Val Ser Ile Gly Gin Phe Ser Glu Val 325 330 335
Lys Ile Asn Ile Lys Gin Pro Tyr Ser Glu Ser Val Arg Pro Ser Gly 340 345 350
Asp Gly Val Gin Ala Leu Val Gin Asn Asn Gin Glu Lys Arg Lys Tyr 355 360 365
Thr Tyr Asn Pro Asn Thr Asn Gin Val Ile Asp Thr Asn Ala Thr Lys 370 375 380
Glu Lys Leu Val Arg Asp Ile Lys Ser Leu Val Glu Ile Lys Lys Lys 385 390 395 400
Phe Ser Glu Leu Ala Arg Lys Ile Lys Ile Asn Lys Ser Leu Leu Met 405 410 415
Ala Ala Gly Cys Ser Lys Thr Ala Asn Thr Ser Tyr Thr Glu Pro Ile 420 425 430
Gin His Ser Glu Phe Ser Ala Lys Glu Met Ser Ala Lys Asn Gly Asn 435 440 445
Asp Cys Ser Met Glu Leu Leu Ala Thr Cys Leu Ser Leu Trp Lys Asn 450 455 460
Gin Pro Ser Lys Thr Thr Glu Glu Asn Val Pro Lys Pro Leu Glu Glu 465 470 475 480
Lys Gin Cys Asn Thr Ser Arg Ile Ser Thr Thr Val Val Gly Ser Ala 485 490 495
Asn Pro Thr Asn Glu Val His Val Lys Ser Leu Cys Ser Gly Val Gly 500 505 510
Asn Ser Gin Lys Met Met Ser Ser Ser Gin Thr Val Leu Pro Val Leu 515 520 525
Ile Pro Ser Cys Glu Ser Ser Gly Val Ala Val Gly Lys Gly Thr Glu 530 535 540
Leu Gin Ile Ala Val Val Ser Pro Leu Val Leu Ser Asp Thr Asn Thr 545 550 555 560
Leu Pro Gly Lys Asp Ser Val Pro Glu Val Leu Pro Glu Thr Leu Tyr 565 570 575
Pro Val Val Lys Glu Gly Ser Val Cys Ser Leu Gin Thr Gin Pro Thr 580 585 590
Glu Thr Val Ala Leu Pro Phe Asp Val Ile Gly Ala Val Ala Ser Asn 595 600 605
Asn Ile Ser Ala Glu Ile Pro Leu Pro Val Asp Lys Glu Lys Gin His 610 615 620
Lys Pro Ile Gin Gly Asp Pro Asp Ile Ala Asp Ser Ser Leu Gly Lys 625 630 635 640
His Ser Pro Leu Gly Thr Glu Val Leu Pro Lys Pro Met Asp Ser Thr 645 650 655
Ile Val Ser Gly Pro Met Leu Gin Ile Glu Ser Ile Cys Ser Leu Ala 660 665 670
Glu Gly Asp Val Ser Tyr Asn Ser Gin Ile Ala Glu Ile Phe Asn Ser 675 680 685
Val Gin Thr Glu Pro Gin Lys Pro Ser Pro Asn Gin Val Ile Asp Ser 690 695 700
Gin Gin Glu Gin Val Tyr Asp Thr Thr Glu Asn Lys Asp Phe Ser Leu 705 710 715 720
Gin Lys Asp Lys Cys Val Gin Cys Thr Asp Val Pro His Glu Val Pro 725 730 735
Glu Gin Pro Glu Pro Leu Gin Pro Glu Glu Pro Ala Ser Ser Glu Tyr 740 745 750
Val Glu Ala Asn Arg Glu Ala Thr Glu Glu Ser Cys Arg Glu Tyr Thr 755 760 765
Gly Arg Lys Glu Ser Thr Ala Lys Asp Val Cys Leu Pro Ala Ala Ile 770 775 780
Gin Gin Asp Pro His Pro Arg Glu Thr Asp Met Phe Ser Lys Ser Asp 785 790 795 800
His Ser Leu Pro Ala Ile Asn Glu Ile Asn Asp Glu Ser Glu Pro Ile 805 810 815
Ser Tyr Leu His Asp Gin Leu Ser Glu Leu Leu Lys Glu Phe Pro Tyr 820 825 830
Gly Ile Glu Thr Phe Asn Arg His Glu Val Ser Leu Asp Gin Gin Lys 835 840 845
Thr His Lys Ile Val Glu Asn Gin Thr Gly Gly Lys Thr Ser Asn Val 850 855 860
Ser Gly Asp Ser Thr Asp Gin Ile Lys Ile Thr Val Leu Asn Ser Glu 865 870 875 880
Gin Ile Lys Glu Leu Phe Pro Glu Asp Asp Gin Pro Cys Asp Lys Leu 885 890 895
Ala Glu Pro Glu Asn Lys Glu Ile Val Ala Glu Val Lys Ser Pro Cys 900 905 910
Asp Ser Gin Ile Pro Arg Glu Glu Ser His Asp Leu Gly Met Leu Asp 915 920 925
Pro Glu Lys Asp Lys Ile His Cys Cys Ala Leu Gly Trp Leu Ser Met 930 935 940
Val Tyr Glu Gly Val Pro Gin Cys His Cys Ser Ser Thr Glu Lys Lys 945 950 955 960
Glu Lys Asp Gin Cys Leu Asp Ile Asn Ser Ser Lys Gin Gly Glu Gin 965 970 975
Pro Cys Asn Ser Gly Ile Thr Ile Phe Glu Ile Asn Pro Val Ser Asn 980 985 990
Asn Ser Lys Thr Pro Leu Thr Gin Ala Thr Glu Glu Gly His Phe Ser 995 1000 1005
Ala Val His Gly Glu Lys Thr Lys Ala Ser Lys Thr Lys Asp Asn 1010 1015 1020
Arg Glu Gly Gin Glu Leu Ala Cys His Phe Ser Ala Lys Cys Tyr 1025 1030 1035
Lys Lys Asp Lys Lys Gly Asn Phe Lys Ile Arg His Asp Thr Ser 1040 1045 1050
Leu Lys Met Glu Gin Lys Leu Lys Asn Ile Ser Ser Lys Cys Asp 1055 1060 1065
Ile Pro Asn Pro Ser Lys Cys Asn Lys Ile Ala Ala Pro Glu Ile 1070 1075 1080
Leu His Val Thr Thr Ser Asn Ser Ala Lys Asn Met Pro Phe Ser 1085 1090 1095
Lys Gin Ala Ser Gin Glu Ser Leu Gin Lys Lys His Thr Ser Gin 1100 1105 1110
Asp Leu Gly Pro Val Lys Ala Pro Ile Glu Leu Ser Ser Asn Thr 1115 1120 1125
Asp Pro Cys Arg Ser Asn Thr Ser Ser Val Gin Ser Val Ser Pro 1130 1135 1140
Glu Lys Lys Lys Leu Lys Phe Lys Ala Gly Gly Ser Arg Leu Lys 1145 1150 1155
Tyr Phe Glu Lys Arg Lys Thr Asp His Val Ile Ile Pro Asp Val 1160 1165 1170
Glu Ile Lys Lys Lys Lys Tyr Glu Lys Gin Glu Gin Asn Lys Asn 1175 1180 1185
Ala Gly Asp Thr Leu Lys Leu Cys Ser Ile Leu Thr Glu Ser Asn 1190 1195 1200
Glu Arg Ala Ser Val Gin Glu Lys Thr Val Pro Ser Pro Glu Ser 1205 1210 1215
Ser Asp Pro Lys Gly Ser Ser Ser Lys Ser Thr Arg Val Ile Thr 1220 1225 1230
Val Gin Glu Tyr Leu Gin Arg Gin Lys Asp Lys Gin Ile Thr Gly 1235 1240 1245
Asn Asn Ala Ser Arg Asn Ile Cys Val Glu Thr Val Leu Cys Asp 1250 1255 1260
Ser Gly His Thr Lys Thr Ser Lys His Ser Ala Ala Val Ser Trp 1265 1270 1275
Gly Lys Leu Val Glu Gly Gin Ser Ile Ser Ala Glu Thr Ala Lys 1280 1285 1290
Glu Leu Glu His Asn Ser Ser Ser His Gly Lys Asp Phe Lys Ile 1295 1300 1305
His His Ser Glu Ala Ser Arg Thr His Ser Val Ser Asn Asn Asn 1310 1315 1320
Lys Gly Lys Phe Asp Gly Lys Gin Pro Asp Lys Met Phe Lys Asn 1325 1330 1335
Lys Thr Ser Met Asn Asn Glu Ser Asn Gin Met Pro Leu Gin Val 1340 1345 1350
Lys Glu Gin Arg Lys Gin Tyr Leu Asn Arg Val Ala Phe Lys Cys 1355 1360 1365
Thr Glu Arg Glu Ser Ile Cys Leu Thr Lys Leu Asp Ser Ala Ser 1370 1375 1380
Lys Lys Leu Ser Ile Glu Lys Lys Ser Gly Glu Tyr Thr Ser Lys 1385 1390 1395
Thr Lys Asp Thr Asp Lys Pro Ser Met Leu Glu Phe Lys Leu Cys 1400 1405 1410
Pro Asp Val Leu Leu Lys Asn Thr Ser Thr Val Asp Lys Gin Asp 1415 1420 1425
Cys Pro Gly Pro Gly Pro Glu Lys Glu Gin Ala Pro Val Gin Val 1430 1435 1440
Ser Gly Ile Lys Ser Thr Lys Glu Asp Trp Leu Lys Cys Ile Pro 1445 1450 1455
Thr Arg Thr Lys Met Pro Glu Ser Ser Gin Arg Asp Ser Ala Asp 1460 1465 1470
Ser Arg Leu Ser Lys Arg Ser Leu Ser Ala Asp Glu Phe Glu Ile 1475 1480 1485
Leu Gin Asn Pro Val Lys Glu Ser Asn Ile Met Phe Arg Thr Tyr 1490 1495 1500
Lys Lys Met Tyr Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser Ser 1505 1510 1515
Pro Val Lys 1520
<210> 36 <211> 6 <212> PRT <213> Séquence artificielle <22 0> <221> source <223> /note=”Description de séquence artificielle : Synthétique Marqueur 6xHis” <400> 36
His His His His His His 1 5
<210> 37 <211> 8 <212> PRT <213> Séquence artificielle <220> <221> source <223> /note=”Description de séquence artificielle : Synthétique peptide" <400> 37
Asp Tyr Lys Asp Asp Asp Asp Lys 1 5
<210> 38 <211> 9 <212> PRT <213> Séquence artificielle <22 0> <221> source <223> /note="Description de séquence artificielle : Synthétique peptide" <400> 38
Ala Trp Arg His Pro Gin Phe Gly Gly 1 5
<210> 39 <211> 8 <212> PRT <213> Séquence artificielle <220> <221> source <223> /note=”Description de séquence artificielle : Synthétique peptide" <400> 39
Trp Ser His Pro Gin Phe Glu Lys 1 5
Claims (9)
- REVENDICATIONS1. Cellule CHO recombinante, comprenant : une ou plusieurs séquences polynucléotidiques codant pour le complexe pentamère du cytomégalovirus (CMV), où ledit complexe pentamère comprend : la gH ou l'un de ses fragments formant un complexe, la gL ou l'un de ses fragments formant un complexe, la pUL128 ou l'un de ses fragments formant un complexe, la pUL130 ou l'un de ses fragments formant un complexe, et la pUL131 ou l'un de ses fragments formant un complexe ; où lesdites une ou plusieurs séquences polynucléotidiques sont intégrées dans l'ADN génomique de ladite cellule CHO et où l'expression ou l'activité de la protéine FAM60A est réduite dans ladite cellule, comparativement à un témoin.
- 2. Cellule CHO selon la revendication 1, où ladite cellule CHO est une cellule CH0-K1, CHO-DUXB11, CHO-DG44, ou CHO-S.
- 3. Cellule CHO selon la revendication 1 ou 2, où au moins une copie de la séquence génomique du gène FAM60A, ou au moins 50 % de la séquence codante dudit gène FAM60A, est délétée.
- 4. Cellule CHO selon l'une quelconque des revendications 1 à 3, où ledit fragment formant un complexe de la gH comprend 1'ectodomaine d'une protéine gH pleine longueur.
- 5. Cellule CHO selon l'une quelconque des revendications 1 à 4, où ledit complexe pentamère est soluble.
- 6. Cellule CHO selon l'une quelconque des revendications 1 à 5, où ledit complexe pentamère est sécrété à partir de la cellule hôte.
- 7. Culture à grande échelle comprenant la cellule CHO selon l'une quelconque des revendications 1 à 6, où ladite culture a une taille d'au moins 20 litres.
- 8. Culture à grande échelle selon la revendication T, où le rendement du complexe pentamère du CMV est d'au moins 0,05 g/1.
- 9. Composition comprenant le complexe pentamère du cytomégalovirus (CMV), où ledit complexe pentamère comprend : la gH ou l'un de ses fragments formant un complexe, la gL ou l'un de ses fragments formant un complexe, la pUL128 ou l'un de ses fragments formant un complexe, la pUL130 ou l'un de ses fragments formant un complexe, et la pUL131 ou l'un de ses fragments formant un complexe, et où ledit complexe pentamère est produit par la cellule CHO selon l'une quelconque des revendications 1 à 6, ou la culture à grande échelle selon la revendication 7 ou 8.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14191385.5A EP3015475A1 (fr) | 2014-10-31 | 2014-10-31 | Cellules de mammifère exprimant des antigènes du cytomégalovirus |
EP14191385.5 | 2014-10-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
BE1023841A1 true BE1023841A1 (fr) | 2017-08-09 |
BE1023841B1 BE1023841B1 (fr) | 2017-08-10 |
Family
ID=51844603
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BE2015/5701A BE1023364B1 (fr) | 2014-10-31 | 2015-10-29 | Cellules de mammiferes exprimant des antigenes du cytomegalovirus |
BE2016/5877A BE1023841B1 (fr) | 2014-10-31 | 2016-11-24 | Cellules de mammiferes exprimant des antigenes du cytomegalovirus |
BE2016/5876A BE1023840B1 (fr) | 2014-10-31 | 2016-11-24 | Cellules de mammiferes exprimant des antigenes du cytomegalovirus |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BE2015/5701A BE1023364B1 (fr) | 2014-10-31 | 2015-10-29 | Cellules de mammiferes exprimant des antigenes du cytomegalovirus |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BE2016/5876A BE1023840B1 (fr) | 2014-10-31 | 2016-11-24 | Cellules de mammiferes exprimant des antigenes du cytomegalovirus |
Country Status (19)
Country | Link |
---|---|
US (1) | US10414802B2 (fr) |
EP (2) | EP3015475A1 (fr) |
JP (1) | JP6688297B2 (fr) |
CN (1) | CN107075486B (fr) |
AR (1) | AR102464A1 (fr) |
BE (3) | BE1023364B1 (fr) |
BR (1) | BR112017008827A2 (fr) |
CA (1) | CA2964859C (fr) |
CY (1) | CY1123405T1 (fr) |
DK (1) | DK3212660T3 (fr) |
ES (1) | ES2799735T3 (fr) |
HR (1) | HRP20200932T1 (fr) |
HU (1) | HUE049356T2 (fr) |
LT (1) | LT3212660T (fr) |
MX (1) | MX2017005661A (fr) |
PL (1) | PL3212660T3 (fr) |
PT (1) | PT3212660T (fr) |
SI (1) | SI3212660T1 (fr) |
WO (1) | WO2016067239A1 (fr) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX355469B (es) | 2012-07-06 | 2018-04-19 | Novartis Ag | Complejos de proteinas de citomegalovirus. |
EP3052106A4 (fr) | 2013-09-30 | 2017-07-19 | ModernaTX, Inc. | Polynucléotides codant des polypeptides de modulation immunitaire |
KR102307278B1 (ko) * | 2014-04-29 | 2021-09-30 | 노파르티스 아게 | 신규 척추동물 세포 및 관심 폴리펩티드의 재조합적 발현 방법 |
EP3048114A1 (fr) | 2015-01-22 | 2016-07-27 | Novartis AG | Antigènes du cytomégalovirus et leurs utilisations |
WO2017070613A1 (fr) | 2015-10-22 | 2017-04-27 | Modernatx, Inc. | Vaccin contre le cytomégalovirus humain |
WO2018075980A1 (fr) | 2016-10-21 | 2018-04-26 | Modernatx, Inc. | Vaccin contre le cytomégalovirus humain |
CN107723276B (zh) * | 2017-11-02 | 2021-08-13 | 上海交通大学 | 一种稳定高表达目标产物的细胞株的构建方法和试剂盒 |
EP3787676A2 (fr) | 2018-05-04 | 2021-03-10 | Spybiotech Limited | Composition de vaccin |
EP3895730A4 (fr) * | 2018-12-10 | 2022-10-19 | KM Biologics Co., Ltd. | Vaccin pour la prévention ou le traitement d'une infection congénitale par le cytomégalovirus |
US11406703B2 (en) | 2020-08-25 | 2022-08-09 | Modernatx, Inc. | Human cytomegalovirus vaccine |
US20240024455A1 (en) * | 2020-12-02 | 2024-01-25 | Seqirus Inc. | Multicistronic rna vaccines and uses thereof |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4816567A (en) | 1983-04-08 | 1989-03-28 | Genentech, Inc. | Recombinant immunoglobin preparations |
US5168062A (en) | 1985-01-30 | 1992-12-01 | University Of Iowa Research Foundation | Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence |
GB8717430D0 (en) | 1987-07-23 | 1987-08-26 | Celltech Ltd | Recombinant dna product |
SG88714A1 (en) | 1989-11-06 | 2002-05-21 | Cell Genesys Inc | Production of proteins using homologous recombination |
US5589392A (en) | 1991-01-14 | 1996-12-31 | Stratagene | Nucleic acid construct encoding a nuclear transport peptide operatively linked to an inducible promoter |
EP3031469B1 (fr) | 2006-06-07 | 2023-08-23 | The Trustees Of Princeton University | Complexe de protéine de surface du cytomégalovirus destiné à être utilisé dans des vaccins et en tant que cible de médicament |
EP4098324A1 (fr) * | 2010-10-11 | 2022-12-07 | GlaxoSmithKline Biologicals S.A. | Plateformes de délivrance d'antigènes |
MX355469B (es) | 2012-07-06 | 2018-04-19 | Novartis Ag | Complejos de proteinas de citomegalovirus. |
EP2935319B1 (fr) | 2012-12-18 | 2019-04-24 | Novartis AG | Production de protéines thérapeutiques dans des cellules de mammifère génétiquement modifiées |
DK3083676T3 (da) | 2013-12-20 | 2019-11-25 | Novartis Ag | Hidtil ukendte eukaryote celler og fremgangsmåder til rekombinant ekspression af et produkt af interesse |
WO2015092737A1 (fr) | 2013-12-20 | 2015-06-25 | Novartis Ag | Nouvelles cellules eucaryotes et procédés d'expression de manière recombinante d'un produit d'intérêt |
WO2015165480A1 (fr) * | 2014-04-30 | 2015-11-05 | Institute For Research In Biomedicine | Compositions de vaccin de cytomégalovirus humain et leur procédé de production |
KR102307278B1 (ko) | 2014-04-29 | 2021-09-30 | 노파르티스 아게 | 신규 척추동물 세포 및 관심 폴리펩티드의 재조합적 발현 방법 |
-
2014
- 2014-10-31 EP EP14191385.5A patent/EP3015475A1/fr not_active Withdrawn
-
2015
- 2015-10-29 BE BE2015/5701A patent/BE1023364B1/fr not_active IP Right Cessation
- 2015-10-29 ES ES15791768T patent/ES2799735T3/es active Active
- 2015-10-29 CA CA2964859A patent/CA2964859C/fr active Active
- 2015-10-29 HU HUE15791768A patent/HUE049356T2/hu unknown
- 2015-10-29 PT PT157917683T patent/PT3212660T/pt unknown
- 2015-10-29 DK DK15791768.3T patent/DK3212660T3/da active
- 2015-10-29 MX MX2017005661A patent/MX2017005661A/es unknown
- 2015-10-29 EP EP15791768.3A patent/EP3212660B1/fr active Active
- 2015-10-29 CN CN201580059495.8A patent/CN107075486B/zh active Active
- 2015-10-29 US US15/522,455 patent/US10414802B2/en active Active
- 2015-10-29 BR BR112017008827-4A patent/BR112017008827A2/pt not_active Application Discontinuation
- 2015-10-29 WO PCT/IB2015/058349 patent/WO2016067239A1/fr active Application Filing
- 2015-10-29 LT LTEP15791768.3T patent/LT3212660T/lt unknown
- 2015-10-29 AR ARP150103502A patent/AR102464A1/es unknown
- 2015-10-29 SI SI201531242T patent/SI3212660T1/sl unknown
- 2015-10-29 JP JP2017523410A patent/JP6688297B2/ja active Active
- 2015-10-29 PL PL15791768T patent/PL3212660T3/pl unknown
-
2016
- 2016-11-24 BE BE2016/5877A patent/BE1023841B1/fr not_active IP Right Cessation
- 2016-11-24 BE BE2016/5876A patent/BE1023840B1/fr not_active IP Right Cessation
-
2020
- 2020-06-10 HR HRP20200932TT patent/HRP20200932T1/hr unknown
- 2020-06-16 CY CY20201100546T patent/CY1123405T1/el unknown
Also Published As
Publication number | Publication date |
---|---|
BE1023840B1 (fr) | 2017-08-10 |
AR102464A1 (es) | 2017-03-01 |
BR112017008827A2 (pt) | 2018-03-27 |
EP3212660B1 (fr) | 2020-03-25 |
LT3212660T (lt) | 2020-07-10 |
MX2017005661A (es) | 2017-06-26 |
BE1023364A1 (fr) | 2017-02-20 |
SI3212660T1 (sl) | 2020-07-31 |
CN107075486B (zh) | 2021-06-22 |
BE1023840A1 (fr) | 2017-08-09 |
DK3212660T3 (da) | 2020-06-15 |
PL3212660T3 (pl) | 2020-10-05 |
US10414802B2 (en) | 2019-09-17 |
BE1023364B1 (fr) | 2017-02-20 |
HUE049356T2 (hu) | 2020-09-28 |
EP3212660A1 (fr) | 2017-09-06 |
CN107075486A (zh) | 2017-08-18 |
PT3212660T (pt) | 2020-06-23 |
CY1123405T1 (el) | 2021-12-31 |
JP6688297B2 (ja) | 2020-04-28 |
WO2016067239A1 (fr) | 2016-05-06 |
HRP20200932T1 (hr) | 2020-09-18 |
EP3015475A1 (fr) | 2016-05-04 |
BE1023841B1 (fr) | 2017-08-10 |
ES2799735T3 (es) | 2020-12-21 |
CA2964859C (fr) | 2023-04-04 |
JP2017534283A (ja) | 2017-11-24 |
US20170362278A1 (en) | 2017-12-21 |
CA2964859A1 (fr) | 2016-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BE1023841B1 (fr) | Cellules de mammiferes exprimant des antigenes du cytomegalovirus | |
RU2710726C2 (ru) | Новые клетки позвоночных и способы рекомбинантной экспрессии интересующего полипептида | |
WO2002052007A1 (fr) | Proteine de cellule de membrane synoviale | |
CN109068621B (zh) | 具有人源化的tmprss基因的啮齿类动物 | |
EP3999102A1 (fr) | Utilisation de la frataxine pour le traitement de la forme franco-canadienne du syndrome de leigh | |
US11992524B2 (en) | Compositions and methods for therapeutic or vaccine delivery | |
US20210108188A1 (en) | Non-covalent systems and methods for dna editing | |
FR2841559A1 (fr) | Recepteurs par modifies, preparation et utilisations | |
KR101423696B1 (ko) | 대장균에서 인간 유전자를 대량발현 시킬 수 있는 t7 프로모터 및 n-말단 ha 태그서열을 포함하는 포유동물 세포 발현 벡터의 이용 | |
EP1658309B1 (fr) | Peptide inhibiteur de la traduction des proteines et ses utilisations pour le controle de la traduction des proteines | |
KR101423697B1 (ko) | 인간 유전자의 세포 내 발현과 독성을 대장균에서 간단하고 빠르게 진단하기 위한 시스템 | |
Stephan | Analysis of the functional interaction of neurotrypsin and agrin in the murine central nervous system | |
JPWO2004048562A1 (ja) | ヒト由来β1,3−N−アセチルグルコサミニルトランスフェラーゼ2の製造方法 | |
BR112016024534B1 (pt) | Métodos para produzir de forma recombinante um polipeptídeo de interesse, para produzir uma célula de vertebrado isolada, e para selecionar uma célula, bem como uso de uma célula de vertebrado |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Effective date: 20170810 |
|
MM | Lapsed because of non-payment of the annual fee |
Effective date: 20181031 |