Nothing Special   »   [go: up one dir, main page]

Protéomique 2024 (

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 123

Cours Protéomique

Pr. Riadh BEN SALAH


LBT3/ 2023-2024
Plan du cours 14 heures

I. Protéomique : Historique et définition

II. Etapes de l’analyse protéomique

III. Spectrométrie de masse : théorie et applications en


protéomique

IV. Approches de la protéomique quantitative

V. Bioinformatique et Protéomique : les bases de données en


Protéomique

VI. Exemples d'applications de la protéomique


Plan du cours

1. Introduction à la protéomique

1. Historique

2. Définition
L’analyse protéomique constitue une science jeune qui permette
1'étude des protéines que ce soit constituantes, enzymes du
métabolisme comme marqueurs de l'état cellulaire, ou médiateurs
des régulations liées à la dynamique des différents états comme la
pathologie ou la différenciation. La génomique a permis
d’accroître nos connaissances en cancérologie moléculaire et
dans le domaine de la prédisposition génétique. L’utilisation de la
protéomique permet de compléter ces acquis, en particulier pour
une meilleure compréhension des mécanismes
physiopathologiques de la fonction des gènes et pour la recherche
des marqueurs diagnostiques ou des cibles thérapeutiques. Les
avancées de la biochimie des protéines dépendent des avancées
technologiques de cette approche: amélioration des performances
de la 2D-PAGE et des outils de détection qui y sont associés
comme l'automatisation de la manipulation des échantillons,
nouveaux développements de la spectrométrie de masse et de la
bioinformatique.
1. Historique

Le terme de protéomique est récent : Il a été utilisé pour la


première fois dans une publication scientifique en 1997. Il
dérive de « protéome », terme inventé en 1995, par analogie
avec génomique qui dérive lui‐même du terme génome.

Les scientifiques se sont intéressés aux protéines bien avant


la naissance de la protéomique. Mais, depuis une dizaine
d'années, la protéomique est devenue une science à part
entière, avec ses techniques propres et ses méthodes.
2. Définition

Protéomique : science qui s’intéresse à l’étude et la


caractérisation du protéome

Protéome : ensemble des PROTÉines exprimées par le


génOME d’une cellule, d'un tissu, d'un organe ou d'un
organisme à un moment et dans un environnement donnés
TRANSCRIPTOME
Rôle et place des protéines dans le vivant

‐ Les enzymes : catalyseurs des réactions métaboliques,

‐ Les éléments qui assurent la synthèse de l’ADN et l’ARN : ADN


polymérase, ARN polymérase, hélicases…

‐ Les protéines de structure, éléments architecturaux intérieurs


ou extérieurs : actine, tubuline, collagène…

‐ Les canaux et les transporteurs membranaires qui régulent les


échanges de matière entre la cellule et le milieu extracellulaire :
Na/K ATPase…
‐Les protéines de signalisation : hormones de nature protéique
(ex: insuline, hormone de croissance…) / éléments
intracellulaires de la transduction du signal (ex: kinases,
phosphatases …) / Les récepteurs qui reçoivent et convertissent
les informations relatives au milieu extracellulaire.

‐ Les protéines de fixation et de stockage: hémoglobine et


myoglobine pour fixation de l’oxygène/ ferritine protéine de
stockage du fer …

‐ Les protéines du système immunitaire/immunoglobulines


Protéome : ensemble des PROTÉines exprimées par le génOME
d’un système biologique à une situation bien déterminée
(variantes temps et/ou environnement).
Le protéome varie selon :
Le type des cellules (spécificité tissulaire)
Le stade de développement (cycle cellulaire, état de
différentiation…)
Les conditions physico‐chimiques (température, pH,
viscosité, stress salin, stress oxydatif, …)
L’état physiologique normal versus l’état pathologique

La taille du protéome est plus importante que celle du


génome

Un seul génome peut donner plusieurs protéomes


Exemple 1 :

Le protéome est dynamique, le génome est constant.


Exemple 2 : chez l’Homme 25 000 ‐ 30 000 gènes et environ 106
protéines

Un gène peut coder pour plusieurs protéines en considérant :

1‐ les modifications dues à la maturation des ARNm : épissage


alternatif

2‐ les modifications post‐traductionnelles (glycosylation,


phosphorylation, acétylation, hydroxylation, amidation,
activation d’un zymogène...)
Pourquoi étudier le protéome?

‐ Ni l’analyse du génome (génomique) ni l’analyse à grande


échelle des ARNm (transcriptomique) ne permettent de prédire
le taux d’expression des protéines.
‐ Les modifications post‐traductionnelles des protéines peuvent
donner plusieurs isoformes ayant différentes fonctions.
‐ L’adressage cellulaire ou la localisation correcte est
indispensable pour qu’une protéine puisse accomplir sa
fonction biologique. Cet adressage se fait généralement après
maturation grâce à un peptide d’adressage (ex: peptide signal)
situé au site N‐terminal.
‐ La quantité des protéines cellulaires dépend de la dynamique
de synthèse et de dégradation: certaines protéines sont
synthétisées en grande quantité et d’autres en faible quantité
mais la durée de vie des protéines n’est pas la même (le temps
de ½ vie varie de quelques minutes à quelques jours) ce qui
influence énormément le taux des protéines dans la cellule

Le protéome donne une image plus complète des processus


biologiques que le génome et le transcriptome
L’analyse protéomique permet notamment :

la recherche et l’identification de l’ensemble des protéines


constituant une cellule, un organisme, un tissu…

l’identification des protéines constituant un complexe


protéique (interactions protéines‐protéines)

la recherche et l’identification de protéines impliquées dans


des voies biologiques par une analyse différentielle
(sauvage/mutant; état normal/état pathologique).
Applications de la protéomique
Plan du cours
I. Protéomique : Historique et définition

II. Etapes de l’analyse protéomique

III. Spectrométrie de masse : théorie et applications en


protéomique

IV. Approches de la protéomique quantitative

V. Bioinformatique et Protéomique : les bases de données en


Protéomique

VI. Exemples d'applications de la protéomique


2. Etapes de l’analyse protéomique

Extraction de l’ensemble des protéines


2.1 Extraction de l’ensemble des protéines

Cette étape importante vise à extraire les protéines à partir


d’un échantillon biologique. L’exactitude et la réussite de toute
l’analyse protéomique dépendent énormément de cette étape.
Lorsque les protéines sont intracellulaires, plusieurs
techniques visant à dénaturer la membrane cellulaire peuvent
être utilisées: e

1. Méthodes mécaniques
• Cryobroyage
mortier et pilon en présence d’azote liquide
• Abrasion microbilles de verre

• Sonication Sonicateur

Utilisation d'ultra‐sons (fréquence 


20 kHz) pour rompre les membranes
des cellules

• Homogénéisation à haute pression «French press »


2. Méthodes physiques
• Choc osmotique en utilisant un milieu hypotonique

• Choc thermique en réalisant plusieurs cycles de congélation /


décongélation

3. Méthode enzymatique :
Consiste à utiliser le lysozyme, enzyme qui attaque les
peptidoglycanes constituant la paroi des bactéries
(particulièrement les bactéries Gram +).

4. Méthode chimique :
Consiste à utiliser des détergents afin de solubiliser les protéines
membranaires (30% du protéome) et les stabiliser dans un milieu
aqueux.
Parmi les détergents utilisés, on peut citer ceux non ioniques
tels que Triton X100, Tween 80… ou ceux zuitterioniques (charge
positive et négative à la fois) tels que les sulfobétaïnes

L’extraction des protéines membranaires peut être améliorée en


utilisant de puissants agents réducteurs comme la tributyl
phosphine, DTT (dithiothréitol) … et des agents chaotropiques
comme la thiourée.

Des extractions dans des solvants organiques (mélange


chloroforme / méthanol par exemple) permettent de solubiliser
davantage les protéines membranaires.
Il n’existe pas un protocole universel d’extraction et pour chaque
échantillon il faut adapter un protocole.

Pour avoir une bonne extraction :

Rompre les liaisons covalentes (ponts disulfures) et non


covalentes entre les protéines et/ou les autres constituants
cellulaires (membranes, acides nucléiques…..).

Protéger contre la modification de l’échantillon (éviter la


protéolyse…)

Eliminer les molécules interférentes avec l’électrophorèse


(sels, lipides, acides nucléiques…..)
2.2 Séparation des protéines

La seconde étape permet de séparer les protéines en fonction


de leurs caractéristiques biochimiques .

On distingue deux approches :

Approche classique avec gel : l’électrophorèse

bidimensionnelle

Approche sans gel: chromatographie bidimensionnelle


Electrophorèse bidimensionnelle

La méthode de séparation classique en protéomique est


l’électrophorèse bidimensionnelle (E2D)

Avantages :

Aspect quantitatif

Méthode la plus courante pour étudier :

l’abondance

les modifications post‐traductionnelles


L’E2D nécessite différentes étapes :

Préparation des échantillons protéiques

Séparation des protéines de chaque échantillon sur gel

1ère dimension : Focalisation isoélectrique

2ème dimension : SDS‐PAGE

Coloration des gels

Détection sur gel et "quantification" des protéines


différemment exprimées
1. Préparation des échantillons

Chaque échantillon protéique a ses caractéristiques. Un


échantillon idéal serait dénué de sels, d'acides nucléiques et
serait soluble dans l'eau même à forte concentration.

Pour améliorer la solubilité d’un échantillon protéique :

Utilisation de l’urée et thiourée (agents choatropiques)


solubilisent les protéines dans la solution aqueuse même à
forte concentration.

Les détergents non ioniques et/ou zwitterioniques évitent


l'agrégation des protéines lorsque celles‐ci ont des domaines
ffff
hydrophobes / tels que les protéines transmembranaires .

Le DTT ou la tributyl phosphine maintiennent les


groupements ‐SH réduits, afin d’éviter les ponts disulfure inter‐
protéines.

Pour ne pas modifier les chaînes polypeptidiques on ajoute


des inhibiteurs de phosphatases, de protéases, de
glycosidases…

Pour éliminer les acides nucléiques : utilisation de polycations


(spermine ou spermidine) qui condensent les acides nucléiques
permettant leur élimination par centrifugation
Tampon de solubilisation :
Souvent, chaque échantillon demandera une optimisation
particulière mais dans de nombreux cas les protocoles simples
sont rentables.
La composition suivante est classiquement applicable : 7‐8 M
urée, 1‐2 M thiourée, 2‐4% CHAPS (détergent zwitterionique), 50
mM de DTT (dithiothréitol), 30 mM spermine.

Pour les tissus:


‐ broyer les tissus en poudre fine sous l’action de l’azote liquide,
puis, après évaporation de l'azote, verser la poudre dans le
tampon de solubilisation.
‐ Centrifuger et récupérer les protéines solubles.
‐ Précipiter les protéines d’un broyat (TCA, TCA/acétone) et
reprendre dans le tampon de solubilisation.

Pour les cellules en culture:


‐ Reprendre le culot dans le tampon de solubilisation puis
extraire par une méthode à optimiser.

2. Séparation des protéines


Le principe de la séparation repose sur la réalisation d’une
isoélectrofocalisation (1ère dimension : séparation selon la
charge, pHi) suivie d’une migration en gel SDS‐PAGE (2ème
dimension : séparation selon la MM).
L’association de ces deux paramètres (charge et taille)
confère à cette technique un très grand pouvoir résolutif
puisqu’elle permet de séparer plusieurs milliers d’espèces
protéiques issues de mélanges complexes.

2.1. 1ère dimension : isoélectrofocalisation (focalisation


isoélectrique)

Principe :

La focalisation isoélectrique : séparation d’un mélange de


protéines sur la base de leurs différences de pHi.
Les protéines sont des molécules amphotères dont la charge
dépend du pH du milieu où elles sont dissoutes. Au pHi, la charge
globale des protéines est nulle

La migration est effectuée dans un gradient de pH; chaque


protéine migre jusqu‘au l'endroit où le pH est égal à son pHi.
Au début de la mise en place de l’isoélectrofocalisation, le
gradient de pH était généré par des ampholytes (poly‐
électrolytes de synthèse chargés) introduites dans le gel au
moment de sa fabrication. Ces molécules migrent rapidement et
génèrent un gradient de pH le long du gel.
Par la suite, l’utilisation des ampholytes pour obtenir un
gradient de pH s’est avérée peu reproductible. On utilise
maintenant des gradients de pH immobilisés (IPG), formés avec
des immobilines.
Les immobilines sont des dérivés de l'acrylamide.

R correspondent à des groupements acide


ou base faible qui forment une série de
molécules tampon avec différentes valeurs
de pKa d'ionisation (exemples : 3,6 ‐ 4,4 ‐
4,6 ‐ 6,2 ‐ 7,0 ‐ 8,5 ‐ 9,3)
Les groupes chargés portés par les immobilines qui forment le
gradient de pH sont attachés d’une manière covalente à la
matrice de polyacrylamide et donc immobilisés.
Ce système d’immobilines permet de fixer le gradient de pH et
de palier aux problèmes de reproductibilité entre les
laboratoires.
Il existe de nombreuses gammes de IPG :

Larges : 3‐11

Etroites : zone acide 4‐7 ou zone alcaline 9‐12

Très étroites : 4,35‐5,55…


Réhydratation et dépôt
Les bandelettes de gels de 1ère dimension se vendent sous
forme déshydratée. Elles doivent être réhydratées avec un
tampon de réhydratation contenant classiquement de l’urée 8‐9
M (solubilisation/dénaturation), un détergent non ionique pour
solubiliser les protéines hydrophobes (CHAPS, Triton ou NP‐40,
0.5 à 4%), du DTT 20 à 100 mM (réducteur), un colorant (bleu de
bromophénol) et un mélange d’ampholytes entraînant les
protéines dans leur migration. Les protéines s’arrêtent de
migrer quand elles atteignent leur point isoélectrique
L'application des protéines se fait très souvent par

l'intermédiaire de la solution de réhydratation dans laquelle est

dilué l'échantillon préparé. Cette méthode permet notamment

d'introduire bien plus de protéines dans le gel.


Migration:
Les paramètres de migration (ampirage et voltage) sont en
général à optimiser en fonction de l'échantillon (salinité,
tampons, pHi des protéines, quantité), de la pureté des
composants des solutions (eau milli‐Q ou bidistillée, urée,
CHAPS...) du nombre de gels à focaliser et du gradient
employé.

Application d’un champs électrique : 3500 à 8000 V pendant un


temps variable
2.2. deuxième dimension : SDS‐PAGE

Principe :

Une séparation selon la masse molaire est un gel


d'électrophorèse de polyacrylamide en conditions
dénaturantes : SDS (Sodium Dodécyl Sulfate) est un détergent
anionique qui dénature les protéines et leur confère une
charge globale négative
‐ les grosses molécules sont ralenties par les pores du gel : elles
migrent lentement,
‐ les molécules de petite taille circulent plus facilement au travers
les mailles formées par le gel : elles migrent donc plus vite.
La migration des protéines est inversement proportionnelle
à leur taille dans l’électrophorèse SDS‐PAGE
Ces deux électrophorèses sont effectuées de manière
perpendiculaire l'une par rapport à l'autre

Le gel 2D améliore l’efficacité de séparation et chaque protéine se


présente sous forme d’un seul spot
3. Coloration des gels

Colorant Sensibilité Compatibilité avec MS Linéarité

Radioactivité < 1 ng Non Large

Blue de Coomassie 30‐100 ng Oui Large

Nitrate d’argent 1 ng Oui, mais après traitement Limitée

Sypro‐Ruby 1 ng Oui Très large


Linéarité sur une gamme limitée
4. Détection sur gel et "quantification" des protéines
différemment exprimées

Après avoir scanner les gels, les images captées sont traitées
par un logiciel d’analyse d’images qui sont dédiées uniquement à
la protéomique : ex logiciel P‐Dquest , logiciel Image master 2D
platinum.
Ces logiciels permettent la diminution du bruit de fond, le
dénombrement des taches et le calcul des coordonnées (pHi et
MM) ainsi que la quantification par la mesure d’intensité.
Analyse informatique des gels
Les multiples spots (parfois jusqu’à 2000) correspondent aux
protéines séparées en 2 dimensions. La position des spots sur
le gel est reproductible dans les systèmes de séparation en
gradient d’immobilines. Un changement de position est par
conséquent un indicateur d’une modification post‐
traductionnelle affectant la charge et/ou la taille.

Il est impossible d’appréhender individuellement le nombre


considérable de spots résolues sur un gel 2D. L’analyse
d’images repose sur la numérisation de l’image du gel 2‐D
après coloration.
Au cours de cette étape, le logiciel découpe l’image en
pixels pour la transmission et le stockage des données. Chaque
pixel de l’image est enregistré à une position en x et en y
associée à une valeur de densité optique (DO) proportionnelle
à l’intensité du signal enregistré par le scanner.
Pour que la DO soit un bon paramètre de mesure et un
reflet de l’expression de la protéine, la coloration appliquée
doit présenter de préférence une linéarité importante.
Limites de l’électrophorèse 2D :

La durée est longue (5 à 6 jours)

Plusieurs étapes ou manipulations à réaliser


3 11
La séparation n’est optimale que dans
un intervalle de MM réduit (15‐100
kDa) et de pHi réduit (3‐11).
Cependant, le pHi des protéines varie
de 1 (ex la pepsine) à plus de 12 et la
MM de moins de 5 à plus de 300 kDa.
Les protéines très hydrophobes ont fortement tendance à
précipiter lors de l’étape d’isoélectrofocalisation. En
conséquence, les protéines régulatrices de la cellule, qui sont
présentes en faible quantité ou sont de solubilité limitée dans
l’eau (protéines membranaires, protéines nucléaires),
échappent très largement à l’analyse protéomique.

Seules les protéines abondantes (plus de 10 000 copies par


cellule) peuvent être analysées par les techniques classiques.
En effet, les protéines les plus rares sont présentes à des taux
d
de l’ordre de 50 à 100 molécules par cellule, alors que les
protéines les plus abondantes sont présentes à des taux de
l’ordre de 107 molécules par cellule. Cette gamme d’expression
très étendue fait qu’il est à peu près illusoire de vouloir
visualiser et caractériser les protéines minoritaires dans un
extrait cellulaire total.

Problème mineur d’ordre technique : reproductibilité ou


variation inter‐gels
Approche sans gel : Chromatographie
bidimensionnelle (2D-LC)

2 dimensions :
1ère dimension : Chromatographie échangeuse d’ions
Élution progressive des protéines selon leur charge (dépend de
leur pHi et du pH du tampon d’élution)
2ème dimension : chromatographie en phase réverse
Elution selon hydrophobicité : les protéines récupérées en
premier sont les plus hydrophiles puis élution des protéines de
plus en plus hydrophobes
MudPIT (Multidimensional Protein Identification
Technology)

Un mélange de protéines est digéré par la trypsine.


Le mélange de peptides qui en résulte est séparé par un
système composé de deux chromatographie successives (en
tandem), relié à un spectromètre de masse MS/MS
(détermination de la séquence): la première dimension est un
échangeur de cations, la deuxième chromatographie est une
phase réverse.
Une concentration de sel donnée permet l'élution de certains
peptides de l'échangeur de cations vers la phase réverse.
Les peptides qui se fixent sur la phase reverse sont élués par
un gradient d'éthanol et analysés par spectrométrie de masse
en tandem.
Une fois l'élution de la phase réverse est terminée, une
concentration de sel plus importante est appliquée à
l'échangeur de cations pour éluer d'autres peptides vers la
phase reverse.
Une vingtaine de ces cycles peuvent ainsi être réalisés.
L'assignation des peptides à des protéines est effectuée par
des algoritmes spécifiques comme SEQUEST.
MS/MS

MS/MS

MS/MS
Avantages :
‐ Elimine la séparation par les gels 2D
‐ Moyennant des méthodes bioinformatiques puissantes :
identification des protéines minoritaires dans une fraction
biologique et qui ne peuvent pas être visualisées par gel 2D.
MudPIT permet aussi la caractérisation des protéines
membranaires ou celles de valeurs de pHi extrême
‐ Possibilité d’identification des milliers de protéines dans un
seul échantillon protéique
Inconvénients :
‐ Mise en place d’une plateforme spécialisée (équipement,
logiciels, personnel qualifié)
‐ Très coûteuse
‐ Le problème majeur de cette approche "en vrac" est
l‘ambiguïté pour assigner des peptides communs à différentes
protéines, à l'inverse de l'approche par gel bi‐dimensionnel où
les protéines sont séparées au préalable.
2.3 Identification
L’étape d’identification des protéines est importante, elle
permet de savoir quelles sont les protéines impliquées dans un
processus biologique.
En général, les méthodes d’identification les plus utilisées
sont :
‐ Le séquençage du NH2‐terminal par la méthode d’Edman
‐ La spectrométrie de masse : L'avancée majeure en terme
d'identification des protéines en analyse protéomique
correspond à l'utilisation conjointe de la spectrométrie de
masse et des banques de données.
Digestion trypsique

Avant d’identifier les protéines par spectrométrie de masse,


les spots protéiques d’intérêt sont excisés soigneusement du
gel soit manuellement au scalpell soit de façon automatisée
avec un gelSpotter (robot).
Ils sont par la suite hydrolysés en fragments peptidiques par
une protéase spécifique (trypsine ou autres).
Enzymes protéolytiques Sites de clivage

Aminopeptidase aa N‐terminal
Carboxypeptidase aa C‐terminal
Chymotrypsine Phe, Tyr et Trp
Trypsine Arg et Lys
Glu‐C protéase Glu et Asp
Lys‐C protéase Lys
Arg‐C protéase Arg
Asp‐N protéase Asp
L’hydrolyse totale d’un octapeptide P8 permet d’identifier les acides
aminés suivants : Ala, Asp, Arg, 2 Gly, Phe, Ser et Val
L’action de la trypsine sur P8 fournit un tripeptide TP3 et un
pentapeptide TP5 ; le traitement de P8 par la chymotrypsine fournit
un tripeptide CP3 et un pentapeptide CP5. Tous ces peptides sont
isolés et traités indépendamment par l’aminopeptidase et par la
carboxypeptidase comme c’est indiqué dans le tableau :

Enzyme Peptide Aminopeptidase Carboxypeptidase


P8 Ala Val
TP3 Ser Val
Trypsine
TP5 Non précisé Non précisé
CP3 Non précisé Non précisé
Chymotrypsine
CP5 Asp Val
Déduire la séquence de ce peptide
La protéase la plus utilisée en spectrométrie de masse est la
trypsine qui hydrolyse la liaison peptidique après les acides
aminés lysine et arginine (excepté KP et RP).
Ces peptides ont des masses différentes car leurs séquences en
acides aminés sont différentes.
Plan du cours 14 heures

I. Protéomique : Historique et définition

II. Etapes de l’analyse protéomique

III. Spectrométrie de masse : théorie et applications en


protéomique

IV. Approches de la protéomique quantitative

V. Bioinformatique et Protéomique : les bases de données en


Protéomique

VI. Exemples d'applications de la protéomique


Principe
La spectrométrie de masse est une technique qui permet de
déterminer la masse moléculaire exacte d’un composé. C’est
une méthode très sensible (jusqu’à 1 Da= un hydrogène près).
La spectrométrie de masse se base sur l’ionisation de
l’échantillon puis la séparation des ions dans un champ
électrique selon le rapport m/z (m = masse de la particule et z =
charge de la particule). Les particules séparées vont être par la
suite détectées grâce à un détecteur .
Les spectromètres de masse mesurent le rapport m/z des ions
(peptides ionisés), d’où la détermination de leur masse
Les spectromètres comportent 3 éléments :
– une source d’ionisation : produire des ions en phase gazeuse
– un analyseur de masse : séparation des ions en fonction du
rapport m/z
– un détecteur : enregistrement et quantification des ions par
transformation du signal ionique en signal électrique
Selon le type de source, on distingue :
Electrospray Ionisation (ESI)
Matrix Assisted Laser Desorption Ionisation (MALDI)
Il existe plusieurs types d’analyseurs à basse résolution ou à
haute résolution

Analyseurs résolution Gamme m/z


Quadripôle (Q) 2000 8000
Magnétique 20 000 20 000
Temps de vol (TOF) 20 000 500 000
Trappe ionique (IT) 5000 6000

Un analyseur temps de vol (TOF (Time of Flight); haute


résolution) est facilement compatible avec une source de type
MALDI alors que les sources ESI sont compatibles avec des
analyseurs de basse résolution : quadripôle et trappe ionique
En protéomique, deux méthodes (différentes selon source
d’ionisation et l’analyseur) sont principalement utilisées :
‐ MALDI‐TOF (MS) permet de réaliser une empreinte
peptidique
‐ ESI (MS/MS) permet d'obtenir la séquence en acides
aminés.
MALDI‐TOF (Matrix Assisted Laser Desorption Ionization Time‐of‐
Flight)
Un appareil de type MALDI‐TOF permet d'obtenir une carte
peptidique massique représentant la distribution des masses
des fragments peptidiques obtenus par digestion trypsique
d'une protéine.
MALDI‐TOF est une méthode d'ionisation permettant d'analyser
des molécules de hautes masses moléculaires (peptides,
oligonucléotides...). Les ions formés sont accélérés grâce à une
haute tension puis envoyés dans un tube de vol où ils volent
jusqu'au détecteur. Les ions ayant une masse élevée voleront
plus lentement que les ions ayant une masse plus faible.
Etapes de MALDI‐TOF:

1‐ Digestion trypsique des protéines

2‐ Co‐cristallisation de l’échantillon et d’une matrice photo‐


excitable : Le phénomène d'ionisation utilise une matrice
cristallisée. Exemple : un mélange acide sinapinique /
acétonitrile / H2O. Les propriétés de ce mélange sont :
• un caractère acide donc une source de proton pour
l'ionisation des peptides
• une forte absorption optique dans les UV pour absorber
rapidement et efficacement l'irradiation du laser
• la présence de groupements polaires pour une utilisation
avec la solution aqueuse

3‐ Excitation de la matrice par tir Laser (UV 337 nm) : Sous l'effet
d'un laser UV (337 nm), la matrice irradiée subit une désorption
entraînant une vaporisation et une ionisation des peptides
qu'elle contient par transfert de proton.

Bleu : matrice
Rouge : échantillon
4‐ accélération des ions formés par une haute tension. Ces ions
acquièrent une grande énergie cinétique et sont séparés en
fonction de leur temps de vol qui est fonction du rapport [m/z]
selon une trajectoire circulaire : les petits ions volent plus vite
que les gros

5‐ Détection grâce à un détecteur permet de transformer les


ions en un signal électrique. Ce signal est d’autant plus
important que la quantité d’ions est élevée.
Dans un spectre de masse, la hauteur relative des pics indique
l'abondance relative des espèces
La spectrométrie de masse MALDI‐TOF permet d'établir la
carte ou l’empreinte peptidique massique de la protéine
("peptide mass fingerprint ‐ PMF").
Carte peptidique massique (PMF)
6‐ Identification de la protéine : Comparaison de la liste de masse
expérimentale avec la liste de masse théorique de chaque protéine
da la banque de données digérée par la trypsine in silico
Effet de la précision de la masse sur la recherche des protéines
candidates
Effet du nombre de peptide sur la recherche des protéines
candidates

Le nombre des peptides à comparer pour trouver les protéines


potentielles dépend de la taille de la protéine et de la pureté du
spot
‐ Nombre des peptides recherchés/Nombre des peptides trouvés =
6/4 pour la protéine Z98765
‐ La substitution d'un acide aminé peut induire un déplacement
des masses des ions qui rend les spectres expérimentales et
théoriques différents.
L’identification des protéines via la comparaison des PMF
expérimentales ou théoriques se fait en utilisant les logiciels
suivants :
 L'identification d'une protéine n'est possible que si elle est
déjà répertoriée dans les banques de données protéiques.

 Les séquences expérimentales et celles obtenues in


silico doivent coïncider presque exactement : en effet, la
substitution d'un ou plusieurs acides aminés peut induire un
changement des masses des ions qui rend les deux spectres
très différents difficulté d’identification
ElectroSpray Ionisation (ESI)

Le mode d’ionisation le plus couramment utilisé en


spectrométrie de masse en tandem MS/MS est l‘ElectroSpray
Ionisation (ESI)

Principe :
‐ Une solution aqueuse est introduite dans la source par un
capillaire très fin chargé et en métal.
‐ En appliquant un champ électrique (4 à 5 kV) entre le capillaire
et une contre‐électrode associée à un courant d'azote co‐axial,
l’échantillon en solution va se décomposer en un nuage de
gouttelettes hautement chargés : nébulisation (spray)
‐ diminution de la taille des gouttelettes par évaporation
progressive du solvant sous l’effet d’un second flux d’azote
chauffé puis explosions successives responsables de divisions
spontanées de la gouttelette chargée et désorption de
molécules multichargées.
‐ les ions désolvatés (en phase gazeuse) sont introduits dans
l’analyseur où règne un vide poussé.
Electrospray Ionisation
La spectrométrie de masse en tandem (MS/MS) consiste à
sélectionner un ion par une première spectrométrie de masse, à
le fragmenter, puis à effectuer une deuxième spectrométrie de
masse sur les fragments (aa et sous peptides) ainsi générés.

 Les fragments peptidiques issus de l'hydrolyse par la trypsine


sont en solution aqueuse volatile (mélange méthanol‐eau 1:1).

 Ionisation des fragments peptidiques par une source ESI

 Sélection des peptides ionisés un à un par un analyseur selon


leur rapport m/z
 Les ions sélectionnés se décomposent lorsqu’ils entrent dans
une cellule de collision contenant des molécules de gaz neutre
(Argon, Hélium, Néon)

 Analyse des fragments selon leur rapport m/z et génération d’un


spectre MS/MS

 Reconstitution de la séquence en acides aminés du peptide

 Analyse des banques protéiques et génomiques


La spectrométrie de masse en tandem (MS/MS) combine en
général deux analyseurs.
Les ions (sous‐peptides ou acides aminés) qui résultent de la
fragmentation des peptides par ionisation / collision sont notés
de la manière suivante si la fragmentation a lieu au niveau de
la liaison peptidique :
‐ ion b : il contient la partie N‐terminale du peptide fragmenté
‐ ion y : il contient la partie C‐terminale du peptide fragmenté

Le chiffre qui accompagne la lettre indique le nombre d'acides


aminés dans le fragment.
b1 : 1er aa du coté N‐terminal; b2 : 1er et 2ème aas du côté N‐
terminal ….
y1 : dernier aa du côté C‐terminal ; y2 : dernier et avant dernier
aas du côté C‐terminal…
Chaque acide aminé a une masse théorique
La masse d’un sous‐peptide formé de n acides aminés est égale à
la somme des masses des acides aminés qui le constituent

Comparaison des
masses théoriques et
expérimentales puis
détermination de la
séquence
La comparaison des séquences peptidiques avec les banques
de données protéiques permet de trouver des protéines
candidates. Cette approche s’appuie sur l’utilisation des
logiciels qui recherchent les similarités entre séquences et
fournissent une liste de protéines candidates classées par ordre
décroissant de probabilité qui est calculée grâce à un score.

Ces logiciels (Mascot, Sequest…) sont conçus pour accepter

des variations (substitution, insertion ou délétion d'acides

aminés). Ainsi, l'approche permet de repérer dans les banques

de données des séquences en acides aminés non totalement

identiques mais présentant des analogies avec la séquence

déduite de l’interprétation du spectre MS/MS.


Programmes disponibles pour l’interprétation des spectres MS/MS
La limitation de la spectrométrie MS/MS repose dans
l’interprétation des spectres c’est à dire leur conversion en une
ou plusieurs séquence(s) peptidique(s) possible(s) certaines
régions des spectres sont difficiles à interpréter : qualité du
spectre, résidus isobares error‐prone : Ile = Leu, Lys = Gln, Trp =
[Glu + Gly]

Des logiciels spéciaux peuvent restreindre l'interprétation


de ces spectres à la détermination d’une courte séquence de 3 à
5 acides aminés qui correspond à une zone interprétable du
spectre MS/MS. On appelle cette séquence PST (Peptide
Sequence Tag).
La séquence est encadrée par deux valeurs de masse (en Da)
des parties N‐ et C‐terminales du fragment peptidique. Ces
masses correspondent aux zones mal interprétées du spectre
MS/MS.

Ces étiquettes (PST) sont utilisées pour cribler les banques


protéiques ou génomiques
La recherche des protéines candidates se fait suite à la
localisation des PST et attribution d’un score
X X X X X

Le criblage des banques génomiques se fait via des logiciels


spéciaux / Pepline ce qui permet l’annotation des génomes.
Elle repose sur la localisation des séquences PST sur les
produits de traduction des 6 phases de l’ADN Calcul d’un
score identification d’un gène outil pour l’annotation
des génomes
Plan du cours 14 heures

I. Protéomique : Historique et définition

II. Etapes de l’analyse protéomique

III. Spectrométrie de masse : théorie et applications en


protéomique

IV. Approches de la protéomique quantitative

V. Bioinformatique et Protéomique : les bases de données en


Protéomique

VI. Exemples d'applications de la protéomique


IV. Approches de la protéomique quantitative

Voir polycope protéomique quantitative


V. Bioinformatique et protéomique

Les méthodologies de l’analyse protéomique peuvent être


séparées en deux grands groupes :
‐ Le premier regroupe les méthodes expérimentales réalisées
dans le laboratoire "réel" ("wet laboratory") à savoir
l’électrophorèse bidimensionnelle et les méthodes
spectrométriques.
‐ Le second groupe de méthodes, mises en œuvre dans le
laboratoire "virtuel" ("dry laboratory"), fait appel à la
bioinformatique.
La bioinformatique occupe une place très importante en
analyse protéomique car elle a mis à la disposition de cette
dernière des:
‐ Logiciels spécialisés utilisés au cours des différentes étapes
de l’analyse: traitement d’image, validation et interprétation
des gels, digestion des séquences des protéines in silico,
comparaison des PMF…
‐ Banques de données et outils spécialisés pour la
protéomique: Swiss‐2DPAGE, Expasy …
V. Exemples d'applications : protéomique clinique

Le gel 2D reste un outil de « routine» de l’analyse protéomique


mais souffre de diverses limites (protéines minoritaires, les
protéines de faible MM…).
La nécessité de développement de nouveaux outils d’analyses
plus rapides, sensibles, sélectifs et quantitatifs associés aux
progrès de la spectrométrie de masse a entraîné l’émergence
de nouvelles stratégies prometteuses / SELDI‐TOF (Surface
Enhanced Laser Desorption Ionization)
La méthodologie SELDI‐TOF repose sur la comparaison de profils
protéiques. Cette technologie permet de détecter et mesurer la
masse des protéines ou sous‐populations de protéines
présentes dans un mélange complexe : sérum, plasma, urine,
liquides biologiques …
Du moment qu’une molécule, même minoritaire, apparaît ou
disparaît entre deux états physiologiques elle constitue un
élément intéressant pour détecter la physiopathologie.
A titre d’exemple, cette approche protéomique a permis
d’identifier des biomarqueurs tumoraux permettant d’établir un
diagnostic simple dans le cancer du sein, cancer de prostate…
SELDI –TOF
SELDI = Surface Enhanced Laser Desorption Ionization

Support : surface d’échange chromatographique


‐ surfaces chimiques :
‐ molécules hydrophobes
‐ molécules hydrophiles
‐ échange cationique
‐ échange anionique
‐ surfaces biologiques : récepteur, anticorps, ligand, enzyme,
ADN…
La fixation sélective combinée à une modulation de la
stringence des lavages permet d’éliminer les protéines non
fixées ou fixées de façon non spécifique et donne ainsi la
possibilité de détecter et d’analyser des protéines minoritaires
ou plus petites, masquées par des protéines plus grosses et
plus abondantes.
Les protéines retenues sont détectées par désorption et
l’ionisation par laser suivi d’une analyse en temps de vol
Le SELDI‐TOF présente l’avantage de pouvoir détecter des
protéines de MM inférieure à 20 kDa (sous‐représentées ou
absentes avec la technique d’électrophorèse 2D).

Vous aimerez peut-être aussi