Identification de protéines

L’identification de protéines en mélange dans des extraits biologiques totaux ou fractionnés est une application classique de la LC-MS/MS. En fonction des données génomiques disponibles (protéines ou ESTs) pour l’espèce étudiée, cette identification peut se faire suivant deux approches :

1- L’approche dite de “Mass matching” (ou empreinte de fragmentation) consiste à identifier des peptides sur la base de la similarité entre spectres MS2 experimentaux et théoriques : les masses expérimentales mesurées après fragmentation des peptides sont comparées avec des masses théoriques issues de la digestion et de la fragmentation in silico d’une base de données de protéines. Les protéines sont ensuite identifiées par inférence à partir de la liste des peptides identifiés.

Avantage : L’identification des protéines peut être effectuée dans des mélanges très complexes.
Limite : Un peptide ne pourra être identifié que si sa séquence exacte est présente dans la base de données de protéines.
Logiciel utilisé : X!Tandem pour l’identification des peptides et X!TandemPipeline pour l’inférence des protéines.

2- L’approche dite “De Novo” consiste à interpréter directement et automatiquement chaque spectre MS2 en une séquence primaire d’acides aminés. Bien qu’incomplètes, les séquences ainsi obtenues peuvent ensuite être utilisées pour identifier les protéines par homologie de séquence.

Avantage : les fonctions des protéines présentes dans l’échantillon peuvent être inférées bien qu’aucune séquence de l’espèce étudiée ne soit présente dans les banques de données.
Limites : seuls les spectres MS2 de très bonne qualité peuvent être interprétés en séquences d’acides aminés. L’analyse de mélanges complexes est longue et difficile par cette approche dont l’utilisation est généralement restreinte à l’analyse de spots 2D. Certains acides aminés isobares ou de masses très proches sont indiscernables par cette approche (e.g. =L, F=Mox, Q=K).
Logiciels utilisés : Peaks Studio ou Pepnovo pour l’interprétation automatique des spectres; Fasts ou MSBLAST pour l’alignement de séquences (ces deux logiciels permettent d’aligner un ensemble de peptides sur une protéine dans une base de données).

Quantification de protéines

La plateforme pratique en grande majorité une approche label-free. Pour obtenir des abondances de protéine à partir de données acquises au niveau des peptides, trois approches complémentaires sont utilisées:

1- La quantification basée sur les XIC consiste à résumer les intensités de peptide mesurées par le spectromètre de masse en abondances de protéines. Pour ce faire, il existe plusieurs méthodes allant de la moyenne des intensités de peptides à la modélisation statistique (cf Blein-Nicolas & Zivy (2016) pour plus d’information).

Avantage : haute précision de quantification.
Limite : nécessite de traiter les données pour filtrer les outliers, manipuler les données manquantes et calculer les abondances de protéines.
Logiciels utilisés : MassChroq pour la quantification des peptides et le paquet R ‘MCQR’ pour le traitement des données.

2- Le comptage de spectres est une approche semi-quantitative dans laquelle les protéines sont quantifiées sur la base du nombre de spectres MS2 qui leur sont attribués après l’étape d’identification.

Avantage : pas de logiciel spécifique requis car les données de comptage de spectres sont accessibles directement dans les sorties d’X!TandemPipeline. Il n’y a pas de données manquantes mais des zéros.
Limite : la précision de quantification, et donc le pouvoir de discrimination, sont plus faibles que dans l’approche basée sur les XIC. Des problèmes liés à la sparcité des données (i.e. présence de nombreux zéros) peuvent se produire dans certains cas.

3- Le comptage de pics est une autre approche semi-quantitative dans laquelle les protéines sont quantifiées sur la base du nombre de pics chromatographique (ou d’ions peptides) qui leur sont attribués après identification et quantification des peptides.

Avantage : les données sont plus complètes qu’avec l’approche basée sur le comptage des spectres et leur traitement est plus simple qu’avec l’approche basée sur les XIC.
Limites : la précision de quantification, et donc le pouvoir de discrimination, sont plus faibles que dans l’approche basée sur les XIC. Il est nécessaire d’utiliser un logiciel de quantification
Logiciels utilisés : MassChroq pour la quantification des peptides et le paquet R ‘MCQR’ pour le traitement des données.

Caractérisation de modifications post-traductionnelles

PAPPSO une forte expérience dans la détermination de sites de phosphorylation par des analyses basées sur un marquage diméthyl des amines primaires, le fractionnement des peptides et l’enrichissement en phosphopeptides. La plateforme effectue également des analyses de glycoprotéomique, des analyses de ponts disulfure ainsi que la caractérisation de l’extrémité N-terminale des protéines.