Découvrir la biologie par la protéomique unicellulaire

Découvrir la biologie par la protéomique unicellulaire

Pour relever le défi de l’épuisement des échantillons lors de la préparation, il y a eu un certain nombre d’avancées récentes dans ce qui est maintenant un domaine d’étude en évolution rapide de SCP, avec des contributions importantes de plusieurs chercheurs. Des travaux antérieurs combinaient l’électrophorèse capillaire (EC) avec la spectrométrie de masse à haute résolution (HRMS) pour analyser les protéomes de blastomères uniques de Xénope laevis embryons12. Plus récemment, Zhu et al. développé une méthode appelée NanoPOTS (traitement des nanogouttelettes dans un pot pour les échantillons de traces)13. Cette méthode réduit les étapes de manipulation des liquides et augmente le rendement en protéines par cellule, ce qui permet d’identifier 2 à 25 fois plus de peptides que lorsque les échantillons étaient préparés dans de petits tubes. Ils ont démontré que NanoPOTS identifiait de manière robuste ~ 1 500 à 3 000 protéines de 10 à 140 cellules et augmentait encore la profondeur protéomique jusqu’à > 3 000 protéines en utilisant l’algorithme Match Between Runs dans le logiciel MaxQuant utilisé pour analyser les données.13. De même, dans une autre étude, l’approche NanoPOTS a permis d’identifier environ 670 groupes de protéines dans des extraits de cellules HeLa uniques14.

L’équipe de Nikolai Slavov a adopté une approche différente en développant une méthode appelée SCoPE-MS (protéomique unicellulaire par spectrométrie de masse) qui visait à réduire les pertes d’échantillons causées par l’adhésion aux colonnes chromatographiques ou à d’autres surfaces en incluant un protéome porteur qui augmente la quantité de faible peptides d’abondance soumis à la spectrométrie de masse. Notamment, dans cette méthode, les échantillons de test et de support sont étiquetés individuellement avec des étiquettes isobares, puis regroupés, ce qui est une étape techniquement difficile pour les échantillons de petit volume.15. Cependant, l’échantillon de support, qui a une abondance totale de protéines 200 fois plus élevée que les cellules individuelles et est marqué avec un réactif d’étiquette de masse en tandem isobare (TMT), peut déclencher MS2 et ainsi permettre la quantification des cellules individuelles dans l’ensemble TMT basé uniquement sur leur signal d’ion reporter15. Les analyses SCoPE-MS de 12 cellules Jurkat simples et de 12 cellules U-937 simples ont identifié un total de 767 protéines15. Dans le cas du SCoPE-MS15alors que l’inclusion d’un protéome porteur permet d’identifier plus de peptides, cela peut influencer négativement la quantification16. Cela résulte de la difficulté d’effectuer une quantification MS précise sur les très faibles signaux de peptides dérivés de protéines dans les cellules individuelles en présence des très grands signaux peptidiques des protéines porteuses.17. Pour mieux comprendre ce défi, Cheung et ses collègues ont analysé la relation entre le niveau de protéome porteur et la précision quantitative de SCoPE-MS16. Les résultats ont montré qu’une augmentation de la quantité de protéome porteur nécessitait une augmentation correspondante du nombre d’ions échantillonnés pour maintenir la précision quantitative. Sur la base des résultats obtenus, ils ont fourni des conseils sur la conception expérimentale de SCP, la collecte de données et l’analyse de données et ont développé un programme, SCPCompanion, qui permet une analyse de contrôle de la qualité des données SCP-MS.

Alors que Cheung et al. discuter de la nécessité de paramètres d’acquisition MS appropriés lors de la réalisation d’études SCP, on ne sait toujours pas quels niveaux de porteurs en excès fournissent l’équilibre optimal entre sensibilité et précision ou dans quelle mesure des rapports réduits nuisent à la précision quantitative18. Par conséquent, Ctortecka et al. ont mené une étude approfondie des technologies SCP multiplexées actuellement disponibles qui ont pris en compte les identifications de protéines, la variance de mesure, la précision quantitative et les données manquantes. Ils concluent que la limitation des pointes de support à ≤ 20 fois est d’une importance cruciale pour des analyses SCP précises et que les analyses DIA-TMT fournissent un chevauchement de répliques amélioré par rapport aux analyses DDA-TMT tout en préservant le débit d’acquisition à une précision quantitative améliorée. Veuillez consulter la discussion plus approfondie sur DIA et DDA ci-dessous.

Un workflow optimisé, SCoPE219,20a incorporé plusieurs améliorations par rapport à SCoPE-MS qui visaient à augmenter l’accessibilité, le débit et la précision20. Les améliorations comprenaient (1) la lyse des cellules avec l’approche de préparation minimale d’échantillons protéomiques (mPOP) qui utilise un cycle de congélation-chaleur qui extrait les protéines dans l’eau, évitant ainsi le nettoyage avant l’analyse par spectrométrie de masse par chromatographie liquide (LC-MS), (2) diminuant les volumes de lyse et de digestion de 10 à 1 µl, ce qui augmente de 10 fois les concentrations de trypsine et de protéines substrats dans la digestion, (3) l’utilisation d’un canal de référence composé d’aliquotes de tous les ensembles d’échantillons, (4) un gradient nLC plus court qui augmente le débit et la sensibilité de la SM, et (5) une optimisation systématique des paramètres qui intègre des améliorations précédemment développées pour aider à optimiser l’acquisition des données de la SM (c.-à-d. DO-MS ; optimisation de la SM basée sur les données)21 et pour améliorer les identifications de peptides dans les données SCP LC-MS/MS acquises (c’est-à-dire, DART-ID ; alignement des temps de rétention pour l’identification basé sur les données)22. Comme expliqué dans Specht et al., la quantification précise des données LC-MS/MS nécessite l’échantillonnage de l’apex des pics chromatographiques20. Ainsi, Huffman et al. développé DO-MS pour optimiser les paramètres de l’instrument nécessaires pour permettre aux pics chromatographiques d’être échantillonnés généralement dans les 3 s de leurs sommets21. De plus, SCoPE2 a amélioré l’identification des séquences peptidiques en utilisant un algorithme bayésien (DART-ID) pour incorporer des informations sur le temps de rétention qui augmentent la confiance dans l’attribution de séquences peptidiques aux spectres MS/MS tout en déterminant rigoureusement le taux de fausses découvertes (FDR)22. La pureté spectrale élevée et l’utilisation de temps de rétention pour renforcer l’identification des séquences peptidiques ont permis d’attribuer des séquences peptidiques à environ 35 % des spectres MS2 de chaque SCoPE2 exécuté à 1 % FDR20.

D’autres études visant à améliorer la préparation des échantillons incluent les travaux de Schoof et al., qui ont développé un flux de travail amélioré pour le SCP automatisé. Ils ont découvert que l’inclusion de 20 % de trifluoroéthanol (TFE) pendant la lyse et de 10 % de TFE pendant la digestion à la trypsine augmentait le nombre de protéines identifiées d’environ 5 %.6. Ils ont également mené des études pour optimiser les paramètres des instruments MS pour SCP. Ces études ont montré que des temps d’injection de 300 et 500 ms offraient un bon équilibre entre la profondeur du protéome et les performances quantitatives.6. Enfin, scepter (Single Cell proteomics readout of expression), qui est un package python qui étend les capacités de Scanpy pour traiter les données MS/MS unicellulaires, a été décrit par Schoof et al.6. Comme détaillé ici, https://scanpy.readthedocs.io/en/stable/, Scanpy est une boîte à outils évolutive basée sur Python pour l’analyse des données d’expression génique unicellulaire. sceptre prend les fichiers de résultats de Proteome Discoverer et les méta-informations des cellules individuelles, ce qui est une caractéristique clé qui permet à sceptre de relier les paramètres FACS enregistrés à chaque cellule. Les auteurs ont découvert que l’intensité totale additionnée par cellule fournissait un paramètre approprié pour détecter les cellules aberrantes pouvant provenir de doublets, de puits vides ou d’une perte d’échantillon pendant la préparation. Le filtrage de ces cellules était crucial pour éviter des conclusions biologiques trompeuses6. Grâce à leur flux de travail amélioré, l’analyse de huit plaques à 384 puits de cellules individuelles d’un système de modèle de leucémie primaire a identifié 2723 protéines sur 2035 cellules avec une moyenne de 987 protéines identifiées par cellule.

Une limitation de la quantification sans étiquette dépendante des données (DDA) est la présence de valeurs manquantes qui complique l’analyse même des répétitions techniques. Ce défi est exacerbé par les rapports signal/bruit inférieurs caractéristiques des données SCP LC-MS/MS. Kalxdorf et al. a tenté de relever ce défi en développant le flux de travail IceR (Ion current extraction Re-quantification) qui combine des taux d’identification élevés de DDA avec de faibles taux de valeurs manquantes similaires à l’acquisition indépendante des données (DIA)23. Ces auteurs ont appliqué IceR aux données SCP et ont montré qu’il augmentait le nombre de protéines identifiées de manière fiable dans des échantillons unicellulaires.

Un système de préparation d’échantillons assisté par filtre miniaturisé appelé MICROFASP a été développé pour effectuer le traitement parallèle de 146 blastomères isolés à partir d’un stade de 50 cellules. Xénope laevis embryons (200 ng de protéine/blastomère)24. Sur la base d’analyses LC-MS/MS sur 109 blastomères, une moyenne de 3468 ± 229 groupes de protéines et 14 525 ± 2437 peptides uniques ont été identifiés à partir de chaque blastomère, avec 1311 protéines identifiées dans chaque blastomère24. Brunner et al. a également récemment décrit un flux de travail à cellule unique qui combine une préparation d’échantillon miniaturisée, une chromatographie à très faible débit (100 nl/min) et un nouveau spectromètre de masse à mobilité d’ions piégés (TIMS), qui a permis d’améliorer la sensibilité de 10 fois par rapport à 1 μl/min. chromatographie à débit minimal25. La méthode, appelée véritable protéomique dérivée d’une seule cellule (T‐SCP), nécessite une manipulation précise des échantillons où, sans perte, les cellules individuelles sont triées dans des puits contenant 1 µl de tampon de lyse, suivies d’une étape de chauffage et de l’ajout de lysyl-endopeptidase et trypsine pour donner un total de 2 µl dans un espace clos. Les peptides sont concentrés dans des nanopaquets de 20 nl dans un dispositif EvoTip similaire à un StageTip. Les peptides sont ensuite soumis à une LC-MS/MS à très faible débit avec un nouveau mode d’acquisition diaPASEF (accumulation parallèle-fragmentation en série) dans lequel les ions peptidiques sont libérés dans des emballages concentrés du dispositif TIMS dans le système de vide d’un quadripôle time-of- spectromètre de masse de vol (TIMS-qTOF)26. Ces précurseurs peptidiques peuvent être fragmentés de manière très sensible, soit en mode dépendant des données (ddaPASEF), soit en mode indépendant des données (diaPASEF), ce qui entraîne une utilisation très élevée des ions et de faibles taux de données manquantes.26. Lorsque cette dernière approche a été couplée à une chromatographie à très faible débit, les auteurs ont quantifié jusqu’à 2083 protéines par cellule HeLa à l’aide d’une bibliothèque spectrale HeLa DIA25.

Il a été démontré que l’électrophorèse capillaire couplée à l’ionisation par électrospray et à la spectrométrie de masse à haute résolution (CE-ESI-HRMS) a une sensibilité suffisante pour effectuer des analyses de protéome subcellulaire27. Cette étude a analysé des échantillons allant de grandes cellules d’environ 250 μm de diamètre provenant de Xénope laevis embryons à de petits neurones cultivés d’environ 35 μm de diamètre provenant de l’hippocampe de souris. Des analyses sur ~ 18 ng de l’extrait de la ligne médiane ventrale animale ou des cellules équatoriales ont identifié 1133 protéines dans un embryon de 16 cellules. Étant donné que CE-ESI-HRMS d’environ 5 ng de protéine digérée à partir d’une cellule médiane dorsale gauche d’animal a identifié 722 protéines, cette technologie a une sensibilité suffisante pour analyser des cellules plus petites. Cependant, comme CE-ESI-HRMS de trois neurones uniques n’a identifié que 16, 14 et 7 protéines, respectivement, il est probable que la manipulation manuelle de ces cellules et leur traitement dans des microtubes aient entraîné d’importantes pertes d’adsorption. Ensemble, ces études démontrent que le CE-ESI-HRMS a le potentiel de fournir un complément précieux au SCP à base de nanoLC.

Comme résumé ci-dessus, réduire les volumes d’échantillon et de digestion à ≤ 2 µl, limiter les pics de porteurs dans les technologies SCP multiplexées à < 20 fois, simplifier les procédures de lyse cellulaire, diminuer les gradients HPLC et/ou les débits, optimiser les paramètres d'acquisition de la spectrométrie de masse, utiliser les temps de rétention pour renforcer les identifications de séquences peptidiques, le développement d'un logiciel qui fournit un traitement et une analyse améliorés des données SCP-MS/MS, et l'utilisation d'analyses DIA ou de type DIA à la place de DDA ont tous contribué aux progrès substantiels des analyses SCP au cours des dernières années qui permettent désormais de quantifier jusqu'à ~2000 protéines dans un seul extrait de cellule HeLa.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.