Diagnostic basé sur l’apprentissage automatique et classification du risque de maladie coronarienne à l’aide de l’imagerie de perfusion myocardique SPECT : une étude radiomique

Diagnostic basé sur l’apprentissage automatique et classification du risque de maladie coronarienne à l’aide de l’imagerie de perfusion myocardique SPECT : une étude radiomique

Le flux de travail de la présente étude est présenté sur la figure 1. Les sections suivantes sont consacrées à la description de l’acquisition de données, de l’extraction de caractéristiques radiomiques et du cadre de modélisation diagnostique, y compris les méthodes de sélection de caractéristiques, les algorithmes d’apprentissage automatique et le processus d’évaluation et de comparaison. des modèles.

Figure 1

Flux de travail des modèles radiomiques proposés pour le diagnostic automatisé de la maladie coronarienne et la classification des risques à partir de l’imagerie de perfusion myocardique au repos/stress à l’aide de la tomodensitométrie par émission de photons uniques.

Acquisition d’ensembles de données et d’images

Au total, 395 patients suspects de maladie coronarienne ayant suivi le protocole stress-repos MPI SPECT de 2 jours ont été inscrits dans cette étude. Toutes les données ont été anonymisées et utilisées sans aucune intervention sur le diagnostic, le traitement ou la prise en charge des patients. L’étude a été approuvée par le comité d’examen institutionnel (IRB) de l’Université des sciences médicales Shahid Beheshti (code IRB : IR.SBMU.MSP.REC.1399.368). Le consentement éclairé a été annulé pour tous les sujets par le même IRB indiqué ci-dessus. Toutes les méthodes ont été réalisées conformément aux directives et réglementations en vigueur. Pour imiter un scénario clinique réel, nous n’avons appliqué aucun critère d’inclusion/exclusion conditionnelle à l’ensemble de données. Cependant, il convient de mentionner que l’ensemble de données recruté n’incluait pas les patients souffrant d’un infarctus du myocarde.

L’imagerie SPECT a été réalisée pour tous les patients bénéficiant d’un protocole de perfusion myocardique de repos et d’effort de 2 jours. Des images de perfusion myocardique au repos et au stress (induit par l’exercice, le dipyridamole ou la dobutamine) ont été incluses dans cette étude. En moyenne, 555 à 925 MBq de 99mTc-MIBI a été administré par voie intraveineuse à des patients sur la base des directives publiées37, 38. Pour le protocole d’effort physique, le produit radiopharmaceutique a été injecté lorsque la fréquence cardiaque du patient a atteint 85 % de sa valeur maximale. Les tests d’effort ont été poursuivis pendant au moins 1 minute après l’injection du produit radiopharmaceutique afin de maintenir une demande cardiaque maximale constante en oxygène. Pour l’épreuve d’effort pharmacologique, le dipyridamole a été injecté à la dose de 0,56 mg/kg pendant 4 min (ou la dobutamine à la dose de 5 à 10 µg par kilogramme toutes les 3 à 5 min), suivi de l’injection du radiopharmaceutique au bout de trois minutes.39. L’acquisition d’images a été réalisée 15 à 20 et 60 minutes après l’injection pour les tests d’effort et d’effort pharmacologique, respectivement.40.

Les images ont été acquises sur un système d’imagerie gamma-caméra à tête unique (Intermedical-MULTICAM 1000, Allemagne) utilisant 32 projections sur un arc de 180 ° allant de l’oblique antérieur droit à l’oblique postérieur gauche, par incréments de 30 s pour chaque projection, avec une taille de matrice de 64 × 64 et dimension de pixel de 5,357 × 5,357 mm2. L’imagerie de stress en décubitus dorsal a commencé 15 à 60 minutes après le stress.

Définition de la vérité terrain

Deux médecins en médecine nucléaire ont examiné les MPI SPECT, les informations cliniques supplémentaires et les antécédents des patients, et ont classé les patients comme normaux ou diagnostiqués avec une coronaropathie. De plus, les patients coronariens positifs ont été classés en groupes à risque faible, intermédiaire et élevé. La vérité terrain a été établie sur la base d’un consensus entre deux médecins et, dans les cas où il n’y avait pas d’accord, un médecin spécialiste en médecine nucléaire a pris la décision finale. Les informations cliniques des patients comprenaient des MPI SPECT antérieurs, la tension artérielle, les résultats de l’échocardiographie, les résultats de l’ECG et des tests d’effort, l’hyperlipidémie, l’indice de masse corporelle (IMC) et l’état du diabète sucré. Il est à noter que le médecin avait accès aux scores SPECT quantitatifs traditionnels, tels que le stress total (SSS), le repos (SRS) et les scores de différence (SDS), etc., ainsi qu’aux informations sur le mouvement et l’épaississement des parois provenant des ensembles de données fermées et du projections SPECT brutes.

L’ensemble de données comprenait 78 patients normaux et 317 patients coronariens, dont 135 patients à faible risque, 127 patients intermédiaires et 55 patients à haut risque. Les informations démographiques des patients sont résumées dans le tableau 1.

Tableau 1 Caractéristiques cliniques des patients stratifiés selon le risque de maladies artérielles cardiaques. Les deux dernières colonnes montrent le p valeurs entre les classes définies pour la tâche 1 (pas de CAD vs CAD positif) et 2 (patients à faible risque vs patients à haut risque).

Segmentation d’images

Le myocarde du ventricule gauche, à l’exclusion de la cavité cardiaque, a été segmenté manuellement à l’aide du logiciel 3D-slicer.41 par un technologue en médecine nucléaire ayant plus de dix ans d’expérience et édité/vérifié par un médecin en médecine nucléaire expérimenté.

Extraction de caractéristiques

La normalisation de l’Initiative sur les biomarqueurs d’images (IBSI)42 suggère d’interpoler les images avec des tailles de voxel isotropes pour obtenir une rotation invariante également afin de normaliser la taille des voxels des images. Cependant, dans notre ensemble de données, tous les scans avaient déjà un espacement isotrope des voxels de 5,357 × 5,357 × 5,357 mm.3. Nous les avons donc conservés intacts pour éviter toute manipulation ultérieure des intensités. De plus, les niveaux d’intensité à l’intérieur du VOI ont été discrétisés à des niveaux de 64 Gy pour faciliter le calcul des caractéristiques de texture. Les caractéristiques radiomiques ont été calculées à l’aide d’un environnement standardisé pour l’analyse radiomique (SERA)43, un package basé sur MATLAB conforme à la directive IBSI. Dans le but de valider la reproductibilité, ce package a été évalué dans des études de standardisation multicentriques44. Un total de 118 caractéristiques, dont 13 histogrammes d’intensité basés sur l’intensité (ih), 3 histogrammes de volume d’intensité (ivh) et 90 caractéristiques de texture 3D (matrice de cooccurrence au niveau de 25 Gy (GLCM), analyse au niveau de 16 Gy matrice de longueur (GLRLM), matrice de zone de taille à 16 Gy (GLSZM), matrice de zone de distance à 12 Gy (GLDZM), matrice de différence de tons de gris à 5 voisinages (NGTDM) et matrice de dépendance à 16 niveaux de gris de voisinage (NGLDM) ) ont été extraits pour chaque VOI. Valeur absolue Les caractéristiques statistiques de premier ordre (min, max, moyenne, etc.) ont été considérées comme non pertinentes car les images MPI SPECT n’étaient pas quantitatives.36. Les caractéristiques morphologiques n’étaient pas non plus pertinentes puisque le VOI concernait l’ensemble du myocarde du ventricule gauche. La famille, les noms et les abréviations des caractéristiques extraites sont répertoriés dans le tableau supplémentaire S1.

Établissement du modèle

Dans cette section, nous introduisons différents anneaux dans la chaîne du cadre de diagnostic automatisé proposé, y compris l’établissement de tâches de diagnostic et d’ensembles de fonctionnalités, la sélection de fonctionnalités, les classificateurs et le processus d’évaluation des modèles.

Etablissement des tâches de diagnostic

Deux tâches de diagnostic ont été définies dans cette étude pour les modèles.

(1) La première tâche est le diagnostic de coronaropathie, y compris la classification des patients en coronaropathie négative et positive (classification normale/anormale).

(2) La deuxième tâche est le diagnostic du risque, y compris la classification des patients en patients à faible risque (MC négatif et faible risque) et à haut risque (risque intermédiaire et élevé). Le tableau 2 répertorie les tâches et leurs descriptions.

Tableau 2 Tâches de classification définies pour les modèles et répartition des patients dans les classes pour chaque tâche.

Établissement d’un ensemble de fonctionnalités

Des ensembles de caractéristiques radiomiques de repos, de stress, delta et combinées (combinaison de toutes) ont été ajoutés aux caractéristiques cliniques, notamment l’âge, le sexe, les antécédents familiaux, le statut de diabète, le statut de tabagisme et la fraction d’éjection (calculée à partir d’images SPECT) pour être intégrés dans différents modèles pour diagnostiquer les tâches 1 et 2.

Sélection de fonctionnalité

Les données ont été divisées au hasard en 80 % et 20 % pour les partitions de formation et de test. Dans tous les modèles, les caractéristiques extraites de l’ensemble de données d’entraînement ont été normalisées à l’aide du score Z, et la moyenne et l’écart type obtenus ont été appliqués à la caractéristique correspondante extraite de l’ensemble de données de test. De nombreuses caractéristiques extraites peuvent ne pas être corrélées aux résultats étudiés (caractéristiques non pertinentes) ou peuvent être fortement corrélées les unes aux autres (caractéristiques redondantes). Ces fonctionnalités ne fournissent pas de nouvelles informations et doivent donc être exclues. Nous avons utilisé trois méthodes FS différentes, dont une basée sur un filtre : Maximum Relevance Minimum Redundancy (mRMR)45et deux basés sur un wrapper : Boruta46 et élimination de fonctionnalités récursives47 avec Random Forest comme machine principale (RF-RFE). Étant donné que l’ensemble de données utilisé pour la tâche 1 était déséquilibré (78 patients normaux et 317 patients anormaux), une fois les caractéristiques sélectionnées, nous avons appliqué la technique de suréchantillonnage des minorités synthétiques (SMOTE) aux données d’entraînement avec les caractéristiques sélectionnées pour corriger les biais plausibles.48.

Classification

La classification des patients a été réalisée à l’aide de neuf méthodes d’apprentissage automatique différentes, à savoir l’arbre de décision (DT), le gradient boosting (GB), le K-Nearest Neighbor (KNN), la régression logistique (LR), le perceptron multicouche (MLP), Naïve Bayes. (NB), Random Forest (RF), Algorithmes de Support Vector Machine (SVM) et eXtreme Gradient Boosting (XGB). Les hyperparamètres ont été optimisés lors d’une quintuple validation croisée dans les données d’entraînement par recherche aléatoire de modèles avec plus de 100 paramètres différents (XGB et Random Forest) et recherche par grille de modèles avec moins de 100 paramètres différents. Par la suite, les paramètres optimaux ont été appliqués aux données de test avec 1 000 bootstraps. Les hyperparamètres de chaque classificateur et la plage de leurs valeurs sont présentés dans le tableau 3. Tous les modèles FS et ML ont été sélectionnés en fonction de leur disponibilité publique afin d’augmenter la reproductibilité de l’étude.

Tableau 3 Hyperparamètres des classificateurs et leurs plages utilisées.

Évaluation des performances

Les mesures de l’aire sous la courbe ROC (AUC), de la précision (ACC), de la sensibilité (SEN) et de la spécificité (SPE) ont été utilisées pour évaluer les performances des modèles. De plus, les performances des meilleurs modèles ont été comparées statistiquement à l’aide du test de DeLong (seuil de signification < 0,05). Toutes les analyses ont été effectuées à l'aide de R 4.0 (bibliothèque mlr version 2.18).

2023-09-10 12:31:57
1694343694


#Diagnostic #basé #sur #lapprentissage #automatique #classification #risque #maladie #coronarienne #laide #limagerie #perfusion #myocardique #SPECTune #étude #radiomique

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.