Dans une étude récente publiée dans Rapports scientifiquesles chercheurs ont utilisé l’apprentissage profond pour développer un modèle qui prédit les événements critiques chez les individus pédiatriques admis en service général à l’aide de variables simples.
Étude: Développement d’un modèle d’apprentissage profond qui prédit les événements critiques des patients pédiatriques admis en service générals. Crédit d’image : PopTika/Shutterstock.com
Arrière-plan
Un diagnostic précoce des individus dont l’état se détériore est essentiel pour une prise en charge rapide avant des événements critiques comme la réanimation cardio-pulmonaire (RCR). Les enfants sont plus susceptibles de recevoir un traitement avant un arrêt cardiaque. Les outils existants sont longs et complexes, ce qui les rend impraticables.
Le score d’alerte précoce pédiatrique (PEWS) a une faible capacité prédictive. L’apprentissage profond est utilisé pour développer des modèles de prédiction des crises médicales ; cependant, la plupart des recherches se sont concentrées sur les adultes.
Une étude a utilisé 29 critères pour déterminer la probabilité de transmission en USI, ce qui peut s’avérer irréaliste. Un autre a créé un modèle LSTM nécessitant plus de 20 mesures de signes vitaux.
À propos de l’étude
Dans l’étude observationnelle transversale rétrospective actuelle, les chercheurs ont développé un modèle d’apprentissage automatique pour prédire les événements cruciaux chez les patients pédiatriques admis dans les services généraux en fonction de caractéristiques telles que les signes vitaux, l’âge, le sexe et l’intervalle de mesure.
L’équipe a mené l’étude de janvier 2020 à décembre 2022, incluant des patients âgés de <18 ans hospitalisés admis dans le service général d'un hôpital pédiatrique tertiaire.
Ils ont caractérisé les événements critiques comme une RCR dans les services généraux, un transfert imprévu vers des unités de soins intensifs (USI) ou un décès.
Ils ont formé un modèle de prédiction des événements critiques à l’aide des signes vitaux collectés pendant l’hospitalisation, en utilisant les intervalles de mesure des participants, leur âge et leur sexe pour normaliser la variabilité normale selon l’âge.
Les chercheurs ont séparé l’ensemble de données prétraitées en ensembles de données de formation (80 %) et de test (20 %), l’apprentissage en profondeur étant effectué à l’aide de simples réseaux de neurones artificiels (ANN). Ils ont examiné les indicateurs vitaux en combinant des codes d’identification pseudonymisés et des dates d’hospitalisation pour générer des codes d’identification d’hospitalisation uniques (IHID).
Ils ont trié les durées de mesure des signes vitaux par ordre croissant et ont estimé l’intervalle entre les mesures des signes vitaux au sein de l’IHID.
Les chercheurs ont identifié les enregistrements critiques comme étant des données collectées six heures avant un événement, comme un transfert à l’unité de soins intensifs ou un décès, et six heures avant un événement de RCP, comme une mortalité après une réanimation cardio-pulmonaire.
Ils ont divisé les enregistrements en catégories non critiques et critiques, en éliminant ceux non critiques contenant des événements cruciaux et en effectuant un apprentissage approfondi sur les derniers enregistrements documentés pour l’IHID dans des groupes non critiques.
Les chercheurs ont mesuré la capacité de prédiction du modèle à l’aide de deux mesures essentielles : l’aire sous la courbe caractéristique de fonctionnement du récepteur (AUROC) et l’aire sous la courbe précision-rappel (AUPRC).
Les critères d’évaluation secondaires comprenaient la RCR, un transfert inattendu vers l’unité de soins intensifs et le décès. L’étude a également examiné la pertinence du processus d’estimation pour toutes les caractéristiques utilisées et le lien entre elles.
Résultats
L’étude a inclus 13 787 personnes avec 22 184 hospitalisations et 1 039 070 points de données pour les signes vitaux. L’âge moyen des participants à l’hospitalisation était de 69 mois, avec 43 % des patients étant des femmes.
L’hospitalisation a duré 3,0 jours. Après le filtrage des données, 14 227 enregistrements pertinents sont restés, dont 74 mois et 43 % de femmes.
La catégorie critique représentait 4,40 % des patients, avec 261 cas nécessitant une réanimation cardio-pulmonaire, 238 cas impliquant un transfert non programmé en réanimation et 141 décès. La valeur moyenne d’imputation des données manquantes pour l’intervalle de mesure initial était de 276.
Les performances prédictives du modèle généré étaient exceptionnelles, avec un AUROC de 0,99 et un AUPRC de 0,90.
L’équipe a créé un modèle d’apprentissage profond doté d’une capacité de prédiction exceptionnelle qui utilise des facteurs simples pour prévoir avec précision des événements cruciaux tout en réduisant la charge de travail du personnel médical. Cependant, l’étude était une expérience monocentrique, justifiant des recherches plus approfondies pour une validation externe du modèle.
Les prédicteurs de résultats les plus significatifs étaient l’intervalle de mesure, la SpO2 et le score RR z. La sortie du modèle augmente à mesure que l’intervalle diminue, tandis que l’effet diminue à mesure que l’intervalle augmente. La SpO2 a montré une tendance similaire.
Des scores z plus élevés de fréquence respiratoire et de fréquence cardiaque avaient une plus grande influence sur les résultats, tandis que des valeurs plus faibles de scores z avaient moins d’effet.
L’examen de l’association entre les caractéristiques pour la caractérisation du modèle a révélé que des intervalles de mesure plus étroits entraînaient des valeurs SHAP plus élevées, mais que le score z HR n’était pas significatif.
L’association entre les valeurs de saturation en oxygène (SpO2) et les lectures SHAP était continuellement inverse, la tendance devenant plus marquée avec une diminution des intervalles de mesure.
Conclusion
Dans l’ensemble, les résultats de l’étude mettent en évidence un modèle basé sur l’apprentissage profond qui utilise des données simples telles que les signes vitaux, le sexe, les intervalles de mesure et l’âge pour prédire l’intervention chez les patients pédiatriques défaillants.
Cette méthode réduit la charge de travail du personnel médical en s’appuyant sur un petit nombre de variables plutôt qu’en accumulant des mesures. Le modèle avait des valeurs AUROC et AUPRC de 0,99 et 0,90, respectivement, bien meilleures que les recherches antérieures.
Le modèle a continuellement dépassé 0,96 pour tous les événements cruciaux, mais son AUPRC a diminué en raison d’un manque de formation spécialisée. Le modèle a produit de meilleurs résultats sur toutes les périodes, probablement en raison d’un déséquilibre entre les sous-groupes non critiques et cruciaux et de l’uniformité des données.
2024-02-29 16:15:00
1709213429
#Développement #modèles #basés #sur #lapprentissage #profond #pour #prédire #les #événements #pédiatriques #critiques #dans #les #services #généraux