Apprentissage en profondeur pour la prédiction de la détérioration des patients COVID-19 sur la base d’une série chronologique de trois signes vitaux

Apprentissage en profondeur pour la prédiction de la détérioration des patients COVID-19 sur la base d’une série chronologique de trois signes vitaux

2023-06-20 12:22:33

Base de données

Toutes les méthodes ont été réalisées conformément aux directives et réglementations en vigueur. Dans cette étude rétrospective, nous utilisons la base de données « NYU Langone De-identified COVID-1953» recueillies auprès de patients dans les installations de NYU Langone entre janvier 2020 et septembre 2022. La base de données cliniques anonymisée COVID-19 est un ensemble de données anonymisées sur l’activité clinique à NYU Langone Health obtenu auprès d’Epic à partir du 1er janvier 2020. Les données ont ont été dépouillés des identifiants uniques et les dates ont été décalées d’un nombre arbitraire de jours pour chaque patient, ce qui signifie que ces données ne sont pas soumises aux restrictions HIPAA sur l’utilisation de la recherche, et donc l’IRB a été exempté. Plus d’informations peuvent être trouvées ici53.

Pré-traitement des données

Nous définissons les critères d’inclusion et d’exclusion. Premièrement, dans le cas de plusieurs consultations de patients, nous utilisons la consultation la plus récente du patient. Ensuite, nous incluons les patients qui ont été testés positifs pour COVID-19 dans l’établissement ou qui ont déjà reçu un diagnostic de COVID-19 au moment de leur admission. Ensuite, nous incluons les patients hospitalisés avec des mesures de signes vitaux. Les signes vitaux de ces patients, y compris la SpO2, la température et la fréquence cardiaque, sont périodiquement mesurés et enregistrés environ toutes les 4 à 5 h. Pour chaque patient, l’âge, le sexe, le statut et l’heure de la vaccination, ainsi que la présence de comorbidités, notamment l’obésité, le diabète et l’hypertension, sont également enregistrés.

Semblable aux travaux précédents (voir52 et référence), nous définissons la détérioration comme la survenue du résultat composite de la mortalité, de l’admission aux soins intensifs ou de l’intubation, c’est-à-dire l’un des trois événements. Pour les rencontres de patients avec plusieurs événements indésirables, nous ne considérons que la survenue de l’événement de détérioration le plus précoce. Il convient de noter que s’il existe plusieurs détériorations du même type (par exemple, une admission en réanimation) enregistrées pour un patient à plus d’une semaine d’intervalle, nous ne considérons que la plus récente comme moment de référence de la détérioration pour le patient. Pour les patients dont l’état s’était détérioré, nous avons extrait les données des signes vitaux dans les 48 h précédant le moment de la détérioration.

Nous utilisons ces données pour définir des fenêtres “positives” pour chaque horizon de prédiction, où (t=0) représente la fin de la fenêtre et (t=-,24) représente le début de la fenêtre, tel que, par exemple, dans l’horizon de prédiction de 24 h, la détérioration se serait produite à (t=24).

Pour les patients qui n’ont pas connu de détérioration et qui ont reçu leur congé, nous utilisons la fenêtre de 48 h précédant le dernier enregistrement des signes vitaux et utilisons de la même manière celles-ci pour formuler les fenêtres « négatives ». Nous excluons tous les échantillons contenant moins de 48 h de surveillance des signes vitaux, précédant soit le temps de détérioration, soit le temps de décharge.

Pour prétraiter les données de la série chronologique, nous normalisons d’abord les données à l’aide de la normalisation du score Z en fonction de la moyenne et de l’écart type de chaque signe vital. Étant donné que les signes vitaux sont mesurés à intervalles irréguliers, nous rééchantillonnons chaque série chronologique pour obtenir des entrées échantillonnées régulièrement pour les réseaux LSTM et TCN. Ce rééchantillonnage est effectué en interpolant d’abord les données brutes échantillonnées de manière non uniforme par interpolation spline cubique, puis en échantillonnant le signal interpolé toutes les 15 min. Sur la figure 1, nous montrons un schéma résumant le prétraitement des données brutes de séries chronologiques, que nous appelons les données SEQ.

Lire aussi  Un chercheur de l'Institut de virologie de Wuhan affirme que le nouveau coronavirus était une "arme biologique"

Comme pour les données non SEQ, nous encodons le sexe du patient, le statut vaccinal, le statut d’hypertension et le statut d’obésité en binaire (0 ou 1). Pour l’état du diabète, nous utilisons un codage à chaud pour indiquer si un patient n’est pas diabétique ([1, 0, 0]), diabétique sans complications ([0, 1, 0]), ou diabétique avec complications ([0, 0, 1]). Nous avons regroupé l’âge en 18 sous-groupes différents et remplacé chaque âge par le sous-groupe d’âge correspondant (valeur entre 1 et 18). Pour le temps de vaccination, nous comptons le nombre de mois écoulés entre le moment du deuxième vaccin COVID-19 et le jour du moment de la prédiction ((t=0)).

Figure 1

Pipeline de prétraitement des données. Nous encodons les données non-SEQ et pré-traitons les données SEQ : (i) normalisons via la normalisation du score Z, (ii) modélisons la série chronologique à l’aide d’une interpolation spline cubique, (iii) et rééchantillonnons toutes les 15 minutes.

Figure 2
Figure 2

Architecture du réseau neuronal profond basé sur LSTM. Le réseau de signes vitaux SEQ traite les données SEQ via un réseau basé sur LSTM, tandis que le module non-SEQ englobe les données non-SEQ.

figure 3
figure 3

Architecture du réseau neuronal profond basé sur TCN. Le réseau de signes vitaux SEQ traite les données SEQ via une série de blocs TCN résiduels suivis d’une couche FC, tandis que le module non SEQ traite les données non SEQ.

Modèle de prédiction de détérioration basé sur DL

Nous avons choisi de développer et de comparer les performances d’un modèle basé sur LSTM et d’un modèle basé sur TCN, car ces deux architectures de modèles sont couramment utilisées pour modéliser des données de séries chronologiques. Notre architecture de réseau neuronal profond basée sur LSTM proposée se compose de couches TD-LSTM et de couches entièrement connectées (FC). L’architecture globale de ce réseau est illustrée à la Fig. 2, et nous l’appelons le Réseau de signes vitaux séquentiels récurrents (RSVS-Net), composé de deux modules. Les données SEQ sont traitées par un module composé d’un réseau LSTM et d’une seule couche FC, tandis que les données non SEQ sont traitées par un deuxième module composé d’une couche FC indépendante. La prédiction finale est basée sur les deux modalités.

Le réseau basé sur TCN proposé dans cette étude comprend des blocs TCN résiduels et des couches FC. Nous appelons ce modèle Réseau de signes vitaux séquentiels convolutionnels (CSVS-Net). Le module qui traite les données SEQ dans ce réseau se compose d’une série de cinq blocs TCN résiduels avec des dilatations de noyau augmentant de manière exponentielle, et d’une seule couche FC. Le module de traitement de données non SEQ du CSVS-Net est le même que celui de Réseau RSVS. L’architecture de CSVS-Net est illustré à la Fig. 3. Par souci de brièveté, nous nous référons aux blocs TCN résiduels en tant que blocs R dans le reste de cet article.

Lire aussi  types, propriétés et bienfaits pour le corps

Détails de l’architecture RSVS-Net

Les réseaux LSTM sont bien connus pour leur capacité à apprendre des données SEQ et ont été largement utilisés dans des études où les données de séries chronologiques font partie intégrante de l’apprentissage du système et de la prédiction d’événements futurs.55,56. Le module temporel consiste en un LSTM dilaté dans le temps, qui prend trois signes vitaux en entrée à chaque pas de temps, et comporte trois couches, chacune contenant 32 unités cachées. L’état caché final du réseau LSTM, composé d’une dimensionnalité de 32, est traité par une couche FC avec une dimensionnalité de sortie de 16. Les données non SEQ, avec une dimensionnalité de 9, sont traitées par une seule couche FC, qui calcule une sortie de dimensionnalité de 16.

Enfin, les représentations latentes des deux modalités sont concaténées en un vecteur de dimensionnalité de 32 puis traitées par une couche de fusion FC avec une dimensionnalité de sortie de 8. Elle est ensuite suivie d’une seule couche FC avec activation sigmoïde et une dimensionnalité de sortie de un, qui représente la prédiction selon laquelle un échantillon précède la détérioration ou n’est pas dans l’horizon temporel spécifié. Toutes les couches FC utilisent l’activation tangente hyperbolique à l’exception de la dernière couche, qui utilise l’activation sigmoïde. Le Réseau RSVS Le modèle a 22 209 paramètres entraînables.

Détails de l’architecture CSVS-Net

Les modèles TCN ont récemment fait l’objet d’une attention croissante pour l’analyse de données de séries chronologiques49,50,57,58,59. Dans les TCN, la convolution est causale, ce qui signifie que la sortie de convolution au moment t ne s’appuiera que sur le signal au moment t ou plus tôt49. Dans le CSVS-Net, le module de données SEQ comprend cinq blocs R sérialisés. Chaque bloc a deux couches convolutionnelles causales 1D dilatées (DC-Conv). De plus, chaque bloc R a une connexion résiduelle, de sorte que le réseau deviendrait plus efficace pour apprendre les caractéristiques extraites et les modifications appliquées au signal d’entrée par les couches DC-Conv. À la fin de chaque structure de bloc R, la sortie de la dernière couche DC-Conv et l’entrée du bloc R seront additionnées. Par conséquent, ces signaux doivent avoir des dimensions correspondantes. Pour s’assurer que ce critère est satisfait tout au long du modèle, dans le premier bloc R résiduel, un (1 fois 1) une couche convolutionnelle avec une fonction d’activation linéaire est implémentée dans la connexion résiduelle pour faire correspondre la dimension des données d’entrée à la sortie des couches DC-Conv.

Dans CSVS-Net, toutes les couches DC-Conv dans les blocs R ont 28 filtres et utilisent la fonction d’activation de tangente hyperbolique. Par conséquent, la dimension de sortie de chaque bloc R est ((N fois 28)), avec N étant le nombre d’échantillons pour chaque caractéristique dans les signaux de série chronologique des signes vitaux. Pour une période d’observation de 24 h pour chaque caractéristique, puisque nous avons 4 échantillons par heure, la longueur du signal sera (N = 1 + (4 fois 24) = 97). Pour analyser toute la longueur de ce signal, l’architecture du CSVS-Net devrait pouvoir avoir un champ réceptif ((R_{champ})) assez grand pour analyser toute la longueur du signal. Le (R_{champ}) Le paramètre peut être calculé à l’aide de l’équation. (1).

Lire aussi  Les bénéfices de Gilead (GILD) au T1 manquent, la chute des ventes de Veklury - 28 avril 2023

$$begin{aligned} R_{field} = 1 + 2times (K – 1)times sum _{i=1}^B d_i. end{aligné}$$

(1)

Dans l’éq. (1), K représente la taille du filtre, B est le nombre de blocs R dans l’architecture, et (d_i) est la dilatation du noyau utilisée à chaque bloc R. En choisissant (K=3), (B=5)et (d_i = 2^{(i-1)}), nous aurons permis au modèle de gagner un champ réceptif de 125. Il convient de noter que tout autre nombre choisi de blocs R se traduira par un champ réceptif insuffisant ou inutilement grand pour le modèle. Enfin, une couche “slicer” est implémentée à la fin de la chaîne R-block, qui ne traverse que le dernier tableau de la sortie du R-block final. Par conséquent, la dimension de la sortie de la couche de découpage est ((1 fois 28)). Par la suite, cela (1 fois 28) est traité par une couche FC avec une dimensionnalité de 16. Le reste des couches dans le CSVS-Net sont les mêmes que ceux de Réseau RSVS. Le CSVS-Net Le modèle a 22 709 paramètres entraînables.

Stratégie de formation en trois phases

Afin d’optimiser les performances du réseau proposé, la stratégie de formation se compose de trois phases, décrites ci-dessous.

  • La phase 1: Formation du module SEQ Dans la première phase, nous entraînons uniquement le module SEQ et figeons toutes les autres couches. La sortie de la couche FC dans le module SEQ est connectée à une autre couche FC qui calcule la prédiction. Après cette phase de formation, les poids sont utilisés pour pré-initialiser le module SEQ dans la phase suivante, et nous supprimons la deuxième couche FC utilisée pour calculer les prédictions lors de la pré-formation dans la première phase.

  • Phase 2: Formation de la couche de fusion Dans la deuxième phase, on calcule les représentations des données SEQ après avoir initialisé le module associé avec les poids obtenus dans la première phase, puis on fige le module SEQ. Nous formons ensuite la couche FC, la couche de fusion FC et la couche de prédiction de sortie FC en utilisant les données non SEQ.

  • Étape 3 : Réglage fin de bout en bout de RSVS-Net et CSVS-NetDans la dernière phase, nous initialisons les paramètres de l’ensemble du réseau en utilisant les poids obtenus dans les deux premières phases. Le réseau est formé de bout en bout, pour améliorer les performances globales du réseau.

Formation et évaluation de modèles

Pour entraîner et évaluer les modèles, nous divisons l’ensemble de données en ensembles d’entraînement, de validation et de test, avec des pourcentages de (66,6%), (16,6%)et (16,6%), respectivement. Chaque ensemble de données a la même distribution d’échantillons positifs et négatifs. Les résultats de performance finaux sont obtenus en évaluant les modèles entraînés sur l’ensemble de données de test.

Nous formons les modèles en utilisant l’ensemble de formation pour 200 époques en utilisant la stratégie de formation en trois phases. Pour les première et deuxième phases, nous choisissons un taux d’apprentissage de 0,0001 basé sur l’expérimentation initiale et un taux d’apprentissage de 0,00001 pour l’étape finale de mise au point. Pour toutes les phases, nous utilisons l’optimiseur ADAM60 avec (bêta _1 = 0,9), (bêta _2 = 0,999), (epsilon = 10^{-8}). Après un entraînement de 200 époques, le meilleur modèle est sélectionné en fonction de l’époque avec le moins de perte de validation sur toutes les époques. Nous évaluons les modèles sur le jeu de test. Nous utilisons la perte d’entropie croisée focale binaire51 afin de gérer le déséquilibre des classes dans le jeu de données. Nous évaluons les performances des modèles à l’aide de trois métriques largement utilisées pour la classification binaire : la précision (avec un seuil de 0,5 pour convertir la probabilité prédite en binaire), AUROC et l’aire sous la courbe de précision-rappel (AUPRC).



#Apprentissage #profondeur #pour #prédiction #détérioration #des #patients #COVID19 #sur #base #dune #série #chronologique #trois #signes #vitaux
1687263706

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

https://www.sinotrade.com.tw/richclub/MacroExpert/Fed%E9%99%8D%E6%81%AF%E9%A0%90%E6%9C%9F%E5%86%8D%E5% BA%A6%E5%87%BA%E7%8F%BE%E8%AE%8A%E5%8C%96–%E9%99%8D%E6%81%AF2%E7%A2%BC%E6%A9 %9F%E7%8E%87%E5%86%8D%E5%BA%A6%E4%B8%8A%E5%8D%87-%E7%9B%AE%E5%89%8D %E9%99% A4%E4%BA%86%E5%B0%B1%E6%A5%AD%E4%B9%8B%E5%A4%96-%E5%88%B0%E5%BA%95%E9%82%84 %E6%9C%89%E4%BB%80%E9%BA%BC%E8%B6%A8%E5%8B%A2%E6%98%AF%E5%BD%B1%E9% 9F%BFFed%E6 %B1%BA%E7%AD%96%E8%B7%AF%E5%BE%91%E7%9A%84%E9%97%9C%E9%8D%B5—66e7e0e5dd84ce60909f854e

https://www.sinotrade.com.tw/richclub/MacroExpert/Fed%E9%99%8D%E6%81%AF%E9%A0%90%E6%9C%9F%E5%86%8D%E5% BA%A6%E5%87%BA%E7%8F%BE%E8%AE%8A%E5%8C%96-%E9%99%8D%E6%81%AF2%E7%A2%BC%E6%A9 %9F%E7%8E%87%E5%86%8D%E5%BA%A6%E4%B8%8A%E5%8D%87-%E7%9B%AE%E5%89%8D %E9%99% A4%E4%BA%86%E5%B0%B1%E6%A5%AD%E4%B9%8B%E5%A4%96-%E5%88%B0%E5%BA%95%E9%82%84 %E6%9C%89%E4%BB%80%E9%BA%BC%E8%B6%A8%E5%8B%A2%E6%98%AF%E5%BD%B1%E9% 9F%BFFed%E6 %B1%BA%E7%AD%96%E8%B7%AF%E5%BE%91%E7%9A%84%E9%97%9C%E9%8D%B5-66e7e0e5dd84ce60909f854e – Nouvelles Du Monde