Dans cette étude, nous avons collecté des données de laboratoire auprès de 3 082 femmes enceintes de notre hôpital principal et de 864 femmes enceintes de l’hôpital secondaire de Chengxi. À l’aide de cinq algorithmes, nous avons établi des modèles prédictifs de la sPTB pendant la grossesse, le modèle XGBoost démontrant des performances prédictives globales supérieures à celles des autres modèles. Nous avons identifié l’ALP, l’AFP, l’ALB, la HCT, la TC, la DBP, l’ALT, la PLT, la taille et la SBP comme des facteurs d’influence majeurs de la sPTB.
Dans cette étude, les résultats expérimentaux numériques ont indiqué que parmi les 44 indicateurs évalués, 24 indicateurs, dont ALP, AFP, ALB, HCT et TC, présentaient des différences statistiquement significatives entre les deux groupes. Nous avons en outre effectué une analyse de colinéarité sur ces 24 indicateurs, à l’exclusion de ceux dont les coefficients de corrélation sont supérieurs à 0,9, et établi cinq modèles (Adaboost, XGBoost, RF, LR et GB), parmi lesquels le modèle XGBoost a démontré les performances optimales (AUC = 0,89).
Ces dernières années, avec les progrès rapides de la technologie de l’intelligence artificielle, les algorithmes d’apprentissage automatique ont été largement appliqués dans divers domaines du diagnostic médical. [30, 31]. L’algorithme XGBoost a attiré une attention considérable de la part des chercheurs et a été largement utilisé pour prédire un spectre de maladies, telles que la prédiction et la classification des maladies cardiaques. [32]le développement de modèles de diagnostic du cancer du sein [33]et l’analyse des facteurs associés à la mortalité chez les patients atteints d’un cancer colorectal [34]. L’algorithme XGBoost est une technique avancée d’apprentissage automatique basée sur des arbres de décision améliorés par gradient, réputée pour son efficacité, sa flexibilité et son évolutivité exceptionnelles. En exploitant de nombreux ensembles de données et fonctionnalités, il construit des modèles non linéaires sophistiqués qui capturent efficacement divers facteurs de risque influençant la progression de la maladie et leurs interactions potentielles. Cela fait de XGBoost un outil puissant pour analyser des données à grande échelle et prédire les risques de maladie.
En résumé, la combinaison de paramètres de laboratoire tels que l’ALP, l’AFP et l’ALB avec des techniques avancées d’apprentissage automatique fournit une approche puissante pour prédire la sPTB. Par conséquent, nos résultats plaident en faveur de l’incorporation de l’algorithme XGBoost dans le flux de travail clinique actuel. Nous soulignons cependant qu’elle doit être interprétée en conjonction avec d’autres données cliniques et échographiques de la pratique clinique. Cette approche holistique améliore la précision et la fiabilité du modèle.
Limites
Notre étude a fourni des informations précieuses sur la prédiction de la sPTB, mais elle présente certaines limites. Premièrement, les données utilisées dans l’étude proviennent d’un seul hôpital, ce qui peut affecter la généralisabilité des résultats. Deuxièmement, nous reconnaissons l’importance des résultats de l’échographie, en particulier des mesures de la longueur cervicale, pour évaluer la santé fœtale et le risque d’accouchement prématuré. Cependant, en raison de ressources limitées et de la disponibilité des données, cette étude n’a pas inclus de telles données d’imagerie échographique, ce qui représente une contrainte notable. Pour résoudre ce problème, nous avons mis en œuvre des critères d’inclusion et d’exclusion stricts, des procédures de collecte de données standardisées et des méthodes d’analyse uniformes pour garantir la qualité et la fiabilité de nos résultats de recherche. Nous prévoyons d’étendre notre étude à plusieurs centres à l’avenir en collectant des données auprès de divers hôpitaux, en tenant compte des variations des populations de patients et des pratiques cliniques dans différents contextes de soins de santé. Parallèlement, nous avons l’intention d’enrichir notre modèle avec une gamme plus diversifiée d’informations médicales dans les études futures, améliorant ainsi l’efficacité du modèle.
De plus, étant donné que cette étude repose principalement sur une analyse rétrospective, il existe un risque de biais. Par conséquent, les recherches futures devraient viser à valider nos résultats en augmentant la taille des échantillons et en adoptant des méthodologies de recherche prospectives pour garantir l’applicabilité universelle des résultats. Notre cohorte d’étude est relativement homogène ; ainsi, des études ultérieures devraient être menées dans différentes régions, collectant des données en temps réel et prenant en compte les facteurs de confusion potentiels tels que l’origine ethnique, les antécédents médicaux et le statut socio-économique afin de minimiser le risque de biais et d’évaluer plus précisément les performances des modèles prédictifs.
Au cours de la phase de collecte de données, afin de garantir la cohérence et la comparabilité du groupe témoin normal, nous avons établi une cohorte homogène de patientes ayant des grossesses sans complications en excluant celles présentant des complications telles qu’une anémie, un utérus cicatrisé et un oligohydramnios. Nous reconnaissons que ce critère d’exclusion peut imposer certaines limites à la généralisabilité des résultats de notre étude.
#Développement #validation #dun #algorithme #prédiction #risque #prématurité #spontanée #basé #sur #bioinformatique #maternelle #une #étude #rétrospective #monocentrique #BMC #Grossesse #accouchement