Spatialisation COVID-19 par modèle bayésien empirique à São Paulo, Brésil

Spatialisation COVID-19 par modèle bayésien empirique à São Paulo, Brésil

Zone d’étude

La zone d’étude était la municipalité de Sorocaba dans l’État de Sao Paulo (SP), la région du sud-est du Brésil (Fig. 1). Ayant 450 382 km2, Sorocaba a une population estimée à 679 378 habitants (IBGE, 2020), qui vivent principalement dans les zones urbaines, qui représentent 82,5 % de la municipalité (Mello et al., 2014). Initialement recouverts de forêts atlantiques et de savanes, les vestiges de la commune (environ 5,6 %) sont éparpillés dans ce paysage urbanisé (Mello et al., 2014).

Fig. 1

Localisation de Sorocaba et des municipalités voisines dans l’État de Sao Paulo, Brésil

Sorocaba est important dans la spatialisation des coronavirus car il se trouve près de la métropole de Sao Paulo (environ 100 km), l’un des principaux épicentres de la maladie au Brésil. La proximité a transformé Sorocaba en une “ville dortoir” de la métropole pour certains de ses habitants. Pourtant, Sorocaba et les municipalités voisines (Fig. 1) forment la région métropolitaine de Sorocaba, l’une des plus peuplées de la SP.

Le drainage de la municipalité a environ 6830 km2, appartenant à l’Unité de gestion des ressources en eau de la rivière Sorocaba et Médio Tietê, composée de 34 municipalités de São Paulo. La rivière principale qui traverse la municipalité porte justement le nom de rivière Sorocaba, qui est le principal affluent de la rive gauche de la rivière Tietê (IGC, 2014), qui alimente en eau douce une région peuplée de l’État de Sao Paulo.

Le climat régional est tropical, avec des étés pluvieux et des hivers secs (EMBRAPA, 2020).

Selon l’institut officiel du Brésil nommé “IBGE” (2020), le taux de mortalité infantile dans la municipalité est de 9,71 décès pour mille naissances vivantes, occupant le nombre 313 des 645 municipalités du SP et 3193 des 5570 municipalités du territoire brésilien. Toujours selon l’IBGE, dans l’enquête de 2009, la commune comptait 75 établissements de santé liés au Système Unifié de Santé (IBGE, 2020).

Données statistiques et informations COVID-19

Les informations COVID-19 sur Sorocaba et les municipalités voisines (du 23 janvier au 17 mai 2020) ont été obtenues auprès du Centre de surveillance épidémiologique du Secrétariat de la santé de São Paulo – ESC/SPHS (CVE, 2020).

La région a cumulé 468 (100%) personnes infectées sur la période étudiée, résultant en un taux de prévalence (TP) moyen de 0,00038, ce qui équivaut au rapport entre le nombre de personnes infectées par celles à risque (tableau 1) (CVE, 2020).

Tableau 1 Sorocaba et municipalités voisines (SP, Brésil) : données statistiques et informations COVID-19, du 23 janvier au 17 mai 2020

Ayant la plus grande population de la région pour la période étudiée, Sorocaba a également révélé le plus grand nombre de cas infectés par hectare (ha ; 10 000 m2) (n = 0,0071) avec 68,4 % (n = 320) de personnes infectées et un RP de 0,00047 (Tableau 1 ). Les valeurs de classement les plus basses étaient Itu (10,3 % ; n = 48), Votarantim (7,7 % ; n = 36), Mairinque (3,6 % ; n = 17) et Araçoiaba da Serra (3,2 %) = 15), Porto Feliz (3,2 % ; n = 15), Pirapora Jump (2,6 % ; n = 12), Ipero (0,9 % ; n = 4) et Aluminium (0,2 % ; n = 1).

Spatialisation COVID-19

Le PR de la municipalité (tableau 1) a soutenu l’identification des régions associées à un possible taux de transmission élevé du virus. Nous avons utilisé le taux (PR) pour estimer le nombre de personnes infectées par les secteurs de recensement IBGE (cs) (2010) divisé par la superficie du secteur respectif (Eq. 1). L’IBGE définit le cs comme l’équivalent de l’unité territoriale pour la collecte des opérations de recensement, en respectant les limites communales (Fig. 2a).

$${text{ SI }}left( {{text{ha}}} right){ } = frac{{text{PR x Pop cs}}}{{text{A cs}} }$$

(1)

Figure 2
Figure 2

Données utilisées dans la modélisation pour un SI et b EO, pour la municipalité de Sorocaba (SP, Brésil)

où : SI(ha) est le secteur infecté par ha ; PR est le taux de prévalence ; Pop cs est la population dans le secteur du recensement; A cs est la superficie du secteur de recensement (IBGE, 2020).

De la même manière, nous avons utilisé les données d’occurrence des personnes de plus de 60 ans, par cs (IBGE, 2020) pour évaluer la corrélation entre ce groupe de personnes et le SI (ha), qui a été divisé par la surface du cs respectif, selon l’éq. 2 (Fig. 2b).

$${text{EO}} = frac{{{text{Pop}}.60{text{cs}}}}{{text{A cs}}}$$

(2)

où : EO est l’occurrence des personnes âgées ; Populaire. 60 est la population de plus de 60 ans ; A cs est la superficie du secteur de recensement (IBGE, 2020).

Après avoir utilisé des interpolateurs basés sur un modèle bayésien empirique, nous spatialisons les valeurs résultant de l’application des Eqs. 1 et 2.

La structure bayésienne suppose qu’un modèle probabiliste des données observées a priori (c’est-à-dire SI (ha)) pourrait estimer a posteriori les paramètres inconnus (Chen et al., 2000), c’est-à-dire générer une surface continue, représentant la probabilité d’occurrence de personnes infectées par hectare et présence de personnes âgées.

Ainsi, dans l’environnement du système d’information géographique, le krigeage bayésien empirique a été utilisé comme méthode d’interpolation géostatistique automatisée qui calcule les paramètres (équations 3 et 4) à travers un sous-ensemble de données (équations 1 et 2) et des simulations.

Lors des simulations, la méthode considère l’erreur introduite par l’estimation des paramètres, rendant les résultats plus précis. Ainsi, la méthode de krigeage bayésien utilise la technique du maximum de vraisemblance pour prédire les valeurs de surface inconnues à travers les points échantillonnés, c’est-à-dire les valeurs de Si et EO de la ville de Sorocaba (Krivoruchko, 2012).

Le modèle a été ajusté pour une prédiction empirique de 100 points dans le variogramme exponentiel, avec une distance de recouvrement de 1 unité pour 100 simulations. Le nombre maximum et le nombre minimum de points voisins (c’est-à-dire les municipalités voisines de Sorocaba) pour l’interpolation étaient de 15 et 10, respectivement, couvrant un rayon de 0,0064 unités, ce qui donne les équations. 3 et 4.

$${text{Modèle SI}} = 0,00173 + 0,802*{text{SI}}left( {{text{ha}}} right)$$

(3)

$${text{Modèle EO}} = 0,30852 + 0,779*{text{EO}}$$

(4)

où : le modèle SI est le modèle prédictif pour le secteur infecté par hectare (ha) et le modèle EO est le modèle prédictif pour l’occurrence des personnes âgées.

Nous avons analysé l’ampleur de la prédiction du modèle à travers l’erreur quadratique moyenne (RMSE), qui devrait afficher des valeurs faibles pour indiquer un résultat robuste, garantissant un coefficient de corrélation (R) entre les valeurs empiriques et la prédiction supérieure à 0,70. Pour cela, nous avons comparé les données d’origine avec les valeurs estimées par le modèle, une procédure automatisée dans l’environnement SIG.

Compte tenu de la robustesse de la surface, la carte a été découpée avec les limites de la municipalité de Sorocaba pour connaître la spatialisation COVID-19 pour la zone d’étude.

De la même manière, nous avons vérifié l’EO en utilisant 200 points aléatoires superposés à la surface pour connaître les valeurs ponctuelles.

Le coefficient de corrélation de Pearson supérieur à 0,70 a été utilisé comme référence, avec les données précédemment testées pour la distribution normale. Ce coefficient considère qu’une valeur absolue de 1 indique une relation linéaire parfaite. Une corrélation proche de zéro indique qu’il n’y a pas de relation linéaire entre les variables. Le signe indique un sentiment de corrélation. Une valeur positive indique que les variables augmentent simultanément et que la ligne a une pente ascendante. Une valeur négative indique qu’à mesure qu’une variable augmente, l’autre diminue et la ligne descend.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.