“Les bâtons et les pierres peuvent me briser les os”, dit le vieil adage. “Mais les mots ne me feront jamais de mal.”
Dites cela à Eugenia Rho, professeur adjoint au Département d’informatique, et elle vous montrera de nombreuses données prouvant le contraire.
Son Society + AI & Language Lab a montré que
- Le langage policier est un indicateur précis des interactions violentes avec les automobilistes noirs.
- Les préjugés des médias audiovisuels et les chambres d’écho des médias sociaux mettent la démocratie américaine en danger.
Maintenant, l’équipe de recherche de Rho au College of Engineering s’est tournée vers une autre question : quels effets la rhétorique des médias sociaux a-t-elle eu sur les taux d’infection et de mortalité du COVID-19 aux États-Unis, et que peuvent en tirer les décideurs politiques et les responsables de la santé publique ?
“De nombreuses études décrivent simplement ce qui se passe en ligne. Souvent, elles ne montrent pas de lien direct avec les comportements hors ligne”, a déclaré Rho. “Mais il existe un moyen concret de relier le comportement en ligne à la prise de décision hors ligne.”
Cause et effet
Pendant la pandémie de COVID-19, les médias sociaux sont devenus un lieu de rassemblement de masse pour l’opposition aux directives de santé publique, telles que le port du masque, la distanciation sociale et les vaccins. La désinformation croissante a encouragé un mépris généralisé à l’égard des mesures préventives et a conduit à une montée en flèche des taux d’infection, à des hôpitaux débordés, à des pénuries de personnel de santé, à des décès évitables et à des pertes économiques.
Au cours d’une période d’un mois entre novembre et décembre 2021, plus de 692 000 hospitalisations évitables ont été signalées parmi les patients non vaccinés, selon une étude de 2022 publiée dans le Yale Journal of Biology and Medicine. Ces hospitalisations coûtent à elles seules la somme faramineuse de 13,8 milliards de dollars.
Dans l’étude, l’équipe de Rho, y compris le Ph.D. Xiaohan Ding, étudiant, a développé une technique qui a entraîné le chatbot GPT-4 à analyser les publications de plusieurs groupes de discussion subreddit interdits qui s’opposaient aux mesures de prévention du COVID-19. L’équipe s’est concentrée sur Reddit car ses données étaient disponibles, a déclaré Rho. De nombreuses autres plateformes de médias sociaux ont interdit aux chercheurs extérieurs d’utiliser leurs données.
Le travail de Rho s’appuie sur un cadre de sciences sociales appelé Fuzzy Trace Theory, lancé par Valerie Reyna, professeur de psychologie à l’Université Cornell et collaboratrice de ce projet de Virginia Tech. Reyna a montré que les individus apprennent et se souviennent mieux des informations lorsqu’elles sont exprimées dans une relation de cause à effet, et pas seulement sous forme d’informations par cœur. Cela reste vrai même si les informations sont inexactes ou si le lien implicite est faible. Reyna appelle cette construction de cause à effet un « résumé ».
Les chercheurs ont travaillé pour répondre à quatre questions fondamentales liées à l’essentiel sur les réseaux sociaux :
- Comment pouvons-nous prédire efficacement l’essentiel du discours sur les réseaux sociaux à l’échelle nationale ?
- Quels types d’idées caractérisent comment et pourquoi les gens s’opposent aux pratiques de santé publique liées au COVID-19, et comment ces idées évoluent-elles au fil du temps au fil des événements clés ?
- Les modèles essentiels prédisent-ils de manière significative les modèles d’engagement en ligne parmi les utilisateurs des subreddits interdits qui s’opposent aux pratiques de santé liées au COVID-19 ?
- Les schémas fondamentaux prédisent-ils de manière significative les tendances des résultats nationaux en matière de santé ?
Le lien manquant
L’équipe de Rho a utilisé des techniques d’invite dans des modèles de langage étendus (LLM) – un type de programme d’intelligence artificielle (IA) – ainsi que des statistiques avancées pour rechercher puis suivre ces éléments essentiels dans les groupes de subreddit interdits. Le modèle les a ensuite comparés aux jalons du COVID-19, tels que les taux d’infection, les hospitalisations, les décès et les annonces de politique publique associées.
Les résultats montrent qu’en effet, les publications sur les réseaux sociaux liant une cause, telle que “J’ai reçu le vaccin contre la COVID”, à un effet, tel que “Depuis, je me sens comme la mort”, sont rapidement apparues dans les croyances des gens et ont affecté leurs décisions de santé hors ligne. En fait, le nombre total et les nouveaux cas quotidiens de COVID-19 aux États-Unis pourraient être prédits de manière significative par le volume des informations essentielles sur les groupes de subreddit interdits.
Il s’agit de la première recherche sur l’IA à relier empiriquement les modèles linguistiques des médias sociaux aux tendances réelles de la santé publique, soulignant le potentiel de ces grands modèles linguistiques pour identifier les modèles de discussion en ligne critiques et pointer vers des stratégies de communication de santé publique plus efficaces.
“Cette étude résout un problème de taille : comment relier les éléments cognitifs du sens que les gens utilisent réellement au flux d’informations à travers les médias sociaux et dans le monde des résultats en matière de santé”, a déclaré Reyna. “Ce cadre LLM basé sur des invites qui identifie l’essentiel à grande échelle a de nombreuses applications potentielles qui peuvent promouvoir une meilleure santé et un meilleur bien-être.”
Big data, grand impact
Rho a déclaré qu’elle espère que cette étude encouragera d’autres chercheurs à utiliser ces méthodes pour répondre à des questions importantes. À cette fin, le code utilisé dans ce projet sera mis à disposition gratuitement lorsque l’article sera publié dans les actes de la conférence de l’Association of Computing Machinery sur les facteurs humains dans les systèmes informatiques. Le document compare également le coût des différentes manières dont les chercheurs peuvent analyser de grands ensembles de données et en tirer des conclusions significatives à moindre coût. L’équipe présentera ses conclusions du 11 au 16 mai à Honolulu, Hawaï.
En dehors du monde universitaire, Rho a déclaré qu’elle espère que ce travail encouragera les plateformes de médias sociaux et d’autres parties prenantes à trouver des alternatives à la suppression ou à l’interdiction des groupes qui discutent de sujets controversés.
“Le simple fait d’interdire complètement les personnes dans les communautés en ligne, en particulier dans les espaces où ils échangent et apprennent déjà des informations sur la santé, peut risquer de les enfoncer plus profondément dans les théories du complot et de les forcer à accéder à des plateformes qui ne modèrent pas du tout le contenu”, a déclaré Rho. “J’espère que cette étude pourra éclairer la manière dont les sociétés de médias sociaux travaillent main dans la main avec les responsables et les organisations de santé publique pour mieux s’engager et comprendre ce qui se passe dans l’esprit du public pendant les crises de santé publique.”
2024-05-13 18:50:14
1715615712
#Une #étude #retrace #une #épidémie #langage #contagieuse