Des proportions déroutantes | Sciences | LE PAYS

2024-09-27 15:48:05

Les chiffres aléatoires déroutants de la semaine dernière ont donné lieu à des commentaires intéressants de la part de mes aimables lecteurs. A la question : « Pourquoi est-il plus probable que le nombre d’habitants d’une ville commence par 1 plutôt que par 9 ? », répond Jonathan Arnold (vraisemblablement originaire d’un pays anglophone, à en juger par son nom et l’absence d’accents dans votre langue). texte):

« Si l’on pense à la population d’un centre urbain de par exemple 800 ou 900 habitants, il faudra augmenter la population de 100 à 200 habitants pour atteindre le chiffre de 1 000 habitants, un chiffre qui commence par un 1. A partir de là, il faudra augmenter la population de 1 000 habitants pour que le premier chiffre aille de na n+1″.

Et Xoaquín Fernández ajoute :

« Si nous appliquons la loi de Zipf par segments de population (de 10 000 à 99 999 ; de 100 000 à 999 999…), nous pourrions bien expliquer le résultat. Pour chaque section, le nombre de populations dans le segment initial est plus grand que dans le suivant. Mon explication mettrait l’accent sur les économies d’agglomération fondées sur une répartition initiale plus équilibrée de la population ; Ce serait un processus cumulatif, qui sélectionnerait, parfois par hasard, un point et le renforcerait.

La loi de Zipf a été formulée au milieu du siècle dernier par le linguiste américain George K. Zipf, qui a appliqué l’analyse statistique à l’étude de différentes langues et a découvert que la fréquence d’apparition des mots suit un modèle similaire à celui établi par le loi de Benford-Newcomb (mais c’est un autre article).

De son côté, Adelaida López évoque une anecdote intéressante en rapport avec le sujet abordé :

« Il existe des astuces statistiques simples pour détecter certains types de fraude. Par exemple, Hill (le premier à formaliser mathématiquement la loi de Benford) a proposé à ses élèves l’exercice de devoirs consistant à lancer une pièce de monnaie 200 fois en l’air et à enregistrer quand elle est tombée face et quand elle est arrivée face. Les plus paresseux, et la plupart des tricheurs, n’ont pas pris la peine de lancer la pièce 200 fois et ont écrit au hasard pile et face d’une manière assez uniforme, mais il n’est jamais venu à l’esprit d’aucun d’entre eux d’écrire pile ou face 6 fois de suite. parce que intuitivement ils ne considéraient pas probable que des séries consécutives aussi longues soient données, ce qui est faux quand 200 lancements réels sont effectués. “Grâce à cette décision, Hill a détecté les tricheurs.”

En fait, la probabilité que lancer une pièce 200 fois aboutisse finalement à 6 pile ou 6 pile d’affilée est d’environ 96 % (pouvez-vous la calculer ?), donc une répartition trop uniforme des pile et face était un signe (presque) c’est sûr que j’ai triché.

Compter les mots, les noms, les personnes…

Dans les prochains articles, nous traiterons (ce n’est pas un pluriel majestueux : je raconte, comme d’habitude, avec la collaboration de mes lecteurs avisés) de la loi Zipf susmentionnée (et du principe de Pareto, avec lequel elle est étroitement liée) et, comme un chaleureux -up, je propose l’exercice suivant : choisir n’importe quel texte d’une certaine longueur (un chapitre de livre, une histoire, un long article…), noter le nombre de fois où apparaissent les cinq mots les plus fréquents et tenter d’établir une relation entre ces fréquences. Si l’onomastique vous attire plus que la linguistique, vous pouvez faire de même avec les cinq patronymes les plus fréquents. Ou avec tout autre ensemble qui se prête à classer ses sous-ensembles en fonction du nombre d’éléments, comme la population des villes les plus peuplées d’un pays.



#Des #proportions #déroutantes #Sciences #PAYS
1727485204

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.