203 private links
« Quand on étudie un ensemble de données numériques, on pourrait s'attendre à voir les chiffres de 1 à 9 apparaître à peu près aussi fréquemment comme premier chiffre d'un nombre, soit avec une fréquence de 11,1% = 1/9 pour chacun. Or, contrairement à cette intuition (biais d'équiprobabilité), pour près du tiers des observations, le 1er chiffre significatif le plus fréquent est 1. Le chiffre 2 est ensuite lui-même plus fréquent que le 3… et la probabilité d'avoir un 9 comme premier chiffre significatif n'est que de 4,6 % . C'est une loi observée aussi bien dans les mathématiques sociales, c'est-à-dire les sciences humaines et sociales, que dans des tables de valeurs numériques comme celles qu'on rencontre en physique, en BTP, en économie (taux de change), ou même dans les numéros de rue de son carnet d'adresses. »
Cela signifie que pour vérifier (empiriquement !) la vraisemblance d'un ensemble de données, il suffit de regarder la répartition des chiffres : si vous avez plus de 8 et 9 que de 1 et 2, c'est peut-être que les données ont été manipulées ou biaisées.