Portrait : je suis la statistique

Bonjour, je m’appelle la Statistique. Fille des sciences mathématiques,  je suis  la science des grands nombres, celle du chiffre, de la donnée, de “la data” (*) comme on dit aujourd’hui. Je m’intéresse à dénombrer les individus d’une population, afin d’en décrire les caractéristiques et d’en dresser le portrait. Ces individus peuvent être des personnes, mais aussi tout autre sorte de choses, des objets allant de l’infiniment petit, des cellules, des atomes, à l’infiniment grand, des planètes, des corps célestes. Je compte, je calcule des indicateurs, je définis des catégories. Toute ma puissance se déploie quand la population comprend un très grand nombre d’individus

Je m’intéresse et je m’applique à tous les domaines de la connaissance. Rien n’échappe à mes capacités d’analyse, même si je m’épanouis plus particulièrement en explorant les populations d’êtres humains. Normal, puisque c’est l’être humain qui m’utilise, car je l’aide dans sa tentative de comprendre le monde dans lequel il vit. Je lui offre toute une palette d’outils mathématiques pour analyser et explorer n’importe quel centre d’intérêt. Ces outils vont du pourcentage et de la plus simple et universelle règle de 3, jusqu’aux modélisations les plus puissantes et sophistiquées.

Comprendre le monde

Seshat était la déesse de l’écriture
dans la mythologie égyptienne.
Les hiéroglyphes gravés dans la pierre
étaient un moyen efficace
de stockage de l’information :
ils ont traversés les siècles jusqu’à nos jours !
Seshat portait une robe en peau
de panthère et une coiffure
surmontée d’une plante à 7 feuilles.
Elle s’intéressait à différents domaines :
histoire, comptabilité, architecture…
Elle prenait note de tout sur ses tablettes,
y compris les données de recensement,
à une époque où la statistique
n’avait pas encore été conceptualisée.

Mon instrument de base est le tableau, avec ses lignes, ses colonnes, ses marges et ses cases, le fameux tableau statistique. Tout le travail consiste à le réduire pour le rendre lisible [NDLR : les dinosaures qui ont appris la stat avec SAS se souviennent encore de leur première “proc summary” !] Tout l’art est de donner du sens à l’information en acceptant d’en perdre. 

Un moyen souvent magique de rendre un tableau plus intelligible est de le traduire de façon visuelle, en construisant une représentation graphique. J’apprécie les histogrammes, les courbes d’évolution, les camemberts et autres diagrammes, qui produisent des images que le cerveau interprète plus directement. Un dessin vaut mieux qu’un grand discours.

Parmi toutes les représentations graphiques, les capacités de traitement des ordinateurs m’ont donné accès à l’une d’entre elles particulièrement puissante : la cartographie thématique. Utiliser la dimension géographique de l’information a ouvert des horizons dans l’utilisation de ma science. Construites intelligemment, les images créées peuvent être de véritables œuvres d’art.

Une insatiable soif d’expliquer

J’existe cependant depuis l’aube de l’humanité, depuis que l’être humain a commencé à compter sans doute. J’ai connu un bond en avant magistral avec l’invention de machines dotées de capacités de calcul de plus en plus énormes, comme si rien ne devait plus pouvoir m’arrêter et mettre de limites à mon insatiable soif d’analyser et d’expliquer. On a même essayé de me rebaptiser “data science”, tout comme de renommer les graphiques en “dataviz”, surtout quand ils deviennent complexes et interactifs. 

Je m’attaque à des volumes de données de plus en plus gigantesque et en même temps de moins en moins structurés, voire même qui s’auto-alimentent, dans une spirale vertigineuse. Cependant, je reste avant tout la Statistique et j’invite celle ou celui qui m’utilise à se montrer modeste. Je ne suis rien d’autre qu’une boîte à outils pour aider à comprendre, sans oublier qu’une compréhension entière et parfaite du monde reste un idéal inaccessible.

* On dit désormais « la data », bien que « data » soit, avant de devenir a very usual english world, le pluriel de « datum », le mot latin signifiant « donnée ».

5 commentaires sur “Portrait : je suis la statistique”

  1. Retour de ping : Divagations à propos du temps - Icem7

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *