lundi 19 mars 2012

Flagrant délit... d'insuffisance cartographique !

Je reviens sur les deux cartes de la semaine dernière.

Je parlais vendredi de cette limite d'une représentation cartographique : la profondeur des tranches n'est pas une chose évidente ! Bien sûr, la légende affiche explicitement les bornes de chacune. Mais prendre la mesure de leurs profondeurs respectives demande un certain effort d'abstraction. Or la facilité de visualisation que propose une carte est précisément l'inverse de cet effort-là, n'est-ce pas ?

Regardons donc aujourd'hui de plus près l'amplitude de ces tranches.

Mais avant cela, quelques mots sur la manière dont les tranches sont constituées. L'idée de départ est de regrouper les départements dans cinq ensembles d'effectifs identiques. Comme il y a 96 départements (de 01 à 95, la Corse en comptant 2), cela fait idéalement quatre groupes de 19 et un groupe de 20. À partir de cette idée de base, j'effectue un ajustement sur les bornes : pour chaque limite entre deux tranches, au lieu de prendre pour borne la médiane des deux valeurs voisines, je prends pour borne un arrondi à deux chiffres significatifs. L'ambition de cet ajustement est de donner une légende lisible ! Mais en conséquence, il peut y avoir des valeurs de la tranche du dessus qui passent dans la tranche du dessous : je tiens évidemment compte de ces passages pour la répartition définitive. (Je reviendrai un jour plus en détail sur ce traitement, dans mon blog Excel.)

Comme on travaille ici sur une population assez nombreuse (plusieurs dizaines d'items) et sur des plages de valeurs assez larges, ces ajustements portent en général sur un nombre réduit d'items : au lieu de 19 ou 20 départements par groupe, j'en ai parfois entre 17 et 23. La différence est faible et le gain de lisibilité sur la légende est grand. Par exemple, la tranche du milieu pour la carte de jeudi dernier est "15 000 - 27 000" au lieu de "14 816 - 26 599". C'est plus lisible.

Revenons à notre question d'amplitude. Le graphe ci-dessous met en parallèle la plage de valeurs de ces deux cartes en alignant leurs minimums et leurs maximums respectifs, et en échelonnant les limites des tranches. Comme je le disais jeudi, la tranche supérieure est de loin la plus large dans les deux cas. Mais dans le second, la tranche inférieure n'est pas négligeable non plus, alors qu'elle est minuscule dans le premier cas. Et globalement, les tranches semblent plus "harmonieuses" dans le second cas que dans le premier.

L'une des conclusions qu'on peut en tirer tient à le différence de "gravité suggérée" par ces données. Le nombre de faits constatés varie certes dans un rapport de 1 à 115 entre la Lozère (2 081) et Paris (238 856). Mais si l'on relative (littéralement) ceci au nombre d'habitants, on n'a jamais qu'un rapport de 1 à 6 entre la Creuse (167 faits pour 1000 habitants) et Paris (encore, hum, avec 1085 faits pour 1000 habitants).

Je tâcherai de trouver d'autres données par département pour les mettre en rapport avec ces chiffres. Je pense au taux d'urbanisation notamment.



source :
données cartographiées mercredi 14 et jeudi 15 mars 2012 sur ce blog.