Une dataviz sur mesure pour explorer les données de la population d’Occitanie

Classé dans : explorateur de données | 0

Une démarche de dataviz répond à des besoins d’explication ou d’exploration de données. Dans le premier cas, la dataviz cherche à communiquer des informations qui répondent à des questionnements précis. C’est le cas des tableaux de bord qui montrent des graphiques qui permettent de mesurer l’atteinte d’objectifs. Dans le deuxième cas,  il n’y a pas de questionnement précis au départ. La dataviz cherche à mettre en forme les données de manière à faciliter la mise en évidence d’informations potentiellement contenues dans le jeu de données, des signaux faibles.
Le jeu de données ouvertes sur la population en Occitanie est un bon exemple pour illustrer cette démarche d’exploration. La visualisation sous forme de pyramide des âges est la représentation la plus habituelle pour montrer la répartition de l’âge des habitants dans un territoire. Même si cette représentation peut être critiquée notamment par la difficulté à comparer les échelles entre les hommes et les femmes, elle est largement utilisée et la plupart d’entre nous avons en tête les formes caractéristiques des pays vieillissants et  de ceux à forte croissance démographique. Lorsque l’analyse est faite sur un territoire ou les  formes des pyramides sont proches, la recherche d’informations pertinentes par comparaison des formes est plus délicate.

La représentation originale sous forme de «cartogrammes de pyramides des âges»  montre que l’on peut faciliter  cette recherche en présentant plusieurs pyramides sur une même planche sans pour antant  produire une représentation complexe.

 

Le principe consiste à placer sur la carte d’Occitanie, la pyramide des âges des 13 départements de la région. La surface des pyramides colorée en vert est proportionnelle au nombre d’habitants. Ainsi la surface de la pyramide de l’Hérault (34) représente 14 fois celle de la surface de la Lozère (48).  Bien plus que la comparaison de chiffres, cette visualisation renforce la perception de ces écarts. En plaçant les pyramides sur une carte de la région, la densité de population peut être appréhendée.

En exprimant les unités des pyramides en part de la population, le profil global de la population de la région peut être superposé pour servir de référence et faciliter la mesure des écarts par rapport à cette référence.

Les pyramides présentées ne contiennent aucune information textuelle pour ne pas perturber le comparatif des formes. La légende est donnée par la pyramide des âges de la population de la région. Le lecteur peut assez facilement retrouver les valeurs  en s’appuyant sur ce graphique.

Sur la planche de la population des départements, les deux plus gros départements de la région que sont l’Hérault (34) et la Haute-Garonne (31) montrent une forte proportion de 18 – 30 ans alors que tous les autres ont un déficit dans cette classe d’âge. Les formes des pyramides cachent néanmoins de fortes variations au sein même de ces territoires départementaux.

La planche de la population des villes montre que ce sont les deux grandes villes de la région, Toulouse et Montpellier, qui attirent cette tranche d’âge. Le département du Lot (46) est celui qui présente le profil le plus particulièrement marqué dans cette tranche d’âge. Le département de la Lozère (48) bien qu’isolé géographiquement et peu peuplé à un profil proche de celui de l’Occitanie dans son ensemble.

Le département de la Lozère (48) montre un déséquilibre hommes/femmes significatif dans la tranche des 40-65ans avec une proportion d’hommes plus élevée. Cela est bien visible bien que l’écart soit de l’ordre de quelques centaines d’individus.

Que ce soit à Toulouse ou Montpellier, les femmes dans la tranche des 20-25ans sont plus nombreuses que les hommes mais leur nombre diminue plus rapidement avec l’âge et le constat s’inverse dans la tranche des 25-30ans.
Les zones d’emploi et de formation que sont les grandes agglomérations attirent la jeunesse mais toutes les villes n’ont pas le même pouvoir attractif. La ville de Perpignan bien que peuplée de plus de 120 000 habitants n’attirent pas cette tranche d’âge alors que des villes plus modestes comme Albi, Rodez ou Tarbes restent attractives. La ville de Tarbes a un profil particulier avec une beaucoup plus d’hommes que de femmes dans la tranche des 20-25ans.

Nous pourrions trouver d’autres indices intéressant à partir de ces deux planches mais cette première analyse rapide montre que la réalisation de compositions de graphiques sur mesure peut faciliter grandement ce travail d’exploration et la détection de signaux faibles.

Quelques informations techniques :

Les données population et contours des départements sont des open data et disponibles sur le site data.gouv.fr.

L’analyse et la visualisation des données population ont a été faites en python avec la librairie matplotlib notamment et l’assemblage sur les planches avec le logiciel illustrator.

Laissez un commentaire