POK 2 : data visualisation sur des projets

Tags :
  • POK
  • 2024-2025
  • temps 2
  • data visualisation
  • looker studio
  • power BI
  • power query
Auteurs :
  • Clarisse Francese

Je compte apprendre l'art de la data visualisation à travers plusieurs projets et en utilisant les logiciels Looker Studio et Power BI. Le projet 1 sera de créer un visuel avec les statistiques de vente de carte postale pour ma grande soeur illustratrice et notamment une carte de la France avec ses boutiques. Le projet 2 consistera à créer un visuel avec des statistiques sur mes voyages en Europe. Le projet 3 sera une carte des préfectures de France déjà visitées.

POK débutant : aucun prérequi

📌Tâches

Sprints et horodatage

🏃‍➡️Sprints

Objectif général : apprendre l'art de la data visualisation et plus précisement maitriser les logiciels Looker Studio et Power BI.

Sprint 1

  • [x] mieux comprendre ce qu'est la data visualisation et les bons principes : 1h30 (1h)
  • [x] suivre un tuto sur looker studio et explorer le logiciel : 1h30 (1h30)
  • [x] lister les données que je veux mettre en forme pour ma soeur, réfléchir au visuel : 30 min (20 min)
  • [x] préparer les tableaux avec les données qui seront représentés : 45 min (30 min)
  • [x] mettre en forme visuelle les données du tableau : 1h30 (1h50)
  • [ ] envoyer le résultat à ma soeur et lui expliquer comment bien se l'approprier : 15 min
  • [x] téléchargement et prise en main Excel + Power BI : pas prévu (2h)
  • [x] projet tableau de bord pour ma soeur sur Power BI : pas prévu (2h)
  • [x] finalisation rédaction POK : pas prévu (0h50)
  • [ ] faire un tableau de bord de mes voyages : 4h

Total d'heures sprint 1 : 10h
Etude post mortem : j'ai clairement sous estimé la phase de planification de ce premier sprint car j'ai énormément changé ma to do list en cours de route. Je ne pensais pas que Looker Studio serait aussi peu pratique et donc que j'allais aller aussi vite sur Power BI. Je me suis aussi retrouvé à devoir beaucoup travailler lundi 18/11 et ce n'était pas forcément très efficace d'enchaîner autant d'heures.

Sprint 2

  • [x] réfléchir aux indicateurs que je veux pour le tableau de bord de mes voyages : 1h (30 min)
  • [x] créer une base de données adéquate de mes voyages sur Excel : 2h (1h45)
  • [x] utiliser Power BI pour créer le tableau de bord souhaité et rédiger sur Github : 3h (2h15)
  • [x] trouver un autre petit projet à réaliser (les préfectures) et le faire : 4h (3h30)
  • [x] progresser en Excel et en powerpoint : pas prévu (2h)

Total d'heures sprint 2 : 10h
Etude post mortem : j'ai fini plus vite que ce que je pensais la prise en main de PowerBI donc j'en ai profité pour améliorer mes compétences sur la suite Microsoft que j'ai téléchargé pour ce POK.

⌛Horodatage

Date Heures passées Indications
Sprint 1
Mardi 12/11 1h Compréhension de ce qu'est la Data visualisation
Mercredi 13/11 0h30 Début tuto logiciel Looker Studio
Vendredi 15/11 1h40 Suite tuto logiciel Looker Studio et début du travail sur le tableau pour ma soeur
Lundi 18/11 2h Fin du travail sur Looker Studio, critique et recherche de solution
Lundi 18/11 2h Téléchargement Excel et tuto + téléchargement Power BI
Lundi 18/11 2h Projet tableau de bord pour ma soeur sur Power BI
Lundi 18/11 0h50 Finalisation rédaction POK
Sprint 2
Samedi 23/11 3h30 Réflexion indicateur tableau, création tableau et création rapport Power BI
Dimanche 24/11 1h Fin Power BI voyages et rédaction Github
Dimanche 24/11 3h30 Excel et Power BI préfectures et rédaction Github
Dimanche 15/12 2h Excel et Microsoft

Sommaire

1️⃣POK : sprint 1

📖Ressources déjà existantes

J'ai d'abord regardé différents MON qui traitent de la data visualisation.

J'ai aussi regardé de mon côté des ressourcespour mieux comprendre la Dataviz. Concrètement, celà consiste à transformer des données brutes en représentations visuelles souvent interactives. Ce format permet une meilleure compréhension des données et donc une prise de décision simplifiée.

👨‍🏫Tuto Looker Studio

J'ai suivi la vidéo youtube recommandée par Sarah, ce qui m'a permis de travailler sur le tableau de données assez indigeste ci-dessous.

Image description

Et d'utiliser Looker Studio pour transformer ces données en le tableau de bord ci-dessous. On voit que tout est dynamique et donc on peut passer du tableau original à gauche à un tableau où on étudie les chiffres plus en détail à droite (ici j'ai sélectionné le pays Italy et décoché la case tapis).

Image 2 Image 3

👩‍🎨 Projet 1 : tableau de bord des ventes de ma soeur artiste

Liste des données à faire apparaître dans ce tableau de bord :

Maintenant, il y a plus qu'à !

J'ai d'abord récupéré le tableau de suivi de ses factures disponible en version lecteur ici. Puis, j'ai commencé à créer le tableau de bord. Pour répondre aux contraintes de Looker Studio, j'ai modifié un peu les tableaux de ma soeur. Notamment, j'ai changé les titres des colonnes pour faciliter l'accès aux données. J'ai obtenu le résultat ci-dessous :

Image description

Comme vous pouvez le voir, le résultat n'est pas celui que j'avais en tête car j'ai constaté les limites de Looker Studio et les problèmes du tableau de ma soeur.

  1. Tout d'abord, je n'avais pas de moyen simple de récupérer les informations sur la quantité de cartes postales, affiches fable et affiches maison vendues. En effet, contrairement à l'exemple du tutoriel où 1 ligne correspond à 1 vente et donc à 1 produit, ma soeur utilise un système où 1 ligne correspond à une facture d'1 librairie mais avec plusieurs produits (voir le screen ci-dessous). Ainsi, le CA indiqué pour cette vente correspond à la somme des CA pour les différents produits et je ne peux donc pas accéder au CA précis pour chaque produit. De plus, vu que les types de produits sont dans des colonnes différentes et non dans une même colonne, je ne peux pas faire facilement de somme sur les types de produit et obtenir des graphiques par quantité de produits.
Image description
  1. Ensuite, la carte de France avec des ronds proportionnels au CA de chaque ville est assez décevante. Elle bug, impossible de faire un zoom intermédiaire sinon les ronds disparaissent et je ne peux pas afficher le CA dans le rond. D'ailleurs, le graphique nommé "graphique géographique" ne fonctionne même pas car ma liste de ville ne correspond pas à une liste de pays et l'option villes n'existe que pour les Etats-Unis. Bref, les graphiques géographiques sont décevants.
  2. Enfin, le niveau de personnalisation esthétique est faible. Je ne peux pas modifier les titres tels que "record count" ou "null" au lieu de "0" dans certains tableaux ce qui les rend peu intuitifs.

Ainsi, j'ai été plutôt décue des fonctionnalités sur Looker Studio et je compte donc regarder directement le logiciel PowerBI proposé par Microsoft pour comparer.

📈Power BI

Contrairement à Looker Studio proposé par Google, Power BI est un logiciel proposé par Microsoft. Or je ne possède pas la suite Microsoft car elle est payante et Centrale n'a visiblement pas trouvé le budget de nous l'offrir... Ainsi j'ai trouvé un moyen de télécharger une version de Microsoft beaucoup moins chère que l'abonnement officiel en commandant une clé d'activation. Je peux attester personnellement que ce lien fonctionne, car j'ai enfin Excel, Word et Power Point sur mon ordinateur !

Après quelques recherches, je conclus d'essayer la version gratuite de Power BI Desktop pour ce travail. En effet, la version gratuite permet de créer de bons visuels, par contre on ne peut pas les partager avec d'autres utilisateurs comme dans la version pro. J'ai commencé par visionner cette vidéo youtube que je trouve très claire. Elle résume ce qu'est Power BI et montre les possibilités avec ce logiciel. Ainsi, je vais essayer de recréer le tableau de bord pour le tableau de ma soeur sur Power BI. J'ai ainsi transformé le google sheet en Excel sur mon ordinateur.

J'ai d'abord importé les données sur Power BI Desktop en ouvrant l'Excel de ma soeur. Je remarque directement que la suite Power BI propose automatiquement des tableaux pertinents ("tables sugérés") pour le traitement des données donc il n'y a pas besoin de soi-même refaire autant de mise en forme qu'avec Looker Studio. Dans mon cas, j'ai par exemple choisi le table "MOIS" qui correspondait bien à mon usage.

Image description

Ensuite, j'ai nettoyé mes données avec Power Query (rien besoin de télécharger, Power Query est sugéré automatiquement). Là encore, le logiciel est bien conçu et il est simple de remplacer la valeur "null" par 0 par exemple.

Image description

Puis, j'ai travaillé sur le tableau de bord jusqu'à obtenir ce résultat dont je suis plutôt satisfaite :

Image description

Il s'agit d'un tableau de bord interactif donc on peut cliquer directement sur les graphiques pour voir les données qui nous intéressent. Par exemple, voici 3 tableaux de bords selon si on sélectionne :

Image 1 Image 2
Image 3

Ainsi, je suis largement convaincue par la supériorité de PowerBI version gratuite sur Looker Studio quand on veut juste créer des projets pour soi sans l'intention de les partager à d'autres utilisateur. De plus, Power Bi est aussi plus souvent utilisé que Looker Studio par les entreprises, donc je trouve ça plus pertinent de me former à ce logiciel. Ainsi, je ne vais utiliser que Power BI pour le deuxième sprint.

2️⃣POK : sprint 2

🧳 Projet 2 : tableau de bord de mes voyages en Europe

Choix des indicateurs du tableau de bord

Avant de créer le tableau Excel de mes voyages en Europe, je dois réfléchir à quelles données je veux afficher dans mon tableau de bord pour bien concevoir le tableau. Pour chaque voyage, je vais noter une ligne par pays dans un Excel avec les données suivantes :

Données que je veux dans le tableau de bord :

Et je veux que les interaction entre les éléments pour voir facilement les voyages dans un pays, pendant une année ou selon le contexte soient très simple.

Création de l'Excel et du tableau de bord

J'ai commencé par créer un tableau sur Excel avec les données sur mes voyages :

Image description

Puis j'ai créé le tableau de bord sur Power BI. Le voici sans filtre :

Image description

Et voici ce tableau de bord en sélectionnant l'Allemagne ou les voyages avec mes amis :

Image 1 Image 2

Et voici une vidéo montrant les interactions directement sur le logiciel Power BI :

🏙️ Projet 3 : tableau de bord des préfectures visitées en France

J'avais envie de voir visuellement combien de préfectures en France métropolitaine il me reste à visiter donc j'ai créé un tableau Excel avec la liste des préfectures, la taille de la population et si j'avais déjà visitée la ville ou non.

Image description

Puis j'ai créé ce tableau de bord :

Image description

Et là encore, je peux facilement trier selon le critère de mon choix (ici, les préfectures visitées) :

Image description

On pourrait penser que ce projet a été très rapide, mais en vrai j'ai galéré. Je n'arrivais pas à récupérer le nombre de ville que j'ai visité ou non. J'ai donc utilisé une astuce en transformant les données du tableau avec PowerQuery en créant 2 nouvelles colonnes "Pas encore visitées" et "Déjà visités" obtenues en transformant les "oui" et "non" de la colonne "Visitée".

Image description

Puis j'ai créer 2 nouvelles mesures à l'aide de l'onglet Modéalisation, Mesure Rapide pour calculer les totaux de préfectures visitées et pas encore visitées. Ci-dessous, l'exemple du calcul pour les villes déjà visitées. Il faut bien penser à convertir les données des colonnes en "nombre entier" à l'étape précédente pour que le calcul fonctionne.

Image description

👩‍💻 Progression sur Excel et PowerPoint

Il me restait encore 2h pour ce sprint 2 après avoir fini ces 2 projets. Ayant l'impression d'avoir plutôt bien compris comment utiliser Power BI, j'ai préféré utiliser ce temps pour améliorer mes compétences sur Excel et PowerPoint, 2 logiciels de la suite Microsoft que j'ai téléchargé au cours de ce POK. N'étant pas le sujet principal du POK, je n'ai pas détaillé ici ce que j'ai fait mais pour résumer : j'ai exploré les possibilités qu'offrent ces logiciels et j'ai recopié des modèles trouvés sur Internet.

Comparaisons des logiciels

J'ai comparé les logiciels sur différents critères résumé dans ce tableau ci-dessous : alt text

Ainsi, si on veut des visualisations simples et gratuites, Looker Studio est un excellent choix. Mais pour des besoins professionnels plus poussés avec des données complexes, Power BI est quand même préférable (avec des licences payantes pour le partage).

👍 Conclusion de ce POK 2

Au cours de ces 2 sprints, j'ai bien compris ce qu'est la data visualisation et j'ai appris à maîtriser les logiciels Looker Studio de Google et Power BI de Microsoft. En plus, je me suis bien amusée à créer des statistiques sur mes voyages dans le deuxième sprint. Ainsi, je considère avoir rempli les objectifs que je m'étais fixés initialement et je suis très satisfaite de ce POK !