Ce projet s'inscrit dans le cadre du cours de Data Visualization & Business Intelligence de Cy Tech et Sciences-Po Saint-Germain-En-Laye. Il vise à développer des compétences avancées en visualisation de données.
Ce projet a pour objectifs principaux d’améliorer l’esthétique des graphiques statistiques afin de rendre les données plus lisibles et attractives, de créer des visualisations interactives à l’aide de Plotly et Flourish, et de réaliser des analyses de données géospatiales incluant des cartes interactives et des modèles d’élévation. Il vise également la conception de dashboards de Business Intelligence avec Power BI et la production de rapports professionnels de haute qualité, exploitables pour la prise de décision.
- Langage : R (version 4.0+)
- Bibliothèques principales :
dplyr,tidyr: Manipulation de donnéesggplot2,patchwork: Visualisationvcd,vcdExtra: Analyses catégorielles et mosaic plotscar,broom: Diagnostics de modèlesforestplot: Représentation graphique des odds ratios
- RStudio recommandé pour les utilisateurs R
- Power BI Desktop pour la partie Business Intelligence
git clone https://github.com/naima-beck/data-viz-business-intelligence.git
cd data-viz-business-intelligenceLes données brutes sont disponibles sur Caisses des Dépôts. le nommer : moncompteformation_formations_engagees.csv
Placez le fichier moncompteformation_formations_engagees.csv dans le dossier data/ avant d'exécuter les notebooks.
data-viz-business-intelligence/
├── references/ # Contient l'énoncé du projet
│ └── enonce_projet.pdf
│
├── data/ # Données brutes ou traitées
│ ├── flights/ # Données de trafic aérien
│ ├── phd/ # Dataset des thèses françaises
│ ├── spatial/ # Données géospatiales (EPCI, villes)
│ ├── business/ # Données BI (ventes, marketing, RH)
│ └── shapefiles/ # Fichiers shape pour les cartes
│
├── notebooks/ # Scripts R organisés par thématique
│ ├── 01_import_cleaning.R
│ ├── 02_phd_analysis.R
│ ├── 03_spatial_maps.R
│ ├── 04_ukraine_flights.R
│ ├── 05_business_intelligence.R
│ └── 06_interactive_viz.R
│
├── outputs/ # Résultats et productions
│ ├── plots/ # Graphiques statiques (PNG, PDF)
│ ├── gif/ # Animations et GIFs
│ ├── html/ # Cartes interactives et rapports
│ ├── flourish/ # Visualisations Flourish
│ ├── kepler/ # Cartes Kepler.gl
│ └── powerbi/ # Dashboards Power BI
│
├── img/ # Images utilisées dans les rapports
├── raster/ # Données raster (SRTM, DEM)
│ └── srtmgl5.tif
└── README.mdCette section se concentre sur l’amélioration de l’apparence des graphiques statistiques afin de les rendre plus clairs et attractifs. Elle inclut la création de graphiques empilés, tels que les stacked area et bar plots, la personnalisation typographique avec des choix de polices et de tailles adaptés, ainsi que la gestion des transparences et des palettes de couleurs. L’adaptation des échelles, y compris les échelles logarithmiques, et le positionnement optimisé des légendes font également partie de cette démarche pour maximiser la lisibilité et l’impact visuel des visualisations.
Cette partie du projet porte sur le développement de visualisations interactives permettant une exploration dynamique des données. Elle comprend des graphiques dotés de sliders et de sélecteurs grâce à Plotly, des bar chart races créés avec Flourish pour montrer l’évolution des données dans le temps, ainsi que des cartes interactives utilisant Leaflet ou Folium, offrant aux utilisateurs la possibilité de naviguer et de manipuler les informations géospatiales de manière intuitive.
L’analyse des données géospatiales se concentre notamment sur le trafic aérien entre la Russie et l’Ukraine, avec la création de cartes choroplèthes et l’exploitation de données raster. Cette section inclut également le traitement de modèles numériques d’élévation (SRTM) pour mieux représenter le relief, ainsi que les calculs de distances et les projections CRS adaptées pour assurer la précision et la cohérence des visualisations géospatiales.
La partie Business Intelligence du projet consiste à concevoir des dashboards Power BI détaillés par département, permettant d’analyser des indicateurs clés tels que le churn, le recrutement et les activités marketing. Elle inclut également la création de visualisations avancées intégrant DAX et Python pour enrichir les analyses et produire des rapports professionnels, interactifs et facilement exploitables pour la prise de décision stratégique.
@naima-beck - Cy Tech - Sciences-Po Saint-Germain-En-Laye - [2024/2025]
Ce projet est réalisé dans un cadre académique. Les données sont fournies pour usage pédagogique.
Il est sous licence CC BY-NC-SA 4.0