Projet – Données et Modélisation
Présentation du projet
Mission
Votre mission est de développer une base de données relationnelle complète, exploitable et réaliste permettant au ministère de la Transition Écologique de :
- Centraliser les données des agences,
- Gérer le personnel, les capteurs et les mesures,
- Produire des rapports d’analyse,
- Effectuer des requêtes complexes pour l’aide à la décision.
Étapes du projet
Phase 1 – Analyse et organisation
- Constitution du groupe (3 à 4 étudiants)
- Reformulation du besoin client
- Planification du projet
- Construction d’un WBS / OBS
Phase 2 – Modélisation
- Dictionnaire de données
- Modèle conceptuel de données (MCD en 3e forme normale)
- Modèle logique de données (MLD)
- Modèle physique de données (script SQL)
Phase 3 – Réalisation
- Implémentation de la base dans MySQL Workbench
- Peuplement avec des données réalistes
- Écriture et exécution des requêtes demandées
- Création de comptes utilisateurs et gestion des droits
Données à modéliser
Les données devront respecter la cohérence avec le contexte (régions françaises, dates entre 2017 et 2024, etc.).
Outils recommandés
| Outil | Usage principal | |-------------------------|--------------------------------------------------------| | Looping MCD | Conception du modèle conceptuel (MCD) | | MySQL Workbench | Implémentation graphique du MLD + requêtes SQL | | MySQL Command Line | Peuplement de la base / Requêtes avancées | | Mockaroo / generatedata.com | Génération de données RH réalistes |
Spécifications techniques
Résumés attendus (exemples de requêtes)
- Liste de toutes les agences
- Personnel technique de l’agence de Bordeaux
- Nombre total de capteurs déployés
- Rapports publiés entre 2018 et 2022
- Concentrations de CH4 en mai/juin 2023 pour certaines régions
- Agents responsables des GES industriels (GESI)
- Rapports sur NH3 par date décroissante
- Mois de concentration minimale de PFC par région
- Moyennes des gaz en Ile-de-France en 2020
- Productivité des agents admin de Toulouse
- Rapports associés à un gaz donné (paramétré)
- Régions avec plus de capteurs que d’agents
Modalités de rendu
Livrable 0 (non évalué) – Préparation
- Présentation de l’équipe
- Reformulation du besoin
- Organisation du projet (planning, rôles, WBS/OBS)
📅 Date limite : 1er avril 2025
Livrable 1 – Modélisation
Ce livrable constitue une étape fondamentale du projet. Il vise à vérifier que vous avez bien compris les enjeux liés au besoin exprimé par le client, et que vous êtes capables de le traduire dans une modélisation cohérente et rigoureuse. Il est attendu pour le 05 Mai 2025.
Le rendu se fera sous la forme d’une archive .zip contenant les éléments suivants :
-
Un dictionnaire de données complet, précisant pour chaque information : nom, signification, type, taille et contraintes éventuelles.
-
Un modèle conceptuel de données (MCD), respectant les bonnes pratiques de modélisation (notamment la 3e forme normale). Ce modèle devra refléter avec fidélité les différentes dimensions du besoin.
-
Un modèle logique de données (MLD), accompagné d’explications sur les choix effectués (notamment les clés, les dépendances fonctionnelles, les associations et les cardinalités).
-
Un modèle physique de données, sous forme de script SQL permettant la création des tables avec les types, tailles et contraintes appropriés. Ce script doit être prêt à être exécuté dans un environnement MySQL.
-
Les arbres algébriques correspondant aux requêtes 1 à 6, ainsi qu’à la requête 7 (sans le tri), pour évaluer votre capacité à formaliser les traitements attendus.
-
Une note explicative synthétique sur vos choix de modélisation (organisation des entités, regroupements, généralisations éventuelles, etc.).
L’objectif de ce livrable est de présenter une base structurée, cohérente, sans redondance, et capable de répondre aux attentes du client. Il ne s’agit pas d’une simple étape technique, mais d’un livrable structurant du projet, qui permet de valider vos orientations avant l’implémentation.
Le livrable compressé (.zip) est à déposer sur Moodle au lien suivant : Déposer le livrable 1.
📅 Date limite : 05 Mai 2025
Livrable 2 – Implémentation et requêtes
Ce livrable permet de valider la mise en œuvre complète de votre base de données. Il s’inscrit dans la continuité du travail réalisé dans le livrable 1, qu’il reprend et ajuste si nécessaire. Il constitue également la base de votre démonstration lors de la soutenance finale.
Le rendu se fera sous la forme d’une archive .zip contenant les éléments suivants :
-
Les requêtes SQL correspondant aux résumés attendus. Chaque requête devra être accompagnée d’un commentaire précisant son objectif et, le cas échéant, les choix effectués (jointures, filtrages, agrégations…).
-
Un rapport de réalisation expliquant :
- La stratégie utilisée pour peupler la base de données (outils utilisés, types de données générées, cohérence avec le sujet),
- Les fonctionnalités mises en œuvre et celles qui n’ont pas pu être intégrées,
- Les difficultés rencontrées (techniques, organisationnelles) et les solutions apportées.
-
Les modèles MCD/MLD/MPD éventuellement mis à jour suite à des ajustements réalisés pendant la phase d’implémentation.
-
Le script SQL complet de création de la base de données (mise à jour du script fourni au livrable 1, si besoin).
Ce livrable sera évalué sur la qualité de l’implémentation, la capacité à répondre aux besoins par des requêtes pertinentes, et la rigueur dans la restitution des éléments techniques. Il sert également de support à la soutenance orale.
Le livrable compressé (.zip) est à déposer sur Moodle au lien suivant : Déposer le livrable 2.
📅 Date limite : 14 mai 2025
Soutenance finale
La soutenance marque la dernière étape du projet. Elle sera de type technico-commerciale. Elle a pour objectif de convaincre un jury (incarnant les représentants du ministère et/ou de ClearData) de la pertinence de votre solution.
Elle se compose de deux temps :
-
15 minutes de présentation orale, structurée et synthétique. Vous y présenterez :
- Votre compréhension du besoin,
- Les choix de modélisation retenus,
- Les principales fonctionnalités de votre base,
- Quelques exemples de requêtes mises en œuvre.
-
15 minutes d’échange avec le jury, qui pourra :
- Vous interroger sur certains aspects techniques,
- Vous demander d’exécuter des requêtes non présentées,
- Vous faire réagir à des cas d’usage concrets.
Lors de la soutenance, vous devrez être en mesure de fournir :
- le script SQL de création de la base,
- la base de données finale (sous forme de fichier
.sqlou équivalent), - les requêtes SQL prêtes à être exécutées,
- la capacité à modifier ou ajouter des données en direct.
L’objectif est de valoriser la démarche menée, la rigueur du travail fourni, et la capacité du groupe à s’exprimer de manière professionnelle dans un contexte projet réaliste.
📅 Date : 16 mai 2025
Ressources utiles
- Looping MCD
- SQL optimisation
- Générateur de données fictives – Mockaroo
- SQL fonctions avancées – W3Schools