Aller au contenu

A1 - Cadrage & Collecte des Besoins

Compétence C1 : Collecter les besoins en données des directions métiers afin d'avoir une vision structurée de l'ensemble des données du SI et partager la stratégie Data globale.


1. Contexte client

Electio-Analytics est une start-up de conseil stratégique pour campagnes électorales. L'équipe (1 expert politique, 1 business developer, 1 assistante) souhaite un outil de prévision des tendances électorales à moyen terme (1-3 ans).

2. Besoins identifiés

Besoin métier Traduction data Priorité
Prédire les résultats électoraux 2027 Modèle ML régression (% voix par candidat) Haute
Comprendre les facteurs d'influence Feature importance (Random Forest) Haute
Visualiser les résultats par commune Cartes choroplèthes interactives Moyenne
Croiser votes et indicateurs socio-éco Jointures BDD multi-tables Haute

3. Périmètre validé (ADR-005)

Paramètre Décision Justification
Zone Gironde (534 communes) Volume maîtrisable pour un POC 25h
Élections Présidentielles 2017 & 2022 (T1+T2) Scrutins nationaux comparables
Prédiction 2027 Tour 1 Horizon moyen terme (1-3 ans)
Indicateurs Sécurité SSMSI Seule source disponible à la maille communale

4. Sources de données retenues

Source API/Format Volume Licence
geo.api.gouv.fr REST JSON 200 KB Etalab 2.0
data.gouv.fr (élections) JSON + Parquet 151 MB Etalab 2.0
SSMSI (sécurité) CSV gzip 34 MB Etalab 2.0

Source écartée : INSEE emploi (API indisponible lors du dev).

5. Stratégie data globale

flowchart LR
    A["Données publiques\n(3 sources API)"] --> B["Pipeline ETL\n(Python)"]
    B --> C["Entrepôt PostgreSQL\n(17 tables, 3NF)"]
    C --> D["ML + Visualisation\n(Prédictions 2027)"]

Fichiers de référence : - Roadmap : docs/01-project-management/ROADMAP.md - Sources : docs/01-project-management/SOURCES_DONNEES.md - Périmètre : docs/02-architecture/adr/ADR-005-choix-perimetre-geographique.md