Se rendre au contenu

Principes de Modélisation des Données

Data > Fondamentaux Data


Une formation de 2 jours pour comprendre les principes de modélisation des données modernes : Data Lake, Data Warehouse, Lakehouse, gouvernance et qualité des données dans le cloud.

La formation en 6 mots clés

Modélisation des données

Data Lake

Lakehouse

Gouvernance

Cloud

Data Warehouse

Informations Pratiques et Programme

Prérequis


Aucun

Durée


2 jours

Contenu Technique de la Formation


La formation aborde les concepts et technologies suivants :

  • Introduction au Big Data : enjeux, contexte, cas d’usage
  • Différences entre données structurées, semi-structurées et non structurées
  • Panorama des architectures modernes :
  • Data Warehouse : concepts, limites, évolutions
  • Data Lake : stockage massif, formats de fichiers, gouvernance
  • Lakehouse : convergence entre Data Lake et Data Warehouse
  • Écosystème technologique : Hadoop, Spark, Azure Synapse, Databricks, Snowflake, BigQuery (panorama général)
  • Gouvernance et qualité des données dans un environnement Big Data
  • Notions d’ETL et ELT dans un contexte moderne
  • Premiers pas avec les outils Cloud (Azure, AWS, GCP)

Objectifs de la Formation


À l’issue de cette formation, les participants seront capables de :

  • Comprendre les enjeux et concepts du Big Data dans un contexte professionnel
  • Distinguer les architectures classiques (Data Warehouse) des architectures modernes (Data Lake, Lakehouse)
  • Expliquer les avantages et limites de chaque approche
  • Situer les principales technologies du marché et leur rôle dans une architecture moderne
  • Identifier les bonnes pratiques de gouvernance et de qualité des données
  • Relier les concepts de stockage, transformation et restitution des données dans une architecture globale

Table des Matières


Introduction

  • Le phénomène Big Data : volume, variété, vélocité
  • Pourquoi les architectures classiques ne suffisent plus


Les architectures de données

  • Data Warehouse : concepts, force, limites
  • Data Lake : stockage brut, organisation, gouvernance
  • Lakehouse : principe, avantages et cas d’usage


Panorama technologique

  • Hadoop et Spark
  • Plateformes Cloud (AWS, Azure, GCP)
  • Solutions modernes : Databricks, Snowflake, BigQuery


Gouvernance et qualité des données

  • Métadonnées et catalogues
  • Règles de conformité (RGPD, sécurité, droits d’accès)


Intégration et exploitation

  • Différences entre ETL et ELT
  • Cas concrets d’analytique moderne


En Pratique


  • Les exercices proposés visent à illustrer les concepts à travers des mises en situation :
  • Identifier les différents types de données (structurées, semi-structurées, non structurées) dans des exemples concrets.
  • Construire un schéma simplifié de Data Warehouse, Data Lake et Lakehouse à partir d’un cas pratique (entreprise de e-commerce).
  • Étude de cas guidée : comparer deux scénarios d’architecture (Warehouse vs Lakehouse).
  • Atelier collectif : définir une architecture cible pour une entreprise fictive (banque, retail ou industrie).
  • Mini-démo (selon outils disponibles) : exploration d’un jeu de données via un outil moderne (Azure Synapse, Databricks, Snowflake).

Modalités et Inscription


Cette formation est proposée selon deux formules pour s'adapter au mieux à vos besoins :


Session régulière

Des sessions sont organisées à intervalles réguliers. Demandez les prochaines dates planifiées pour vous inscrire à la prochaine session.


Sur mesure & intra-entreprise

Vous souhaitez former vos équipes directement dans vos locaux ou adapter le programme technique à votre contexte d'entreprise ? Contactez-nous pour obtenir un devis personnalisé.

Obtenir cette formation

Prêt à maîtriser la modélisation des données modernes ? Rejoignez la prochaine session ou contactez-nous pour organiser cette formation dans vos locaux.


Devis sur-mesure

S'inscrire à cette formation

Remplissez le formulaire pour obtenir plus d'informations.