Prérequis
Aucun
Durée
2 jours
Contenu Technique de la Formation
La formation aborde les concepts et technologies suivants :
- Introduction au Big Data : enjeux, contexte, cas d’usage
- Différences entre données structurées, semi-structurées et non structurées
- Panorama des architectures modernes :
- Data Warehouse : concepts, limites, évolutions
- Data Lake : stockage massif, formats de fichiers, gouvernance
- Lakehouse : convergence entre Data Lake et Data Warehouse
- Écosystème technologique : Hadoop, Spark, Azure Synapse, Databricks, Snowflake, BigQuery (panorama général)
- Gouvernance et qualité des données dans un environnement Big Data
- Notions d’ETL et ELT dans un contexte moderne
- Premiers pas avec les outils Cloud (Azure, AWS, GCP)
Objectifs de la Formation
À l’issue de cette formation, les participants seront capables de :
- Comprendre les enjeux et concepts du Big Data dans un contexte professionnel
- Distinguer les architectures classiques (Data Warehouse) des architectures modernes (Data Lake, Lakehouse)
- Expliquer les avantages et limites de chaque approche
- Situer les principales technologies du marché et leur rôle dans une architecture moderne
- Identifier les bonnes pratiques de gouvernance et de qualité des données
- Relier les concepts de stockage, transformation et restitution des données dans une architecture globale
Table des Matières
Introduction
- Le phénomène Big Data : volume, variété, vélocité
- Pourquoi les architectures classiques ne suffisent plus
Les architectures de données
- Data Warehouse : concepts, force, limites
- Data Lake : stockage brut, organisation, gouvernance
- Lakehouse : principe, avantages et cas d’usage
Panorama technologique
- Hadoop et Spark
- Plateformes Cloud (AWS, Azure, GCP)
- Solutions modernes : Databricks, Snowflake, BigQuery
Gouvernance et qualité des données
- Métadonnées et catalogues
- Règles de conformité (RGPD, sécurité, droits d’accès)
Intégration et exploitation
- Différences entre ETL et ELT
- Cas concrets d’analytique moderne
En Pratique
- Les exercices proposés visent à illustrer les concepts à travers des mises en situation :
- Identifier les différents types de données (structurées, semi-structurées, non structurées) dans des exemples concrets.
- Construire un schéma simplifié de Data Warehouse, Data Lake et Lakehouse à partir d’un cas pratique (entreprise de e-commerce).
- Étude de cas guidée : comparer deux scénarios d’architecture (Warehouse vs Lakehouse).
- Atelier collectif : définir une architecture cible pour une entreprise fictive (banque, retail ou industrie).
- Mini-démo (selon outils disponibles) : exploration d’un jeu de données via un outil moderne (Azure Synapse, Databricks, Snowflake).
Modalités et Inscription
Cette formation est proposée selon deux formules pour s'adapter au mieux à vos besoins :
Session régulière
Des sessions sont organisées à intervalles réguliers. Demandez les prochaines dates planifiées pour vous inscrire à la prochaine session.
Sur mesure & intra-entreprise
Vous souhaitez former vos équipes directement dans vos locaux ou adapter le programme technique à votre contexte d'entreprise ? Contactez-nous pour obtenir un devis personnalisé.