Prérequis
Connaissances de base en gestion de données et en développement Notions générales en Git ou systèmes de versioning
Durée
1 jour
Contenu Technique de la Formation
La formation aborde les contenus techniques suivants :
- Principes du CI/CD appliqués aux projets data
- Différences entre CI/CD logiciel et CI/CD data
- Gestion du code, des scripts et des pipelines avec Git et GitHub/GitLab
- Intégration continue : validation, tests de qualité et automatisation
- Déploiement continu : orchestration des pipelines de données et mise en production
- Outils et plateformes courants (Azure DevOps, GitHub Actions, Jenkins)
- Bonnes pratiques de gouvernance et collaboration dans les équipes data
Objectifs de la Formation
Le CI/CD appliqué à la data permet d’améliorer la fiabilité, la rapidité et la reproductibilité des projets analytiques et de data engineering. Cette formation vise à donner les bases pour comprendre et mettre en place un premier pipeline CI/CD adapté aux projets data. Les compétences visées par la formation sont les suivantes :
- Comprendre les concepts de CI/CD et leur application aux projets data
- Utiliser Git pour gérer le code et les pipelines de données
- Mettre en place une intégration continue avec tests de qualité des données
- Automatiser le déploiement de pipelines data en production
- Identifier les outils adaptés (Azure DevOps, GitHub Actions, Jenkins, etc.)
- Appliquer des bonnes pratiques de collaboration et gouvernance
Table des Matières
Introduction
- Définition du CI/CD
- Intérêt et enjeux pour les projets data
Concepts fondamentaux
- Intégration continue (CI) appliquée à la data
- Déploiement continu (CD) pour les pipelines et modèles
Outils et workflow
- Gestion de version avec Git
- Pipelines CI/CD avec Azure DevOps, GitHub Actions, Jenkins
- Tests et validation des données
Mise en production
- Automatisation des déploiements
- Supervision et rollback
- Bonnes pratiques de monitoring
Collaboration et gouvernance
- Organisation des équipes data autour du CI/CD
- Documentation et traçabilité
- Cas pratiques en entreprise
En Pratique
- Les exercices proposés lors de la formation permettent de mettre en œuvre les concepts :
- Création d’un dépôt Git et mise en place d’un premier pipeline simple
- Ajout de tests de validation de données dans un processus CI
- Déploiement automatisé d’un pipeline de données fictif
- Exercice récapitulatif : mini-projet de CI/CD data avec GitHub Actions ou Azure DevOps
Modalités et Inscription
Cette formation est proposée selon deux formules pour s'adapter au mieux à vos besoins :
Session régulière
Des sessions sont organisées à intervalles réguliers. Demandez les prochaines dates planifiées pour vous inscrire à la prochaine session.
Sur mesure & intra-entreprise
Vous souhaitez former vos équipes directement dans vos locaux ou adapter le programme technique à votre contexte d'entreprise ? Contactez-nous pour obtenir un devis personnalisé.