Se rendre au contenu

Introduction au Big Data

Data > Data Engineering, Architecture & Cloud


Une formation d'1 jour pour comprendre les technologies et outils du Big Data : écosystème Hadoop, Apache Spark, Kafka, bases NoSQL, outils d'analyse et gouvernance des données à grande échelle.

La formation en 6 mots clés

Big Data

Hadoop

Kafka

NoSQL

Data Engineering

Apache Spark

Informations Pratiques et Programme

Prérequis


Connaissances de base en Business Intelligence

Durée


1 jour

Contenu Technique de la Formation


La formation aborde les contenus techniques suivants :

  • Introduction au Big Data : concepts et enjeux
  • Écosystème Hadoop : HDFS, MapReduce, YARN
  • Outils de traitement de données en temps réel (Apache Spark, Kafka)
  • Stockage NoSQL (Cassandra, MongoDB)
  • Outils d'analyse de données (Hive, Pig)
  • Introduction à l'apprentissage automatique avec Big Data
  • Gestion, sécurité et gouvernance des données

Objectifs de la Formation


Les objectifs visés par cette formation sont :

  • Comprendre les concepts fondamentaux du Big Data
  • Se familiariser avec l'écosystème Hadoop et ses composants
  • Apprendre à utiliser des outils de traitement de données en temps réel
  • Comprendre les principes et l'utilisation des bases de données NoSQL
  • Acquérir des compétences dans l'analyse de données Big Data
  • Introduction aux concepts de l'apprentissage automatique dans le Big Data
  • Connaître les aspects de gestion, de sécurité et de gouvernance des données

Table des Matières


Introduction au Big Data

  • Définition et importance du Big Data dans le contexte actuel
  • Types de données : structurées, semi-structurées, non structurées
  • Sources de données Big Data et exemples d'applications


Écosystème Hadoop

  • Composants de base : HDFS, MapReduce, YARN
  • Architecture et fonctionnement de Hadoop
  • Installation et configuration d'un cluster Hadoop


Outils de Traitement de Données en Temps Réel

  • Présentation d'Apache Spark et Kafka
  • Traitement des flux de données (streaming data)
  • Exemples d'application et mise en pratique


Stockage NoSQL

  • Présentation des bases de données NoSQL : Cassandra, MongoDB
  • Choix d'une base de données en fonction des besoins
  • Principes de conception et d'utilisation des bases NoSQL


Outils d'Analyse et Apprentissage Automatique

  • Utilisation de Hive et Pig pour l'analyse de données
  • Principes de base de l'apprentissage automatique avec Big Data
  • Outils et bibliothèques (Apache Mahout)


Gestion, Sécurité et Gouvernance des Données

  • Enjeux de la gestion des données Big Data
  • Aspects de sécurité et de confidentialité
  • Politiques et meilleures pratiques de gouvernance des données


En Pratique


  • La formation d’algorithmique de base est fortement orientée sur la pratique. Les participants ont l’occasion de mettre en pratique les différentes notions théoriques enseignées tout au long de la formation.
  • Installation et configuration d'un mini-cluster Hadoop
  • Réalisation de traitements de données avec Spark et Kafka
  • Manipulation de données avec des bases de données NoSQL
  • Analyse de données avec Hive et Pig
  • Exercices d'introduction à l'apprentissage automatique

Modalités et Inscription


Cette formation est proposée selon deux formules pour s'adapter au mieux à vos besoins :


Session régulière

Des sessions sont organisées à intervalles réguliers. Demandez les prochaines dates planifiées pour vous inscrire à la prochaine session.


Sur mesure & intra-entreprise

Vous souhaitez former vos équipes directement dans vos locaux ou adapter le programme technique à votre contexte d'entreprise ? Contactez-nous pour obtenir un devis personnalisé.

Obtenir cette formation

Prêt à explorer l'univers du Big Data ? Rejoignez la prochaine session ou contactez-nous pour organiser cette formation dans vos locaux.


Devis sur-mesure

S'inscrire à cette formation

Remplissez le formulaire pour obtenir plus d'informations.