Introduction au Big Data

Data > Data Engineering, Architecture & Cloud

Une formation d'1 jour pour comprendre les technologies et outils du Big Data : écosystème Hadoop, Apache Spark, Kafka, bases NoSQL, outils d'analyse et gouvernance des données à grande échelle.

Organiser dans vos locaux

S'inscrire

La formation en 6 mots clés

Big Data

Hadoop

Kafka

NoSQL

Data Engineering

Apache Spark

Informations Pratiques et Programme

Prérequis

Connaissances de base en Business Intelligence

Durée

1 jour

Contenu Technique de la Formation

La formation aborde les contenus techniques suivants :

Introduction au Big Data : concepts et enjeux
Écosystème Hadoop : HDFS, MapReduce, YARN
Outils de traitement de données en temps réel (Apache Spark, Kafka)
Stockage NoSQL (Cassandra, MongoDB)
Outils d'analyse de données (Hive, Pig)
Introduction à l'apprentissage automatique avec Big Data
Gestion, sécurité et gouvernance des données

Objectifs de la Formation

Les objectifs visés par cette formation sont :

Comprendre les concepts fondamentaux du Big Data
Se familiariser avec l'écosystème Hadoop et ses composants
Apprendre à utiliser des outils de traitement de données en temps réel
Comprendre les principes et l'utilisation des bases de données NoSQL
Acquérir des compétences dans l'analyse de données Big Data
Introduction aux concepts de l'apprentissage automatique dans le Big Data
Connaître les aspects de gestion, de sécurité et de gouvernance des données

Table des Matières

Introduction au Big Data

Définition et importance du Big Data dans le contexte actuel
Types de données : structurées, semi-structurées, non structurées
Sources de données Big Data et exemples d'applications

Écosystème Hadoop

Composants de base : HDFS, MapReduce, YARN
Architecture et fonctionnement de Hadoop
Installation et configuration d'un cluster Hadoop

Outils de Traitement de Données en Temps Réel

Présentation d'Apache Spark et Kafka
Traitement des flux de données (streaming data)
Exemples d'application et mise en pratique

Stockage NoSQL

Présentation des bases de données NoSQL : Cassandra, MongoDB
Choix d'une base de données en fonction des besoins
Principes de conception et d'utilisation des bases NoSQL

Outils d'Analyse et Apprentissage Automatique

Utilisation de Hive et Pig pour l'analyse de données
Principes de base de l'apprentissage automatique avec Big Data
Outils et bibliothèques (Apache Mahout)

Gestion, Sécurité et Gouvernance des Données

Enjeux de la gestion des données Big Data
Aspects de sécurité et de confidentialité
Politiques et meilleures pratiques de gouvernance des données

En Pratique

La formation d’algorithmique de base est fortement orientée sur la pratique. Les participants ont l’occasion de mettre en pratique les différentes notions théoriques enseignées tout au long de la formation.
Installation et configuration d'un mini-cluster Hadoop
Réalisation de traitements de données avec Spark et Kafka
Manipulation de données avec des bases de données NoSQL
Analyse de données avec Hive et Pig
Exercices d'introduction à l'apprentissage automatique

Modalités et Inscription

Cette formation est proposée selon deux formules pour s'adapter au mieux à vos besoins :

Session régulière

Des sessions sont organisées à intervalles réguliers. Demandez les prochaines dates planifiées pour vous inscrire à la prochaine session.

Sur mesure & intra-entreprise

Vous souhaitez former vos équipes directement dans vos locaux ou adapter le programme technique à votre contexte d'entreprise ? Contactez-nous pour obtenir un devis personnalisé.

Obtenir cette formation

Prêt à explorer l'univers du Big Data ? Rejoignez la prochaine session ou contactez-nous pour organiser cette formation dans vos locaux.

Devis sur-mesure

contact@bstorm.be · +32 (0) 10 24 71 10

S'inscrire à cette formation

Remplissez le formulaire pour obtenir plus d'informations.