> Formations > Technologies numériques > Intelligence Artificielle, Big Data > IA, Machine Learning, analyse de données > Formation Data analyst, parcours de 6 mois en continu > Formations > Technologies numériques > Formation Data analyst, parcours de 6 mois en continu

Data analyst, parcours de 6 mois en continu

tutorat inclus

Data analyst, parcours de 6 mois en continu

tutorat inclus
Télécharger le programme Partager cette formation

Télécharger le programme Partager cette formation

ORSYS et DataScientest proposent un parcours de formation complet pour le métier de data analyst. Le data analyst ou business analyst traite et analyse les données dans une optique de prise de décision business, organisationnelle ou projet. Ce parcours en ligne vous permet de maîtriser les fondamentaux du langage Python et ses principales bibliothèques pour la data science. Vous y apprenez également toutes les technologies autour de l’analyse des données comme la data visualisation, le machine learning, l’extraction et la gestion de données texte, le big data ainsi que la business intelligence (BI).


Catalogue
Sur mesure

Formation en ligne

Réf. 4DX
  294h00
Prix : 5990 € H.T.
Langue : FR




ORSYS et DataScientest proposent un parcours de formation complet pour le métier de data analyst. Le data analyst ou business analyst traite et analyse les données dans une optique de prise de décision business, organisationnelle ou projet. Ce parcours en ligne vous permet de maîtriser les fondamentaux du langage Python et ses principales bibliothèques pour la data science. Vous y apprenez également toutes les technologies autour de l’analyse des données comme la data visualisation, le machine learning, l’extraction et la gestion de données texte, le big data ainsi que la business intelligence (BI).

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Connaître les fondamentaux de Python
  • Maîtriser les bibliothèques Python dédiées à la data science
  • Effectuer de la data visualisation
  • Utiliser les technologies autour de l’analyse données : machine learning, big data, business intelligence (BI…)
  • Comprendre l’extraction et la gestion de données texte

Public concerné
Personnes ayant une appétence pour la programmation et la manipulation des données.

Prérequis
Avoir un niveau bac +2 à composante business ou sciences est souhaité. Des notions de marketing et de statistiques sont nécessaires.

Programme de la formation

Fondamentaux de Python

  • Découverte des différentes variables, listes et tuples.
  • Présentation des divers opérateurs et structures de contrôle.
  • Initiation au concept de boucle et ses différents types.
  • Introduction aux fonctions et leurs documentations.
  • Instanciation de classes et utilisation de modules.

NumPy et Pandas

  • Création et manipulation d’un tableau NumPy array.
  • Présentation des opérations matricielles.
  • Création d’un indicateur statistique et application.
  • Chargement et première exploration d’un jeu de données.
  • Introduction au data cleaning.
  • Introduction au data processing.

Data quality (module optionnel)

  • Présentation des principes essentiels à la data quality.
  • Traitement des variables numériques et textuelles.
  • Introduction au nettoyage de données.
  • Initiation à la gestion des valeurs manquantes.

Matplotlib

  • Présentation de différents types de graphes.
  • Introduction à la personnalisation de graphique.
  • En option : présentation de graphiques avancés avec Matplotlib et création de figures avec classes et objets.

Seaborn

  • Initiation à l'analyse de distribution.
  • Découverte de l'analyse statistique.
  • Initiation à l'analyse multivariée.
  • En option : Bokeh.
  • Utiliser des graphiques interactifs et intégrables sur une page web.

Algorithme et méthodologie de classification avec Scikit-learn

  • Présentation des algorithmes de classification (régression logistique, KNN, arbre de décision, forêt aléatoire, SVM…).
  • Initiation aux algorithmes de boosting et de bagging.
  • Découverte des différents modèles et sélections.
  • Classification des données déséquilibrées.

Méthode de réduction de dimension

  • Introduction à l'analyse en composantes principales.
  • Présentation de l'algorithme T-SNE.
  • Introduction à l'analyse discriminante linéaire.
  • Découverte du clustering avec l'algorithme des K-means.

Méthode de régression et text mining

  • Introduction à la régression linéaire simple.
  • Découverte des expressions régulières.
  • Mise au point à la gestion de données textuelles.
  • Création de Wordclouds (nuages de mots-clés).
  • Présentation de l'analyse de sentiments.

Web scraping et introduction aux data engineering et big data

  • Introduction au langage web (HTML, CSS).
  • Extraction de contenu web avec Beautiful Soup.
  • Application du scraping sur Google.
  • Introduction aux 3V du big data (volume, variété, vélocité).
  • Présentation des bases de données et architectures.
  • Mise en production de données.

Data processing et machine learning sur de grandes bases de données

  • Introduction à PySpark.
  • Découverte de fonctions Pyspark (Data processing, data frames, régression avec Pyspark, ML pipelines, model turning…).


Modalités pratiques
Activités digitales
Test de positionnement sous forme de QCM d'une heure, séance d’introduction à la plateforme à distance, classes collectives, classe de soutien sur mesure, simulation et codage en direct, exercices, fiches de synthèse, projet fil rouge dédié, social learning, échanges avec data scientists.
Tutorat
Un data scientist expert accompagne par e-mail l’apprenant dès son entrée en formation. Il échange avec lui et l'aide à assimiler les compétences théoriques et pratiques nécessaires à la réussite de sa formation. Lui ou un second data scientist expert anime des classes à distance collectives durant 15 % du temps ainsi que des ateliers collectifs de soutien. L'apprenant dispose également d'un mentor dédié au suivi de son Projet Fil Rouge avec qui il fait des points réguliers. Les partages entre apprenants sur le forum de discussion et pendant les moments en groupe sont aussi très riches !
Pédagogie et pratique;
Formation digitale basée sur une pédagogie active et conçue avec des experts en data science. Une combinaison de théorie, de démonstrations, de mises en pratique, de partages d’expériences et de bonnes pratiques. Un test de positionnement, un accompagnement sur mesure dès le début du parcours, un projet fil rouge et des séquences pédagogiques de courte durée permettent de renforcer l’apprentissage et d’évaluer l’apprenant tout au long de sa formation. En cas de besoin technique, une cellule support est disponible en ligne 5 jours sur 7 de 9 h à 18 h 30. À l’issue de son parcours en ligne, l’apprenant reçoit un certificat délivré par Mines ParisTech | PSL Executive Education, ce qui lui permet de bénéficier de la reconnaissance d’un acteur de référence dans le domaine.

Inclus
Tutorat
Bénéficiez de l’accompagnement d’un formateur expert du domaine pour vous guider et renforcer votre apprentissage.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.