Technifutur® sur Facebook Technifutur® sur LinkedIn Technifutur® sur Twitter Technifutur® sur YouTube Newsletter Technifutur®

Retour Page d'accueil

Vos contacts pour cette formation

Entreprises

Formulaire de renseignements

Martine Simonis
Chargée relations entreprises
T : 04 382 45 18 | Mail


Elisabeth D'Eleuterio
Coordinatrice
T : 04 382 44 46 | Mail


Maria Sciortino
Coordinatrice
T : 04 382 44 63 | Mail


Caroline Sekieta
Coordinatrice
T : 04 246 62 18 | Mail



Planifications pour cette formation

Cette formation n'est pas planifiée actuellement

> Formations  Informatique / Gestion de bases de données /BI

Formation à Python pour le traitement de données (Machine Learning)

Type de formation :  | Participants : 12  | Durée : 3 jours

> Objectifs

L'objectif de cette formation est de permettre d'apprendre les bases de Python.

La préparation des données avec pandas, la lecture et l'écriture des données depuis et vers différentes source.

Mais aussi d'apprendre et de faire de nombreux exercices sur l’analyse discriminante, la régression logistique et les arbres de décision.

Ainsi qu'une introduction à l’utilisation de Spark avec Python (pyspark)

> Public

Data scientist, responsable de traitement des données, etc.

> Prérequis

Avoir une bonne logique de programmation et des bonnes notions de bases de données.

Mais également des bonnes bases de statistiques voir de data mining.

> Programme

Les bases de Python

  • Organisation d’un programme
  • Types de données simples et complexes, List

Compréhension

  • Structures de contrôle
  • Gestion des fichiers
  • Principaux modules et fonctions

Préparation des données avec pandas

  • Lecture et écriture des données depuis et vers différentes sources (fichiers textes, Excel, bases de données, etc.)
  • Filtrage, sélection, transformation, calcul, agrégation, jointure, sorties simples

La visualisation de données avec matplotlib & seaborn

  • Revue des différents types de graphiques

Apprentissage et analyse statistique avec sci-kit learn & statsmodels

  • Revue des techniques :
  • L’analyse discriminante
  • La régression logistique
  • Les arbres de décision
  • Gestion des ensembles d’apprentissage et de test
  • Évaluation des modèles
  • Introduction à l’utilisation de Spark avec Python (pyspark)


Version Texte | Imprimez cette formation Version imprimable