MACHINE LEARNING WITH SCIKIT-LEARN <> Partie IV : analyse exploratoire et mise en forme des descripteurs

less than 1 minute read

Published:

Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d'analyse exploratoire disponibles dans le package Pandas, que l'on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l'étape de modélisation à proprement parler.

Nous apprendrons également à manipuler certains outils de pré-traitement des données disponibles dans le module PreProcessing de scikit-learn, permettant d'appliquer diverses transformations aux descripteurs : standardisation, imputation de données manquantes, ...

Ressource consulté: hands on machine learning with scikit-learn and tensorflow. Nous travaillerons à partir du jeu de données California Housing, et plus précisemment d'une version sensiblement modifiée, préparée par l'auteur du livre consulté.

 

EN SAVOIR PLUS ...