Blog posts

Classification et problème de classes déséquilibrées

Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes...

Support Vector Machines (SVM)

Une machine à vecteur de support (SVM) est un algorithme d’apprentissage automatique supervisé qui peut être utilisé à des fins de classification et de régression. Dans cet article, nous allons...

L'algorithme Gradient Boosting Machines : XGBOOST

XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de...

SCIKIT-LEARN <> Partie II : analyse en composante principale - ACP

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon...

SCIKIT-LEARN <> Partie I : régressions linéaires et polynomiales

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera d’apprendre des modèles de régression linéaires et polynomiales, de les représenter et de calculer...

Les plateformes de données open sources pour les projets de Data Science

Lorsque vous démarrez un projet en Data Science, la première des préoccupations est la recherche des données qui pourront répondre à votre problématique. Dans cet article, nous allons parcourir quelques...

Scraping et visualisation des données Facebook avec R

Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que...

Système de recommandation avec Python et R

L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de...

Le Big Data et les réseaux sociaux

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs....