Posts by Category

EN

Learn the difference between longitudinal and time series data

3 minute read

Published:

Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.

FR

Les LLMs & Hugging Face

6 minute read

Published:

Découvrez comment Hugging Face révolutionne l’IA avec les LLMs et GenAI. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

Les Transformers & HuggingFace

4 minute read

Published:

Découvrez comment HuggingFace révolutionne l’IA avec sa librairie Transformers. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

Analyse et prévision des ventes du Black Friday

9 minute read

Published:

L’objectif de ce projet est de faire une EDA et une prévision d’achat pour les données de ventes du Black Friday avec le language Python. Dans cette analyse, nous allons faire deux choses. Tout d’abord, explorerer les données et trouver des corrélations entre différents éléments, afin de pouvoir obtenir des informations sur les futures stratégies marketing. En plus de cela, utiliser également la méthode de régression pour prédire les achats futurs.

Interface graphique en Python à l’aide de Tkinter

6 minute read

Published:

Vous cherchez à créer une interface utilisateur graphique (GUI) en Python à l’aide de Tkinter. Si tel est le cas, dans cet article, je vais vous montrer comment créer une interface graphique avec Tkinter.

SCIKIT-LEARN <> Partie IV : analyse exploratoire et mise en forme des descripteurs

less than 1 minute read

Published:

Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d’analyse exploratoire disponibles dans le package Pandas, que l’on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l’étape de modélisation à proprement parler.

SCIKIT-LEARN <> Partie III : k plus proches voisins (k-means) & validation croisée

less than 1 minute read

Published:

Dans cette partie III nous allons apprendre à manipuler : la classe KNeighborsClassifier qui permet de réaliser de la classification par la méthode des k plus proches voisins ou k-means, les fonctions cross_val_score et cross_val_predict qui permettent de réaliser des expériences de validation croisée.

Classification et problème de classes déséquilibrées

less than 1 minute read

Published:

Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes adaptés.

Support Vector Machines (SVM)

4 minute read

Published:

Une machine à vecteur de support (SVM) est un algorithme d’apprentissage automatique supervisé qui peut être utilisé à des fins de classification et de régression. Dans cet article, nous allons explorer les bases mathématiques des SVM, les noyaux et la sélection de fonctionnalités.

L’algorithme Gradient Boosting Machines : XGBOOST

3 minute read

Published:

XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.

SCIKIT-LEARN <> Partie II : analyse en composante principale - ACP

less than 1 minute read

Published:

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon ses premières composantes principales.

SCIKIT-LEARN <> Partie I : régressions linéaires et polynomiales

less than 1 minute read

Published:

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera d’apprendre des modèles de régression linéaires et polynomiales, de les représenter et de calculer leurs performances en terme d’erreur quadratique moyenne.

Scraping et visualisation des données Facebook avec R

6 minute read

Published:

Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que je partageais avec des amis pour publier des liens vers de la musique qui, selon nous, méritaient d’être écoutées.

Système de recommandation avec Python et R

10 minute read

Published:

L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.

Le Big Data et les réseaux sociaux

11 minute read

Published:

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.

Premiers pas avec la programmation R

10 minute read

Published:

Dans cet article, nous allons vous guider à travers les premiers pas avec le langage de programmation R. Nous verrons comment installer R et RStudio, comment importer des bibliothèques, et comment effectuer une analyse de données de base.

Questions et réponses: Questions courantes en Data Science

2 minute read

Published:

Dans cet article, nous allons répondre à quelques questions courantes en Data Science. Nous aborderons des sujets tels que comment débuter en Data Science, comment écrire un excellent article sur la science des données, et plus encore.

Installation de Tensorflow sur winpython

2 minute read

Published:

Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.