Posts by Tags

Big data

Le Big Data et les réseaux sociaux

11 minute read

Published:

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.

Chatbots

Classesdéséquilibrées

Classification et problème de classes déséquilibrées

less than 1 minute read

Published:

Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes adaptés.

Classification

Classification et problème de classes déséquilibrées

less than 1 minute read

Published:

Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes adaptés.

Cross-sectiona data

Learn the difference between longitudinal and time series data

3 minute read

Published:

Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.

Data

Data Science

Premiers pas avec la programmation R

10 minute read

Published:

Dans cet article, nous allons vous guider à travers les premiers pas avec le langage de programmation R. Nous verrons comment installer R et RStudio, comment importer des bibliothèques, et comment effectuer une analyse de données de base.

Questions et réponses: Questions courantes en Data Science

2 minute read

Published:

Dans cet article, nous allons répondre à quelques questions courantes en Data Science. Nous aborderons des sujets tels que comment débuter en Data Science, comment écrire un excellent article sur la science des données, et plus encore.

EDA

Analyse et prévision des ventes du Black Friday

9 minute read

Published:

L’objectif de ce projet est de faire une EDA et une prévision d’achat pour les données de ventes du Black Friday avec le language Python. Dans cette analyse, nous allons faire deux choses. Tout d’abord, explorerer les données et trouver des corrélations entre différents éléments, afin de pouvoir obtenir des informations sur les futures stratégies marketing. En plus de cela, utiliser également la méthode de régression pour prédire les achats futurs.

Facebook

Le Big Data et les réseaux sociaux

11 minute read

Published:

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.

GenAI

Les LLMs & Hugging Face

6 minute read

Published:

Découvrez comment Hugging Face révolutionne l’IA avec les LLMs et GenAI. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

Gradient Boosting

L’algorithme Gradient Boosting Machines : XGBOOST

3 minute read

Published:

XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.

Analyse et prévision des ventes du Black Friday

9 minute read

Published:

L’objectif de ce projet est de faire une EDA et une prévision d’achat pour les données de ventes du Black Friday avec le language Python. Dans cette analyse, nous allons faire deux choses. Tout d’abord, explorerer les données et trouver des corrélations entre différents éléments, afin de pouvoir obtenir des informations sur les futures stratégies marketing. En plus de cela, utiliser également la méthode de régression pour prédire les achats futurs.

HuggingFace

Les LLMs & Hugging Face

6 minute read

Published:

Découvrez comment Hugging Face révolutionne l’IA avec les LLMs et GenAI. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

Les Transformers & HuggingFace

4 minute read

Published:

Découvrez comment HuggingFace révolutionne l’IA avec sa librairie Transformers. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

LLMs

Les LLMs & Hugging Face

6 minute read

Published:

Découvrez comment Hugging Face révolutionne l’IA avec les LLMs et GenAI. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

Longitudinal data

Learn the difference between longitudinal and time series data

3 minute read

Published:

Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.

Machine Learning

SCIKIT-LEARN <> Partie IV : analyse exploratoire et mise en forme des descripteurs

less than 1 minute read

Published:

Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d’analyse exploratoire disponibles dans le package Pandas, que l’on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l’étape de modélisation à proprement parler.

SCIKIT-LEARN <> Partie III : k plus proches voisins (k-means) & validation croisée

less than 1 minute read

Published:

Dans cette partie III nous allons apprendre à manipuler : la classe KNeighborsClassifier qui permet de réaliser de la classification par la méthode des k plus proches voisins ou k-means, les fonctions cross_val_score et cross_val_predict qui permettent de réaliser des expériences de validation croisée.

Classification et problème de classes déséquilibrées

less than 1 minute read

Published:

Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes adaptés.

L’algorithme Gradient Boosting Machines : XGBOOST

3 minute read

Published:

XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.

SCIKIT-LEARN <> Partie II : analyse en composante principale - ACP

less than 1 minute read

Published:

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon ses premières composantes principales.

Installation de Tensorflow sur winpython

2 minute read

Published:

Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.

NLP

Les Transformers & HuggingFace

4 minute read

Published:

Découvrez comment HuggingFace révolutionne l’IA avec sa librairie Transformers. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

Système de recommandation avec Python et R

10 minute read

Published:

L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.

Open Source

PCA

SCIKIT-LEARN <> Partie II : analyse en composante principale - ACP

less than 1 minute read

Published:

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon ses premières composantes principales.

Programmation R

Premiers pas avec la programmation R

10 minute read

Published:

Dans cet article, nous allons vous guider à travers les premiers pas avec le langage de programmation R. Nous verrons comment installer R et RStudio, comment importer des bibliothèques, et comment effectuer une analyse de données de base.

Python

SCIKIT-LEARN <> Partie IV : analyse exploratoire et mise en forme des descripteurs

less than 1 minute read

Published:

Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d’analyse exploratoire disponibles dans le package Pandas, que l’on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l’étape de modélisation à proprement parler.

SCIKIT-LEARN <> Partie III : k plus proches voisins (k-means) & validation croisée

less than 1 minute read

Published:

Dans cette partie III nous allons apprendre à manipuler : la classe KNeighborsClassifier qui permet de réaliser de la classification par la méthode des k plus proches voisins ou k-means, les fonctions cross_val_score et cross_val_predict qui permettent de réaliser des expériences de validation croisée.

Système de recommandation avec Python et R

10 minute read

Published:

L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.

Installation de Tensorflow sur winpython

2 minute read

Published:

Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.

Questions

Questions et réponses: Questions courantes en Data Science

2 minute read

Published:

Dans cet article, nous allons répondre à quelques questions courantes en Data Science. Nous aborderons des sujets tels que comment débuter en Data Science, comment écrire un excellent article sur la science des données, et plus encore.

R

Scraping et visualisation des données Facebook avec R

6 minute read

Published:

Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que je partageais avec des amis pour publier des liens vers de la musique qui, selon nous, méritaient d’être écoutées.

Premiers pas avec la programmation R

10 minute read

Published:

Dans cet article, nous allons vous guider à travers les premiers pas avec le langage de programmation R. Nous verrons comment installer R et RStudio, comment importer des bibliothèques, et comment effectuer une analyse de données de base.

Random Forest

Analyse et prévision des ventes du Black Friday

9 minute read

Published:

L’objectif de ce projet est de faire une EDA et une prévision d’achat pour les données de ventes du Black Friday avec le language Python. Dans cette analyse, nous allons faire deux choses. Tout d’abord, explorerer les données et trouver des corrélations entre différents éléments, afin de pouvoir obtenir des informations sur les futures stratégies marketing. En plus de cela, utiliser également la méthode de régression pour prédire les achats futurs.

Rfacebook

Scraping et visualisation des données Facebook avec R

6 minute read

Published:

Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que je partageais avec des amis pour publier des liens vers de la musique qui, selon nous, méritaient d’être écoutées.

Régressions

SCIKIT-LEARN <> Partie I : régressions linéaires et polynomiales

less than 1 minute read

Published:

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera d’apprendre des modèles de régression linéaires et polynomiales, de les représenter et de calculer leurs performances en terme d’erreur quadratique moyenne.

SVM

Support Vector Machines (SVM)

4 minute read

Published:

Une machine à vecteur de support (SVM) est un algorithme d’apprentissage automatique supervisé qui peut être utilisé à des fins de classification et de régression. Dans cet article, nous allons explorer les bases mathématiques des SVM, les noyaux et la sélection de fonctionnalités.

Scikit-Learn

SCIKIT-LEARN <> Partie II : analyse en composante principale - ACP

less than 1 minute read

Published:

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon ses premières composantes principales.

SCIKIT-LEARN <> Partie I : régressions linéaires et polynomiales

less than 1 minute read

Published:

Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera d’apprendre des modèles de régression linéaires et polynomiales, de les représenter et de calculer leurs performances en terme d’erreur quadratique moyenne.

Scikit-learn

SCIKIT-LEARN <> Partie IV : analyse exploratoire et mise en forme des descripteurs

less than 1 minute read

Published:

Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d’analyse exploratoire disponibles dans le package Pandas, que l’on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l’étape de modélisation à proprement parler.

SCIKIT-LEARN <> Partie III : k plus proches voisins (k-means) & validation croisée

less than 1 minute read

Published:

Dans cette partie III nous allons apprendre à manipuler : la classe KNeighborsClassifier qui permet de réaliser de la classification par la méthode des k plus proches voisins ou k-means, les fonctions cross_val_score et cross_val_predict qui permettent de réaliser des expériences de validation croisée.

Support Vector Machines

Support Vector Machines (SVM)

4 minute read

Published:

Une machine à vecteur de support (SVM) est un algorithme d’apprentissage automatique supervisé qui peut être utilisé à des fins de classification et de régression. Dans cet article, nous allons explorer les bases mathématiques des SVM, les noyaux et la sélection de fonctionnalités.

Système recommandation

Système de recommandation avec Python et R

10 minute read

Published:

L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.

Tensorflow

Installation de Tensorflow sur winpython

2 minute read

Published:

Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.

Time Series

Learn the difference between longitudinal and time series data

3 minute read

Published:

Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.

Tkinter

Interface graphique en Python à l’aide de Tkinter

6 minute read

Published:

Vous cherchez à créer une interface utilisateur graphique (GUI) en Python à l’aide de Tkinter. Si tel est le cas, dans cet article, je vais vous montrer comment créer une interface graphique avec Tkinter.

Transformers

Les Transformers & HuggingFace

4 minute read

Published:

Découvrez comment HuggingFace révolutionne l’IA avec sa librairie Transformers. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.

Twitter

Le Big Data et les réseaux sociaux

11 minute read

Published:

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.

Visualisation

Scraping et visualisation des données Facebook avec R

6 minute read

Published:

Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que je partageais avec des amis pour publier des liens vers de la musique qui, selon nous, méritaient d’être écoutées.

Web scraping

Le Big Data et les réseaux sociaux

11 minute read

Published:

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.

Winpython

Installation de Tensorflow sur winpython

2 minute read

Published:

Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.

XGBoost

L’algorithme Gradient Boosting Machines : XGBOOST

3 minute read

Published:

XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.

interface graphique

Interface graphique en Python à l’aide de Tkinter

6 minute read

Published:

Vous cherchez à créer une interface utilisateur graphique (GUI) en Python à l’aide de Tkinter. Si tel est le cas, dans cet article, je vais vous montrer comment créer une interface graphique avec Tkinter.