Le Big Data et les réseaux sociaux
Published:
Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.
Published:
Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.
Published:
Les chatbots sont des robots conversationnels qui dialoguent par écrit, les utilisateurs en langage naturel. Ils sont adaptés pour répondre aux nouvelles attentes des clients tout en optimisant les coûts de l’entreprise.
Published:
Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes adaptés.
Published:
Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes adaptés.
Published:
Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.
Published:
Lorsque vous démarrez un projet en Data Science, la première des préoccupations est la recherche des données qui pourront répondre à votre problématique. Dans cet article, nous allons parcourir quelques plateformes de données open source.
Published:
Dans cet article, nous allons vous guide dans le choix du logiciel de programmation pour votre entreprise, en vous expliquant les forces et les faiblesses entre python et R.
Published:
Lorsque vous démarrez un projet en Data Science, la première des préoccupations est la recherche des données qui pourront répondre à votre problématique. Dans cet article, nous allons parcourir quelques plateformes de données open source.
Published:
Dans cet article, nous allons vous guider à travers les premiers pas avec le langage de programmation R. Nous verrons comment installer R et RStudio, comment importer des bibliothèques, et comment effectuer une analyse de données de base.
Published:
Dans cet article, nous allons répondre à quelques questions courantes en Data Science. Nous aborderons des sujets tels que comment débuter en Data Science, comment écrire un excellent article sur la science des données, et plus encore.
Published:
L’objectif de ce projet est de faire une EDA et une prévision d’achat pour les données de ventes du Black Friday avec le language Python. Dans cette analyse, nous allons faire deux choses. Tout d’abord, explorerer les données et trouver des corrélations entre différents éléments, afin de pouvoir obtenir des informations sur les futures stratégies marketing. En plus de cela, utiliser également la méthode de régression pour prédire les achats futurs.
Published:
Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.
Published:
Découvrez comment Hugging Face révolutionne l’IA avec les LLMs et GenAI. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.
Published:
XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.
Published:
L’objectif de ce projet est de faire une EDA et une prévision d’achat pour les données de ventes du Black Friday avec le language Python. Dans cette analyse, nous allons faire deux choses. Tout d’abord, explorerer les données et trouver des corrélations entre différents éléments, afin de pouvoir obtenir des informations sur les futures stratégies marketing. En plus de cela, utiliser également la méthode de régression pour prédire les achats futurs.
Published:
Découvrez comment Hugging Face révolutionne l’IA avec les LLMs et GenAI. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.
Published:
Découvrez comment HuggingFace révolutionne l’IA avec sa librairie Transformers. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.
Published:
Découvrez comment Hugging Face révolutionne l’IA avec les LLMs et GenAI. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.
Published:
Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.
Published:
Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d’analyse exploratoire disponibles dans le package Pandas, que l’on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l’étape de modélisation à proprement parler.
Published:
Dans cette partie III nous allons apprendre à manipuler : la classe KNeighborsClassifier qui permet de réaliser de la classification par la méthode des k plus proches voisins ou k-means, les fonctions cross_val_score et cross_val_predict qui permettent de réaliser des expériences de validation croisée.
Published:
Dans cet article, nous allons aborder le problème de classification avec des classes déséquilibrées. Nous verrons les différentes approches pour traiter ce problème, notamment les techniques d’échantillonnage et les algorithmes adaptés.
Published:
XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.
Published:
Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon ses premières composantes principales.
Published:
Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.
Published:
Découvrez comment HuggingFace révolutionne l’IA avec sa librairie Transformers. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.
Published:
Les chatbots sont des robots conversationnels qui dialoguent par écrit, les utilisateurs en langage naturel. Ils sont adaptés pour répondre aux nouvelles attentes des clients tout en optimisant les coûts de l’entreprise.
Published:
L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.
Published:
Lorsque vous démarrez un projet en Data Science, la première des préoccupations est la recherche des données qui pourront répondre à votre problématique. Dans cet article, nous allons parcourir quelques plateformes de données open source.
Published:
Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon ses premières composantes principales.
Published:
Dans cet article, nous allons vous guider à travers les premiers pas avec le langage de programmation R. Nous verrons comment installer R et RStudio, comment importer des bibliothèques, et comment effectuer une analyse de données de base.
Published:
Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d’analyse exploratoire disponibles dans le package Pandas, que l’on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l’étape de modélisation à proprement parler.
Published:
Dans cet article, nous allons vous guide dans le choix du logiciel de programmation pour votre entreprise, en vous expliquant les forces et les faiblesses entre python et R.
Published:
Dans cette partie III nous allons apprendre à manipuler : la classe KNeighborsClassifier qui permet de réaliser de la classification par la méthode des k plus proches voisins ou k-means, les fonctions cross_val_score et cross_val_predict qui permettent de réaliser des expériences de validation croisée.
Published:
L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.
Published:
Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.
Published:
Dans cet article, nous allons répondre à quelques questions courantes en Data Science. Nous aborderons des sujets tels que comment débuter en Data Science, comment écrire un excellent article sur la science des données, et plus encore.
Published:
Dans cet article, nous allons vous guide dans le choix du logiciel de programmation pour votre entreprise, en vous expliquant les forces et les faiblesses entre python et R.
Published:
Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que je partageais avec des amis pour publier des liens vers de la musique qui, selon nous, méritaient d’être écoutées.
Published:
Dans cet article, nous allons vous guider à travers les premiers pas avec le langage de programmation R. Nous verrons comment installer R et RStudio, comment importer des bibliothèques, et comment effectuer une analyse de données de base.
Published:
L’objectif de ce projet est de faire une EDA et une prévision d’achat pour les données de ventes du Black Friday avec le language Python. Dans cette analyse, nous allons faire deux choses. Tout d’abord, explorerer les données et trouver des corrélations entre différents éléments, afin de pouvoir obtenir des informations sur les futures stratégies marketing. En plus de cela, utiliser également la méthode de régression pour prédire les achats futurs.
Published:
Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que je partageais avec des amis pour publier des liens vers de la musique qui, selon nous, méritaient d’être écoutées.
Published:
Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera d’apprendre des modèles de régression linéaires et polynomiales, de les représenter et de calculer leurs performances en terme d’erreur quadratique moyenne.
Published:
Une machine à vecteur de support (SVM) est un algorithme d’apprentissage automatique supervisé qui peut être utilisé à des fins de classification et de régression. Dans cet article, nous allons explorer les bases mathématiques des SVM, les noyaux et la sélection de fonctionnalités.
Published:
Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera simplement de réaliser une ACP d’un jeu de données et de le représenter selon ses premières composantes principales.
Published:
Dans cet article nous allons réaliser quelques opérations de base en Python et Scikit-Learn. L’objectif sera d’apprendre des modèles de régression linéaires et polynomiales, de les représenter et de calculer leurs performances en terme d’erreur quadratique moyenne.
Published:
Dans cet article qui fait suite de la partie III, nous allons (re)voir quelques outils classiques d’analyse exploratoire disponibles dans le package Pandas, que l’on met en général en oeuvre pour avoir une meilleure connaissance du jeu de données à étudier avant de passer à l’étape de modélisation à proprement parler.
Published:
Dans cette partie III nous allons apprendre à manipuler : la classe KNeighborsClassifier qui permet de réaliser de la classification par la méthode des k plus proches voisins ou k-means, les fonctions cross_val_score et cross_val_predict qui permettent de réaliser des expériences de validation croisée.
Published:
Une machine à vecteur de support (SVM) est un algorithme d’apprentissage automatique supervisé qui peut être utilisé à des fins de classification et de régression. Dans cet article, nous allons explorer les bases mathématiques des SVM, les noyaux et la sélection de fonctionnalités.
Published:
L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.
Published:
Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.
Published:
Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.
Published:
Vous cherchez à créer une interface utilisateur graphique (GUI) en Python à l’aide de Tkinter. Si tel est le cas, dans cet article, je vais vous montrer comment créer une interface graphique avec Tkinter.
Published:
Découvrez comment HuggingFace révolutionne l’IA avec sa librairie Transformers. Apprenez à utiliser les modèles pré-entraînés pour le NLP, la vision et plus encore.
Published:
Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.
Published:
Dans cet article, nous allons gratter les données de Facebook avec le package Rfacebook. Ensuite, nous utiliserons ggplot2 pour nos visualisations. Je vais utiliser les données d’un groupe privé que je partageais avec des amis pour publier des liens vers de la musique qui, selon nous, méritaient d’être écoutées.
Published:
Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook), des sites web et des blogs.
Published:
Dans ce poste je vais vous montrer comment installer Tensorflow CPU sur Windows 10 sans carte graphique GPU, ni un processeur NVIDA et sans ANACONDA.
Published:
XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.
Published:
Vous cherchez à créer une interface utilisateur graphique (GUI) en Python à l’aide de Tkinter. Si tel est le cas, dans cet article, je vais vous montrer comment créer une interface graphique avec Tkinter.