Blog posts

2024

Learn the difference between longitudinal and time series data

3 minute read

Published:

Longitudinal and time series data are confusing when it comes to analysing historical data. There are no strict and formal definitions on which a wide range of data analysts agree. In the literature, we have noticed that there are very few articles on the subject. And the few articles that do mention it, skim over the definition.

2022

2020

Interface graphique en Python à l’aide de Tkinter

6 minute read

Published:

Vous cherchez à créer une interface utilisateur graphique (GUI) en Python à l’aide de Tkinter. Si tel est le cas, dans cet article, je vais vous montrer comment créer une interface graphique avec Tkinter.

Chatbots : vos clients sont de plus en plus exigeant, ils veulent la bonne réponse, tout de suite, tout le temps.

3 minute read

Published:

Les clients deviennent de plus en plus exigeants, et leurs attentes peuvent souvent être déçues par les réalités opérationnelles des entreprises, comme des temps d’attente longs et des horaires d’ouverture restreints. Cette situation peut nuire à l’expérience de marque et provoquer des résiliations. L’article propose le chatbot comme une solution adaptée pour aligner ces nouvelles attentes avec les objectifs de rentabilité des entreprises.

Quel langage de programmation pour votre entreprise Python Vs R ?

5 minute read

Published:

Dans la pluspart des domaines de l 39 informatique que ce soint celui du Big Data l 39 apprentissage automatique ou encore l 39 intelligence artificielle IA il existe diverses pr eacute f eacute rences ou recommandation quant aux outils

Classification et problème de classes déséquilibrées

less than 1 minute read

Published:

Dans les problèmes de classification en machine learning, les classes déséquilibrées posent des défis, car la plupart des algorithmes se basent sur l’exactitude, ce qui peut conduire à des modèles biaisés. Cet article examine l’importance d’aborder ce problème dans divers cas d’utilisation, tels que le dépistage de maladies et le filtrage de spams. Il propose plusieurs méthodes pour classifier des jeux de données déséquilibrés, en mettant l’accent sur les approches algorithmique et d’échantillonnage.

Support Vector Machines (SVM)

4 minute read

Published:

Support Vector Machines (SVM) est un algorithme d’apprentissage machine qui peut être utilisé pour de nombreuses tâches différentes (figure 1). Dans cet article, je vais expliquer la base mathématique pour démontrer comment cet algorithme fonctionne à des fins de classification binaire.

L’algorithme Gradient Boosting Machines : XGBOOST

3 minute read

Published:

XGBoost est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans tous les langages de programmation utiles en Machine Learning, tels que Python, R ou encore Julia.

Les plateformes de données open sources pour les projets de Data Science

4 minute read

Published:

Lors du lancement d’un projet en Data Science, la recherche de données pertinentes est cruciale. L’article met en avant que les data scientists investissent souvent beaucoup de temps à naviguer sur Internet pour dénicher des ensembles de données qui répondent à leurs problématiques spécifiques.

Scraping et visualisation des données Facebook avec R

6 minute read

Published:

L’article présente l’utilisation du package Rfacebook pour gratter des données de Facebook, avec un exemple basé sur un groupe privé où des liens musicaux étaient partagés. Les visualisations sont réalisées avec ggplot2, et l’article souligne l’applicabilité de ces méthodes pour analyser des groupes Facebook ou maximiser les interactions sur des publications personnelles.

Système de recommandation avec Python et R

10 minute read

Published:

L’article traite de la collecte de données par scraping pour un système de recommandation, en identifiant les données clés. Il examine ensuite le fonctionnement d’un algorithme de similarité, avant de décrire l’intégration et le déploiement des processus dans l’application movie-space.

LE BIG DATA ET LES RESEAUX SOCIAUX

11 minute read

Published:

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire des données et des mégadonnées des principaux réseaux sociaux (Twitter, Facebook) , des sites web et des blogs.

Premiers pas avec la programmation R

10 minute read

Published:

R est un langage de programmation axé sur l’analyse statistique et graphique. Il est donc couramment utilisé dans l’inférence statistique, l’analyse des données et l’apprentissage automatique.

2019

Questions et réponses: Questions courantes en Data Science

2 minute read

Published:

L’une des principales raisons pour lesquelles il y a tant d’intérêt pour la science des données est ses diverses applications. Les données ont toujours été un élément très important de l’histoire humaine et prendre des décisions intelligentes sur la base des expériences passées et des informations fournies peut jouer un rôle crucial pour les individus ou les organisations.