Encode les données avec Scikit-Learn

Dans ce post, nous allons découvrir comment adapter un jeux de données contenant des données textuelles, pour le rendre utilisable dans des modèles de classification, de regression ou de clustering. L’objectif est de convertir les informations contenues dans ces chaines de caractéres en une matrice numérique, sans en perdre le sens. Bref, le genre de savoir-faire indispensable en Machine/Deep Learning. Nous utiliserons un dataset sur la consommation et l’autonomie de voitures électriques....

4 mars, 2022 · 26 min · Me

Remets ton fichier CSV dans le 'bon' sens avec Pandas Melt

Dans “Nettoie rapidement ton dataset”, tu as commencé à préparer ton dataset à partir d’un fichier CSV de la Banque Mondiale. Prochaine étape : le rendre exploitable pour aggréger les données, tracer des graphiques, et entrainer des modèles de Machine Learning. Bref, dépivote le avec Pandas 😎 Qu’est-ce qui ne va pas dans ce format ? Reprenons notre dataframe. df.head(10) | | Country Name | Country Code | Indicator Name | Indicator Code | 1962 | 1967 | 1972 | 1977 | 1982 | 1987 | 1992 | 1997 | 2001 | 2002 | 2005 | 2007 | 2012 | 2014 | 2017 | |---:|:----------------------------|:---------------|:------------------------------------------------------------|:-----------------|-------:|-------:|-------:|---------:|----------:|----------:|-------------:|-------------:|-------:|----------:|-------:|----------:|----------:|-------:|---------:| | 1 | Africa Eastern and Southern | AFE | Annual freshwater withdrawals, total (billion cubic meters) | ER....

18 février, 2022 · 7 min · Me

Nettoie rapidement ton dataset

Depuis novembre 2021, j’accompagne les étudiants dans leur parcours de Data Scientist sur openclassrooms. Bref, je suis mentor. Je suis celui que j’aurai aimé rencontrer quand j’ai commencé à me former en ligne en 2016. Je consacre mes vendredis après-midi à discuter avec eux, à les encourager, à répondre à leurs questions, à les rassurer parfois aussi. Et je t’avoue que je commence à m’attacher à ces personnes qui bossent intensément pour acquérir ces nouvelles compétences....

17 février, 2022 · 18 min · Me