M is for Data Monkey

Dans un monde idéal, les données de nos clients seraient sagement stockées dans des bases de données bien structurées, des ERP parfaits ou des services en lignes modèles. Dans un monde idéal, les professionnels de la donnée n’auraient pas à ce soucier de cette tâche fastidieuse et peu glorifiante qu’est le nettoyage de données. Nous n’aurions même pas à nous soucier d’apprendre le langage M.

Oui mais voilà. Justement parce nous sommes des professionnels de la donnée, nous sommes amenés à traiter des données de toutes sortes et présentée sous toutes les formes possibles : fichiers Excel (avec formules et macro, bien entendu !), JSON ou fichiers de logs étrangement formatés. Notre job consiste aussi à transformer cette donnée brute.

Bref, nous sommes devenus des data monkeys !

Le livre de référence pour déjouer tous les pièges de Power Query existe : il est intitulé « M is for (Data) Monkey: A Guide to the M Language in Excel Power Query » par Ken Puls et Miguel Escobar.

En 25 chapitres, ce guide illustre pas à pas la façon d’aborder le Data Shaping, des données de base aux formats plus complexes, de la fusion de requêtes à l’application de la logique conditionnelle. La plupart des chapitres sont illustrés par des exemples concrets permettant de dompter l’interface de Power Query dans Excel. Les derniers chapitres sont consacré à la compréhension du langage M.

Bien entendu, les concepts présentés peuvent être transposés au Query Editor de Power BI.

Pour compléter cette lecture, vous pouvez aller faire un tour sur ce post de AngryAnalytics qui présente les avantages d’utiliser les expressions régulières pour mettre en forme des données.

Vous voilà armé pour affronter sans crainte une armée de données barbares !

 

 

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s