M is for Data Monkey

Dans un monde idéal, les données de nos clients seraient sagement stockées dans des bases de données bien structurées, des ERP parfaits ou des services en lignes modèles. Dans un monde idéal, les professionnels de la donnée n’auraient pas à ce soucier de cette tâche fastidieuse et peu glorifiante qu’est le nettoyage de données. Nous n’aurions même pas à nous soucier d’apprendre le langage M.

Oui mais voilà. Justement parce nous sommes des professionnels de la donnée, nous sommes amenés à traiter des données de toutes sortes et présentée sous toutes les formes possibles : fichiers Excel (avec formules et macro, bien entendu !), JSON ou fichiers de logs étrangement formatés. Notre job consiste aussi à transformer cette donnée brute.

Bref, nous sommes devenus des data monkeys !

Le livre de référence pour déjouer tous les pièges de Power Query existe : il est intitulé « M is for (Data) Monkey: A Guide to the M Language in Excel Power Query » par Ken Puls et Miguel Escobar.

En 25 chapitres, ce guide illustre pas à pas la façon d’aborder le Data Shaping, des données de base aux formats plus complexes, de la fusion de requêtes à l’application de la logique conditionnelle. La plupart des chapitres sont illustrés par des exemples concrets permettant de dompter l’interface de Power Query dans Excel. Les derniers chapitres sont consacré à la compréhension du langage M.

Bien entendu, les concepts présentés peuvent être transposés au Query Editor de Power BI.

Pour compléter cette lecture, vous pouvez aller faire un tour sur ce post de AngryAnalytics qui présente les avantages d’utiliser les expressions régulières pour mettre en forme des données.

Vous voilà armé pour affronter sans crainte une armée de données barbares !

 

 

A quoi sert Powerpoint ?

A rien s’il on en croit cette anecdote bien connue relatée par le New York Times : face à un schéma Powerpoint censé synthétiser la stratégie militaire appliquée en Afghanistan, le général Stanley McChrystal, commandant des forces armées et de l’OTAN aurait déclaré « lorsque nous aurons compris ce schéma, nous aurons gagné la guerre ! »

Cette histoire, faisant écho à de nombreuses autres, parle forcément à tous ceux qui ont dû subir d’interminables présentations Powerpoint durant lesquelles l’orateur récite sagement le texte écrit en police minuscule sur chaque slide projeté à l’écran. Le constat est lourd : indigeste, chronophage (qu’il s’agisse du temps perdu à concevoir les slides ou du temps passé devant la présentation), Powerpoint n’a pas su évoluer et est devenu l’ennemi de toute réunion professionnelle. Lire la suite de « A quoi sert Powerpoint ? »

31 days of SSIS

Durant l’élaboration de traitements d’alimentation SSIS, lorsqu’on se trouve face à un problème d’optimisation ou de débogage, le réflexe naturel est de chercher un secours parmi les résultats de recherche Google. Assez pertinente lorsqu’il s’agit de se documenter sur l’utilisation de base d’un composant SSIS, cette recherche l’est bien moins lorsque la solution demande une certaine expérience du sujet.

Pour tous ces cas épineux, le blog de Jason Strate est une mine d’or. Début 2011 (c’est pas neuf mais c’est toujours d’actualité), Jason a publié une série d’articles exposant des trucs et astuces (31 au total, un par jour). Chaque article aborde un thème et cite les cas concrets pour lesquels vous aurez besoin d’appliquer la recette présentée.

Lire la suite de « 31 days of SSIS »

Partager comme un artiste : le guide du social creatif

 

Comme vous sans doute, je profite de cet « entre deux fêtes » pour me ressourcer et pour faire tout ce que je n’ai plus le temps de faire dans l’année. Et avant tout, je prends le temps de lire. N’ayant pas devant moi un temps illimité, Lire la suite de « Partager comme un artiste : le guide du social creatif »