Datagraphie : [dataɡʁafi], nom fém.

Géographe de formation, infographiste à mes heures perdues, je propose un néologisme : datagraphie. Cartographie, visualisation des données, géolocalisation et mashups sont en cours de (ré)invention — ce blog propose une veille sur ces sujets.

14 décembre 2012 ~ 0 Commentaires

Gapminder : un outil de visualisation web multivariables

Si vous avez un grand nombre de données à explorer, croiser, analyser, la Fondation GapMinder a développé l'outil qu'il vous faut : Trendalyzer. Racheté en mars 2007 par Google et rebaptisé "Motion Chart Time Formats", l'application permet d'explorer des données en deux, trois, voire quatre dimensions grâce à l'utilisation simultanée d'une timeline et de bulles dont la taille et la couleur permettent d'introduire de nouvelles variables.

Gapminder est une Fondation établie à Stockholm dont la principale mission est la promotion du développement durable et de l'accomplissement des Objectifs du Millénaire par l'utilisation des statistiques (sociales, économiques et environementales) aux échelles locales, régionales et mondiales. C'est donc naturellement que leur site propose de croiser des données sociales, économiques et environementales dans le temps (obtenues de sources citées et fiables) et de visualiser les trajectoires obtenues. 

Concrètement, et parce qu'un exemple vaut mieux qu'un long discours, vous pouvez par exemple visualiser l'espérance de vie des habitants de différents pays en fonction du revenu par tête, le tout de 1800 à 2011. La taille des points renseigne sur le nombre d'habitants et la couleur sur le continent représenté (cliquez ici pour afficher la visualisation dans Gapminder).

J'ai fait le choix de n'afficher que cinq pays (France, Etats-Unis, Chine, Tunisie, Afrique du Sud) pour garder de la clarté sur le graphique, sinon c'est vite le bazar – quoique cela permet parfois de distinguer des grands groupes, souvent organisés par continent, mais pas toujours. Les trajectoires sont toujours intéressantes à étudier : la Chine affronte un plateau depuis le début des années 2000, qui voit son revenu par tête augmenter beaucoup plus rapidement que son espérance de vie ; la France a une trajectoire particulièrement agitée (les pics vers le bas d'espérance de vie sont dues aux guerres) et voit depuis les années 1970 son espérance de vie avancer au même rythme que sa richesse par habitant ; l'Afrique du Sud a connu dans les années 1990 un incroyable retour en arrière et tente de remonter depuis le début des années 2010 (je ne suis pas expert de ce pays, mais il semble que la baisse de l'espérance de vie est due à l'épidémie du Sida) ; etc.

L'outil arrive avec une foule d'options. Ainsi, sur chaque axe, on peut choisir d'adopter une échelle linéaire ou logarithmique. On peut n'afficher qu'une sélection de pays (et éventuellement affecter aux autres un coefficient de transparence pour faire sortir la sélection de la masse). La couleur des bulles peut également être affectée à une variable particulière (continent, démographie, richesse, etc.), tout comme leur taille. Une option permet d'afficher les tracés décrits par les bulles. Un outil permet de zoomer sur une zone du graphique pour voir plus en détail ce qu'il se passe. L'URL d'une visualisation contient toutes les variables nécessaires à la création d'une visualisation – pratique pour en garder quelques unes en mémoire sans avoir à tout reconstruire. Enfin, on peut choisir de  représenter les bulles sur une mapemonde (avec projection à l'équateur, qui rétablit la taille véritable des pays de l'hémisphère sud au passage :) ), plutôt que sur un diagramme. De quoi passer des heures à jouer avec les données mises en ligne sur le site de Gapminder.

La réutilisation de l'application avec ses propres données a été rendue possible avec le rachat par Google et même facilitée. Rebaptisé "Motion Chart Time Format", elle a intégré les Google Chart Tools et on le trouve donc naturellement dans le Playground des outils de visualisation Google. Un parfait endroit pour jouer avec le code source des données qui nourrissent l'application – plus de données sociales ni environnementales dans l'exemple de Google, mais des courbes de vente de bananes, pommes, oranges. La prise en main sur son site est plutôt facile pourvu que l'on connaisse quelques rudiments de HTML, JavaScript et de JSON (format de données sous JavaScript). Au besoin, l'aide et les tutoriels fournis par Google sont plutôt bien faits.

En fait, le seul réel défaut de l'outil créé par Gapminder se situe sous le capot : il est entièrement en Flash. Ce qui fait qu'il ne s'affiche pas sur vos iDevices. Comme tous les autres Google Chart Tools sont en HTML5/JavaScript, j'ai contacté Google pour savoir si une nouvelle version non-Flash était prévue un jour.. et la réponse est non. C'est sûr ça fait pas très Web des années 2010, mais il faut se rappeler que l'outil a été développé au milieu des années 2000 (je n'ai pas réussi à trouver la date exacte).

Du coup, j'ai recherché quelles autres outils similaires et non-développées en Flash existent et je suis tombé sur SOCR HTML5 MotionCharts, développé par le labo de statistiques en lignes (SOCR pour Statistics Online Computational Resource) de la prestigieuse UCLA. Le résultat n'est pas aussi abouti et intuitif que Gapminder, mais tout à fait fonctionnel. L'exemple suivant montre l'index des prix de l'immobilier dans chaque Etat des Etats-Unis en fonction de la population, le tout toujours dans le temps (cliquez ici pour accéder à la version animée sur le site de la SOCR).

La prise en main de l'outil développé par le SOCR est toute aussi facile que Gapminder. La licence de l'outil n'est pas précisée, mais j'imagine que la réutilisation est encouragée. Pour en savoir plus ou télécharger les fichiers de l'application : http://wiki.stat.ucla.edu/socr/index.php/SOCR_HTML5_MotionCharts

09 décembre 2012 ~ 0 Commentaires

Message de service

Cela va bientôt faire un an et demi que ce blog n'a pas été mis à jour. En cause, un emploi du temps un peu trop chargé, des priorités recentrées et surtout un départ pour le Canada.

La bonne nouvelle, c'est que ce blog reprendra très prochainement du service. Il évoluera cependant pour se consacrer davantage aux aspects techniques de la création de datavisualisations. Pas de promesse quant au rythme, mais il devrait être mis à jour au moins une fois par mois :)

01 juin 2011 ~ 1 Commentaire

Le Musée de ma vie : la mise en scène mégalo d’une virtuelle vie sociale par Intel

Depuis quelques mois, la mode est aux mashups réalisés à partir de nos posts sur les réseaux sociaux. Utopic proposait un habillage graphique plutôt réussi de l'actualité de vos amis sur Facebook et Twitter. Le projet Social Memories proposait l'édition d'un livre à partir de vos meilleurs statuts Facebook – c'est bien connu, le réseau est plein de prose. Le fabricant de microprocesseurs Intel va plus loin avec son application créant un musée virtuel dédié à sa vie : "The Museum of Me".

Le musée en question prend l'aspect d'un bâtiment design, du genre musée d'art moderne. Un clic plus tard, l'aplication vous demande l'autorisation de se connecter à votre compte Facebook et d'y récupérer tout un tas de données. Puis vient un chargement plus ou moins interminable – près de 10 minutes en ce qui me concerne, mais sûrement cela est-il du au grand nombre de connexions suite au lancement récent du site.

Quand daigne se lancer l'application, on entre enfin dans le fameux musée et commence un interminable travelling en 8 étapes dans votre vie numérique. L'intérieur du musée est particulièrement épuré et Intel a poussé le narcissime réalisme jusqu'à y mettre en scène de faux visiteurs en train de contempler notre oeuvre. La visite commence par les amis avec lesquels on intéragit le plus ; suivent une grande fresque murale avec les photos mises en ligne sur Facebook et les vues satellite des lieux dans lesquels on a voyagé (grâce aux données de géolocalisation des photos en ce qui me concerne). Un immense mur affiche ensuite les mots les plus fréquents dans nos statuts et les vidéos postées ou "likées". Une sculpture de pouce géant trône au milieu de la pièce. Wow.

La suite est plus cocasse : d'énormes robots manipulent et classent nos photos, vidéos et souvenirs, grande allégorie de notre société de consommation numérique. Leur classement abouti à une immense mosaïque, qui lorsque la caméra recule, se mue en notre photo de profil ("ma vie, mon oeuvre"), puis en social graph ("tout ça c'est moi !"), et pour finir en constellation d'étoiles.

Au final, Intel livre ici une magnifique oeuvre numérique, qui contribuera à venir combler d'orgueil nos égos déjà bien gâtés par les réseaux sociaux. Intel livre aussi là un beau panorama de notre identité numérique et, passé l'élan artistico-narcissique, on se dira tout de même : "wow, Facebook sait quand même beaucoup de choses sur moi". Intel aussi maintenant.

27 mai 2011 ~ 0 Commentaires

La taille relative des choses

A ceux qui se sont toujours interrogés sur la raison de la taille des choses dans l'univers, ce site ne donnera pas de réponse. Mais, de 900 Ym – la taille supposée de l'univers – à 0,0000000001 ym – l'échelle supposée de la corde de la théorie des cordes –, cette animation flash designée par PrimaxStudio met magnifiquement en perspective l'étendue des différences de grandeur connues. A noter que, étrangement, l'échelle de vie de l'homme se situe au quasi miieu de cette éventail.    

13 mai 2011 ~ 0 Commentaires

Timeline : la traque de Ben Laden

Dans les outils de visualisation de données et de traitement de l'information, la timeline apparaît désormais comme incontournable. Preuve en est, cette magnifique vidéo, réalisée façon plan de métro, retraçant la traque de Ben Laden. 2'07'' pour en connaître toutes les étapes, de la déclaration d'ennemi public n°1 à Abottabad, en passant par les stations Gary Weddle (le professeur de Washington qui jura de ne pas se raser tant que Ben Laden ne serait pas capturé) et Gary Faulkner (l'illuminé parti avec son sabre chasser le Ben Laden dans les grottes de Tora Bora).

Une belle réalisation graphique, mais qui invite aussi à s'interroger sur l'appauvrissement du traitement de l'information dans les nouveaux médias, par exemple par le fait que tous les événements sont situés sur le même plan…