Le Post Infeeny

Les articles des consultants et experts Infeeny

[PASS SUMMIT 2013] Visualize your Big Data with HDInsight, Power View and Excel

Speaker : Jen Stirrup, Copper, Blue Consulting

Niveau de la session : 300

Agenda :

  • Data visualisation background
  • Visualising your data
  • Your big data : toolkit  Power View  et Power Map

Data visualisation background + Visualising your data :

Jen insiste sur l’intérêt de l’aspect visual des données (citations, …) puis sur le déluge du volume des données, les data unknown unknows.

Elle présente les données de températures associées aux décollages de Challenger (Roben report by NASA), puis des données statistiques Anscombet’s Quartet (mean, var , regression linéaire) puis graph associés (plus lisible selon Jen) :

Visualiser via des tables de données n’est pas tjs facile.

Elle parle des risques du Big Data : quelle techno, quel budget, comment visualiser les données, risques sur les données (20 000 hommes enceinte en UK)…

Comment visualiser les données :

Data First : penser format tabulaire (données catégorisées ou triées) ou spatial

Etapes : preatteattentive processing, visual integration , cognitive integration

Suggestion de Perceptual Pattern = conseils (size, color, shape, format 2d, association des couleurs/quantités/ordre) … bref on parle de mise en forme, graphisme (ça c’est pour Plaza-design), quel rapport avec le big data (c’est valable quel que soit le volume de données)

Information seeking mantra : resumer puis zoomer et filtrer puis données des détails à la demande

Visualising your data :

Self Service + Insights + Actions

Présentation de quand utiliser Power View (répondre à des questions : adhoc query et visualisation) et quand utiliser power map (mapping + exploring + interagir : data you want about where)

Your big data : toolkit  Power View  et Power Map :

Démo :

(dans l’ordre voici le déroulement en vrac de la démo)

  • Utilisation de Hive + HDInsight (cluster via Windows Azure)
  • HDInsight = Microsoft distribution de Hadoop (c’est en preview actuellement) mais Jen montre arrête la demo de HDInsight (qui n’a même pas commencée)
  • Utilisation de la version hors Microsoft de Hadoop (Hortonworks Sandbox : free  et interface mieux que dans HDInsight), l’utilisation de hue pour créer un requête (create table : syntaxe proche du T-SQL)

en important d’abord des données stockées sous HDFS puis le chargement des données dans une partition (non non c’est pas du T-SQL mais c’est très proche : on utilise l’entrepôt de Hadoop)

  • Utilisation de Excel (other sources + odbc connection to hortonworks sandbox : le dsn était tout prêt pour la démo), après Jen  c’est comme d’habitude on peut accéder à la table Excel via PowerPivot …
  • Comment récupérer dans une table Excel des données publiques (on line search), relier la donnée à PowerPivot et ajouter du DAX et utiliser la police windings dans un slicer pour afficher des smileys (lettres J ou K)
  • Démo finale avec Power View

Conclusion :

La première partie de la présentation (Data visualisation background et Visualising your data) est trop longue (1 heure) et présente un intérêt modéré (pas d’utilisation d’outils) : hors sujet ?

La deuxième partie (démo) est tout petit peu plus intéressante (si vous voulez afficher des smileys dans des slicers dans Excel) mais en fin de compte on y apprend pas grand-chose, la session précédente de Jen sur le Big Data était mieux. Une session ou a presque rien vu sur du big data.

Pascal Rouzé

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :