Varias gráficas 3 D

Las visualizaciones en Big Data

Hace unas semanas estaba leyendo un artículo sobre el mercado Big Data en Europa. Se ofrecían datos por sectores. Se me clavó la mirada en la infografía. Muchos datos pero muy difíciles de captar.

En muchos casos la visualización de datos será “punta del iceberg” de todo un proyecto Big Data. Sólo la punta… pero como en el caso de los icebergs será lo único verá el usuario final. Siempre es importante que la información se muestre forma muy clara. Si además alguien tiene que tomar algún tipo de decisión en tiempo real el disponer de la información de forma que sea fácil de asimilar y valorar se convierte en cuestión crítica.
La infografía que captó mi atención es la que reproduzco a continuación. Mírela unos instantes.

Europe big data market by application, 2012 – 2022 (USD Million)

Infografía de barras apiladas

Ahora intente responder a las siguientes cuestiones:
1. ¿El volumen total del mercado en 2.019 está por encima o por debajo de 16.000 USD Millon?
2. ¿Qué mercado es el que tiene un mayor crecimiento?
3. ¿Puede decirme aunque sólo sea de forma aproximada el volumen de cualquier mercado que no sea el BSFI?
4. ¿Los valores de 2.015 son reales o estimados?
5. ¿Sabe lo que significa BFSI?

Investigando un poco las a las dos últimas cuestiones se responden con facilidad.
Punto 4: La referencia al artículo original se editó en enero de 2.016, la publicación del original es de septiembre de 2.015, evidentemente los datos referidos a este año son necesariamente estimados.
BFSI: No hace falta que acuda a Google, ya lo he hecho yo. Se son servicios financieros y de seguros (Banking, Financial Services and Insurance).

Existen otras cuestiones a tener en cuenta.
a. Las pequeñas rayitas entre los años en el eje de abcisas no aportan ningún tipo de información; Tampoco son de ninguna ayuda. Lo mejor es eliminarlas.
b. En el eje de ordenadas existen demasiados números. Con haber puesto los múltiplos de 5.000 hubiese sido suficiente y la infografía hubiese quedado más limpia. Otra solución habría sido el haber hecho la gráfica más esbelta con lo que el efecto aglomeración se habría difuminado. Por otra parte parece evidente que sobran los decimales.
c. Unas líneas auxiliares horizontales a la altura de cada uno de los valores correspondientes a las ordenadas ayudaría en sobremanera en la lectura de los valores que reflejan las barras.
d. Poniendo las líneas mentadas en el párrafo anterior la cuestión de reducir la cantidad de valores en el eje de ordenadas o el hacer el gráfico de más altura sería importante para que no se produjesen saltos visuales entre de líneas.
e. Si ahora acudimos a la leyenda veremos que los diferentes sectores están ordenados de izquierda a derecha y de arriba hacia abajo. Sus correspondientes valores en el gráfico se leen de abajo hacia arriba.

Como comentario adicional indicar la utilización de barras apiladas es una alternativa que se debe relegar a casos muy especiales. Aunque puede tener un aspecto estético interesante su contrapartida es la dificultad para poder visualizar los valores que representan.

¿Cómo mostrar pues toda esa información? Mi propuesta sería el hacer dos gráficos:
En el primero de ellos se pueden ver los valores en conjunto del mercado europeo mediante un diagrama de barras verticales. También se podría haber elegido un histograma. Se solventan las cuestiones expuestas anteriormente. De forma adicional se pone el valor sobre cada una de las barras. El gráfico no es tan bonito como el presentado en el artículo pero la información está más clara.

Infografía mercado por años
En la segunda infografía optamos por utilizar un esquema de líneas. Al tener que representar hasta 8 valores diferentes y de forma simultánea empezamos a correr el riesgo de que el gráfico se nos convierta en una ensalada de espaguetis. En este caso el riesgo no se ha materializado dado que las líneas no se cruzan y que además existen tres grupos de valores con lo que se pueden diferenciar bastante bien el camino que sigue cada una de ellos. El poner como en el gráfico anterior los valores reales en cada punto crearía más confusión que claridad: en lugar de una ensalada de espaguetis tendríamos una sopa de letras, o de números. En el caso de que los valores precisos tengan una importancia real sería menester que los mismos apareciesen en una tabla adicional.

Gráfico de líneas
Resulta opinable si hubiese sido mejor haber puesto en el eje de abcisas múltiplos de 1.000 USD Millon o múltiplos de 500. Como se puede ver he optado por la segunda solución.

Es muy probable que la persona que hizo el post lo único que pretendía con la infografía era da un poco de color al artículo para aliviar la densidad de texto, de hecho la infografía no se corresponde con el contenido del post. En cualquier caso a mi me ha servido una excusa para hacer hincapié en una parte vital de la cadena de valor que genera el big data y que no siempre es tenida suficientemente en cuenta.

No nos olvidemos que una buena visualización será lo que en muchos casos decante al consejo de administración a favor de invertir en nuestra propuesta de un proyecto Big Data o que simplemente nos lo envíen muy cortésmente al ostracismo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *