22/04/2021

Yo mido, tu mides, él mide… pero… ¿quién interpreta?

La visualización de datos es ya “mainstream”, un proceso que va siendo cada vez más común tanto a nivel empresarial, como en los inputs que recibimos en nuestro día a día. Sin ir más lejos, quién no espera ver alguna infografía ahora que se aproximan jornadas electorales…

Este concepto en absoluto es nada nuevo. En el antiguo Egipto ya se realizaban mapas para señalar recursos a excavar. Pero si es verdad, que hay que esperar bastante tiempo para ver visualizaciones parecidas a las actuales y con aplicaciones estadísticas o económicas…como pueden ser las balanzas comerciales de Inglaterra respecto a los países nórdicos.

Otro de los campos en los que ha ido destacado ya desde sus inicios es la Medicina. En 1850 se lograron trabajos cartográficos para intentar detectar las causas de contagio de enfermedades cómo el cólera a través de pintar en un mapa, la concentración de las muertes asociándolas a la ubicación de pozos.

Terminando este recorrido sobre el contexto histórico, no podemos dejar de hablar de las míticas primeras infografías modernas, más complejas y con más variables del ingeniero Joseph Minard. Joseph representó las batallas de Aníbal en el intento de conquista de Roma y de Napoleón en el intento de tomar Moscú.

https://www.abc.es/20121019/cultura/abci-napoleon-rusia-bicentenario-minard-201210182015.html

Tratando de buscar definiciones más formales, se habla de la visualización de datos como “el proceso de transformación de datos en información, mediante elementos visuales con dos objetivos principales, análisis y comunicación”.

Y es que, no solamente consiste en analizar, extraer patrones e insights. Si no que se debe tener como objetivo contestar preguntas, tomar decisiones, ver datos en contexto, presentar argumentos, contar una historia e incluso inspirar…por eso hemos querido dedicar hoy nuestro post a esta fantástica disciplina.

Poniéndonos más técnicos, el paso de datos en crudo a la información y búsqueda de valor debe lograr el conocimiento del receptor de la información, evitando todo el ruido y facilitando la interpretación, pero ¿por qué mediante la visualización de datos? El principal motivo es que agiliza tremendamente el proceso de comprensión, de un solo vistazo.

Estamos acostumbrados a usar el sentido de la vista para todo, es nuestro sentido más crítico y uno de los más diferenciadores, y estamos habituados a extraer una cantidad ingente de información a través de ella. Como apunte, destacar que alrededor de 1/3 de nuestras neuronas van destinadas en exclusiva a este sentido*.

Para más inri, otro de los motivos es que, con la llegada del Big Data, cada vez generamos mayor cantidad de datos, pero la capacidad humana se mantiene estable. El gap entre dato que queremos entender y nuestra capacidad es cada vez más grande. Por tanto, la visualización de datos evita algunos problemas, colabora y complementa a las tablas y cálculos, permitiendo comprender toda información desagregada.

Como ya hemos comentado, a pesar de que esta disciplina no es nada novedosa, podemos afirmar que los proyectos y herramientas de visualización han evolucionado hasta convertirse en instrumentos cada vez más sencillos y accesibles, en gran parte gracias a la tendencia del open data y la necesidad de visualización de los datos masivos. Algunas de las herramientas más notorias dentro de este campo son Tableau (propiedad de Saleforce), Microstrategy, Spotfire, Qlik, Gephi, Carto, Power BI…cada vez más asequibles tanto en precio como en facilidad de integración para las empresas y los usuarios.

Y ahora sí, entrando ya en materia, nos gustaría mostraros de manera visual, no iba a ser de otra manera, las posibilidades y ventajas que pueden arrojar estas herramientas que agilizan y facilitan la toma de decisiones a través de interfaces amigables.

Un básico de estas herramientas es la elaboración de informes y dashboards dinámicos. Para ello, el primer paso es la extracción y transformación de los datos que queremos pintar. Estas herramientas permiten conectarse e importar datos de múltiples fuentes:  archivos, BBDD, servicios en línea…de hecho, cada vez existen más API´s en el mercado que permiten esta conexión.

Una vez se han importado los datos, toca la parte de transformación y modificación de estos. Para ello, las propias herramientas te muestran directamente una opción donde transformar tus datos, mostrando las tablas, la relación entre ellas, sus propiedades y las opciones de configuración para nuevas consultas, además de la posibilidad de agregar columnas nuevas o aplicar estadísticos a las existentes. En esta parte es importante conocer la visual que arroja la calidad de los datos, y es posible únicamente habilitando opciones de vista sobre la distribución y perfil de columnas, mostrando los porcentajes de datos erróneos o vacíos facilitando inclusive la opción de eliminarlos directamente.

Una vez transformados los datos, pasamos a la fase de modelado, asociando tablas mediante relaciones entre columnas comunes. Para la modelización de datos, requiere por parte del usuario un conocimiento previo de conceptos como la normalización de datos, tipos de modelos de datos, llaves foraneas, llaves primarias, nociones de cardinalidad, y tipos de filtros a aplicar en cada caso. Con esta modelización vamos a conseguir reducir la redundancia y preservar la integridad de nuestros datos.

Continuando con el ejemplo anterior de Power Bi, podremos añadir métricas o columnas calculadas al modelo mediante DAX, su propio lenguaje, con una sintaxis intuitiva similar a las funciones de Excel.

Por último, tras el enriquecimiento de nuestros datos, pasamos a representarlo de forma visual. Estas herramientas proporcionan unas plantillas que, de manera sencilla, permiten arrastrar los campos que se desean mostrar, seleccionar tipos de gráficos y aplicar filtros, ya sea de forma individual como a todas las páginas simultáneamente. Además, permite relacionar las diferentes gráficas ente sí. Como principal ventaja de estos dashboards es que son dinámicos, pudiendo ver cómo se comporta la información integrada de mi fuente en tiempo real.

Queríamos destacar que una de las partes más importantes en la representación gráfica es utilizar el tipo de gráfico adecuado, asociado a los datos que queremos mostrar. Os dejamos en este post, una infografía muy útil para este propósito:

https://www.sqlbi.com/ref/power-bi-visuals-reference

Pero como ya hemos mencionado anteriormente, la generación de cuadros de mando es solo una pequeña parte dentro de todas las funcionalidades de las herramientas de visualización. Cada vez son más completas permitiendo técnicas de análisis y visualización avanzada adaptadas a todos los niveles técnicos. Desde Integración de capacidades de IA con Python y Pycaret, la integración y evaluación de modelos de Machine Learning como clasificación, regresión, reglas de asociación, clustering y detección de anomalías, e incluso como analizar tus textos y añadir capacidades de NLP, todas ellas orientadas a enriquecer tus dashboards y que logren contestar de una forma más acertada a las preguntas de negocio planteadas.

Para concluir, y volviendo a la rama de la comunicación dentro de la visualización de datos, queríamos resaltar de la manera que se merece la figura del intérprete de los mencionados informes. Esta figura es sumamente importante, debiendo tener en cuenta a quién irá dirigido nuestro análisis, su lenguaje, la profundidad del conocimiento técnico, e incluso entender sus prioridades…de nada sirve que hayas realizado el mejor análisis del mundo, con ratios y Kpi´s haciendo saltos con doble tirabuzón, si el receptor del mensaje no lo llega a comprender. Esta mala comunicación, puede dar lugar a la paralización de proyectos, o en el peor de los casos a la pérdida de clientes que no vean claro el retorno de su inversión.

Una de las tendencias que en la actualidad se encuentran más en auge alineado con facilitar la comprensión del receptor es transmitir el dato mediante historias o storytelling. Y es que, como dijo la escritora y psicóloga Brené Brown, “Las historias tal vez son datos con alma”.

Si tenemos historias significativas, tenemos datos recordables que van a impactar y conectar mejor con el espectador, despertando su consideración. Además de generar confianza y fiabilidad a través de fijar conceptos y reportar resultados con claridad. Esto en Grupo Ideonomía lo tenemos muy presente en la relación con nuestros clientes.