Estetica en la visualización de datos

Los ordenadores tienen una limitación (no intrínseca, sino debida a su capacidad limitada de calculo) para comprender y analizar diferentes conjuntos de datos. A día de hoy un ordenador puede darnos patrones y tendencias pero es muy dificil que logre entender la miriada de datos hasta el punto de generar conclusiones o nuevas preguntas por lo que la vieja tendencia a penasar “el ordenador tiene que dar respuestas inequívocas y perfectas” (restos de la programación lineal) se ha pasado a una simbiosos máquina-humano en el que el primero facilita el conocimiento del problema al segundo, que es quien realiza el análisis y las conclusiones. Muchas veces el proceso de solución de un problema pasa por su representación gráfica y por la visualización del mismo (diagramas de flujo, listado de relaciones) ya sea en boli o papel o bien usando modos mas complejos y automáticos de solución. Este tipo de simbiosis ha inspirado otras doctrinas de la informática, como la computación humana en la que las personas realizan unidades o tareas básicas de computación que el ordenador no puede realizar (como reconocer una imágen porno de una lista) para que la máquina las procese y realice las conclusiones (invirtiendo la relación y creando a veces economías basadas en ese principio de modo de granjas humanas para spamear o solucionar captchas).
Una de las formas en que las máquinas pueden ayudarnos a analizar un conjunto de datos es mediante la creación de representación de la información. Los diferentes modos de crear conjuntos de información generan a veces formas bellísimas que representan la relación entre los datos y que muchas de las cuales por su complejidad y aspecto, merecerían estar en un museo.
Aunque el que haya leído estas lineas sabra de mi debilidad por comentar las representaciones que me han llamado la atención (muchas veces de increíbles fuentes como visualcomplexity) merece la pena comentar que revista smashing ha publicado un estupendo artículo desglosando diferentes modos de analizar y comprender la información con ejemplos y la clase de problemas que intenta resolver. Aunque no estan todos los que son, y muchas representaciones merecerían un análisis diferente y otros ejemplos más adecuados, si que es una buena forma de introducirse y entender este campo. El artículo contiene estupendas imágenes y un listado bastante interesante con varios de los recursos y blogs más interesantes sobre el tema.
(gracias por el apunte, Jon)
Links
El artículo es bueno de verdad. Pero los comentarios y los trackbacks están repletitos de información sobre la visualización de datos.
Los ingenieros (y no quiero señalar!) suelen olvidar el enfoque estadístico en muchos de los fenómenos que estudian, apostando por una orientación determinista. En muchos de esos gráficos echo en falta la propuesta de modelos estocásticos para estudiar el comportamiento de muchas de esas situaciones. Y para que veas que los estadísticos han tenido afición desde antiguo por la representación gráfica de los datos, te paso el siguiente link de un artículo publicado en Chance:
http://www.amstat.org/publications/chance/184.feature.pdf
Ahí se habla de Galton, primo de Darwin y padre intelectual de los modelos de regresión lineal. Un tipo polifacético y entre otras cosas, propuso un mapa isocrónico. A los que de pequeños les gustó “La vuelta al mundo en 80 días” seguramente les traerá algunos recuerdos sentimentales.
No me señales que no soy de esos ingenieros antiestadisticas, si peco de algo es de obsesion (casi paralizante, como muchas veces ven en mi entorno laboral) por los numeros y sus relaciones en muchos de los problemas que trato. :) Me apunto el pdf que no lo conocia para leerlo mañnana de camino al trabajo. Obrigado….
Para aquellos que quieran profundizar en el tema, acabo de recopilar numerosas referencias en: http://www.gelo.tv/blog/archivo/visualizacion-de-datos-educar-desvelando-la-complejidad.xhtml
Matthew Ericson, editor gráfico del New York Times, ha dado hace poco una charla en la Infovis Conference (http://conferences.computer.org/infovis/infovis2007/) sobre el trabajo de esta sección. Solamente he podido ver el archivo con la presentación, que tiene unos ejemplos bastante atractivos e interesantes de los trabajos gráficos de este períodico.
El link con el archivo de la presentación me lo he bajado de aquí:
http://www.ericson.net/infovis/InfoVis_Raster.zip