Celeb Larsen, iTunes, pagerank

Celeb Larsen es un artista/musico/programador residente en Seattle. Hace unos meses, viendo que la popularidad de iTunes habia crecido entre su grupo de amigos, tomo a 40 de ellos, repartidos por todo EE.UU. y les pidio que les enviara su playlist por correo para cruzar datos. El grafico superior indica la correlacion entre canciones y la posicion geografica de los voluntarios que participaron en el proyecto, las lineas unen a individuos que tienen la misma cancion entre sus favoritas y en cierto modo dibujan un mapa completo del pais mostrando claramente cuatro centros de actividad (que corresponden a la posicion de los amigos de Caleb pero que podria indicar perectamente las zonas mas conectadas del pais): Seattle, San Francisco, NYC y Bonton/Nueva Inglaterra. La oscuridad de las 14.132 lineas corresponden la frecuencia con la que el album ha sido escuchado. La pagina del proyecto, que Celeb llama visualizacion de las conexiones inherentes entre amigos tiene mas datos, un grafico mas detallado y el codigo fuente (en PHP) del programa que se ha usado para dibujarlo.
Al ser un grafico no compartido (cada uno se baja las canciones que le parece y luego se las manda al artista) no se aprecia ningun tipo de Power Law en la grafica, (tambien llamado distribucion de Pareto, de Bradford o regla del 80/20) el disegno de las lineas mas o menos sigue una tonica regular y muestra, entre otras cosas, que los colegas de Celeb tienen todos mas o menos el mismo gusto. Uno se puede imaginar que o bien es un grupo medianamente homogeneo (quiza se conocen de algun chat de musica), o bien un grupo muy cerrado de amigos (de los que van a los mismos conciertos) que por algun motivo han decidido irse a vivir cada uno por su lado.
Pocas veces las redes se forman de este modo, generalmente los nodos entran en la red en tiempos diferentes y se conectan a otros miembros de la red existentes en ese momento segun lo que perciben en su entorno en los primeros instantes en los que entran. Si creo un weblog (generalista) y quiero enlazarlo con alguien, microsiervos o la pagina de Enrique Dans tienen mas probabilidades que el blog de mi primo, por poner un ejemplo, con lo que recibirian a su vez mas enlace y mas popularidad cuando algun blog entre “de mi mano”. Clay Shirky publico hace cuatro agnos (que se dice) un estudiode como estas propiedades afectan a los blogs, y como sitios como technorati simplemente obviaban (por entonces) ese hecho que era la base matematica de algo tan presente como el pagerank. (Shirky por otra parte dio una muy buena presentacion de folksonomias en San Francisco que puede verse en linea). Esas redes se denominan de escalado libre y aparece en todas los sistemas (naturales o inventados) que presentan algo que los anglos llaman “preferential attachment“: La capacidad o necesidad de que nuevos nodos de una red se conecten a nodos existentes hace que estos, preferencialmente, se unan con los mas populares, aumentando su popularidad. Esta propiedad fue descubierta hace muy poquito tiempo por un fisico hungaro llamado Albert-László Barabási y las resumio en un librito simple y facil de leer llamado Linked (cuyo primer capitulo puede leerse en linea en la web del autor). Barabasi, por si veis la web, tiene un muy muy muy interesante estudio de porque “nos sincronizamos” con los aplausos.
Este tipo de redes de escalado se observa en redes sociales (myspace o los blogs son un ejemplo), en la estructura neuronal del cerebro, en la web o en la propagacion de epidemias. Una de las propiedades de este tipo de redes es la aparicion de Hubs o centros neuralgicos de forma natural (google, yahoo, Microsiervos…). En enfermedades que hemos tenido la desgracia de ver crecer se ha podido seguir este comportamiento, parece ser que el SIDA, por ejemplo, conto con un “paciente cero” llamado Gaetan Douglas (aunque hay “otros candidatos”), “azafato” gay de Air Canada que “ayudo” a propagar la enfermedad por todo el mundo por su trabajo, su belleza extrema y su promiscuidad (cientos de contactos sexuales por agno). Esta teoria, pese a su consistencia matematica, tiene muchos detractores. Una demostracion muy conocida y divertida de este tipo de redes puede verse en el Oraculo de Kevin Bacon, de la Universidad de Virginia, que es capaz de decirnos que Franco y Kevin Bacon estan mas proximos de lo que pensabamos.
Hace unas semanas, cuando estuve en Europa, vi que varios de mis amigos usan iTunes, Banshee o AmaroK en sus casas para escuchar musica en sus equipos. A varios de ellos les configure y di password en una red de hamachi, que como comente sirve entre otras cosas para “compartir iTunes”. Ademas de eso, mi familia o la familia de mi novia (al completo) tiene acceso a la red. El hub principal de la red (por volumen de canciones) esta en la caja negra del salon de mi casa y de vez en cuando curioseo en los logs lo que cada uno va escuchando de las maquinas que tengo acceso directo (mi servidor y la “caja negra” que tiene mi familia en Cadiz) viendo algunos patrones, canciones que son mas populares y mas escuchadas. Se que muchos de mis amigos no coinciden en mis gustos musicales, por lo que la grafica de Celeb seria mas desigual, lo que si creo es que si hay una enorme presencia de mi musica en esa red, sera mas escuchada que otras cosas mas normales. Sin poder mapear todos los accesos de la Red (obviamente) y por lo tanto sin poder hacer una grafica completa de la comparticion de las canciones en esta red, no me sorprenderia nada raro que nuestra pequegna red tuviera otra pinta muy diferente a la que pinto Celeb en el grafico de ahi arriba y que la mia mapearia mas como se propagan el contenido y las preferencias musicales que una simple representacion estatica de los gustos compartidos preexistentes.
El proyecto de Caleb lo he conocido via Visual Complexity
A ver si configuramos ese teclado en castellano :)
Es flojera mas bien :D ahora “me cuesta”, por cierto, bonitas horas para estar despierto !!!!
Vaya nivelón de blog, muchas gracias por contarnos estas frikadas, tocayo ;-)