Pedro Jareño was here

Pedro Jareño, que esta haciendo una vuelta al mundo de blogger en blogger estuvo en San Francisco hace unos días y tuve la suerte de conocerle, enseñarle mi parte favorita de la ciudad y hablar de sus ciudades invisibles, la enorme energía que traía, sus aventuras dentro y fuera de Internet, mi vida y el porqué alguien en Silicon Valley se mete a trabajar en Craigslist por ideas, donde uno sabe de sobra que no va a acabar siendo rico.

En su post me dedica unas palabras cariñosas y pone unas cuantas fotos y vídeos del San Francisco que no suelen ver los turistas y de mi restaurante vegetariano favorito del més (donde entre otras estupendas cosas ponen una sangría de vino blanco que está pa-matarse) o del jardin de una casa donde puedes ir a tomarte una cerveza de madrugada y donde el guarda de la puerta literalmente parece que colecciona DNIs españoles. Me sigue encantando ver mi barrio con los ojos de quien lo visita por primera vez.

Por si alguien no lo sabe, Pedro lleva casi dos meses recorriendose el planeta para promocionar Mi Nube, un sitio que por primera vez en muchos años me ha dado envidia de que exista a vuestro lado del Atlántico y no al mío. Mi Nube, que es mezcla compra de billetes y hoteles con red social suelo explicarlo por aquí como una mezcla bastante buena entre Kayak y Yelp.

En la entrevista de arriba hablo un poco de Craigslist, mi blog y mi vida por estas latitudes, una versión un pelín más condensada se emitió hace unos días en el espacio que tiene Pedro en el programa Cámara Abierta 2.0 de La 2.

Conociendo San Francisco con Juan Pablo Puerta (Craigslist)
- Vuelta al mundo 2.0

Ladies and Gentlemen: Jeremy Zawodny

craigslist, yahoo — EwS @ 11:15 pm

Jeremy Zawodny ha anunciado hoy en su blog que viene a trabajar en Craigslist como parte de nuestro equipo de ingenieros. Conozco a Jeremy y trabajé anteriormente con él en Yahoo! y llevo (llevamos) meses esperando la hora en que pudiera incorporarse.

Además de ser el autor de una de las biblias de Mysql, hasta hace pocos días Jeremy era el blogger más característico de Yahoo!: trabajó como ingeniero de Search, metió el software libre hasta en las entrañas de la compañía, diseñó la enorme arquitectura interna de bases de datos y fué uno de los creadores e impulsores de Yahoo! Developer Network, la plataforma abierta de Y!, donde solía aparecer entrevistando a los creadores de las tecnologías internas en la serie de estupendos vídeos que tienen en línea. Hoy día es una de las figuras más respetadas tanto de la blogosfera como de la comunidad MySQL.

Las razones para el cambio que expone en su blog son las de la cultura que ha encontrado en la compañía, lo bien que tratan a los empleados, la calidad técnica que ha encontrado (yay!) y la cantidad de problemas técnicos que estamos enfrentandonos día a día: gestionar el aún brutal crecimiento que aún tenemos y seguir siendo uno de las sitios más rápidos (por delante de google, facebook y wikipedia) de EE.UU. Personalmente se de la sensación de cambiar una empresa grande por una mas pequeña y dejar de depender de una estructura jerárquica enorme (que en lo más profundo creo que es lo que esta matando la compañía) por un entorno en el que simplemente pones tus ideas en práctica sin mayor interferencia. Si los cálculos no me fallan, Jeremy será el empleado 27 de la compañía y tal que hoy estamos creciendo al ritmo escaso de un una persona por año (estoy convencido, como los chicos de 37signals que hay empresas y problemas que simplemente tienen un tamaño optimo para su resolución y el escalar y contratar por el mero hecho de hacerlo puede -que se lo digan a Fred Brooks- a ser horriblemente contraproducente no solo en la visión global de los problemas sino en la misma calidad y velocidad del producto que se genera).

La salida de Zawodny no se relaciona pero se une en el tiempo a lo que parece ser un éxodo de ejecutivos e ingenieros estrella de Yahoo!, en lo que va de semana han anunciado la salida el matrimonio Fake-Butterfield (creadores de flickr) , Joshua Schachter (creador de del.icio.us, ese abandonado de la mano de dios) , Vish Makhijani (ex general manager de Inktomi), Qi Lu (el creador de Panama -el adwords de Yahoo!- cuyo puesto no tiene sentido después del anuncio de cooperación con Google), Brad Garlinghouse (quien controla propiedades como correo, grupos o flickr)y Jeff Weiner (el vicepresidente de la división de redes).

Jeremy Zawodny - I’m Joining Craigslist in July

Craigslist speaks in tongues

EwS, craigslist, i18n — EwS @ 2:56 am

“Release fast, release often” es un mantra que se escucha por estas latitudes, especialmente en empresas pequeñas donde tu equipo de testing (QA de toda la vida) son los usuarios que con el tamaño y los cambios que haces con sus sugerencias empiezan a tomarte cariño, implicarse y tutearte como si fueras uno más de la familia. Dar a las teclas cuando tienes los productos cocidos pero sabes que necesitas inmensa ayuda de los que usan tu trabajo día a día para darle las pinceladas finales y ponerle la firma en una esquinita. Trabajar en Craigslist hace que muchísimas veces, cuando comento donde trabajo a recien llegados tanto aquí como en Black Rock City, reciba abrazos, felicitaciones, regalos (si, regalos) e historias de quien ha encontrado pareja o comunidad, basa su negocio o ONG en el sitio (como me pasó con un chico que pedía en la lista móviles usados para enviarlos, reciclados, gratis al tercer mundo) o simplemente ha amueblado su casa de manera barata.

En Octubre del més pasado activé las primeras versiones internacionales de Craigslist, un proyecto en el que trabajé casi desde antes de que me incorporara al equipo. El primer país fué obviamente España (por ser el mercado que mejor conozco) y la noche de la release, maratoniana de 9 horas mientras todos dormían la recuerdo con los ecos de Radiohead sonando en mi casa (por esas cosas de la profesión, mantengo la surperstición de poner una única canción repetida indefinidamente cuando tengo que concentrarme para que algo salga bien). Desde entonces los usuarios se dieron cuenta y enviaron correos y mandaron sugerencias y dieron paso a los siguientes países latinoamericanos y algunas ciudades estadounidenses pequeñitas en la frontera con México.

La semana pasada activé las teclas para que salieran las versiones en Italiano, Portugués, Francés (con variación local en Canada) y Alemán, y no pensaba (de nuevo) decir nada y comentarlo todo tranquilamente a la vuelta de las vacaciones de no ser por Techcrunch que se le han chivado (ese “basque, maybe klingon” como siguientes idiomas es una frase que suelo decir muchas veces de cachondeo en la oficina, por cierto) y los amigos queridos que llevan tiempo deseando dar la voz. Las versiones son muy americanas, la categorización se mantiene intacta y hay muchos restos de inglés que (por motivos legales o técnicos) aun están asomando la patita, la actividad de los futuros usuarios en los idiomas locales me darán los patrones de uso más adecuados para los diferentes sitios y poco a poco con la actividad, se irán refinando.

Quien haya seguido este blog desde hace tiempo sabrá que suelo hablar de las complicaciones de la internacionalización, de como este mundo es un objeto mucho más complejo de lo que pensamos y que actitudes o sistemas que nos parecen normales en una zona del mundo no tienen ningún sentido en el otro. Como quedó reflejado en el documental “24 horas en Craigslist” (que se realizó enteramente con recursos encontrados en el sitio), Craigslist es un fenómeno muy de la zona de San Francisco (donde consigues un sofá y un polvo de una noche con dos clicks de ratón, donde contactas con tus vecinos para manifestaciones políticas y te apuntas a un club de bisexuales veganos para ir a pasear en monociclo colina abajo por las cuestas), el sitio no tiene publicidad casi por norma sagrada de la casa, nunca tendrá logo ni un diseño más complejo que lo que veis y nunca se cobrará nada en los sitios internacionales que vaya sacando (lo cual hace que tenga que responder la famosa pregunta de “como sacamos dinero” cada vez que conozca a alguien). Repetir algo así, tan de San Francisco, con mis propios y únicos medios precisa de un acercamiento al problema de manera diferente, el de dejar que sean los propios usuarios definan sus modelos de comportamiento y conseguir poquito a poco, no solo que Craigslist se acerque a la cultura de cada ciudad en la que esta presente, sino que pueda definirse incluso a nivel de barrios y comunidades más pequeñas. Cuando una empresa quiere permanecer pequeña tiene que buscar modos de crear herramientas para incorporara a su base de usuarios a la creación del proyecto. Craigslist no es un sitio de clasificados normal, no es una búsqueda de pisos ni una inmobiliaria, conocer a los seres que en ella puebla es entender lo que hay de especial en esta ciudad y lo que la hace única. Craigslist, en cierto modo, hace de espina vertebral de todo lo que de raro y friki hay en San Francisco. Es una tontería, pero el diseño simple y la no existencia de anuncios o ímpetu comercial agresivo hace que los usuarios puedan sentirse en su casa y creen vínculos de cariño con nosotros y los propios usuarios que generan comunidades y usos interesantísimos del sistema (recomiendo echarle un vistazo al documental al que me refería antes -en este torrent tan majo por ejemplo- para entender de lo que hablo)

La tarea que tengo como responsable de una expansión internacional es mucho más sencilla y divertida de lo que parece. San Francisco es la primera ciudad de Craigslist, y NY la segunda pero Filipinas por ejemplo (y mas lejos, Hong Konk) le siguen muy cerca en tráfico. En estos sitios donde existe un problema de “huevo o gallina” los efectos red crean situaciones interesantísimas. En absolutamente cada mercado que lanzaré (quitando el siguiente sitio, una medio coña en latín para la Ciudad del Vaticano) hay un sitio bien establecido con el mismo modelo, generalmente propiedad de ebay y que ayuda a mucha gente en sitios donde no hemos estado antes. La presión de ganar dinero en los mercados locales, que no existe ya que conseguí que me lo prometieran antes de embarcarme en esta aventura, esta diluida por lo que espero sea una oportunidad de conocer mejor los diferentes lugares y rasgos de las culturas a las cuales estarán dirigidos los futuros sitios, sin tensiones económicas y con una mejor posibilidad de poder servir a los usuarios, que al final son los que te toman cariño y los que te dan las mejores satisfacciones.

(ahora si de verdad que me voy de vacaciones)

Un cambio de nada

Mirando por encima los logs veo que la mayoría de los que os pasais por aquí me leeis a través de lectores RSS, así que no notareis nada raro, feedburner tiene un sistema de redirección de sitios bastante majo que me ha simplificado la vida horriblemente. Para los demás, habreis notado que el blog apunta ahora a folksonomy.com en lugar del antiguo blog.folksonomy.com y que ha cambiado un pelín el diseño.

Los cambios se deben principalmente a que el antiguo hosting (la máquina que era folksonomy.com) era un ordenador dedicado en un cluster en el medio del desierto pordiossabedonde que teníamos un amigo expatriado americano y yo desde hace la tira y que corría una venerable debian sarge (la misma versión de la que mi abuelo usaba en la guerra) que como todos por supuesto sabeis deja de tener soporte de seguridad desde el próximo 31 de Marzo, por lo que nos decidimos que o bien cambiabamos de bicho y tirabamos cada uno para su lado (cosa que al final ha pasado porque al final cada uno solo lo usaba para sus blogs y chuminadas) o bien instalabamos algo de este siglo. El contrato del hosting acaba a final de més y la primera idea que tenía en mente era contratar alguno hosting de esos que salen cuatro perras pero sabiendo que en casa tengo máquinas de sobra (dos servidores -pronto tres- y cuatro portátiles) decidí intentar montarlo en casa ver que pasa. Los problemas no son tanto de máquina como de ancho de banda y disponibilidad: comcast tiene una predilección a reiniciar su red a las cuatro de la mañnana (una de la tarde en casi toda España) de vez en cuando y mi gato tiene tendencia a pasar caminando justo encima del botón de apagado de cualquiera de las máquinas en el momento menos oportuno, además de eso mi red adsl no es nada del otro mundo (16 megas de entrada y uno de subida) y la conexión se suele usar para bajar contenido (documentales, películas, series, música), stream de radio, telefonia ip, servidor externo de ficheros y un rsync remoto que se activa cada pocas horas y lo que quieran hacer los vecinos que se conectan desde sus casas o el parque Dolores, que esta a dos pasos, por lo que como dicen aquí “los tubos estan un pelín atascados”.

La máquina que va a alojar el blog es la que siempre esta encendida (la caja negra), un bichillo VIA de 800mhz y un giga de memoria sin ventilador, con un par de terabytes de disco externo, la cual se utiliza principalmente como servidor de películas (con un p2p via deluge que se activa cada vez que algun programa interesante se asoma al RSS), servidor de correo imap y webmail (filtrado con procmail, eliminación de spam con spambayes…), emisión de música vía mt-daap, unas cuantas sesiones screen desde donde entro al IRC cuando estoy fuera. Para aprovechar los recursos de esta máquina al máximo y para que el tráfico no la mate del todo es necesario ajustar mas o menos decentemente el software que va a correr. He sustituido el viejo lighttpd que me servía para acceder al webmail y al pitchfork por nginx, que es un placer de configurar, una mala bestia, se enchufa solo al memcached y en las pruebas que he hecho de rendimiento no consigo que ocupe más del 10% de procesador por mas peticiones que le haga (generalmente en un uso de tráfico normal me consume un 2%). El ningx se conecta a php por fastcgi y cachea las páginas con memcached (las debería cachear automáticamente al menos), el php lo tengo bastante oxidado pero he instalado eaccelerator y ajustar un par de valores de rendimiento y el mysql, que tiene el cache desabilitado, esta limitado a un único proceso. El tema del cache de mysql me viene de experiencia profesional. La base de datos es la última línea de defensa y el usuario tiene que llegar a ella después de pasar por memcached o cualquier sistema que tengamos para cachear objetos, no se si habrá aĺgún experto en bases de datos en la sala pero el sistema que tiene mysql para cachear (y la velocidad de búsqueda dentro de este cache) hace que solo tenga sentido para guardar el resultado de peticiones especialmente costosas. Craigslist por ejemplo, que tienen nivel de accesos que se cuenta por las decenas de miles por segundo, tiene los caches de mysql totalmente desabilitados (lo cual se consigue mediante un cache hit-rate en el frontend superior al 99% de las peticiones)

En la oficina tengo una conexión bastante decente desde la maquina donde trabajo y en las pruebas que he estado haciendo (con el estupendo pylot generalmente) consigo tumbar el ancho de banda que tengo en casa mucho antes de que el servidor empiece a notarlo, por lo que la parte software esta más o menos solucionada. Consigo lanzar procesos, poner películas y dejar cosas bajando que las iptables consiguen por un lado que las páginas se sirvan decentemente y por otro que en el caso de que alguien este haciendo un uso “en tiempo real” de la máquina (una sesion ssh, una película), no tenga ni que notarlo. Pero como la fuerza de una cadena es la misma que la de su eslabón más débil aún queda por ver que pasa en caso de que alguna entrada salga en algún sitio de mucho tráfico, a comcast le de por cancelarme el servicio, pete un disco duro o el gato se coma un cable. Para colmo en dos días me marcho semana y media de vacaciones y la hermana de Justine, que suele quedarse en casa a cuidar del pequeño Linus, tiene una afición a desmontar la red en cuanto salimos por la puerta (he llegado a pensar que, con su plena adolescencia, esta mujer ha desarrollado algún tipo de filia consistente el chupar cables eléctricos), con lo que lo más seguro es que en unos días, todo se vaya al garete y me quede sin blog hasta mi regreso, donde puede que me deje de fantasear con la posibilidad de alojar mi propia información y recapacite sobre esta y otras ideas geniales.

El template también lo he cambiado medianamente, quitando lo que Tufte llama “administrative debris” y desaciendome de elementos que no dan ningún tipo de información sobre las noticias que escribo (el logo de la gota de agua, los enlaces de administración y otros elementos gráficos superfluos). Lo único que he añadido es una pequeña sparkline con la actividad de los últimos 30 días y unos contadores de noticias por sección y fecha, generalmente que debo ordenar los posts muy antiguos (siguen formando un cluster en torno a agosto de 2006) y para recordarme de cuando dejo bastantes días sin escribir o temas sin tocar. La idea que tengo es, (siempre que yslow me diga que lo sigo haciendo bien) ir eliminando cada vez más elementos gráficos y dejar solo lo que considere que es indispensable (para ello iré mirando logs -algo que no hacía antes, ya que los desactivé-) para ver si los que entrais soleis ir a secciones, usar el buscador o simplemente llegais por alguna búsqueda en google de esas que siempre hace gracia compartir (en cuyo caso creo que eliminaré el resto de enlaces). Las fotos de flickr también han desaparecido porque no creo que tengan mucho sentido y el yslow se quejaba del excesivo peso del sistema de autentificación por openID que tiene wordpress (que era una de las ideas principales que tenía), ya que te envía jquery y tres o cuatro ficheros más por lo que se queda en el cajón de las ideas para un poco más adelante.

Sobre el hosting, la otra opción es alojar el blog desde alguna máquina de la oficina. Como cualquier empresa de Internet con cierto tráfico, la cantidad de servidores que se quedan obsoletos y acumulamos es enorme (curiosamente, en una empresa de este tipo, el coste más alto -después del humano- es el la energía y ancho de banda, por lo que el espacio de rack y el consumo eléctrico se convierte en un bien preciado que hace que las máquinas cedan su paso más rapido de lo que sería normal), haciendo que tengamos la casa literalmente llena de bichos por todos lados sin saber bien donde meter y que solemos quitarnos de enmedio donandolos a museos o centros educativos. El grupo de servidores que tenemos lo donaremos a riseup, una organización anarquista con sede en Seattle que aloja la mitad de los grupos activistas del planeta (una especie de Sindominio a lo bestia) y que entre otras cosas tiene un colo público con la mayor instalación de mailman del planeta. (otro grupo de servidores irán directamente a formar parte de la nueva base de datos de la campaña de Obama, ya que uno de nuestros administradores de sistema no para de dar la puta coña con Obama todo el santo día es bastante activo en su campaña). La oficina tiene un cable de fibra óptica propia que llega a Main 365 (nuestro colo, en SOMA) y desde allí directamente a San José, a unos 80 km, para conectar con el backbone, con lo que el blog, con las máquinas y el ancho de banda, no estaría en situación mejor, pero la idea de tenerlo cerquita en mi casa y de analizar y ver lo que tarda en petar medianamente era más que atractiva (además de lo bien que me lo paso probando y configurando los servicios yo mismo) por lo que lo dejo, cruzo los dedos y me voy de vacaciones a ver que sucede a mi vuelta.

Stallman no usa navegador

Gilipolleces, craigslist, hackers — EwS @ 6:16 pm
For personal reasons, I do not browse the web from my computer. (I
also have not net connection much of the time.) To look at page I
send mail to a demon which runs wget and mails the page back to me.
It is very efficient use of my time, but it is slow in real time.

Richard Stallman en misc@openbsd.org

Ya me explicará como hace para publicar ciertas cosas….

(Donald Knuth, por cierto, no utiliza ni el email y no me puedo imaginar ningún otro programador que haya escrito más que culquiera de estos dos…)

Gilipollez del día en Craigslist

Gilipolleces, craigslist, hackers — EwS @ 11:17 pm

Busco a una mujer que desee criar un hijo por el método Unix.

Un hacker de los de consola busca pareja en Nueva York para evitar que la estirpe se pierda. Y aunque algo (remotamente) relacionado con el curro me entero por la prensa. (por cierto, ojo con detalles tales como las edades que pide….)

Calendarios

craigslist, historia, i18n, informacion — EwS @ 2:40 am

XI. Le jour, de minuit à minuit, est divisé en dix parties, chaque partie en dix autres, ainsi de suite jusqu’à la plus petite portion commensurable de la durée. [….] La centième partie de l’heure est appelée minute décimale; la centième partie de la minute est appelée seconde décimale.

Decreto de la Revolución Francesa de Octubre de 1973 que instauraba el tiempo decimal en la nueva república.

Hace un par de días terminó Chanukak, la conocida como Navidad judía y que es una fiesta sin casi importancia en el calendario hebreo (mas que por la casi coincidencia con la navidad y el consumismo que eso trae) que consiste en la iluminación diaria de una serie incremental de velas en la Menorah. El año pasado (mi primer Chanukak) la fecha cayó Al contrario que los fiestas cristianas o paganas, (basadas en Calendarios solares como el Juliano o Gregoriano) o las Islámicas (basadas en calendarios lunares), las fiestas judias se corresponden a días particulares en un calendario lunisolar, que tiene en cuenta tanto la fase lunar como la rotación de la tierra en torno al sol. Los calendarios lunisolares tienen la particularidad de añadir un més completo (”més bisiesto”) siete veces en períodos de 19 años. Como las comunidades judías de hoy viven en zonas donde se utilizan calendarios solares, las matemáticas para el traspaso de fechas suelen ser monstruos inmanejables que muchas veces necesitan de estandarización y redondeos (un explicación por aquí).

Los calendarios y las horas han sufridos vaivenes políticos, el 9 de Diciembre pasado, Chavez ordenaba que Venezuela pasara a su propio huso horario (que pasa a denominarse UTC−4:30Q y que contiene a ese único país) con diferencia de media hora con respecto a sus vecinos. Otros países como Irán y Nepal tienen sus propios husos horarios (este último denominado UTC+5:45E y diferenciado 15 minutos del que le correspondería). La revolución francesa, como veremos mas tarde, cambió las semanas a períodos de diez días y durante más de 10 años, la unión soviética pasó a usar el calendario Gregoriano de nuevo (en lugar del Juliano que ahora usan) comiéndose en la transición medio més de febrero de 1913.

Las diferentes formas de entender la organización de días en el calendario es solo una muestra de nuestras diferencias. El mundo es un objeto extrañísimo y el bagage cultural que llevamos encima nos hace ver el resto de las culturas con un único prisma y dar por hecho elementos culturales que pueden ser totalmente diferentes en otros países y causar más de un problema. Mi trabajo es (en parte) pensar esas diferencias y aplicarlas casi a nivel local. Al contrario de muchos sitios que basan su expansión en la búsqueda de la captación de un usuarios globales, Craigslist es brutalmente local. La gente que entra al sitio no esta interesada en lo que le rodea (no tiene sentido comprar una bici usada o buscar pareja al otro lado del mundo) por lo que el valor de las interacciones disminuye con la distancia. La globalización no tiene que ser una americanización de la cultura sino una mezcla de las diferencias y una adaptación y respeto a los rasgos que nos hacen únicos. Tenemos la tecnología que nos permite esa adaptación y las trazas que los usuarios van dejando por la Red (al acceder a nuestro servicio, al escribirnos) permiten definir de forma precisa y glanular el mapa de nuestras diferencias. Desde hace mucho, la empresa se ha enfocado en mantener el servicio cuanto más local mejor y nuestros movimientos, conforme el número de usuarios crece exponencialmente, se acercan a conseguir más y más diferencias entre las diferentes ciudades en las que Craigslist opera.

Ve a Craigslist y pon el mismo anuncio en dos ciudades suficientemente distantes y serás bloqueado. Ven repetidas veces a poner anuncios particulares con una ip que no cuadre demasiado con la del lugar a la que accedes y no creo que dures mucho. Cuando uno viaja se da cuenta de diferencias sutiles o no en diferentes partes del mundo, diferencias que son mayores en Europa y que se muestran en nuestos diferentes estilos de vida, acentos y formas de divertirnos, trabajar, tomar vacaciones y relacionarnos. El objetivo de mi trabajo en Craigslist es crear la plataforma donde los usuarios puedan dar cabida a sus propias diferencias.

No es un trabajo fácil. La empresa es americana y nacio enfocada en una zona del mundo muy determinada (la Bahía de San Francisco). Craigslist, como casi todas las empresas de Internet de la zona, adolece de cierta miopia. Una forma de expresar la ceguera de ciertas empresas a todo lo que no sea americano es en la existencia de dos personalidades en la gestión de mis tarjetas de crédito.

Como gran parte de los españoles, tengo dos nombres y dos apellidos. La estructura normal de los nombres en Estados Unidos es un único nombre seguido de un middle-name generalmente escrito como una única inicial (y que por tradición suele ser el de un familiar muerto) y un único apellido. La estructura de mi nombre es suficientemente irregular para que haya visto todo tipo de usos en los más de tres años que estoy aquí. A veces soy Mr. Puerta, a veces Mr. López, a veces Mr. Pablo y cualquier tipo de combinación inimaginable entre medio (he de recordar que mis medicinas estan a nombre de Puerta-López y mi seguro médico al de Puerta López, sin guión). Las dos tarjetas de crédito que tengo (una para irme dando un buen historial de crédito y pillar millas y la otra “por si acaso”) estan en el mismo banco pero las crearon con dos nombres diferentes (Juan P. López y Juan Pablo Puerta López) que no me molesté en unificar en su día. Los dos nombres o identidades mantenienen dos historiales de pagos o impagos completamente separados. Juan Pablo Puerta no usa casi nada su tarjeta y se olvido de hacer un pago de un dominio que no esperaba, lo que hizo que el més pasado crédito bajara a límites horribles y empezara a recibir ofertas de oscuras empresas ofreciendoles tajetas de alto interés. Por su parte Juan P. López ha pagado siempre sus facturas a tiempo y ha visto en el mismo més como su línea de crédito se ha duplicado. En un día normal puedo recibir dos ofertas completamente diferentes de las mismas empresas de crédito, una destinada a quien se suele olvidar de hacer los pagos y otra ofreciendo mucha liquidez a alguien con supuesto mayor poder adquisitivo.

Mi banco, mi farmacia y la empresa en la que esta mi seguro médico me ven con una óptica americanocéntrica. Aunque es un error garrafal, es algo muy dificil de evitar a priori y todos, en mayor o menor grado, tenemos una cierta miopía hacia las estructuras de los nombres de otras culturas.

Damos, por ejemplo, por hecho que los apellidos son inalterables pero no hay nada más lejos de la realidad. Dando un simple ejemplo, en el nombre Björk Guðmundsdóttir, Björk es el nombre de pila. La segunda parte indica el nombre de pila del padre (o a veces de la madre) seguido de -sson para un hombre o -sdóttir para una mujer (compar la estructura con la de la popular blogger y fotógrafa Rebekka Guðleifsdóttir). El apellido, además de cambiar de estructura, es más una descripción que un signo de parentesco en sentido occidental. El padre de Björk, Guðmundor, era el hijo de Gunnar, por lo que es Guðmundur Gunnarsson. Mi amiga Daria, por ejemplo, vió como su apellido cambiaba cuando sus padres emigraron de la Polonia comunista, perdiendo la marca de género de los apellidos eslavos y la familia de mi novia ha occidentalizado su apellido (que sufrió muchas mutaciones en el trascurso de su migración a EE.UU). Apellido que tienen, por cierto, solo desde principios del siglo XIX cuando el Zar Alexander ordenó en 1804 que todos los judíos que vivían en territorios aledaños a Rusia (generalmente los Ashkenazim) adquirieran apellidos para homologar la estructura de los nombres en la zona. Los Ashkenazim no usaban ningún tipo de apellidos y los tomaron según la relación con la zona en la que vivían (cuisamente no siempre se puede reconocer a los judíos por los apellidos, en EE.UU. el apellido judío mas popular es Miller y con esos nombres, nadie diría que Natalie Portman (Natalie Herschlag: נטלי הרשלג) o Paula Abdul son judías de arriba a abajo….)

Además de cambios en la estructura del apellido, se pueden dar cambios en el orden. En el nombre 毛泽东 (mao ze dong) el apellido es Mao, Ze es un nombre generacional que es común a sus hermanos y hermanas y Dong sería el nombre de nacimiento. La forma de referisse a Dong cambiaría de lo formal y anticuado (毛泽东先生 (mao ze dong xiān shēng) o 毛先生 (mao xiān shēng)) a los coloquiales Ze Dong o simplemente Dong (solo cuando hay mucha confianza). Este sistema se usa en países asiáticos (China, Taiwan, Japón, Korea) y algunas comunidades Europeas, especialmente en Hungría. En vietnam tienen una estructua americana a la inversa (ej: el primer ministro de Vietnam: Nguyễn Tấn Dũng aunque los viernamitas usan el nombre y no el apellido en las formas de cortesía (mr. Dũng)). Los chinos que trabajan en Silicon Valley, por cierto, suelen adoptar nombres occidentales para evitar problemas (el nombre real de Jerry Yang, fundador de Yahoo es 楊致遠 o Yáng Zhìyuǎn). Los indios tienen una estructura Apellido-Nombre del padre-Nombre (Velikkakathu Sankaran Achuthanandan) y tanto entre algunas castas índias como en algunos países árabes la estructura de los nombres contiene información de casta, familiar, de lugar o religiosa (Abu Karim Muhammad al-Jamil ibn Nidal ibn Abdulaziz al-Filistini).


Para colmo, la práctica totalidad de la humanidad usa formas de escrituras no recogidas en la codificación Latin-1, por lo que no solo hay que estar lidiando con la correcta estructura de los nombres al presentar una información, sino con la correcta codificación y orientación del texto. Usar, por lo tanto, un formulario para un usuario que le pida simplemente nombre y apellido puede ser un atentado a su particularidad cultural tan grande como el que me hace el banco cada vez que me “genera” un nombre.

Además de los calendarios y los nombres, la hora es otra de las variaciones que encontramos en los diferentes países. Quitando ese horror marketininano del Swatch Internet time de hace unos años, muchos países tienen su propia forma de expresar la hora. En la cultura europea hablada y en la norteamericana usamos el tiempo de doce horas con un sufijo que indica el período del día que corresponde. Sin embargo, los Europeos preferimos y usamos con normalidad el sistema de 24 horas que los yankis aborrecen, son incapaces de convertir y lo denominan como “estructura militar”. Además de yankilandia, Australia, la parte anglófona de Canadá, Filipinas y Nueva Zelanda son los únicos países que usan exclusivamente el formato de 12 horas.

Aunque casi todos usemos un sistema dodecimal, no tenemos unanimidad en cuando situar el principio del día, el Swahili entre otros idiomas africanos coloca el principio del día en el amanecer en lugar de la media noche y considera toda la noche como perteneciente al día anterior y no al siguiente (El martes no se convierte en miércoles hasta que no sale el sol). En países africanos bilingues el mismo hecho puede referirse a las ocho de la mañana (si se habla en inglés, por ejemplo) o las dos de la mañana (saa mbil, si se habla en Swahili), los hablantes ajustan el formato horario al idioma que usen en ese momento. Los formatos tamobién cambian enormemente de país en país. Los occidentales solemos separar horas y minutos con dos puntos, aunque muchos franceses usan la h como separador. En el caso de usar el formato de 12 horas, en los países de habla hispana e inglesa se usa AM y PM, cada país restante usa su formato nacional (por ejemplo “πµ” y “µµ” en Grecia) con algunas excepciones, como en China y Taiwan, que usan un sistema de siete sufijos y prefijos para indicar los diferentes períodos del día.

Por si fuera poco, no todos los países se han aclarado en usar un formato de 12 o 24 horas. El caso más extremo es el de Tailandia, que usa su propio reloj de 6 horas por lo que un día se compone de cuatro vueltas de reloj. Ha habido, además, experimentos sociales de modificación y racionalización del uso de las horas como durante la Revolución Francesa, donde se instauró brevemente un sistema horario decimal, donde un día quedaba dividido en diez horas, cada hora en 10 minutos, cada minuto en diez segundos y así sucesivamente con formas cada vez más pequeñas de medición. Los días a su vez, se englobaban en decades o semanas decimales (primidi, duodi, tridi…). Los días del año por cierto recibían una nombre único conforme a los animales o plantas que se recogieran en ese período. Pese a la enorme belleza y elegancia del sistema los franceses no fueron los únicos: China usó un sistema decimal de tiempo llamado Ke durante siglos hasta que el sistema europeo fué introducido por los jesuitas.

Para mí, entender estas variaciones son básicas si estamos en el proceso de construcción de una plataforma que sea natural a comunidades locales en diferentes partes del mundo. Quitar el rasgo americanizador de una herramienta tan usada es horriblemente difícil (especialmente cuando literalmente somos cuatro gatos) tanto a nivel de como se expresa la información como a nivel de clasificación e interacción del contenido. Si lo vamos consiguiendo, se dira con el tiempo… El post me ha salido horriblemente largo, pero es solo un porcentual pequeñísimo de la totalidad del problema. Espero que en un futuro, cada vez más empresas empiecen a ser más humildes y a usar otro tipo de globalización y a entender y respetar las diferencias locales de cada comunidad para adaptarse y acercarse a las mismas.

Wikipedia tiene una enorme colección de la estructura de los nombres en varias decenas de idiomas
Varios de los ejemplos del post los he sacado del estupendo blog de Rishida, del w3c
Calendarios solares, lunares y lunisolares
Los nombres de los días del año del calendario revolucionario francés.

Diferencias locales al buscar pareja

craigslist, informacion, politica — EwS @ 10:29 pm

Toby Segaran, un neozelandes emigrado recientemente a San Francisco y autor de Programming Collective Intelligence de O´Reilly (una auténtica maravilla llena de algoritmos en python de la cual estoy dando cuenta desde hace unos días a base de quitarme horas de sueño) ha tomado una muesta de 500 anuncios de contactos personales en los craigslist de cinco ciudades diferentes y ha encontrado una serie de patrones de palabras que se repiten que aunque tremendamete simples dan una idea de lo que suelen buscar o promocionar de sí mismos los que buscan pareja en el sitio en el que trabajo. La categoría w4m se refiere a chicas que buscan chicos para una relación mas o menos a largo plazo (en contraste de casual encounters que sería lo equivalente a quedar para echar un casquete rápido).

Los patrones más interesantes son una mayor cantidad de términos relacionados directamente con el sexo en Nueva York, una mayor cantidad de términos relacionados con la vida al aire libre en San Francisco (por el clima, supone el autor) y una mayor cantidad de exageraciones con términos relacionados con la industria del cine en L.A.

Aunque el estudio es simplísimo (las palabras se han analizado separadamente sin tener en cuenta términos completos entre otras muchas cosas) es interesante ver como el carácter definido que cada ciudad se refleja de cierto modo en unos simples anuncios destinados a buscar pareja.

Hablando de Craigslist y dado que varios vieron ese vídeo de cuado Craig salió el The Daily Show (me sorprede que un personaje tan de aquí despierte interés al otro lado del charco…), decir que ayer se estrevistó a este casi adorable friki en The Colbert Report, un spin off del programa que se presenta cada noche el genial John Stewart y que representa a un falso republicano (mientras que Stewart es claramente un judío demócrata) que exagera y se cachondea cada noche de la simbología y los modos de los conservadores de este país. Desde el pucherazo electoral que dió el poder de nuevo a Bush en 2004, muchos americanos ha recurrido a colocar bumper stickers (pegatinas en los coches, algo muy yanki) pidiendo que la pareja se presente a la presidencia en las elecciones del próximo año. Siguiéndoles el juego, Colbert anunció que se va a presetar a las primarias de AMBOS partidos por el estado de Carolina del Sur, por lo que suele llenar su programa de coñas referentes a ese estado. En la entrevista se tocó el tema del diseño horrible del sitio, la negativa a vender la empresa o la acusación de varios periódicos de estar matando una de las fuentes tradicionales de ingreso de las publicaciones, por lo que a veces nos han llegado a acusar incluso de estar detrás de la guerra de Irak…. curiosamente nadie del curro tiene tele en casa (no había caido hasta ahora) por lo que el vídeo de la entrevista tuvimos que verlo via torrent y en diferido….

Links
Mining Social Data: Craigslist W4M
Stewart/Colbert 08
The Colbert Report puede verse en línea en el sitio de Comedy Central
También puede verse con mas calidad donde siempre

The Wallet Test

Paul Kinsella dejó deliberadamete 100 carteras idénticas delante de cámaras ocultas para analizar si los que la encotraban decidían devolverlas. Cada cartera contenía dos dólares y 10 céntimos en metálico, un supuesto cheque regalo de 50$ y un carnet de conducir con la dirección clara del supuesto dueño (además de otros objetos que suelen encontrarse en las carteras, como notas o tarjetas de visita) como puede verse en la descripción del experimento.

De las 100 personas que “tomaron parte” en el test, 74 fueron honestas y devolvieron las tarjetas con todo su contenido, 26 se quedaron con ellas (ojo que tenía solo dos dólares) de las cuales tres intentaron usar el cheque regalo. Los resultados se dividen por sexo, edad (aprox) y raza y el sitio contiene hasta vídeos del encuentro e imágenes de satélite de las localizaciones de las distintas carteas.

La cosa queda más como una anécdota que otra cosa. La muestra es algo pequeña y eso, junto con la aleatoriedad de la misma (los que pasaban por allí) y el uso de una cantidad monetaria fija y pequeña y en lugares más o menos similares no puede considerarse ni como representativa de ningún grupo específico ni como un estudio medianamente serio de las actuaciones de diferentes conjuntos poblacionales (por lo poco que me acuerdo de estadística de carrera). De todos modos si es interesante el observar que (contra todo pronóstico ya que a veces pienso que tendemos a pensar que todo el mundo es malo y ahí afuera solo hay dragones) 3 cuartos de los que encontraron carteras con calderilla se dieron la molestia de devolversela a su legitimo dueño.

Aunque no se relaciona ni de lejos (ya que son bromas mas que estudio) Craigslist ha sufrido casos parecidos de intentar analizar el comportamiento que se supone privado. Hace cosa de un año a un tal Jason Fortuny no se le ocurrió otra cosa que colocar un anuncio falso en la sección de “casquete rápido” de CL Seattle pidiendo algo de BDSM pal cuerpo y publicó todas las respuestas con fotos y sonidos en la encyclopaedia dramática (al loro con la foto que puso) a lo que le siguió una copia idéntica en CL Portland. Wired lo catalogó de sociopático en su día y uno, que se gana la vida como se la gana y que ve muchas cosas por estos ojitos solo piensa por un lado que este el reverso del anonimato que queda implícito en el sistema y por otro que el exponer claramente con tus datos reales de primera algo que no quieres que se sepa a un total desconocido es síntoma de no haber entendido del todo que nos hemos metido de cabeza en una sociedad cada vez más transparente y pública. Por otro lado el pasado Mayo alguien (con más ganas de coña que otra cosa) escribió un missed connection falso de una chica en CL New York para ver quien contestaba. A los que lo hicieron les contestó “estas escribiedo a mi novia, gilipollas!”.

The Lost Wallet Project

White Glove Tracking: Resultados

Gilipolleces, arte, craigslist — EwS @ 12:23 am

Hace unos cuantos días, charlando con unos compañeros de Craigslist sobre comportamiento emergente y mostrandole ejemplos en Internet me di cuenta que los chicos de White Glove Tracking Project habían terminado su trabajo. WGT es un esuerzo colaborativo en el que esta metido Rhizome.org y del que ya hablé en su día, que resulta tan inútil como seguir el guante blanco de una legendaria actuación de Michael Jackson por la pantalla frame a frame usando el trabajo de colaboradores en línea, pero que es muy interesante (en mi opinión) para investigar los mecanismos en los que en conjunto de usuarios puede llegar a pensar como una cabeza única. El vídeo tiene tiene el cuadradito amarillo resultado de la colaboración de varios miles de voluntarios y esta a descarga con mejor calidad en el sitio del proyecto, que incluye datos en formato texto para el proceso, series de frames, el código fuente de las aplicaciones y extensiones para usar los datos en programas como el estupendísimo y adictivo processing

El comportamiento emergente es algo que en la empresa en la que trabajo se usa desde casi que nacio. En cada anuncio la gente tiene una serie de enlaces en los que selecciona lo apropiado o inapropiado del contenido y por detrás hay una serie de mecanismos que determinan si el anuncio debe ser reclasificado, borrado, movido a una categoría con los mejores anuncios o simplemente el sistema tiene ignorar el voto. El comportamiento de varios millones de usuarios a la vez crea el problema interesante del volúmen de información que se recibe, y en análisis de variables tales como la proporcion de votos con respecto a las visualizaciones de un anuncio que se necesita para tomar alguna accion (siempre dependiendo de un análisis del contenido del texto y del autor del mismo) o que valor se le da a cada voto dependiendo de la historia anterior conocida del usuario que vota, para lo que hay muchas técnicas estadísticas clásicas que nos ayudan, generalmente seleccionando ejemplos de buen y mal comportamiento y estableciento tanto patrones de comportamiento como porcentaje de apariencia de abuso a partir de lo cual es más conveniente descartar la acción del voto (lo mismo que hace un filtro antispam pero un pelín más complejo). Si dejaramos cualquier voto al azar, surgirían espontaneamente hordas censoras que patrullarían el sitio borrando comentarios que no comulgaran con sus ideas (algo así esta sucediendole a sitios como digg o menéame por lo que creo (y es algo personal) que es una falta de análisis en la maquinaria que no ve el usuario). Ha habido al margen de eso horrible que es la web2.0 proyectos voluntarios que han salido rana por falta de post-processo como (lo comente alguna vez) dejaron la Google Galicia como un bebedero de patos. A veces es interesante observar al pequeño censor que muchos usuarios tienen dentro, desde el que consigue una cita con una chica e inmediatamente después del contanto intenta borrarla del sistema para que no aparezcan más candidatos a empresas que intentan borrar los anuncios de empresas rivales, en los foros de CL se ven muchos usuarios intentando aprender como funciona el sistema de flagging (que así se llama) con intención de abusarlo y hay hasta páginas que reune a antiflaggers.  Como curiosidad ayer en el Indymedia de la zona de la Bahía de San Francisco saltó de nuevo la noticia de la confesión de alguien que fué contratado por el ayuntamiento de la ciudad para limpiar Craigslist de críticas al equipo gubernamental. En post era totalmente falso, pero consta (y solo hay que tener un pelín de vista para verlo) que no sería la primera vez que un organismo de esas dimensiones acude a ciertas tácticas de marketing y relaciones públicas. Lo bueno de sistemas masivamente distribuidos (en la nomenclatura de Mitch Kapor, ese yogi-genio que va a cambiar el mundo otra vez en cuanto nos descuidemos) como Craigslist, Reddit y otros es que aunque ofrezcan mecanismos para el abuso, el mismo comportamiento emergente de los usuarios ofrece a los que estan detrás del sistema datos para autoregular este comportamiento a través de un fino equilibrio que minimizar cualquier daño si se lleva a cabo un mínimo seguimiento y análisis riguroso de datos, lo que muchas veces se da por descontado y no se hace correctamente (vaya peñazo que acabo de soltar madre mia….)

Links

Next Page »
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.