Un cambio de nada
Mirando por encima los logs veo que la mayoría de los que os pasais por aquí me leeis a través de lectores RSS, así que no notareis nada raro, feedburner tiene un sistema de redirección de sitios bastante majo que me ha simplificado la vida horriblemente. Para los demás, habreis notado que el blog apunta ahora a folksonomy.com en lugar del antiguo blog.folksonomy.com y que ha cambiado un pelín el diseño.
Los cambios se deben principalmente a que el antiguo hosting (la máquina que era folksonomy.com) era un ordenador dedicado en un cluster en el medio del desierto pordiossabedonde que teníamos un amigo expatriado americano y yo desde hace la tira y que corría una venerable debian sarge (la misma versión de la que mi abuelo usaba en la guerra) que como todos por supuesto sabeis deja de tener soporte de seguridad desde el próximo 31 de Marzo, por lo que nos decidimos que o bien cambiabamos de bicho y tirabamos cada uno para su lado (cosa que al final ha pasado porque al final cada uno solo lo usaba para sus blogs y chuminadas) o bien instalabamos algo de este siglo. El contrato del hosting acaba a final de més y la primera idea que tenía en mente era contratar alguno hosting de esos que salen cuatro perras pero sabiendo que en casa tengo máquinas de sobra (dos servidores -pronto tres- y cuatro portátiles) decidí intentar montarlo en casa ver que pasa. Los problemas no son tanto de máquina como de ancho de banda y disponibilidad: comcast tiene una predilección a reiniciar su red a las cuatro de la mañnana (una de la tarde en casi toda España) de vez en cuando y mi gato tiene tendencia a pasar caminando justo encima del botón de apagado de cualquiera de las máquinas en el momento menos oportuno, además de eso mi red adsl no es nada del otro mundo (16 megas de entrada y uno de subida) y la conexión se suele usar para bajar contenido (documentales, películas, series, música), stream de radio, telefonia ip, servidor externo de ficheros y un rsync remoto que se activa cada pocas horas y lo que quieran hacer los vecinos que se conectan desde sus casas o el parque Dolores, que esta a dos pasos, por lo que como dicen aquí “los tubos estan un pelín atascados”.
La máquina que va a alojar el blog es la que siempre esta encendida (la caja negra), un bichillo VIA de 800mhz y un giga de memoria sin ventilador, con un par de terabytes de disco externo, la cual se utiliza principalmente como servidor de películas (con un p2p via deluge que se activa cada vez que algun programa interesante se asoma al RSS), servidor de correo imap y webmail (filtrado con procmail, eliminación de spam con spambayes…), emisión de música vía mt-daap, unas cuantas sesiones screen desde donde entro al IRC cuando estoy fuera. Para aprovechar los recursos de esta máquina al máximo y para que el tráfico no la mate del todo es necesario ajustar mas o menos decentemente el software que va a correr. He sustituido el viejo lighttpd que me servía para acceder al webmail y al pitchfork por nginx, que es un placer de configurar, una mala bestia, se enchufa solo al memcached y en las pruebas que he hecho de rendimiento no consigo que ocupe más del 10% de procesador por mas peticiones que le haga (generalmente en un uso de tráfico normal me consume un 2%). El ningx se conecta a php por fastcgi y cachea las páginas con memcached (las debería cachear automáticamente al menos), el php lo tengo bastante oxidado pero he instalado eaccelerator y ajustar un par de valores de rendimiento y el mysql, que tiene el cache desabilitado, esta limitado a un único proceso. El tema del cache de mysql me viene de experiencia profesional. La base de datos es la última línea de defensa y el usuario tiene que llegar a ella después de pasar por memcached o cualquier sistema que tengamos para cachear objetos, no se si habrá aĺgún experto en bases de datos en la sala pero el sistema que tiene mysql para cachear (y la velocidad de búsqueda dentro de este cache) hace que solo tenga sentido para guardar el resultado de peticiones especialmente costosas. Craigslist por ejemplo, que tienen nivel de accesos que se cuenta por las decenas de miles por segundo, tiene los caches de mysql totalmente desabilitados (lo cual se consigue mediante un cache hit-rate en el frontend superior al 99% de las peticiones)
En la oficina tengo una conexión bastante decente desde la maquina donde trabajo y en las pruebas que he estado haciendo (con el estupendo pylot generalmente) consigo tumbar el ancho de banda que tengo en casa mucho antes de que el servidor empiece a notarlo, por lo que la parte software esta más o menos solucionada. Consigo lanzar procesos, poner películas y dejar cosas bajando que las iptables consiguen por un lado que las páginas se sirvan decentemente y por otro que en el caso de que alguien este haciendo un uso “en tiempo real” de la máquina (una sesion ssh, una película), no tenga ni que notarlo. Pero como la fuerza de una cadena es la misma que la de su eslabón más débil aún queda por ver que pasa en caso de que alguna entrada salga en algún sitio de mucho tráfico, a comcast le de por cancelarme el servicio, pete un disco duro o el gato se coma un cable. Para colmo en dos días me marcho semana y media de vacaciones y la hermana de Justine, que suele quedarse en casa a cuidar del pequeño Linus, tiene una afición a desmontar la red en cuanto salimos por la puerta (he llegado a pensar que, con su plena adolescencia, esta mujer ha desarrollado algún tipo de filia consistente el chupar cables eléctricos), con lo que lo más seguro es que en unos días, todo se vaya al garete y me quede sin blog hasta mi regreso, donde puede que me deje de fantasear con la posibilidad de alojar mi propia información y recapacite sobre esta y otras ideas geniales.
El template también lo he cambiado medianamente, quitando lo que Tufte llama “administrative debris” y desaciendome de elementos que no dan ningún tipo de información sobre las noticias que escribo (el logo de la gota de agua, los enlaces de administración y otros elementos gráficos superfluos). Lo único que he añadido es una pequeña sparkline con la actividad de los últimos 30 días y unos contadores de noticias por sección y fecha, generalmente que debo ordenar los posts muy antiguos (siguen formando un cluster en torno a agosto de 2006) y para recordarme de cuando dejo bastantes días sin escribir o temas sin tocar. La idea que tengo es, (siempre que yslow me diga que lo sigo haciendo bien) ir eliminando cada vez más elementos gráficos y dejar solo lo que considere que es indispensable (para ello iré mirando logs -algo que no hacía antes, ya que los desactivé-) para ver si los que entrais soleis ir a secciones, usar el buscador o simplemente llegais por alguna búsqueda en google de esas que siempre hace gracia compartir (en cuyo caso creo que eliminaré el resto de enlaces). Las fotos de flickr también han desaparecido porque no creo que tengan mucho sentido y el yslow se quejaba del excesivo peso del sistema de autentificación por openID que tiene wordpress (que era una de las ideas principales que tenía), ya que te envía jquery y tres o cuatro ficheros más por lo que se queda en el cajón de las ideas para un poco más adelante.
Sobre el hosting, la otra opción es alojar el blog desde alguna máquina de la oficina. Como cualquier empresa de Internet con cierto tráfico, la cantidad de servidores que se quedan obsoletos y acumulamos es enorme (curiosamente, en una empresa de este tipo, el coste más alto -después del humano- es el la energía y ancho de banda, por lo que el espacio de rack y el consumo eléctrico se convierte en un bien preciado que hace que las máquinas cedan su paso más rapido de lo que sería normal), haciendo que tengamos la casa literalmente llena de bichos por todos lados sin saber bien donde meter y que solemos quitarnos de enmedio donandolos a museos o centros educativos. El grupo de servidores que tenemos lo donaremos a riseup, una organización anarquista con sede en Seattle que aloja la mitad de los grupos activistas del planeta (una especie de Sindominio a lo bestia) y que entre otras cosas tiene un colo público con la mayor instalación de mailman del planeta. (otro grupo de servidores irán directamente a formar parte de la nueva base de datos de la campaña de Obama, ya que uno de nuestros administradores de sistema no para de dar la puta coña con Obama todo el santo día es bastante activo en su campaña). La oficina tiene un cable de fibra óptica propia que llega a Main 365 (nuestro colo, en SOMA) y desde allí directamente a San José, a unos 80 km, para conectar con el backbone, con lo que el blog, con las máquinas y el ancho de banda, no estaría en situación mejor, pero la idea de tenerlo cerquita en mi casa y de analizar y ver lo que tarda en petar medianamente era más que atractiva (además de lo bien que me lo paso probando y configurando los servicios yo mismo) por lo que lo dejo, cruzo los dedos y me voy de vacaciones a ver que sucede a mi vuelta.