¿Quién está detrás de la mayor caída de Facebook y WhatsApp de la historia?

Hoy Facebook se ha dejado 50.000 millones de dólares en bolsa, debido principalmente a la mayor caída global que ha sufrido en toda su historia, y de la que actualmente no se ha recuperado. Sobre las 17.30 de la tarde todos los servicios de Facebook, incluyendo la propia red social, mensajería de Facebook Messenger, WhatsApp y también Instagram están caídos. Todo esto se debe a un fallo en los servicios DNS que tiene el propio Facebook, actualmente los registros DNS que nos llevan a los diferentes servicios de Facebook están completamente caídos, estos dominios literalmente han desaparecido de todos los servidores DNS del mundo, y no se puede acceder a ningún dominio de Facebook ni el resto de servicios.

Facebook actualiza por error BGP y arrastra con él los DNS

Parece ser que sobre las 17.30 hora español, el equipo de Facebook realizó un cambio muy importante en el protocolo BGP, llevándose consigo los registros de los DNS, por lo que ahora mismo los dominios de Facebook, WhatsApp e Instagram han desaparecido completamente, si intentas acceder a cualquiera de estos servicios no te cargarán, porque los clientes no saben cómo llegar hasta los servidores.

Internet está formado por miles de sistemas autónomos, también conocidos como AS, estos AS utilizan el protocolo BGP para comunicarse con otros sistemas autónomos e intercambiar las rutas.  Cuando nosotros nos conectamos a Facebook, lo primero que debemos hacer es consultar los servidores DNS para saber hacia donde ir con la dirección IP pública que nos proporcione, posteriormente los paquetes se enrutarán directamente desde el origen de la conexión (nosotros) hasta el destino, pasando por varios routers intermedios, todos y cada uno de estos routers tienen las rutas necesarias para llevarnos hasta el destino, que son los servidores de Facebook.

Aunque los servidores sigan en pie y funcionando sin problemas, Facebook utiliza internamente diferentes DNS que tienen con el objetivo de llegar a sus propios servicios, sin embargo, al no funcionar los DNS, lógicamente nadie puede llegar hasta el destino. Si intentamos hacer un nslookup desde nuestra conexión a Internet, automáticamente el servidor DNS nos va a indicar que no se encuentra el dominio de Facebook ni ningún otro dominio relacionado.

El fallo que ha hecho que toda la plataforma de Facebook se cayera, es una mala actualización del protocolo BGP, haciendo que inmediatamente no se pueda acceder nuevamente a estos sistemas de forma remota para arreglar el problema, cuando se realiza un cambio en BGP, estos cambios se propagan rápidamente a todos los demás routers involucrados. Hay personas de Facebook desde hace horas en sus datacenters de manera física que están intentando solucionar el problema, sin embargo, las personas que tienen los conocimientos necesarios para poderse autenticar en el sistema y proceder con los cambios están trabajando remotamente desde sus casas, y lógicamente no pueden acceder de forma remota a Facebook para solucionarlo.

Esto que ha ocurrido es como cuando intentamos configurar un firewall de un servidor remoto vía SSH, y por error nos bloqueamos a nosotros mismos. En este caso, al actualizar el protocolo BGP y debido a la rápida propagación de las nuevas rutas con los cambios incorporados, simplemente ya no hay «camino» para acceder a estos equipos, no pueden volver hacia atrás con los cambios porque han perdido la conectividad.

Facebook utiliza sus propios DNS para absolutamente todo, para WhatsApp, para las llamadas VoIP, el correo electrónico interno de Facebook etc, por tanto, si el DNS se cae, se cae también la forma de solucionarlo de forma remota. Debido a que Facebook tiene seguridad muy estricta para evitar ataques, e incluso para evitar que los propios empleados hagan cambios críticos, solamente unas pocas personas tienen los conocimientos y las credenciales de acceso necesarias para poder acceder y solucionarlo.

¿Y si realmente ha sido un ataque?

En Internet se comenta que el grupo Anonymous ha atacado Facebookl, en el caso de que un ataque haya comprometido seriamente la infraestructura de la empresa, lo más lógico es cortar todas las comunicaciones de raíz, que es justamente lo que ha hecho Facebook actualizando su protocolo BGP para borrar todas las rutas de todos los routers del mundo. Para una empresa del tamaño de Facebook, con personas con años de experiencia a sus espaldas y que son de los mejores en el mundo en su ámbito, es bastante extraño que hayan actualizado mal el protocolo BGP para justamente perder toda la comunicación con el exterior, a no ser que sea por un buen motivo: un hackeo muy importante.

Otros servicios también tienen problemas

Otros servicios como Google y Telegram también están teniendo algunos problemas de estabilidad, es posible que sean los siguientes en caer. Ahora mismo el funcionamiento de estos servicios no es del todo correcto, por ejemplo, no permiten descargar fotografías ni tampoco subirlas, además, al navegar por Internet con Google también da error en algunas ocasiones. Si tienes un smartphone, es muy posible que te indique que estás conectado a una red WiFi sin conexión a Internet, esto es porque para verificar la conexión a Internet realizan comunicaciones con servidores de Google, y parece que están caídos o no funcionan del todo bien, por este motivo de manera errónea el móvil nos indica que también están caídos.

El motivo de estas caídas es porque la gente intenta entrar a los dominios de Facebook en «avalancha» y de forma continua, los servidores DNS no pueden resolver correctamente estos dominios, y tienen sobrecarga de peticiones, por este motivo, en ocasiones parece que también se han caído los diferentes servicios cuando no es así.

¡Sé el primero en comentar!