El pasado 14 de julio hubo un incidente con los DNS de Cloudflare, 1.1.1.1, y rápidamente hubo mucha especulación sobre si pudo haber un ciberataque. La interrupción, que se prolongó durante 62 minutos (desde las 21:48 hasta las 22:50 UTC), impidió la resolución de dominios para los usuarios de los DNS públicos 1.1.1.1, afectando principalmente a las consultas sobre protocolos UDP, TCP y DoT. Posteriormente, en un comunicado oficial publicado el 15 de julio, Cloudflare ha indicado que no se trató de un ataque informático o un secuestro de BGP, sino de un problema propio.
Los DNS son las siglas del Sistema de Nombres de Dominio. Es lo que traduce las direcciones IP en el nombre de una página. Por ejemplo, para entrar en RedesZone, simplemente tienes que poner RedesZone.net y no memorizar números, que sería la IP de esa web. Esto es algo que se resuelve justo antes de que se abra una web. Normalmente, usamos los DNS que proporciona el operador que tenemos contratado, pero también puedes usar otros y dentro de los más recomendados están los de Cloudflare y Google.
Problema interno en los DNS de Cloudflare
Esta interrupción afectó a la mayoría de usuarios de todo el mundo que utilizaban los DNS de Cloudflare. En muchos casos, esto supuso que no podían entrar en una página web, una tienda online o cualquier otra plataforma. Ponían el nombre del dominio, pero no resolvía la dirección y, por tanto, no abría la página.
En el anuncio oficial, Cloudflare ha indicado que el problema estuvo en un error en la configuración interna. Concretamente, en un cambio que realizaron en la configuración para una futura DLS (Suite de Localización de Datos) que realizaron hace unas semanas y que, por error, vinculó los prefijos IP de los DNS 1.1.1.1 a un servicio DLS no productivo.
A través de una actualización, el pasado 14 de julio se añadió una ubicación de prueba a este servicio DLS inactivo, actualizando la configuración de red globalmente de forma incorrecta, lo que provocó el problema. Lo que ocurrió con todo esto es que los prefijos de los DNS 1.1.1.1 de Cloudflare, apuntaban a una única ubicación sin conexión. Los usuarios, en definitiva, se encontraban con que su conexión era redirigida a un centro de datos inactivo, por lo que no llegaban realmente a la web de destino.
En el radar de Cloudflare, como puedes observar en la imagen que adjuntamos, se ve claramente el gráfico con el volumen de DNS justo en el momento del incidente. En cuanto a datos en España, nuestro país representó el 1,1% del total de este incidente. La gran mayoría ocurrió en Estados Unidos, con el 25,5% del total.
Impacto del incidente
Esta configuración incorrecta se revirtió en poco tiempo. Comenzó a las 21:48h UTC, que fue cuando se añadió la actualización, a las 22:01h detectaron el problema ya las 22:20 se revirtió. Por tanto, 32 minutos después de que empezara el problema, comenzaron a publicar nuevamente prefijos BGP que fueron retirados por error. Poco después, a las 22:54h, se restableció por completo en todas las ubicaciones.
Este incidente afectó a varios rangos de IP, entre los que se encuentra 1.1.1.1 (que son los DNS principales de Cloudflare) y 1.0.0.1 (los DNS secundarios), pero también a otros dentro de la infraestructura de Cloudflare.
Respecto al impacto que tuvo este incidente en los protocolos, las consultas UDP, TCP y DNS sobre TLS (DoT) a las direcciones mencionadas experimentaron una caída significativa en el volumen, pero el tráfico DNS sobre HTTPS (DoH) prácticamente no se vio afectado, ya que sigue un enrutamiento diferente a través de cloudflare-dns.com, según el reporte de Cloudflare.
Según han indicado, el problema ha ocurrido por utilizar sistemas heredados, los cuales carecían de las validaciones automáticas necesarias para prevenir errores humanos durante las actualizaciones, según el análisis de Cloudflare. Esto se podría haber evitado de no usar este tipo de sistemas. Han señalado que planean dejar obsoletos estos sistemas heredados y acelerar la migración a sistemas de configuración más actuales, más preparados ante incidencias de este tipo.
| Indicador | Valor / Estado | Fuente / Nota |
|---|---|---|
| Duración total del incidente | 62 minutos | Informe de Cloudflare |
| Impacto geográfico (EE.UU.) | 25.5% del total | Informe de Cloudflare |
| Impacto geográfico (España) | 1.1% del total | Informe de Cloudflare |
| Protocolos UDP, TCP, DoT | Caída significativa de volumen | Afectados por el enrutamiento erróneo |
| Protocolo DoH (DNS sobre HTTPS) | Prácticamente no afectado | Utiliza un enrutamiento diferente |
¿Qué puedes hacer, como usuario, si te encuentras ante un problema de este tipo? En caso de que no puedas acceder a una web, el motivo puede ser un error de los DNS, como lo que hemos visto de Cloudflare. Tenemos un tutorial completo donde explicamos cómo cambiar los DNS en el ordenador o móvil. Podrías utilizar otras opciones, como los DNS de Google, los propios de Cloudflare, Quad9 o los de OpenDNS.
