Qué es y cómo funciona la caché web o servidor proxy

Qué es y cómo funciona la caché web o servidor proxy

Alberto López

Si alguna vez os habéis preguntado si hay algún tipo de medida para ahorrar en tráfico de datos para mejorar la velocidad a la que accedemos a una página web, o si hay algún método para no sobrecargar las líneas cuando se hacen consultas sobre un navegador, la respuesta es sí. Hoy en RedesZone os vamos a explicar qué es y cómo funciona la caché web, para que podáis entender cómo se simplifica el tráfico de datos y se acelera la carga de páginas web en nuestro navegador, y cualquier otro tipo de transferencia de datos de hipertexto.

Para entender todo un poco mejor vamos a reafirmar algunos de los conceptos básicos, explicando qué es y qué significa HTTP y HTTPS.

¿Qué es HTTP y HTTPS?

HTTP son las siglas de «Hypertext Transfer Protocol» o «Protocolo de Transferencia de Hipertexto«. Su variante mucho más actual y la cual se usa ahora mismo como estándar de transferencia de hipertexto, HTTPS significa lo mismo, pero añadiendo «secure» al final, es decir, seguro o cifrado. El uso de ambos protocolos es el mismo, la transferencia de datos. La diferencia básica entre los dos es el poder de esa «s» final, un protocolo HTTP es un protocolo de transferencia de hipertexto entre dos puntos el cual es visible para cualquiera que intercepte esa comunicación, sin embargo, en una transferencia de datos con protocolo HTTPS se usa una conexión segura mediante un certificado para el uso SSL/TLS la cual solo es visible para el emisor y el receptor, ya que cualquiera que intercepte esa transferencia de datos no podrá descifrar nada, porque la comunicación con HTTPS utiliza TLS 1.2 o TLS 1.3 para cifrar y autenticar las comunicaciones.

Ahora lo que nos queda en el aire es un par de conceptos para poder despejar cualquier duda que nos surja.

¿Qué son los protocolos SSL y TLS?

El protocolo SSL cuyo significado de sus siglas es «Secure Socket Layer» o «Capa de Sockets Seguros» y el protocolo TLS, «Transport Layer Security» o «Seguridad de la Capa de Transporte» son protocolos diseñados para garantizar que la información no se podrá leer ni manipular por sistemas que no sean el emisor de la petición y el receptor de la misma. El protocolo SSL actualmente está en desuso por falta de seguridad, la evolución de SSL es TLS y es el protocolo que se utiliza actualmente.

Realmente el TLS es la versión 3.1 del SSL. Fue introducido cuando Internet requirió un protocolo más estable y más seguro. Mediante una estandarización del proceso se ideó el protocolo TLS en el cual, las dos partes implicadas, se comunican y negocian las claves que usarán para encriptar y desencriptar el mensaje. Los puntos sobre los que trabaja el Certificado TLS son la seguridad criptográfica gracias a la negociación entre servidores de los usuarios, la interoperabilidad entre aplicaciones, la extensibilidad y la eficiencia. Actualmente se utilizan los protocolos TLS 1.2 y también TLS 1.3 que ha salido recientemente, y que nos proporciona una mayor seguridad (seguridad por defecto) y una mayor velocidad.

Ya tenemos toda la base para comprender bien el funcionamiento de la caché web.

¿Qué es la caché web o servidor proxy?

El concepto de caché web se puede entender fácilmente si lo asemejamos a un «almacén». Este almacén se encuentra dentro de la red que recibe solicitudes HTTP y HTTPS en nombre del servidor web de origen. Su funcionamiento consiste en almacenar los objetos que ya hemos solicitado recientemente como cliente. De esta manera, configurando nuestros navegadores para que todas las solicitudes HTTP y HTTPS se dirijan primero a este almacén, estos objetos podrán obtenerse más rápidamente sin la necesidad de la salida a Internet puesto que ya se encuentran en él por haber sido solicitados previamente.

El proceso de la comunicación

Para entenderlo todo, pondremos un caso simple: la carga de una página web. Abrimos la página web y lo primero que hará el navegador web es establecer una conexión TCP (Transmission Control Protocol o Protocolo de Control de Transmisión) con el servidor proxy o caché web, y realizará una solicitud HTTP o HTTPS para el objeto que necesite cargar en la página el cual puede estar almacenado en dicho servidor proxy, o no estarlo.

Ahora, el servidor proxy comprobará si tiene una copia del objeto o archivo que ha sido solicitado por el navegador, y, si la tiene, la caché web devolverá el objeto pedido rápidamente al navegador para su carga. Si no tiene dicho objeto, la caché web abre una conexión TCP con el servidor de origen para pedirle el objeto que requiere para su carga en la página, después de pedirlo lo almacena en nuestro almacén (caché web o servidor proxy) y lo que envía al cliente que lo ha solicitado, aunque realmente lo que llegará será una copia del original.

Un servidor proxy, actúa de servidor (para los clientes, es decir, nosotros) y de cliente de otros servidores (cuando pide el objeto si no lo tiene almacenado en disco). Quien instala un servidor proxy normalmente es un ISP (operador de telefonía) para poder ahorrar dinero en tráfico de internet.

Razones para instalar un servidor Proxy

La principal razón es acelerar la transferencia de datos reduciendo el tiempo de respuesta a la solicitud de un cliente, se acentúa más cuando el ancho de banda entre el cliente y el servidor de origen es mucho menor que entre el cliente y la caché. El servidor proxy es un equipo instalado de forma local, lo que se traduce en una gran velocidad entre el cliente y la caché web la cual podrá suministrar los objeto solicitados de manera muy rápida.

Se reduce ampliamente el tráfico de salida a Internet, así, los operadores pueden hacer mucho más eficientes las conexiones de cualquier tipo sin necesidad de mejorar las conexiones de Internet lo que se traduce en un ahorro de costes en la instalación de dicha caché web. Asimismo, conseguimos no colapsar tanto las redes de Internet y por tanto que las aplicaciones que verdaderamente necesiten salir a Internet mejoren sus prestaciones.

Imaginemos que no tenemos un caché web y que nuestra conexión a Internet es de 10Mbps, sin embargo, nuestra red necesita más, si la intensidad de tráfico en la red se acerca a 1, los retardos comienzan a aumentar, y crece sin límite ya que se van almacenando las «tareas».

Hoy en día no tenemos problemas con una conexión de fibra óptica, pero para las zonas en las que aún no se dispone de esa conexión, el uso de este método mejora mucho la velocidad de carga en los navegadores, ya que la tasa de acierto del uso de un caché web está entre 0,2 y 0,7 por tanto, entre un 20% y un 70% de los objetos solicitados serán desde nuestra LAN y no desde Internet, la intensidad de tráfico bajará hasta niveles que nos podamos permitir, y de esta manera se agilizará mucho más la conexión y carga de datos de transmisión.